回答:
従属変数としてバイナリ変数を持つことと、従属変数として比率を持つことには違いがあります。
バイナリ従属変数:
従属変数としての割合:
異なるグループ内の応答が0または100%にどれだけ近いかに依存します。極端な値が多数ある場合(つまり、0または100%に多くの値が積み上げられている場合)、これは困難です。(「分母」、つまりパーセンテージが計算される被験者の数がわからない場合、とにかく分割表アプローチを使用することはできません。)グループ内の値がより合理的である場合、変換できます応答変数(たとえば、古典的な逆正弦平方根またはおそらくロジット変換)。変換されたデータがANOVAの仮定を適切に満たしているかどうかを判断するためのさまざまなグラフィカル(推奨)および帰無仮説テスト(あまり推奨されません)のアプローチがあります(分散と正規性の均質性、前者は後者よりも重要です)。グラフィカルテスト:箱ひげ図(分散の均一性)とQQプロット(正規性)[後者はグループ内で、または残差に対して行われるべきです]。帰無仮説検定:例:バートレット検定またはフリグナー検定(分散の均一性)、シャピロウィルク、ジャークベラなど
応答変数が0/1(煙、煙ではない)になるように、生データが必要です。次に、バイナリロジスティック回帰を使用できます。BMIを間隔にグループ化するのは正しくありません。カットポイントは正しくなく、おそらく存在しないため、BMIが喫煙に関連しているかどうかを公式にテストしていません。現在、多くの情報が破棄されたBMIが喫煙に関連しているかどうかをテストしています。特に、外側のBMI間隔は非常に不均一であることがわかります。
比例データに対して通常のANOVAを実行することを選択した場合、同種の誤差分散の仮定を検証することが重要です。(パーセンテージデータでよく見られるように)エラー分散が一定でない場合、より現実的な代替方法はベータ回帰を試すことです。これにより、モデルのこの不均一分散を説明できます。これは、パーセンテージまたは割合である応答変数を処理するさまざまな代替方法を議論する論文です:http : //www.ime.usp.br/~sferrari/beta.pdf
Rを使用する場合、パッケージbetaregが役立つ場合があります。