(ひねりを加えた)市場調査の実験を設計する方法は?


8

たとえば、1000人の見込み客がいるオークションを考えてみましょう。これらの見込み客(年齢、性別、人種、収入、学業成績など)に関する情報に基づいて、製品の売り上げをその一部、たとえば250に「入札」することができます(入札コストは無視してください)。適切なサブセットを選択する可能性を最大化するには、おそらくロジスティック回帰を使用して構築された当社の製品の「好感度」のモデルを使用します。私はこの部分をうまく通り抜けることができます。

ただし、製品の好感度のモデルを構築するには、市場調査を行い、一般の人々から募集する可能性のある主題について製品の売り込みをテストする必要があります。これは実際にはかなりコストがかかります。さらに、それはおそらく、見込み客が引き出されている人口の人口統計に合わせる必要があります。たとえば、要因計画では、実際には、たとえば1000人の見込み客の中でネイティブアメリカンとの出会いが非常に少なく、原則として、彼らにまったく売り込まないことを選択します。(悲しいが本当。)

そのような実験はどのように設計されるべきですか?具体的には、設計変数はすべてカテゴリーおよび順序の要素であり、入札比率は入力パラメーター(上記の例では1/4)であり、募集できる対象の最大数も同様です。実験計画と無作為抽出のいくつかの組み合わせが適切であるように思われるかもしれませんが、私はすべての合理的な提案と指針に寛容です。

また、エフェクトサイズが小さく、サンプルの募集プールが小さいため、市場調査で統計的に有意な回帰係数が得られる可能性は低いことにも注意してください。そして、実験計画を過度に最適化することはおそらく愚かなことであり、合理的ではない非常識な手順で十分です。


1
設計したい実験の要因は何ですか?サンプルで製品をテストしたいのですが、これまでのところ、異なる母集団ドメインから層別化した採用を除いて、実験的な操作は確認できません。
tomka 2014年

1
はい、「実験」によって、私は新入社員のプールを選択する方法を意味します。私たちは、人口統計変数(年齢、人種、性別、学歴など)の任意の組み合わせで(ほぼ)新入社員を選択できます。これが私の仕事です。
シャビーシェフ2014年

1
n = 1000の母集団からの単純な確率サンプルを使用しない主な理由は何ですか?
tomka 2014年

1
予算の制約により、サンプリングできる新入社員の数ははるかに少なく、50のオーダーです。このサイズと設計変数の数の場合、ランダムサンプルは、サンプリングエラーのために代表的なものには見えません。実験的なデザインがうまくいくと思います。
shabbychef 2014年

2
一部のグループの層別サンプルを探していると思いますが、これは実験ではありません。アイデアは、関連するすべてのグループがデータセットに存在することを確認し、母集団に対して設計の重み付けを使用することです。それでも、n = 50はおそらく小さすぎて、あなたが言及するすべての社会人口統計学を層別化することはできません。また、関連付け/効果のサイズが強い場合でも、サンプリングエラーは予測の品質を損なう可能性があります。
tomka 2014年

回答:


4

問題への1つのアプローチは、層別化されたサンプルを使用することです。層別化の目的の1つは、母集団の特定のドメイン(グループ)がサンプルで表されることを確認することです。そうしないと、たとえば選択確率が小さいために、有効な推論にはまばらに表されます。

=50

w=πsπpop
πsπpop SRSを使用するときに選択確率です。

=50=50

たとえば、「性別」は通常、ポップで50/50の確率でよく表される変数です。したがって、場合でも=50「十分な」男性と女性がいますが、Nat。午前。このタイプの変数ではないかもしれませんが、それでもモデルにとって重要です。電力分析は、必要に応じてさらにガイダンスを提供する場合がありますが、特定のモデルによって異なり、多項回帰の場合は非常に複雑になる場合があります。

選択確率が低すぎる特性は層別化の候補ですが、カテゴリー全体で選択確率が十分に高い/バランスのとれた変数は、サンプリング設計では無視できます。これで、母集団とモデルの重要な階層が特定されました、それらにサンプリング設計戦略を構築できます(つまり、すべての「層」を満たすために、関連するすべての層からランダムにサンプリングします)。

=50


これは私が私が行く必要があるところへの長い道のりを私に与えます。どうもありがとう!
シャビーシェフ、2014年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.