「データセットが与えられたが、明確な目的がない場合、どのように対処しますか?」
これは一般的です。
上記のアドバイスとは別に、現在のビジネスの目標と直接のクライアントの目標を理解することが不可欠であることを理解してください。多くの場合、彼らは彼らがするよりもデータに向いている特定の問題を理解する必要があります。内部クライアントまたは外部クライアントからデータと不明確な目的が提示されることは非常に一般的です。通常、データで達成できる目標を提供し、クライアントの実際のビジネス上の問題を解決するのがあなたの仕事です。データの結果とビジネスソリューションを一致させるには、ある程度の側面的思考が必要になります。
上記を要約すると、「目的を定義することは、クライアント(単独)に任せるにはあまりに重要(そしておそらく非常に難しい)です」と要約します。
機械学習のコンテキストでは、CRISP-DMは、ループを反復してこの問題を解決しようとする方法論であり、クライアントとのディスカッションで追加のデータ理解を使用して、元の問題をよりよく理解できます。したがって、たとえば、彼らは明確に定義されていない目標を述べているかもしれません。EDAを行った後の2回目の議論は、それを少し鋭くします。後でうまく機能するが、適切な目標に達していないモデルを後で作成すると、再び実際のビジネス目標に近づきます。
言い換えれば、タスクのあいまいさにあまり邪魔されないようにしてください。真空に遭遇し、あなたの利益のためにそれを満たしてください。
これは少し横方向のシフトですが、シックスシグマの方法論は、DMAICシステム(「顧客の声」に関して「定義」を表す「D」)とは異なる状況でこの問題を解決しようとします。 6シグマコンテキストのリソースでいくつかのヒントを収集できる可能性があります(たとえば、クライアントで実行できる演習で、クライアントが望むものをより明確に表現できるようにします)