航空会社の価格設定行動、特に競合他社の価格設定に対する航空会社の反応を調査したいと思います。
より複雑な分析についての私の知識はかなり限られていると言えますが、データの全体的なビューを収集するために、ほとんどすべての基本的な方法を実行しました。これには、類似のパターンを識別するのにすでに役立つ簡単なグラフが含まれます。SAS Enterprise 9.4も使用しています。
しかし、私はより多くの数値ベースのアプローチを探しています。
データセット
私が使用している(自己)収集データセットには、約54.000の運賃が含まれています。すべての運賃は、毎日(毎晩00:00)60日以内に収集されました。
したがって、その時間枠内のすべての運賃は、運賃の利用可能日および運賃の回収日までに通過するフライトの出発日を条件として回発生します。 (フライトの出発日が過去の場合、フライトの運賃を徴収することはできません)
基本的に次のように見える書式なし:(偽のデータ)
+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32 | 16APR2015:10:50:02 | 23APR2015:21:55:04 | XA |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32 | 16APR2015:13:20:02 | 23APR2015:19:00:04 | XY |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32 | 16APR2015:13:20:02 | 23APR2015:21:55:04 | XH |
+--------------------+-----------+--------------------+--------------------------+---------------+
「DaysBeforeDeparture」はで計算されます。ここで
- I&間隔(出発の前日)
- 運賃および出発日(フライト出発)
- cおよび運賃が徴収された日付
I(DaysBeforeDep。)(偽のデータ!)によってグループ化されたデータセットの例を次に示します。
+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 880.68 | 477.99 | 2,245.23 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 904.89 | 477.99 | 2,534.55 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 1,044.39 | 920.99 | 2,119.09 | LH |
+-----------------+------------------+------------------+------------------+------------------+
これまでに思いついたこと
折れ線グラフを見ると、すでにいくつかの線が高い相関係数を持っていると推定できます。したがって、最初にグループ化されたデータで相関分析を使用しようとしました。しかし、それは正しい方法ですか?基本的に、個々の価格ではなく、平均値で相関をとろうとしていますか?他の方法はありますか?
価格が線形形式で移動せず、非線形に見えるため、どの回帰モデルがここに適合するかわかりません。航空会社の各価格動向にモデルを適合させる必要がありますか
PS:これは長いテキストの壁です。何か明確にする必要がある場合はお知らせください。このサブは初めてです。
誰が手がかりですか?:-)