航空運賃-競争力のある価格設定行動と価格の相関関係を検出するには、どのような分析を使用する必要がありますか?


12

航空会社の価格設定行動、特に競合他社の価格設定に対する航空会社の反応を調査したいと思います。

より複雑な分析についての私の知識はかなり限られていると言えますが、データの全体的なビューを収集するために、ほとんどすべての基本的な方法を実行しました。これには、類似のパターンを識別するのにすでに役立つ簡単なグラフが含まれます。SAS Enterprise 9.4も使用しています。

しかし、私はより多くの数値ベースのアプローチを探しています。

データセット

私が使用している(自己)収集データセットには、約54.000の運賃が含まれています。すべての運賃は、毎日(毎晩00:00)60日以内に収集されました。回収方法

したがって、その時間枠内のすべての運賃は、運賃の利用可能日および運賃の回収日までに通過するフライトの出発日を条件としてn回発生します。 (フライトの出発日が過去の場合、フライトの運賃を徴収することはできません)

基本的に次のように見える書式なし:(偽のデータ)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

「DaysBeforeDeparture」はで計算されます。ここで=sc

  • I&間隔(出発の前日)
  • 運賃および出発日(フライト出発)
  • cおよび運賃が徴収された日付

I(DaysBeforeDep。)(偽のデータ!)によってグループ化されたデータセットの例を次に示します。

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

これまでに思いついたこと

折れ線グラフを見ると、すでにいくつかの線が高い相関係数を持っていると推定できます。したがって、最初にグループ化されたデータで相関分析を使用しようとしました。しかし、それは正しい方法ですか?基本的に、個々の価格ではなく、平均値で相関をとろうとしていますか?他の方法はありますか?

価格が線形形式で移動せず、非線形に見えるため、どの回帰モデルがここに適合するかわかりません。航空会社の各価格動向にモデルを適合させる必要がありますか

PS:これは長いテキストの壁です。何か明確にする必要がある場合はお知らせください。このサブは初めてです。

誰が手がかりですか?:-)

回答:


9

元航空会社の収益管理アナリストからの警告:このアプローチで間違ったツリーをtreeえているかもしれません。後に続くテキストの壁についてはお、び申し上げますが、このデータは一見して見えるよりもはるかに複雑でノイズが多いため、生成方法の簡単な説明を提供したいと考えました。事前に注意してください。

航空会社の運賃には2つの要素があります:航空会社が特定のルートで利用できる実際の運賃(運賃規則と必要なものをすべて含む)。そうではありませんが、それらはルールではなく例外です)、および航空会社が日常的に実行する実際の在庫管理です。

運賃は、設定された間隔で1日に4回ATPCOに提出できます。航空会社がそうする場合、通常、既存の運賃の追加、削除、および変更の混合で構成されます。航空会社が価格設定アクションを開始すると(競合他社がここで独自の動きをしようとしていないと仮定して)、通常、競合他社がフォロー/応答するかどうかを確認するために次の更新まで待つ必要があります。航空会社は次の更新まで応答するまで待たなければならないため、競合他社が価格設定アクションを開始すると、逆のことが起こります。

今、これは運賃に関してはすべてうまくいっていますが、問題は、これがすべてATPCOで公開されているため、運賃は公開情報の次善の策であるということです...あなたの武器庫に入ったので、実際に在庫を割り当てられない運賃の発行、すべての運賃を出発日としてリストするなど、難読化の試みは前代未聞ではありません。

多くの点で、秘密のソースは実際の在庫配分、つまり各フライトで特定の運賃で販売できる座席数に帰着します。この情報は公開されていません。Web情報をスクレイピングすることでいくつかの情報を得ることができますが、出発時刻/日付および運賃規則の潜在的な組み合わせは非常に多く、簡単に追跡する能力を超えて急速にエスカレートする可能性があります。

通常、航空会社は非常に安い運賃のために少数の座席を販売するだけで、それらを引っ掛ける人々は運賃規則がそれらを締め出さないようにするか、他の旅行者が単にそれらをbeat打しないようにかなり前に予約する必要があります。航空会社は、より高い運賃でさらに数席を販売するなど、進んでいくでしょう。彼らは、彼らが公表した最高の運賃ですべての座席を販売することを非常に喜んでいるでしょうが、これは通常実行可能ではありません。

出発日に近づくにつれて運賃が高くなることで見ているのは、単に安い座席をより遠くに予約するという自然なプロセスですが、残りの在庫は徐々に高くなります。もちろん、ここにはいくつかの注意事項があります。RMチームは通常、収益目標を達成し、各フライトで収益を最大化しようと努力するため、RMプロセスは積極的に管理され、人間の介入が非常に一般的です。そのため、すぐに満席になるフライトは、低料金を閉鎖することで「引き締め」られる場合があります。ゆっくり予約しているフライトは、より多くの座席をより低い運賃に割り当てることにより、「緩められ」ます。

この分野の航空会社の間には絶え間ない相互作用と競争がありますが、運賃を削るだけで実際のダイナミクスをキャプチャすることはほとんどありません。誤解しないでください。このようなツールは自由に使用でき、それらの制限にもかかわらず、非常に価値がありますが、意思決定プロセスに投入されるデータソースの1つにすぎません。RMチームが毎日何千もの運用上の決定を下すのではなく、数百に及ぶアクセスや、その時点で見られる最新の情報にアクセスする必要があります。このデータを取得するために提携する航空会社パートナーが見つからない場合は、代替のデータソースを検討する必要があります。

Official Airline Guide(またはその競合他社の1つ)からO&D運賃データにアクセスすることを検討し、それを分析に使用することをお勧めします。サンプルベースであり(販売されたすべてのチケットの約10%)、理想よりも高いレベルで集約されるため、慎重にルートを選択する必要がありますただし、実際に販売されたもの(平均運賃)と販売された量(負荷率)をより正確に把握できる場合があります。その情報を使用することで、少なくとも航空会社の価格戦略の結果を調査し、そこから推測を行うことができます。


徹底的な説明をありがとう。価格に基づいたこのような分析は非常に限られていることに同意します。これには、特に運賃規則(払い戻し可能なチケット、最低滞在日数など)も含まれます。これらの制限の一部は、常に同じ料金を収集して比較可能にすることで克服できます。ただし、重要な情報-あなたが言ったように、空いている席の量(!=飛行機の席)と実際に販売されたチケットの量が欠落しています。
s1x

そのようなデータへのアクセスは非常に制限されており、古い場合(US DOTのDatabank 1Bなど)。Clark R.やVincent N.(2012)容量に応じた価格設定[...] リンクなどの一部の研究には、このようなデータが含まれており、より優れた洞察を提供しています。私は制限を知っています(できれば;-))、そしてあなたが述べたように、価格に影響を与える多くの情報があります。それでも、特定の市場を観察すると、何が起こっているかの感覚をつかむことができます。競合行動や異なる価格戦略アプローチがあるかどうかを確認できます。ただし、原因を見つけることはできません。
s1x

1
@ s1x-私は同意し、提供する堅実な代替手段があればいいのにと思いますが、あなたが学んだように、詳細な収益データはどの航空会社でも最も熱心に守られている秘密です。そのことと、データ生成プロセスに何が入るかを確実に把握したかっただけです。それを超えて、私はあなたがやろうとしていることを気に入っており、他の答えはテクニックの観点から正しい方向への一歩だと思います。また、リンクされたTS間のパターンを見分けるのに役立つことが多いため、データ探索中にさまざまなTSの相互相関を使用することもできます。
ハブ

4

記述的および視覚的な探索的データ分析(EDA)に加えて、時系列分析をより包括的洗練された分析として使用することを試みます。具体的には、時系列回帰分析を実行します。時系列分析は巨大な研究と実践の領域です。そのため、基礎に精通していない場合は、上記のリンクされたウィキペディアの記事から始めて、徐々に特定のトピックを検索し、対応する記事、論文、書籍を読むことをお勧めします。

時系列分析は非常に一般アプローチであるため、RPythonSASSPSSなどの多くのオープンソースおよびクローズソースの商用データサイエンスおよび統計 環境(ソフトウェア)でサポートされています。これにRを使用する場合は、一般的な時系列分析時系列の分類とクラスタリングに関する私の回答確認してください。これが役立つことを願っています。


@Aleksandr Blekhのご回答ありがとうございます-本当にありがたいです。病気はそれを掘り下げます。たぶんばかげた質問かもしれませんが、ここで間違っている場合は、ここで訂正してください。相関分析で、1つの航空会社を相関させる変数として使用しています。これまでのところ、一部の航空会社がEPCを採用しているため、結果は説得力がありました。コードシェア契約を結んでいた人たちも同様の価格でした。このような高い相関関係は、たとえば次のColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 ようになります。そのような結果同様の価格パターンを示していると思います。回帰分析では、何がわかりますか?
s1x

@ s1x:どういたしまして(回答を高く評価するなら、もちろん、そうするのに十分な評判を得られるなら、遠慮なく賛成してください。)さて、質問に移ります。前述したように、TS分析はより洗練された包括的なものです。特定のTS回帰では、いわゆる自己回帰およびその他のTSの複雑さを考慮します。したがって、従来の単純な分析ではなく、TS回帰分析を使用することをお勧めします。また、実行する予定のデータ分析に関係なく、常に EDAから開始する必要があります(実際、EDAはしばしば計画を変更します)。
アレクサンドルブレフ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.