k-fold交差検定を発明したのは誰ですか?


24

私は、k-fold cross-validationが導入された論文への参照を探しています(主題に関する単なる学術的な参照ではありません)。おそらく、最初の論文を明確に特定するのは時間の霧にさかのぼりすぎているため、このアイデアが使用された初期の論文は興味深いものになります。

私が知っている最も早いのは

PA LachenbruchおよびMR Mickey、「判別分析におけるエラー率の推定」、Technometrics、vol。10、いいえ。1、1〜12ページ、1968年2月。

そして

A. LuntzおよびV. Brailovsky、「認識の統計的手順で得られた文字の推定について(ロシア語)」、Techicheskaya Kibernetica、vol。3、1969。

しかし、私が知る限り、それらはleave-one-out交差検証のみをカバーしています(私の技術的なロシア語はそれだけではありません; o)。


1
あなたはスティグラーの法則に精通していると思いますか?(述べられているよりも少し広義に解釈されるため。):)
枢機

毎日新しいことを学びます!元の発明者が不明な場合は、早めに参照してください。独立して複数回発明されたものの一つではないかと思うが、歴史は興味深い。
ディクラン有袋類

回答:


12

コンサルティングする価値があるかもしれない論文の1つは

Stone M. 交差検証の選択と統計的予測の評価。J. Royal Stat。Soc。、36(2)、111–147、1974。

私はへの参照を見ました

Mosteller F.およびTukey JW データ分析(統計を含む)。社会心理学ハンドブック。Addison-Wesley、レディング、MA、1968。

k

1931年の論文

ラーソンS。多重相関係数の収縮。J.エデュカット。Psychol。、22:45–55、1931。

ランダムに選択された検証セットがモデルのその後の評価のために脇に置かれる初期の例として、例えばストーンによって言及されています。


モステラーとテューキーの参照は、良いスタート+1に見えます(トルコではなくテューキーだと思います!; o)
ディクランマースピアル

@ DikranMarsupial、Ha、Tukeyに謝罪します。参照をコピーして貼り付けましたが、名前のつづりが間違っていることに気付きませんでした。はい、間違いなくテューキーです。
NRH

1
MostellerとTukey:books.google.pl/…–
liori
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.