これはソースからの説明です(ほとんど)
22:03分
見る価値のある!
基本的に、ダグラスメリルによると、Googleの元CTOによると、次のようになります。
1)グーグルで(スペルミスのある)単語を書いた
2)必要なものが見つからない(結果をクリックしない)
3)単語のスペルを間違えたことに気づき、検索ボックスの単語を書き換えます。
4)欲しいものを見つけます(最初のリンクをクリックします)
このパターンは何百万回も乗算され、最も一般的なミススペルと最も「一般的な」修正とを示しています。
このようにして、Googleはほぼ瞬時に、すべての言語でスペル修正を提供できます。
また、これは、「nigth」グーグルが代わりにその単語を示唆するので、夜通し誰もが夜を綴るようになる場合を意味します。
編集
@ThomasRutter:ダグラスはそれを「統計的機械学習」と表現しています。
彼らは、どのクエリがどのユーザーからのものかを知っているため(Cookieを使用)、誰がクエリを修正したかを知っています。
ユーザーがクエリを実行し、ユーザーの10%のみが結果をクリックし、90%が戻って別のクエリ(修正された単語を含む)を入力し、今回は90%が結果をクリックした場合、彼らはそれを見つけたことがわかります修正。
また、表示されるすべてのリンクの情報を持っているため、それらが2つの異なる「関連」クエリであるかどうかも知ることができます。
さらに、スペルチェックにコンテキストが含まれるようになったため、コンテキストに応じて異なる単語を提案することもできます。
スペルを自動的に修正するためにコンテキストがどのように考慮されるかを示すGoogle Waveのデモ(@ 44m 06s)を参照してください。
ここでは、その自然言語処理のしくみについて説明します。
そして最後に、自動機械翻訳(@ 1h 12m 47s)をミックスに追加して実行できることの素晴らしいデモがあります。
ビデオに分と秒のアンカーを追加して、コンテンツに直接スキップします。それらが機能しない場合は、ページをリロードするか、マークまで手動でスクロールしてみてください。