コンピュータサイエンス modelling

4

私は、「提案された友人」アルゴリズムに取り組むアプローチを決定することに興味があります。 Facebookには、知り合いかもしれないと思う個人を推薦する機能があります。これらのユーザーは、通常（ユーザーが友人を特に推奨するエッジケースを除く）、自分と非常によく似たネットワークを持っています。つまり、共通の友人の数が多い。Twitterは「Who To Follow」メカニズムについても同様の道をたどっていると思います。 Facebookの従業員であるStephen Doyle（Igy）は、外見などの友人よりも評価することがEdgeRankの公式を使用している関連ニュースフィードは同様の投稿であることを提案しました。別のユーザーがGoogleランクシステムを提案しました。 Facebookは、ニュースフィードの最適化を述べてい。Σ Uewede∑uewede\sum u_{e}w_{e}d_{e} あなたはeueu_{e} =閲覧ユーザーとエッジ作成者間のアフィニティスコア =このエッジの重み（作成、コメント、いいね、タグなど） =エッジが作成された時間に基づく時間減衰係数 wewew_{e} deded_{e} これらのアイテムを合計すると、オブジェクトのランクが得られるはずです。これは、Igyが示唆したように、同様の形式の何かが提案された友人に使用されることを意味します。だから私はこれがすべてのタイプの接続がランクシステムを介して一般的に行われる方法であると推測していますか？

29 algorithms machine-learning modelling social-networks

8

ランダムネスとは

私はコンピューターサイエンスの学生で、現在システムシミュレーションとモデリングコースに登録しています。それは私たちの周りの日常のシステムに対処し、たとえばIIDやGaussianなどの異なる分布曲線で乱数を生成することで、異なるシナリオでそれらをシミュレートすることを伴います。私はboidsプロジェクトに取り組んできましたが、まさに「ランダム」とは実際には何であるかという質問がありました。たとえば、Math.random()Java のメソッドを介したプログラミング言語でも、生成されるすべての乱数は、基本的に「アルゴリズム」に従って生成されます。特定のモデルを可能な限り正確にシミュレートするために、実際に生成される数字のシーケンスが実際にランダムであり、それが役立つことをどのように本当に知ることができますか？

23 randomness modelling

1

歌のクラスタリング（ジョー・ウォルシュ問題）

イーグルスは、70年代および80年代のロックスーパーグループであり、Hotel Californiaなどのクラシックを担当しています。それらには、ギタリストのジョー・ウォルシュがいる（たとえば、Life in the Fast Laneにある）ものと、彼がいない2つの非常に特徴的な音があります。後者の曲は、より陰鬱で退屈な感じがします。（教師なし）学習アルゴリズムが2つの音の違いを検出できる程度を理解したいと思います。スピードメタルとクラシック音楽の違いは簡単にわかると思いますが、同じバンドのサウンドはどうでしょうか。そのような実験をどのように設定しますか？何らかの標準形式の関連オーディオファイルが既にあると仮定します。これは、1980年にリードシンガーを変更したAC / DCなど、他のロックグループにも当てはまることに注意してください。

23 machine-learning modelling

1

数独パズルの効率的なエンコード

任意の9x9グリッドを指定するには、各正方形の位置と値を指定する必要があります。この単純なエンコーディングでは、81（x、y、value）トリプレットが得られ、x、y、および値ごとに4ビット（1-9 = 9値= 4ビット）が必要で、合計81x4x3 = 972ビットです。各正方形に番号を付けることにより、位置情報を7ビットに減らし、各正方形のビットと合計891ビットをドロップできます。所定の順序を指定することにより、合計324ビットの各値に対して、これを大幅に4ビットに減らすことができます。ただし、数独には数字が欠けている場合があります。これにより、指定する必要のある数字の数を減らすことができますが、位置を示すために追加のビットが必要になる場合があります。（位置、値）の11ビットエンコードを使用して、手がかりを持つパズルを指定できます。nnn11n11n11nビット、例えば最小（17）パズルには187ビットが必要です。私がこれまで考えた中で最良のエンコードは、各スペースに1ビットを使用して、それが満たされているかどうかを示し、そうであれば、次の4ビットが数値をエンコードすることです。これにはビットが必要で、最小パズルの場合は149（）です。できれば有効な各数独セットアップのデータベースなしで、より効率的なエンコードがありますか？（パズルから一般的なに対処するためのボーナスポイント）81+4n81+4n81+4nn=17n=17n=17nnnN×NN×NN \times N 多くのパズルは別のパズルを回転させたり、数字の単純な並べ替えをしたりするということを思いつきました。おそらくそれは必要なビットを減らすのに役立つ可能性があります。ウィキペディアによると、古典的な9×9数独ソリューショングリッドの数は6,670,903,752,021,072,936,960（OEISのシーケンスA107739）、または約です。6.67×10216.67×10216.67×10^{21} 計算を正しく行った場合（）、ルックアップテーブルの情報は73（72.498）ビットになります。ln(6,670,903,752,021,072,936,960)ln(2)ln(6,670,903,752,021,072,936,960)ln(2)\frac{ln{(6,670,903,752,021,072,936,960)}}{ln{(2)}} だが：回転、反射、順列、再ラベル付けなどの対称性を考慮すると、本質的に異なるソリューションの数は、5,472,730,538 [15]（OEISのシーケンスA109741）であることが示されました。これにより33（32.35）ビットが得られるため、使用する順列を示す巧妙な方法で73ビット全体を下回る可能性があります。

16 combinatorics modelling information-theory sudoku

4

実行可能な調理レシピを提案するアルゴリズムを考案する方法は？

私はかつて、料理のレシピを提案するアルゴリズムを作成したベテランを私のコースにいました。最初は、あらゆる種類のクレイジーなレシピが出てきました。その後、彼女は実際のレシピで調理アルゴリズムを訓練し、最終的には非常に良いレシピを提案します。彼女はベイズの定理やクラスタリングに関連するものを使用したと思いますが、彼女はずっといなくなっており、アルゴリズムもそうです。私はインターネットを検索しましたが、料理のレシピを探すとどんな種類の結果も得られますが、私が探しているものではありません。だから、私の質問は：どのアルゴリズムを使用して、実行可能なレシピを（ランダムに）提案するアルゴリズムを考案できますか（固定レシピのデータベースを使用せずに）。なぜ調理アルゴリズムを探しているのですか？まあ、それは基礎となる概念の現実世界のアプリケーションの非常に良い例であり、そのようなアルゴリズムは現実世界により近いさまざまな設定で役立つ可能性があります。

15 machine-learning artificial-intelligence modelling recommendation-systems

2

2つの異なる価格のドリンクディスペンサーのCCSプロセス

ドリンクディスペンサーは、（コインを挿入するために、ユーザが必要です：）三つのボタンの、そしてプレス1 ˉ Dのお茶は、お茶のカップを要求Eの紅茶、コーヒーのため同上を、そしてˉ rは払い戻しを要求する（つまり、マシンが戻っていますコイン：ˉ B）。このディスペンサーは、次のCCSプロセスによってモデル化できます。c¯c¯\bar cd¯お茶d¯tea\bar d_{\text{tea}}eお茶eteae_{\text{tea}}r¯r¯\bar rb¯b¯\bar b M=d e fc 。（dお茶。e¯お茶。M+ dコーヒー。e¯コーヒー。M+ r 。b¯。M）M=defc.(dtea.e¯tea.M+dcoffee.e¯coffee.M+r.b¯.M) M \stackrel{\mathrm{def}}= c.(d_{\text{tea}}.\bar e_{\text{tea}}.M + d_{\text{coffee}}.\bar e_{\text{coffee}}.M + r.\bar b.M) 内戦はコーヒーの価格を2コインに引き上げますが、お茶の価格は1コインのままです。私たちは、2枚のコインの後にのみコーヒーを配達し、1枚または2枚のコインの後に払い戻しを受け入れるように変更されたマシンを求めています。変更したマシンをCCSプロセスでどのようにモデル化できますか？

11 logic concurrency modelling process-algebras ccs

2

ピアグレーディングデザイン-グラフを選択して、正確なランキング/レーティングを取得

バックグラウンド。グレーディングプロセスの一部としてピアグレーディングを使用して、半自動グレーディングのコードを書いています。生徒には一度に2組のエッセイが与えられ、生徒はスライダーを使用してどちらが優れているか、どれほど優れているかを選択できます。たとえば、スライダーは次のようになります。 A---X-B ピアグレーディングの結果に基づいて、エッセイがランク付けされ、教師が上位X％と下位X％を評価し、すべてのエッセイのスコアがこれに基づいて自動的に計算されます。このランキング/スコアリングプロセスを実行する方法はすでに考え出されています。その部分はうまくいきます。私の質問。生徒に与えるエッセイのペアをどのように選択すればよいですか？シミュレーションでは、正確なランキングを取得するには、エッセイを少なくとも3回成績評価する必要があることが示唆されています。したがって、各エッセイは、ピアグレーディング用に提示されるペアのうち少なくとも3つに表示されます。これはグラフの問題と考えることができます。エッセイをノードと考えてください。各エッジは、ピアのグレーディングプロセス中に提示されるエッセイのペアを表します。上記の精度結果は、各ノード（またはほとんどのノード）の次数が少なくとも3であることを示唆しています。どのようなグラフを使用する必要がありますか？ピアグレーディング中に使用するグラフをどのように生成する必要がありますか？ 1つの課題は、グラフにクラスターがある場合、これによりピアグレーディングが歪むことです。たとえば、ピアグレーディングの結果が歪むため、高品質のエッセイに対してピアグレーディングを行うことは望ましくありません。あなたは何をお勧めします？この問題は、次のようなものを使用した無向グラフでモデル化できると思います。次数が最も低いノードを取得して、次に少ないノードとリンクしますあなたの平均学位が少なくとも3になるまで続けますノード接続を最大化クリークの数を最小限に抑えるこれは良いアプローチですか？そうでない場合、代わりに何をお勧めしますか？

9 algorithms graphs modelling

2

観測から確率分布関数を構築する

N個のプレーヤーとM個のオブジェクトがあり、各オブジェクトには値があります。各プレイヤーはオブジェクトを選択する際の戦略を持っています。プレイヤーは各ラウンドでオブジェクトを選択し、多くのプレイヤーは同じオブジェクトを選択できます。ただし、各オブジェクトの値は、それを選択したすべてのプレーヤー間で均等に分割されます。ゲームごとに9000ラウンド（選択肢）があります。私たちの目標は、ゲームの最後に蓄積する価値を最大化することです。質問：決定が確率変数であると仮定して、各プレイの確率分布関数を作成するにはどうすればよいですか？現在のアプローチ：私の現在のアプローチは、プレーヤーが特定のオブジェクトを選択する頻度をカウントし、ラウンドの総数で割ることです。これにより、プレーヤーがその特定のオブジェクトを選択する可能性が高くなります。問題：各プレーヤーが積極的にプレイし、可能な限り予測不可能（ノイズ）にしようとすると、私の現在のアプローチでは、確率分布関数が正確ではありません（9000ラウンドでは十分なデータではないようです）。これらの分布関数を構築するより良い方法はありますか？注：私は（ベイズモデルおよびHMM）が頻度カウントよりも優れていることをどこかで読んだことがありますが、それをこの状況にどのように適応させるかはわかりません。

7 machine-learning probability-theory modelling

1

ウィンドウが表示されている画面を表すための効率的なクエリ可能なデータ構造

（これは私の他の質問に関連しています、ここを参照してください） 3つのウィンドウがある画面を想像してください。これらをサポートしながら、これを表す効率的なデータ構造を見つけたいのですが。特定のウィンドウを他のウィンドウと重複せずに配置できる座標のリストを返します上記の例で、サイズ2x2のウィンドウを挿入する場合、可能な位置は（8、6）、（8、7）、..になります。アスペクト比を維持しながら、他のウィンドウと重ならないように画面上のウィンドウのサイズを変更する x、yの位置にウィンドウを挿入します（ウィンドウが重ならない場合）今の私の素朴なアプローチは、ウィンドウの配列を維持し、画面上のすべてのポイントを調べて、ウィンドウのいずれかにあるかどうかをチェックすることです。これは、ここで、画面の幅、高さであり、それにウィンドウの数です。一般に、各ウィンドウが多くのスペースをとる場合、は小さくなります（たとえば、<10）。O （N ⋅ M ⋅ W ）O（ん⋅メートル⋅w）O(n\cdot m\cdot w)n 、mん、メートルn, mwwwwww

7 algorithms computational-geometry user-interface modelling

タグ付けされた質問 「modelling」

タグ付けされた質問「modelling」