メンバーが他のセットの最大数に含まれている固定サイズのセットを見つける


7

ゲーテインスティトゥートで初心者レベルの外国語教授と出会い、できるだけ多くの学生とコミュニケーションをとるために学生が話す最も一般的な5つの言語を学んだことから、私は問題について考えていました。

有限数の人々がいて、それぞれがいくつもの言語を話しているとします。問題の目的のために、実際の言語を複雑にするいくつかのことを無視します(たとえば、人々は複数の言語を話しますが、異なるレベルでは、1つの言語を理解する人々は密接に関連する言語を理解できるかもしれません)言語など)。

したがって、たとえば:

  • P 1が話す{English, German}
  • P 2が話す{Spanish, Italian, French}
  • P 3が話す{Mandarin, English}
  • P 10000が話す{Afrikaans, Swahili, English}、など。

できるだけ多くの人に理解していただけるように翻訳したい文書を書いています。残念ながら、私の予算は限られているため、N言語にしか翻訳できません。

与えられたNの値に対して、意図した母集団から最大数の人々に到達するためのN言語の最適セットをどのように計算しますか?

この問題は、集合論/組み合わせ論の問題として簡単に一般化できるように聞こえるので、誰かが以前にそのような何かに取り組んだことがあると私は確信しています。既存の文献を見てみたいのですが、それを見つける方法がわかりません。

このタイプの問題に名前はありますか?そうでない場合は、別の既知の問題に削減できますか?



2
@MatthewRockうん。りんごを手渡して「どういうりんご?」と聞くと 「なんか果物だよ」って言ったら、どう思いますか?
ラファエル

1
「セットを他のセットの固定量でカバーする問題の名前はありますか?」多分?さて、「ソリューションサイズが固定されたセットカバーの名前はありますか?」と尋ねます。しかし、どうやらあなたはセットカバーについて知らなかったので、それは意味がありません。
ラファエル

@ラファエル私はそれが逆だと思います。私はあなたに果物を渡し、それが何であるか尋ねます。「ある種のリンゴ」であるか、(おそらく)「おそらく木で育つ」ということです。あなたは私の質問に答えませんでしたが、多分それは私を助けることができるかもしれません-したがって、コメントではなくコメントです。最悪の場合:私は役に立たないコメントを投稿しました。少し現実的なケース:誰かが何か新しいことを学ぶ。
MatthewRock 2016

回答:


6

あなたの問題は、NPのハード最大カバレッジ問題の直接的なインスタンスであると考えています。これは、セットカバーに関連しています。

ウィキペディアから、最大カバレッジ問題

入力として、いくつかのセットと数kが与えられます。セットには、いくつかの共通の要素がある場合があります。 要素の最大数がカバーされるように、これらのセットの最大kを選択する必要があります。つまり、選択したセットの和集合は最大サイズになります。

したがって、あなたのケースでは、カーディナリティがその言語を話す学生の数に等しい各言語のセットがあります。入力は、最大変換数Nです。


ばっちり成功。サイトへようこそ!
David Richerby 16

2

現時点で言語のネイティブスピーカーの数を無視する場合、問題はSet Coverです。すべての言語を最大でカバーできるかどうかを尋ねますk 翻訳者。

重みを追加すると(各言語のネイティブスピーカーの数)、最適化のモードが追加されます。一部の言語のみをカバーする場合がありますが、合計の重みを最大にします。これは確かに簡単ではありません。セットカバー自体からの削減は簡単です。

したがって、問題はNP困難です。

整数プログラミングを使用して表現することも簡単であるため、NP完全であると結論付けることができます。

名前についてはわかりません。「加重セットカバー」は、セットにコストがかかるバリアントですでに採用されていますが、これらのラインの周りに何かを発明します。「最大重量セットカバー」かもしれません。


ネイティブスピーカーを無視する必要はありません。関心のある人はそれぞれが話す言語のリストを持っています。そのうちの1人はおそらく彼らのネイティブ言語です。また、あなたは質問がすることとは逆の意味で最適化しているようです。あなたは「誰もが理解できる翻訳の最小数はいくつですか?」という質問に答えています。質問は、「私は一定の翻訳予算を持っている:理解できる人の数を最大化するためにどの言語に翻訳すべきか?」と尋ねています。
David Richerby 2016

2
実際、これはまだ私よりもNP硬さの簡単な証明を提供します。バイナリ検索を使用して最小値を見つけることにより、セットカバーを解くことができます。k(実行された翻訳の数)到達する人々のセットは全員です。
David Richerby 16

@DavidRicherby私は読者を意味しました。質問には暗黙の言葉が残っていますが、説明から、正確に最適化するために、どの言語を何人の人が理解できるかについてのデータがあると私は収集しました。私はどうやら誤解しやすい方法で処方しましたか?
ラファエル

@DavidRicherby予算内ですべての人に連絡することができない可能性があります。これはもちろん興味深いケースです。それが問題が普通のセットカバーと異なるところです。
ラファエル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.