GPUでpdfからhtmlに変換する方法は?


0

私はGPUでhtml変換にpdfをしたかったです。

統合グラフィックスカードの場合、それはそれ自身のRAMを持っていません。そのような場合、転送のオーバーヘッドは絶対にありません。そのため、pdfからhtmlへの変換の場合、並列処理とファイルのサイズが考慮されます。ファイルのサイズが大きくなりすぎることはありません。専用カードを使用すると、転送のオーバーヘッドが問題になる可能性があります。私たちが統合カードを使うならば、この問題はそこにはありません。

並列処理を考えると、並列化はページ単位で実現できると思います。動作しますか?

pdfからhtmlへの変換用の並列またはGPU実装はありますか? (今まで私は誰も見つけることができませんでした)

に投稿しました https://stackoverflow.com/questions/36199864/how-to-parallelize-pdf-to-html-conversion-on-gpu

投稿は描いている、それは実行可能ではありません。しかし、それがなぜ実現不可能であるのかはっきりしません。ページ単位で並列化できます。なぜ私たちはこれをやることができないのですか?

GPUでこの変換を実行できないのはなぜですか。

これに関してNVIDIAが発行したホワイトペーパーはありますか? (私も一人も見つかりませんでした)

現時点で任意のアイデアは非常に便利になります

前もって感謝します


たとえプログラミング言語が関係していなくても、それはまだプログラミングの問題です。私はあなたがここでより良い答えを得ることはないと思います、それからあなたはstackoverflowを受け取りました。
Máté Juhász

ありがとうございました。多分。しかし、私は詳細に理由が必要です。それは不可能か可能か事実は可能性か実現可能性についてですか?
Vanns

複雑な論理処理が必要なため、このタスクはGPU変換にはまったく適していないと思われます。 PDFから画像を取り出してWebページに挿入するだけでよいのであれば、GPUが行うべき複雑なことは何もありません。あなたがPDFのテキストを取り、それをhtmlに入れたいのであれば、やるべきことはそのテキストをhtmlブロックでラップすることだけで、これもまたGPUには何もしません。 OCRはGPU上で動作可能かもしれませんが、それは非常に複雑な作業であり、htmlコンバータへの無料のPDFに入れるような作業ではありません。
Mokubai

GPUはメインCPUのように複雑な分岐プロセッサではないため、単に「GPUで実行する」と言ってもタスクが速くなるわけではありません。 CPU上で「簡単」なタスクの多くは、GPUランドへの変換のために非常に骨の折れるように計画される必要があり、ほとんどの場合、投資収益率はそれだけの価値がありません。 GPUにはさまざまなパフォーマンスレベルがあるため、ハイエンドカードのCPUよりも10倍高速に実行できるタスクは、ローエンドGPUのCPUよりも10倍低速になります。あなたが持っている仕事に適したツールを使用してください。あなたの仕事に合うように道具を壊さないでください。
Mokubai

回答:


0

OCRはGPUで実行できますが、他のコンポーネントは必ずしもGPUを使用して高速になるとは限りません。あなたのGPUはシングルインストラクションマルチプルデータプロセッサ(SIMD)であり、これはそれが大量のデータに対して一度に同じ操作をすることができることを意味します。あなたのCPUは(マルチコアだと仮定して)マルチインストラクションマルチデータプロセッサ(MIMD)です。つまり、異なるデータに対して同時に多くの異なる操作を実行することができます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.