プログラミング pdf

4

現在のところ、この質問は私たちのQ＆A形式には適していません。回答は事実、参考資料、または専門知識によって裏付けられることを期待していますが、この質問は、討論、議論、世論調査、または広範な議論を求める可能性があります。この質問を改善して再開できると思われる場合は、ヘルプセンターにアクセスしてガイダンスを入手してください。 8年前に閉鎖されました。どのPythonPDFライブラリがありますか？多くのグリッドを含むPDFを作成する必要があり、ページ（複数ページ）を管理できるライブラリを探しています。ライブラリは、ページがいつ終了するかを計算してから、次のページを作成する必要があります。

86 python pdf pdf-generation

10

多数のPDFファイルを比較するツール？[閉まっている]

現在のところ、この質問は私たちのQ＆A形式には適していません。回答は事実、参考資料、または専門知識によって裏付けられることを期待していますが、この質問は、討論、議論、世論調査、または広範な議論を求める可能性があります。この質問を改善し、場合によっては再開できると思われる場合は、ヘルプセンターにアクセスしてガイダンスを入手してください。 8年前に閉鎖されました。光学コンテンツについては、多数のPDFファイルを比較する必要があります。PDFファイルはさまざまなプラットフォームで作成されており、ソフトウェアのバージョンも異なるため、構造上の違いがあります。例えば：テキストのチャンクは異なる場合があります書き込み順序は異なる場合があります位置はいくつかのピクセルで異なる場合があります内部構造ではなく、人間のようにコンテンツを比較する必要があります。使用したPDFジェネレーターの異なるバージョン間のリグレッションをテストしたいと思います。

84 testing pdf compare

14

Webブラウザ内にPDFを表示する

Webブラウザ内の.htmlページにPDFを表示するにはどうすればよいですか？

84 html pdf browser

4

Rstudio rmarkdown：単一のPDFでの縦向きと横向きの両方のレイアウト

rmarkdown同じドキュメントに縦向きと横向きの両方のレイアウトを持つPDFを生成するためにどのように使用するのだろうか。rmarkdownラテックスを使用するよりもさらに良い純粋なオプションがある場合。これは、再現可能な小さな例です。まず、これ.RmdをRStudioでレンダリングすると（Knit PDFボタンを押す）、すべてのページが横向きのレイアウトでPDFになります。 --- title: "All pages landscape" output: pdf_document classoption: landscape --- ```{r} summary(cars) ``` \newpage ```{r} summary(cars) ``` 次に、縦向きと横向きのレイアウトを組み合わせたドキュメントを作成しようとします。の基本的な設定は、ここのYAML「含む」セクションに従って行われます。in_headerファイル「header.texは」のみを含む\usepackage{lscape}、のために提案パッケージknitr風景レイアウトこちらを。.texファイルは同じディレクトリにある.Rmdファイル。 --- title: "Mixing portrait and landscape" output: pdf_document: includes: in_header: header.tex --- Portrait: ```{r} summary(cars) ``` \newpage \begin{landscape} Landscape: ```{r} summary(cars) ``` \end{landscape} \newpage More portrait: ```{r} summary(cars) ``` …

84 r pdf rstudio knitr r-markdown

6

フィットするようにズーム：HTMLに埋め込まれたPDF

ローカルのPDFファイルを単純なWebページに埋め込んでおり、オブジェクトのサイズに合うように初期ズームを設定しようとしています。これが私が試したものですが、ズームには影響しません。 <embed src="filename.pdf?zoom=50" width="575" height="500"> 最初のズームがオブジェクトのサイズに合うように設定されるようにコードを変更する方法を知っている人はいますか。

84 html object pdf

13

実行時にc＃でPDFファイルを作成する[クローズ]

閉まっている。この質問は、StackOverflowのガイドラインを満たしていません。現在、回答を受け付けていません。この質問を改善したいですか？質問を更新して、StackOverflowのトピックになります。 6年前に閉鎖されました。この質問を改善する実行時にPDFファイルを作成できる.NET3.5に添付/添付できるPDFライブラリはありますか？つまり、新しいPDFファイルを開き、1行ずつ書き込み、画像を埋め込むなど、すべてC＃コードでPDFファイルを閉じます。？私が欲しいのは、Reporting Servicesのpdf出力オプションを使用せずにC＃でカスタマイズされたpdfライターを実装できるようにするツールと仕様のセットです。

83 c# pdf

12

PDFをPNGに変換する

PDFをPNG画像（少なくとも1つの表紙）に変換しようとしています。pdftkでPDFの最初のページを正常に抽出しています。私はimagemagickを使用して変換を行っています： convert cover.pdf cover.png これは機能しますが、残念ながら、cover.pngが正しくレンダリングされません（PDFのアルファオブジェクトの一部が正しくレンダリングされません）。ImageMagickがGhostScriptを使用して変換を行うことは知っています。gsを使用して直接行うと、目的の結果を得ることができますが、他のツールを利用できるため、変換ライブラリを使用したいと思います。 GhostScriptのこのコマンドは、目的のイメージを実現します。 gs -sDEVICE=pngalpha -sOutputFile=cover.png -r144 cover.pdf GhostScriptへの変換を介して引数を渡す方法はありますか、それともGhostScriptを直接呼び出すことに固執していますか？

83 image pdf png imagemagick ghostscript

10

PDFファイルをPHPとマージする[クローズ]

クローズ。この質問はもっと焦点を合わせる必要があります。現在、回答を受け付けていません。この質問を改善したいですか？質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てるようにします。 2年前に閉鎖されました。この質問を改善する私のコンセプトは-ウェブサイトには10個のPDFファイルがあります。ユーザーはいくつかのPDFファイルを選択してから、マージを選択して、選択したページを含む単一のPDFファイルを作成できます。PHPでこれを行うにはどうすればよいですか？

83 php pdf

5

URLパラメータを使用してPDF内のブックマークにリンクすることは可能ですか？

WebサイトでPDFファイルへのリンクを提供する場合、PDFブラウザープラグイン（使用されている場合）を最初から開くのではなく、特定のブックマークにジャンプさせる情報をURL（要求パラメーター）に含めることはできますか？：ような何かhttp://www.somehost.com/user-guide.pdf?bookmark=chapter3？ブックマークでない場合、特定のページに移動することは可能ですか？答えがあれば、AdobeのPDFリーダープラグインなどに固有で、バージョン制限があるかもしれないと思いますが、私はそのテクニックが存在するかどうかに主に興味があります。

82 url pdf hyperlink bookmarks

2

Pythonを使用したPDF解析-フォーマットされたプレーンテキストの抽出[クローズ]

閉まっている。この質問は、StackOverflowのガイドラインを満たしていません。現在、回答を受け付けていません。この質問を改善したいですか？質問を更新して、StackOverflowのトピックになります。 5年前に閉鎖されました。この質問を改善する PDFドキュメントからテキストを抽出できるPDFライブラリを探しています。PyPDFを見てきましたが、これでPDFドキュメントからテキストを非常にうまく抽出できます。これに伴う問題は、ドキュメントにテーブルがある場合、テーブル内のテキストがドキュメントの残りのテキストと一致して抽出されることです。これは、役に立たず、文字化けしているように見えるテキストのセクションを生成するため、問題になる可能性があります（たとえば、多数の数字がマッシュアップされます）。表や特別なフォーマットを除いて、PDFドキュメントからテキストを抽出したいと思います。これを行うライブラリはありますか？

82 python pdf parsing text-extraction information-extraction

10

PHPでのPDF編集？[閉まっている]

クローズ。この質問はもっと焦点を合わせる必要があります。現在、回答を受け付けていません。この質問を改善したいですか？質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てるようにします。 6年前に閉鎖されました。この質問を改善する PHPでPDFを編集するための良い方法を知っている人はいますか？できればオープンソース/ゼロライセンスコストの方法。:) PDFファイルを開き、PDF内のテキストを置き換えてから、PDFの変更バージョンを書き出すという方針に沿って考えていますか？過去にFPDFを使用してプログラムでPDFファイルを作成したことがありますが、少し扱いにくい場合があります。

81 php pdf

6

AndroidでPDFをレンダリングする方法

私のアプリケーションでは、バイトストリームを受信し、それを電話メモリ内のpdfファイルに変換します。それをPDFにレンダリングするにはどうすればよいですか？そして、それを活動に見せますか？

81 java android pdf

6

VB.NETまたはC＃でitextsharpdllを使用してPDFコンテンツを読み取る

Pdfreaderクラスのitexsharpを使用してPDFコンテンツを読み取るにはどうすればよいですか。私のPDFには、プレーンテキストまたはテキストの画像が含まれている場合があります。

80 c# vb.net pdf itextsharp

3

暗号化されたPDFからのPythonデータの抽出

私は純粋な数学の最近の卒業生で、基本的なプログラミングコースをほとんど履修していません。私はインターンシップを行っており、内部データ分析プロジェクトがあります。ここ数年の内部PDFを分析する必要があります。PDFは「保護されています」。つまり、暗号化されます。PDFパスワードはありません。さらに、パスワードが存在するかどうかは不明です。しかし、これらのドキュメントはすべて揃っており、手動で読むことができます。印刷することもできます。目標は、私たちがいくつかのアイデアを持っている言語であるPythonで読むことです。まず、いくつかのPythonライブラリでPDFを読み込もうとしました。しかし、私が見つけたPythonライブラリは暗号化されたPDFを読みません。当時は、Adobe Readerでもエクスポートできませんでした。次に、PDFを復号化することにしました。Pythonライブラリーpykepdfを使用して成功しました。Pykepdfは非常にうまく機能します！ただし、復号化されたPDFは、前のポイントのPythonライブラリ（PyPDF2およびTabula）でも読み取ることができません。現時点では、Adobe Readerを使用して復号化されたPDFから情報をエクスポートできるため、多少の改善がありましたが、目的はすべてをPythonで行うことです。私が示しているコードは、暗号化されていないPDFでは完全に機能しますが、暗号化されたPDFでは機能しません。pykepdfで取得した復号化されたPDFでも機能しません。私はコードを書きませんでした。PythonライブラリPykepdfとTabulaのドキュメントで見つけました。PyPDF2ソリューションは、Al Sweigartの著書「Automate the Boring Stuff with Python」で私が強く推奨しています。また、前に説明した制限付きで、コードが正常に機能していることも確認しました。最初の質問、プログラムが暗号化されたことのないファイルで動作する場合、なぜ復号化されたファイルを読み取れないのですか？ 2番目の質問、復号化されたファイルをPythonで何らかの方法で読み取ることができますか？どのライブラリがそれを実行できるか、または不可能ですか？復号化されたPDFはすべて抽出可能ですか？あなたの時間と助けてくれてありがとう!!! これらの結果は、Python 3.7、Windows 10、Jupiter Notebooks、およびAnaconda 2019.07を使用して見つかりました。 Python import pikepdf with pikepdf.open("encrypted.pdf") as pdf: num_pages = len(pdf.pages) del pdf.pages[-1] pdf.save("decrypted.pdf") import tabula tabula.read_pdf("decrypted.pdf", stream=True) import PyPDF2 pdfFileObj=open("decrypted.pdf", "rb") pdfReader=PyPDF2.PdfFileReader(pdfFileObj) pdfReader.numPages pageObj=pdfReader.getPage(0) pageObj.extractText() Tabulaを使用すると、「出力ファイルが空です」というメッセージが表示されます。 PyPDF2では、「/ n」のみが表示されます UPDATE …

12 python pdf encryption extraction

4

C＃でWindowsサービスを介してPDF印刷

このコードを使用して、Windowsサービス内でC＃を使用してローカルプリンターでPDFファイルを印刷しています。 Process process = new Process(); PrinterSettings printerSettings = new PrinterSettings(); if (!string.IsNullOrWhiteSpace(basePrint)) printerSettings.PrinterName = basePrint; process.StartInfo.FileName = fileName; process.StartInfo.Verb = "printto"; process.StartInfo.Arguments = "\"" + printerSettings.PrinterName + "\""; process.Start(); process.WaitForInputIdle(); ユーザーがWindowsサービスを実行するように設定すると、すべてが正常に機能します。 LocalSystem資格情報の下でこのコードを実行すると、「この操作に関連付けられているアプリケーションはありません」というエラーが表示されますが、これは通常、拡張子が.pdfのファイルの印刷操作を処理するプログラムがないことを示しています。。私の問題は、このコードがサービスに設定された特定のユーザーで機能し、ファイルを右クリックすることでプリンターにファイルを送信できるという事実によって確認されるように、この操作を処理するプログラム（Foxit Reader）があることです印刷オプションを選択します。特定のユーザーなしでサービス内からローカルプリンターで印刷できるように変更できるものはありますか？

8 c# pdf printing windows-services

タグ付けされた質問 「pdf」

タグ付けされた質問「pdf」