タグ付けされた質問 「parsing」

解析とは、アーティファクトを構成要素に分割し、それらの要素間の関係をキャプチャすることを指します。このタグは、自己ホスト型の解析プラットフォーム([parse-platform]タグを使用)に関する質問や、特定のプログラミング言語での解析エラー(代わりに適切な言語タグを使用)用ではありません。

9
Python:言語を決定する方法は?
私はこれを手に入れたい: Input text: "ру́сский язы́к" Output text: "Russian" Input text: "中文" Output text: "Chinese" Input text: "にほんご" Output text: "Japanese" Input text: "العَرَبِيَّة" Output text: "Arabic" Pythonでどうすればいいですか?ありがとう。
89 python  string  parsing 

7
ConfigParserを使用してセクション名のないファイルを読み取る
ConfigParserスクリプトのランタイム構成を読み取るために使用しています。 セクション名を指定しない柔軟性が必要です(十分に単純なスクリプトがあります。「セクション」は必要ありません)。例外ConfigParserをスローしNoSectionError、ファイルを受け入れません。 ConfigParserに(key, value)セクション名のない構成ファイルのタプルを単純に取得させるにはどうすればよいですか? 例えば: key1=val1 key2:val2 設定ファイルには書きたくありません。

18
Javaの真のソリューション:2つの文字列から2つの数値を解析し、それらの合計を返します
かなり愚かな質問です。与えられたコード: public static int sum(String a, String b) /* throws? WHAT? */ { int x = Integer.parseInt(a); // throws NumberFormatException int y = Integer.parseInt(b); // throws NumberFormatException return x + y; } それが良いJavaかどうかわかりますか?私が話しているのNumberFormatExceptionは、チェックされていない例外です。署名の一部として指定する必要はありませんsum()。さらに、私が理解している限り、チェックされていない例外の概念は、プログラムの実装が正しくないことを示すだけであり、さらに、チェックされていない例外をキャッチすることは、実行時に不良プログラムを修正するようなものであるため、悪い考えです。 誰かが次のことを明確にしてください: NumberFormatExceptionメソッドのシグネチャの一部として指定する必要があります。 独自のチェック済み例外(BadDataException)を定義し、NumberFormatExceptionメソッド内で処理して、として再スローする必要がありBadDataExceptionます。 独自のチェック済み例外(BadDataException)を定義し、正規表現のように両方の文字列を検証BadDataExceptionし、一致しない場合はスローする必要があります。 あなたの案? 更新: 想像してみてください。何らかの理由で使用する必要があるのはオープンソースフレームワークではありません。メソッドのシグネチャを見て、「OK、スローされることはない」と考えます。その後、ある日、例外が発生しました。正常ですか? アップデート2: 私sum(String, String)は悪いデザインだというコメントがいくつかあります。私は絶対に同意しますが、私たちが良いデザインを持っていれば元の問題は決して現れないと信じている人のために、ここに追加の質問があります: 問題の定義は次のようになりますString。数値がsとして格納されるデータソースがあります。このソースは、XMLファイル、Webページ、2つの編集ボックスを備えたデスクトップウィンドウなどです。 あなたの目標は、これらの2を取りString、それらをintsに変換し、「合計はxxxです」というメッセージボックスを表示するロジックを実装することです。 これを設計/実装するために使用するアプローチが何であれ、内部機能の次の2つのポイントがあります。 あなたが変換する場所Stringにint 2int秒追加する場所 私の元の投稿の主な質問は次のとおりです。 Integer.parseInt()正しい文字列が渡されることを期待します。悪い文字列を渡すときはいつでも、それはあなたのプログラムが正しくないことを意味します(「あなたのユーザーはばかです」ではありません)。一方でMUSTセマンティクスを持つInteger.parseInt()があり、他方で入力が正しくない場合に問題がない必要があるコードを実装する必要があります-SHOULDセマンティクス。 …


10
固定幅のファイルを効率的に解析する方法は?
固定幅の行を保持するファイルを解析する効率的な方法を見つけようとしています。たとえば、最初の20文字は列を表し、21:30から別の列を表します。 行が100文字を保持していると仮定すると、行をいくつかのコンポーネントに解析する効率的な方法は何でしょうか。 行ごとに文字列スライスを使用することもできますが、行が大きい場合は少し醜いです。他に速い方法はありますか?
84 python  parsing 

9
抽象構文木と具体的な構文木の違いは何ですか?
インタプリタ/コンパイラがどのように機能するかについて少し読んでいますが、混乱している領域の1つは、ASTとCSTの違いです。私の理解では、パーサーはCSTを作成し、それをセマンティックアナライザーに渡してASTに変換します。ただし、私の理解では、セマンティックアナライザーは単にルールが守られていることを確認します。なぜ具体的ではなく抽象的にするために実際に変更を加えるのか、私にはよくわかりません。 セマンティックアナライザーについて私が見逃しているものはありますか、それともASTとCSTの違いはやや人工的なものですか?

7
ArrayListからコンマ区切りの文字列を作成するにはどうすればよいですか?
デバッグログに出力するためにコンマ区切りのリストとして吐き出したい処理スクリプトにIDのArrayListを保存しています。物事をループすることなくこれを簡単に取得できる方法はありますか? 編集:.net 2.0以降で利用可能なList(Of T)を指摘してくれたJoelに感謝します。それが利用可能であれば、それは物事をトン簡単にします。
84 c#  vb.net  parsing 

5
AndroidでHTMLを解析する
私はウェブページからアンドロイドでHTMLを解析しようとしていますが、ウェブページがうまく形成されていないので、私は得SAXExceptionます。 AndroidでHTMLを解析する方法はありますか?
83 android  html  parsing 

6
8ビット組み込みシステムで使用できるflex / bisonの代替手段はありますか?
私は、avr-gccツールチェーンを使用したCのAVRマイクロコントローラーの演習として、言語のような単純なBASIC用の小さなインタープリターを書いています。ただし、レクサーとパーサーの作成に役立つオープンソースツールがあるかどうか疑問に思っています。 Linuxボックスで実行するようにこれを作成する場合は、flex / bisonを使用できます。8ビットプラットフォームに制限したので、すべて手作業で行う必要がありますか?

1
PythonでYAMLファイルを解析し、データにアクセスしますか?
私はYAMLを初めて使用し、YAMLファイルを解析し、解析されたYAMLのデータを使用/アクセスする方法を探しています。 私は、例えば、YAMLファイルを解析する方法についての説明に遭遇してきた、PyYAMLとチュートリアル、「どのように私はPythonでYAMLファイルを解析することができます」、「オブジェクトにPythonの辞書を変換する?」、しかし私は見つかっていないことです解析されたYAMLファイルからデータにアクセスする方法の簡単な例。 次のようなYAMLファイルがあるとします。 treeroot: branch1: branch1 text branch2: branch2 text テキスト「branch1text」にアクセスするにはどうすればよいですか? 「YAML解析とPython?」は解決策を提供しますが、より複雑なYAMLファイルからデータにアクセスする際に問題が発生しました。そして、解析されたYAMLファイルからデータにアクセスする標準的な方法があるかどうか疑問に思っています。おそらく「ツリーの反復」や「elementpath」表記に似ているか、XMLファイルを解析するときに使用されるものですか?
83 python  xml  parsing  yaml 

8
PHP:括弧内のテキストを抽出する最良の方法は?
括弧の間にあるテキストセットを抽出するための最良/最も効率的な方法は何ですか?可能な限り最も効率的な方法で、「これ(テキスト)以外のすべてを無視する」という文字列から文字列「text」を取得したいとします。 これまでのところ、私が思いついた最高のものはこれです: $fullString = "ignore everything except this (text)"; $start = strpos('(', $fullString); $end = strlen($fullString) - strpos(')', $fullString); $shortString = substr($fullString, $start, $end); これを行うためのより良い方法はありますか?一般的に正規表現を使用すると効率が低下する傾向があることは知っていますが、関数呼び出しの数を減らすことができない限り、おそらくこれが最善のアプローチでしょうか?考え?
83 php  parsing  string 

2
Pythonを使用したPDF解析-フォーマットされたプレーンテキストの抽出[クローズ]
閉まっている。この質問は、StackOverflowのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善したいですか?質問を更新して、StackOverflowのトピックになります。 5年前に閉鎖されました。 この質問を改善する PDFドキュメントからテキストを抽出できるPDFライブラリを探しています。PyPDFを見てきましたが、これでPDFドキュメントからテキストを非常にうまく抽出できます。これに伴う問題は、ドキュメントにテーブルがある場合、テーブル内のテキストがドキュメントの残りのテキストと一致して抽出されることです。これは、役に立たず、文字化けしているように見えるテキストのセクションを生成するため、問題になる可能性があります(たとえば、多数の数字がマッシュアップされます)。 表や特別なフォーマットを除いて、PDFドキュメントからテキストを抽出したいと思います。これを行うライブラリはありますか?

5
(文字列から)XMLを読み取り、いくつかのフィールドを取得する-XMLの読み取りに関する問題
私はこのXMLを持っています(と呼ばれるC#文字列に格納されていますmyXML) <?xml version="1.0" encoding="utf-16"?> <myDataz xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema"> <listS> <sog> <field1>123</field1> <field2>a</field2> <field3>b</field3> </sog> <sog> <field1>456</field1> <field2>c</field2> <field3>d</field3> </sog> </listS> </myDataz> そして、私はすべての<sog>要素を閲覧したいと思います。それぞれについて、子を印刷したいと思い<field1>ます。 だからこれは私のコードです: XmlDocument xmlDoc = new XmlDocument(); string myXML = "<?xml version=\"1.0\" encoding=\"utf-16\"?><myDataz xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\" xmlns:xsd=\"http://www.w3.org/2001/XMLSchema\"><listS><sog><field1>123</field1><field2>a</field2><field3>b</field3></sog><sog><field1>456</field1><field2>c</field2><field3>d</field3></sog></listS></myDataz>" xmlDoc.Load(myXML); XmlNodeList parentNode = xmlDoc.GetElementsByTagName("listS"); foreach (XmlNode childrenNode in parentNode) { HttpContext.Current.Response.Write(childrenNode.SelectSingleNode("//field1").Value); } しかし、文字列をXMLとして読み取ることができないようですか?私は得るSystem.ArgumentException
82 c#  .net  xml  parsing  xml-parsing 


5
OpenFileDialogパス/ファイル名からパスを抽出しています
私はファイルの選択から始まる小さなユーティリティを書いています、そしてそれから私はフォルダを選択する必要があります。選択したファイルがあった場所にフォルダをデフォルト設定したいと思います。 OpenFileDialog.FileNameフルパスとファイル名を返します-必要なのはパス部分(ファイル名なし)だけを取得することです。これを最初に選択したフォルダーとして使用できます。 private System.Windows.Forms.OpenFileDialog ofd; private System.Windows.Forms.FolderBrowserDialog fbd; ... if (ofd.ShowDialog() == DialogResult.OK) { string sourceFile = ofd.FileName; string sourceFolder = ???; } ... fbd.SelectedPath = sourceFolder; // set initial fbd.ShowDialog() folder if (fbd.ShowDialog() == DialogResult.OK) { ... } これを行うための.NETメソッドはありますか、それとも使用する必要がありますregex, split, trim,か?
81 c#  .net  parsing  path 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.