タグ付けされた質問 「parsing」

解析とは、アーティファクトを構成要素に分割し、それらの要素間の関係をキャプチャすることを指します。このタグは、自己ホスト型の解析プラットフォーム([parse-platform]タグを使用)に関する質問や、特定のプログラミング言語での解析エラー(代わりに適切な言語タグを使用)用ではありません。

11
URLの最後のスラッシュの後にすべてを取得する方法は?
PythonでURLの最後のスラッシュに続くものを抽出するにはどうすればよいですか?たとえば、これらのURLは次を返す必要があります。 URL: http://www.test.com/TEST1 returns: TEST1 URL: http://www.test.com/page/TEST2 returns: TEST2 URL: http://www.test.com/page/page/12345 returns: 12345 私はurlparseを試しましたが、のようなフルパスのファイル名が得られpage/page/12345ます。
110 python  parsing  url 

6
beautifulsoupを使用して属性値を抽出する
Webページの特定の「input」タグで単一の「value」属性のコンテンツを抽出しようとしています。次のコードを使用します。 import urllib f = urllib.urlopen("http://58.68.130.147") s = f.read() f.close() from BeautifulSoup import BeautifulStoneSoup soup = BeautifulStoneSoup(s) inputTag = soup.findAll(attrs={"name" : "stainfo"}) output = inputTag['value'] print str(output) TypeErrorが発生します。リストのインデックスはstrではなく整数でなければなりません Beautifulsoupのドキュメントからでも、文字列はここでは問題にならないはずです...しかし、私は専門家ではなく、誤解しているかもしれません。 どんな提案も大歓迎です!前もって感謝します。

16
Python / Json:二重引用符で囲まれた予期されるプロパティ名
私はPythonでJSONオブジェクトをロードするための良い方法を理解しようとしています。このjsonデータを送信します。 {'http://example.org/about': {'http://purl.org/dc/terms/title': [{'type': 'literal', 'value': "Anna's Homepage"}]}} 文字列として受信されるバックエンドに、それjson.loads(data)を解析するために使用しました。 しかし、同じ例外が発生するたびに: ValueError: Expecting property name enclosed in double quotes: line 1 column 2 (char 1) 私はそれをググりましたがjson.loads(json.dumps(data))、json形式ではないものでもあらゆる種類のデータを受け入れるため、個人的にはそれほど効率的ではないと思われるこのソリューション以外には何も機能しないようです。 どんな提案も大歓迎です。
110 python  json  parsing 

11
Visual Studio Solutionファイルの解析
.NETでVisual Studioソリューション(SLN)ファイルを解析するにはどうすればよいですか?相対的なビルド順序を保存しながら、複数のソリューションを1つにマージするアプリを書きたいと思います。

13
GAEで完全に有効なXMLを解析するときの「コンテンツはプロローグで許可されていません」
私は過去48時間、この非常に腹立たしいバグに頭を殴っていたので、ラップトップを窓から投げ出す前に、ようやくタオルを投げ入れて、ここで聞いてみようと思いました。 AWS SimpleDBに対して行った呼び出しからの応答XMLを解析しようとしています。応答は問題なく戻ってきます。たとえば、次のようになります。 <?xml version="1.0" encoding="utf-8"?> <ListDomainsResponse xmlns="http://sdb.amazonaws.com/doc/2009-04-15/"> <ListDomainsResult> <DomainName>Audio</DomainName> <DomainName>Course</DomainName> <DomainName>DocumentContents</DomainName> <DomainName>LectureSet</DomainName> <DomainName>MetaData</DomainName> <DomainName>Professors</DomainName> <DomainName>Tag</DomainName> </ListDomainsResult> <ResponseMetadata> <RequestId>42330b4a-e134-6aec-e62a-5869ac2b4575</RequestId> <BoxUsage>0.0000071759</BoxUsage> </ResponseMetadata> </ListDomainsResponse> このXMLをパーサーに渡します XMLEventReader eventReader = xmlInputFactory.createXMLEventReader(response.getContent()); eventReader.nextEvent();何度も呼び出して、必要なデータを取得します。 ここに奇妙な部分があります-ローカルサーバー内でうまく機能します。返事が来て、私はそれを解析して、みんな幸せです。問題は、コードをGoogle App Engineにデプロイしても、送信リクエストは引き続き機能し、応答XMLは100%同一で正しいように見えますが、応答は次の例外で解析に失敗します。 com.amazonaws.http.HttpClient handleResponse: Unable to unmarshall response (ParseError at [row,col]:[1,1] Message: Content is not allowed in prolog.): <?xml version="1.0" encoding="utf-8"?> …

4
フレンドリーな方法でffmpeg情報を取得する
ffmpegを使用してビデオファイルに関する情報を取得しようとするたびに、多くの役に立たない情報と優れたものが混在しています。 私は使用していffmpeg -i name_of_the_video.mpgます。 それを友好的な方法で得る可能性はありますか?つまり、JSONはすばらしい(そして醜いXMLでも構いません)。 今までのところ、アプリケーションで正規表現を使用してデータを解析しましたが、特定のビデオファイルに表示される厄介なコーナーがたくさんあります。遭遇したことはすべて修正しましたが、まだまだあるかもしれません。 私は次のようなものが欲しかった: { "Stream 0": { "type": "Video", "codec": "h264", "resolution": "720x480" }, "Stream 1": { "type": "Audio", "bitrate": "128 kbps", "channels": 2 } }
108 json  parsing  ffmpeg 

3
ネストされたJSONオブジェクト-すべてに配列を使用する必要がありますか?
JSONでオブジェクトをネストする方法はありますか?そのため、すべてから配列を作成する必要はありませんか?エラーなしでオブジェクトを解析するには、次のような構造が必要です。 {"data":[{"stuff":[ {"onetype":[ {"id":1,"name":"John Doe"}, {"id":2,"name":"Don Joeh"} ]}, {"othertype":[ {"id":2,"company":"ACME"} ]}] },{"otherstuff":[ {"thing": [[1,42],[2,2]] }] }]} このオブジェクトを「result」という変数にフェッチした場合、ネストされたオブジェクトに次のようにアクセスする必要があります。 result.data[0].stuff[0].onetype[0] そして result.data[1].otherstuff[0].thing[0] これは不器用で冗長なようですが、可能であれば次のようにします。 result.stuff.onetype[0] そして result.otherstuff.thing しかし、すべてが配列である場合、オブジェクトキーを直接使用するにはどうすればよいですか?私の混乱し、教育を受けていない心にとって、このようなものがより適切に見えるでしょう: {"data": {"stuff": {"onetype":[ {"id":1,"name": ""}, {"id":2,"name": ""} ]} {"othertype":[ {"id":2,"xyz": [-2,0,2],"n":"Crab Nebula","t":0,"c":0,"d":5} ]} } {"otherstuff": {"thing": [[1,42],[2,2]] } } } 私はおそらくここで基本的なことを誤解しているかもしれませんが、jQueryパーサー(およびjQuery 1.4で使用されるネイティブFFパーサー)が2番目のスタイルオブジェクトを受け入れることができません。誰かが私を悟らせることができればそれはありがたいことに感謝します!

5
HaskellのPrelude.readがMaybeを返さないのはなぜですか?
Prelude.readのタイプがである正当な理由はありますか read :: Read a => String -> a Maybe値を返すのではなく? read :: Read a => String -> Maybe a 文字列は解析可能なHaskellに失敗する可能性があるため、後者の方がより自然ではないでしょうか? あるいはEither String a、どこLeftが解析、およびなかった場合は、元の文字列を含んでいるでしょうRightそれがなかった場合の結果? 編集: 他の人に対応するラッパーを書かせてもらうつもりはありません。安全であるという安心感を求めているだけです。
108 parsing  haskell  types 


8
PHP YAMLパーサー[終了]
現在のところ、この質問はQ&A形式には適していません。私たちは回答が事実、参考文献、または専門知識によってサポートされることを期待しますが、この質問はおそらく議論、議論、投票、または拡張された議論を誘います。この質問を改善でき、再開できると思われる場合は、ヘルプセンターにアクセスしてください。 7年前休業。 PHP用の優れたYAMLパーサーを知っている人はいますか?もしそうなら、このライブラリの長所と短所は何ですか?
105 php  parsing  yaml 

12
JavaでINIファイルを解析する最も簡単な方法は何ですか?
Javaでレガシーアプリケーションのドロップイン置換を書いています。要件の1つは、古いアプリケーションが使用していたiniファイルをそのまま新しいJavaアプリケーションに読み込む必要があることです。このiniファイルの形式は、コメント用の文字として#を使用して、ヘッダーセクションとキー=値のペアを持つ一般的なWindowsスタイルです。 JavaのPropertiesクラスを使用してみましたが、もちろん、異なるヘッダー間で名前の衝突がある場合は機能しません。 したがって、問題は、このINIファイルを読み取ってキーにアクセスする最も簡単な方法は何でしょうか。
104 java  parsing  ini 

2
文脈自由文法とは何ですか?
誰かが文脈自由文法とは何かを私に説明できますか?Wikipediaのエントリ、次に正式な文法のWikipediaのエントリを調べた後、私は完全に戸惑いました。誰かがこれらのことを説明できるほど親切でしょうか? 構文解析と、正規表現エンジンの制限についても調査したいので、これは不思議に思っています。 これらの用語が直接プログラミングに関連しているか、一般的に言語学に関連しているかはわかりません。その場合は、申し訳ありませんが、もしそうであれば移動できますか?


8
LR、SLR、およびLALRパーサーの違いは何ですか?
LR、SLR、およびLALRパーサーの実際の違いは何ですか?SLRとLALRはLRパーサーのタイプであることを知っていますが、それらの解析テーブルに関する限り、実際の違いは何ですか? また、文法がLR、SLR、またはLALRであるかどうかを示す方法は?LL文法の場合、解析テーブルのセルに複数のプロダクションルールが含まれていてはならないことを示す必要があります。LALR、SLR、およびLRに同様のルールはありますか? たとえば、どのように文法を示すことができますか S --> Aa | bAc | dc | bda A --> d LALR(1)ではなくSLR(1)ですか? 編集(ybungalobill):LALRとLRの違いは何なのか、満足のいく答えが得られませんでした。したがって、LALRのテーブルはサイズが小さくなりますが、認識できるのはLR文法のサブセットのみです。誰かがLALRとLRの違いについて詳しく説明できますか?LALR(1)とLR(1)で回答できます。どちらも1トークンの先読みを使用し、どちらもテーブル駆動型です。それらはどのように違うのですか?

22
優先順位のある式(式)パーサー?
バイナリ(+、-、|、&、*、/など)演算子、単項(!)演算子、および括弧を処理する単純なスタックアルゴリズムを使用して、方程式パーサーを開発しました。 ただし、この方法を使用すると、すべてに同じ優先順位が残ります。演算子に関係なく左から右に評価されますが、括弧を使用して優先順位を強制できます。 そのため、現在のところ、「1 + 11 * 5」は56でなく、60を返します。 これは現在のプロジェクトに適していますが、後のプロジェクトで使用できる汎用ルーチンが欲しいです。 明確にするために編集: 優先順位のある方程式を解析するための良いアルゴリズムは何ですか? 私は実装が簡単なものに興味があり、利用可能なコードのライセンス問題を回避するために自分でコーディングできることを理解しています。 文法: 文法の質問が理解できません-これを手で書きました。YACCやBisonの必要性がわからないほど簡単です。「2 + 3 *(42/13)」のような方程式で文字列を計算するだけです。 言語: 私はCでこれを行っていますが、言語固有のソリューションではなく、アルゴリズムに興味があります。Cは十分に低いレベルなので、必要に応じて別の言語に簡単に変換できます。 コード例 上記で説明した単純式パーサーのテストコードを投稿しました。プロジェクトの要件が変更されたため、コードがプロジェクトに組み込まれていなかったため、パフォーマンスやスペースを最適化する必要がありませんでした。元の詳細形式であり、すぐに理解できるはずです。演算子の優先順位の観点からそれをさらに行う場合は、マクロハックを選択することになります。マクロハックは、プログラムの他の部分と簡単に一致するためです。ただし、これを実際のプロジェクトで使用する場合は、よりコンパクトで高速なパーサーを使用します。 関連する質問 数学パーサーのスマートなデザイン? -アダム

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.