タグ付けされた質問 「parsing」

解析とは、アーティファクトを構成要素に分割し、それらの要素間の関係をキャプチャすることを指します。このタグは、自己ホスト型の解析プラットフォーム([parse-platform]タグを使用)に関する質問や、特定のプログラミング言語での解析エラー(代わりに適切な言語タグを使用)用ではありません。

13
Goで行ごとにファイルを読み取る
file.ReadLineGoで機能が見つかりません。すぐに書ける方法はわかりますが、ここで何か見落としているのではないかと思っています。ファイルを1行ずつ読み取る方法を教えてください。
335 string  file  parsing  go  line 

4
Pythonで設定ファイルを使用するベストプラクティスは何ですか?[閉まっている]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 2年前休業。 この質問を改善する 多くの引数を指定して実行するコマンドラインスクリプトがあります。私は今、あまりにも多くの議論を抱えるようになりました。私はいくつかの議論を辞書形式でも持ちたいと思っています。 だから物事を簡素化するために、代わりに設定ファイルを使用してスクリプトを実行したいと思います。ファイルの解析に使用するライブラリーが本当にわかりません。これを行うためのベストプラクティスは何ですか?もちろん自分で何かをハンマーで打つこともできますが、これのためのライブラリーがあれば、私はすべて耳を傾けます。 いくつかの「要求」: 使用するのpickleではなく、簡単に読み取って編集できる簡単なテキストファイルにしたいと考えています。 辞書のようなデータを追加できるようにしたいのです。つまり、なんらかのネストの形式をサポートする必要があります。 単純化された疑似サンプルファイル: truck: color: blue brand: ford city: new york cabriolet: color: black engine: cylinders: 8 placement: mid doors: 2

7
パンダのread_csv low_memoryおよびdtypeオプション
電話するとき df = pd.read_csv('somefile.csv') 私は得る: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130:DtypeWarning:列(4、5、7、16)には型が混在しています。インポート時にdtypeオプションを指定するか、low_memory = Falseを設定します。 dtypeオプションがに関連しているのはなぜですかlow_memory、なぜFalseこの問題を解決するのですか?

5
レクサー対パーサー
レクサーとパーサーは、理論的には本当に違いますか? 正規表現を嫌うのはおしゃれなようです。コーディングホラー、別のブログ投稿。 ただし、人気のある字句ベースのツールであるpygments、geshi、またはprettifyはすべて正規表現を使用します。彼らは何かを語っているようです... 字句解析が十分な場合、EBNFはいつ必要ですか? これらのレクサーによって生成されたトークンをバイソンまたはアントラーパーサージェネレーターで使用した人はいますか?
308 parsing  antlr  lexer  pygments 

5
PythonでJSONを解析する方法は?
私のプロジェクトは現在、PythonでJSONメッセージを受け取っており、情報を取得する必要があります。これを目的として、文字列内の単純なJSONに設定します。 jsonStr = '{"one" : "1", "two" : "2", "three" : "3"}' これまではリストを使用してJSONリクエストを生成してきましたがjson.dumps、これと反対のことを行うには、使用する必要があると思いますjson.loads。しかし、私はそれにあまり運がありませんでした。上の例の"2"入力で返されるスニペットを誰かに提供してもらえ"two"ますか?
281 python  json  parsing 

30
JavaScriptを使用してURLにパラメーターを追加する
AJAX呼び出しを利用するWebアプリケーションでは、リクエストを送信する必要がありますが、URLの最後にパラメーターを追加します。次に例を示します。 元のURL: http://server/myapp.php?id = 10 結果のURL: http://server/myapp.php?id = 10 &enabled = true 各パラメーターを調べてURLを解析するJavaScript関数を探し、新しいパラメーターを追加するか、既に存在する場合は値を更新します。

19
URI文字列を名前と値のコレクションに解析する
私はこのようなURIを持っています: https://google.com.ua/oauth/authorize?client_id=SS&response_type=code&scope=N_FULL&access_type=offline&redirect_uri=http://localhost/Callback 解析された要素を含むコレクションが必要です: NAME VALUE ------------------------ client_id SS response_type code scope N_FULL access_type offline redirect_uri http://localhost/Callback 正確には、C#/。NET HttpUtility.ParseQueryStringメソッドに相当するJavaが必要です。 これについてアドバイスをください。 ありがとう。

8
JavaでXPathを使用してXMLを読み取る方法
JavaでXPathを使用してXMLデータを読みたいので、収集した情報について、要件に従ってXMLを解析できません。 これが私がしたいことです: URLを介してオンラインからXMLファイルを取得し、XPathを使用してそれを解析します。2つのメソッドを作成します。1つは特定のノード属性IDを入力し、結果としてすべての子ノードを取得するものです。2つ目は、特定の子ノードの値のみを取得したい場合です。 <?xml version="1.0"?> <howto> <topic name="Java"> <url>http://www.rgagnonjavahowto.htm</url> <car>taxi</car> </topic> <topic name="PowerBuilder"> <url>http://www.rgagnon/pbhowto.htm</url> <url>http://www.rgagnon/pbhowtonew.htm</url> </topic> <topic name="Javascript"> <url>http://www.rgagnon/jshowto.htm</url> </topic> <topic name="VBScript"> <url>http://www.rgagnon/vbshowto.htm</url> </topic> </howto> 上記の例では、@ nameで検索する場合はすべての要素を読み取り、@ name 'Javascript'のURLが1つのノード要素のみを返すようにする1つの関数も読み取ります。
273 java  xml  parsing  xpath 

25
Androidでのクエリ文字列の解析
Java EEにはServletRequest.getParameterValues()があります。 非EEプラットフォームでは、URL.getQuery()は単に文字列を返します。 Java EEを使用していない場合に、URLのクエリ文字列を適切に解析する通常の方法は何ですか? < 暴言 > 自分のパーサーを作ってみようという答えが人気です。これは非常に興味深いエキサイティングなマイクロコーディングプロジェクトですが、良いアイデアだとは言えません :( 以下のコードスニペットは、一般的に欠陥があるか壊れています。それらを壊すことは読者にとって興味深い練習です。 そして、それらを使用するWebサイトを攻撃するハッカーに。 クエリ文字列の解析は明確に定義された問題ですが、仕様を読んでニュアンスを理解することは簡単ではありません。あなたのために、いくつかのプラットフォームライブラリコーダーにハードワークをさせ、修正を行わせるほうがはるかに良いです! < /暴言 >
271 java  android  parsing  url 

30
C ++でCSVファイルを読み取って解析するにはどうすればよいですか?
C ++でCSVファイルのデータを読み込んで使用する必要があります。この時点では、実際にはカンマで区切られたパーサーになります(つまり、新しい行やカンマをエスケープする必要はありません)。主なニーズは、メソッドが呼び出されるたびに次の行のベクトルを返す行ごとのパーサーです。 私はかなり有望に見えるこの記事を見つけました:http : //www.boost.org/doc/libs/1_35_0/libs/spirit/example/fundamental/list_parser.cpp 私はBoost's Spiritを使ったことがありませんが、試してみたいと思っています。しかし、私が見落としているより簡単な解決策がない場合にのみ。
264 c++  parsing  text  csv 




21
C ++ std :: stringが特定の文字列で始まるかどうかを確認し、部分文字列をintに変換するにはどうすればよいですか?
C ++で次の(Python疑似コード)を実装するにはどうすればよいですか? if argv[1].startswith('--foo='): foo_value = int(argv[1][len('--foo='):]) (たとえば、argv[1]ある--foo=98、次にfoo_valueです98。) 更新:単純な小さなコマンドラインツールに非常に小さな変更を加えることを検討しているだけなので、Boostを調べるのをためらっています(マイナーにBoostをリンクして使用する方法を学ぶ必要はありません)変化する)。

13
Python:文字列から\ xa0を削除しますか?
現在、Beautiful Soupを使用してHTMLファイルを解析し、を呼び出していますが、get_text()スペースを表す多くの\ xa0 Unicodeが残っているようです。Python 2.7でそれらすべてを削除し、スペースに変更する効率的な方法はありますか?より一般的な質問になると思いますが、Unicode形式を削除する方法はありますか? line = line.replace(u'\xa0',' ')別のスレッドで提案されているように、を使用してみましたが、\ xa0がuに変更されたため、代わりに "u"がどこにでもあります。): 編集:問題はによって解決されたようですがstr.replace(u'\xa0', ' ').encode('utf-8')、.encode('utf-8')何もせずに実行するreplace()と、たとえば\ xc2などの奇妙な文字が吐き出されます。誰かがこれを説明できますか?
240 python  parsing  unicode 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.