タグ付けされた質問 「xml-parsing」



6
C ++ではどのXMLパーサーを使用すればよいですか?[閉まっている]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか? Stack Overflowのトピックとなるように質問を更新します。 2年前休業。 解析が必要なXMLドキュメントがある、またはXMLドキュメントを作成してテキスト(ファイルまたはメモリ)に書き込む必要があります。C ++標準ライブラリにはこのためのライブラリがないため、何を使用すればよいですか? 注:これは、C ++-FAQスタイルの決定的な質問であることを意図しています。そう、それは他のものの複製です。他の質問はもう少し具体的なものを求める傾向があったため、私はそれらの他の質問を単に適切に使用しませんでした。この質問はより一般的です。
344 c++  xml-parsing  c++-faq 

2
XML解析に最適なノードモジュール[終了]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか?Stack Overflowのトピックとなるように質問を更新します。 6年前休業。 この質問を改善する XML解析に関する限り、XML解析に使用できる最良のノードモジュールはどれですか。

10
SAXとDOMの違いは何ですか?
XMLパーサーに関する記事を読んだところ、SAXとDOMに出会いました。 SAXはイベントベースで、DOMはツリーモデルです。これらの概念の違いは理解できません。 私が理解したことから、イベントベースとは、ノードに何らかのイベントが発生することを意味します。特定のノードをクリックすると、すべてのノードを同時にロードするのではなく、すべてのサブノードが表示されます。ただし、DOM解析の場合、すべてのノードが読み込まれ、ツリーモデルが作成されます。 私の理解は正しいですか? 誤りがある場合は訂正してください。または、イベントベースのツリーモデルをより簡単に説明してください。

7
Pythonを使用したHTMLの解析
Pythonリスト/辞書/オブジェクトの形式でタグを取得するのに役立つPython用のHTMLパーサーモジュールを探しています。 次の形式のドキュメントがある場合: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div id='class'>Something here</div> <div>Something else</div> </div> </body> </html> 次に、HTMLタグの名前またはIDを介してネストされたタグにアクセスする方法を提供します。これにより、基本的に、divタグclass='container'内に含まれているbodyタグ内のコンテンツ/テキスト、または類似のものを取得するように要求できます。 Firefoxの「要素の検査」機能(HTMLの表示)を使用している場合は、ツリーのように入れ子になった方法ですべてのタグが提供されることがわかります。 ビルトインモジュールの方がいいと思いますが、少し質問しすぎるかもしれません。 私はStack Overflowとインターネット上のいくつかのブログで多くの質問をしました、そしてそれらのほとんどはBeautifulSoupまたはlxmlまたはHTMLParserを提案しますが、これらのいくつかは機能を詳述し、どちらがより速く/より効率的かについての議論として終わります。

14
XML文字列をオブジェクトに変換
ソケットを介してXML文字列を受信して​​いますが、これらをC#オブジェクトに変換したいと考えています。 メッセージの形式は次のとおりです。 <msg> <id>1</id> <action>stop</action> </msg> 私は.Netを初めて使用するので、これを実行するためのベストプラクティスがわかりません。以前にJAXB for Javaを使用したことがあり、同様のものがあるかどうか、またはこれが別の方法で処理されるかどうかはわかりませんでした。

6
'ElementTree'を介してPythonで名前空間を持つXMLを解析する
Pythonを使用して解析したい次のXMLがありますElementTree。 <rdf:RDF xml:base="http://dbpedia.org/ontology/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns="http://dbpedia.org/ontology/"> <owl:Class rdf:about="http://dbpedia.org/ontology/BasketballLeague"> <rdfs:label xml:lang="en">basketball league</rdfs:label> <rdfs:comment xml:lang="en"> a group of sports teams that compete against each other in Basketball </rdfs:comment> </owl:Class> </rdf:RDF> すべてのowl:Classタグを検索して、タグrdfs:label内のすべてのインスタンスの値を抽出します。次のコードを使用しています。 tree = ET.parse("filename") root = tree.getroot() root.findall('owl:Class') 名前空間のため、次のエラーが発生します。 SyntaxError: prefix 'owl' not found in prefix map http://effbot.org/zone/element-namespaces.htmにあるドキュメントを読んでみましたが、上記のXMLには複数の名前空間がネストされているため、これを機能させることができません。 すべてのowl:Classタグを見つけるためにコードを変更する方法を教えてください。

2
エンティティ「foo」への参照は「;」で終了する必要があります デリミタ
Googleチェックアウトサンドボックスで生成されたHTMLコードがあり、HTMLページで正常に機能します。同じコードをXHTMLページに配置すると、以下の例外がスローされます。 エンティティ「w」への参照は「;」で終了する必要があります デリミタ w以下のsrc属性のURLのリクエストパラメータを参照しています。 <input type="image" name="Google Checkout" alt="Fast checkout through Google" src="http://sandbox.google.com/checkout/buttons/checkout.gif?merchant_id=211512493599623&w=180&h=46&style=white&variant=text&loc=en_US" height="46" width="180" /> これはどのように引き起こされ、どうすれば解決できますか?

4
XML属性値の改行は許可されますか?
私はそれがエレガントでも望ましいものでもないことを理解していますが、XML要素の属性値が複数行にまたがることが(整形式XMLで)許可されていますか? 例えば <some-xml-element value="this value goes over.... multiple lines!" /> ええ、私はそれを書くより良い方法があることに気づきました。私は個人的にそれを次のように書きます: <some-xml-element> <value>this value goes over... multiple lines!</value> </some-xml-element> または: <some-xml-element value="this value goes over....
" /> しかし、私たちは独自のXMLパーサーを持っているので、最初の例が整形式のXMLで許可されているかどうかを知りたいのです。
91 xml  xml-parsing 

2
jQuery xmlエラー '要求されたリソースに' Access-Control-Allow-Origin 'ヘッダーがありません。
私は楽しみのために私の個人的なプロジェクトに取り組んでいます。http: //www.ecb.europa.eu/stats/eurofxref/eurofxref-daily.xmlにあるxmlファイルを読み取り、xml を解析し、これを使用して、通貨間の値を変換します。 これまでのところ、xmlを読み取るためのかなり基本的なコードを考え出しましたが、次のエラーが発生します。 XMLHttpRequestは****を読み込めません。要求されたリソースに「Access-Control-Allow-Origin」ヘッダーがありません。したがって、オリジン ' http://run.jsbin.com 'はアクセスを許可されません。 $(document).ready( function() { $.ajax({ type: 'GET', url: 'http://www.ecb.europa.eu/stats/eurofxref/eurofxref-daily.xml', dataType: 'xml', success: function(xml){ alert('aaa'); } }); } ); 私のコードには何の問題もないので、誰かが私のコードで何が間違っているのか、そしてどのようにそれを修正できるかを指摘してほしいと思っています。

5
(文字列から)XMLを読み取り、いくつかのフィールドを取得する-XMLの読み取りに関する問題
私はこのXMLを持っています(と呼ばれるC#文字列に格納されていますmyXML) <?xml version="1.0" encoding="utf-16"?> <myDataz xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema"> <listS> <sog> <field1>123</field1> <field2>a</field2> <field3>b</field3> </sog> <sog> <field1>456</field1> <field2>c</field2> <field3>d</field3> </sog> </listS> </myDataz> そして、私はすべての<sog>要素を閲覧したいと思います。それぞれについて、子を印刷したいと思い<field1>ます。 だからこれは私のコードです: XmlDocument xmlDoc = new XmlDocument(); string myXML = "<?xml version=\"1.0\" encoding=\"utf-16\"?><myDataz xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\" xmlns:xsd=\"http://www.w3.org/2001/XMLSchema\"><listS><sog><field1>123</field1><field2>a</field2><field3>b</field3></sog><sog><field1>456</field1><field2>c</field2><field3>d</field3></sog></listS></myDataz>" xmlDoc.Load(myXML); XmlNodeList parentNode = xmlDoc.GetElementsByTagName("listS"); foreach (XmlNode childrenNode in parentNode) { HttpContext.Current.Response.Write(childrenNode.SelectSingleNode("//field1").Value); } しかし、文字列をXMLとして読み取ることができないようですか?私は得るSystem.ArgumentException
82 c#  .net  xml  parsing  xml-parsing 

6
StAXではなくSAXを選択する必要があるのはいつですか?
SAXやStAXのようなストリーミングxmlパーサーは、DOMパーサーのようなツリー構造を構築するパーサーよりも高速でメモリ効率が高くなります。SAXはプッシュパーサーです。つまり、オブザーバーパターン(リスナーパターンとも呼ばれます)のインスタンスです。SAXが最初にありましたが、次にStAX(プルパーサー)が登場しました。これは、基本的にイテレーターのように機能することを意味します。 どこでもSAXよりもStAXを好む理由を見つけることができますが、それは通常、「使いやすい」ということになります。 JAXPに関するJavaチュートリアルでは、StAXはDOMとSAXの中間として漠然と示されています。「SAXよりも簡単で、DOMよりも効率的です」。ただし、StAXがSAXよりも低速またはメモリ効率が低いという手がかりは見つかりませんでした。 このすべてが私に不思議に思いました:StAXの代わりにSAXを選ぶ理由はありますか?
81 java  xml  xml-parsing  sax  stax 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.