Pythonを使用して解析したい次のXMLがありますElementTree
。
<rdf:RDF xml:base="http://dbpedia.org/ontology/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:owl="http://www.w3.org/2002/07/owl#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns="http://dbpedia.org/ontology/">
<owl:Class rdf:about="http://dbpedia.org/ontology/BasketballLeague">
<rdfs:label xml:lang="en">basketball league</rdfs:label>
<rdfs:comment xml:lang="en">
a group of sports teams that compete against each other
in Basketball
</rdfs:comment>
</owl:Class>
</rdf:RDF>
すべてのowl:Class
タグを検索して、タグrdfs:label
内のすべてのインスタンスの値を抽出します。次のコードを使用しています。
tree = ET.parse("filename")
root = tree.getroot()
root.findall('owl:Class')
名前空間のため、次のエラーが発生します。
SyntaxError: prefix 'owl' not found in prefix map
http://effbot.org/zone/element-namespaces.htmにあるドキュメントを読んでみましたが、上記のXMLには複数の名前空間がネストされているため、これを機能させることができません。
すべてのowl:Class
タグを見つけるためにコードを変更する方法を教えてください。