質問
CSSパスに基づいてHTML要素のコンテンツを選択できるツール(Linuxが望ましい)を教えてください。
例
たとえば、次のHTMLドキュメントを考えてみます。
<html>
<body>
<div class="header">
<h1>Header</h1>
</div>
<div class="content">
<table>
<tbody>
<tr><td class="data">Tabular Content 1</td></tr>
<tr><td class="data">Tabular Content 2</td></tr>
</tbody>
</table>
</div>
<div class="footer">
<p>Footer</p>
</div>
</body>
</html>
CSSセレクターを使用して値を抽出できるコマンドラインプログラム(たとえば、「cssgrep」の一種)あれは:
cssgrep page.html "body > div.content > table > tbody > tr > td.data"
プログラムは、以下を標準出力に書き込みます。
Tabular Content 1
Tabular Content 2
関連リンク
- https://getfirebug.com/wiki/index.php/Command_Line_API#.24.24.28selector.29
- /programming/7334942/is-there-something-like-a-css-selector-or-xpath-grep
- https://github.com/keeganstreet/element-finder
- http://www.w3.org/Tools/HTML-XML-utils/
ありがとうございました!
brew install html-xml-utils
。