削除するにはいくつかの異なる方法があるHTML tags
からNSString
ではCocoa
。
1つの方法は、文字列をにレンダリングしNSAttributedString
、レンダリングされたテキストを取得することです。
別の方法は、NSXMLDocument's
- objectByApplyingXSLTString
メソッドを使用XSLT
して、それを行う変換を適用することです。
残念ながら、iPhoneはNSAttributedString
またはをサポートしていませんNSXMLDocument
。HTML
正規表現またはを使用して快適に感じるには、エッジケースと不正なドキュメントが多すぎNSScanner
ます。誰かがこれに対する解決策を持っていますか?
開始タグと終了タグの文字を単純に探すという提案が1つありました。この方法は、ごく簡単な場合を除いて機能しません。
たとえば、これらのケース(同じ主題のPerlクックブックの章にある)は、このメソッドを壊します。
<IMG SRC = "foo.gif" ALT = "A > B">
<!-- <A comment> -->
<script>if (a<b && a>c)</script>
<![INCLUDE CDATA [ >>>>>>>>>>>> ]]>