レイアウトについては、有名な「Lorem ipsum」テキストを使用して、どのように表示されるかをテストします。
私が探しているのは、テキストファイルを読み取るときに文字エンコードを処理するいくつかのメソッドをテストするためにJUnitテストで使用できる、いくつかの異なるエンコードでエンコードされたテキストを含むファイルのセットです。
例:持つISO 8859-1
エンコードされたテスト・ファイルおよびWindows-1252
エンコードされたテストファイルを。Windowsの-1252は、領域80の違いトリガする必要があり16 9F - 16。つまり、ISO 8859-1と区別するために、この領域の文字が少なくとも1つ含まれている必要があります。
おそらく、テストファイルの最良のセットは、各エンコーディングのテストファイルにすべての文字が一度含まれているものです。しかし、多分私はsthに気づいていません-私たちは皆、このエンコーディングのものが好きですよね?:-)
文字エンコードの問題に関するそのようなテストファイルのセットはありますか?