最近、私はscribdにより、ユーザー(無料ユーザー)がサイトでホストされているドキュメントを閲覧するのが非常に難しくなることを見てきました。同じものをダウンロードすることはもちろん、ドキュメント内で検索する機能はありません。
JavaScriptを使用して、ブラウザでオンデマンドでページをロードするため、ブラウザの「名前を付けて保存」機能はあまり役に立ちません。
驚いたことに、テキストをコピー/貼り付けても、クリップボードに意味がわからないことがわかりました!間違っていたことを確認するために、ブラウザーでJavaScriptをオフにしてから、同じドキュメントを再度ロードしました。出来上がり、私はちらつきを見ていた。そのため、scribdのjavascriptがなんらかの形で意味のないテキストをデコードし、ブラウザに表示するように見えます。
さて、私の質問は、javascriptが有効になり、ブラウザでテキストが適切にレンダリングされた後でも、選択したテキストに対応するDOMオブジェクトを見ると、意味不明なテキストが表示されることです。
だから、今、私は混乱しています。テキストはユーザーには問題なく表示されますが、DOMオブジェクトにはまだ意味がありません。だから質問は、DOMオブジェクトにちらつきを保持し、デコードされたテキストをレンダリングできるようにするために、サイトはどのような種類のJavaScriptフック/コードを使用していますか?
デコードされたテキストにアクセスする方法はありますか?私の意図は、デコードするアルゴリズムをリバースエンジニアリングすることではなく、デコードされたテキストが保存されている場所を見つけることですか?
サンプル文書は次のとおりです。
Javascriptのオン/オフを切り替えるとどうなるかをご覧ください!