タグ付けされた質問 「ascii」

英語のアルファベットの順序に基づく文字エンコード方式。ASCIIは、American Standard Code for Information Interchangeの略です。







12
なぜBase64を使用するのですか?
ウィキペディアは言う Base64エンコードスキームは、テキストデータを処理するように設計されたメディアを介して保存および転送する必要があるバイナリデータをエンコードする必要がある場合に一般的に使用されます。これは、転送中にデータが変更されることなくそのままであることを保証するためです。 しかし、私たちのマシンが持っているメモリはバイナリを格納し、それはあなたがそれをどのように解釈するかに依存するので、データは常にバイナリで格納/送信されるということではありませんか?したがって、ビットパターン010011010110000101101110をManASCII としてエンコードする場合でもTWFu、Base64 としてエンコードする場合でも、最終的には同じビットパターンを格納することになります。 究極のエンコーディングがゼロと1に関するものであり、すべてのマシンとメディアがそれらを処理できる場合、データがASCIIまたはBase64として表されているかどうかはどうですか? 「テキストデータを扱うように設計されたメディア」とはどういう意味ですか?彼らはバイナリを扱うことができます=>彼らは何をでも扱うことができます。 みなさん、ありがとうございます。 データを送信するとき、意図したとおりの形式でデータが解釈されるかどうかはわかりません。したがって、両方の当事者が理解できる何らかの形式(Base64など)でコード化されたデータを送信します。同じ方法で送信者と受信者が異なる方法で解釈しても、コード化された形式に同意するため、データが誤って解釈されることはありません。 Mark Byersの例から 送りたい場合 Hello world! 1つの方法は、次のようにASCIIで送信することです。 72 101 108 108 111 10 119 111 114 108 100 33 ただし、バイト10は、反対側の改行として正しく解釈されない場合があります。したがって、ASCIIのサブセットを使用して、次のようにエンコードします 83 71 86 115 98 71 56 115 67 110 100 118 99 109 120 107 73 61 61 同じ情報量で転送されるデータが増えるという犠牲を払って、レシーバーが残りの文字セットの解釈が異なる場合でも、レシーバーが意図した方法でデータをデコードできるようにします。

7
非ASCII文字を1つのスペースに置き換えます
非ASCII(\ x00- \ x7F)のすべての文字をスペースに置き換える必要があります。私が何かを欠落していない限り、これはPythonでは簡単なことではないことに驚いています。次の関数は、すべての非ASCII文字を単に削除します。 def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) そして、これは非ASCII文字を文字コードポイントのバイト数に従ってスペースの量で–置き換えます(すなわち、文字は3つのスペースで置き換えられます): def remove_non_ascii_2(text): return re.sub(r'[^\x00-\x7F]',' ', text) ASCII以外のすべての文字を1つのスペースに置き換えるにはどうすればよいですか? 無数の同様のSOの質問、なしのアドレス文字代替として反対するストリッピング、そしてさらにすべての非ASCII文字ではない、特定の文字取り組みます。


17
アポストロフィのHTMLコード
一見シンプルなようですが、ウェブ上で何か関連するものを見つけることができません。 アポストロフィの正しいHTMLコードは何ですか?ですよ’ね?
222 html  ascii 


10
垂直タブとは何ですか?
垂直タブ文字(\vC言語、ASCII 11)の元々の歴史的使用は何でしたか? キーボードにキーがあったことはありますか?誰かがそれをどのように生成しましたか? 垂直タブ文字が面白くて役に立つ何かをする言語またはシステムが現在も使用されていますか?

16
Pythonの文字列がASCIIかどうかを確認するにはどうすればよいですか?
文字列がASCIIかどうかを確認したい。 気づいていますが、やってord()みるord('é')とわかりますTypeError: ord() expected a character, but string of length 2 found。Pythonのビルド方法が原因であることがわかりました(ord()のドキュメントで説明されています)。 チェックする別の方法はありますか?
211 python  string  unicode  ascii 

11
PythonでエラーなしにUnicodeをASCIIに変換する
私のコードはWebページを削って、それをUnicodeに変換するだけです。 html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) しかし、私はUnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal not in range(128) 私はそれがHTMLがどこかに間違った形式のUnicodeの試みを含んでいることを意味すると思います。エラーが発生する代わりに、問題の原因となっているコードバイトを削除できますか?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.