タグ付けされた質問 「ascii」

英語のアルファベットの順序に基づく文字エンコード方式。ASCIIは、American Standard Code for Information Interchangeの略です。

9
(grep)非ASCII文字に一致する正規表現?
Linuxでは、多くのファイルを含むディレクトリがあります。一部には非ASCII文字がありますが、すべて有効なUTF-8です。1つのプログラムにバグがあり、ASCII以外のファイル名で機能しないため、影響を受けるファイルの数を調べる必要があります。私はこれを使ってこれを行いfind、次にgrepを実行して非ASCII文字を出力し、次にa wc -lを実行して数字を見つけていました。grepである必要はありません。私は、任意の標準的なUnix使用できる正規表現のように、Perlの、sedは、AWKなどを、 しかし、「ASCII文字以外の文字」の正規表現はありますか?
169 regex  unicode  grep  ascii 


10
^ = 32の背後にあるアイデアは何ですか?小文字を大文字に、またはその逆に変換しますか?
コードフォースに関するいくつかの問題を解決していました。通常、私は最初に文字が大文字か小文字かをチェックし、次に減算または加算32して対応する文字に変換します。しかし、私は誰かが^= 32同じことをするためにやることを見つけました。ここにあります: char foo = 'a'; foo ^= 32; char bar = 'A'; bar ^= 32; cout << foo << ' ' << bar << '\n'; // foo is A, and bar is a これについての説明を探しましたが、わかりませんでした。なぜこれが機能するのですか?


10
Python文字列は[u'String ']として出力されます
OverантотвопросестьответынаStack Overflowнарусском:покодировкамutf-8выдаетрезультатпо-ренепо-ретпо-ререпо-ретпо-ретпо-рет これは確かに簡単なものになるでしょうが、本当に私を悩ませています。 Webページを読み取り、Beautiful Soupを使用してそれを解析するスクリプトがあります。私の最終的な目標はlink.contentsを出力することなので、スープからすべてのリンクを抽出します。 私が解析しているテキストはすべてASCIIです。Pythonは文字列をUnicodeとして扱うことを知っています。これは非常に便利で、weeスクリプトでは役に立たないと思います。 「文字列」を保持する変数を出力するたび[u'String']に、画面に出力されます。これを単にASCIIに戻す簡単な方法はありますか、それを取り除くための正規表現を書く必要がありますか?
142 python  unicode  ascii 

6
デフォルトのエンコーディングがASCIIの場合、なぜPythonはUnicode文字を出力するのですか?
Python 2.6シェルから: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> 「é」文字はASCIIの一部ではなく、エンコーディングも指定していないため、printステートメントの後に意味不明またはエラーが発生するはずです。デフォルトのエンコーディングであるASCIIが何を意味するのか理解できません。 編集 編集を[ 回答]セクションに移動し、提案どおりに承認しました。

5
intをASCIIに変換してPythonに戻す
私は自分のサイトのURL短縮ツールの作成に取り組んでおり、現在の計画(私は提案を受け入れています)では、ノードIDを使用して短縮URLを生成します。したがって、理論的には、ノード26はshort.com/z、ノード1はshort.com/a、ノード52はshort.com/Z、ノード104はとなる可能性がありますshort.com/ZZ。ユーザーがそのURLにアクセスした場合、プロセスを逆にする必要があります(明らかに)。 私はこれについていくらか不器用な方法を考えることができますが、もっと良い方法があると思います。助言がありますか?
137 python  integer  ascii  encode 



12
Javaでの「エンコーディング用のマップできない文字」警告
私は現在、コンパイル時に次の警告を出すJavaプロジェクトに取り組んでいます。 /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = "� 2003-2008 My Company. All rights reserved."; SOが日付の前に文字をどのようにレンダリングするかはわかりませんが、それは著作権記号である必要があり、警告の中にひし形の疑問符として表示されます。 文字が出力アーティファクトに正しく表示されることは注目に値しますが、警告は煩わしいものであり、このクラスを含むファイルは、エンコーディングを誤って保存するテキストエディターによっていつか操作される可能性があります... この文字を「著作権」文字列に挿入して、コンパイラーを満足させ、再エンコードの問題が発生することなくシンボルをファイルに保存するにはどうすればよいですか?
112 java  encoding  utf-8  ascii 


15
C#で文字列のASCII値を取得する方法
C#で文字列内の文字のASCII値を取得したい。 文字列の値が「9quali52ty3」の場合、11文字のそれぞれのASCII値の配列が必要です。 C#でASCII値を取得するにはどうすればよいですか?
108 c#  encoding  ascii 

9
Python Unicodeエンコードエラー
Amazon XMLファイルを読み取って解析していますが、XMLファイルに 'が表示されているのに、印刷しようとすると次のエラーが発生します。 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) これまでオンラインで読んだことから、エラーはXMLファイルがUTF-8であるという事実に起因していますが、PythonはそれをASCIIエンコード文字として処理したいと考えています。エラーをなくし、プログラムがXMLを読み取るときにXMLを印刷する簡単な方法はありますか?
104 python  unicode  ascii  encode 

8
Pythonでファイルから文字を読み取る
テキストファイルには、「これは好きではありません」という文字列があります。 しかし、それを文字列に読み込むと、「こんな風に\ xe2 \ x80 \ x98t」のようになります。\ u2018が「 '」のUnicode表現であることを理解しています。私が使う f1 = open (file1, "r") text = f1.read() 読み取りを行うコマンド。 さて、文字列に読み込まれたときに、「I like \ xe2 \ x80 \ x98t like this like this」の代わりに、「I do n't like this」のように文字列を読み取ることはできますか? 2番目の編集:この問題を解決するためにマッピングを使用する人を見たことがありますが、実際には、この種のANSIをUnicodeに(またはその逆に)変換する組み込みの変換はありませんか?

7
Pythonを使用して非ASCII文字を削除し、ピリオドとスペースを残すにはどうすればよいですか?
.txtファイルを使用しています。ASCII以外の文字を含まないファイルのテキスト文字列が必要です。ただし、スペースやピリオドは残したい。現在、私もそれらを取り除いています。これがコードです: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def get_my_string(file_path): f=open(file_path,'r') data=f.read() f.close() filtered_data=filter(onlyascii, data) filtered_data = filtered_data.lower() return filtered_data onlyascii()を変更してスペースとピリオドを残すにはどうすればよいですか?それほど複雑ではないと思いますが、理解できません。
100 python  text  unicode  filter  ascii 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.