次のような文字列があります。
6Â 918Â 417Â 712
この文字列をトリミングする明確な方法(Pythonを理解しているように)は、文字列がと呼ばれる変数にあると言うだけs
です。
s.replace('Â ', '')
これでうまくいくはずです。しかしもちろん、'\xc2'
blabla.pyファイル内の非ASCII文字がエンコードされていないことを訴えます。
異なるエンコーディングを切り替える方法を私はまったく理解できませんでした。
ここにコードがあります、それは実際には上記と同じですが、今はコンテキストにあります。ファイルはメモ帳でUTF-8として保存され、次のヘッダーがあります。
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
コード:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
それ以上のことはありませんs.replace
...
u