文字コードエラー

投稿者: | 2008年1月11日

Pythonで、文字コード関係のエラーが出ることがある。
たとえば、以下のようなメッセージが出る場合。

UnicodeDecodeError: ‘ascii’ codec can’t decode ・・・

実際、僕もこのようなメッセージが出て途方に暮れた。
例によって、頼るのは先達のありがたいアドバイス。検索してみるとあっさり見つかった。
以下の対処で解決。
・ sitecustomize.py というファイルを “Pythonをインストールしたディレクトリ/Lib” に作成する。
 内容は、

import sys
sys.setdefaultencoding(‘utf-8’)

これだけである。
以前の記事で紹介したスクリプトも、この対策をしていれば日本語も問題なく扱うことができる。