技術的雑談-文字コードで「〜」を使う時の文字化け
環境
WindowsXP、JDK1.4.2_08、Eclipse3.1.0
(で、現象が出たというだけで、これのせいかどうかはわからない)
現象
- Javaのソースのコメントに「〜」を入れ、文字コードをEUC-JPにて保存したところ、文字化けし、一部の漢字コードチェッカーでShift-JISエンコードのテキストファイルと認識される。
- でも、それ以外の部分はEUC-JPでエンコードされているし、エディターで開いても問題ない。
- 【2005/8/6追加】エンコードをShift-JISにすると文字化けし、MS932にするとちゃんと「〜」が表示される。
原因
推測ですが、
Javaの文字コード変換ルーチンにちょっと問題があるのかもしれません。
EUC-JPエンコードの時に、「〜」を使うと化けてしまうのかな?
そういえば時々「〜」を入れると「?」となるWebページとかあるけど、多分それと同じです。
【2005/8/6追加】Windowsで作成したテキストをShift-JISとしてコード変換を行っているためです。
Javaにおいては、Windowsで作成したテキストはShift-JISとは微妙に異なるMS932というエンコードと定義されています。
対処
「〜」を使わないようにする……?
【2005/8/6追加】Windowsで作成したテキストはShift-JISとしてコード変換を行う。
履歴
2005/8/6 -- MS932エンコードである事を記載、修正。
2005/8/5 -- 初版
技術的雑談へ戻る