よく文字化けを起こす文字と言えば「~」も典型的な文字化け文字。

これはUNICODE制定時の勘違いが不幸の始まりで、
「~」は、左下から右上に上がる形で書き始まるけど、
UnicodeからEUC_JP等に変換すると、
左上から右下に下がる形で書き始まる、よく似た文字に変ってしまう。

しかも、逆変換すると元の文字に戻らないという難儀な物。

しかも、それを、OSによっては仕様書を無視して
普通の人にとって正しく見えるように変換テーブルをねじ曲げたり、
別のOSでは、文字コードが変っても見た目が同じようになるように、
フォントを変えてしまったりしていて、結構混沌な状況に。

この問題の唯一確実な解決方法は、
UNICODEをつかうならばUNICODEで全て統一すること。

でも、世の中のシステムは、
DBとロジックをUNICODEに統一できたとしても、
メールは未だにiso-2022-jpで送れという仕様もあるので、
なかなか対応が難しい。

ちなみに、おんなじ様に文字コードが変ってしまう文字としては
「-」(ハイフン/負記号)がある。
ただ、こっちは見た目が変らないので、普段はあまり問題にならないけど、
先日、これで一悶着があったのでやっぱり、駄目文字問題は面倒だなと。
※他にも「£」とか、「¬」とか、この手のUNICODEにまつわる文字問題は結構ある。