文字化けテスター

人工的に文字化けを発生させます

入力 出力 入力・出力のリストを
sample入力

概要

入力された文字列を人工的に文字化けさせます。

文字化け時と逆の文字コードの組み合わせを指定すると、 「情報が失われていない文字化け」だと、復元することも可能です。

Windowsでデフォルトで使われているのは、Shift_JISを Microsoftが独自拡張したMS932です。PHP上では「SJIS-win」と呼ばれています。

その他、「Windows-31J」「CP932」「Microsoftコードページ932」などと呼ばれることもありますが、すべて同じものを指しています。 また、単に「Shift_JIS」ということもあり、生の「Shift_JIS」なのか、 Microsoftが独自拡張した「Shift_JIS」なのか区別する必要があります。

補足

コメント

「情報が失われていない文字化け」とは、例えばEUCをSJISで表示した場合に発生する、 半角カナが頻出する文字化けなどです。この場合には復元できる可能性・割合が比較的高いです。

それに対し「情報が失われている文字化け」とは、クエスチョンマークや四角(?□)などの 別の文字に置き換えられている場合です。この場合には少なくともその部分は復元できません。 また、その割合が多ければ多いほど、復元できる可能性と割合が低下します。

ちなみに四角(□)に文字化けするケースは日本で「豆腐」と呼ばれるようになりそれが世界に広がり、 文字化けの代名詞として「tofu」が世界中で使われるようになりました。Googleが開発している 「Noto」というフォントは、 全ての言語を表示し豆腐の表示をなくすことを目指し「no more tofu」の略でNotoという名前にしたそうです。

関連・参考リンク

ちょこっとアンケート&メッセージ

このページに関するちょっとした感想または、要望、バグ・間違いの指摘などは、下記の送信欄からお送りください。 質問・その他お問合せなど、返信をご希望の方は「こちらのページ」からメッセージをお送りください。

「このページはお役に立ちましたか?」のアンケートとメッセージのどちらか一方でかまいません (両方書いていただけるとよりうれしいです)。お気軽にご利用ください (感想・どんな用途で使用したかなどをいただけると作成・運営の励みになります!)


このページはお役に立ちましたか? ※サンプルの追加・ツール改善の参考に利用させていただきます。 チェックを入れなければ値の送信はせず、メッセージのみの送信となります。