文字化けテスター:開発者向け

人工的に文字化けを発生させます

入力 出力 入力・出力のリストを
sample入力

概要

入力された文字列を人工的に文字化けさせます。

文字化け時と逆の文字コードの組み合わせを指定すると、 「情報が失われていない文字化け」だと、復元することも可能です。

Windowsでデフォルトで使われているのは、Shift_JISを Microsoftが独自拡張したMS932です。PHP上では「SJIS-win」と呼ばれています。

その他、「Windows-31J」「CP932」「Microsoftコードページ932」などと呼ばれることもありますが、すべて同じものを指しています。 また、単に「Shift_JIS」ということもあり、生の「Shift_JIS」なのか、 Microsoftが独自拡張した「Shift_JIS」なのか区別する必要があります。

補足

コメント

元々は開発者向けに作った機能なのですが、開発者ではない人の間で文字化けの遊びに使用されることが多いようだったため、 開発者用と一般用でページを分け、一般用はシンプルに最も使用するUTF-8とShift_JISの変換に絞り利用し、元の機能をこちらに移動しました。

「情報が失われていない文字化け」とは、例えばEUCをSJISで表示した場合に発生する、 半角カナが頻出する文字化けなどです。この場合には復元できる可能性・割合が比較的高いです。

それに対し「情報が失われている文字化け」とは、クエスチョンマークや四角(?□)などの 別の文字に置き換えられている場合です。この場合には少なくともその部分は復元できません。 また、その割合が多ければ多いほど、復元できる可能性と割合が低下します。

ちなみに四角(□)に文字化けするケースは日本で「豆腐」と呼ばれるようになりそれが世界に広がり、 文字化けの代名詞として「tofu」が世界中で使われるようになりました。Googleが開発している 「Noto」というフォントは、 全ての言語を表示し豆腐の表示をなくすことを目指し「no more tofu」の略でNotoという名前にしたそうです。

関連・参考リンク

ちょこっとアンケート&メッセージ

このページに関するちょっとした感想または、要望、バグ・間違いの指摘などは、下記の送信欄からお送りください。 質問・その他お問合せなど、返信をご希望の方は「こちらのページ」からメッセージをお送りください。

「このページはお役に立ちましたか?」のアンケートと自由メッセージのどちらか一方でかまいません (両方だとよりうれしいです)。お気軽にご利用ください (感想・どんな用途で使用したかなどをいただけると作成・運営の励みになります!)


このページはお役に立ちましたか?
自由メッセージ
認証コード 必須
画像のひらがな一文字を入力してください。拗音・促音・濁点・半濁点はありません。
※サンプルの追加・ツール改善の参考に利用させていただきます。