文字化け解説・文字化けパターンサンプル

目次


文字化けのパターンのサンプルです。

このページでは、HTMLファイルのヘッダの文字コード指定が間違っている場合などに ブラウザで開いた際に発生する文字化けについて、それぞれの文字化けを閲覧者のブラウザで実際に発生させる事ができるサンプルを用意しました。 対象の文字コードは、UTF-8・Shift_JIS・EUC-JPの3つとしました (2015年3月現在で、日本語文字を表示させることが出来る、HTMLファイルで使用可能な主要な文字コード)

主要3ブラウザ(IE11, Chrome41, Firefox36)で確認しましたが、文字化け表示のされ方がそれぞれ若干異なっていました。 そのため、各ブラウザ・各バージョンで実際に確認できるよう、文字コードの指定を間違えているHTMLファイルをIFRAMEで表示させています。 また、資料として「IE11, Chrome41, FirFox36」での画面キャプチャも添付しました。

また、こちらのページ「文字化けテスター」で、 任意の文字列を人工的に文字化けさせることができます。文字化け時と逆の文字コードの組み合わせを指定すると、 「情報が失われていない文字化け」だと、復元することも可能です。あわせてご利用ください。

元のファイルがUTF-8の場合

UTF-8をUTF-8で表示

正常に表示

UTF-8をShift_JISで表示

主に(なじみの薄い)漢字と半角カナに化け、一部が表示不可となる。「縺繧繝繹」など糸偏の漢字や 「撰托抵搾」など手偏の漢字がやや多く表示される。

UTF-8をEUC-JPで表示

大部分が(なじみの薄い)漢字に化け、一部が表示不可になる。

元のファイルがShift_JISの場合

Shift_JISをUTF-8で表示

ほとんどの文字が表示不可になる。一部はアスキー文字に化ける。

Shift_JISをShift_JISで表示

正常に表示

Shift_JISをEUC-JPで表示

アスキー文字や漢字に化け、一部が表示不可になる。比較的なじみのある範囲の文字に化ける。

元のファイルがEUC-JPの場合

EUC-JPをUTF-8で表示

ほとんどの文字が表示不可になる。一部がアラビア文字(?)などに化ける。

EUC-JPをShift_JISで表示

半角カナが多く表示(2000年初め頃まではこの感じの文字化けが多かった)

EUC-JPをEUC-JPで表示

正常に表示

※「元のファイルがUTF-8の場合」はすべて正常に表示され、それ以外はすべて文字化けするなど、 「画面キャプチャ」と異なる状態になる現象が確認されています。 原因の一つとして、文字コードを強制する機能があるプラグインを入れているために、そのような現象が発生することがあります。 その場合には、文字コードを強制する機能がありそうなプラグインを無効にしたり、シークレットモードで表示するなど試してみてください。 また、別のブラウザでも試していただきたいです。それでもダメな場合は不具合報告をしていただきたいです。

まとめ

私の経験上、「EUC-JPではないファイルをEUC-JPで開いているケース」は少ないように思います。 ですので基本的に太字のケースに気を付ければいいかと思います。

画面キャプチャ

IE11

Chrome41

Firefox36

コメント

表示不可の文字は、IEでは白抜きの四角で表現され、ChromeとFirefoxでは黒ひし形にクエスチョンマークで表現されます。

UTF-8やShift_JISをEUC-JPで開いた場合の表示は、ChromeではIEやFirefoxに比べるとかなり少なめに表示されます。

ちょこっとアンケート&メッセージ

このページに関するちょっとした感想または、要望、バグ・間違いの指摘などは、下記の送信欄からお送りください。 質問・その他お問合せなど、返信をご希望の方は「こちらのページ」からメッセージをお送りください。

「このページはお役に立ちましたか?」のアンケートと自由メッセージのどちらか一方でかまいません (両方だとよりうれしいです)。お気軽にご利用ください (感想・どんな用途で使用したかなどをいただけると作成・運営の励みになります!)


このページはお役に立ちましたか?
自由メッセージ
認証コード 必須
画像のひらがな一文字を入力してください。拗音・促音・濁点・半濁点はありません。