第3水準・第4水準漢字などをブログで使う。

JISの第3水準・第4水準漢字をウェブページで使ってみましょ、ということで。うちのブログの幾つかの記事にとっ散らかして書いているのでまとめておく。

1. テキストエディタでシコシコとHTMLを書く場合

文字コードを UTF-8 に設定して HTML を作成すれば大丈夫。

もちろん、UTF-8 が正しく扱えるエディタを使用せねばなりません。
Windows 向けのエディタでは、個人的には medit オススメ。Mac だったら、mi をずっと使用しています。
まぁこのあたりはお好みで。

2. WordPress で第3水準・第4水準漢字などを使いたい場合

UTF-8 だと、通常範囲の文字は 一文字あたり3バイト以内 のサイズなのですが、第3・第4水準漢字の一部は 一文字あたり4バイト なのですね。

そんなわけで、WordPress で4バイト文字を正しく扱うために、WPの設定とデータベースの設定を弄らなければなりません。

→ 詳しくはこちらの記事:WordPress で 4バイト文字を扱えるようにする。 を参照してください。

「第3・第4水準漢字は使うけれど 4バイト文字は絶対に使わない」というのであれば、この設定はしなくても大丈夫な筈。

3. Movable Type で第3水準・第4水準漢字などを使いたい場合

上記 WP の場合と同様の理由で、MTとデータベースの設定を変更しなくてはなりません。

こちらのサイト:Movable Type config utf8mb4 - さんしょううおの泡(あぶく)で、詳しい設定方法を見ることができます。

要は…

  • mt_entry テーブルのキャラクタセットを utf8mb4 に、称号順序を utf8mb4_general_ci に変更。
  • 4バイト文字が格納される可能性があるカラムのキャラクタセットを utf8mb4 に変更
  • このとき、MySQLのキーにサイズ制限があったりするので、適宜、カラムのデータサイズも変更する。
  • Movable Type 本体のスクリプトを弄って、utf8mb4 を読み出せるようにする。
…という作業を行うわけですね。

4. ああもう、データベースの設定とか無理。という場合

HTMLの「実体参照」を用いて文字を埋め込むという手があります。
詳しくは、先の記事:WordPress で 4バイト文字を扱えるようにする。 をご覧ください。

さて、こんな具合で「第3・第4水準漢字を使ったウェブページやブログの作成」はできると思います。

あとひとつ考えておかなければならないのは、上記のようにして整えた「製作者側の環境」ではなく、「閲覧者側の環境」。ブラウザや使用OSに依っては、うまく表示されないのではないか。

この辺りのことは、こちらの記事:第3水準・第4水準漢字などをウェブで使う。にまとめてありますのでご一読ください。「まっさらの Windows XP」以外の、より新しい環境ならば、おそらく表示に問題は出ないかと。

もうそろそろ「Windows XP」だとか「Internet Explorer 8」方面への対応を律儀に考えなくても良くね? と思ったりもする今日この頃です。

カテゴリ: