サイト制作時の文字コードについて改めて勉強する
WEBサイトを制作する際にheadタグ内で文字コードを指定しますが、どんな種類があるんでしょう?
今まであまり考えずに文字コードは UTF-8 を指定して来ましたが、それぞれどんな意味があって、どんな歴史があるのか気になってしまったのでちょこっと調べました。
意外とまとめられているPOSTがなかったので、メモも兼ねてエントリーしときます。
HTMLで使われる文字コード一覧
- Shift-JIS
- EUC-JP
- ISO-2002-JP
- UTF-8
使われてるもののほとんどはこの4つですね。(他にもメジャーなのがあれば教えて下さい…)
じゃあ、それぞれどんな意味があるのか?
文字コードのそれぞれの意味
Shift-JIS について
Microsoftによって考えだされた文字コード。比較的昔から存在。(噂によると1982年に誕生したんだとか!)パソコンの標準の文字コードとしてよく使われる。
EUC-JP について
UNIX上で日本語を使うためによく使われる文字コード。いつ誕生したのかは不明とのことですが、Shift-JISよりも後になるんじゃないでしょうか。。曖昧ですいません。
ISO-2002-JP について
主に電子メールでよく使われる・・・らしい(Wikipedia参照)ISO/IEC 2022のエスケープシーケンスを利用して文字集合を切り替える7ビットのコードであることを特徴とする (アナウンス機能のエスケープシーケンスは省略される)。俗に「JISコード」と呼ばれることもある。・・・らしいです。読んでもよくわかりませんね。まあ、普通にサイトをつくっていく分にはあまり使わないかも知れません。
UTF-8 について
特徴としては、ちょっと重いけど日本語など表示する為のキャパが広い!といったところでしょうか。(解釈が間違ってたらすいません)
とまあ、この他にもUTF-16やUCS-4、UCS-2などなどたくさんの文字コードがございますが、そのあたりは高度な文字コードだと思いますので、普通にサイトをつくる場合は必要ないかなと思います。そのあたりは素晴らしく便利なWEBサービスを提供してくれているスーパープログラマーの方々にお任せするとして、最後に文字コードの書き方を載せて終わりにしますね。
<head></head>の中に下記コードを入れて終了!※大体は<head>のすぐ下に入れます!
ではまた!
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">