Lesson 2

実体参照と文字コードって?

 

二昔前は文字化けよくしていましたね。

ちかごろは文字化けを見ることがなくなりましたが、うっかりしないように注意事項です。

 

1.文字コードは基本UTF-8

<meta charset='utf-8'>とheadに一行入れておいてください。

もちろんutfが扱えるテキストエディタを使ってね。

UTF-8が大文字や小文字、ハイフンはいるのかいらないのかって、その時々で仕様が違うので厳密に書くときは適時調べてください…私も全部把握しているわけではありません。

気にしだしたらキリがなくて面倒なので厳密に区別したことないですが、'と"を使い分けてると「おっ」って思いますね。

 

私がずー----と使っているテキストエディタはサクラエディタです。選ぶのに困ったら使ってみてください。

 

サクラエディタのバーメニュー

 

改行コードとかも簡単に変えられて便利です。

 

プログラミングも今後するのであれば¥r(CR)は使わず¥n(LF)だけにする癖をつけると良いと思います。

英字だけだったJavaScriptやPerl、PHPでふと思いついたコメント書いたとたんに文字化けってミスをいまだにしてしまいます。

最初から無理やりどこかに日本語一文字でも入れて、エディタが次回からもutfと認識してくれるようにしておくという荒業で回避です。

 

2.実体参照

コーディングに使う文字をそのまま使うとまずいからって話です。

たとえば<や>をそのまま使うとどこかで絶対バグります。やりがちなpreタグやcodeタグでなんとなくごまかせてても、偶然うまくいっているだけで魔法タグではないです。きちんと&lt;と&gt;に変換してますか?

甘えがちな&と"もなるべく忘れずに参照文字にしておくとバグが減りますね。

この四文字でHTMLは問題なく、あとは臨機応変に対応してください。実体参照はたくさんあります。絵文字などマニアック(だった)ものも今は平気で表示されるので楽しい時代になりました。

ところで、よく"が2バイト文字で書かれてることがありませんか?コピペするとかなりの確率でエラーを出すアレです。これはプログラムでもかなり危険なので、CMSなどのシステム側で勝手に変換されてることがあり、嫌がらせではないですよ。

&lsquo;や&rsquo;なんてヤツもいつの間にか2バイト文字に変換されてしまします。

ここでは文字符号で参照文字を表記してますが、&#060;みたいな10進数表記でも構いません。好きな方や気分で変えてみましょう。

ちなみに最後に使われている©は&copy;で、丸に入ったCは?ってコーディングをたくさんしていたころによく聞かれました。

 

 

 

< ネット関連の記事一覧

 


 

2022/2/3 おーすけ