ウェブの60%以上がすでにUnicodeに、Googleが文字コードについて発表
ブロードバンド
テクノロジー
注目記事

コンピューターでは文字にコードを割り当てて管理、表現している。このコードはそれぞれの言語圏で独自に作成されたため整合性、互換性がなかった。インターネットが普及すると統一されていない文字コードはトラブルを引き起こし、いわゆる文字化けの大きな原因となった。
Unicodeは全世界の文字を単一の規格にまとめたもので、1980年代に誕生した。つまりインターネットの普及以前だが、当初はほとんど使用されなかった。
今回のGoogleの発表によれば、2001年にはほとんど0%だったUnicodeが少しずつ使われるようになり、2005年ごろからは急速にU普及している。入れ替わるようにそれまでもっとも多かったASCIIが減少している。
日本で長らく主流だったシフトJISは緩やかに減少傾向にあり、日本語のウェブサイトでもUnicodeが使われることが増えている。
Googleでは、「Unicodeの普及によって我々がカバーしている多くの言語の処理が容易になる。Unicodeのおかげで、人々がGoogleで検索するとき、ほとんど全ての言語で情報を見るけることができる」としている。
《山田 正昭》
特集
この記事の写真
/