Unicode
Unicode(ユニコード)とは、全世界共通の文字コードである。
目次
概要
漢字はCJK統合漢字と言って、中日韓で微妙に形が違う漢字は1つのコードポイントに統合されている訳だが、「浅」は統合しても「桟」と「栈」は統合しないとかミスが多発している、どうすんの。また、「CJK」と極東を一括りにすることによって一部の人達が怒ってきそうである。漢字なんて元々中国からのパケリなのにね(^ДД^) 最近は線文字Bとか楔形文字とかも追加されていて、昔なのか現代なのか分からなくなって来ている。ファイストスの円盤も追加予定(未解読だろ)、神代文字は却下された(当たり前)。
主な(?)利用方法
「かける様」の文字列はしたらば掲示板の全体NGワードになってる訳だが、色んな幅のスペースや見えない文字とかがUnicodeには天こ盛りなので、それらの文字を「かける様」の中に入れることによって外見は何も変わりなくNGワードを回避することが出来る。但し名前やスレのタイトルには使えない。
主な文字
U+200C ‌ 幅無しノンジョイナー
本来の使い方は、隣接するアラビア文字をくっつかなくする。
U+200D ‍ 幅無しジョイナー
本来の使い方は、隣接するアラビア文字をくっつく形にする。
ライブドアに対策され現在は使用不可
- U+2009   細いスペース
- U+200A   極細スペース
- U+200B ​ 幅無しスペース
本来の使い方は、長い単語の中に入れておくと、行がはみ出した時にそこで改行してくれる。
- U+FEFF  幅無し改行しないスペース
意味無いやないか、と言ってはいけない。本来はテキストファイルの先頭に置いて、上位バイトが先か下位バイトが先かを判断するのに使うものである。
使用例
入力:救世主かける‌様万歳!! 表示:救世主かける様万歳!!