2012年8月1日 星期三

CJKV : 未統一漢字

CJKV : 未統一漢字
http://zh.wikipedia.org/wiki/CJKV#.E6.9C.AA.E7.B5.B1.E4.B8.80.E6.BC.A2.E5.AD.97

未統一漢字

    主條目:未統一漢字列表

有些字只是同一字在不同地區的寫法,理應統一,但因為字源分離原則而只好分開編碼。

值得注意的是字源分離原則由「 Unicode聯盟 決定把不正統的編入位於基本多文種平面的『 相容表意文字區 』( Compatibility Ideographs )」時起廢棄,原因是 CNS 中有太多字形非常接近,按 Unicode 標準應該統一的字。

這些字只有正統的會編入正式字集( 包括擴展A、B、C區 )中,不正統的編入位於「 第二輔助平面 」的「 相容表意文字補充區 」( Compatibility Ideographs Supplement )中。

例子:
Unicode     字     Unicode     字     Unicode     字
U+4E1F     丟     U+4E22     丢          
U+514C     兌      U+5151     兑          
U+518A     冊     U+518C     册          
U+5433     吳     U+5434     吴     U+5449     呉
U+543F     吿      U+544A     告          
U+5965     奥     U+5967     奧          
U+5968     奨     U+596C     奬     U+734E     獎
U+5986     妆     U+599D     妝          
U+59CD     姍     U+59D7     姗          
U+5C13     尓     U+5C14     尔          
U+5F54     彔     U+5F55     录          
U+6236     戶     U+6237     户     U+6238     戸
U+63FA     揺     U+6416     搖     U+6447     摇
U+66A8     暨     U+66C1     曁          
U+69D8     様     U+6A23     樣          
U+6A2A     横     U+6A6B     橫          
U+6B65     步     U+6B69     歩          
U+7155     煕      U+7199     熙          
U+7D55     絕     U+7D76     絶          
U+7DA0     綠     U+7DD1     緑          
U+9AEA     髪     U+9AEE     髮          
U+9EAA     麪     U+9EAB     麫          
U+9EBC     麼     U+9EBD     麽          
U+9EC3     黃     U+9EC4     黄          
U+9ED1     黑     U+9ED2     黒    


沒有留言: