注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云淡风轻

云淡风轻近午天,傍花随柳过前川。

 
 
 

日志

 
 

Unicode的问题  

2008-05-16 10:08:56|  分类: 格物致知 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
    如果一个页面要同时显示简体字,繁体字,那么gbk编码就足够了。但如果还要显示日文,韩文等,那就非utf-8不可了。在unicode里,\u0800-\u9FFF为中、韩、日字符。其中,中文的范围:\u4e00-\u9fa5,日文在\u0800-\u4e00,韩文为\u9fa5以上。
    但其实,用utf-8的话还是会有一个问题的。有一些汉字,在日文里也有使用,但写法和我们通常的写法有略有不同,也还可以辩认。如下图,第一行是汉字通常的写法,第二行是日文里的,写法上也略有变化。日文里应该就是直接用了中文,但因为历史上汉字就有很多异形字,两国各自标准化时采用的写法不一样。这样应该编成两个字符还是一个字符,确实也不好判断。目前,在unicode里,它们是编成一个字符。现在看起来不同是因为它们的字体不一样(第一行是宋体,第二行是MS Mincho),就是说,在一篇中文和日文混排的文章里,要想让分清楚这两种,用一种字体是不可能的。也就是说,要分开中文和日文,仅看unicode编码是不够的,还要检查字体。

    另一个问题,和技术无关,但是也很严重。为Unicode字符设计的字体里,应该采用哪一种写法呢?目前日本人的技术给中国强,影响比中国大,老外们采用日文中的写法,也顺乎道理人情。如果有一天所有人都使用unicode,和为unicode设计的字体,那我们的某些汉字就无形中被日本人同化了,虽然日本人的写法也是从中国传过去的。

  评论这张
 
阅读(96)| 评论(2)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017