news center

技术:计算机代码讲多种语言

技术:计算机代码讲多种语言

作者:公西文跄  时间:2017-11-05 07:36:01  人气:

纽约的JONATHAN BEARD美国计算机公司联盟宣布了一套新的计算机代码,用于表示世界主要语言中使用的每个数字,字母,表意文字和符号 - 以及大多数次要语言目前国际公认的版本仅包含256个字符,因此无法容纳欧洲的所有语言,更不用说世界其他语言该联盟被称为Unicode,其字符集也是如此 Unicode声称其新标准“将使多语言软件更易于编写,信息系统更易于管理,并且国际信息交换更加实用”由于它得到了一些世界上最大的计算机公司的支持,该联盟希望其新代码将成为事实上的世界标准实际上,西方世界的每台个人计算机现在都使用ASCII字符集(ASCII代表美国信息交换标准代码)它在1967年被采用为128个字符集,并且多年来翻了一番,达到256个字符 “ASCII是成功的,因为它提供了一个明确的,固定长度的代码,”Unicode的秘书Ken Whistler说 “它的最大缺点是它的名字:美国人”一位法国物理学家向丹麦的同事发送电子邮件不能使用重音字母,因为无法知道巴黎屏幕上显示的字母将如何显示在哥本哈根虽然每个ASCII字符由计算机中的8位数字表示,但Unicode将以16位数字表示其字符 Unicode将有65 536(2 16)而不是256(2 8)个字符 Unicode的成员公司包括IBM,Apple,Sun Microsystems和Microsoft,以及Research Libraries Group,这是一个由美国学术图书馆组成的联盟该联盟已经发现65000个字符足够多:6000个代码足以满足欧洲,中东和印度次大陆的所有字母表,而最大的代码块,中文,日文和韩文表意文字,需要另外一个代码 18 000.去年12月发布的Unicode版本1.0共有27 000个代码,包括数学和科学符号大约一半的代码仍未分配,如果有足够的需求,还有添加符文,象形文字和楔形文字的空间 Unicode希望它的字符集能够为目前普遍存在的混乱带来秩序国际标准化组织(ISO)为拉丁字母,希腊语,希伯来语,阿拉伯语和西里尔语建立了单独的8位字符集,但它们并未统一使用中国,日本,韩国和台湾都建立了国家标准,但这些完全不相容,即使两种语言使用相同的表意文字在大多数情况下,Unicode使用现有标准,但对于亚洲语言,联盟花了数年时间消除重复字符 “我们的学者能够找到超过11000个符合中文,日文,韩文和台湾标准的字符,在代码中节省了大量空间,”惠斯勒说新代码在速度和空间方面都付出了代价因为每个新的Unicode字符所占用的数据位数是ASCII字符的两倍,所以调制解调器每秒会发送一半的Unicode字符,而光盘将占用一半的文本该联盟相信,