会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 电脑零配件 / 数据处理系统 / 数据处理系统和数据处理方法

数据处理系统和数据处理方法

阅读:520发布:2021-02-28

IPRDB可以提供数据处理系统和数据处理方法专利检索,专利查询,专利分析的服务。并且一种处理多种语言的数据的构造简单的数据处理系统。包括处理装置、显示装置、一组字形存储器和识别装置。字形存储器用于为各个字符代码存储字体并且用于向显示装置提供字形数据。根据字符代码的前2位的组合把字形存储器划分成四个区域。基于移位JIS标准把日语字符作为第一种语言的第一种字符集分配到第一区域里,并且把朝鲜语字符作为第二种语言的第二种字符集分配到第四区域里。根据字符的前2位识别装置识别字符代码对应的区域。,下面是数据处理系统和数据处理方法专利的具体信息内容。

1.一种数据处理系统,包括:

处理装置,用于处理包含着各表示一个字符的字符代码的数 据;以及显示装置,用于显示由字符代码表示的字符,

其中至少存在着一组字形存储器,用于为各个字符代码存储字 体并且用于向显示装置提供字形数据。根据字符代码的一个规定位 数的组合,把该字形存储器划分成多个区域,并且把不同语言的字 符集的字形分配到各个区域里。

2.一种数据处理系统,包括:

处理装置,用于处理包含着各表示一个字符的单字节或双字节 的字符代码的数据;以及显示装置,用于显示由字符代码表示的字符,

其中至少存在着一组字形存储器,用于为各个字符代码存储字 体并且用于向显示装置提供字形数据。根据字符代码的所规定的2 位的组合,该字形存储器被划分成四个区域,第一区域至第四区 域。并且把第一种语言的第一种字符集分配到第一区域里和把第二 种语言的第二种字符集分配到除第一区域之外的其它区域中的一个 区域里。

3.如权利要求2所述的数据处理系统,还包括识别装置,用 于根据字符代码的所规定2位识别一个字符代码对应的这些区域中 的一个区域。

4.如权利要求2所述的数据处理系统,其中一个字形存储器 集包含着可以同时在显示装置上显示的多个字符的字体。

5.如权利要求2所述的数据处理系统,其中只要需要,可以 显示或者来自第一字符集的第一字符串数据中的或者来自第二字符 集的对应第二字符串数据中的任何一种字符串数据。

6.如权利要求2所述的数据处理系统,其中第一字符集和第 二字符集是日语字符、汉语字符或朝鲜语字符。

7.如权利要求2所述的数据处理系统,其中把移位JIS标准字 符代码用作为第一字符集的字符代码。

8.如权利要求2所述的数据处理系统,其中把JIS标准字符代 码用作为第一字符集的字符代码。

9.如权利要求2所述的数据处理系统,进而包括转换装置, 用于转换字符集的字符代码。

10.一种数据处理方法,包括:

处理包含着各表示一个字符的字符代码的数据的步骤;以及显示由字符代码所表示的字符的步骤,

其中至少存在着一组字形存储器,用于为各个字符代码存储字 体并且用于向显示步骤提供字形数据。根据字符代码的一个规定位 数的组合,把该字形存储器划分成多个区域,并且把不同语言的字 符集的字形分配到各个区域里。

11.一种数据处理方法,包括:

处理包含着各表示一个字符的单字节或双字节字符代码的数据 的步骤;以及显示由字符代码表示的字符的步骤,

其中存在着一组字形存储器,用于为各个字符代码存储字体并 且用于向显示步骤提供字形数据。根据字符代码的所规定2位的组 合,该字形存储器被划分成四个区域,第一区域至第四区域。并且 把第一种语言的第一种字符集分配到第一区域里和把第二种语言的 第二种字符集分配到除第一区域之外的其它区域中的一个区域里。

12.如权利要求11所述的数据处理方法,还包括根据字符代 码的所规定2位识别一个字符代码对应的这些区域中的一个区域的 步骤。

13.如权利要求11所述的数据处理方法,其中一个字形存储 器集包含着可以同时在显示步骤上显示的多个字符的字体。

14.如权利要求11所述的数据处理方法,其中只要需要,可 以显示或者来自第一字符集的第一字符串数据中的或者来自第二字 符集的对应第二字符串数据中的任何一种字符串数据。

15.如权利要求11所述的数据处理方法,其中第一字符集和 第二字符集是日语字符、汉语字符或朝鲜字符。

16.如权利要求11所述的数据处理方法,其中把移位JIS标准 字符代码用作为第一字符集的字符代码。

17.如权利要求11所述的数据处理方法,其中把JIS标准字符 代码用作为第一字符集的字符代码。

18.如权利要求11所述的数据处理方法,还包括转换字符集 的字符代码的步骤。

说明书全文

本发明涉及用于处理多种语言的一种构造简单的数据处理系统 和数据处理方法。

在许多情况下,需要计算机处理在多种语言下编码的字符串数 据。随着卡拉OK系统在世界上更加流行,对能用于多种语言下的 卡拉OK系统的需求日益增加。并且,同时,强烈需要这样一种卡 拉OK系统,其允许许多人规定歌名、检索歌曲信息并且用他们自 己的语言显示歌词,从而来自各国的人们可以在同一地点享受卡拉 OK。

能处理多种语言的计算机必须能够处理根据某种专门的编码方 法的那些语言中的所有字符。这要求计算机把字符转换为由特定位 数构成的二进制代码系统。这种处理称为编码。这些基本代码中的 一种是图4中所示的字母数字和假名(ANK)代码。

如图4中所示,该ANK代码中的各个字符,是用一个8位 (一字节)的字符代码表示的。根据其在描述该字符的ANK编码 表中的位置,对应于各字符的8位字符代码是用二维(即水平和垂 直)坐标值表示的。也就是说,在ANK代码里,一个8位字符代 码的高位4位代表水平坐标值,而低位4位代表垂直坐标值。这两 个坐标值各由十六进制数表示,十六进制数由10个数字字符0至 9和6个字母字符A至F组成。例如,在ANK代码中,对应于假 名字符“ア”的字符代码是用十六进制B1(H)表示的,因为该 假名字符的水平坐标值为B而且垂直坐标值为1。

ANK编码的问题在于,尽管它几乎包括英语中所需的全部字 符(大写和小写字母字符、数字字符以及特殊符号),但是因为它 只包括片假名字符它是不适用于日语的。这是因为字符的数量随着 语言而变化。

更具体地,在英语中大约使用200个字符,包括大写/小写字 母字符和特殊符号,而在日语中使用片假名字符并使用平假名字符 和大约7000个汉字字符。在许多亚洲国家里,一种语言由许多字 符组成。例如,朝鲜语至少需要大约2300个常用的由首音(initial sounds)、中间音(intermediate sounds)和尾音(end sound)组合 的朝鲜语字符。

因此,对于诸如使用汉字字符的日语和汉语或者使用朝鲜语字 符的朝鲜语,由于这些语言使用大量的字符,不可能利用8位 ANK代码唯一地识别所有的字符。为了解决这个问题,已经使用 能代表更多字符的16位(双字节)二进制代码对汉字字符和朝鲜 文字符进行编码。

双字节代码系统的一个例子是移位JIS(日本工业标准)代 码,即日语汉字字符标准。移位JIS代码是通过在保持由JIS C6226定义的JIS代码的内容的情况下移动字符的字符定义位置建 立的。也就是说,在移位JIS代码里,各个汉字字符的两个字节中 第一个字节从它的定义位置移动到一个ANK代码未使用的未定义 区域里。然后把第二个字节移动到ANK代码中未定义ANK代码 控制字符、符号或空格的位置上去。这个方法使得有可能从各个汉 字字符代码的第一个字节中识别出该字符代码是一个日语汉字字 符。

其它已知的双字节代码系统包括GB 2312-80和KS C5601, GB 2312-80是用于表示大约7500个汉语汉字字符的汉字字符标 准,而KS C5601是用于表示大约2600个朝鲜语字符和大约3000 个汉字字符的朝鲜字符标准。

但是,不能够在同一个计算机上使用这些各具有自己的代码设 置的双字节代码系统。此外,利用32位表示大量字符的国际编码 字符集(ISO 10646-1/图5)在处理上是复杂的。为了解决这些 问题,近来提出把统一码用作为标准以允许在同一个计算机上使用 多种语言。

统一码是由美国国家标准学会(ANSI)提出的16位(双字 节)代码系统。具有一个由256×256种组合构成的称为基本语言 平面的大代码表的统一码的目的是,单靠该基本语言平面来表示所 有语言的字符代码设置。在该统一码中,某些等效的但是形状不同 的汉字代码字符,如日语中的“恶”和汉语中的“恶,被处理为相 同形状的字符。这些形状不同的字符是用称为CJK(中日朝)综合 汉字代码的一种公用代码表示的。

但是,用统一码实现处理多种语言的数据处理系统存在下述问 题。统一码所使用的特殊代码是和常规的代码系统不兼容的,因而 不可能利用现有的资源。

另外,由于统一码对所有语言的所有字符只使用一个大的基本 多语言平面,数据量增大了并且系统结构变得复杂。

另一个问题是有时忽略了多个语言之间的细微差别。在上面所 述的CJK综合汉字代码里,日语、朝鲜语和汉语中使用的多个形 状不同的字符被综合成一个汉字字符。因此,不可能区分在几种语 言中具有细小差异的汉字字符。图6表示不同形状字符的一个例 子。

因此,当在上述三种语言的一种语言下显示数据时,有时在那 种语言中不使用的形状不同的字符出现在所显示的数据中。

这样,在现有技术中,不可能在一个计算机上同时处理象日 语、朝鲜语、汉语等等的多种双字节语言。

本发明寻求结合上述的现有技术解决这些问题。本发明的一个 目的是提供一种处理多种语言的构造简单的数据处理系统。本发明 的另一个目的是提供一种数据处理系统,其处理多种语言并且还能 区分形状不同的字符。本发明的再一个目的是提供一种处理多种语 言并同寸利用现有资源的数据处理系统。

为了实现上述目的,本发明第一方面是一个数据处理系统,其 包括:处理装置和显示装置,处理装置用于处理包含着各表示一个 字符的字符代码的数据;显示装置用于显示用字符代码所表示的字 符。在该系统里至少存在着一组字形存储器,用于为各个字符代码 存储字符字体并且用于向显示装置提供字形数据,根据字符代码的 规定位数的组合该字形存储器划分成多个区域,并且把不同语言的 字符集的字形分配到各个区域里。

本发明第二方面从方法学的观点实现第一方面的发明并且是一 种数据处理方法,该方法包括处理包含着各表示着一个字符的字符 代码的数据的步骤;和显示用字符代码表示的字符的步骤,在该方 法里至少存在着一组字形存储器,用于为各个字符代码存储字体并 且用于向显示步骤提供字形数据。根据字符代码的一规定位数的组 合该字体存储器划分成多个区域,并且把不同语言的字符集的字形 分配到各个区域里。

根据本发明第一方面和第二方面,根据字符代码的一规定位数 的组合该字形存储器划分成多个区域,并且把不同语言的字符集分 配到各个区域里。这样能够表示和处理多种语言的字符类型。此 外,根据本发明第一方面和第二方面,一种字符集的代码不和另一 种字符集的代码重复,从而向每个形状不同的字符指定了统一的 代码。这样防止了把形状不同的字符处理为相同的代码。    

本发明第三方面是一个数据处理系统,包括处理装置和显示装 置,处理装置用于处理包含各代表着一个字符的单字节或双字节的 字符代码的数据;显示装置用于显示用字符代码表示的字符,在该 系统里至少存在一组字形存储器,用于为各个字符代码存储字体并 且用于向显示装置提供字形数据。根据字符代码的一规定2位的组 合该字形存储器被划分为四个区域,第一区域至第四区域,并且把 第一种语言的第一种字符集分配到第一区域里,而把第二种语言的 第二种字符集分配到除第一区域外的其它区域中的一个区域里。

本发明第四方面从方法学的观点实现本发明第三方面并且是一 种数据处理方法。该方法包括处理包含着各代表一个字符的单字节 或双字节的字符代码的数据的步骤和显示用字符代码表示的字符的 步骤,在该方法里至少存在一组字形存储器,用于为各个字符代码 存储一个字体并且用于向显示步骤提供字形数据。根据字符代码的 一规定2位的组合该字形存储器被划分为四个区域,第一区域至第 四区域,并且把第一种语言的第一种字符集分配到第一区域里,而 把第二种语言的第二种字符集分配到除第一区域外的其它区域中的 一个区域里。

根据本发明第三、第四方面所述的发明,根据双字节字符代码 的前二位的组合字形存储器划分为四个区域。把第一字符集指定到 第一区域,并把第二字符集指定到第二区域里。这可允许用双字节 字符代码代表和处理多种语言的字符类型。另外,根据本发明第一 方面所述的发明,第一字符集不和第二字符集重复,从而向每个形 状不同的字符分配了统一的字符代码。这样防止了把不同形状的字 符处理成相同的代码。

本发明第五方面是一个如本发明第三方面所述的数据处理系 统,其进而包括一个识别装置,用于根据字符代码的一规定2位识 别一个字符代码所对应的一个区域。

本发明第六方面从方法学的观点实现本发明第五方面并且是一 种如本发明第四方面所述的数据处理方法,该方法进行包括根据字 符代码的一规定2位识别一个字符代码所对应的一个区域的步骤。

根据本发明第五、第六方面,通过简单地检验一个字符代码的 前二位可以容易地识别和处理字符类型。

本发明第七方面是一个如本发明第三方面所述的数据处理系 统,其中一个字形存储器集包含着可以同时在显示装置上显示的多 个字符的字体。

本发明第八方面从方法学的观点实现发明第七方面并且是一种 如本发明第四方面所述的数据处理方法,其中一个字形存储器集包 含着可以同时在显示步骤上显示的多个字符的字体。

根据如本发明第七、第八方面所述的发明,第一和第二字符集 位于可以被同时显示的字符的字形区域里。这样可允许同时显示来 自第一字符集的字符和那些来自第二字符集的字符,使得用户可同 时观察来自两个集的字符。

本发明第九方面是一个如本发明第三方面所述的数据处理系 统,其中只要需要,可以显示来自第一字符集的第一字符串数据的 或者来自第二字符集的对应第二字符串数据的任何一种字符串数 据。

本发明第十方面从方法学的观点实现发明第九方面并且是一种 如本发明第四方面所述的数据处理方法,其中只要需要,可以显示 或者来自第一字符集的第一字符串数据的或者来自第二字符集的对 应第二字符串数据的任何一种字符串数据。

根据本发明第九、第十方面所述的发明,使得在处理期间来自 第一字符集的字符串对应于来自第二字符集的那些字符串。它给用 户多种显示选择,确保了高级的显示可操作性;例如,能够选择性 地显示来自不同字符集中的一个字符集的字符,或者,能够同时地 显示来自两个字符集的字符。

发明第十一方面是一个如本发明第三方面所述的数据处理系 统,其中第一字符集和第二字符集是日语字符、汉语字符或者朝鲜 语字符。

本发明第十二方面从方法学的观点实现本发明第十一方面并且 是一种如本发明第四方面所述的数据处理方法,其中第一字符集和 第二字符集是日语字符、汉语字符或者朝鲜语字符。

根据本发明第十一、第十二方面所述的发明,日语字符、汉语 字符或者朝鲜语字符被用作为第一字符集和第二字符集。因为这些 字符集需要相同等级分辨率的字形,存储区得到更好的使用。

本发明第十三方面是一个如本发明第三方面所述的数据处理系 统,其中把移位JIS标准字符代码用作为第一字符集的字符代码。

本发明第十四方面从方法学的观点实现发明第十三方面并且是 一种如本发明第四方面所述的数据处理方法,其中把移位JIS标准 字符代码用作为第一字符集的字符代码。

根据本发明第十三、第十四方面所述的发明,把移位JIS标准 字符代码用作为第一字符集,从而即使当这些字符和单字节的字符 相混合时仍可取消对控制代码(例如,输入/输出代码)的需要。 此外,因为该系统能和现有的与JIS兼容的硬件和软件一起很好的 工作并且保持它们的向上兼容性,现有资源可得到应用。

本发明第十五方面是一个如本发明第三方面所述的数据处理系 统,其中把JIS标准字符代码用作为该第一字符集的字符代码。

本发明第十六方面从方法学的观点实现发明第十五方面并且是 一种如本发明第四方面所述的数据处理方法,其中把JIS标准字符 代码用作为第一字符集的字符代码。

根据本发明第十五、第十六方面所述的发明,因为把JIS标准 字符代码用作为第一字符集,该系统能和现有的与JIS兼容的硬件 和软件一起很好的工作并且保持它们的向上兼容性,从而应用了现 有的资源。

本发明第十七方面是一个如本发明第三方面所述的数据处理系 统,进而包括转换装置,用于转换一个字符集的字符代码。

本发明第十八方面从方法学的观点实现发明第十七方面并且是 一种如本发明第四方面所述的数据处理方法,其进而包括转换一个 字符集的字符码的步骤。

根据本发明第十七、第十八方面所述的发明,本发明中采用的 字符代码能够用基于某其它标准的字符代码来代替。它能使得包括 数据在内的现有资源得到更好的使用。

从下述说明中将会更全面地显现本发明的其它的和更深层的目 的、特性和优点。

图1是一个功能框图,表示本发明的第一实施方式的结构。

图2是一个图,表示在本发明的第二实施方式中使用的代码分 配。    

图3是一个概念图,图中把汉语字符分配到本发明的实施方式 里的数据处理系统的第三区域中。

图4是ANK代码的例子。

图5是一个概念图,表示国际编码字符集的结构。

图6是形状不同的字符的例子。

各图中所使用的数字表示:

1…处理装置

2…显示装置

3…字形存储器

4…识别装置

参见附图,附图中表示了本发明的各种最佳实施方式。 (1)第一实施方式的结构

第一实施方式对应于权利要求1至4、6、8、10、至13、15、 和17。本发明的一个目的是提供一种处理多种语言的结构简单的 数据处理系统。本发明的另一个目的是提供一种处理多种语言的并 且区分形状不同的字符的数据处理系统。本发明的再一个目的是提 供一种处理多种语言并同时利用现有资源的数据处理系统。

图1是一个功能性框图,表示本实施方式中所采用的数据处理 系统(下称本系统)的结构。如该图所示。本系统是一个包括处理 装置1和显示装置2的数据处理系统,处理装置1用于处理由单字 节或双字节字符代码数据构成的数据,显示装置2用于显示用字符 代码表示的字符。处理装置1包括存储设备,处理程序和输入设 备。

此外,本系统具有一组字形存储器(3),以把各个字符代码的 字体存储起来,根据一个字符代码的前二位的组合,该字形存储器 被划分为四个区域,从1到4。区域1含有作为第一种语言的第一 字符集的日语字符,而区域4含有作为第二种语言的第二字符集的 朝鲜语字符。保存着多个可同时在显示装置2上显示的字符的字形 存储器3包含着作为日语字符的JIS C 6226。本系统还具有识 别装置4,用于根据一个字符代码的该前二位识别各字符代码对应 的区域。 (2)第一实施方式的操作和效果

具有上述构造的第一实施方式按如下执行操作。当在本系统里 显示一个字符时,识别装置4检验字符代码的前二位以便识别该字 符代码对应的区域,并且基于其结果显示包括在显示装置2上的对 应区域里的字形。

本实施方式把第一字符集分配给第一区域并把第二字符集分配 给第二区域,从而产生一种仅利用双字节字符代码来表示和处理多 种语言字符类型的简单结构。此外,对第一和第二字符集的每一个 都使用统一的代码的本实施方式允许把不同的字符代码分配给形状 不同的字符,并因此而防止了把形状不同的字符处理成相同的字符 代码。

本实施方式还允许通过检验字符代码的前二位,识别和处理字 符类型。并且,本实施方式把第一和第二字符集分配到各字形区域 里从而可同时显示来自第一集和那些来自第二集的字符,因此使得 用户能同时观察来自两个集的字符。

此外,因为在本实施方式里第一字符集是日语以及第二字符集 是朝鲜语,并且因为这两种字符集需要等级相同的分辨率的字形, 从而存储器区域得到更好的使用。

本实施方式在第一字符集里采用JIS标准字形,可允许本系统 能和现有的与JIS兼容的硬件和软件一起很好地工作,因此利用了 现有资源。 (3)第二实施方式

可以把移位JIS标准(X 0208-1990、等等)代码用作为第一 字符集(权利要求7和16)。图2表示在第二实施方式中使用的字 符代码分配。如图2中所示,单字节的片假名字符(十六进制数 80h至DFh)被去掉,并且在所产生的空出区域里分配所需的语言 (本例中为朝鲜语)代码,按相同的方式,如同JIS代码改变成移 位JIS代码。(在本图中,所分配的朝鲜语代码被简写为原始KS 代码)。这里,移位JIS代码用于JIS代码的对应部分,而KS代码 的对应部分移至其第一字节范围为从AOh至CFh的区域里。请注 意,纵然不存在单字节片假名字符,采用了双字节片假名字符来显 示片假名字符。还请注意,在空出的区域中其第一字节为DDh、 DEh、和DFh的区域是不用于外国语言的代码的,以使得在尺寸 上外国语言区域和移位JIS标准代码区域相等。

如上面所述,不和JIS代码重复的朝鲜语KS代码或者汉语 GB代码能够应用在本发明的一种实施方式里。因此,本发明特别 适用于同时显示日语和朝鲜语两种字符的卡拉OK系统。即使单字 节字符和双字节字符相混,本发明仍除去了对控制代码(例如、输 入/输出代码)的需要。另外,因为本系统和现有的与JIS兼容的 硬件和软件能很好地一起工作并且保持着它们的向上兼容性,现有 的资源得到利用。具有上面所描述特征的第二实施方式可应用于, 例如,采用移位JIS通信协议的通信卡拉OK机。 (4)其它的实施方式

本发明不受限于上述的最佳实施方式中,在不违背其精神和基 本特性的前提下本发明可以体现在如下面所描述的具体形式中。

例如,尽管可以通过专门的输入程序读入字符代码,它们可以 从其它的字符代码转换得到;该方法可省掉输入步骤(权利要求9 和18)。更具体地,通过一个转换器程序可以把按JIS标准C 6226-1978字符代码输入的日语字符转换成移位JIS标准字符代 码,或者可以把按朝鲜语KS-C 5601标准字符代码输入的字符 分配到上述实施方式中规定的区域。逆转换也是可能的。这使得现 有资源包括数据能得到更好的使用。

分配到各个区域里的字符集是不限于日语、汉语或朝鲜语字符 集的,而是可以分配给任何其它语言的字符集的。当从日语、汉语 和朝鲜语中选择第一字符集和第二字符集时,任何组合(日语字符 和汉语字符、汉语字符和朝鲜语字符、等等)是可能的(权利要求 6和15)。

在中国,GB 2312-80(GO)是目前唯一可用的标准。图3 表示把汉语GB 2312标准代码分配到上述第一实施方式中的第三 区域(第三块)中的一个例子。还存在着G1、G3、G5、G7及G8 标准草案;当将来使用标准G1至G8时,可以把允许进行层间切 换的一个多层语言平面应用于那些标准。

根据本发明可以构造这样的系统,使得只要需要,可以显示或 者来自第一字符等的第一字符串数据的或者来自第二字符集的对应 第二字符串数据的任何一种字符串(权利要求5和14)。该方法给 予用户多种显示选择,确保了高级的显示可操作性;例如,能够选 择性地显示日语字符和朝鲜语字符中的一个字符,或者同时显示它 们的各一个字符。

如上面所述,本发明提供了一种构造简单的处理多种语言的数 据处理系统。

尽管说明了最佳实施方式,在由下述权利要求书所叙述的本发 明的原理的范围之内熟练的技术人员可对其作出各种改变。

高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用