组合式拼音类主副码汉字、词语编码输入法及其键盘转让专利

申请号 : CN201410288523.0

文献号 : CN105204657B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 黄振荣

申请人 : 黄振荣

摘要 :

组合式拼音类主副码汉字、词语编码输入方法,根据GF3001规范规定选取687个编码部件,归并成409个编码部件组,确定了31个高频编码部件,主要根据主形编码部件的读音或叫法名称的拼音字母确定其字母型主码,副码1、再依据其第1、2个笔画名称的拼音首字母相应作为其字母型副码2、3,形成字母型编码资源,再根据国家规范转换成相应的数字型编码资源,再运用这些编码资源形成了字母型,数字型,拼音首字母、非拼音首字母的汉字、词语的编码输入法,组合应用,既能输入读得出音的字,又能输入读不出音的字,在对GB18030字库与三级词语库的编码输入时,其重码数大多不超过10个,应用效果良好。

权利要求 :

1.组合式拼音类主副码汉字、词语编码输入法,利用计算机通用软、硬字母键盘或者手机、计算机的软、硬数字键盘,输入汉字、词语,其特征在于一、选定编码部件

拆分汉字,确定参与编码的编码部件;

选用GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的560个基础部件,选用GB0011——2009《汉字部首表》的201个主部首和100个附形部首,再选用含有560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、段、发、贯、亀、龜、庚、亥、壺、華、亦、 与、 堇、兼、可、婁、免、卯、南、囊、农、 棄、牽、其、妻、前、乌、烏、勿、网、行、叚、羲、 以、制,共计44个,为了便于记忆使常用的数字类汉字与字符都定为编码部件又选用了:一、百、六、○,扣除重复计算数,总计选用了687个部件作为本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件的构字理据相同、或写法稍异、或有所省减、或置向不同的变体、或互为繁、简字的关联性,归并成409个编码部件组,组内的第一个编码部件称为主形编码部件,在这687个编码部件基础上允许增加或者减少不超出百分之二十的编码部件选用量,只对重码率略有影响,但不改变该编码输入法的实质;

二、确定高频编码部件及其主部位位置以及高频编码部件的字母型主码确定了31个构字能力特别强的部首为高频编码部件,在本发明确定的687个编码部件中除去31个高频编码部件其余的编码部件称之为普通编码部件;

在同一字母键位上只设置一个或一组互为繁、简字体的高频编码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通常所处的位置,其中高频编码部件:山、扌、 纟、糹、月、 亻、木、艹、訁、讠的9个编码部件组的12个高频编码部件不是以它们的读音或部首名称的汉语拼音的首字母作为它们的主码,而是人为指定;确定的31个高频编码部件的形状、字母型主码、主部位位置如表一所示:表一:上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设定可以在31个高频编码部件的基础上在增加或减少不超出百分之二十的范围内变动,只对重码率有影响,但不改变编码方法的实质;

三、确定每个编码部件的拼音类主码、副码1、副码2、副码3,形成汉字编码方法的拼音类编码资源

选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部件称之为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码一样;主形编码部件都有一定的读音或叫法,除高频编码部件的主码已确定了以外,其他主形编码部件的主码一般都取其读音或叫法的拼音首个字母作为拼音类的字母型主码;采用点折I法,对于主形编码部件的读音的拼音首个字母为Y的,而且主形编码部件的首笔是点(丶)、折(乛)的取I作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取Y作为其字母型主码;除此之外其他的普通编码部件的主形编码部件的主码仍取其读音或叫法的拼音首个字母作为音笔类的字母型主码;

普通编码部件与高频编码部件拼音类字母型副码1的确定:采用优选法:主形编码部件读音或名称的汉语拼音,其声母为j、q、x,而韵母是首字母为i的复合音韵母,或者其声母为zh、ch、sh等双字母声母,或者其汉语拼音第1字母为y,而第2字母为i,而韵母为鼻韵母的,则均取其汉语拼音的第3字母作其字母型副码1,除此以外,其余的都取其汉语拼音的第2字母作其字母型副码1;同一编码部件组的各编码部件字母型副码与该组的主形编码部件的字母型副码1相同;

普通编码部件与高频编码部件的拼音类字母型副码2、副码3的确定:根据国家规范,汉字由横(一)、竖(丨)、撇(丿)、点(丶)折(乛)五种笔画组成,本发明依次用这五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表示笔画的字母型码,每个编码部件依次取首笔画、第2笔画的笔画的字母型码作为编码部件的字母型副码2、字母型副码3;对于不足2个笔画构成的编码部件,缺失的第2个笔画的,本发明确定都取字母V;

根据上述方法确定409个编码部件组的687个编码部件的字母型主码、副码1、副码2、副码3,依次排列,副码1采用优先法确定,对于不足2个笔画构成的编码部件,确定都采用字母V补足的方案;主形编码部件的读音的拼音首个字母为Y的,采用点折I法;上述方法确定409个编码部件组的687个编码部件的字母型主码、副码1、副码2、副码3,依次排列如下面所示:四、转换取得各编码部件拼音类数字型主码、副码1、副码2、副码3码,形成拼音类数字型编码资源

对编码部件拼音类字母型的副码2、副码3涉及到五类笔画的,都以国家标准GB/

T18031—2000《信息技术数字键盘汉字输入通用要求》的“汉字笔画的键位设定”的规定转换成数字码,而不是以笔画名称的汉语拼音首字母转换成相应的数字码,除上述情况以外,编码部件的各类字母型主码、副码1以及拼音首字母的其他字母,以该标准的“10键位汉语拼音字母键位设定”和“8键位汉语拼音字母键位设定”的规定的字母与数字的对应关系,分别依次转换成10键位法拼音类数字型主码、副码1、副码2、副码3与8键位拼音类数字型主码、副码1、副码2、副码3以及拼音首字母的数字码;对于高频编码部件,在上述转换所得的各类数字型主、副代码的基础上,略作调整使各高频编码部件的各类数字型主码、副码1的数字组合,在同一类型中相互间都不相同,具体方案 如表六所示;上述转换方案称之为字母笔画不同式转换方案;“汉字笔画的键位设定”如下面所示:“10键位汉语拼音字母键位设定”如下面所示:

“8键位汉语拼音字母键位设定”如下面所示:

“字母笔画不同式转换方案”的高频编码部件的拼音类数字型主码、副码1、副码2、副码

3,用数字键盘的相应的数字键依次表达,31个高频编码部件方案的高频编码部件拼音类数字型主副码,具体方案如下面所示:五、组合式拼音类主副码汉字、词语编码输入法

在汉字拆分时,除拼音类部首主副码字母型汉字编码方法采用字典、词典用部首汉字拆分法外,其他各种汉字、词语编码方法都采用通用拆分法,取拆分编码部件笔画多的在先的那一种;字母型转换成数字型采用字母笔画不同式转换方案;采用“8键位汉语拼音字母键位设定”规定的字母与数字的对应关系,由字母型码转换成数字型码;

组合式拼音类主副码汉字、词语编码输入法由组合式拼音类主副码字母型汉字、词语编码输入法和组合式拼音类主副码数字型汉字、词语编码输入法两部分组成,把两部分编码设置在不同码表上切换调用;

第一部分:组合式拼音类主副码字母型汉字、词语编码输入法

利用拼音类字母型编码资源,形成组合式拼音类主副码字母型汉字、词语编码输入法包含有:①拼音类拼音首字母主副码字母型汉字编码方法;②拼音类拼音首字母主副码字母型词语编码方法;③拼音类非拼音首字母主副码字母型汉字编码方法;④拼音类非拼音首字母主副码词语编码方法;⑤拼音类主副码字母型部首汉字编码方法;⑥拼音类主副码字母型声系汉字编码方法;针对常用汉字、常用词语和GB18030的27000多汉字字符集的大字符集的汉字的编码输入,进行组合编码输入操作:对常用汉字、词语采用拼音首字母字母型汉字、词语编码输入法,对于GB18030的27000多汉字采用非拼音首字母主副码字母型汉字编码方法,取得编码;拼音类拼音首字母字母型汉字、词语编码与拼音类非拼音首字母字母型汉字编码,组合在同一张码表;

拼音类字母型汉字、词语的编码方法如下:

在以下的叙述中,规定:对一个编码部件取1码,即取其字母型主码,取2码,即依次取其字母型主码、副码1,取3码,即依次取其字母型主码、副码1、副码2;取4码,即依次取其字母型主码、副码1、副码2、副码3;

(一)拼音类拼音首字母主副码字母型汉字编码方法

A、码长不定,确定采用拼音类字母型编码资源;

B、单个编码部件的汉字的编码:如果该汉字的拼音首字母与该编码部件的字母型主码相同:对于是高频编码部件的,则依次取该编码部件的字母型主码、副码1;对于是普通编码部件的,采用四码法,依次取该编码部件的字母型主码、副码1、副码2、副码3;如果该汉字的拼音首字母与该编码部件的字母型主码不相同的,又是高频编码部件的,采用替代三码法,则依次取该汉字的拼音首 字母、该高频编码部件的副码1、副码2;如果该汉字的拼音首字母与该编码部件的字母型主码不相同的,又是普通编码部件的,而且字母型主码不是i的,采用取代四码法,依次取该汉字的拼音首字母、该编码部件的字母型副码1、副码2、副码3;

如果该汉字的拼音首字母为y而编码部件的字母型主码为i的,采用替代四码法,则依次取该汉字的拼音首字母、该编码部件的字母型副码1、副码2、副码3;

C、2个或2个以上编码部件组成的汉字,汉字可以分成首部与余部两部分;

D、对于由2个或2个以上的编码部件组成的汉字,分如下二个部分依次确定其字母型编码:

第1部分,取根据汉字的汉语拼音的首字母作为第1部分的字母型编码;

第2部分,以下述方法取汉字的首部和余部的编码:

对于由2个的编码部件组成的汉字字母型编码方法:如果首部是一个处于主部位的高频编码部件的,采用三码法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码;如果首部件编码部件是普通编码部件的,采用一二法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码;

对于由3个或3个以上的编码部件组成的汉字:如果是单首部汉字,又如果首部是一个处于主部位的高频编码部件的,则依次取第1、第2、第末个编码部件各1码;如果是单首部汉字,又如果首部是一个普通编码部件,采用首一法,则依次取第1、第2、第末个编码部件各1码,如果其首部为组合首部的汉字,则该组合首部取2码,采用首末法,依次对组合首部的第

1、第末个编码部件各取1码,其余部为单个编码部件,取1码;

把上述第1、第2两部分取的字母型编码,依次组合成整个汉字的编码;

E、编码时,采用英文小写字母;

(二)拼音类非拼音首字母主副码字母型汉字编码方法

A、码长不定,采用拼音类字母型编码资源;

B、单个编码部件的汉字:如果该编码部件是高频编码部件的,则依次取其字母型主码、字母型副码1;如果是普通编码部件的:采用四码法,则依次取其字母型主码、副码1、副码2、副码3;

C、由2个或2个以上编码部件组成的汉字:可以分成首部与余部两部分;

D、对于由2个的编码部件组成的汉字字母型编码方法:如果首部是一个处于主部位的高频编码部件的,采用三码法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码;如果首部件编码部件是普通编码部件的,采用二二法,则依次对首部那个编码部件取2码,对余部那个编码部件取2码;

E、对于由3个编码部件组成的汉字:如果首部是一个单首部,又是一个处于主部位的高频编码部件的,采用末二法,则依次对首部的那个高频编码部件取1码、余码的第1编码部件取1码、余部的第2编码部件取2码;如果首部是一个单首部,又是一个普通编码部件的,采用首二法,则依次对首部的那个编码部件取2码,余部的第1、第2编码部件各取1码;如果首部是组合首部,则依次对组合首部的第1、第2个编码部件各取1码,余部的那个编码部件取2码;

F、对于由4个或4个以上的编码部件组成的汉字:如果首部是个单首部的,又 是处于主部位的高频编码部件的,则依次取首部的那个编码部件1码、余部的第1、第2、第末个编码部件各1码;如果首部是一个单首部,又是一个普通编码部件的,采用首二法,则依次对汉字的首部那个编码部件取2码、余部的第1、第末个编码部件各取1码;如果首部是组合首部,对于组合首部取码方案,采用组合首部首、次、末取码法,即依次对组合首部的第1、第2、第末个编码部件各取1码,汉字的余部那个部件取1码;

把上述汉字各编码部件取的编码,以编码部件在汉字组成中的先后为序,依次组成整个汉字的编码;

G、编码时,采用英文小写字母;

(三)拼音类拼音首字母主副码字母型汉语词语编码方法

A、采用拼音类字母型编码资源,依据拼音类拼音首字母汉字编码方法取得的汉字编码,取词语的编码;词语编码的最长码长设定为6;

B、对于由2个汉字组成的词语,采用二二法,依次对第1个汉字、第2个汉字各取2码;

C、对于由3个汉字组成的词语,采用一一二法,则依次取第1个汉字1码、第2个汉字1码、第3个汉字2码;

D、对于由4个汉字组成的词语,采用四码法,则依次取第1、第2、第3、第4个汉字的各取1码;

E、对于由5个汉字组成的词语,采用五码法,则依次取第1、第2、第3、第4、第5个汉字各1码;

F、对于由6个或6个以上汉字组成的词语,顺六法,依次取词语的第1、第2、第3、第4、第

5、第6个汉字各1码;

G、编码时,采用英文小写字母;、

(四)拼音类非拼音首字母主副码字母型汉语词语编码方法

利用确定的拼音类非拼音首字母主副码字母型汉字编码输入法对每个汉字的编码,实施对汉语词语的非拼音首字母编码;词语编码的最长码长设定为6;对一个汉字取2码:如果是由二个或二个以上编码部件组成的汉字,采用首次法,即依次取该汉字的第1、第2个编码部件的字母型主码;

A、对于由2个汉字组成的词语编码,采用二三法,即依次取该词语的第1个汉字2码、第2个汉字3码;

B、对于由3个汉字组成的词语编码:采用末二法,即依次取该词语的第1、第2个汉字各1码、第3个汉字2码;

C、对于由4个汉字组成的词语编码,采用四码法,即依次取该词语的第1、第2、第3、第4个汉字各1码;

D、对于由5个汉字组成的词语编码,依次取该词语的第1、第2、第3、第4、第5个汉字各1码;

E、对于由6个或6个以上汉字组成的词语编码,采用顺六法,依次取该词语的第1、第2、第3、第4、第5、第6个汉字各取1码;

G、编码时,采用英文小写字母;

第二部分:组合式拼音类主副码数字型汉字、词语编码输入法

利用拼音类数字型编码资源实施组合式拼音类主副码数字型汉字、词语编码输入;码长不定,最大码长设定为6;

采用拼音类数字型编码资源的组合式拼音类主副码数字型汉字、词语编码输入法包含有:①基于拼音首字母主副码数字型汉字编码方法;②基于拼音首字母主副码数字型词语编码方法;③基于非拼音首字母主副码数字型汉字编码方法;④基于非拼音首字母主副码数字型词语编码方法,针对GB2312的6763个常用汉字、常用词语和GB18030的27000多个汉字字符集的大字符集的汉字的编码输入,采用如下组合编码输入操作:对常用汉字与常用词语库采用基于拼音首字母数字型汉字、词语编码输入法,对于GB2312的全部汉字乃至GB18030‐2000的汉字集采用基于非拼音首字母主副码数字型汉字编码方法取得的编码,组织在同一张码表;

各种数字型汉字、词语的编码方法如下:

(五)拼音类基于拼音首字母主副码数字型汉字编码方法

A、确定采用拼音类数字型编码资源;在取码中,分成两个部分取编码的,则把第1部分与第2部分取的编码,依次组合成整个汉字的编码;

B、单个编码部件的汉字的编码:对于编码部件是高频编码部件的汉字:如果其拼音首字母数字型码与该高频编码部件的数字型主码相同的,则对该高频编码部件取2码,就是该汉字的编码部件的数字型主码、副码1;如果不同的,采用拼首法,则依次取拼音首字母转化成的1个数字码、该高频编码部件的2码;对于普通编码部件的汉字:如果其拼音首字母的数字型码与该编码部件的数字型主码相同的,采用四码法,则依次取该编码部件4码,作为该汉字的编码;如果不相同的,采用替代法,则依次取该字的拼音首字母转换成的一个数字码、该编码部件的数字型副码1、副码2、副码3;

C、对于由2个编码部件组成的汉字,分如下二个部分依次确定其数字型编码:第1部分,取该汉字汉语拼音首字母转换成的一个数字码作为第1部分的编码;第2部分,以下述方法取编码:如果第1个编码部件为处于主部位的高频编码部件,采用首二末三法,则依次取第1个编码部件2码、第3个编码部件3码;如果第1个编码部件是普通编码部件,采用首三末二法,则依次取第1个编码部件3码、第2个编码部件2码;

D、对于由3个编码部件组成的汉字,分如下二个部分依次确定其数字型编码:第1部分,取该汉字汉语拼音首字母转换成的一个数字码作为第1部分的编码;第2部分,以下述方法取编码:如果首部是单首部,又如果第1个编码部件为处于主部位的高频编码部件,采用首二末二法,则依次取第1个编码部件2码、第2编码部件1码、第3个编码部件取2码;如果首部是单首部,又如果第1编码部件是普通编码部件的,采用首三法,则依次取第1个编码部件取

3码,第2、第3个编码部件各取1码;如果首部是组合首部的汉字,采用余二法,则依次取组合首部的第1、第2编码部件各1码、余部那个编码部件2码;

E、对于由四个编码部件组成的汉字,分如下二个部分依次确定其数字型编码:

第1部分,取该汉字汉语拼音首字母转换成的一个数字码作为第1部分的编码;

第2部分,以下述方法取编码:如果首部是单首部,又如果第1个编码部件为 处于主部位的高频编码部件,采用首二法,则依次取第1个编码部件2码、第2、第3、第4个编码部件各1码;如果首部是单首部,又如果第1编码部件是普通编码部件的,采用首三法,则依次取第1编码部件3码、第2、第末个编码部件各1码;如果首部是组合首部的汉字,采用余二法,则依次取组合首部的第1、第2、第3编码部件各1码、余部那个编码部件2码;

F、对于由五个或五个以上编码部件组成的汉字分如下二个部分依次确定其数字型编码:

第1部分,取该汉字汉语拼音首字母转换成的一个数字码作为第1部分的编码;

第2部分,以下述方法取编码:如果首部是单首部,第1个编码部件为处于主部位的高频编码部件,采用首二法,则依次取第1编码部件2码、第2、第3、第末个编码部件各1码;如果首部为单首部,又是普通编码部件,采用首三法,则依次取第1编码部件3码、第2、第末个编码部件各1码;如果首部是组合首部的汉字,采用前四法,则依次对组合首部的第1、第2、第3、第4编码部件各取1码、余部那个编码部件取1码;

(六)拼音类基于非拼音首字母主副码数字型汉字编码方法

A、确定采用拼音类数字型编码资源;

B、对于由单个编码部件组成的汉字:如果该编码部件是高频编码部件,则依次取编码部件2码;如果该编码部件是普通编码部件,采用四码法,则依次取该编码部件4码;

C、2或2个以上编码部件组成的汉字:可以分成首部与余部两部分;

D、对于由2个编码部件组成的汉字,如果第1编码部件是处于主部位的高频编码部件的,采用首二末四法,则依次对第1个编码部件取2码、第2个编码部件取4码;如果第1编码部件是普通编码部件的,采用首三末三法,则依次对第1编码部件取3码、第2编码部件取3码;

E、对于由3个编码部件组成的汉字:如果第1编码部件是处于主部位的高频编码部件的单首部的,采用首二末三法,则依次对第1个编码部件取2码、第2个编码部件取1码、第3个编码部件取3码;如果第1编码部件是普通编码部件的单首部字,采用首三末二法,则依次对第

1个编码部件取3码、第2个编码部件取1码、第3个编码部件取2码;对于首部是组合首部的汉字,采用余部四码法,则依次对组合首部的第1、第2编码部件各取1码、对余部的那个编码部件取4码;

F、对于由四个编码部件组成的汉字:如果第1编码部件是处于主部位的高频编码部件的单首部的汉字,采用首二末二法,则依次对汉字的第1编码部件取2码、第2、第3个编码部件各取1码、第4个编码部件取2码;如果第1个编码部件是普通编码部件的单首部的汉字,采用首三法,则依次对第1个编码部件取3码、第2、第3、第4个编码部件各取1码;对于组合首部的汉字,采用余三法,则依次对组合首部的第1、第2、第3个编码部件各取1码,余部的那个编码部件取3码;

G、对于由五个编码码部件组成的汉字:如果第1编码部件是处于主部位的高频编码部件的单首部汉字,采用首二法,则依次对汉字的第1编码部件取2码、 第2、第3、第4、第5编码部件各取1码;如果第1个编码部件是普通编码部件的单首部的汉字,采用首三法,则依次对第1个编码部件取3码、第2、第3、第末个编码部件各取1码;对于组合首部的汉字,采用余二法,则依次对组合首部的第1、第2、第3、第4个编码部件各取1码、余部那个编码部件取2码;

H、对于由六个或六个以上编码码部件组成的汉字:如果第1编码部件是处于主部位的高频编码部件的单首部汉字,采用首二法,则依次对汉字的第1编码部件取2码、第2、第3、第4、第末个编码部件各取1码;如果第1个编码部件是普通编码部件的单首部的汉字,采用首三法,则依次对第1个编码部件取3码、第2、第3、第末个编码部件各取1码;对于组合首部的汉字,采用顺式余二法,则依次对组合首部的第1、第2、第3、第4个编码部件各取1码,余部的那个编码部件取2码;

(七)拼音类基于拼音首字母主副码数字型汉语词语编码方法

利用拼音类主副码数字型编码资源,实施对汉语词语编码输入:

设定:对一个汉字取1码,即取汉字的基于拼音首字母的主副码数字型汉字编码的第1个数字码,也就是取该汉字的拼音首字母;对一个汉字取2码,即依次取汉字的基于拼音首字母的主副码数字型汉字编码的第1、第2个数字码;对一个汉字取3码,分三种情况取编码:如果是单个编码部件的汉字,采用编码法,依据编码方案该汉字只取2码的仍然取2码,也视为取3码;其他则依次取这个汉字的第1、第2、第3个数字型编码;如果是单首部的汉字,则依次取该汉字的第1、第2个数字型编码、汉字的第2编码部件的数字型主码;如果是组合首部的汉字,采用顺序法,依次取组合首部汉字的第1、第2、第3个音笔类基于拼音首字母主副码数字型汉字编码的数字型编码;对一个汉字取4码:如果是单个编码部件的汉字,采用编码法,即采用的汉字的编码方案,取几码是几码,不再增加;如果是两个编码部件的汉字,采用编码法,依次取其拼音首字母的数字码、第1、第2个编码部件的数字型主码;如果是三个或三个以上编码部件的汉字,则取拼音首字母的数字型码、第1、第2、第3个编码部件的数字型主码;具体的编码方法如下:A、对于两个汉字组成的词语:采用首二末四法,则依次对第1个汉字取2码、第2个汉字取4码;

B、对于由三个汉字组成的词语:采用二一三法,则依次取词语的第1个汉字2码、第2个汉字1码、第3个汉字3码;

C、对于由四个汉字组成的词语:采用首二末二法,则依次取第1个汉字2码、第2、第3个汉字各1码、第4个汉字2码;

D、对于由五个汉字组成的词语:采用首二法,则依次取第1个汉字2码、第2、第3、第4、第

5个汉字各1码;

E、对于由六个或六个以上汉字组成的词语:采用首二法,则依次取词语的第1汉字2码、第2、第3、第4、第5个汉字各1码;

(八)拼音类非基于拼音首字母主副码数字型汉语词语编码方法

利用拼音类主副码数字型编码资源,实施对汉语词语编码输入:

拼音类非基于拼音首字母主副码数字型汉语词语编码方法:设定:对一个汉 字取1码:

即取该汉字的第1个编码部件拼音类数字型主码;对一个汉字取2码:如果是单个编码部件的汉字,则依次取该编码部件的数字型主码、副码1;如果是单首部汉字,则即依次取该汉字的第1、第2个编码部件各1码;如果是组合首部的汉字,采用首余法,则依次取组合首部的第

1编码部件的数字型主码、余部那个编码部件的数字型主码;对一个汉字取3码:如果是单个编码部件的汉字,则依次取该编码部件的数字型主、副码1、副码2;如果是由两个编码部件组成的单首部的汉字,则依次取第1编码部件数字型主码、第2编码部件数字型主码、副码1;

如果是由三个或三个以上编码部件组成的单首部的汉字,则依次取汉字的第1、第2、第3个编码部件各1码;如果是组合首部的汉字,采用首余法,则依次取汉字组合首部的第1、第2个编码部件、余部的那个编码部件各1码;对一个汉字取4码:对于单个编码部件的汉字,则取该编码部件的数字型主码、副码1、副码2、副码3;对于两个编码部件的汉字,采用一三法,则依次取第1个编码部件1码、第2个编码部件3码;对于三个编码部件的汉字,首部是单首部的汉字,则依次取第1、第2个编码部件各1码、第3个编码部件2码;对于四个或四个以上的编码部件的汉字,采用顺末法,则依次取第1、第2、第3、第末个编码部件各1码;对于三编码部件的组合首部的汉字,则依次取组合首部的第1、第2个编码部件各1码、余部那个编码部件2码;对于由四个或四个以上编码部件的组合首部的汉字,采用顺末法,则依次取第1、第2、第

3、第末个编码部件各1码;具体编码方法如下:

A、对于两个汉字组成的词语:采用首二末四法,则依次取第1个汉字2码、第2个汉字取4码;

B、对于由三个汉字组成的词语:采用二一三法,则依次取词语的第1个汉字2码、第2个汉字1码、第3个汉字3码;

C、对于由四个汉字组成的词语:采用首二末二法,则依次取第1个汉字2码、第2、第3个汉字各1码、第4个汉字2码;

D、对于由五个汉字组成的词语,采用首二法,则依次取第1个汉字2码、第2、第3、第4、第

5个汉字各1码;

E、对于由六个或六个以上汉字组成的词语:采用首二法,则依次取第1个汉字2码、第2、第3、第4、第5个汉字各1码。

2.根据权利要求1所述的组合式拼音类主副码汉字、词语编码输入法,其特征在于,在汉字拆分时;取拆分编码部件笔画少的在先的那一种。

3.根据权利要求1所述的组合式拼音类主副码汉字、词语编码输入法,其特征在于,字母型转换成数字型,采用“全字母式转换方案”,在于涉及到“8键位汉语拼音字母键位设定”的字母型码转换数字型码,对于笔画的转换,把笔画撇“丿”的拼音首字母转换定为数字1,其他不变,仍然以笔画名称的汉语拼音首字母的字母形式,依据标准的规定转换成数字码,也就是说,只依据GB/T18031标准的“10键位汉语拼音字母键位设定”和“8键位汉语拼音字母键位设定”的字母与数字的对应关系,把前面设定的各编码部件各类字母型主码、副码1、副码2、副码3一一对应地分别转换成10键位法与8键位法音笔类数字型主码、副码1、副码2、副码3,对于高频编码部件在上述转换所得的数字 型代码的基础上,略作调整使各高频编码部件的各类数字型主码、副码1的数字组合,在同一类型中相互间都不相同,“全字母式转换方案”的高频编码部件的拼音类数字型主码、副码1、副码2、副码3,用数字键盘的相应的数字键依次表达,31个高频编码部件方案的高频编码部件音笔类数字型主副码,具体方案如下面所示:

4.根据权利要求1所述的组合式拼音类主副码汉字、词语编码输入法,其特征在于,字母型转换成数字型采用,字母笔画不同式转换方案;采用“10键位汉语拼音字母键位设定”规定的字母与数字的对应关系,由字母型码转换成数字型码。

5.根据权利要求2所述的组合式拼音类主副码汉字、词语编码输入法,其特征在于,字母型转换成数字型,采用“全字母式转换方案”,采用“8键位汉语拼音字母键位设定”规定的字母与数字的对应关系,由字母型码转换成数 字型码。

6.根据权利要求2所述的组合式拼音类主副码汉字、词语编码输入法,其特征在于,字母型转换成数字型,采用“全字母式转换方案”,采用“10键位汉语拼音字母键位设定”规定的字母与数字的对应关系,由字母型码转换成数字型码。

7.根据权利要求1或2或3或4或5或6其中之一所述的组合式拼音类主副码汉字、词语编码输入法,其特征在于,对于主形编码部件的读音的拼音首个字母为Y的,采用点折Y法,主形编码部件的读音的拼音首个字母为Y的而主形编码部件的首笔是点(丶)、折(乛)的仍取Y作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取I作为其字母型主码。

8.根据权利要求1或2或3或4或5或6其中之一所述的组合式拼音类主副码汉字、词语编码输入法,其特征在于,拼音类拼音首字母主副码字母型汉字编码方法中,由2个或2个以上编码部件组成的汉字:可以分成首部与余部两部分;对于由2个的编码部件组成的汉字字母型编码方法:如果首部件编码部件是普通编码部件的,采用一三法,则依次对首部那个编码部件取1码、对余部的那个编码部件取3码;对于由3个编码部件组成的汉字:如果首部是一个单首部,又是一个普通编码部件的,采用末二法,则依次对首部的那个编码部件取1码、余部的第1个编码部件取1码、余部的第2个编码部件取2码;对于由4个或4个以上的编码部件组成的汉字:如果首部是一个单首部,又是一个普通编码部件的,采用一码法,则依次对汉字的首部的那个编码部件取1码、余部的第1、第2、第末个编码部件各取1码。

9.根据权利要求1或2或3或4或5或6其中之一所述的组合式拼音类主副码汉字、词语编码输入法,其特征在于,拼音类非拼音首字母主副码字母型汉字编码方法由拼音类主副码字母型部首汉字编码方法替代,拼音类主副码字母型部首汉字编码方法具体如下:A、采用拼音类主副码字母型编码资源,汉字拆分采用部首拆分法;码长不定;

B、作为汉字的首部的部首的编码部件,采用三码法作,部首的编码部件都取3码,即取该部首的编码部件的字母型主码、副码1、副码2;

C、作为汉字的余部的编码部件,采用三码法,如果是单个编码部件的余编码,则依次对该编码部件取3码,如果是二个编码部件的余部,则依次对第1个编码部件取1码、对第2个编码部件取2码,如果是由三个或三个以上的编码部件组成的余部,则依次取其第1、第2、第末个编码部件各取1码;

D、对于没有余部的首部的部首的编码部件,采用三码法,取该编码部件3码,即取该字编码部件的字母型主码、副码1、副码2;

E、把汉字的首部与余部的编码依次组合在一起,成为整个汉字的编码。

10.根据权利要求1或2或3或4或5或6其中之一所述的组合式拼音类主副码汉字、词语编码输入法,其特征在于,拼音类非拼音首字母主副码字母型汉字编码方法由拼音类主副码字母型声系汉字编码方法替代,拼音类主副码字母型声系汉字编码方法具体如下:A、采用拼音类主副码字母型编码资源,汉字拆分采用声符拆分法;码长不定;

B、对声符取编码,采用四码法,对于单个编码部件的声符,则取该编码部件4码,对于由二个编码部件组成的声符,采用首二法,则依次取其第1、第2个编码部件各2码,对于三个编码部件组成的声符,采用首一法,则依次取第1、第2个编码部件各1码、第3个编码部件2码,对于由四个或四个以上编码部件组成的声符,则依次取其第1、第2、第3、第末个编码部件各

1码;

C、对形符取编码,采用二码法,如果形符是单个编码部件的,则取其2码,如果形符是二个或二个以上编码部件组成的,则依次取其第1、第末个编码部件各1码;

D、对于没有形符的声符取编码,采用四码法,对于单个编码部件的声符,则取该编码部件4码,对于由二个编码部件组成的声符,采用首二法,则依次取其第1、第2个编码部件各2码,对于三个编码部件组成的声符,采用首一法,则依次取第1、第2个编码部件各1码、第3个编码部件2码,对于由四个或四个以上编码部件组成的声符,则依次取其第1、第2、第3、第末个编码部件各1码;

E、声符取的编码在前,形符取的编码在后,依次组成整个汉字的编码。

说明书 :

组合式拼音类主副码汉字、词语编码输入法及其键盘

技术领域

[0001] 本发明属于用于计算机或其他对汉字字符信息进行处理装置的汉字、词语编码输入的方法及键盘。

背景技术

[0002] 已公开的汉字编码输入方法,对于参与编码的部件,一般只赋于一个字母的音码或形码,本人发明的ZL03112606.5的一类音形义汉字编码输入法,引入了音、形码与义类码形成了重码率低见字就能输入的较好的计算机汉字输入方法,取得了良好的效果。但是要求使用者要对四百多个编码部件组的义类码要了解记住掌握,有一定的难度,需要一定的时间。
[0003] 发明目的
[0004] 本发明的目的是提出对ZL03112606.5一类音形义汉字编码输入法进行改进的拼音类汉字、词语编码输入法,使使用者对方法的掌握更容易,编码部件的安排也更合理,重码率也控制得较低,字、词的输入也流畅。

发明内容

[0005] 一个汉字有几种拆分方案,则依次优先满足(1)取拆分成编码部件最少的那一种;(2)取拆分编码部件笔画多的在先的那一种,或者采用另一种方案,取拆分编码部件笔画少的在先的那一种;(3)取编码部件起笔画的笔画排序在前的那一种,确定一种拆分方案;
[0006] 除满足上述拆分要求外,本发明有三种汉字拆分法,方案之一,称之为通用拆分法,两个以上编码部件构成的汉字,可以分成首部与余部两部分,规定,在上下结构或左右结构、包围类结构的汉字中,只要首个编码部件处于单独位置或者首个编码部件与末个编码部件都为单独的编码部件时,都确定首个编码部件作为汉字分成两个部分中的首部,汉字去掉该编码部件后剩余的编码部件就为余部,例如:“蒂”字“艹”为首部,“帝”为余部;“國”字“囗”为首部,“或”为余部;又规定,汉字的第1编码部件与一个或一个以上的编码部件处在一个层面,则末个编码部件为余部,汉字去掉余部的剩余的多个编码部件的组合,称作组合首部,例如:“愁”字,“秋”为组合首部;为了减少重码率,还可以把 定义为组合部件,在汉字拆分中视作一个组合首部,例如“赢”字, 为一个部分,视作组合首部,“贝”为另一部分,视为余部;向右上包围结构的字,例如以“辶”、“廴”为部首的汉字,其除去“辶”、“廴”以外的为一个部分,视为组合首部,“辶”、“廴”为另一部分,为单余部;方案之二,称之为部首拆分法:根据GF0011—2009《汉字部首表》规定以及在该规范以前的字典、词典规定的部首取汉字部首,采用GF0012—2009《GB13000.1字符集汉字部首归部规范》的汉字部首归部规则,①从汉字的左、上、外位置取部首,如果左和右、上和下、外和内都是部首,则只取左、上、外位置的部首;②如果汉字的左、上不是部首,右、下是部首。则取右、下位置的部首;半包围结构的字,如果外不是部首,内是部首,则取内;③如果汉字的左和右、上和下都不是部首,则按照先左后右、先上后下的顺序,从偏旁的位置取部首;④如果由上述位置取不到部首的左右结构、上下结构、包围结构的字或其他字,从起笔的位置取单笔部首;⑤如果在取部位置上少笔与多笔几个部首出现叠合时,则取多笔部首,不取少笔部首;
根据上述规则取的部首,在把汉字分成首部与余部两个部分中一律都作为首部,一般来说,汉字去掉首部剩余部分为余部,但是对于只能取单笔部首的单个编码部件的汉字,为了保持编码部件的完整性,该汉字的这个编码部件的整个编码部件作为该汉字的余部,例如,“重”字是单个编码部件的汉字,“重”的首部是“丿”,“重”的余部是“重”;对于单个编码部件的汉字本身是部首的不再拆分;此方案中的汉字余部,还是依据汉字去掉首部后的笔画顺序对各编码部件取码;方案之三,称之为声符拆分法,大部分汉字都是形声字,由声符与形符构成,声符也称为声旁,声符相同的汉字形成了字族,以字族汇集在一起形成的字典称为声系字典,形符也称为形旁,为此把汉字分成声符与形符两部分,以《广韵声系》为蓝本,以《广韵声系》确定的声符,作为汉字声符部分,汉字去掉声符部分剩余的部分就视为汉字的形符,如果《广韵声系》没有确定汉字声符的,而汉字能明确确定部首的,汉字去掉部首的剩余部分,就视为声符,这里的部首也就视为形符,汉字中有如下几个编码部件组合:
构成汉字族,为此也定义为声符,汉字去掉这些编
码部件组合的剩余部分就是形符,对于单个编码部件,不再拆分,整个编码部件视作声符,把汉字的声符作为拆分汉字的第一部分,汉字的形符作为拆分汉字的第二部分;
[0007] 本发明利用计算机的字母键盘、数字键盘或手机等其他对汉字字符信息进行处理装置的软、硬字母键盘、数字键盘,进行编码输入汉字、词语。具体的实现步骤如下:
[0008] 一、选定编码部件
[0009] 根据国家语委GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的要求,拆分汉字,确定参与编码的编码部件。
[0010] 选用GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的560个基础部件,选用GB0011——2009《汉字部首表》的201个主部首和100个附形部首,再选用含有560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、段、发、贯、亀、龜、庚、亥、壺、華、亦、 与、 堇、兼、可、婁、免、卯、南、囊、农、 棄、牽、其、妻、前、乌、烏、勿、网、行、叚、羲、 以、制,共计44个,为了便于记忆使常用的数字类汉字与字符都定为编码部件又选用了:一、百、六、○,扣除重复计算数,总计选用了687个部件作为本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件的构字理据相同、或写法稍异、或有所省减、或置向不同的变体、或互为繁、简字的关联性,归并成409个编码部件组,组内的第一个编码部件称为主形编码部件,有的编码部件由多个基础部件组成,如:風,在编码时要把它整体看作一个编码基本单元-——编码部件。在不违反GF3001规范的前提下,在这687个编码部件基础上允许增加或者减少不超出百分之二十的编码部件选用量,只对重码率略有影响,但不改变该编码输入法的实质。
[0011] 二、确定高频编码部件及其主部位位置以及高频编码部件的字母型主码
[0012] 构成汉字的五六百个部件中有三十多个被称之为部首的部件构字能力特别强,据本人统计它们大约构成了全部汉字的百分之四十左右,在这三十多个部首中,本发明确定了其中的31个构字能力特别强的部首为高频编码部件,在确定的687个编码部件中除去31个高频编码部件其余的编码部件称之为普通编码部件。
[0013] 为了降低重码率,在同一字母键位上只设置一个或一组互为繁、简字体的高频编码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通常所处的位置,为了降低重码率,其中高频编码部件:山、扌、 纟、糹、月、 亻、木、艹、訁、讠的9个编码部件组的12个高频编码部件不是以它们的读音或部首名称的汉语拼音的首字母作为它们的主码,而是人为指定。确定的31个高频编码部件的形状、字母型主码、主部位位置如表一所示:表一:
[0014]
[0015] 31个高频编码部件在字母键盘盘面的布置如图一所示。
[0016] 上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设定可以在31个高频编码部件的基础上在增加或减少不超出百分之二十的范围内变动,只对重码率有影响,但不改变编码方法的实质。
[0017] 三、确定每个编码部件的拼音类字母型主码、副码1、副码2、副码3,形成汉字编码方法的拼音类编码资源
[0018] 选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部件称之为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码一样,主形编码部件都有一定的读音或叫法,除高频编码部件的主码已确定了以外,其他主形编码部件的主码一般都取其读音或叫法名称的拼音首个字母作为拼音类的字母型主码;为了降低重码率,一个改进的方案,称之为点折I法:主形编码部件的读音的拼音首个字母为Y的,而且主形编码部件的首笔是点(丶)、折(乛)的取I作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取Y作为其字母型主码;另一个方案,称之为点折Y法,主形编码部件的读音的拼音首个字母为Y的而主形编码部件的首笔是点(丶)、折(乛)的仍取Y作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取I作为其字母型主码;除此之外其他普通编码部件的主形编码部件的主码,仍取其读音或叫法的拼音首个字母作为拼音类的字母型主码。
[0019] 普通编码部件与高频编码部件拼音类字母型副码1的确定:有两种方案,方案之一,称之为一般法:除主形编码部件读音或名称的汉语拼音,其声母为zh、ch、sh等双字母声母的,则取其汉语拼音的第3字母作字母型副码1的字母型码,除此以外,其余的都取其汉语拼音的第2字母作其字母型副码1;方案之二,称之为优选法:主形编码部件读音或名称的汉语拼音,其声母为j、q、x,而韵母是首字母为i的复合音韵母,或者其声母为zh、ch、sh等双字母声母,或者其汉语拼音第1字母为y,而第2字母为i,而韵母为鼻韵母的,则均取其汉语拼音的第3字母作其字母型副码1,除此以外,其余的都取其汉语拼音的第2字母作其字母型副码1;同一编码部件组的各编码部件字母型副码与该组的主形编码部件的字母型副码1相同;
[0020] 普通编码部件与高频编码部件的拼音类字母型副码2、副码3的确定:根据国家规范,汉字由横(一)、竖(丨)、撇(丿)、点(丶)折(乛)五种笔画组成,本发明依次用这五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表示笔画的字母型码。每个编码部件依次取首笔画、第2笔画的笔画的字母型码作为编码部件的字母型副码2、字母型副码3;对于不足2个笔画构成的编码部件,缺失的第2个笔画的,可以任意确定一个字母来表达,本发明确定都取字母V;另一个方案是,对于不足2个笔画构成的编码部件,该编码部件的的字母型副码3就空缺。
[0021] 根据上述方法确定本发明的409个编码部件组的687个编码部件的字母型主码、副码1、副码2、副码3,依次排列,如表二所示,副码1采用优选法确定,对于不足2个笔画构成的编码部件,确定都采用字母V补足的方案;主形编码部件的读音的拼音首个字母为Y的,采用点折I法,表二中拼音类主副码,为了看得醒目采用了大写字母,它与小写字母等效,在实际编码时,编码表采用小写字母;表二:
[0022]
[0023]
[0024]
[0025]
[0026]
[0027]
[0028]
[0029]
[0030] 四、转换取得各编码部件拼音类数字型主码、副码1、副码2、副码3码,形成拼音类数字型编码资源
[0031] 转换形成数字型编码资源方案:转换形成数字型编码资源有两种方案,方案之一,称之为字母笔画不同式转换方案:根据国家标准GB/T18031—2000《信息技术数字键盘汉字输入通用要求》,对编码部件拼音类字母型的副码2、副码3涉及到五类笔画的,都以该标准的“汉字笔画的键位设定”的规定转换成数字码,而不是以笔画名称的汉语拼音首字母转换成相应的数字码,除上述情况以外,编码部件的各类字母型主码、副码1以及拼音首字母的其他字母,以该标准的“10键位汉语拼音字母键位设定”和“8键位汉语拼音字母键位设定”的规定的字母与数字的对应关系,分别依次转换成10键位法拼音类数字型主码、副码1、副码2、副码3与8键位拼音类数字型主码、副码1、副码2、副码3以及拼音首字母的数字码;对于高频编码部件,在上述转换所得的各类数字型主、副代码的基础上,略作调整使各高频编码部件的各类数字型主码、副码1的数字组合,在同一类型中相互间都不相同,具体方案如表六所示;上述转换方案称之为字母笔画不同式转换方案;方案之二,称之为全字母转换方案:与方案之一不同点在于涉及到“8键位汉语拼音字母键位设定”的字母型码转换数字型码,把笔画撇“丿”的拼音首字母转换定为数字1,其他不变,仍然以笔画名称的汉语拼音首字母的字母形式,依据标准的规定转换成数字码,也就是说,只依据GB/T18031标准的“10键位汉语拼音字母键位设定”和“8键位汉语拼音字母键位设定”的字母与数字的对应关系,把前面设定的各编码部件各类字母型主码、副码1、副码2、副码3一一对应地分别转换成10键位法与8键位法拼音类数字型主码、副码1、副码2、副码3,对于高频编码部件在上述转换所得的数字型代码的基础上,略作调整使各高频编码部件的各类数字型主码、副码1的数字组合,在同一类型中相互间都不相同,具体方案如表七所示,上述转换方案称之为全字母转换方案;“汉字笔画的键位设定”如下表三所示:表三:
[0032]
[0033] “10键位汉语拼音字母键位设定”如下表四所示:
[0034] 表四:
[0035]
[0036] “8键位汉语拼音字母键位设定”如下表五所示:
[0037] 表五:
[0038]
[0039] “字母笔画不同式转换方案”的高频编码部件的拼音类数字型主码、副码1、副码2、副码3,用数字键盘的相应的数字键依次表达,31个高频编码部件方案的高频编码部件拼音类数字型主副码,具体方案如表六所示:表六:
[0040]
[0041]
[0042] “全字母式转换方案”的高频编码部件的拼音类数字型主码、副码1、副码2、副码3,用数字键盘的相应的数字键依次表达,31个高频编码部件方案的高频编码部件拼音类数字型主副码,具体方案如表七所示:表七:
[0043]
[0044] 五、组合式拼音类主副码汉字、词语编码输入法
[0045] 在实施编码时,首先要确定拆分方案,拼音类部首主副码字母型汉字编码方法采用字典、词典用汉字部首拆分法,其余的各种汉字、词语编码方法都采用通用拆分法,在取拆分编码部件笔画多的在先的那一种与取拆分编码部件笔画少的在先的那一种,这两种方案中确定一种;在由字母码转换成数字码的两种方案:字母笔画不同式转换方案与全字母式转换方案,这两方案中确定一种;而且在“10键位汉语拼音字母键位设定”与“8键位汉语拼音字母键位设定”,这两种规定的字母与数字的对应关系中,确定一种;
[0046] 组合式拼音类主副码汉字、词语编码输入法由组合式拼音类主副码字母型汉字、词语编码输入法和组合式拼音类主副码数字型汉字、词语编码输入法两部分组成;
[0047] 第一部分:组合式拼音类主副码字母型汉字、词语编码输入法
[0048] 利用拼音类字母型编码资源,形成组合式拼音类主副码字母型汉字、词语编码输入法包含有:①拼音类拼音首字母主副码字母型汉字编码方法;②拼音类拼音首字母主副码字母型词语编码方法;③拼音类非拼音首字母主副码字母型汉字编码方法;④拼音类非拼音首字母主副码词语编码方法;⑤拼音类主副码字母型部首汉字编码方法;⑥拼音类主副码字母型声系汉字编码方法;针对GB2312的6763个常用汉字、常用词语和GB18030的27000多汉字字符集或者GB13000中的中文台湾地区通行的汉字集或者日文汉字集或者朝鲜语汉字集以及几万乃至10万多汉字的大字符集的汉字的编码输入,可以从以下的方式进行组合编码输入操作:对常用汉字,例如,GB2312的6763个汉字中的一级字库或者一级、二级字库与常用词语库,采用拼音类拼音首字母字母型汉字编码方法、拼音类拼音首字母字母型词语编码输入法,对于GB18030-2000的27000多汉字或者GB13000中的中文台湾地区通行的汉字集或者日文汉字集采用拼音类非拼音首字母主副码字母型汉字编码方法或者采用拼音类主副码部首字母型汉字编码方法或者拼音类主副码字母型声系汉字编码方法,取得编码;对于常用词语也可用拼音类非拼音首字母字母型词语编码方法输入;拼音类拼音首字母字母型汉字编码方法的编码、拼音类拼音首字母字母型词语编码方法的编码与拼音类非拼音首字母字母型汉字编码方法的编码或者拼音类主副码字母型部首汉字编码方法的编码或者拼音类主副码字母型声系汉字编码方法的编码,可以组合在同一张码表,也可以分列在不同码表中,切换调用;拼音类拼音首字母字母型汉字、词语编码与拼音类非拼音首字母字母型汉字、词语编码可以组合在同一张码表,也可以分列在两张码表中,切换调用。拼音类主副码字母型部首汉字编码方法还可单列用于电子部首字典,能把部首相同的字汇集在一起;拼音类主副码字母型声系汉字编码方法还可以单列用于电子声系字典,能把声符相同的字汇集在一起;
[0049] 拼音类字母型汉字、词语的编码方法如下:
[0050] 在以下的叙述中,规定:对一个编码部件取1码,即取其字母型主码,取2码,即依次取其字母型主码、副码1,取3码,即依次取其字母型主码、副码1、副码2;取4码,即依次取其字母型主码、副码1、副码2、副码3。
[0051] (一)拼音类拼音首字母主副码字母型汉字编码方法
[0052] A、码长不定,与大于码长的词语编码同组码表时,汉字编码没达到码长的,可以以结束键结束,也可以以显示框中冠以的数字选择键选择;结束键结束后还有重码的,选择键选择;有多种编码方案的,除另有规定的,都从中选择一种;上述两点适用于下面的各个方法;确定采用拼音类字母型编码资源;
[0053] B、单个编码部件的汉字的编码:如果该汉字的拼音首字母与该编码部件的字母型主码相同:对于是高频编码部件的,则依次取该编码部件的字母型主码、副码1;对于是普通编码部件的,有两种编码方案,方案之一,称之为三码法,则依次取该编码部件的字母型主码、副码1、副码2,方案之二,称之为四码法,依次取该编码部件的字母型主码、副码1、副码2、副码3;如果该汉字的拼音首字母与该编码部件的字母型主码不相同的,又是高频编码部件的,有五种编码码方案,方案之一,称之为二码法,则依次取该字的拼音首字母、该高频编码部件的字母型主码,方案之二,称之为三码法,则依次取该汉字的拼音首字母、该高频编码部件的2码,方案之三,称之为替代三码法,则依次取该汉字的拼音首字母、该高频编码部件的副码1、副码2,方案之四,称之为四码法,则依次取该汉字的拼音首字母、该编码部件的
3码,方案之五,称之为替代四码法,则依次取汉字的拼音首字母、该编码部件的副码1、副码
2、副码3;如果该汉字的拼音首字母与该编码部件的字母型主码不同的,又是普通编码部件,而且编码部件的字母型主码不是I的,有五种编码方案,第一种方案,称之为副二法,依次取该汉字的拼音首字母、该编码部件的字母型主码、副码1、副码2,第二种方案,称之为副三法,依次取该汉字的拼音首字母、该编码部件的字母型副码1、副码2、副码3,第三种方法,称之为三码法,依次取该汉字的拼音首字母、该编码部件的字母型副码1、副码2,方案之四,称之为四码法,则依次取该汉字的拼音首字母、该编码部件的3码,方案之五,称之为取代四码法,则依次取该汉字的拼音首字母、该编码部件的字母型副码1、副码2、副码3;如果该汉字的拼音首字母为y而编码部件的字母型主码为I的,有三种编码方案,方案之一,称之为三码法,则依次取该汉字的拼音首字母、该编码部件的副码1、副码2,方案之二,称之为四码法,则依次取该汉字的拼音首字母、该编码部件的字母型主码、副码1、副码2,方案之三,称之为替代四码法,则依次取该汉字的拼音首字母、该编码部件的字母型副码1、副码2、副码
3;
[0054] C、2个或2个以上编码部件组成的汉字,汉字可以分成首部与余部两部分;
[0055] D、对于由2个或2个以上的编码部件组成的汉字,分如下二个部分依次确定其字母型编码:
[0056] 第1部分,取根据汉字的汉语拼音的首字母作为第1部分的字母型编码;
[0057] 第2部分,以下述方法取汉字的首部和余部的编码:
[0058] 对于由2个的编码部件组成的汉字字母型编码方法:如果首部是一个处于主部位的高频编码部件的,有两种编码方案,方案之一,称之为三码法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码,方案之二,称之为二码法,则依次对首部那个编码部件取1码,对余部那个编码部件取1码;如果首部件编码部件是普通编码部件的,有两种编码方案,方案之一,称之为一二法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码,方案之二,称之为二一法,则依次对首部那个编码部件取2码、对余部的那个编码部件取1码;
[0059] 对于由3个或3个以上的编码部件组成的汉字:如果是单首部汉字,又如果首部是一个处于主部位的高频编码部件的,则依次取第1、第2、第末个编码部件各1码;如果是单首部汉字,又如果首部是一个普通编码部件,有两种编码方案,方案之一,称之为首二法,则依次取第1个编码部件2码、第末个编码部件1码,方案之二,称之为首一法,则依次取第1、第2、第末个编码部件各1码;如果其首部为组合首部的汉字,则该组合首部取2码,有两种取码方案,方案之一,称之为首末法,依次对组合首部的第1、第末个编码部件各取1码,作为首部的编码;方案之二,称之为首次法,依次对组合首部的第1、第2个编码部件各取1码,作为首部的编码;组合首部为首部的汉字,其余部为单个编码部件,取1码;
[0060] 把上述第1、第2二个部分取的字母型编码,依次组合成整个汉字的编码;
[0061] E、编码时,采用英文小写字母,或者采用英文大写字母;
[0062] (二)拼音类非拼音首字母主副码字母型汉字编码方法
[0063] A、码长不定,采用拼音类字母型编码资源;
[0064] B、单个编码部件的汉字:如果该编码部件是高频编码部件的,则依次取其字母型主码、字母型副码1;如果是普通编码部件的:有两种编码方案,方案之一,称之为三码法,则依次取其字母型主码、副码1、副码2,方案之二,称之为四码法,则依次取其字母型主码、副码1、副码2、副码3;
[0065] C、由2个或2个以上编码部件组成的汉字:可以分成首部与余部两部分;
[0066] D、对于由2个的编码部件组成的汉字字母型编码方法:如果首部是一个处于主部位的高频编码部件的,有两个编码方案,方案之一,称之为三码法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码,方案之二,称之为四码法,则依次对首部那个编码部件取1码,对余部那个编码部件取3码;如果首部件编码部件是普通编码部件的,有两种编码方案,方案之一,称之为为二二法,则依次对首部那个编码部件取2码,对余部那个编码部件取2码,方案之二,称之为一三法,则依次对首部那个编码部件取1码、对余部的那个编码部件取3码;
[0067] E、对于由3个编码部件组成的汉字:如果首部是一个单首部,又是一个处于主部位的高频编码部件的,有两种编码方案,方案之一,称之为末二法,则依次对首部的那个高频编码部件取1码,余码的第1编码部件取1码、余部的第2编码部件取2码,方案之二,称之为三码法,则依次对首部的那个高频编码部件取1码、余码的第1、第2编码部件各取1码;如果首部是一个单首部,又是一个普通编码部件的,有两种编码方案,方案之一,称之为首二法,则依次对首部的那个编码部件取2码、余部的第1、第2编码部件各取1码,方案之二,称之为末二法,则依次对首部的那个编码部件取1码、余部的第1个编码部件取1码、余部的第2个编码部件取2码;如果首部是组合首部,则依次对组合首部的第1、第2个编码部件各取1码,余部的那个编码部件取2码;
[0068] F、对于由4个或4个以上的编码部件组成的汉字:如果首部是个单首部的,又是处于主部位的高频编码部件的,则依次取首部的那个编码部件1码、余部的第1、第2、第末个编码部件各1码;如果首部是一个单首部,又是一个普通编码部件的,有两种取码方案,方案之一,称之为首二法,则依次对汉字的首部那个编码部件取2码、余部的第1、第末个编码部件各取1码;方案二,称之为一码法,则依次对汉字的首部的那个编码部件取1码、余部的第1、第2、第末个编码部件各取1码;如果首部是组合首部,对于组合首部有两种取码方案,第一种方法,称之为组合首部首次末取码法,即依次对组合首部的第1、第2、第末个编码部件各取1码,汉字的余部那个部件取1码,第二种方法,称之为组合首部首、次、次次取码法,即依次对组合首部的第1、第2、第3个编码部件各取1码,汉字的余部那个部件取1码;
[0069] 把上述汉字各编码部件取的编码,以编码部件在汉字组成中的先后为序,依次组成整个汉字的编码;
[0070] E、编码时,采用英文小写字母,或者采用英文大写字母;
[0071] (三)拼音类拼音首字母主副码字母型汉语词语编码方法
[0072] A、采用拼音类字母型编码资源,依据拼音类拼音首字母汉字编码方法取得的汉字编码,取词语的编码;对词语中的一个字取1码,就是取该字的拼音首字母;对一个词中的一个字取2码,如果是单个编码部件的汉字,则依次取该汉字的拼音首字母、该编码部件的副码1,如果由两个或两个以上的编码部件组成的汉字,就是依次取该词的这个字拼音首字母字母型的编码的第1、第2个字母码,也就是依次取该字的拼音首字母、该字的第1编码部件的字母型主码;对一个汉字取3码,就是依次取该字的编码的第1、第2、第3个字母码;词语编码的最长码长设定为6,也可设定为4或5,这不改变编码的实质,只对重码率有所影响;
[0073] B、对于由2个汉字组成的词语,有4种编码方案,方案之一。称之为二二法,依次对第1个汉字、第2个汉字各取2码;方案之二,称之为一三法,依次取第1个汉字1码,第2个汉字3码;方案之三,称之为三一法,依次取第1个汉字3码,第二个汉字1码,方案之四,称之为二三法,则依次对第1个汉字取2码、第2个汉字取3码;实施编码时在上述的方案中可以选择其中的一个方案,或者同时选择其中的两个方案,或者同时选择其中三个方案,进行编码;也可以实行混合组合,对所有的两个汉字组成的词语都采用二二法编码,对于一些构词能力特别强的字,如作为第1字出现的“发”、“不”、“大”、“出”的两字组词语,再增加采用一三法对词语的编码;对于作为第2字出现的“头”、“工”、“心”的两字组词语,再增加采用三一法对词语的编码;
[0074] C、对于由3个汉字组成的词语,有四种编码方案,方案之一,称之为一一二法,则依次取第1个汉字1码、第2个汉字1码、第3个汉字2码;方案之二,称之为二一一法,则依次取第1个汉字2码、第2个汉字1码、第三个汉字1码;方案之三,称之为一二一法,则依次取第1个汉字1码、第2个汉字2码、第3个汉字1码,方案之四,称之为二一二法,则依次取第1个汉字2码、第2个汉字1码、第3个汉字2码;在实施编码时,在上述的方案中可以选择其中的一个方案,或者选择其中的两个方案,或者选择其中三个方案,进行编码;
[0075] D、对于由4个汉字组成的词语,有三种编码方案,方案之一,称之为四码法,则依次取第1、第2、第3、第4个汉字的各取1码,方案之二,称之为五码法,则依次取第1、第2、第3个汉字各1码、第4个汉字的取2码,方案之三,称之为首二法,则依次取第1个汉字2码、第2、第3、第4个汉字的各1码;实施编码时,在上述的方案中可以选择其中的一个方案,或者同时选择其中的两个方案,进行编码;
[0076] E、对于由5个汉字组成的词语,有三种编码方案,方案之一,称之为五码法,则依次取第1、第2、第3、第4、第5个汉字各1码;方案之二,称之为六码法,则依次取第1、第2、第3、第4个汉字各1码,第5个汉字取2码,方案之三,称之为首二法,则依次取第1个汉字2码、第2、第
3、第4、第5个汉字各1码;在实施编码时,在上述的方案中可以选择其中的一个方案,或者同时选择其中的两个方案,进行编码;
[0077] F、对于由6个或6个以上汉字组成的词语,有四种编码方案,方案之一,称之为顺六法,依次取词语的第1、第2、第3、第4、第5、第6个汉字各1码,方案之二,称之为末六法,则依次取词语的第1、第2、第3、第4、第5、第末个汉字各1码,方案之三,称之为首二法,则依次取词语的第1个汉字2码、第2、第3、第4、第5个汉字各1码,方案之四,称之为首二末一法,则依次取词语的第1个汉字2码、第2、第3、第4、第末个汉字各1码;
[0078] G、编码时,采用英文小写字母,或者采用英文大写字母;、
[0079] (四)拼音类非拼音首字母主副码字母型汉语词语编码方法
[0080] 利用确定的拼音类非拼音首字母主副码字母型汉字编码输入法对每个汉字的编码,实施对汉语词语的非拼音首字母编码;对一个汉字取1码,即取该汉字的第1个编码部件的字母型主码,对一个汉字取2码:如果是单个编码部件的字,则依次取该编码部件的字母型主码、副码1;如果是由二个或二个以上编码部件组成的汉字,有两种取法,取法之一,称之为首次法,即依次取该汉字的第1、第2个编码部件的字母型主码,取法之二,称之为首余法,即依次取该汉字的首部的第1个编码部件字母型主码、余部的第1个编码部件的字母型主码;对一汉字取3码,如果是单个编码部件的汉字,则依次取该编码部件的字母型编码的主码、副码1、副码2;如果是二个编码部件的汉字,则依次取汉字的第1编码部件1码、第2编码部件2码;如果是三个或三个以上编码部件的汉字,则依次取汉字的第1、第2、第末个编码部件各1码;词语的最大码长设定为6;词语的具体编码方法如下:
[0081] A、对于由2个汉字组成的词语编码,有三种方案,方案之一,称之为二二法,用首次法,对词语的汉字取码,即依次取该词语的第1个汉字2码、第2个汉字2码;方案之二,称之为首三法,即依次取该词语的第1个汉字3码、第2个汉字1码,方案之三,称之为末三法,依次取该词语的第1个汉字1码、第2个汉字3码;
[0082] B、对于由3个汉字组成的词语编码:有三种编码方案,方案之一,称之为末二法,即依次取该词语的第1、第2个汉字各1码、第3个汉字2码;方案之二,称之为首二法,即依次取该词语的第1个汉字2码、第2、第3个汉字各1码,方案之三,称之为次二法,则依次取第1个汉字1码、第2个汉字2码、第3个汉字1码;
[0083] C、对于由4个汉字组成的词语编码,有二种方案,方案之一,称之为末二法,即依次取该词语的第1、第2、第3个汉字各1码、第4个汉字2码;方案之二,称之为四码法,即依次取该词语的第1、第2、第3、第4个汉字各1码;
[0084] D、对于由5个汉字组成的词语编码,依次取该词语的第1、第2、第3、第4、第5个汉字各1码;
[0085] E、对于由6个或6个以上汉字组成的词语编码,依次取该词语的第1、第2、第3、第4、第5、第6个汉字各取1码;
[0086] (五)拼音类主副码字母型部首汉字编码方法
[0087] A、采用拼音类主副码字母型编码资源,汉字拆分采用字典、词典用汉字部首拆分法;码长不定;
[0088] B、作为汉字的首部的部首的编码部件,有三种取编码方案,方案之一,称之为二码法,取该编码部件2码,即取该编码部件的字母型主码、副码1;方案之二,称之为三码法,取该编码部件3码,即取该字编码部件的字母型主码、副码1、副码2;方案之三,称之为四码法,取该编码部件4码,即取该编码部件的字母型主码、副码1、副码2、副码3;
[0089] C、作为汉字的余部的编码部件,有两种取码方案,方案之一,称之为二码法,对于单个编码部件的余部,则依次对该编码部件取2码,如果是二个或二个以上编码部件的余部则对其第1、第末个编码部件各取1码;方案之二,称之为三码法,如果是单个编码部件的余编码,则依次对该编码部件取3码,如果是二个编码部件的余部,则依次对第1个编码部件取1码、对第2个编码部件取2码,如果是由三个或三个以上的编码部件组成的余部,则依次取其第1、第2、第末个编码部件各取1码;
[0090] D、对于没有余部的首部的部首的编码部件,有三种取编码方案,方案之一,称之为二码法,取该编码部件2码,即取该编码部件的字母型主码、副码1;方案之二,称之为三码法,取该编码部件3码,即取该字编码部件的字母型主码、副码1、副码2;方案之三,称之为四码法,取该编码部件4码,即取该编码部件的字母型主码、副码1、副码2、副码3;
[0091] E、把汉字的首部与余部的编码依次组合在一起,成为整个汉字的编码;
[0092] (六)拼音类主副码字母型声系汉字编码方法
[0093] A、采用拼音类主副码字母型编码资源,汉字拆分采用声符拆分法;码长不定;
[0094] B、对声符取编码,有三种方案,方案之一,称之为二码法,对于单个编码部件的声符,则取该编码部件2码,对于由二个或二个以上编码部件组成的声符,则依次取其第1、第末个编码部件各1码,方案之二,称之为三码法,对于单个编码部件的声符,则取该编码部件3码,对于由二个编码部件组成的声符,则又有两种取编码方案,方案之一,称之为首二法,则依次取其第1个编码部件2码、第2个编码部件1码,方案之二,称之为首一法,则依次取其第1个编码部件1码、第2个编码部件2码,对于由三个或三个以上编码部件组成的声符,则依次取第1、第2、第末个编码部件各1码;方案之三,称之为四码法,对于单个编码部件的声符,则取该编码部件4码,对于由二个编码部件组成的声符,又有三种取编码方案,方案之一称之为首一法,则依次取其第1个编码部件1码、第2个编码部件3码,方案之二,称之为首二法,则依次取其第1、第2个编码部件各2码,方案之三,称之为首三法,则依次取第1个编码部件3码、第2个编码部件1码;对于三个编码部件组成的声符,又有两种取编码方案,方案之一,称之为首一法,则依次取第1、第2个编码部件各1码、第3个编码部件2码,方案之二,称之为首二法,则依次取其第1个编码部件2码、第2、第3个编码部件各1码,对于由四个或四个以上编码部件组成的声符,则依次取其第1、第2、第3、第末个编码部件各1码;
[0095] C、对形符取编码,有三种取编码方案,方案之一,称之为二码法,如果形符是单个编码部件的,则取其2码,如果形符是二个或二个以上编码部件组成的,则依次取其第1、第末个编码部件各1码;方案之二,称之为三码法,如果形符是单个编码部件的取该编码部件3码,如果形符是二个编码部件组成的,则依次取其第1个编码部件1码、第2个编码部件2码;如果形符是三个或三个以上的编码部件组成的,则依次取第1、第2、第末个编码部件各取一码;方案之三,称之为一码法,取形符的第1个编码部件的字母型主码;
[0096] D、对于没有形符的声符取编码,有三种方案,方案之一,称之为二码法,对于单个编码部件的声符,则取该编码部件2码,对于由二个或二个以上编码部件组成的声符,则依次取其第1、第末个编码部件各1码,方案之二,称之为三码法,对于单个编码部件的声符,则取该编码部件3码,对于由二个编码部件组成的声符,则又有两种取编码方案,方案之一,称之为首二法,则依次取其第1个编码部件2码、第2个编码部件1码,方案之二,称之为首一法,则依次取其第1个编码部件1码、第2个编码部件2码,对于由三个或三个以上编码部件组成的声符,则依次取第1、第2、第末个编码部件各1码;方案之三,称之为四码法,对于单个编码部件的声符,则取该编码部件4码,对于由二个编码部件组成的声符,又有三种取编码方案,方案之一称之为首一法,则依次取其第1个编码部件1码、第2个编码部件3码,方案之二,称之为首二法,则依次取其第1、第2个编码部件各2码,方案之三,称之为首三法,则依次取第1个编码部件3码、第2个编码部件1码;对于三个编码部件组成的声符,又有两种取编码方案,方案之一,称之为首一法,则依次取第1、第2个编码部件各1码、第3个编码部件2码,方案之二,称之为首二法,则依次取其第1个编码部件2码、第2、第3个编码部件各1码,对于由四个或四个以上编码部件组成的声符,则依次取其第1、第2、第3、第末个编码部件各1码;
[0097] E、声符取的编码在前,形符取的编码在后,依次组成整个汉字的编码;
[0098] 第二部分:组合式拼音类主副码数字型汉字、词语编码输入法
[0099] 利用拼音类数字型编码资源实施组合式拼音类主副码数字型汉字、词语编码输入;码长不定,最大码长设定为6;
[0100] 采用拼音类数字型编码资源的组合式拼音类主副码数字型汉字、词语编码输入法包含有:①基于拼音首字母主副码数字型汉字编码方法;②基于拼音首字母主副码数字型词语编码方法;③基于非拼音首字母主副码数字型汉字编码方法;④基于非拼音首字母主副码数字型词语编码方法,针对GB2312的6763个常用汉字、常用词语(或汉语大词语集)和GB18030的27000多个汉字字符集或者GB13000中的中文台湾地区通行的汉字集或者日文汉字集或者朝鲜语汉字集以及几万乃至10万多汉字的大字符集的汉字的编码输入,可以从以下的组合中选择,进行组合编码输入操作:对常用汉字,例如,GB2312的6763个汉字中的一级字库或者一级、二级字库与常用词语库采用基于拼音首字母数字型汉字、词语编码输入法,对于GB2312的全部汉字乃至GB18030-2000的27000多汉字或者GB13000中的中文台湾地区通行的汉字集或者日文汉字集采用基于非拼音首字母主副码数字型汉字编码方法取得的编码,可以组织在同一张码表,也可分列两张表,切换调用;对于常用词语也可用基于非拼音首字母数字型词语编码输入;拼音类基于拼音首字母数字型汉字、词语编码与拼音类基于非拼音首字母数字型汉字、词语的编码可以组合在同一张码表,也可以分列在两张码表中,切换调用。
[0101] 各种数字型汉字、词语的编码方法如下:
[0102] 在以下的叙述中,规定:对于一个编码部件取1码,即取其数字型主码,取2码,即依次取其数字型主码、副码1,取3码,即依次取其数字型主码、副码1、副码2,取4码,即依次取其数字型主码、副码1、副码2、副码3;
[0103] 在以下各条编码条款中,有多个编码方案的,在实施具体编码时,从中选定一个编码方案;
[0104] (七)拼音类基于拼音首字母主副码数字型汉字编码方法
[0105] A、确定采用拼音类数字型编码资源;在取码中,分成两个部分取编码的,则把第1部分与第2部分取的编码,依次组合成整个汉字的编码;
[0106] B、单个编码部件的汉字的编码:对于编码部件是高频编码部件的汉字,如果其拼音首字母数字型码与该高频编码部件的数字型主码相同的,则对该高频编码部件取2码,就是该汉字的编码部件的数字型主码、副码1;如果不同的,有二种编码方案,方案之一,称之为拼首法,则依次取拼音首字母转化成的1个数字码、该高频编码部件的2码,方案之二,称之为替代法,则依次取拼音首字母转化成的1个数字码、该编码部件的数字型副码1、副码2;对于普通编码部件的汉字,其拼音首字母的数字型码与该编码部件的数字型主码相同的:
有两种编码方案,方案之一,称之为三码法,则依次取该编码部件3码,方案之二,称之为四码法,则依次取该编码部件4码,作为该汉字的编码;如果不相同的,有三种编码方案,方案之一,称之为三码法,则依次取该字的拼音首字母转换成的数字码、该编码部件的数字型副码1、副码2,方案之二,称之为四码法,则依次取该字的拼音首字母转换成的一个数字码、该编码部件的3个数字码,方案之三,称之为替换法,则依次取该汉字的拼音首字母转换成的数字码、该编码部件的数字型副码1、副码2、副码3;
[0107] C、对于由2个编码部件组成的汉字,分如下二个部分依次确定其数字型编码:第1部分,取该汉字汉语拼音首字母转换成的一个数字码作为第1部分的编码;第2部分,以下述方法取编码:如果第1个编码部件为处于主部位的高频编码部件的,有五种编码方案,方案之一称之为首一末二法,则依次对第1编码部件取1码、第2编码部件取2码,方案之二,称之为首二末一法,则依次对第1编码部件取1码、第2编码部件取2码,方案之三,称之为首二末二法,则依次取第1个编码部件2码、第2编码部件2码,方案之四,称之为首一末三法,则依次取第1个编码部件1码、第2个编码部件3码,方案之五,称之为首二末三法,则依次取第1个编码部件2码、第3个编码部件3码;如果第1个编码部件是普通编码部件的,有六种编码方案,方案之一,称之为首二末一法,则依次取该字的第1个编码部件2码、第2编码部件1码,方案之二,称之为首二末二法,则依次取该字的第1个编码部件2码、第2编码部件2码,方案之三,称之为首一末三法,则依次取第1编码部件1码、第2编码部件3码,方案之四,称之为首一末二法,则依次取第1编码部件取1码、第2编码部件取2码,方案之五,称之为首三末二法,则依次取第1个编码部件3码、第2个编码部件2码,方案之六,称之为首三末一法,则依次取第1个编码部件3码、第2个编码部件1码;
[0108] D、对于由3个编码部件组成的汉字,分如下二个部分依次确定其数字型编码:第1部分,取该汉字汉语拼音首字母转换成的一个数字码作为第1部分的编码;第2部分,以下述方法取编码:如果首部是单首部,又如果第1个编码部件为处于主部位的高频编码部件的,有四种取编码方案:方案之一,称之为三码法,则依次对第1、第2、第3编码部件各取1码,方案之二,称之为末二法,则依次对第1、第2编码部件各取1码、对第3编码部件取2码,方案之三,称之为首二法,则依次取第1个编码部件2码、第2、第3个编码部件各1码,方案之四,称之为首二末二法,则依次取第1个编码部件2码、第2编码部件1码、第3个编码部件取2码;如果首部是单首部,又如果第1编码部件是普通编码部件的,有四种编码方案:方案之一,称之为末二法,则依次对第1、第2个编码部件各取1码、第3个编码部件取2码,方案之二,称之为首二法,则依次对第1个编码部件取2码、第2、第3个编码部件各取1码,方案之三,称之为首二末二法,则依次对第1个编码部件取2码、第2个编码部件取1码、第3个编码部件取2码,方案之四,称之为首三法,则依次取第1个编码部件取3码,第2、第3个编码部件各取1码;如果首部是组合首部的汉字,有三种编码方案,方案之一,称之为余二法,则依次取组合首部的第1、第2编码部件各1码、余部那个编码部件2码,方案之二,称之为首二法,则依次取组合首部的第1编码部件2码、第2编码部件1码、余部那个编码部件2码,方案之三,称之为余三法,则依次取组合首部的第1、第2编码部件各1码、余部那个编码部件3码;
[0109] E、对于由四个编码部件组成的汉字,分如下二个部分依次确定其数字型编码:第1部分,取该汉字汉语拼音首字母转换成的一个数字码作为第1部分的编码;第2部分,以下述方法取编码:如果首部是单首部,又如果第1个编码部件为处于主部位的高频编码部件的,有三种取编码方案:方案之一,称之为四码法,则依次对第1、第2、第3、第4编码部件各取1码,方案之二,称之为末二法,则依次对第1、第2、第3编码部件各取1码、对第4编码部件取2码,方案之三,称之为首二法,则依次取第1个编码部件2码、第2、第3、第4个编码部件各1码;如果首部是单首部,又如果第1编码部件是普通编码部件的,有四种编码方案:方案之一,称之为末二法,则依次对第1、第2、第3个编码部件各取1码、第4个编码部件取2码,方案之二,称之为首二法,则依次对第1个编码部件取2码、第2、第3、第4个编码部件各取1码,方案之三,称之为四码法,则依次取第1、第2、第3、第4个编码部件各1码,方案之四,称之为首三法,则依次取第1编码部件3码、第2、第末个编码部件各1码;如果首部是组合首部的汉字,有三种编码方案,方案之一,称之为余二法,则依次取组合首部的第1、第2、第3编码部件各1码、余部那个编码部件2码,方案之二,称之为首二法,则依次取组合首部的第1编码部件2码、第
2、第3个编码部件1码、余部那个编码部件1码,方案之三,称之为四码法,则依次取组合首部的第1、第2、第3各1码、余部那个编码部件1码;
[0110] F、对于由五个或五个以上编码部件组成的汉字分如下二个部分依次确定其数字型编码:
[0111] 第1部分,取该汉字汉语拼音首字母转换成的一个数字码作为第1部分的编码;
[0112] 第2部分,以下述方法取编码:如果首部是单首部,第1个编码部件为处于主部位的高频编码部件的,有三种编码方案,方案之一,称之为首二法,则依次取第1编码部件2码、第2、第3、第末个编码部件各1码,方案之二,称之为顺序法,则依次对第1、第2、第3、第4、第5个编码部件各取1码,方案之三,称之为取末法,则依次对第1、第2、第3、第4、第末个编码部件各取1码;如果首部为单首部,又是普通编码部件的,有三种编码方案,方案之一,称之为首二法,则依次取第1编码部件2码、第2、第3、第末个编码部件各1码,方案之二,称之为顺序法,则依次对第1、第2、第3、第4、第5个编码部件各取1码,方案之三,称之为取末法,则依次对第1、第2、第3、第4、第末个编码部件各取1码,方案之四,称之为首三法,则依次取第1个编码部件3码、第2、第末个编码部件各1码;如果首部是组合首部的汉字,有二种编码方案,方案之一,称之为前四法,则依次对组合首部的第1、第2、第3、第4编码部件各取1码、余部那个编码部件取1码,方案之二,称之为前三末法,则依次对组合首部的第1、第2、第3、第末个编码部件各取1码、余部那个编码部件取1码;
[0113] (八)拼音类基于非拼音首字母主副码数字型汉字编码方法
[0114] A、确定采用拼音类数字型编码资源;
[0115] B、对于由单个编码部件组成的汉字:如果该编码部件是高频编码部件,则依次取编码部件2码;如果该编码部件是普通编码部件,有两种编码方案,方案之一,称之为三码法,则依次取该编码部件3码,方案之二,称之为四码法,则依次取该编码部件4码;
[0116] C、2或2个以上编码部件组成的汉字:可以分成首部与余部两部分;
[0117] D、对于由2个编码部件组成的汉字,如果第1编码部件是处于主部位的高频编码部件的,有六种编码方案,方案之一,称之为首二末二法,则依次对第1个编码部件取2码、第2个编码部件取2码,方案之二,称之为首二末三法,则依次取第1编码部件2码、第2编码部件3码,方案之三,称之为首二末四法,则依次对第1个编码部件取2码、第2个编码部件取2码,方案之四,称之为首一末三法,则依次对第1个编码部件取1码、第2个编码部件取3码,方案之五,称之为首一末二法,则依次取第1编码部件1码、第2编码部件2码,方案之六,称之为首二末一法,则依次取第1编码部件2码、第2编码部件1码;如果第1编码部件是普通编码部件的,有四种编码方案,方案之一,称之为首三末二法,则依次对第1编码部件取3码、第2编码部件取2码,方案之二,称之为首三末三法,则依次取第1、第2个编码部件各3码,方案之三,称之为首一末三法,则依次第1编码部件取1码、第2编码部件取3码,方案之四,称之为首一末四法,则依次取第1编码部件1码、第2编码部件4码;
[0118] E、对于由3个编码部件组成的汉字:如果第1编码部件是处于主部位的高频编码部件的单首部的,有五种编码方案,方案之一,称之为首二法,则依次对第1个编码部件取2码、第2、第3个编码部件各取1码,方案之二,称之为首二末二法,则依次对第1个编码部件取2码、第2个编码部件取1码、第3个编码部件取2码,方案之三,称之为首二末三法,则依次对第1个编码部件取2码、第2个编码部件取1码、第3个编码部件取3码,方案之四,称之为首一末三法,则依次对第1、第2个编码部件各取1码、第3个编码部件取3码,方案之五,称之为首一末二法,则依次取第1、第2个编码部件各1码、第3个编码部件2码;如果第1编码部件是普通编码部件的单首部字,有四种编码方案,方案之一,称之为首三法,则依次对第1个编码部件取3码、第2、第3个编码部件各取1码,方案之二,称之为首三末二法,则依次对第1个编码部件取3码、第2个编码部件取1码、第3个编码部件取2码,方案之三,称之为首一末三法,则依次对第1、第2个编码部件各取1码、第3个编码部件取3码,方案之四,称之为首一末二法,则依次取第1、第2个编码部件各1码、第3个编码部件2码;对于首部是组合首部的汉字,有三种编码方案,方案之一,称之为余部三码,则依次对组合首部的第1、第2编码部件各取1码、对余部的那个编码部件取3码,方案之二,称之为余部二码法,则依次对组合首部的第1、第2编码部件各取1码、对余部的那个编码部件取2码,方案之三,称之为余四法,则依次对组合首部的第1、第2编码部件各取1码、对余部的那个编码部件取4码;
[0119] F、对于由四个编码部件组成的汉字:如果第1编码部件是处于主部位的高频编码部件的单首部的汉字,有五种编码方案,方案之一,称之为首二末一法,则依次对汉字的第1编码部件取2码、第2、第3、第4编码部件各取1码,方案之二,称之为首二末二法,则依次对汉字的第1编码部件取2码、第2、第3个编码部件各取1码、第4个编码部件取2码,方案之三、称之为首一末二法,则依次对汉字的第1、第2、第3编码部件各取1、第4个编码部件取2码,方案之四,称之为首一末三法,则依次对汉字的第1、第2、第3编码部件各取1、第4个编码部件取3码,方案之五,称之为四一法,则依次对汉字的第1、第2、第3、第4个编码部件各取1码;如果第1个编码部件是普通编码部件的单首部的汉字,有二种编码方案,方案之一,称之为首三法,则依次对第1个编码部件取3码、第2、第3、第4个编码部件各取1码,方案之二,称之为首一末三法,则依次对第1、第2、第3个编码部件各取1码,第4个编码部件取3码;对于组合首部的汉字,有二种编码方案,方案之一,称之为余二法,则依次对组合首部的第1、第2、第3个编码部件各取1码、余部那个编码部件取2码,方案之二,称之为余三法,则依次对组合首部的第1、第2、第3个编码部件各取1码,余部的那个编码部件取3码;
[0120] G、对于由五个编码码部件组成的汉字:如果第1编码部件是处于主部位的高频编码部件的单首部汉字,有三种编码方案,方案之一,称之为首二法,则依次对汉字的第1编码部件取2码、第2、第3、第4、第5编码部件各取1码,方案之二、称之为末二法,则依次对汉字的第1、第2、第3、第4编码部件各取1、第5个编码部件取2码,方案之三,称之为都一法,则依次对汉字的第1、第2、第3、第4、第5个编码部件各取1码;如果第1个编码部件是普通编码部件的单首部的汉字,有三种编码方案,方案之一,称之为首三法,则依次对第1个编码部件取3码、第2、第3、第末个编码部件各取1码,方案之二,称之为末二法,则依次对第1、第2、第3、第4个编码部件各取1码,第5个编码部件取2码,方案之三,称之为都一法,则依次对第1、第2、第3、第4、第5个编码部件各取1码;对于组合首部的汉字,有二种编码方案,方案之一,称之为余二法,则依次对组合首部的第1、第2、第3、第4个编码部件各取1码、余部那个编码部件取2码,方案之二,称之为都一法,则依次对组合首部的第1、第2、第3、第4个编码部件各取1码,余部的那个编码部件取1码;H、对于由六个或六个以上编码码部件组成的汉字:如果第1编码部件是处于主部位的高频编码部件的单首部汉字,有两种编码方案,方案之一,称之为首二法,则依次对汉字的第1编码部件取2码、第2、第3、第4、第末个编码部件各取1码,方案之二,称之为都一法,则依次对汉字的第1、第2、第3、第4、第5、第末个编码部件各取1码;如果第1个编码部件是普通编码部件的单首部的汉字,有二种编码方案,方案之一,称之为首三法,则依次对第1个编码部件取3码、第2、第3、第末个编码部件各取1码,方案之二,称之为都一法,则依次对第1、第2、第3、第4、第5、第末个编码部件各取1码;对于组合首部的汉字,有三种编码方案,方案之一,称之为余二法,则依次对组合首部的第1、第2、第3、第末个编码部件各取1码、余部那个编码部件取2码,方案之二,称之为都一法,则依次对组合首部的第
1、第2、第3、第4、第末个编码部件各取1码,余部的那个编码部件取1码,方案之三,称之为顺式余二法则依次对组合首部的第1、第2、第3、第4个编码部件各取1码、余部那个编码部件取
2码,;
[0121] (九)拼音类基于拼音首字母主副码数字型汉语词语编码方法
[0122] 利用拼音类主副码数字型编码资源,实施对汉语词语编码输入:
[0123] 设定:对一个汉字取1码,即取汉字的基于拼音首字母的主副码数字型汉字编码的第1个数字码,也就是取该汉字的拼音首字母;对一个汉字取2码,即依次取汉字的基于拼音首字母的主副码数字型汉字编码的第1、第2个数字码;对一个汉字取3码,分三种情况取编码:如果是单个编码部件的汉字,有两种取法,取法之一,称之为补足法,如果依编码方案,该汉字只有2码的再依次加取1个数字型码,例如,“女”字,8键位的数字型码为:66,取3码,则再依次加取数字型码:5,也就对“女”字取3码,即为:665,取法之二,称之为编码法,依据编码方案该汉字只取2码的仍然取2码,也视为取3码,例如“女”仍然只取:66;其他则依次取这个汉字的第1、第2、第3个数字型编码;如果是单首部的汉字,则依次取该汉字的第1、第2个数字型编码、汉字的第2编码部件的数字型主码;如果是组合首部的汉字,有两种取法,方案之一,称之为顺序法,依次取组合首部汉字的第1、第2、第3个拼音类基于拼音首字母主副码数字型汉字编码的数字型编码,方案之二,称之为首余法,依次取该汉字的第1、第2个数字型编码、该汉字的余部那个编码部件的数字型主码;从上述的取法中确定一种;对一个汉字取4码:如果是单个编码部件的汉字,有两种取法,取法之一,称之为补足法:取汉字的拼音类拼音首字母主副码数字型全码,即不足4码的,依据其编码方案,依次增加至4码;以8键位的数字型码为例:“女”字,取4码为:6653,如果拼音首字母的数字型码与该编码部件的数字型主码不相同的,采用替代法的,例如,“山”:7225;“羊”:9243;“五”:9815,取法之二,称之为编码法,即采用的汉字的编码方案,取几码是几码,不再增加,例如,“女”只取66,也视为取4码;如果是两个编码部件的汉字,有两种取法,取法之一,称之为补足法,取其拼音首字母的数字码、第1、第2个编码部件的数字型主码、第2编码部件的数字型副码1,取法之二,称之为编码法,依次取其拼音首字母的数字码、第1、第2个编码部件的数字型主码;如果是三个或三个以上编码部件的汉字,则取拼音首字母的数字型码、第1、第2、第3个编码部件的数字型主码;具体的编码方法如下:
[0124] A、对于两个汉字组成的词语:有三种编码方案,方案之一,称之为首三法,则依次对第1、第2个汉字各取3码,方案之二,称之为首二末三法,则依次取第1个汉字取2码,第2个汉字取3码,方案之三,称之为首二末四法,则依次取第1个汉字取2码,第2个汉字取4码;
[0125] B、对于由三个汉字组成的词语:有六种编码方案,方案之一,称之为二二二法,则依次取词语的第1、第2、第3个汉字各取2码,方案之二,称之为二一二法,则依次取词语的第1个汉字2码、第2个汉字1码、第3个汉字2码,方案之三,称之为二一三法,则依次取词语的第
1个汉字2码、第2个汉字1码、第3个汉字3码,方案之四,称之为首一末二法,则依次取词语的第1、第2个汉字各1码、第3个汉字2码,方案之五,称之为首一末三法,则依次取词语的第1、第2个汉字各1码、第3个汉字3码,方案之六,称之为首一末四法,则依次取第1、第2个汉字各
1码、第3个汉字4码;
[0126] C、对于由四个汉字组成的词语:有四种编码方案,方案之一,称之为首二法,则依次取第1个汉字2码、第2、第3、第4个汉字各1码,方案之二,称之为首二末二法,则依次取第1个汉字2码、第2、第3个汉字各1码、第4个汉字2码,方案之三,称之为末二法,则依次取第1、第2、第3个汉字各1码、第4个汉字2码,方案之四,称之为末三法,则依次取第1、第2、第3个汉字各1码、第4个汉字3码,方案之五,称之为首一末二法,则依次取第1、第2、第3个汉字各1码、第4个汉字2码;
[0127] D、对于由五个汉字组成的词语:有三种编码方案,方案之一,称之为首二法,则依次取第1个汉字2码、第2、第3、第4、第五个汉字各1码,方案之二,称之为末二法,则依次取第1、第2、第3、第4个汉字各1码、第5个汉字2码,方案之三,称之为各一法,则依次取第1、第2、第3、第4、第5个汉字各1码;
[0128] E、对于由六个或六个以上汉字组成的词语:有三种编码方案,方案之一,称之为首二法,则依次取词语的第1汉字2码、第2、第3、第4、第5个汉字各1码,方案之二,称之为顺一法,则依次取词语的第1、第2、第3、第4、第5、第6个汉字各1码,方案之三,称之为末一法,则依次取词语的第1、第2、第3、第4、第5、第末个汉字各1码;
[0129] (十)拼音类非基于拼音首字母主副码数字型汉语词语编码方法
[0130] 利用拼音类主副码数字型编码资源,实施对汉语词语编码输入:
[0131] 拼音类非基于拼音首字母主副码数字型汉语词语编码方法;又设定:对一个汉字取1码:即取该汉字的第1个编码部件拼音类数字型主码;对一个汉字取2码:如果是单个编码部件的汉字,则依次取该编码部件的数字型主码、副码1;如果是单首部汉字,则即依次取该汉字的第1、第2个编码部件各1码;如果是组合首部的汉字,有两种取码方案,方案之一,称之为首余法,则依次取组合首部的第1编码部件的数字型主码、余部那个编码部件的数字型主码,方案之二,称之为顺序法,则依次取该汉字的第1、第2个编码部件各1码;对一个汉字取3码:如果是单个编码部件的汉字,则依次取该编码部件的数字型主、副码1、副码2;如果是由两个编码部件组成的单首部的汉字,则依次取第1编码部件数字型主码、第2编码部件数字型主码、副码1;如果是由三个或三个以上编码部件组成的单首部的汉字,则依次取汉字的第1、第2、第3个编码部件各1码;如果是组合首部的汉字,有两种取码方案,方案之一,称之为首余法,则依次取汉字组合首部的第1、第2个编码部件、余部的那个编码部件各1码,方案之二,称之为顺序法,则依次取汉字的第1、第2、第3个编码部件各1码;对一个汉字取4码:对于单个编码部件的汉字,则取该编码部件的数字型主码、副码1、副码2、副码3;对于两个编码部件的汉字,有两种取码方案,方案之一,称之为一三法,则依次取第1个编码部件1码、第2个编码部件3码,方案之二,称之为二二法,则依次取第1个编码部件2码、第2个编码部件2码;对于三个编码部件的汉字,首部是单首部的汉字,则依次取第1、第2个编码部件各1码、第3个编码部件2码;对于四个或四个以上的编码部件的汉字,有两种方案,方案之一,称之为顺序法,则依次取第1、第2、第3、第4个编码部件各1码,方案之二,称之为顺末法,则依次取第1、第2、第3、第末个编码部件各1码;对于三编码部件的组合首部的汉字,则依次取组合首部的第1、第2个编码部件各1码、余部那个编码部件2码;对于由四个或四个以上编码部件的组合首部的汉字,有两种取码方案,方案之一,称之为顺序法,则依次取汉字的第1、第2、第3、第4个编码部件各1码。方案之二,称之为顺末法,则依次取第1、第2、第3、第末个编码部件各1码;具体编码方法如下:
[0132] A、对于两个汉字组成的词语:有三种编码方案,方案之一,称之为首三法,则依次对第1、第2个汉字各取3码,方案之二,称之为首二末三法,则依次第1个汉字取2码,第2个汉字取3码,方案之三,称之为首二末四法,则依次取第1个汉字2码、第2个汉字取4码;
[0133] B、对于由三个汉字组成的词语:有五种编码方案,方案之一,称之为二二二法,则依次取词语的第1、第2、第3个汉字各取2码,方案之二,称之为二一二法,则依次取词语的第1个汉字2码、第2个汉字1码、第3个汉字2码,方案之三,称之为二一三法,则依次取词语的第
1个汉字2码、第2个汉字1码、第3个汉字3码,方案之四,称之为首一末三法,则依次取词语的第1、第2个汉字各1码、第3个汉字3码,方案之五,称之为首一末四法,则依次取第1、第2个汉字各1码、第3个汉字4码;
[0134] C、对于由四个汉字组成的词语:有四种编码方案,方案之一,称之为首二法,则依次取第1个汉字2码、第2、第3、第4个汉字各1码,方案之二,称之为首二末二法,则依次取第1个汉字2码、第2、第3个汉字各1码、第4个汉字2码,方案之三,称之为末二法,则依次取第1、第2、第3个汉字各1码、第4个汉字2码,方案之四,称之为末三法,则依次取第1、第2、第3个汉字各1码、第4个汉字3码;
[0135] D、对于由五个汉字组成的词语:有三种编码方案,方案之一,称之为首二法,则依次取第1个汉字2码、第2、第3、第4、第5个汉字各1码,方案之二,称之为末二法,则依次取第1、第2、第3、第4个汉字各1码、第5个汉字2码,方案之三,称之为各一法,则依次取第1、第2、第3、第4、第5个汉字各1码;
[0136] E、对于由六个或六个以上汉字组成的词语:有四种方案,方案之一,称之为首二法,则依次取第1个汉字2码、第2、第3、第4、第5个汉字各1码,方案之二,称之为首二末法,则依次取第1个汉字2码、第2、第3、第4、第末个汉字各1码,方案之三,称之为顺一法,则依次取第1、第2、第3、第4、第5、第6个汉字各1码,方案之四,称之为顺一末法,则依次取词语的第1、第2、第3、第4、第5、第末个汉字各1码;
[0137] 为了便于输入,降低重码率也可以通过数字键盘上常设的一些符号键或它们的组合,实现标点符号引导、英文大小写字母引导、结束引导、重码选择引导、空格引导、数字数值引导、切换汉字字集引导、手机原字母输入方式引导等功能。
[0138] 六、采用的键盘
[0139] 拼音类主副码数字型汉字、词语编码输入法都采用计算机通用键盘的数字小键盘或者手机、电话机的通用数字键盘或者相应的软键盘;
[0140] 拼音类主副码字母型汉字、词语编码输入法可以采用计算机通用键盘的字母键区以及其各种改进型键盘或者相应的软键盘;完成输入操作;
[0141] 七、运用输入操作
[0142] 对于数字型的运用输入操作方法,依次逐个数字逐个数字击数字键输入,达到汉字、词语的数字型码最大码长数,如果不足码长数,用结束键结束,或者输入显示框中显示的冠在所想输入的字、词前面的数字码;如果没有重码就完成输入,如有重码,再击重码选择键,完成输入;
[0143] 对于字母型的运用输入操作方法:依次逐个字母逐个字母击字母键输入,字母型汉字的码长不定、词语的最大码长数为6,如果不足码长数,用结束键结束,或者输入显示框中显示的冠在所想输入的字、词前面的数字码;如果没有重码就完成输入,如有重码,再击重码选择键,完成输入;
[0144] 有益的效果
[0145] 组合式拼音类主副码汉字、词语编码输入法与已有的汉字编码技术比较具有显著的有益效果。它充分利用人们已经掌握的汉字、汉语拼音、笔画等知识,对规范的汉字编码部件进行“定位”,赋于主、副1、副2、副3码,规则简单,便于记忆掌握,由于把拼音首字母类与非拼音首字母类的字、词输入可以组合在同一张码表中进行无切换输入,能够轻松地输入读不出音或读不准音的字、词,而且,它的重码率,大大低于拼音类的输入法,又提供了字母型、数字型的拼音首字母和非拼音首字母的组合式编码方法,因此具有理据性强、适用性广、易掌握、应用推广性好的优点。组合式拼音类主副码的字母型汉字、词语编码输入法,采用字、词、简码混合输入,字的最大码长设定为4,词的最大码长设定为6,在拼音首字母字、非拼音首字母字、拼音首字母词的混合输入时,把GB18030字库的字与GB/T15732—1995《汉字键盘输入用通用词语集》的全部词语再加《现代汉语词典》2002年增补本新增的词语,做在一张码表上,其输入的重码大都都没超出10个,而且有不少没有重码的,可以进行盲打输入。

附图说明

[0146] 附图1是组合式拼音类主副码字母型汉字编码输入法用的《字母键盘面打字键区键位布置结构示意图》。图中表明每个字母键位上分配的31个高频编码部件方案的高频编码部件和其在汉字中主部位的位置,键位上的字母就是拼音类该高频编码部件的字母型主码;
[0147] 附图2是组合式拼音类主副码数字型汉字编码输入法用的8键位1数字码替代多字母码数字键盘盘面键位布置结构示意图之一;
[0148] 附图3是本发明数字型汉字编码输入法用的10健位1数字码替代多字母码数字键盘盘面键位布置结构示意图之一;
[0149] 附图4是本发明数字型汉字编码输入法用的8键位1数字码替代多字母码数字键盘盘面键位布置结构示意图之二;
[0150] 附图5是本发明数字型汉字编码输入法用的10键位1数字码替代多字母码数字键盘盘面键位布置结构示意图之二。
[0151] 具体实施方法:
[0152] 在汉字拆分时;取拆分编码部件笔画多的在先的那一种,具体汉字拆分采用通用拆分法;采用点折I法;字母型转换成数字型采用,字母笔画不同式转换方案;
[0153] 拼音类拼音首字母主副码字母型汉字、词语编码方法:对汉字编码,单个编码部件的汉字的编码:如果该汉字的拼音首字母与该编码部件的字母型主码相同的:对于是高频编码部件的,则依次取该编码部件的字母型主码、副码1,对于是普通编码部件的,采用三码法;如果该汉字的拼音首字母与该编码部件的字母型主码不相同的,又是高频编码部件的,采用三码法,如果该汉字的拼音首字母与该编码部件的字母型主码不相同的,又是普通编码部件的,而且字母型主码不是i的,也采用三码法;如果该汉字的拼音首字母为y而编码部件的字母型主码为i的,也采用三码法;对于由2个的编码部件组成的汉字:如果首部是高频编码部件,采用二码法;如果首部是普通部件,采用一二法;对于由3个或3个以上的编码部件组成的汉字:如果单首部是普通编码部件的,采用首二法,如果其首部为组合首部的汉字,采用首末法;其例字编码:女:NU;日:RI;山:SAA;鸟:NIP;马:MAZ;衣:YID;仙:XPA;伸:SPS;粑:BMBA;粃:BMBI;般:BZSU;哔:BKBS;愈:YRDX;鹚:CQIN;毂:GSCS;彀:GSGS;宝:BBYU;
岭:LARJ;纷:FLBD;竕:FLID;2字组词语采用二二法,3字组词语采用一一二法,4字组词语采用四码法,5字组词语采用五码法,6或6字以上个字组成的词语采用顺六法;例词语编码:太阳:TDYE;女工:NUGO;工作;GOZP;工资:GOZB;工种:GOZH;计算机:JSJU;一心一意:YXYY;技术鉴定会:JSJDH;国务院法制局:GWYFZJ;国务院外事办公室:GWYWSB;
[0154] 拼音类非拼音首字母主副码字母型汉字、词语编码输入法,码长不定,词语的最大码长设定为6;
[0155] 单个编码部件的汉字,如果是普通编码部件的,采用三码法;对于由2个的编码部件组成的汉字,如果首部是一个处于主部位的高频编码部件的,采用三码法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码,如果首部件编码部件是普通编码部件的,采用二二法;对于由3个编码部件组成的汉字字母型编码方法:如果首部是一个单首部,又是一个处于主部位的高频编码部件的,采用末二法,则依次对首部的那个高频编码部件取1码,余码的第1编码部件取1码、余部的第2编码部件取2码;如果首部是一个单首部,又是一个普通编码部件的,采用首二法,则依次对首部的那个编码部件取2码,余部的第1、第2编码部件各取1码;对于由4个或4个以上编码部件组成的汉字字母型编码方法:如果首部是一个单首部,又是一个普通编码部件的,采用首二法;如果首部是组合首部的,采用组合首部首、次、末取码法;其例字编码:女:NU;鸟:NIP;马:MAZ;顮:BHBY;毂:SMCS;嗀:SMKS;彀:SMGS;殻:SMJS;宝:BAYU;哔:KBSI;呗:KBE;呝:KHII;凒:BIAD;岭:ARDJ;岺:AARJ;峻:AMBZ;馂:
SIMZ;褰:BANI;堂:XAMT;謍:HHMI;骥:MABB;益:QABM;充:TOME;会:REEM;云:ERMO;对一个汉字取2码:如果是单个编码部件的字,则依次取该编码部件的字母型主码、副码1;如果是由二个或二个以上编码部件组成的汉字,采用首余法,即依次取该汉字的首部的第1个编码部件字母型主码、余部的第1个编码部件的字母型主码;对于由2个汉字组成的词语编码,采用二二法;对于由3个汉字组成的词语,采用末二法;对于由4个汉字组成的词语编码,采用四码法;例词语编码:一心一意:YXYI;太阳:DDER;女工:NUGO;工作;GOPZ;工资:GOBB;编码:
LHSM;工种:GOHZ;计算机:IZUJ;技术鉴定会:EUDBR;国务院法制局:WZEDZS;国务院外事办公室:WZEXSL;
[0156] 拼音类基于拼音首字母主副码数字型汉字、词语编码输入法,最大码长设定为6;字母型码转换成数字型码,采用“字母笔画不同式转换方案”,采用“8键位汉语拼音字母键位设定”,由表6所示的“‘字母笔画不同式转换方案’的高频编码部件的拼音类数字型主、副码1、副码2、副码3,用数字键盘的相应的数字键依次表达,31个高频编码部件方案的高频编码部件音笔类数字型主副码”;对一个汉字取3码:如果是单个编码部件的汉字,采用补足法;如果是组合首部的汉字,采用首余法,依次取该汉字的第1、第2个数字型编码、该汉字的余部那个编码部件的数字型主码;对一个汉字取4码:如果是单个编码部件的汉字,采用补足法:如果是两个编码部件的汉字,采用补足法,取其拼音首字母的数字码、第1、第2个编码部件的数字型主码、第2编码部件的数字型副码1;如果是三个或三个以上编码部件的汉字,则取拼音首字母的数字型码、第1、第2、第3个编码部件的数字型主码;
[0157] 对单个编码部件的汉字的编码:对于高频编码部件,如果其拼音首字母数字型码与该高频编码部件的数字型主码不相同的,采用拼首法;对于普通编码部件的汉字,其拼音首字母的数字型码与该编码部件的数字型主码相同的,与不相同的,都采用三码法;对于由2个编码部件组成的汉字:如果第1编码部件是高频编码部件,采用首二末二法,如果第1个编码部件是普通编码部件,采用首三末二法;对于由3个编码部件组成的汉字,如果首部是单首部,又如果第1个编码部件为处于主部位的高频编码部件,采用首二法;如果首部是单首部,又如果第1编码部件是普通编码部件的,采用首三法;如果首部是组合首部的汉字,采用余二法;对于由四个编码部件组成的汉字,如果首部是单首部,又如果第1个编码部件为处于主部位的高频编码部件,采用首二法;如果首部是单首部,又如果第1编码部件是普通编码部件的,采用首三法;如果首部是组合首部的汉字,采用余二法;对于由五个或五个以上编码部件组成的汉字:如果首部是单首部,又如果第1个编码部件为处于主部位的高频编码部件,采用首二法;如果首部是单首部,又如果第1编码部件是普通编码部件的,采用首三法;如果首部是组合首部的汉字,采用前四法;
[0158] 其例字编码:女:66;山:722;鸟:643;宝:222498;哔:25627;峻:522629;馂:574369;呗:25622;览:53952;赣:447942;嗀:476457;
[0159] 词语编码,对于两个汉字组成的词语:采用首三法;对于三个汉字组成的词语,采用二二二法;对于由四个汉字组成的词语:采用首一末二法;对于由五个汉字组成的词语:采用各一法;对于由六个或六个以上汉字组成的词语,采用顺一法;例词语编码:一心一意:
99994;太阳:833937;女工:665461;治愈:936974;计算机:547958;技术鉴定会:57534;国务院法制局:499395;国务院外事办公室:499972;中国人民政治协商会议:947699。