汉字输入与汉字识字教学相整合方法转让专利

申请号 : CN201010504739.8

文献号 : CN101957664B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郑远泾王兰芝范争郑嘉蕾

申请人 : 王兰芝范争郑嘉蕾郑远泾

摘要 :

本发明由“汉字层次解析编码输入方法、词语编码输入方法、符号编码输入方法”组成。以28个汉字基本笔画、297个成字和非成字为汉字的基本部件;按《现代汉语通用字笔顺规范》将汉字解析为不同层次的部件集合;取每一层次的第一个部件的码元为第一码元,取每一层次的第二个部件和最后一个部件的码元为第二码元,汉字编码模式为“第一码元+第二码元+汉字的音码=汉字全码”;设置了“汉字字音查询、字音和模糊字音查字、汉字层次解析编码查询、汉字基本部件动态组合演示”功能。以词语的首字与其余汉字的音码组合的词语编码输入;设置了“字词查询检索、词语释义查询检索”功能;对434个符号命名实施全称和简称编码。

权利要求 :

1.一种汉字输入与汉字识字教学相整合的方法,其特征在于:(1)汉字汉语拼音以“a、b、c、ch、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、sh、t、w、x、y、yu、z、zh”开头的27个字母或字母组合为汉字的音码;

(2)汉字的基本部件:以28种基本笔画、297个成字和不能再解析的交连笔画集合的非成字作为汉字的基本部件;

(3)汉字基本部件的命名及其码元设置:

1)28种基本笔画分为“横、竖、勾、撇、点、捺、折、复折”八类,以基本笔画的类别名称为其名称,名称的首字音码为码元:“一或 ”的类别名为“横”,因此,“一或 ”的名称为“横”,码元为“h”;

“丨”的类别名为“竖”,因此,“丨”的名称为“竖”,码元为“sh”;

“亅”的类别名为“钩”,因此,“亅”的名称为“钩”,码元为“g”;

“丿”的类别名为“撇”,因此,“丿”的名称为“撇”,码元为“p”;

“、”的类别名为“点”,因此,“、”的名称为“点”,码元为“d”;

“ 或 ”的类别名为“捺”,因此,“ 或 ”的名称为“捺”,码元为“n”;

只有一个“折”的基本笔画,命名为“折”,码元为“zh”;

有两个或两个以上“折”的基本笔画,命名为“复折”,码元为“f”;

2)成字基本部件的命名及其码元:

在成字基本部件中,有常用字基本部件、生僻字基本部件和多音字基本部件:①常用字基本部件的名称及其码元:

常用字基本部件以其本字作为名称,其音码为码元;

②生僻字基本部件的名称及其码元:

生僻字基本部件以其本字作为第一名称,其音码为第一码元;

有传统名称的生僻字基本部件,以传统名称为第二名称,第二名称的首字音码为第二码元;

③无传统名称的生僻字基本部件,以顺序书写生僻字的基本笔画的名称组合加“部”字为其第二名称,第二名称的首字音码为第二码元;

④多音字基本部件的名称及其码元:

根据多音字基本部件的不同的音码,设置不同的码元;

3)非成字基本部件的命名及其码元:①具有传统名称的非成字基本部件的名称即为其传统名称,名称的第一个汉字的音码为其码元;

②无名称的非成字基本部件采用“笔画组合”命名,即:用顺序书写无名称非成字部件 的基本笔画的名称组合加“部”字为其名称,名称的第一个汉字的音码为其码元;

(4)按《现代汉语通用字笔顺规范》对汉字实施书写解析,将汉字定义为是顺序书写的不同层次的部件的集合;汉字可分为单层次书写结构和多层次书写结构两种书写结构:

1)按《现代汉语通用字笔顺规范》,单层次书写结构的汉字只能解析为顺序书写的基本部件的集合,这些基本部件在汉字的书写解析过程中,不能组合为合体字,单层次书写结构的汉字只能解析为一个层次的基本部件的集合;

2)按《现代汉语通用字笔顺规范》,多层次书写结构的汉字可解析为不同层次的部件的集合;

(5)汉字书写层次解析编码

①按《现代汉语通用字笔顺规范》,将汉字解析为不同层次的部件集合;

②每一层次的部件集合中的第一个部件为汉字编码的第一部件,第一部件的码元为汉字编码的第一码元;

③同一层次部件集合中的第二个汉字部件或最后一个汉字部件为汉字编码的第二部件,第二部件的码元为汉字编码的第二码元;

④“第一码元+第二码元+汉字音码=汉字全码”为汉字编码模式;

(6)汉字字音查询功能、字音和模糊字音查字功能、汉字层次解析编码查询功能、汉字层次解析基本部件的动态书写组合演示查询功能:

1)汉字字音查询功能

①用鼠标或“Shift+→[光标移动键]”选中所需查询的汉字;

②将光标移至所选汉字之上,或用鼠标点击输入状态栏中的“查询”,系统都能给出所选汉字的字音;

2)汉字层次解析编码查询功能

①用鼠标或同时按下“Shift+→”键,选中需查询的汉字;

②用鼠标点击输入状态栏中的“查询”后,系统显示:③用鼠标点击“层次编码”,系统即给出被查字的字音、层次解析和编码及其注释;

3)汉字基本部件的动态书写组合的演示功能①用鼠标或同时按下“Shift+→”键,选中需查询的汉字;

②用鼠标点击输入状态栏中的“查询”后,系统显示:③用鼠标点击“动态书写”,系统即给出被查字的基本部件动态书写组合的过程;

(7)词语输入方法

词语分为两字词语和多字词语两种:

1)两字词语编码输入方法

两字词语的编码为“首字·x”,其中:①“首字”是两字词语的第一个汉字;

②“·”为“F1、F12、Shift”三键中的任一键;

③“x”为两字词语第二个汉字的音码;

两字词语输入的操作步骤:

①输入两字词语的首字;

②输入“F1、F12、Shift”三键中的任一键,进入输入两字词语第二个汉字音码的状态;

③输入两字词语第二个汉字的音码,至此,系统给出所有的首字相同、第二个汉字音码相同的两字词语,用户可用“=”键翻屏,键选所需的两字词语;

2)多字词语编码输入方法

多字词语的编码为“首·xy”,其中:①“首字”是多字词语的第一个汉字;

②“·”为“F1、F12、Shift”三键中的任一键;

③“x”为多字词语第二个汉字的音码,“y”为多字词语的第三个汉字或最后一个汉字的音码;

多字词语输入的操作步骤:

①输入多字词语的首字;

②输入“F1、F12、Shift”三键中的任一键,进入输入多字词语第二个汉字音码的状态;

③输入多字词语第二个汉字的音码“x”,进入输入多字词语的第三个汉字或最后一个汉字的音码的状态;

④输入多字词语的第三个汉字或最后一个汉字的音码“y”;

3)字词查询检索功能

①用鼠标或同时按下“Shift+→”键,选中需查询的词语的首字;

②用鼠标点击输入状态栏中的“查询”后,系统显示:③用鼠标点击“汉字词语”,系统即分屏列出以被选字为首字的全部词语;

此时,用户检索所需要的词语,翻屏找到所需词语,键入相应的数字键完成所需词语的输入,按空格键,系统则退出词语查询检索状态;

4)词语释义查询检索功能

词语释义查询检索的操作方法和步骤是:①用鼠标或同时按下“Shift+→”键,选中需查询的词语;

②用鼠标点击输入状态栏中的“查询”后,系统显示:③用鼠标点击“汉字词语”;

完成上述操作后,系统即给出被选词语的释义;

(8)符号输入方法

1)以符号的中文名称,符号读音的中文译音,符号的含义,符号的结构特征对符号进行命名;

2)按符号是否是字母类的属性,将符号分为字母类符号和非字母类符号两大类,以“a、 e、u、v”四个字母中的任一个字母作为字母类符号的类别标志码元;其余三个字母中的任一字母为非字母类符号的类别标志码元,用户自行确认了二个符号类别标志码元后,系统即自动确认,同时确认其余两个字母不作为符号的类别标志码元使用;

3)按符号名称的汉字个数将符号分为一字名称符号、两字名称符号和多字名称符号:①多字名称符号取其名称的前两个汉字为简称;

②具有两层含义的多字名称符号,取其两个含义的汉字为简称;

4)一字名称符号的编码输入:符号名称的汉字音码和两个符号类别标志码元三个字母组合为一字名称符号的编码;

5)两字名称符号的编码输入:符号名称的两个汉字的音码和一个符号类别标志码元三个字母组合为两字名称符号的编码;

6)多字名称符号的编码输入:多字名称符号的编码输入有全称编码输入和简称编码输入两种方法 ,多字名称符号的全称编码输入:多字名称符号名称的前三个汉字的音码组合为多字名称符号的编码;

多字名称符号的简称编码输入:用多字名称符号的简称的前两个汉字的音码和一个符号类别标志码元三个字母组合为多字名称符号的编码。

说明书 :

汉字输入与汉字识字教学相整合方法

[0001] 第一部分 技术领域
[0002] 本发明属中文信息处理领域。
[0003] 第二部分 背景技术
[0004] 在我国,汉字的计算机输入已经有三十多年的历史了。现在我国的汉字输入的现状是:
[0005] 1.有96%以上的用户采用微软拼音、搜狗拼音等完全抛弃汉字字形的音码输入汉字;
[0006] 2.在中小学,广大师生仍然采用音码输入汉字。汉字识字教学与汉字输入仍然呈“两张皮”的局面,没有实现汉字输入与汉字识字教学相统一。
[0007] 然而,众所周知,汉字是以形为主、以音为辅,形音义为一体的形音字。人们识别和应用汉字,遵循的是从形出发、以形为主、以音为辅的汉字认知规则。汉字识字教学的主要任务是使学生正确地识别汉字的字形,正确地书写汉字,掌握汉字的字音,理解汉字的字义及其词语的文化内涵。
[0008] 研究我国的汉字编码史表明,在我国最先出现的是形码或以形为主的汉字编码。在上世纪80~90年代的“万码奔腾”时期,形码和以形为主的汉字编码是主力军。其中有许多优秀的形码或以形为主的汉字编码的单字输入的重码率远远低于音码,而词语输入的上屏率、准确率远远高于音码。然而,仅仅十几年时间,这些形码或以形为主的汉字编码便烟消云散,音码却迅速崛起,形成了今天音码一统天下的局面。这就是我国近三十年来的汉字编码发展史。这部汉字编码的发展史给我们的启迪是:
[0009] 1.音码之所以迅速崛起,形成了一统天下的局面,其原因是,对于只会输入汉字模糊字音(无声调的汉字拼音字母组合)的用户,它是一种“无记忆、无障碍”的汉字输入方法。这是音码相对于形码或以形为主的汉字编码的绝对优势;
[0010] 2.形码或以形为主的汉字编码,至今还未实现汉字编码符合中国人对汉字的认知理念;不符合汉字识字教学规范;还未解决汉字识字教学的需求。因此不能应用于汉字识字教学;
[0011] 3.汉字编码要实现汉字输入与汉字识字教学相统一,应用于汉字教学,被广大用户所接受。不仅要使其编码实现科学性、规范性、实用性相统一,还必须实现汉字的“无记忆、无障碍”输入,这是汉字编码必须要实现的前提;
[0012] 4.迄今为止,汉字的解析方法和汉字的基本部件及其称谓(命名)是制约形码或以形为主的汉字编码实现“无记忆、无障碍”输入的两大技术难题,是造成形码或以形为主的汉字编码烟消云散的主要原因。
[0013] 本发明是以实现汉字输入的科学性、规范性、实用性相统一;汉字输入与汉字识字教学相统一,进而实现汉字输入与汉字识字教学相整合为目标。
[0014] 第三部分 本发明内容
[0015] 为实现汉字输入与汉字识字教学相整合的目标,汉字编码要为汉字识字教学提供:
[0016] 一、汉字与符号输入应用系统
[0017] “汉字与符号输入应用系统”是实现汉字输入与汉字汉字识字教学相整合的基础,系统有如下5个子系统组成:
[0018] 1.汉字层次解析编码输入子系统;
[0019] 2.汉字字音编码输入子系统;
[0020] 3.词语编码输入子系统;
[0021] 4.符号编码输入子系统;
[0022] 5.汉字模糊字音查询输入子系统。
[0023] 二、中文信息查询检索系统
[0024] 中文信息查询检索系统由如下4个子系统组成:
[0025] 1.汉字字音查询检索子系统;
[0026] 2.汉字层次解析编码输入查询检索子系统;
[0027] 3.汉字基本部件解析子系统;
[0028] 4.汉字词语查询检索子系统。
[0029] 三、汉字基本部件解析和汉字动态书写系统
[0030] 第四部分 具体实施方式
[0031] 一汉字与符号输入应用系统实施方式
[0032] (一)汉字层次解析编码输入子系统实施方式
[0033] 如前所述,汉字是以形为主,以音为辅的形音字。因此,汉字编码要体现汉字的文化内涵,符合中国人对汉字的认知理念,才能实现与汉字识字教学相整合的目标。汉字识字教学需要以形为主,以音为辅的形音码的汉字编码输入法。为此,本发明:
[0034] 1.汉字的音码
[0035] 汉字汉语拼音以“a、b、c、ch、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、sh、t、w、x、y、yu、z、zh”开头的27个字母或字母组合为汉字的音码。如:
[0036] “a”是“阿[ā]、爱[ài]、安[ān]、昂[áng]、傲[ào]……”等字的音码;
[0037] “c”是“慈[cí]、从[cóng]、藏[cáng]、策[cè]、错[cuò]……”等字的音码;
[0038] “ch”是“察[chá]、畅[chàng]、成[chéng]、春[chū n]……”等字的音码。
[0039] 2.汉字部件和汉字基本部件
[0040] 一切构成汉字的笔画、成字以及不能再解析的交连笔画的集合体,均为汉字的书写层次解析的部件。对《通用规范汉字表》的8300个汉字进行书写层次解析后,得出28个基本笔画,297个汉字基本部件。
[0041] 28个基本笔画分为“横、竖、勾、撇、点、捺、折、复折”八类。基本笔画的类别名称为同类笔画的名称。28个基本笔画、名称及其码元见附表1。
[0042] 297个汉字基本部件、名称及其码元见附表2。
[0043] 3.基本部件的命名
[0044] ①常用字基本部件:以其本字作为名称,其音码为其码元。如:
[0045] “口[kǒ u]”的名称就是“口”,其音码为“k”,因此,“k”是“口”的码元。
[0046] ②多音字成字部件:根据多音字部件的不同的音码,设置不同的码元。如:
[0047] “隹”有[zhuī/weī cuī]三个字音,“隹”有三个音码“zh、w、c”。因此,“隹”有“zh、w、c”三个码元。
[0048] ③具有传统名称的非成字基本部件:其名称即为传统名称。名称的第一个汉字的音码即为码元。如:
[0049] “宀、艹、扌”的名称分别为“宝[bǎ o]盖儿、草[cǎ o]字头、提[tí]手旁”,其音码分别为“b、c、t”,因此,“宀、艹、扌”的码元分别为“b、c、t”。
[0050] ④无名称的非成字基本部件:采用“笔画名称组合法”命名。即以顺序书写基本部件的笔画名称的集合与其在所构汉字中的位置为其名称。如果在所构的不同汉字中的位置,不具有唯一性,则以其笔画名称的集合与“部”为其名称。名称的第一个汉字的音码为码元。如:
[0051] “亠”的顺序书写的笔画是“丶一”,笔画名称的集合是“点横”,“亠”位于“六、京、高、玄…”等字的头部。因此,“亠”的名称为“点横头”,码元为“d”。
[0052] 的顺序书写的笔画是“一一丨”,笔画名称的集合是“横横竖”; 位于“击、举、奉……”等字的不同位置,因此, 命名为“横横竖部”。
[0053] ⑤非常用字、生僻字基本部件:以其本字为第一名称,其字音为第一码元。有传统名称的,以传统名称为其第二名称,名称的第一个字的字音为第二码元;无传统名称的,以“笔画名称组合法”命名为第二名称,名称的第一个字的字音为其第二码元。如:
[0054] “攵[pū]”有传统名称“反[fǎn]文”,因此“攵[pū]”为“攵”的第一名称,“p”为第一码元;“反文”是“攵”的第二名称,“f”为第二码元;
[0055] “[zuǒ]”无传统名称,因此“[zuǒ]”为“”的第一名称,“z”为第一码元;“”的笔画名称组合命名“横撇头”为第二名称,“h”为第二码元。
[0056] 4.汉字的层次解析和层次编码
[0057] 不同的汉字解析方法,对汉字结构的认知不同。因而对汉字基本部件的选取和基本部件的命名方法不同。
[0058] 1)传统的汉字结构理据及其解析的弊端
[0059] 传统的汉字结构理据是将汉字分为“上下结构、左右结构、全包结构、半包结构、镶嵌结构、独体结构”,主张汉字结构解析。这种结构理据和结构解析方法有如下弊端:
[0060] ①基本部件太多:结构解析必然要将500多个笔画间具有交连关系的常用字、非常用字、生僻字、交连的笔画集合作为基本部件。如《信息处理用GB13000.1字符集汉字基本部件规范》有650个基本部件;《现代汉语常用字部件及部件名称规范》有512个基本部件。用户难鉴别、难记忆,难以用于汉字编码,即使勉强用于汉字编码,其编码也必然难记、易忘;
[0061] ②非常用字、生僻字、非成字部件命名的歧义性大记忆难度大:这些部件大都采用“借助法”命名,即借助这些部件构建的汉字中的“某字”及部件所在的位置,冠以“某字‘头、底、旁、边、框、左角、右角、下角、心、腰、省’”等进行命名。如,《现代常用字部件及部件名称规范》的512个基本部件中,以“借助法”命名的部件有129个。“借助法”命名的歧义性大,记忆难度大。如“亠”命名为“玄字头”(见《现代常用字部件及部件名称规范》),然而,在2009年7月颁布的《通用规范汉字表》的8300个汉字中,以“亠”为首部件的汉字有“六、亢、、亩、弃、亦、京、享、夜……”等54个。因此,将“亠”命名为“玄字头”,以“亠”为首部件的其它汉字不仅具有“张冠李戴”的歧义性,而且难记、易忘;
[0062] ③许多汉字的解析违反汉字的书写规范:按结构解析理据,“臧”是包体为“戈”的半包结构汉字,“爿”是不可再解析的下限部件,因此,“臧”字只能解析为“戈、爿、臣”三个部件的集合(见《现代常用字部件及部件名称规范》)。又如,“藏”字只能解析为“艹、戈、爿、臣”四个部件的集合。显然,“臧、藏”实施结构解析,违反了笔顺规范,不利于汉字的书写教学,普通用户也难以掌握。
[0063] 2)书写层次解析的汉字结构特征
[0064] 本发明基于汉字书写是汉字识字教学的重要内容之一,普通用户对会识读的汉字都会书写的事实。从汉字识字教学和汉字输入二者兼顾的原则出发,遵循《现代汉语常用字笔顺规范》,确定并实施了汉字的“书写层次解析”:
[0065] ①汉字书写结构:从应用角度出发,除“囗、匚”两个具有表义作用的汉字基本部件外,将汉字的结构定义为“汉字是顺序书写的不同层次的部件的集合”。
[0066] ②汉字的书写层次解析:按书写笔顺规范,对汉字实施不同层次的书写解析,直至将汉字解析成基本部件的集合为止。因此,汉字的解析过程就是顺序书写汉字基本部件的动态过程。汉字的解析与汉字的书写相一致。
[0067] 3)汉字的书写结构特征:按汉字的书写层次解析理据,汉字具有“多层次书写结构、单层次书写结构,交连书写结构、特殊结构”4种结构。
[0068] ①多层次书写结构:多层次书写结构的汉字,至少有一个部件是合体字部件。因此,必须进行多层次书写解析,才能解析为汉字基本部件的集合。如:“读”可以顺序解析为“讠卖”、“讠十买”、“讠十乛头”、“讠十乛 大”4个层次的部件集合。其中,前三层解析的部件集合中,“卖、买、头”都是合体部件,只有进行第四层解析,“读”才解析成“讠十乛 大”基本部件的集合。多层次书写结构汉字的不同层次解析的部件集合和部件动态组合实例见表1。
[0069] 表1多层次书写结构汉字的不同层次解析、部件集合、部件动态组合实例一览表[0070]
[0071] ②单层次书写结构:单层次书写结构的汉字,在书写解析过程中不出现合体字部件。因此,只需进行一次解析即可将其解析为基本部件的集合。单层次书写结构汉字的解析、部件集合和部件动态组合实例见表2。
[0072] 表2单层次结构汉字的书写解析、部件集合、部件动态组合实例一览表
[0073]
[0074] ③交连书写结构:交连书写结构的汉字的特征是笔画间呈或交、或连的交连关系。在书写解析过程中,不出现多笔画构成的汉字部件,只能顺序解析成基本笔画的集合。见表
3。
[0075] 表3交连书写结构汉字的书写解析、基本笔画集合、基本笔画动态组合实例一览表
[0076]
[0077] ④特殊结构汉字的解析:“囗[wéi/guó]、匚[fā ng]”是全包结构汉字和半包结构汉字的包体。它们不是由连续书写的笔画构成,但在汉字识字教学中,将它们视为整体部件,普通用户也认可将其作为整体部件。因此,本本发明将它们作为整体部件使用,只对包体内的汉字进行层次解析。如:
[0078] “囚”解析为“囗人”;“因”解析为“囗大”;“圆”解析为“囗员、囗口贝”;
[0079] “匠”解析为“匚斤”;“匡”解析为“匚王”;“匮”解析为“匚贵、匚中一贝”。
[0080] 4)汉字书写层次解析编码
[0081] ①按《现代汉语通用字笔顺规范》,将汉字解析为不同层次的部件集合;
[0082] ②每一层次的部件集合中的第一个部件为汉字编码的第一部件,第一部件的码元为汉字编码的第一码元;
[0083] ③同一层次部件集合中的第二个汉字部件,或最后一个汉字部件为汉字编码的第二部件,第二部件的码元为汉字编码的第二码元;
[0084] ④“第一码元+第二码元+汉字音码=汉字全码”为汉字编码模式。
[0085] 如:“我”字的音码是“w”;“我”解析为“丿一亅ˊ 丿、”。“丿”为“我”字汉字编码的第一个部件,“丿”的码元“p”为“我”字汉字编码的第一码元。“一”和“丶”均为“我”字汉字编码的第二部件,“h”和“d”均为“我”字汉字编码的第二码元。因此:“我”字有[丿一我phw]和[丿丶我pdw]两个编码。输入“phw”或“pdw”均可完成“我”字的输入。
[0086] 同理,“京”的音码为“j”,解析为“亠口小”三个部件的集合,因此“京”字有[亠口京dkj]和[亠小京dxj]两个编码。输入“dkj”和“dxj”都可完成“京”字的输入。
[0087] 表4汉字层次解析编码实例
[0088]
[0089]
[0090] (二)汉字字音编码输入子系统
[0091] 汉字字音编码输入有两种方式;
[0092] 1.汉语拼音法汉字字音编码输入:即直接输入汉字的汉语拼音作为汉字字音输入的编码。本本发明在“符号编码输入子系统”中,对表征汉字字音的29个韵调符号“ā、á、ǎ、à、ū、ú、ǔ、ù……”实施了编码输入,可直接对汉字字音编码,完成所需汉字的输入。如:
[0093] “àn”为“岸、按、案…”等字的编码,输入“àn”完成“岸、按、案…”等字的输入;
[0094] “mǔ”为“母、牡、亩…”等字的编码,输入“mǔ”完成“母、牡、亩”等字的输入;
[0095] “zhě ng”为“诊、枕、”等字的编码,输入“zhě ng”完成“诊、枕、”等字的输入。
[0096] 2.声调符数字表示法汉字字音编码输入:将表征汉字“阴平、阳平、上声、去声”的声调符号“ˉ、ˊ、ˇ、`”分别用数字“1、2、3、4”表示,轻声用谐音数字“7”表示,将表示声调的数字标在汉字拼音字母组合的最后一个字母后面表示汉字的字音。即以拼音字母组合与数字为汉字的字音编码。如:
[0097] “an1”为“岸、按、案…”等字的编码,以“an1”来输入“岸、按、案…”等字;
[0098] “mu3”为“母、牡、亩…”等字的编码,以“mu3”来输入“母、牡、亩”等字;
[0099] “zheng3”为“诊、枕、”等字的编码,以“zheng3”来输入“诊、枕、”等字。
[0100] 表5是《小学生规范字典》的4452个字,采用“汉语拼音法汉字字音编码输入”和“声调符数字表示法汉字字音编码输入”的实例。
[0101] 表5汉字字音编码输入及其重码率实例
[0102]
[0103]
[0104] 由于现代汉语汉字的字音有1314个,因此,汉字字音编码输入子系统有1314个汉字字音编码。迄今为止,所有的音码都是以无声调的模糊字音作为汉字的编码。其实质是:将所有的汉字分为409个模糊字音组,造成汉字输入的静态重码率极大。用户必须在同一个模糊字音组中的数十个,甚至上百个同音字中查找所需汉字完成输入。易使用户对汉字字音产生模糊读音。汉字字音编码输入与搜狗拼音和微软拼音等音码相比,不仅具有重码率低,而且不会导致用户对汉字产生模糊性的优点。
[0105] 如在表5中,“出、初、刍、除、厨、锄、蜍、雏、橱、躇、处、杵、础、储、楚、亍、处、怵、绌、畜、搐、触、矗”等23个汉字,采用模糊字音“chu”编码输入,不仅易导致用户对上述汉字的字音产生模糊读音,而且重码率高。而采用汉字字音编码输入,用汉语拼音或用“chu1、chu2、chu3、ch4”将上述汉字分为“出、初”、“刍、除、厨、锄、蜍、雏、橱、躇”、“处、杵、础、储、楚”、“亍、处、怵、绌、畜、搐、触、矗”四个字音编码组,不仅不会导致用户对上述汉字产生模糊读音,而且重码率很低。
[0106] (三)词语编码输入子系统
[0107] 汉字词语有两字词语和多字词语之分:
[0108] 1.两字词语输入
[0109] 两字词语的词语代码是“首字·x”。其中:“首字”:两字词语的第一个汉字;
[0110] “·”:点击“F1、F12、Shift”三键中的任一键;“x”:两字词语第二个汉字的音码。如,输入词语“定量”,操作如下:
[0111] ①输入词语第一个汉字“定”;
[0112] ②点击“F1”键(或F12或Shift键);
[0113] ③输入词语第二个汉字“量”的音码“1”,输入状态栏内显示:
[0114]1.定理;2.定律;3.定量
[0115] ④键入“3”,即完成两字词语“定量”的输入。如采用上述操作方法输入“定理”,则键入空格键或数字“1”即可。
[0116] 2多字词语的词语输入
[0117] 多字词语的词语代码是:“首字·xy”。其中,“首字”:多字词语的第一个汉字;“·”:点击“F1、F12、Shift”三键中的任一键;“x”:多字词语第二个汉字的音码;“y”:多字词语其余汉字中任意一个汉字的音码。如,输入词语“定量分析”,其操作步骤如下:
[0118] ①输入词语第一个汉字“定”;
[0119] ②点击“F1”键(或F12或Shift键);
[0120] ③输入“定量分析”的第二个汉字的音码“1”,第三个汉字的音码“f”或第四个汉字的音码“x”,即完成多字词语“定量分析”的输入;
[0121] 因为首字相同的两字词语、多字词语的数量是有限的,一般只有几十个,多则百十个。因此,采用词语的首字与词语中其它汉字的音码组合的方式输入词语,经检测表明,准确率100%;多字词语自动上屏率为96.7%(无键选或空格键确认);
[0122] (四)符号编码输入子系统
[0123] “符号编码输入子系统”的符号编码输入法:
[0124] 1.根据无名称符号的读音、含义、结构特征进行全称命名,取名称的两字为其简称。如:
[0125] “△、%、//、≥”等数理符号的全称分别为“三角形、百分号、平行于、大于等于”。简称分别为“三角、平行、大等”。
[0126] “ā、á、ǎ、à”现代汉语的韵调符号分别命名为“阿一声、阿二声、阿三声、阿四声”,简称为分别为“阿一、阿三、阿三、阿四”。
[0127] 2.符号分为字母类和非字母类两大类,以“a、e、u、v”四个字母中的任意二个字母分别作为字母类符号和非字母类符号的符号类别标志码,用户自行确认了二个符号类别标志码后,系统即自动确认,同时确认其余两个字母不作为符号类别标志码使用。如,选择了“u”为字母类符号的标志码,“v”为非字母符号的标志码后,“a、e”便不作为符号类别标志码。
[0128] 3.一字符号的编码:符号名称的汉字音码和两个符号类别标志码三个字母组合,为一字符号的编码。如,选择了“u”为字母类符号的类别标志码,“v”为非字母符号的类别标志码后,字母类符号“π(派)、ρ(柔)、τ(陶)”的编码分别为“puu、ruu、tuu”。非字母类符号“°(度)、′(分)、″(秒)”的编码分别为“dvv、fvv、mvv”。
[0129] 4.两字符号编码:符号名称的两个汉字的音码和一个符号类别标志码三个字母组合,为两字符号的编码。如,选择了“u”为字母类符号的类别标志码,“v”为非字母符号的类别标志码后,字母类符号“γ(咖码)、η(衣塔)、δ(待塔)”的编码分别为“gmu、ytu、dtu”。非字母类符号“[;(分号)]、@(埃塔)、¢(美分)”的编码分别为“fhv、atv、mfv”。
[0130] 5.多字符号编码:多字符号编码有符号全称编码和符号简称编码两种:
[0131] ①符号全称编码:用符号名称的前三个汉字的音码组合为多字符号的编码;
[0132] ②符号简称编码:用符号名称中的两个汉字作为多字符号的简称,符号简称的两个汉字的音码和一个符号类别标志码三个字母组合为多字符号的编码。如以“u”为字母类符号的标志码,“v”非字母类标志码。则字母类符号:
[0133] “á”全称“阿二声”,简称“阿二”,全称编码为“aesh”,简称编码为“aeu”;
[0134] “ε”全称“艾普西隆”,简称“艾普”,全称编码为“apx”,简称编码为“apu”。
[0135] 非字母类符号:
[0136] “△”全称“三角形”,简称“三角”,全称编码为“sjx”,简称编码为“sjv”;
[0137] “≥”全称“大于等于”,简称“大等”,全称编码为“dyud”,简称编码为“ddv”。
[0138] 本本发明的434个符号的名称、简称、全称编码、简称编码见附表3。
[0139] (五)汉字模糊字音查询输入子系统
[0140] 为解决不知字形又不知准确字音、只知模糊字音的汉字输入。本本发明设置了汉字模糊字音查询输入系统。
[0141] 1.以汉字的模糊字音为汉字的编码
[0142] 汉字的模糊字音是无声调的汉字拼音字母组合。现代汉语汉字的模糊字音有409个,以汉字的409个模糊字音为汉字的编码。将系统中的汉字按模糊字音分为409组,所有模糊字音相同的汉字归并在一个组,作为汉字输入系统中的汉字模糊字音查询输入的编码。
[0143] 2.模糊字音查询输入操作方法
[0144] 本本发明设置了“切换法”和“分步法”两种模糊字音查询输入。
[0145] 1)切换法
[0146] 模糊字音查询输入的“切换法”操作是在当前输入系统状态下:
[0147] ①点击“F3”键,切换到模糊字音查询输入状态;
[0148] ②输入所需汉字的模糊字音;
[0149] ③用“=、-”或“Pgdn、Pgup”前后翻屏查询检索所需输入的汉字;
[0150] ④完成汉字输入后,系统自动返回当前输入系统状态下。
[0151] 如,用模糊字音“chu”查询输入“搐”字。操作步骤如下:
[0152] ①点击“F3”键,切换到模糊字音查询输入状态;;
[0153] ②输入模糊字音“chu”,屏幕显示模糊字音相同的第一屏汉字:
[0154]1.出 2.初 3.刍 4.除 5.厨 6.锄 7.蜍 8.雏 9.橱 0.躇
[0155] ③第一屏显示的汉字中没有“搐”字,用“Pgdn”翻屏,直到屏幕显示:
[0156]1.搐 2.触 3.矗
[0157] 此时,用户可点击“空格”键,也可点击数字键“1”,键选上屏,完成“搐”字输入。完成“搐”输入后,系统自动返回当前输入系统状态。
[0158] 2)分步法
[0159] 模糊字音查询输入的“分步法”操作是在当前输入系统状态下:
[0160] ①输入所需输入汉字的模糊字音;
[0161] ②用鼠标点击系统输入状态栏中的“查询”,系统屏幕显示所有模糊字音相同的汉字;
[0162] ③翻屏键选完成所需汉字输入。如果,所查询的汉字在第一屏没有,用“=、-”或“Pgdn、Pgup”前后翻屏查询检索所需输入的汉字。
[0163] 如,用模糊字音“chu”查询输入“怵”字,操作步骤如下:
[0164] ①输入模糊字音“chu”;
[0165] ②用鼠标点击系统输入状态栏中的“查询”,系统即显示第一屏:
[0166]1.出 3.初 3.刍 4.除 5.厨 6.锄 7.蜍 8.雏 9.橱 0.躇
[0167] 第一屏没有“怵”字,用“=”后边翻屏,直至查询查到:
[0168]1.处 2.杵 3.础 4’储 5.楚 6.亍 7.处 8.怵 9.绌 0.畜
[0169] 点击数字键“8”,即完成“怵”字的输入。
[0170] 二、中文信息查询检索系统
[0171] 中文信息查询检索系统是汉字识字教学必备的系统。其作用是替代汉字教学中,师生必备的字典、词典,乃至成语词典等,用于查询汉字字音、字义、构词、词语、词语释义以及汉字的解析和汉字动态书写等中文信息。因此,本本发明的中文信息查询检索系统由“汉字字音”、“汉字词语”、“汉字层次解析编码”、“汉字动态书写”四个查询检索子系统组成。
[0172] 其中:
[0173] 汉字词语查询检索子系统:由“字词查询检索”和“词语查询检索”两个模块组成;
[0174] 解析查询检索子系统:由“汉字层次解析编码查询检索”和“汉字基本部件解析查询检索”两个模块组成。
[0175] 系统设置了中文信息查询检索视窗,点击输入状态栏的查询栏,进入中文信息查询检索视窗:
[0176]
[0177] (一)汉字字音查询检索子系统
[0178] 系统中的每一个汉字都标注字音,多音字标注其所有字音。汉字字音查询检索与本本发明的“汉字字音编码输入”不同,汉字字音编码输入是以汉字的汉语拼音为汉字的编码,输入汉字汉语拼音,完成所需汉字的输入,也是由汉字字音查询检索汉字的方法。而汉字字音查询检索系统是“由字查询和检索字音”。其查询检索方法有两种:
[0179] 1.光标法:如果只查被查汉字的字音,采用此方法,只需将鼠标的光标移到被查汉字的中央即可。如查询“隹”字的字音,将鼠标的光标移到“隹”字的中央,屏幕即显示出“隹”字的三个字音:1.zhuī 2.cuī 3.wéi
[0180] 2.视窗法:用于汉字字音的查询和检索。操作方法是:
[0181] ①选中被查字,如果光标在被查字的左边,用鼠标或“Shift+→[光标右移动键]”选中被查字,如果光标在被查字右边,用鼠标或“Shift+←[光标左移动键]”选中被查字;
[0182] ②点击输入法状态栏的“查询栏”进入“中文信息查询检索视窗”;
[0183] ③点击“中文信息查询检索视窗”中的“字音查询”,屏幕即显示出被查字的字音。
[0184] ④如果要检索被查字的字音,可用空格键或数字键确认,即检索出被查字的汉语拼音并以括号标记,置于被查字的右边。
[0185] 如,按上述步骤查询检索“隹”字的字音,完成前三步操作后,屏幕显示:
[0186]zhuī 2.cuī 3.wéi
[0187] 如按空格键,“隹”字右边即出现“隹”字的三个读音[zhu/cu/wéi]。
[0188] 如点击“2”,则选中“隹”的[cuī]字音。点击“3”,则选中“隹”的“[wéi]”字音。
[0189] (二)汉字词语查询检索子系统
[0190] 汉字词语查询检索子系统由“字词查询检索”和“词语查询检索”两个模块组合。
[0191] 1.字词查询检索模块:查询和检索以被查字为首字的所有词语,操作步骤如下:
[0192] ①选中被查字;
[0193] ②点击输入法状态栏中的“查询栏”,进入“中文信息查询检索视窗”;
[0194] ③点击“中文信息查询检索视窗”中的“词语查询检索视窗”;
[0195] ④点击“词语查询检索视窗”中的“字词查询检索”栏,系统即分屏显示出以被查字为首字的全部词语;
[0196] ⑤如果要检索以被查字为首字的全部词语,点击“空格键”,系统便将以被查字为首字的全部词语,按词语第二个汉字的音序,全部录入在用户文本中。如要检索其中的一条词语,则用翻屏和数字键选中即可。
[0197] 如,查以“中”字为首字的全部词语,按上述步骤操作后,屏幕即分屏列出以“中”字为首字的全部词语:
[0198]
[0199]
[0200] 如要选以“中”为首字的全部词语,则点击空格键,系统便将以被查字为首字的全部词语,按词语第二个汉字的音序,全部录入在用户文本中。如要检索“中庸”,则翻屏,找到“中庸”所在的显示屏次,点击数字键“6”即可;如要检索“中国工农红军”,则翻屏,找到“中国工农红军”所在的显示屏次,点击数字键“7”即可。
[0201] 2.词语查询检索模块:
[0202] 词语查询和检索操作步骤如下:
[0203] ①选中被查词语的首字;
[0204] ②点击输入法状态栏中的“查询栏”,进入“中文信息查询检索视窗”;
[0205] ③点击“中文信息查询检索视窗”中的“词语查询检索视窗”;
[0206] ④点击“词语查询检索视窗”中的“词语查询检索”栏,系统显示出被查词语的注释、应用范例、词语典故、词语来源等信息;
[0207] ⑤如果要检索被查词语的全部信息,则点击空格键即可。如果检索其中的一条信息,则点击相应的数字键即可。
[0208] 如,查询检索词语“中流”的信息,按上述步骤操作后,屏幕即显示出:
[0209]
[0210] 如果检索“中流”的全部信息,点击空格键,“中流:①水流的中央:中流砥柱;②中游:长江中流;③中等:中流社会”等词语注释和应用范例全部录入在用户的文本中。
[0211] 如果要选择“中流:水流的中央:中流砥柱”中的“中流”的词语注释和应用范例,点击数字键“1”即可。
[0212] 又如,按上述操作步骤,可以查询和检索“中流砥柱”的如下词语信息:
[0213]
[0214] (三)汉字解析查询检索子系统
[0215] 本系统包括“汉字层次解析编码查询检索”和“汉字基本部件解析查询检索”两个模块。
[0216] 1.汉字层次解析编码查询检索模块及操作方法:模块中包括系统中全部汉字的不同层次解析的部件集合,不同层次的汉字解析编码,不同层次的非常用字、生僻字和无名称的非成字基本部件的称谓等信息。操作步骤如下:
[0217] ①选中被查字;
[0218] ②点击输入法状态栏中的“查询栏”,进入“中文信息查询检索视窗”;
[0219] ③点击“中文信息查询检索视窗”中的“解析查询检索视窗”;
[0220] ④点击“解析查询检索视窗”中的“解析编码视窗”;
[0221] ⑤点击“解析编码视窗”的“层次解析编码”栏,系统即分屏显示被查字的层次解析和编码的全部信息;
[0222] ⑥如检索被查字的层次解析和编码全部信息,点击空格键即可。如要检索出其中一条信息,则点击相应的数字键即可。
[0223] 如,查询检索“橘”字的层次解析和编码信息,按上述步骤操作后,系统即显示出“橘”字的层次解析和编码的全部信息:
[0224]
[0225] 其中:“1.”是“橘”字的不同层次解析的部件集合;
[0226] “2.”是“橘”字的不同层次解析编码;
[0227] “3.”是“橘”字的不同层次解析的非常用字基本部件的字音。
[0228] 检索“橘”字的全部信息,点击空格键即可。检索“橘”字的不同层次解析的部件集合信息,点击数字键“1”即可。其他信息检索亦然。
[0229] 同理,按上述操作可检索出“鳞”字的如下层次解析和编码信息:
[0230]
[0231] 2.汉字基本部件解析查询检索模块及操作步骤
[0232] 本模块包括汉字解析成基本部件的集合、基本部件称谓及其码元等信息。操作步骤如下:
[0233] ①选中被查字;
[0234] ②点击输入法状态栏中的“查询栏”,进入“中文信息查询检索视窗”;
[0235] ③点击“中文信息查询检索视窗”中的“解析编码查询检索视窗”;
[0236] ④点击“解析编码查询检索视窗”中的“解析编码视窗”;
[0237] ⑤点击“解析编码视窗”的“基本部件解析”栏,系统即分屏显示出被查字的基本部件解析信息;
[0238] ⑥如检索被查字的汉字基本部件解析、基本部件称谓及其码元的全部信息,点击空格键即可。如要检索其中的一条信息,则点击相应的数字键即可。
[0239] 如,按上述操作步骤,查询检索“庸”字的解析信息,系统显示:
[0240]
[0241] 其中:
[0242] “1.”是“庸”字的书写解析的部件集合;
[0243] “2.”是“庸”字的基本部件的称谓及其码元。
[0244] 如查询检索“庸”字基本部件解析的全部信息,点击空格键即可。如检索“庸”字书写解析的部件集合信息,则点击数字键“1”;检索“庸”字的基本部件的称谓及其码元信息,则点击数字键“2”即可。
[0245] 三、汉字基本部件解析和汉字动态书写系统
[0246] 本系统主要是演示汉字层次解析的基本部件的动态书写,汉字的基本部件的动态组合。系统有一个汉字动态书写演示主视窗,主视窗的上方第一行显示汉字的基本部件集合信息,第二行显示汉字的基本部件的动态组合。
[0247] 主视窗的左下方有一个汉字基本部件的动态书写视窗,按汉字的笔顺规范演示汉字基本部件的动态书写过程。
[0248] 其操作步骤是:
[0249] ①选中被演示的汉字;
[0250] ②点击“汉字输入系统输入状态栏”中的“查询栏”,进入“中文信息查询检索视窗”;
[0251] ③点击“中文信息查询检索视窗”中的“动态书写”栏,系统便演示被查字的基本部件的集合,逐个演示被查字的基本部件的动态组合过程、基本部件的动态书写。
[0252] 如:演示“庸”字
[0253]
[0254] 其中:视窗上方的第一行是“庸”字的基本部件集合信息;第二行演示“庸”字的基本部件动态组合过程;左下方是演示“庸”字的基本部件的动态书写。
[0255] 附表1汉字基本笔画分类、名称及其码元一览表(28个)
[0256]
[0257]
[0258] 附表2汉字一类基本部件名称及码元一览表
[0259]
[0260]
[0261]
[0262]
[0263]
[0264]
[0265]
[0266] 附表3符号名称、简称及其编码一览表(字母类标志码:u;非字母类标志码:v)[0267]
[0268]
[0269]
[0270]
[0271]
[0272]