计算机汉字联想快码输入法转让专利

申请号 : CN201510058001.6

文献号 : CN104750264B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李裕勋

申请人 : 李裕勋

摘要 :

本输入法简称联想快码,具有联想化、高速化、数学化优点。能解决现有输入法存在“通俗的快不了,快速的绝大多数人用不了,数字化的编码长了”的问题。以10对基本字根,与形似特征同的字根组成覆盖全面的联想编码输入系统(见摘要附图)。分为10个大区、20个上下区,区名字根(基本字根)是:用0——9与(以点代10)作上下区代码。依独、合、多层体易分字。编码简便。

权利要求 :

1.计算机汉字联想快码输入方法,以10对基本字根,也称区名根,分为10个大区、20个上下区,即20个键,其特征在于上区的区名根是联想起源根;字根按形似、特征同的原则分区定键位,各区总合起来,组成联想输入系统,见以上汉字联想字根分区表;

采取双层根码设计,用0—9、 作上下区区名码,即是各区字根的数字代码:一1、丨2、丶3、 4、乙5、人6、口7、刀8、十9、氵0,二 ‖ 冫 了 八 □ 门 土 艹数字上的点代表10,每个字词最多编4码;

依独体字、合体字、多层体字三种结构类型分字;并按以下规则编码:(1)编码顺序规则:

先上后下,先左后右,先外后内;

(2)单字编码规则:

按照分字,配码平均,剩余顺增;

(3)词语编码规则:

两字各2,此1彼3;

三字中2,省名首2;

四字各1,超四前3末1。

说明书 :

计算机汉字联想快码输入法

一、技术领域

[0001] 本汉字输入法(简称联想快码)的技术特征是:以10对有代表性的基本字根,与形似、标志同的字根组成覆盖全面的联想编码输入系统。具有联想(通俗)化、高速化、数字化三大优点。可不间断地输入字词,每个字词最多4码,字均1.7码以内。能在电脑和有英文字母键盘的手机上通用。因其技术优越,还有助于建设我国特色的信息化。请求保护上述技术领域的发明。二、背景技术
[0002] “联想快码”采用和发挥原有“联想输入技术”的“联想”理念,将部分字词的联想改为全部字根的联想。原有“联想输入技术”是一种非编码技术,它不管用户以什么编码输入汉字,只对已确认输入的字进行联想,往往要在字词堆中去找需要的一个,很费时间。与“联想快码”系统的、快速的编码输入技术相比,有天壤之别。
[0003] 现有的输入法繁多,普遍存在这样或那样的缺陷。目前人们使用的几种主要输入法,“通俗的快不了,快速的多数人用不了,数字化的编码长了”。
[0004] 使用“拼音法”,虽有从小学习的基础,但重码多,输入慢;很多人受方言的影响,拼音不准,输入常为难;年纪大的人多不会用;外国人较难学。
[0005] 人们羡慕“五笔字型”的快速,因难学难记,只能被极少数人掌握。
[0006] “笔画码”虽然通俗,但(笔)画多低速。不少对使用拼音法有些困难的人,只好选择或兼用手写输入法。
[0007] 有的专家曾说:“对于同一种编码,要达到既快且便的目的几乎是不可能的,目前数百种汉字编码,没有那一种能真正统一华夏”。
[0008] “联想快码”能解决现有输入法存在的主要问题,具备形成统一输入法的基本条件,可使汉字现代化更上一层楼。三、发明内容
[0009] 发明“联想快码”的技术方案:
[0010] 1、联想字根好记忆
[0011] (1)“联想快码”的字根(简称根),是基本构字部件和基本笔画,它们是汉字结构的代表和信息,按其形状、特征分为10个大区、20个上下区。
[0012] (2)上下区区名字根是基本字根,上区的区名根是联想起源根。它们是:
[0013]
[0014] 上区前5个是基本笔画字根横、竖、点、撇、折(乙代表右折根),下区前5个是与基本笔画根相似的双笔画根(了代表左折和两折根);人与八、口(中无笔画)与囗、刀与门、十与土形相似或根首同;氵(水)与艹(草)形虽不同,但义相关联(有水则草生)。记住上区的区名根,就能联想起下区的区名根(字词以首根分区)。
[0015] (3)区名字根与区内字根的联想。按照“形似特征同”的原则分区定键位,自成联想系列(以宋体字为准)。各区总合起来,成为很好记忆的联想输入系统(参看“说明书附图”)。
[0016] 为加强记忆,特编出以下“字根联想要领顺口词”(笔画简称画,偏旁念字音):
[0017]
[0018] 原有形码对字根分类定位的特征不明显,根形较混杂,难于记忆。
[0019] 2、“双层根码”设计出高速
[0020] 用0——9与 (以点代10,似简谱的高音符号)作上下(双层)区区名码,即是各区字根的代码(量化信息)。上下区的根码好记好区别,同区的根码信息好转化。
[0021] 这样巧妙的双层设计,能扩词库(库容量达到204,有16万多个物理位置,实际收入字词近5万个,且各区字词数量分布比较均衡)、短编码,为本输入法创造了“三化”可共生的良好条件。原有的笔画码用0——9以内的数字输入,因其编码长,防碍了它们在电脑上的广泛应用。
[0022] 将区名根码连接起来(下区区名根码多在括号中),编成能牢记的“根码口诀”:
[0023]
[0024]
[0025] 对下区区名码的标音,是利用现在流行的5个另一种读音幺 两 拐 发洞 再如法增加弯 帜 与 肉 钩 得来的。
[0026] 3、依独、合、多层体易分字
[0027] 形码有利于减少重码、短编码,但应解决分字难问题。
[0028] 著名汉语文字学家陆宗达老先生说,我国第一部字典《说文解字》的作者许慎认为,“汉字的字形可分为两大类:一类是形体可以拆开的,一类是形体拆不开,或者拆开后不能独立成形的。”“从《说文解字》全书来统计,依类象形的‘文’仅占百分之二十左右,形声相宜的字则占百分之八十”(《说文解字通论》52—53、46页。该书由北京师范大学教授、原国家语言文字工作委员会主任、第九和第十届全国人大常委会副委员长、中华文化促进会名誉主席许嘉璐作序)。
[0029] 本输入法循此精神,将汉字主要分为独体、合体两大类型;对少量不易辨别,形似三层以上结构的字,集合成“多层体”这个类型。
[0030] 据此三种结构类型,对其构字部件中的部首、内字(非部首的字中字)、构件(由笔画连交而成,或与内字、构件组合,简称件)和(与内字、件组字的)单笔画分别编码。这样基本上合乎汉字结构的本义,结构形式好分辨,使分字编码由难变易,与联想根码配套成大众化的方法。
[0031] (1)合体字。是由两个构字部件组成的,形声字占绝大多数。对其要分为两个部分编码,有以下三种划分形式:
[0032] 上下结构字。分为上下两部分(内字与上下都能组字的从上)编码。例如:
[0033] 李:木子              惠: 心
[0034] 森:木林              贸: 贝
[0035] 婴: 女             章:音十
[0036] 左右结构字。将左边的一部分与其余部分分开(鸟字旁与其余部分分开;极个别字是左中右结构,均按此规定划分)编码。例如:
[0037] 胡:古月                                湖:氵胡
[0038] 擞:扌数                                鹏:朋鸟
[0039] 包夹结构字。将三四面包围与被包围、两面相夹与被夹的字件分开(两边相同字几乎全是一个字或省字、古字)编码。例如:
[0040]
[0041] (2)独体字。是“纯象形”、“纯指事”的文字,为形声、会意之原,故称“初文”、“半字”(参见《说文解字通论》第43页注释①),是可以独立存在的字。
[0042] 对独体字的构字部件(含字根)、笔画组字,或全由笔画字的,要分别编码(对这种字尽量少分;要保存少画的字,多画的根;两根共画的从上)。
[0043] 例如:
[0044]
[0045] 与合体字近似的依样划分编码,勿虑对二者分辨不清的问题。如:上下连接的“天”分为一大,“不”分为一 “互”分为一 ,“专”分为 ,“业”分为 一,“粤”分为 亏;横阻竖通的“非”分为 ,“能”分为 ,“疑”分为 ;包夹式的“酉”分为西一,“老”分为,“农”分为 ,“豆”分为二 。若被包夹的是单笔画,要按构字部件和字根的顺序编码。如“弟”的构字部件是 弓 ,不是 。
[0046] 对似字件,如女之 、车之 、长之 、弋之 似七,丈之 似 ,鸟之 似勺,丘之似斤等,按件编码,免生疑难。
[0047] (3)多层字(含三层)。对这类字的构字部件,不论上下是否连接,均依横线和横向弧线分层编码(字根不分)。例如:
[0048] 至:              命:              学:
[0049] 商:           善:           黎:
[0050] 直:           寒:          囊:
[0051] 对在字中常见和重要的省体、繁体、异体字,如 (从儿)、 (才)、 (亡)、  (爪)、(月)、 (鸟)、 (尺)、 (戈)、 (从网)、云(倒子)、 (水)、  (臾)、 (正)、(羊)、 (虎)、 (高)、 (尚),並(并)、  (无)、 (页)、 (戕)、 (微)等,作
内字对待。
[0052] 4、编码规则很简便
[0053] 用上述分字方法和“根码口诀”,按以下规则编码,能使广大用户见字知码。
[0054] (1)编码顺序:
[0055] 先上后下,先左后右,先外后内。
[0056] 按此先后,决定构字部件和笔画的编码顺序。构字部件是由几个字根组成的,要依次确定,4码编完为止。若不足4码要按一次空格键。例如:
[0057] 杏(木口):97            雨
[0058] 我     园
[0059] 此规则吸取了黄金富先生“唯物汉字码及中文输入法”(钱伟长作序)中非习惯的笔画顺序法。黄先生在他著作的前言里写道:“电脑打印一个汉字不是一笔笔打出来的,而是点阵打印,即使使用向量法……也不一定按习惯的笔顺来进行。加之考虑到中国人笔顺方面的差别,以及外国人学习笔顺的困难,唯物汉字编码取笔画时,不是按笔顺,而是按照笔画的高低左右位置而进行”。
[0060] “联想快码”将这种顺序法扩展成全部字根的编码顺序规则。这样,用户能依字根的形状、特征对号编码,可充分发挥联想记忆优势,避免按习惯笔顺出现的根难记、码难编、习惯不尽相同等问题,适应汉字现代化发展的需要。
[0061] (2)单字编码规则:
[0062] 按照分字,配码平均,剩余顺增。
[0063] 每个字的4个编码,根据构字部件均等分派,若有多余的码,依次增加,按确定的字根顺次编码输入。
[0064] 构字部件如需细分,比照三种结构类型字的样式处理。
[0065] 例如:
[0066]
[0067]
[0068] 在同一区内,与部首字根相同的非区名字根的单字石、王、虫、山、鱼、月、木、廿、三、川,依根顺编码。例如:
[0069] 三( 一)       川      王      木(十八)
[0070] (3)词语编码规则:
[0071] 两字各2,此1彼3;
[0072] 三字中2,省名首2;
[0073] 四字各1,超四前3末1。
[0074] 例如:
[0075]
[0076]
[0077] 对于重码的处理,吸取了王永民先生“五笔字型”的处理方法。依重码字词使用频率由高至低用数字排位(对较长的词语,采用首尾字中间加一杠的样式),当所需字词排在首位时,继续输入下文会自动入选;如所需字词不在首位,就依其排位按数字键选入(含后无标点的字)。
[0078] “联想快码”实际重码占字词总数的9.5%(其中近半数使用频率较低);5个以内相重的字词占重码总数的99%,它们只需增加一次击键就能选入,占字词编码总量的2.4%;字均1.7码(含重码处理)。
[0079] 汉字“联想快码”集“三化”优势于一身,其功能可与英文输入法比肩,大众化的特点各有千秋,速度要快过英文,直接用数字输入超越外语,与大数据时代的需要相契合。因此,“联想快码”技术对建设我国特色信息化还有以下重要用途。
[0080] 1、利用“联想快码”的数字技术,有助于创新核心技术,掌握自主知识产权,实现电脑、手机国产化。
[0081] 我国是个生产、使用电脑手机的大国,但其核心技术仍受制于人。
[0082] 中文“联想快码”只用20个基本字根的数字代码(“国家标准字符集”中有10——19的序号可作 的信息交换之用,并且还指出在“代码表中,凡未填入图形字符的空白位置,均作为进一步标准化区域。”),就可快捷地输入汉字,比英文输入少用6个键位。
[0083] 英文电脑输入的核心技术,是建立在26个字母编码的基点上的。中文电脑的核心技术也是可以建立在“联想快码”20个基本字根代码的基础之上的。由此可见,这是一个能够掌握自主知识产权,取代英文电脑的突破口,为攻克核心技术难关,催生国产化电脑、手机,提供了有利条件,开辟出一条路径。
[0084] 2、以“联想快码”的编码技术为纽带,有助于开发出使用便捷的大数据软件。
[0085] 现在,大数据时代已经来临。原有的输入、连接技术难于适应我国信息化的发展。
[0086] “联想快码”数字化的优越性,适合我国大数据时代的需求。易于将搜集起来的海量信息,分门别类地整合成系统的数据链,促进各个领域的量化进程, 打造数据资源平台。还可制作城市智能化软件,方便人们的工作、生产、生活。其信息数据简短,连接、操作方便。
[0087] 这种大数据软件,可与本输入法软件先在现有电脑和有英文字母键盘的手机上使用,让大家尽早地快输入、快上网,实现各种信息共享;在上述国产化网格终端制成时与之成龙配套,建设具有中国特色的互联网;与这种国产化手机的结合,将成为民众喜爱的、大有发展前途的移动互联网。这样,能使广大人民群众无障碍地跨入信息化时代。
[0088] 3、利用“联想快码”技术的综合优势,在创造出国产化网络终端产品和大数据软件的基础上,研制我国自己的“根服务器”。
[0089] 2014年元月21日,我国大量网站较长时间处于瘫痪状态,其根本原因在于中国的“根服务器”受美国控制,网络安全没有保障。有专家说,解决这一问题,“除非哪天互联网底层支持技术发生彻底革命。”
[0090] “联想快码”的出世,将促进有核心竞争力的网络终端产品和大数据软件产生,推动互联网底层支持技术的彻底革命。外国人可在英文网络上建造“根服务器”,中国人也能在具有我国特色的网络上研制成自己的“根服务器”,彻底摆脱外国的控制,使我国由网络大国成为网络强国。
[0091] 4、还可用“联想快码”20个基本字根代码的标准音,开发“声码电脑”。
[0092] 这种声码电脑,能避免方言语音障碍,使用户可告别键盘,让不愿动手和不能动手的人得到方便。
[0093] 5、又可用“联想快码”输入与查阅编码的统一性和大众化优点,编纂快速查阅的电脑字典、印刷字典。
[0094] 查阅电脑字典,输入要查字的编码,该字的注音和释义即可出现在屏幕上。
[0095] 使用现有印刷字典,先要查“部首目录”,再查“检字表”,有的还要查“难检字笔画索引”才能找到。用“联想快码”编辑印刷字典,将200多个传统部首或其首根以及难检字的首根归并成20个基本字根大部首,在字典的页面上加上所排字的起止编码,需查阅的字,依其编码可直接找到。四、附图说明
[0096] 在附图中,键的上排左边是区名字根,中间是编码;下面是区内系列联想 字根。
[0097] 是同区同源字根的有: 扌 冫 八 、 艹屮。