多语言混合输入的方法和系统转让专利

申请号 : CN201610970761.9

文献号 : CN106598266B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 黄晓凤赵艳姣戴静芬

申请人 : 上海触乐信息科技有限公司

摘要 :

一种可实现多语言混合输入的方法,在无需切换输入语言的条件下,智能判断用户输入序列,并根据词频、上下文关联性、单词长度、当前输入语言等多种因素决定候选词的优先级,并将合并后的候选词列表显示给用户。

权利要求 :

1.一种多语言混合输入的方法,其特征在于,包括:检测用户输入,当用户操作为输入序列时,执行第一步骤;当用户操作为确认候选词时,执行第二步骤,其中:第一步骤包括:

将所述输入序列加入待确认输入序列的尾部,对所述待确认输入序列进行分析,获取所述待确认输入序列的前段部分;

根据所述待确认输入序列前段部分获取至少一个子序列,每个子序列为所述待确认输入序列前段部分的子集且具有相同的一个或多个开头字符;

将所述各个子序列分别送至多个语言释义模块,获取并合并来自不同的语言释义模块的候选词,并对候选词进行排序后输出;

第二步骤包括:

选择所确认的候选词,并将该候选词对应的序列从待确认输入序列移至已确认输入序列,更新所述待确认输入序列。

2.如权利要求1所述的方法,其特征在于,所述多个语言释义模块分别对应于不同的语言。

3.如权利要求2所述的方法,其特征在于,所述待确认输入序列中的字符对应于至少两种语言中的候选词。

4.如权利要求1所述的方法,其特征在于,所述多个语言释义模块包含同一个语言的不同输入方法。

5.如权利要求2或4所述的方法,其特征在于,初始输入时,所述已确认输入序列为空。

6.如权利要求2或4所述的方法,其特征在于,所述输入序列为整句。

7.如权利要求2或4所述的方法,其特征在于,所述对候选词进行排序包括,当前输入语言候选词的优先级高于备选输入语言候选词的优先级。

8.如权利要求2或4所述的方法,其特征在于,所述对候选词进行排序包括,候选词越长,其优先级越高。

9.一种多语言混合输入的系统,其特征在于,包括:输入装置,适于接收用户输入;

存储装置,适于存储至少一个语言释义模块;

处理器,适于检测用户输入,当用户操作为输入序列时,执行第一步骤;当用户操作为确认候选词时,执行第二步骤,其中:第一步骤包括:将所述输入序列加入待确认输入序列的尾部,对所述待确认输入序列进行分析,获取所述待确认输入序列的前段部分;根据所述待确认输入序列前段部分获取至少一个子序列,每个子序列为所述待确认输入序列前段部分的子集且具有相同的一个或多个开头字符;将所述各个子序列分别送至多个语言释义模块,获取并合并来自不同的语言释义模块的候选词,并对候选词进行排序后输出;

第二步骤包括:选择所确认的候选词,并将该候选词对应的序列从待确认输入序列移至已确认输入序列,更新所述待确认输入序列;

以及显示装置,适于显示输出的候选词。

10.如权利要求9所述的系统,其特征在于,所述多个语言释义模块对应于不同的语言或者为所述多个语言释义模块对应于同一个语言的不同输入方法。

11.如权利要求10所述的系统,其特征在于,所述处理器对候选词进行排序包括,当前输入语言候选词的优先级高于备选输入语言候选词的优先级。

12.如权利要求10所述的系统,其特征在于,所述处理器对候选词进行排序包括,候选词越长,其优先级越高。

说明书 :

多语言混合输入的方法和系统

技术领域

[0001] 本发明涉及电子设备领域,特别涉及电子设备信息输入技术领域,具体是指一种电子设备上实现多种语言混合输入的方法和系统。

背景技术

[0002] 大部分的个人电脑和电子设备上都配备了本地语言的输入法。例如在中文操作系统中配备有拼音输入法,在手机或其他便携设备上则配有简化键盘的输入法。在全球化不断推进的今天,一个用户需要同时输入两种或两种以上语言的情况很常见。例如,有时在中文的句子里需要加入几个英文单词。目前大部分输入法通过提供切换语言的快捷键来解决这个问题。例如,在一些个人电脑的中文输入法中,用SHIFT键可以在中文和英文输入之间进行切换;在手机中,可以用某个特殊键进行语言切换。但是,这样的切换对于用户来说仍然显得不便,因为用户经常会忘记切换,或者在一种主要语言的输入中,临时切换到另一种辅助语言后还要切换回去。同时,增加一个切换键减慢了用户的输入速度,在一些手持设备上还占用了宝贵的键盘空间。
[0003] 一种提出的多语言混合输入的方法是通过用户确认方式的不同来识别不同语言。例如在一种中文输入方案中,当用户按空格键确认时,将输入序列识别为拼音,当用户按回车键确认时,将输入序列识别为英文。这种方式无需用户显式地切换语言,但限制是用户每次输入的内容只能是一种语言,而不能实现在一次输入中多种语言的混合输入。同时,在手机等便携电子设备的简化键盘上,由于每个键上对应了多个字母,击键序列的含义是多义性的。因此对于每一种语言都可能会有多个可能的单词对应,而此时这种方法就无能为力了。
[0004] 因而,研制一种适用于各种设备、各种语言的多语言混合输入系统对于那些经常使用两种或多种语言的用户来说是十分有帮助的。事实上,从一个用户输入序列中推断出所代表的语言是完全可行的。例如,一个输入序列“fangfa”可以推断出其为中文拼音,而另一个输入序列“method”可以推断出为英文单词。在这种过程中,无需用户的切换和确认,输入系统即可智能地判断出用户在使用哪种语言。

发明内容

[0005] 本发明提供一种适用于多语言混合输入的方法和系统,该方法可采用以词或句子为单位的输入方式,通过分析用户的输入序列,匹配所选语言的单词,并用候选词的方式供用户选择。在该方法中,用户无需切换语言,只要连续地输入字符序列并根据系统提示选择对应的候选词,即可输入一段或一句混有多种语言的文本。
[0006] 根据本发明的一个方面,提供了一种多语言混合输入的方法,包括获取用户输入序列的第1步骤;将待确认的输入序列送至多个语言释义模块分析,获得针对不同语言的候选词的第2步骤;合并各语言的候选词,并根据优先级排序生成合并后的候选词列表的第3步骤;输出生成的候选词列表,供用户选择确认的第4步骤。
[0007] 根据本发明的另一个方面,提供了一种多语言混合输入的系统。

附图说明

[0008] 附图1A是举例说明一台适于本发明的个人计算机;
[0009] 附图1B是举例说明根据本发明实施例的屏幕上显示的内容;
[0010] 附图2A是举例说明根据本发明实施例的屏幕上显示的初始用户界面;
[0011] 附图2B是举例说明根据本发明实施例的屏幕上显示的一个进一步的用户界面;
[0012] 附图2C是举例说明根据本发明实施例的屏幕上显示的另一个进一步的用户界面;
[0013] 附图2D是举例说明根据本发明实施例的屏幕上显示的另一个进一步的用户界面;
[0014] 附图2E是举例说明根据本发明实施例的屏幕上显示的另一个进一步的用户界面;
[0015] 附图3是举例说明根据本发明实施例的一个带有简化键盘的电子设备屏幕上显示的内容;
[0016] 附图4是举例说明适用于本发明的计算机设备或便携式终端设备的基本结构框图;
[0017] 附图5是举例说明根据本发明实施例的多语言混合输入软件流程图;
[0018] 附图6是举例说明根据本发明实施例的多个语言释义模块;
[0019] 附图7是举例说明根据本发明实施例的一种多语言混合输入流程。

具体实施方式

[0020] 1.系统操作方式
[0021] 为了便于理解本发明的实施例及其系统结构原理,首先对本发明的一些实施例操作方式和用户体验做简要说明。
[0022] 参考图1A,该图描述了一台适用于本发明的配有键盘和显示屏幕的个人计算机100。用户可以在键盘上输入字符序列,计算机中装载的输入法将其转化为对应语言的文字。
[0023] 图1B是该计算机屏幕上的显示内容。110为文本区域,用户的输入经确认后进入文本区域。120为输入序列,其中分为已确认序列121和待确认序列122。已确认序列显示已经由用户确认的输入序列所对应的单词,待确认序列显示尚未确认的用户输入序列。130为候选词区域,列出了待确认序列可能对应的多个候选词。在这个例子中,以中文拼音和英文的混合输入为例,说明本发明系统的使用方法。
[0024] 参考图2A,该图举例说明了依照本发明实施例的一个初始用户界面。当用户要输入一段话,例如“支持中文和English的混合输入”时,用户首先在键盘上输入序列210“zhi chi zhongwen he english de hun he shuru”。为了便于说明,本文用空格分隔各个词,但实际的用户输入并不需要包含这些分隔符。在这个输入序列中,既包含了拼音,又包含了英文单词。在一开始,该序列的所有部分都为待确认序列,在候选区域中列出了待确认序列前段所对应的候选词。例如该序列的开头“zhi chi”所对应的候选词有“支持”,“只吃”,“咫尺”,“直尺”等,显示在候选区域211中。
[0025] 参考图2B,该图举例说明了依照本发明实施例的一个进一步的用户界面。按空格键选择第一个候选词“支持”后,“zhi chi”被替换为“支持”,成为已确认序列221,而待确认序列222变为“zhong wen he english de hun he shuru”。此时,系统重新对待定序列进行分析并列出新的候选词列表。由此可见,在该系统中,待确认序列从前到后不断地通过用户选定候选词转变为已确认序列。
[0026] 参考2C,该图举例说明了依照本发明实施例的另一个进一步的用户界面。,当用户确认了输入序列“zhi chi zhongwen he”为231“支持中文和”时,待确认序列为232“english de hun he shuru”。此时,系统从内置的英文单词词典中找到English这个单词,将其加入到候选词列表中。而同时由于待确认序列的开头“en”也可能是拼音,因此在候选词列表中也列出了“en”所对应的中文候选词。用户选择候选词“English”后将其加入到已确认序列中,如图2C所示。
[0027] 以此类推,当用户确认了后续的输入序列“de hun he”之后,最后的待确定序列“shuru”所对应的候选词如图2D所示。当用户确认了候选词“输入”之后,所有的输入序列都得到了确认,被输入到文本区域241中。同时输入序列区域和候选区域清空。
[0028] 图3是另一个适用于本发明的便携式电子设备,带有一个简化键盘,每个键上对应了多个英文字符。该键盘既可以是硬件键盘,也可以是显示在触摸屏上的软件键盘。在屏幕区域同样有文本区域,输入序列和候选区域。与前一种实施例类似,用户同样是通过在键盘上输入按键序列,并确认各个候选词。但不同的是,在该键盘上每一个按键对应于多个字符,因此可能对应的候选词也相应增加。例如在用户先后按键301(“ghi”)和键302(“def”)后,可能对应的序列组合有3*3=9种,而实际有效的拼音有“he”和“ge”。在这种具有多义性的键盘上,本发明的系统仍然适用。因为系统可以将各种可能的序列组合所对应的候选词按优选顺序排列(例如词频高低),供用户选择。在此例中,按键301和键302对应的候选词的中文可能有“和,个,合”等,而对应的英文可能有“he”、“if”等,因此全都根据优先顺序显示在候选区域310中。
[0029] 依照本发明的一个实施例,存在一个当前输入语言(如,中文),和一或多个备选输入语言(如,英文)。因此候选词列表中会优先显示当前输入语言的候选词,而仅将备选输入语言中的高词频的单词显示出来。例如,在图3所述的界面中,当用户输入了按键301和按键302后,由于当前输入语言是中文,备选输入语言是英文,因此候选词中仅显示出最高词频的英文单词“if”,而其余候选词都为当前输入语言中文的候选词。尽管英文单词“he”的词频和其余中文候选词的词频相近,但由于其属于备选输入语言,因此并没有出现在候选词列表中。
[0030] 2.名词定义
[0031] 本发明所涉及的名词定义如下:
[0032] “已确认输入序列”:已经由用户确认候选词的输入序列。
[0033] “待确认输入序列”:尚未确认候选词的输入序列。
[0034] 3.系统结构及原理
[0035] 图4描述了本发明所涉及的一种多语言混合输入系统,包含输入装置410,处理器420,存储装置440和显示装置430。其中,输入装置410接受用户的输入,可以是键盘、触摸板、触摸屏等;存储装置440中存有本发明所对应的软件程序及相关的操作系统、文本编辑器以及其他应用程序等,可以是任何记忆介质,例如随机访问内存(RAM),只读内存(ROM),闪存(Flash),硬盘等;处理器420可以是CPU或专用集成电路芯片;显示装置430将系统的输出显示给用户,可以是显示屏、液晶屏等。很多情况下,输入装置410也可能与显示装置430合成,如触摸屏。
[0036] 本多语言混合输入的系统是由多语言混合输入软件500管理的。图5描述了该多语言混合输入软件的主要流程,具备以下步骤:等待用户输入(步骤501);判断本次输入是否为确认候选词操作(步骤502):若是,跳转至步骤503,若否跳转至步骤504;将候选词所对应的序列从待确认序列移至已确认序列(步骤503);将输入键序列加入到待确认序列尾部,并跳转至步骤507(步骤504);判断待确认序列是否为空(步骤505),若是,跳转至步骤506,若否,跳转至步骤507;将已确认的候选词序列输入至文本区域,完成一次输入并返回(步骤506);将更新后的待确认序列送至各个语言释义模块分析(步骤507);综合各语言释义模块分析结果,在候选词模块中合并生成候选词列表,并进行优先级排序(步骤508);输出更新的候选词列表(步骤509)。
[0037] 对于步骤502,确认候选词操作可以是按确认键或空格键等输入默认候选词,或是用方向键选中候选词后按确认键输入某个候选词,或是在触摸屏上点击某个候选词等。
[0038] 对于步骤507,各语言释义模块是根据输入的待确定序列,结合本语言的词库,寻找出可能的本语言候选词,并将其输入至候选词模块中。在本发明中,语言的种类和数量可以任意指定而不影响发明的本质。例如,一种实施例可以包含中文拼音和英文的释义模块,分别查找待确认序列针对中文拼音和英文的候选词;另一种实施例可以包含日文、英文和德文的释义模块,分别查找针对日文、英文和德文的候选词。对于同一种语言的不同输入方法,也可能对应不同的释义模块,例如中文拼音和笔画输入可以对应不同的释义模块。
[0039] 对于步骤508,候选词模块将各个语言释义模块输出的候选词按优先级顺序进行排列,并最终输出给用户。该优先级可根据候选词的词频、上下文关联性等因素决定。
[0040] 依照本发明的一种优选实施例,各语言释义模块可包含一个当前输入语言和一或多个备选输入语言,当前输入语言的候选词在优先级排序中比备选输入语言的候选词具有更高的优先级。例如,在中文为当前输入语言时,中文候选词便具有更高的优先级,这样可确保候选词列表中大部分为中文。在某些实施例中,可以仅将备选输入语言的最高优先级候选词输出,减少对用户选词的干扰。当前输入语言是可以动态切换的,例如,用户可以通过某个特定操作,将当前输入语言从中文切换至英文,而中文则变为备选输入语言。
[0041] 4.释义模块的工作原理
[0042] 下面具体介绍所述释义模块的工作原理。为了实现多语言混合输入的目的,同一个待确认序列被输入到多个语言释义模块中进行解析。如图6所示。
[0043] 在每个释义模块中,都根据各自的语言对待确认序列进行独立的分析。每个释义模块可包含一个该语言的词典,可以快速地将字符序列映射到可能的单词。释义模块根据该语言的词典,寻找出待确认序列及其开头的各子序列所对应的候选词。例如,对于英语释义模块,待确认序列“namecardde”可对应的候选词为“namecard”和“name”。但“card”并不作为该待确认序列的候选词,因为其位于待确认序列的中间,而非开头。又例如,对于中文拼音释义模块,待确认序列“namecardde”可对应的候选词为“那么”、“那”、“拿”等等,因为该序列的开头子序列“name”可以对应为词语“那么”,而开头子序列“na”可以对应与字“那”、“拿”等。
[0044] 对于每个按键对应多个字符的简化键盘,待确认序列可以是一个多义性的序列,即对应于多种可能的字符序列。此时,释义模块仍然可以根据各种可能的字符序列找出对应的候选词。例如,对于英语释义模块,在图3所示手机键盘布局中,当用户先后输入键303(“jkl”),键302(“def”),键304(“tuv”)时,可对应的候选词有“jet”,“let”等。在这种情况下,可能的候选词会比普通键盘输入所对应的候选词更多,但并不影响本发明的实质。
[0045] 5.候选词模块的工作原理
[0046] 对于每一个释义模块,都会产生各自的候选词列表。而候选词模块则将它们合并成一个候选词列表并输出给用户。在合并过程中,候选词模块根据优选顺序从高到低将候选词排序,优先级最高的候选词排在最前。优先级可以有很多因素综合决定,包括候选词的词频、长度、与上下文的关联度等等。一般来说,在同种语言中候选词越长,其优先级就越高。例如当英文中namecard和name同为候选词时,namecard的优先级就更高。而在不同语言中,一般来说,候选词所对应的字符序列越长,则优先级越高。例如候选词“那么”对应的字符序列是“na me”,因此其优先级低于候选词“namecard”。
[0047] 依照本发明的一个实施例,当前输入语言的候选词优先级高于备选输入语言的候选词优先级。例如,当前输入语言为中文,备选输入语言为英文时,中文候选词的优先级高于英文候选词。因此在候选词列表中,只有最高词频的英文单词才会排在前面。
[0048] 需要指出的是,尽管本发明的实施例以中文和英文混合输入为例,但其可同样运用与其他语言的混合输入。例如,要实现英文、德语和法语的混合输入,只需将它们对应的语言释义模块加入系统。
[0049] 图7描述了本发明所涉及的一种多语言混合输入的方法700,包含以下步骤:获取用户输入序列(步骤701);将待确认的输入序列送至多个语言释义模块分析,获得针对不同语言的候选词(步骤702);合并各语言的候选词,并根据优先级排序生成合并后的候选词列表(步骤703);输出生成的候选词列表,供用户选择确认(步骤704)。
[0050] 对于步骤701,用户输入序列可包含已确认序列和待确认序列。已确认序列为已经由用户确认候选词的输入序列,待确认序列为尚未确认候选词的输入序列。
[0051] 对于步骤702,各语言释义模块是根据输入的待确定序列,结合本语言的词库,寻找出可能的本语言候选词,并将其输入至候选词模块中。在本发明中,语言的种类和数量可以任意指定而不影响发明的本质。例如,一种实施例可以包含中文拼音和英文的释义模块,分别查找待确认序列针对中文拼音和英文的候选词;另一种实施例可以包含日文、英文和德文的释义模块,分别查找针对日文、英文和德文的候选词。对于同一种语言的不同输入方法,也可能对应不同的释义模块,例如中文拼音和笔画输入可以对应不同的释义模块。
[0052] 对于步骤703,候选词模块将各个语言释义模块输出的候选词按优先级顺序进行排列。该优先级可根据候选词的词频、上下文关联性等因素决定。
[0053] 可选地,各语言释义模块可包含一个当前输入语言和一或多个备选输入语言,且当前输入语言的候选词在优先级排序中比备选输入语言的候选词具有更高的优先级。例如,在中文为当前输入语言时,中文候选词便具有更高的优先级。在某些实施例中,可以仅将备选输入语言的最高优先级候选词输出。当前输入语言是可以动态切换的,例如,用户可以通过某个特定操作,将当前输入语言从中文切换至英文,而中文则变为备选输入语言。
[0054] 对于步骤704,用户可通过某些特定操作确认候选词。例如,按空格键输入默认候选词,移动光标选中候选词后按确认键,或直接点击触摸屏上的候选词。经用户确认的候选词所对应的输入序列变为已确认输入序列,剩余的序列为待确认输入序列。