输入法中候选内容的生成方法及装置转让专利

申请号 : CN200810180432.X

文献号 : CN101441524B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张会鹏梅书慧

申请人 : 腾讯科技(深圳)有限公司

摘要 :

本发明公开了一种输入法中候选内容的生成方法,该方法包括:缓存用户上N次输入上屏的内容,N为大于等于1的整数;结合用户本次输入的内容与所述缓存的内容,生成候选内容。通过对用户已经输入上屏的内容进行缓存,并将用户已经输入上屏的内容作为用户后续输入时,生成候选内容的参考和限制条件,从而提高了候选内容的准确率。本发明还同时公开了一种输入法中候选内容的生成装置。

权利要求 :

1.一种输入法中候选内容的生成方法,其特征在于,该方法包括:缓存用户上N次输入上屏的内容,N为大于等于1的整数;

将所述缓存的内容对应的拼音串和用户本次输入的拼音串连接在一起,将连接后的整体拼音串作为一个单词,生成候选内容,如果没有与所述整体拼音串完全匹配的单词,则再将所述整体拼音串作为一个整句,以缓存内容作为限制条件进行整句预测,生成候选内容。

2.如权利要求1所述的输入法中候选内容的生成方法,其特征在于,所述N=1。

3.如权利要求2所述的输入法中候选内容的生成方法,其特征在于,缓存用户上一次输入上屏的内容包括:判断用户上一次输入上屏的内容是否为整句,若是,则缓存组成该整句的最后一个单字或单词,否则缓存用户输入上屏的全部内容。

4.如权利要求2所述的输入法中候选内容的生成方法,其特征在于,缓存用户上一次输入上屏的内容包括:判断用户上一次输入上屏的内容是否为整句,若是,则缓存组成该整句的最后一个单字或单词,否则继续判断是否为自造词,若是,则缓存组成该自造词的最后一个单字或单词,否则缓存用户输入上屏的全部内容。

5.如权利要求3或4所述的输入法中候选内容的生成方法,其特征在于,所述缓存组成整句或自造词的最后一个单字或单词包括:缓存所述最后一个单字或单词中最长的一个。

6.如权利要求4所述的输入法中候选内容的生成方法,其特征在于,所述判断用户上一次输入上屏的内容是否为整句,包括:判断用户上一次输入上屏的内容是否包含多个单词或单字,若是,则为整句生成。

7.如权利要求1所述的输入法中候选内容的生成方法,其特征在于,所述以缓存内容作为限制条件进行整句预测,生成候选内容包括:利用最短路径算法对所述连接后的整体拼音串进行整句预测,同时以缓存的内容作为预测的限制条件,生成整句预测结果,如果有完全匹配的整句,则将预测结果中,对应于用户本次输入的拼音串的候选内容排列在候选内容的第一位。

8.一种输入法中候选内容的生成装置,其特征在于,该装置包括:内容接收模块,用于接收用户输入的内容及用户输入上屏的内容;

缓存模块,与所述内容接收模块相连,用于缓存所述内容接收模块接收到的用户上N次输入上屏的内容,N为大于等于1的整数;

候选内容生成模块,与所述内容接收模块及所述缓存模块连接,用于结合内容接收模块接收到的用户本次输入的内容与缓存模块缓存的内容,生成候选内容;

其中,所述候选内容生成模块包括:

拼音连接单元,用于将所述缓存的内容对应的拼音串和用户本次输入的拼音串连接在一起;

单词候选生成单元,与所述拼音连接单元相连,用于将所述拼音连接单元连接后的整体拼音串作为一个单词,生成候选内容;

整句候选生成单元,与所述拼音连接单元相连,用于将所述拼音连接单元连接后的整体拼音串作为一个整句,生成候选内容。

9.如权利要求8所述的输入法中候选内容的生成装置,其特征在于,所述缓存模块包括:存储器,用于缓存用户输入上屏的内容;

整句判决器,用于判断用户输入上屏的内容是否为整句;

缓存控制单元,与存储器和整句判决器分别相连,用于根据N值对缓存的内容进行控制;

当N=1时,若所述整句判决器判断用户输入的内容为整句,则所述缓存控制单元将组成该整句的最后一个单字或单词缓存于所述存储器,否则将用户输入的全部内容缓存于所述存储器。

10.如权利要求9所述的输入法中候选内容的生成装置,其特征在于,所述缓存模块进一步包括:自造词判决器,用于判断用户输入上屏的内容是否为自造词;

所述缓存控制单元,进一步与所述自造词判决器相连,当N=1时,若所述整句判决器判断用户输入的内容为整句时,所述缓存控制单元将组成该整句的最后一个单字或单词缓存于所述存储器,若所述整句判决器判断用户输入的内容不是整句,且所述自造词判决器判断用户输入上屏的内容是自造词时,所述缓存控制单元将组成该自造词的最后一个单字或单词缓存于所述存储器;其它情况下,缓存控制单元将用户输入的全部内容缓存于所述存储器。

说明书 :

输入法中候选内容的生成方法及装置

技术领域

[0001] 本发明涉及输入法技术领域,特别涉及输入法中候选内容的生成方法及装置。

背景技术

[0002] 目前,电脑使用者要将汉字或其他非英文文字输入到电脑中,都需要使用输入法软件,输入法软件可以把从键盘等输入设备中输入的编码转换成汉字或其他文字。对于中文的拼音输入法来说,由于同音字很多,在输入单字或单词的拼音后,输入法软件需要生成多个候选的字词供用户选择,用户选择正确的单字或单词上屏后,继续输入下一个单字或单词。
[0003] 对于单词和单字的候选内容生成较为简单,一般是根据词频的大小,按顺序排列出来,词频最大的单词或单字排在第一位,之后按照词频从大到小的顺序依次排列。
[0004] 但是在用户输入想要输入的一句话中,不一定使用的都是词频最大的字或词,为了更准确地输入用户需要的句子,现有输入法大都实现了整句生成,即允许用户一次性输入包含多个单字或单词的拼音串,并对该拼音串进行音节划分,划分成多个单字或单词,然后使用最大概率算法进行整句预测,生成候选内容,其中包括一个候选整句和按照词频大小排列的其它候选单词或单字,在整选句生成时,生成候选内容的基本原理如下:
[0005] 在用户输入的一串拼音串中包含多个字词,存在着多种字词的组合方案,整句预测就是首先找出这个拼音串中出现的所有候选字词,然后在这些候选字词的组合中找到一个出现概率最大的组合方案作为最后的候选句生成结果。
[0006] 例如我们输入“womendoushipingfanren”这样一个拼音串。经过音节划分后的音节序列为“wo’men’dou’shi’ping’fan’ren”,根据这个音节序列查询内部的拼音词库,可以得到如图1所示的拼音切分词示意图。图1中,每一条弧线代表一个划分出来的字或词,并对应一个或多个候选字或词,这些弧线包含了所有可能的字词划分情况,每个弧线对应的候选字或词从上到下按照词频从高到低排序,而且每一条弧线都带有词频信息,该词频信息是指拼音串所对应的所有候选字或词中词频最大的那个字或词的词频。在目前的输入法中,一般只给用户提供一个候选句,即只有词频最高的词才有效,也就是说词频排在第二位以后的词不会在最后的候选句结果中出现,因此最终得到的候选句是从如图2所示的简化拼音切分词示意图中选择得到的。
[0007] 如图2所示,候选句将从词频最大的字或词中组合得到,接下来利用两点间最短路径算法,如Dijkstra算法、Viterbi算法等,求出概率最大的字词组合方案,作为最后的整句预测结果,生成“我们都是平凡人”的候选句。一般来说,整句生成时由于考虑了各种字词之间的二元共现关系,即两个字词之间是否共同出现过,以及共同出现的概率,其生成的候选句的正确率比采用单词或单字输入时,生成的第一候选字词的正确率更高。
[0008] 相比单词或单字的输入,整句输入可以有效减少用户选择候选字词的次数,提高输入速度和输入体验,但是一般用户都不习惯连续输入很长的一串拼音串,而更习惯以单字或单词为单位进行输入,在输入一个单词或单字并确认上屏后再输入下一个单字或单词。而现有输入法中,用户每一次输入的单词或单字生成候选字词的过程是独立的,每次生成候选字词的操作之间没有相互关系,而上下文联想及整句生成的功能只在单字或单词没有确认上屏之前有效,而在单字或单词上屏后,输入法无法判断已经被用户输入上屏的内容和用户后续输入的内容之间的关联,上下文联想及整句生成的功能并不起作用,只能简单地根据词频生成候选字词,例如用户想输入“这间卧室很大”这句话,用户的输入习惯将该句分两次进行输入,第一次输入“zhejian”,输入法判断这是一个单词输入,按词频大小生成的第一候选内容是“这间”,用户选择“这间”上屏后继续输入“woshihenda”,输入法将根据现有整句生成的方法生成候选句“我是很大”,但“我是很大”并不是用户想要的,此时用户需要手动选择排列在后面的其他候选内容“卧室”和“很大”才能得到“卧室很大”。而如果一次输入“zhejianwoshihenda”整句拼音,则根据基于最大概率的整句预测生成的第一候选句就是“这间卧室很大”,显然,将整句拼音分成多次输入时,候选内容生成的准确率不高,无法达到与整句生成相同的效果,用户需要更多的选择操作来得到正确的句子,降低了用户的输入速度和输入体验,使整句生成功能形同虚设。
[0009] 但在现实应用中,用户改变输入习惯基本是不可能的,所以在现有的户输入习惯下,即这种按单字或单词为单位输入拼音的习惯下,现有的输入法无法实现整句生成的效果,生成的候选内容准确率较低。

发明内容

[0010] 本发明实施例提供一种输入法中候选内容的生成方法,可在现有用户输入习惯下,提高候选内容的准确率。
[0011] 本发明实施例提供一种输入法中候选内容的生成装置,可在现有用户输入习惯下,提高候选内容的准确率。
[0012] 为达到上述目的,本发明的技术方案具体是这样实现的:
[0013] 一种输入法中候选内容的生成方法,该方法包括:
[0014] 缓存用户上N次输入上屏的内容,N为大于等于1的整数;
[0015] 将所述缓存的内容对应的拼音串和用户本次输入的拼音串连接在一起,将连接后的整体拼音串作为一个单词,生成候选内容,如果没有与所述整体拼音串完全匹配的单词,则再将所述整体拼音串作为一个整句,以缓存内容作为限制条件进行整句预测,生成候选内容。
[0016] 一种输入法中候选内容的生成装置,该装置包括:
[0017] 内容接收模块,用于接收用户输入的内容及用户输入上屏的内容;
[0018] 缓存模块,与所述内容接收模块相连,用于缓存所述内容接收模块接收到的用户上N次输入上屏的内容,N为大于等于1的整数;
[0019] 候选内容生成模块,与所述内容接收模块及所述缓存模块连接,用于结合内容接收模块接收到的用户本次输入的内容与缓存模块缓存的内容,生成候选内容;
[0020] 其中,所述候选内容生成模块包括:
[0021] 拼音连接单元,用于将所述缓存的内容对应的拼音串和用户本次输入的拼音串连接在一起;
[0022] 单词候选生成单元,与所述拼音连接单元相连,用于将所述拼音连接单元连接后的整体拼音串作为一个单词,生成候选内容;
[0023] 整句候选生成单元,与所述拼音连接单元相连,用于将所述拼音连接单元连接后的整体拼音串作为一个整句,生成候选内容。
[0024] 由上述的技术方案可见,本发明的这种输入法中候选内容的生成方法和装置,通过对用户已经输入上屏的内容进行缓存,并将用户已经输入上屏的内容作为用户后续输入时,生成候选内容的参考和限制条件,达到类似整句生成的效果,从而提高了候选内容的准确率。

附图说明

[0025] 图1为拼音切分词示意图;
[0026] 图2为简化拼音切分词示意图;
[0027] 图3为本发明实施例的候选内容生成方法总体流程图;
[0028] 图4为本发明实施例一的候选内容生成方法具体流程图;
[0029] 图5为本发明实施例二的候选内容生成方法具体流程图;
[0030] 图6为本发明实施例的候选内容生成装置结构示意图;
[0031] 图7为本发明实施例一的缓存模块具体结构示意图;
[0032] 图8为本发明实施例二的缓存模块具体结构示意图;
[0033] 图9为本发明实施例的候选内容生成模块具体结构示意图。

具体实施方式

[0034] 为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。
[0035] 本发明主要是对用户使用输入法已经输入上屏的内容进行缓存,作为后续用户输入内容时,产生候选内容的参考,结合用户已经输入上屏的内容与用户后续输入的内容生成候选内容,从而在现有用户按单字或单词为单位进行输入的习惯下,使生成的候选内容达到整句生成的效果。
[0036] 图3为本发明实施例的候选内容生成方法总体流程图,如图3所示,该流程包括如下步骤:
[0037] 步骤301,缓存用户上N次输入上屏的内容。
[0038] N可以是大于等于1的自然数,用户输入上屏的内容可以是一个单字或一个单词或者一个整句,整句由多个单字和/或单词组成,如果用户输入上屏的是单字或单词,则可以把这个单字或单词以及对应的拼音串记录下来放入缓冲区缓存,如果用户输入上屏的内容是通过整句生成出来的整句,那么在缓存时只缓存组成这个整句的最后一个字或词。
[0039] 例如用户上一次输入的是“我是中国人”,这是一个整句,组成这个整句的最后一个字或词,根据对词库查询,可以是“人”、“国人”和“中国人”,缓存时可以取任意一个单词保存,也可以保存其中最长的“中国人”,保存最长的词可以提高后续进行整句预测时的准确性。
[0040] 步骤302,结合用户本次输入的内容与所述缓存的内容,生成候选内容。
[0041] 这里结合用户本次输入内容与所述缓存的内容,生成候选内容,是指在用户进行输入时,将本次输入的内容和缓存的内容连接起来,根据连接起来的整体内容,生成候选内容,而不是单独根据用户本次输入的内容来生成候选内容。具体生成候选内容时,可以沿用现有的生成候选内容的方法。
[0042] 在用户输入拼音串时,把缓存区保存的拼音串和用户本次输入的拼音串连接在一起,可以先将连接后的整体拼音串作为一个单词,生成候选内容,如果没有与所述整体拼音串完全匹配的候选内容,则再将所述整体拼音串作为一个整句,以缓存内容作为限制条件进行整句预测,生成候选内容。另外,也可以先作为整句生成候选内容,再作为单词生成候选内容。
[0043] 以缓存内容作为限制条件进行整句预测,生成候选内容的具体方法可以是利用最短路径算法对所述连接后的整体拼音串进行整句预测,同时以缓存的内容作为预测的限制条件,生成整句预测结果,如果有完全匹配的整句,则将预测结果中,对应于用户本次输入的拼音串的候选内容排列在候选内容的第一位。当然,如果没有找到与结合用户本次输入的内容和缓存内容的整体拼音串完全匹配的候选内容,则可以不再考虑缓存内容,采用现有方法,仅针对用户本次输入的拼音串进行候选内容生成。
[0044] 例如用户想输入“刘德华”,先输入“刘”并上屏后,“刘”及其拼音“liu”被放入缓冲区,随后用户输入拼音串“dehua”,此时将用户上次输入的拼音与本次输入的拼音结合起来,即根据“liudehua”这个整体的拼音串进行候选内容生成。首先将“liudehua”按照一个单词来生成候选内容,但是由于没有“刘德华”这个单词,因此再将“liudehua”作为整句,进行整句预测,此时根据整句预测生成的候选词中,由于“刘”与“德华”存在二元共现关系,即有“刘德华”这个完全匹配的整句,因此本次用户输入的拼音所对应的部分“德华”将排在候选内容的第一位,而按照现有词频大小来生成候选内容,则不会考虑“刘”和“dehua”的关系,第一位的候选内容应该是“的话”。同理,如果用户想输入“清华园”,如果先输入上屏了“清华”,则根据本发明实施例生成的候选内容中,“园”将排在第一位,而根据词频来排列的话,“园”并不是第一位。
[0045] 下面以缓存次数N为1时为例详细说明本发明的具体实施方式。
[0046] 图4为本发明实施例一的候选内容生成方法具体流程图,如图4所示,该流程包括如下步骤:
[0047] 步骤401,接收用户上一次输入上屏的内容。
[0048] 步骤402,判断用户输入上屏的内容是否是整句生成的,若是,执行步骤403,否则执行步骤404。
[0049] 步骤403,将组成整句的最后一个单词或单字放入缓冲区缓存。
[0050] 步骤404,将用户输入上屏的全部内容放入缓冲区缓存。
[0051] 如果用户输入的不是整句生成的词,则表明用户输入的是单字或单词,所以直接将用户输入上屏的内容放入缓冲区缓存即可。
[0052] 步骤405,接收用户本次输入的内容。
[0053] 用户后续输入的内容可以是单字、单词或整句。
[0054] 步骤406,将所述缓存的内容对应的拼音串和用户本次输入的拼音串连接在一起。
[0055] 步骤407,判断是否能以单词方式生成候选内容,若是,则执行步骤408,否则执行步骤409。
[0056] 如果没有与所述整体拼音串完全匹配的候选内容,则再将所述整体拼音串作为一个整句,以缓存内容作为限制条件进行整句候选内容生成。
[0057] 步骤408,以单词方式生成候选内容。
[0058] 步骤409,判断是否能以整句方式生成候选内容,若是,则执行步骤410,否则执行步骤411。
[0059] 步骤410,以整句方式生成候选内容。
[0060] 步骤411,不考虑缓存内容,仅对用户本次输入进行候选内容生成。
[0061] 以单词方式生成候选内容,以及以整句方式生成候选内容的方法是本领域成熟技术,这里就不再详述了。
[0062] 其中,步骤402及403中判断用户输入上屏的内容是否为整句生成,并在判断是整句生成时只缓存整句最后一个词的步骤,并不是必须的,可以直接将用户输入上屏的内容缓存下来。一般来说如果用户上一次输入上屏的内容是整句生成出来的,那么之后再次输入的内容与整句的相关性比较小,而与组成该整句的最后一个词的相关性比较大,因此这里对用户输入上屏的内容进行判断是为了进一步提高候选内容生成的准确性。
[0063] 另外,有的输入法还带有用户词库,允许用户自造词,对于这类输入法,在进行整句预测生成候选内容时例如,例如用户第一次输入“我学习”,由于“我学习”是整句生成的结果,因此缓存组成整句的最后一个词,即“学习”,接着输入“zhishi”,连接后的拼音串为“xuexizhishi”,则按照整句生成,候选词“知识”将排列在第一位,同时,由于“我学习”是用户自造的词,因此,“我学习”将被记录到用户词库中。以后用户再输入“woxuexi”的时候,因为“我学习”已经存在于用户词库中,因此就不会进行整句生成,而是做为一个单词上屏,缓存中保存的将是“我学习”这个词,而不是保存的“学习”这个词,因此,当用户随后再输入“zhishi”的时候,因为“我学习”和“知识”并不存在二元共现关系,因此“知识”就不会排列在第一位。
[0064] 为了适应带有用户词库的输入法对于本发明实施例产生干扰,则在上述实施例的基础上,可以进一步在缓存用户上屏的词时,判断缓存的单词是否为用户的自造词,如果是自造词,则通过词库,找出组成自造词的最后一个单词或单字进行保存。
[0065] 图5为本发明实施例二的候选内容生成方法具体流程图,如图5所示,该流程包括:
[0066] 步骤501与步骤401相同;
[0067] 步骤502,判断用户输入上屏的内容是否是整句生成的,若是,执行步骤503,否则执行步骤504。
[0068] 步骤503,将组成整句的最后一个单词或单字放入缓冲区保存。
[0069] 步骤504,判断用户输入的内容是否为自造词,如果是,则执行步骤505,否则执行步骤506。
[0070] 具体对自造词的判断方法有很多,例如对用户自造词进行标识,根据标识进行判断,也可以通过将用户上屏词与用户词库中的词进行比对来判断。
[0071] 步骤505,将自造词中最后一个单词或单字放入缓冲区保存。
[0072] 对于自造词中最后一个单词或单字,也是以保存最长的单词为优选。
[0073] 步骤506,将用户输入上屏内容放入缓冲区保存。
[0074] 步骤507~513与步骤405~411相同,这里不再详述。
[0075] 还以“我学习”为例,如果“我学习”是自造词,则通过核心词库找出组成自造词的最后一个词“学习”是细胞词库中的单词,则在缓存单词时将“学习”存入缓冲区而不是存入“我学习”。这样,在后续用户输入“zhishi”的时候,生成的候选内容排列中,“知识”就会正确排在第一位,解决了用户词库对整句生成时的干扰。
[0076] 另外,在缓存用户输入上屏的内容时,还可以缓存用户最近输入的多个单字或单词。如果只缓存最近一个单字或单词,则用户每次输入上屏的新内容都会替换缓冲区中原来存放的内容。而缓存多个单字或单词时,缓冲区可采用先进先出的原则进行缓存。
[0077] 采用缓存一个单字或单词的方式时,如果要输入“学习知识”,对于用户先输入“学习”后再输入“zhishi”,则“知识”将排在候选内容列表的第一位。因为将“学习”作为一个整体放入缓冲区,“学习”与“知识”存在二元共现关系,采用整句生成,可以得到正确的候选结果“学习知识”。但是如果用户先输入“学”,再输入“习”,之后再输入“zhishi”就不能保证“知识”排在第一位了。因为“学”上屏后,进入缓冲区,然后输入“xi”,选择“习”上屏后,“学”从缓冲区清除,“习”进入缓冲区,再输入“zhishi”,则将“习”与“zhishi”进行整句生成,而“习”与“zhishi”没有二元共现关系,所以无法进行整句生成,也就无法保证“知识”排在第一位。
[0078] 但如果采用缓存多个单字或单词的方式,例如先输入“学”,再输入“习”将连续上屏的两次输入的内容都保存在缓冲区,在后续进行候选生成时,连接的整体拼音串是“xuexizhishi”这样生成的候选内容可以保证“知识”排在第一位,这样就可以进一步提高候选内容生成的准确性。对于缓存用户多次上屏内容时,不应对用户输入上屏的内容进行判断,对用户输入上屏的内容进行判断只在仅缓存用户上一次输入上屏内容时才进行。
[0079] 虽然缓存多个词有利于提高候选内容生成的准确性,但也不宜太多,一般缓存两个单字或单词可以达到较好的效果。
[0080] 图6为本发明实施例的候选内容生成装置结构示意图,该装置可以集成于现有输入法系统中,也可以独立于输入法系统,但需要与输入法系统结合使用。如图6所示,该装置包括:内容接收模块601、缓存模块602和候选内容生成模块603;
[0081] 内容接收模块601,与缓存模块602及候选内容生成模块603相连,用于接收用户输入的内容及用户输入上屏的内容。
[0082] 缓存模块602,与内容接收模块601及候选内容生成模块603相连,用于缓存内容接收模块601接收到的用户上N次输入上屏的内容,N为大于等于1的整数。
[0083] 候选内容生成模块603,与内容接收模块601及缓存模块602连接,用于结合内容接收模块601接收到的用户本次输入的内容与缓存模块602缓存的内容,生成候选内容。在候选内容生成需要查询词库时,只需查询输入法系统中自带的词库即可,这里就不再详述了。
[0084] 图7为本发明实施例一的缓存模块具体结构示意图,如图7所示,所述缓存模块包括:
[0085] 存储器701,用于缓存用户输入上屏的内容;
[0086] 整句判决器702,用于判断用户输入上屏的内容是否为整句;
[0087] 缓存控制单元704,与存储器701和整句判决器702分别相连,用于根据N值对缓存的内容进行控制;
[0088] 若N=1,则当所述整句判决器702判断用户输入的内容为整句时,将组成该整句的最后一个单字或单词缓存于所述存储器701,否则将用户输入的全部内容缓存于所述存储器701。若预设N>1时则可直接存储用户上N次输入的内容而不对用户输入的内容进行判断。
[0089] 图8为本发明实施例二的缓存模块具体结构示意图,如图8所示,所述缓存模块包括:
[0090] 存储器801,用于缓存用户输入上屏的内容;
[0091] 整句判决器802,用于判断用户输入上屏的内容是否为整句;
[0092] 自造词判决器803,用于判断用户输入上屏的内容是否为自造词。
[0093] 缓存控制单元804,与存储器801、整句判决器802和自造词判决器803分别相连,用于根据预设的N值对缓存的内容进行控制;
[0094] 所述缓存控制单元804,若N=1,则当所述整句判决器802判断用户输入的内容为整句时,将组成该整句的最后一个单字或单词缓存于所述存储器801,当所述整句判决器802判断用户输入的内容不是整句,且所述自造词判决器803判断用户输入上屏的内容是自造词时,将组成该自造词的最后一个单字或单词缓存于所述存储器801;其它情况下,将用户输入的全部内容缓存于所述存储器801。同样,若N>1时则可直接存储用户上N次输入的内容而不对用户输入上屏的内容进行判断。对用户输入上屏的内容进行判断只在N=
1时才进行。
[0095] 图9为本发明实施例的候选内容生成模块具体结构示意图,如图9所示,所述候选内容生成模块包括:
[0096] 拼音连接单元901,用于将所述缓存的内容对应的拼音串和用户本次输入的拼音串连接在一起;
[0097] 单词候选生成单元902,与所述拼音连接单元901相连,用于将所述拼音连接单元连接后的整体拼音串作为一个单词,生成候选内容;
[0098] 整句候选生成单元903,与所述拼音连接单元901相连,用于将所述拼音连接单元连接后的整体拼音串作为一个整句,生成候选内容。
[0099] 由上述的实施例可见,本发明的这种输入法中候选内容的生成方法和装置,通过对用户已经输入上屏的内容进行缓存,并将用户已经输入上屏的内容作为用户后续输入时,生成候选内容的参考和限制条件,达到类似整句生成的效果,从而提高了候选内容的准确率。另外,在缓存时,通过判断用户输入上屏的内容是否为整句生成,从而有选择性地保存用户输入上屏的内容,可以进一步提高候选内容生成的准确率。通过判断用户输入上屏的内容是否为自造词,可以进一步解决带有自造词功能的输入法对于候选内容生成的干扰。通过缓存用户多次输入上屏的内容,并结合用户之前多次输入的内容也可以进一步提高候选内容生成的准确率。
[0100] 所应理解的是,以上所述仅为本发明的较佳实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。