一种多字符结构自适应输入法及其布局生成方法转让专利

申请号 : CN202010957799.9

文献号 : CN111831134B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨仁斌

申请人 : 杭州智会学科技有限公司

摘要 :

本发明提供提供一种多字符结构自适应输入法及其布局生成方法,该布局生成方法包括以下步骤:生成输入法页面基础模板,其中输入法页面基础模板内预设字符占位符;提取目标答案数据内的必要字符结构;获取与必要字符结构相关联的类别字符结构;填充类别字符结构和必要字符结构至输入法页面基础模板的预设字符占位符,该方法可提取答案数据中涉及的必要字符结构,自适应生成包含必要字符结构和类别字符结构的输入法,使得用户不再需要反复切换输入法即可快速且准确地输入包含多种字符结构的答案,极大地提高了用户的输入效率。

权利要求 :

1.一种多字符结构自适应输入法布局生成方法,其特征在于,包括以下步骤:

生成输入法页面基础模板,其中输入法页面基础模板内预设字符占位符;

提取目标答案数据内的必要字符结构,其中提取必要字符结构的步骤如下;对目标答案数据依据解析规则进行词法分析得到语法树,提取语法树中各个节点和叶子并进行去重,得到必要字符结构;

获取与必要字符结构相关联的类别字符结构,其中获取类别字符结构的步骤如下:获取至少两样本答案数据组成的样本答案数据集,提取样本答案数据的备选字符,并组成备选字符集;选择备选字符集中的字符进行两两计算PMI值,生成PMI矩阵,根据PMI矩阵计算字符之间的相似度,选择和必要字符结构相似度高的字符作为类别字符结构;

填充类别字符结构和必要字符结构至输入法页面基础模板的预设字符占位符。

2.根据权利要求1所述的多字符结构自适应输入法布局生成方法,其特征在于,剔除从语法树中提取的字符结构中的数字、字母,得到必要字符结构。

3.根据权利要求1所述的多字符结构自适应输入法布局生成方法,其特征在于,输入法页面基础模板包括至少一常用输入键盘,剔除从语法树中提取的字符结构中和常用输入键盘对应的输入字符类别相同的字符,得到必要字符结构。

4.根据权利要求1所述的多字符结构自适应输入法布局生成方法,其特征在于,其中类别字符结构和必要字符结构的关联度和类别字符结构和必要字符结构在题目答案中同时出现的概率成正比。

5.一种多字符结构自适应输入法,其特征在于,基于权利要求1到4任一所述的多字符结构自适应输入法布局生成方法得到。

6.根据权利要求5所述的多字符结构自适应输入法,其特征在于,适用于教学题目答案的输入,其中教学题目答案中包括多类别的字符结构。

7.一种电子设备,其特征在于,包括:

至少一个处理器;与所述至少一个处理器通信连接的存储器,其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1到4任一所述的多字符结构自适应输入法布局生成方法。

8.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1到4任一所述的多字符结构自适应输入法布局生成方法。

说明书 :

一种多字符结构自适应输入法及其布局生成方法

技术领域

[0001] 本发明涉及输入法领域,特别涉及一种多字符结构自适应输入法及其布局生成方法,特别适用于教育软件产品的输入法设计。

背景技术

[0002] 输入法是指为了将各种符号输入计算机或者其他移动设备(如手机)而采用的编码方法, 是人机交互过程中非常重要的方式之一。
[0003] 在教育软件系统中,特别是关于填空或者简答等题型的交互上,用户通过输入法键盘完成答案的输入,然而,很多情况下用户的输入内容并非单一的符号格式,尤其是针对数学和化学等学科的答案经常涉及多种符号格式,这就需要用户用输入法输入包括多种符号的复杂答案,然而目前的输入法键盘在面对此类情况的处理上均表现不佳,从而使得用户使用教育软件产品的体验感极差, 进而也降低了用户学习的效率。
[0004] 目前,针对教育产品的输入法主要有三种键盘布局模式:
[0005] 1、固定键盘模式的输入法,这种模式的缺点显而易见,用户需要不停地切换键盘并进行寻找,才能找到并完成各个字符的输入,以数学为例,当用户需要输入一个混合了英文,数字以及特殊符号的数学公式时,需要不停地切换键盘才能实现完整答案的输入,对于用户来说,完成一次复杂答案输入的时间成本很高,且使用起来非常不智能。
[0006] 2、符号整合模式的输入法,其通过将常用符号进行聚合,帮助用户较为容易地找到可能需要的常用字符,但是聚合的符号只是类别中频率比较高的部分,并不能涵盖所有的字符,如果用户需要输入一个非常用的字符,需要先人为地遍历已显示的常用符号确认没有非常用字符后,再切换到全量的符号键盘去寻找,在这种情况下反而会显著拉长了输入时间。
[0007] 3、常用符号嵌入模式的输入法,这种模式直接将常用的符号嵌入到常用键盘中,例如在数学教育产品中,在数字键盘周围搭配上常用的数学符号,如+、-、×、÷等,但是这种方式能够嵌入的符号数量十分有限,只能满足一些一般性的输入需求,无法满足复杂答案输入的需求。

发明内容

[0008] 本发明的目的在于提供一种多字符结构自适应输入法及其布局生成方法,可提取答案数据中涉及的必要字符结构,自适应生成包含必要字符结构和类别字符结构的输入法,使得用户不再需要反复切换输入法即可快速且准确地输入包含多种字符结构的答案,极大地提高了用户的输入效率。
[0009] 为实现以上目的,本技术方案提供一种多字符结构自适应输入法布局生成方法,包括以下步骤:生成输入法页面基础模板,其中输入法页面基础模板内预设字符占位符;提取目标答案数据内的必要字符结构;获取与必要字符结构相关联的类别字符结构;填充类别字符结构和必要字符结构至输入法页面基础模板的预设字符占位符。
[0010] 在一些实施例中,对目标答案数据依据解析规则进行词法分析得到语法树,提取语法树中各个节点和叶子并进行去重,得到必要字符结构。
[0011] 在一些实施例中,剔除从语法树中提取的字符结构中的数字、字母,得到必要字符结构。
[0012] 在一些实施例中,输入法页面基础模板包括至少一常用输入键盘,剔除从语法树中提取的字符结构中和常用输入键盘对应的输入字符类别相同的字符,得到必要字符结构。
[0013] 在一些实施例中,其中类别字符结构和必要字符结构的关联度和类别字符结构和必要字符结构在题目答案中同时出现的概率成正比。
[0014] 在一些实施例中,获取类别字符结构的步骤如下:获取至少两样本答案数据组成的样本答案数据集,提取样本答案数据的备选字符,并组成备选字符集;选择备选字符集中的字符进行两两计算PMI值,生成PMI矩阵,根据PMI矩阵计算字符之间的相似度,选择和必要字符结构相似度高的字符作为类别字符结构。
[0015] 根据本发明的另一方面,提供一种多字符结构自适应输入法,其特征在于,基于所述的多字符结构自适应输入法布局生成方法得到。
[0016] 在一些实施例中,适用于教学题目答案的输入,其中教学题目答案中包括多类别的字符结构。
[0017] 根据本发明的另一方面,提供一种电子设备,包括:至少一个处理器;与所述至少一个处理器通信连接的存储器,其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的多字符结构自适应输入法。
[0018] 根据本发明的另一方面,提供一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行所述的多字符结构自适应输入法。
[0019] 相较现有技术,本技术方案具有以下的特点和有益效果:该多符号自适应输入法布局生成方法通过解析答案数据,提取答案数据中涉及的必要字符结构,根据必要字符结构获取与其关联度高的类别字符结构,自适应生成包含必要字符结构和类别字符结构的输入法,特别适用于教学软件产品的输入法的布局生成,且通过类别字符结构的匹配找寻也可帮助用户纠正易错答案的输入,并防止通过自适应生成的输入法造成题目答案信息的泄露。该自适应输入法可针对任意未知结构的题目答案数据进行分析提取,针对每道题目均自适应生成唯一的输入法,用户不需要切换输入法键盘,在同一个输入法页面即可完成所有答案内容的输入,极大地提高了用户的输入效率的同时提高了用户的用户体验度。也就是说,该方案与现有的几种模式相比,自适应生成的键盘布局是因题而异,基本上可以覆盖用户输入的需求。因而,用户可以快速且准确地输入答案,从而大幅提高做题效率。

附图说明

[0020] 图1是根据本发明的一实施例的多字符结构自适应输入法布局生成方法中提及的输入法页面基础模板的界面示意图。
[0021] 图2是根据本发明的一实施例的多字符结构自适应输入法的页面示意图。
[0022] 图3是根据本发明的一实施例的多字符结构自适应输入法布局生成方法中提及的语法树的示例示意图。
[0023] 图4是根据本发明的一实施例的多字符结构自适应输入法布局生成方法的方法流程示意图。

具体实施方式

[0024] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0025] 本发明提供一种多字符结构自适应输入法及其布局生成方法,特别适用于教育产品软件,其通过对教学答案数据进行分析,提取用户回答该答案时所需的字符结构,按照设定的规则将针对该答案的字符结构填充到预先设置好的输入法模板中,布局生成自适应具有针对性的输入法。
[0026] 该多字符结构自适应输入法布局生成方法包括以下步骤:
[0027] 步骤S1:生成输入法页面基础模板,其中输入法页面基础模板内预设字符占位符;
[0028] 步骤S2:提取目标答案数据内的必要字符结构,其中必要字符结构为输入该目标答案时必要的字符结构;
[0029] 步骤S3:获取与必要字符结构相关联的类别字符结构;
[0030] 步骤S4:填充类别字符结构和必要字符结构至输入法页面基础模板的预设字符占位符中,形成多字符结构自适应输入法。
[0031] 在步骤S1当中,输入法页面基础模板包括至少一常用输入键盘和预设字符占位符,其中常用输入键盘选择为数字输入键盘、中文输入键盘、英文输入键盘以及手写输入键盘其中的一种。在本方案的实施例中,输入法页面基础模板包括可切换选择的多个常用输入键盘和预设字符占位符,其中预设字符占位符设置在每个常用输入键盘对应的页面上。
[0032] 示例性的,如图1所示,本方案提供的输入法页面基础模板同时包括可选的数字输入键盘、中文输入键盘、英文输入键盘以及手写输入键盘,通过选择对应的输入键盘选项即可切换到对应的常用输入键盘页面,每个常用输入键盘页面设有多个虚线框显示的预设字符占位符,预设字符占位符设置在常用输入键盘的边侧不影响其正常显示规则。
[0033] 在步骤S2之前进一步包括步骤:判断目标答案数据是否符合LaTeX规范,若符合继续执行步骤S2,这是为了便于本方案实现对目标答案数据的提取。而若目标答案数据不符合LaTeX规范,则考虑以下几种处理方式:
[0034] 1.忽略此类不符合LaTeX规范的目标答案数据,只针对符合LaTeX规范的目标答案数据进行处理。此时,若判断目标答案数据不符合LaTeX规范,停止自适应输入法的生成。
[0035] 2.若判断该目标答案数据不符合LaTeX规范,生成固定键盘,若判断该目标答案数据符合LaTeX规范,执行步骤S2。
[0036] 3.若判断该目标答案数据不符合LaTeX规范,将此类目标答案数据转换为HTML格式,并通过第三方工具转换为LaTeX规范数据,第三方工具选择比如htmltolatex。
[0037] 在步骤S2当中,提取目标答案数据内的必要字符结构的方法为:对目标答案数据依据解析规则进行词法分析得到语法树,提取语法树中各个节点和叶子并进行去重,得到必要字符结构,其中目标答案数据符合LaTeX规范。
[0038] 具体的,对目标答案数据从左至右依次进行词法分析,利用设定规则对字符进行处理,以得到语法树,设定规则如下;
[0039] 1.若扫描到\字符时,利用正则表达式匹配后面连续的字母,视为一个公式结构,如\frac。
[0040] 2.若扫描到(, [, { 等符号时,与后面对应的 }, ], ) 所包含的所有内容作为整体,进行递归解析。
[0041] 3.若扫描到出现多个字符的单项式时,将各个字符进行拆分。语法树的最低粒度为单字符,如数字,字母等。
[0042] 示例性的,如若目标答案数据为公式: ,利用以上的规则对其进行词法分析,得到对应该公司的LaTeX数据为“\frac{\alpha}{x^{2}-1}”,得到的语法树如图2所示,从语法树中提取得到字符结构为“\frac,\alpha,-,^,1,x,2”。
[0043] 然而在该步骤S2中,优选地,为了避免生成的必要字符结构中隐含包括正确答案,可对从语法树中提取的字符结构进行筛选以得到必要字符结构,筛选的规则可以选择为:筛选步骤S1提及的输入法页面基础模板中常用输入键盘对应的输入字符类别,比如若常用输入键盘包括数字输入键盘,则剔除语法树中提取的字符结构中的数字,得到必要字符结构;剔除字符结构中的数字、字母,以避免答案的泄露。
[0044] 步骤S3当中,基于必要字符结构从备选字符集中提取与必要字符结构同类的类别字符结构,其中类别字符结构和必要字符结构相关性高。在本方案中,判断类别字符结构和必要字符结构相关度是否高的判断依据为:该类别字符结构和必要字符结构在题目答案中同时出现概率是否高。
[0045] 也就是说,步骤S3当中,基于必要字符结构从备选字符集中提取与必要字符结构同类的类别字符结构,其中类别字符结构和必要字符结构的关联度和类别字符结构和必要字符结构在题目答案中同时出现的概率成正比。
[0046] 此步骤中类别字符结构的选择依据主要是为了适应本方案的应用场景,本方案的提及的多字符结构自适应输入法布局生成方法特别适用于教学产品软件中针对复杂符号的题目答案的键盘设计,而针对题目答案的答案相似性高低就直接影响用户的回答准确度。换言之,若两个字符在题目答案中同时出现的概率越大,则表示这两个字符的相关性就越紧密,关联度越高,用户就越容易弄混乱。
[0047] 具体的,步骤S3进一步地包括步骤:
[0048] S31:获取至少两样本答案数据组成的样本答案数据集,并提取样本答案数据的备选字符组成的备选字符集;
[0049] S32:将备选字符集中的字符进行两两计算PMI值,生成PMI矩阵,根据PMI矩阵计算字符之间的相似度;
[0050] S33:选择和必要字符结构相似度高的字符作为类别字符结构。
[0051] 其中步骤S31中,提取样本答案数据的备选字符的方法同步骤S2所示,样本答案数据对应样本题目集,优选的,样本题目集内包括目标答案数据对应的目标题目,通过这样的方式使得样本答案数据和目标答案数据有更高的可比性。
[0052] 步骤S2当中,PMI矩阵中的矩阵值 ,其中Ci和Cj表示不同的两个字符,P(C)表示字符在样本答案数据中出现的概率,P(Ci,Cj)表示两个字符同时出现的概率,PMI(Ci, Cj)表示两个字符的点式互信息数值,数值为负表明两个字符是互斥的,数值为0表示两个字符是相互独立的,数值为正表示两个字符是相关的,正数数值越大,表明相关度越强,关联度越高。
[0053] 字符之间的相似度利用两个字符对应的PMI向量的余弦相似度计算:
[0054]
[0055] 其中n为备选字符集中的字符总个数,0<i≤n,0<j≤n。
[0056] 步骤S3当中,类别字符结构根据预设符号占位符的个数确定。
[0057] 在步骤S4当中,需要将类别字符结构和必要字符结构转换为输入法页面基础模板可加载的格式,填充至预设字符占位符中,形成多字符结构自适应输入法。
[0058] 其中将字符结构转换为输入法页面基础模板可加载的格式的方式为:设计转换函数f(φ)→Φ,其中Φ包括字符和结构,该转换函数对应词法分析产生的结果,比如,f(\alpha)=α,f(\frac)=/,其中α与/均是基于LaTeX规范的字符结构。
[0059] 示例性的,从语法树中提取得到字符结构为“\frac,\alpha,-,^,1,x,2”,则对应的可获取模板展示的字符结构为:α和/。
[0060] 而展示输入法页面基础模板可加载的格式的方式包括:对于web端的移动终端,如果类别字符结构和必要字符结构可以通过HTML可以直接展示,则直接加载;如果无法直接加载,可以通过画布来对此类类别字符结构和必要字符结构生成图片或SVG矢量图,并加载到对应的预设字符占位符中;对于Android端的移动终端,可以将输入法页面基础模板可加载的格式的设计为icon等图标,通过映射关系直接加载到预设字符占位符中。
[0061] 在一些实施例中,类别字符结构和必要字符结构以设定好的规则加载到输入法页面基础模板中,设定规则包括但不限于以下内容:
[0062] 1. 针对特定的目标答案数据,指定特定的字符作为类别字符结构,将类别字符结构加载到输入法页面基础模板中。此情况适用于特别加载对应易错答案的指定字符情况,针对容易出现易错答案的题目。
[0063] 2.设置不同类别的字符结构的优先级顺序,依据优先级顺序展示字符结构,如基本运算符优先于关系符号。
[0064] 3.设置同一类别的字符结构的优先级顺序,如基本运算符中的优先级顺序为:÷、×、-、+。
[0065] 4.指定某些预设符号占位符的固定显示字符,例如在布局模板右侧前四个占位符固定显示基本运算符,并按照优先级排序依次显示÷、×、-、+。
[0066] 如图3所示,最终形成的多字符结构自适应输入法被展示。
[0067] 示例性的,该多字符结构自适应输入法针对目标答案数据出现的字符结构有:℃,^2, °,且,和,或,%,(),【】,<,>,=等。
[0068] 值得一提的是,本方案提供的多字符结构自适应输入法布局生成方法特别适用于教学产品软件,更具体的,特别适用于数学题目、化学题目的答案输入应用,以数学答案为例,对应的字符结构如下;数字:0-9;英文字母:a-z, A-Z;中文逻辑表达式:和,或,且 等;罗马和希腊字符:α,θ,π,γ等;基本运算符:=,-,*,±等,关系符号:>,≥,=,≠,<,≤等。
[0069] 本方案提供的多字符结构自适应输入法布局生成方法的技术优势:本方法特别适用于教育软件产品的输入法设计,特别是针对包括各类类别字符的题目答案输入的输入法设计,且该方法可针对任意题目答案自动提取其内的必要字符结构,从而使得该方法具有广泛的适用性;另外,该输入法布局生成方法在用户回答每道题目时都主动触发,即,针对每道题目都有独一无二的针对性的输入法页面,提高了使用的效率和精准性,且本方案设计而成的多字符结构自适应输入法不需要切换输入法键盘,仅仅替换预设字符占位符中的字符结构即可,且本方案采用寻找和必要字符结构相似度高的类别字符结构作为填充,可在一定程度上起到针对性训练用户,帮助用户校正易错答案的效果。
[0070] 根据本发明的另一方面,本方案提供一种多字符结构自适应输入法,特别地针对教学题目答案的输入,根据其上提到的多字符结构自适应输入法布局生成方法生成,其中教学题目答案中包括多类别字符结构,可以是数学题目,化学题目,物理题目等,该多字符结构自适应输入法被加载到教学产品软件中使用,可极大程度地提高用户的用户体验感,进而提高用户的学习效率。
[0071] 本方案涉及的多字符结构自适应输入法布局生成方法被应用在WEB端和移动终端中被实现,其中移动终端可以以各种形式来实施,特别的,该多字符结构自适应输入法布局生成方法被加载在移动终端的教育软件产品上,移动终端可以是诸如移动电话、笔记本电脑、PDA(个人数字助理)、PAD(平板电脑)等。
[0072] 该多字符结构自适应输入法布局生成方法可被实现为计算机程序,本发明公开的实施例包括计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含执行以上多字符结构自适应输入法布局生成方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本发明的系统中限定的上述功能。
[0073] 作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的移动终端中所包含的;也可以是单独存在,而未装配入移动终端中。上述计算机可读介质承载有一个或者多个计算机程序,当上述一个或者多个程序被一个移动终端执行时,使得该移动终端执行自适应输入法布局生成方法所对应过的流程步骤。
[0074] 本发明不局限于上述最佳实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是具有与本申请相同或相近似的技术方案,均落在本发明的保护范围之内。