标点符号处理方法和装置转让专利

申请号 : CN201611234205.1

文献号 : CN108241612B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张轩

申请人 : 北京国双科技有限公司

摘要 :

本发明公开了一种标点符号处理方法和装置。其中,该方法包括:确定待处理文本中是否有多个相邻的标点符号;在待处理文本中有多个相邻的标点符号的情况下,确定多个相邻的标点符号是否属于预设标点符号组合集,其中,预设标点符号组合集包括至少一组由多个标点符号构成的标点符号组合;在多个相邻的标点符号不属于预设标点符号组合集的情况下,保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号中的其他标点符号删除,得到处理后文本。本发明解决了现有技术中用户由于手误等原因而使文本中出现多个连续的标点符号导致文本中标点符号使用错误的技术问题。

权利要求 :

1.一种标点符号处理方法,其特征在于,包括:确定待处理文本中是否有多个相邻的标点符号;

在所述待处理文本中有所述多个相邻的标点符号的情况下,确定所述多个相邻的标点符号是否属于预设标点符号组合集,其中,所述预设标点符号组合集包括至少一组由多个标点符号构成的标点符号组合;

在所述多个相邻的标点符号不属于所述预设标点符号组合集的情况下,保留所述多个相邻的标点符号中的一个标点符号,并将所述多个相邻的标点符号中的其他标点符号删除,得到处理后文本;

在所述多个相邻的标点符号是相同的标点符号的情况下,保留所述多个相邻的标点符号中的一个标点符号,并将所述多个相邻的标点符号中的其他标点符号删除,包括:保留所述多个相邻的标点符号中任意一个标点符号,并将所述多个相邻的标点符号中的其他标点符号删除;

将所述多个相邻的标点符号中的其他标点符号删除后,所述方法还包括:存储所述待处理文本和/或已删除的标点符号在所述待处理文本中的位置信息;得到处理后文本之后,所述方法还包括:接收对所述已删除的标点符号的撤回命令;根据所述撤回命令和所述待处理文本,或者根据所述撤回命令和所述已删除的标点符号在所述待处理文本中的位置信息,将所述处理后文本恢复为所述待处理文本;

其中,在所述多个相邻的标点符号不是相同的标点符号的情况下,保留所述多个相邻的标点符号中的一个标点符号,并将所述多个相邻的标点符号中的其他标点符号删除,包括:使用自然语言处理技术对所述待处理文本中所述多个相邻的标点符号前的语句进行分析,得到分析结果,根据所述分析结果得到保留所述多个相邻的标点符号中的一个标点符号的方案。

2.根据权利要求1所述的方法,其特征在于,保留所述多个相邻的标点符号中的一个标点符号,并将所述多个相邻的标点符号中的其他标点符号删除之前,包括:确定所述多个相邻的标点符号是否是相同的标点符号。

3.一种标点符号处理装置,其特征在于,包括:第一确定模块,用于确定待处理文本中是否有多个相邻的标点符号;

第二确定模块,用于在所述待处理文本中有所述多个相邻的标点符号的情况下,确定所述多个相邻的标点符号是否属于预设标点符号组合集,其中,所述预设标点符号组合集包括至少一组由多个标点符号构成的标点符号组合;

处理模块,用于在所述多个相邻的标点符号不属于所述预设标点符号组合集的情况下,保留所述多个相邻的标点符号中的一个标点符号,并将所述多个相邻的标点符号中的其他标点符号删除,得到处理后文本;

所述处理模块包括:第一处理模块,用于在所述多个相邻的标点符号是相同的标点符号的情况下,保留所述多个相邻的标点符号中任意一个标点符号,并将所述多个相邻的标点符号中的其他标点符号删除;

所述装置还包括:存储模块,用于在所述处理模块将所述多个相邻的标点符号中的其他标点符号删除后,存储所述待处理文本和/或已删除的标点符号在所述待处理文本中的位置信息;接收模块,用于在所述处理模块得到处理后文本之后,接收对所述已删除的标点符号的撤回命令;撤回模块,用于根据所述撤回命令和所述待处理文本,或者根据所述撤回命令和所述已删除的标点符号在所述待处理文本中的位置信息,将所述处理后文本恢复为所述待处理文本;

其中,所述处理模块包括:第三处理模块,用于在所述多个相邻的标点符号不是相同的标点符号的情况下,使用自然语言处理技术对所述待处理文本中所述多个相邻的标点符号前的语句进行分析,得到分析结果,根据所述分析结果得到保留所述多个相邻的标点符号中的一个标点符号的方案。

4.根据权利要求3所述的装置,其特征在于,所述装置还包括:第三确定模块,用于在所述处理模块保留所述多个相邻的标点符号中的一个标点符号,并将所述多个相邻的标点符号中的其他标点符号删除之前,确定所述多个相邻的标点符号是否是相同的标点符号。

说明书 :

标点符号处理方法和装置

技术领域

[0001] 本发明涉及文本处理领域,具体而言,涉及一种标点符号处理方法和装置。

背景技术

[0002] 随着互联网的普及,文本信息爆炸性增长,人们每天需要处理的文本信息越来越多,在写入文本信息的时候,或者在对文本信息进行一些例如粘贴、复制、修改等操作的时
候,经常会出现标点符号错误的问题,例如,在逗号后面多打了一个句号或者多打了一个逗
号,或者在一句话结尾的句号前粘贴了另一句话,粘贴的话结尾也是一个句号,这样就出现
了两个句号,由于标点符号较小,很容易被用户忽略,并且不易检查出来,导致了文本中标
点符号使用错误,影响文本内容的理解。
[0003] 针对上述现有技术中用户由于手误等原因而使文本中出现多个连续的标点符号导致文本中标点符号使用错误的问题,目前尚未提出有效的解决方案。

发明内容

[0004] 本发明实施例提供了一种标点符号处理方法和装置,以至少解决现有技术中用户由于手误等原因而使文本中出现多个连续的标点符号导致文本中标点符号使用错误的技
术问题。
[0005] 根据本发明实施例的一个方面,提供了一种标点符号处理方法,包括:确定待处理文本中是否有多个相邻的标点符号;在待处理文本中有多个相邻的标点符号的情况下,确
定多个相邻的标点符号是否属于预设标点符号组合集,其中,预设标点符号组合集包括至
少一组由多个标点符号构成的标点符号组合;在多个相邻的标点符号不属于预设标点符号
组合集的情况下,保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号
中的其他标点符号删除,得到处理后文本。
[0006] 可选的,保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号中的其他标点符号删除之前,包括:确定多个相邻的标点符号是否是相同的标点符号。
[0007] 可选的,在多个相邻的标点符号是相同的标点符号的情况下,保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号中的其他标点符号删除,包括:保留多
个相邻的标点符号中任意一个标点符号,并将多个相邻的标点符号中的其他标点符号删
除。
[0008] 可选的,在多个相邻的标点符号不是相同的标点符号的情况下,保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号中的其他标点符号删除,包括:从预
设的标点符号保留数据库中查找与多个相邻的标点符号匹配的标点符号保留方案,其中,
标点符号保留数据库包括至少一组由多个标点符号构成的标点符号组合以及与标点符号
组合匹配的标点符号保留方案,标点符号保留方案为保留多个相邻的标点符号中的一个标
点符号的方案;和/或,使用自然语言处理技术对待处理文本中多个相邻的标点符号前的语
句进行分析,得到分析结果,根据分析结果得到保留多个相邻的标点符号中的一个标点符
号的方案。
[0009] 可选的,将多个相邻的标点符号中的其他标点符号删除后,方法还包括:存储待处理文本和/或已删除的标点符号在待处理文本中的位置信息;得到处理后文本之后,还包
括:接收对已删除的标点符号的撤回命令;根据撤回命令和待处理文本,或者根据撤回命令
和已删除的标点符号在待处理文本中的位置信息,将处理后文本恢复为待处理文本。
[0010] 根据本发明实施例的另一方面,还提供了一种标点符号处理装置,包括:第一确定模块,用于确定待处理文本中是否有多个相邻的标点符号;第二确定模块,用于在待处理文
本中有多个相邻的标点符号的情况下,确定多个相邻的标点符号是否属于预设标点符号组
合集,其中,预设标点符号组合集包括至少一组由多个标点符号构成的标点符号组合;处理
模块,用于在多个相邻的标点符号不属于预设标点符号组合集的情况下,保留多个相邻的
标点符号中的一个标点符号,并将多个相邻的标点符号中的其他标点符号删除,得到处理
后文本。
[0011] 可选的,装置还包括:第三确定模块,用于在处理模块保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号中的其他标点符号删除之前,确定多个相邻的
标点符号是否是相同的标点符号。
[0012] 可选的,处理模块包括:第一处理模块,用于在多个相邻的标点符号是相同的标点符号的情况下,保留多个相邻的标点符号中任意一个标点符号,并将多个相邻的标点符号
中的其他标点符号删除。
[0013] 可选的,处理模块包括:第二处理模块,用于在多个相邻的标点符号不是相同的标点符号的情况下,从预设的标点符号保留数据库中查找与多个相邻的标点符号匹配的标点
符号保留方案,其中,标点符号保留数据库包括至少一组由多个标点符号构成的标点符号
组合以及与标点符号组合匹配的标点符号保留方案,标点符号保留方案为保留多个相邻的
标点符号中的一个标点符号的方案;和/或第三处理模块,用于在多个相邻的标点符号不是
相同的标点符号的情况下,使用自然语言处理技术对待处理文本中多个相邻的标点符号前
的语句进行分析,得到分析结果,根据分析结果得到保留多个相邻的标点符号中的一个标
点符号的方案。
[0014] 可选的,装置还包括:存储模块,用于在处理模块将多个相邻的标点符号中的其他标点符号删除后,存储待处理文本和/或已删除的标点符号在待处理文本中的位置信息;接
收模块,用于在处理模块得到处理后文本之后,接收对已删除的标点符号的撤回命令;撤回
模块,用于根据撤回命令和待处理文本,或者根据撤回命令和已删除的标点符号在待处理
文本中的位置信息,将处理后文本恢复为待处理文本。
[0015] 在本发明实施例中,采用预先设置标点符号集的方式,首先确定待处理文本中是否有多个相邻的标点符号,在待处理文本中有多个相邻的标点符号的情况下,确定多个相
邻的标点符号是否属于预设标点符号组合集,在多个相邻的标点符号不属于预设标点符号
组合集的情况下,说明标点符号使用错误,则保留多个相邻的标点符号中的一个标点符号,
并将多个相邻的标点符号中的其他标点符号删除,最终得到处理后文本,达到了在出现多
个相邻的标点符号的情况下最终只保留一个标点符号的目的,从而对使用错误的标点符号
进行了纠正,并且操作简单,易于实现,使纠正后的文本易于阅读,方便理解,进而解决了现
有技术中用户由于手误等原因而使文本中出现多个连续的标点符号导致文本中标点符号
使用错误的技术问题。

附图说明

[0016] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0017] 图1是根据本发明实施例1的一种标点符号处理方法的流程图;
[0018] 图2是根据本发明实施例2的一种标点符号处理装置的结构图;
[0019] 图3是根据本发明实施例2的一种可选的标点符号处理装置的结构图;
[0020] 图4是根据本发明实施例2的一种可选的标点符号处理装置的结构图;
[0021] 图5是根据本发明实施例2的一种可选的标点符号处理装置的结构图;以及
[0022] 图6是根据本发明实施例2的一种可选的标点符号处理装置的结构图。

具体实施方式

[0023] 为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是
本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人
员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范
围。
[0024] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆
盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于
清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品
或设备固有的其它步骤或单元。
[0025] 实施例1
[0026] 根据本发明实施例,提供了一种标点符号处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并
且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所
示出或描述的步骤。
[0027] 图1是根据本发明实施例的标点符号处理方法,如图1所示,该方法包括如下步骤:
[0028] 步骤S102,确定待处理文本中是否有多个相邻的标点符号。
[0029] 具体的,在获取到待处理文本后,首先需要对待处理文本中的标点符号使用情况进行检测,如果检测某一句话后面的标点符号有两个或两个以上,则确定待处理文本中有
多个相邻的标点符号。如果待处理文本中没有出现多个相邻的标点符号一起使用的情况,
则不对该待处理文本进行后续处理。
[0030] 步骤S104,在待处理文本中有多个相邻的标点符号的情况下,确定多个相邻的标点符号是否属于预设标点符号组合集,其中,预设标点符号组合集包括至少一组由多个标
点符号构成的标点符号组合。
[0031] 具体的,预设标点符号集也就是用户提前设置的不进行处理的标点符号组合,可以包括符合语义规则的标点符号组合,例如“《,”以及“》。”等,也可以包括用户个性化标点
符号使用习惯,例如,一些用户喜欢连续使用多个感叹号来表示强调,或者在一些非正式文
本中,一些用户喜欢连续使用多个句号表示无语等,因此可以构建符合用户个性化需求的
预设标点符号集。
[0032] 此处需要说明的是,预设标点符号集是动态变化的,可以对预设标点符号集进行修改、增加、删除等操作。
[0033] 步骤S106,在多个相邻的标点符号不属于预设标点符号组合集的情况下,保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号中的其他标点符号删除,
得到处理后文本。
[0034] 具体的,在多个相邻的标点符号属于预设标点符号组合集的情况下,说明多个相邻的标点符号没有使用错误,也就是符合语义规则,或者符合用户的个性化标点符号使用
习惯,因此可以不作处理,在多个相邻的标点符号不属于预设标点符号组合集的情况下,说
明多个相邻的标点符号使用错误,因此最终只需要保留多个相邻的标点符号中的一个标点
符号即可,其他的标点符号可以予以删除。
[0035] 此处需要说明的是,由于待处理文本中可能有多处出现多个相邻的标点符号,因此可以提供用户一键全部对使用错误的标点符号进行修改的操作键,也可以提供给针对每
一处使用错误的标点符号进行单独修改的操作键,例如,可以按照在待处理文本中出现的
顺序提示用户选择或确定对多个相邻的标点符号进行保留及删除的方案。
[0036] 在本发明实施例中,采用预先设置标点符号集的方式,首先确定待处理文本中是否有多个相邻的标点符号,在待处理文本中有多个相邻的标点符号的情况下,确定多个相
邻的标点符号是否属于预设标点符号组合集,在多个相邻的标点符号不属于预设标点符号
组合集的情况下,说明标点符号使用错误,则保留多个相邻的标点符号中的一个标点符号,
并将多个相邻的标点符号中的其他标点符号删除,最终得到处理后文本,达到了在出现多
个相邻的标点符号的情况下最终只保留一个标点符号的目的,从而对使用错误的标点符号
进行了纠正,并且操作简单,易于实现,使纠正后的文本易于阅读,方便理解,进而解决了现
有技术中用户由于手误等原因而使文本中出现多个连续的标点符号导致文本中标点符号
使用错误的技术问题。
[0037] 在一种可选的实施例中,步骤S106中保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号中的其他标点符号删除之前,包括:步骤S202,确定多个相邻
的标点符号是否是相同的标点符号。
[0038] 具体的,在确定多个相邻的标点符号不属于预设标点符号组合集的情况下,需要判断多个相邻的标点符号的构成,也就是多个相邻的标点符号中的标点符号是否全都是一
样的标点符号,如果多个相邻的标点符号中有一个标点符号与其他的标点符号不同,就确
定多个相邻的标点符号不是相同的标点符号。
[0039] 在一种可选的实施例中,步骤S202中,在多个相邻的标点符号是相同的标点符号的情况下,步骤S106中保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点
符号中的其他标点符号删除,包括:步骤S302,保留多个相邻的标点符号中任意一个标点符
号,并将多个相邻的标点符号中的其他标点符号删除。
[0040] 具体的,如果多个相邻的标点符号是相同的标点符号,在只需要保留一个标点符号的情况下,保留其中任意一个标点符号都是一样的,因此可以保留多个相邻的标点符号
中任意一个标点符号,并将多个相邻的标点符号中的其他标点符号删除,最终只剩下一个
标点符号,例如,在出现多个句号的情况下,经过步骤S302的处理,最终只剩下一个句号。
[0041] 在一种可选的实施例中,步骤S202中,在多个相邻的标点符号不是相同的标点符号的情况下,步骤S106中保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标
点符号中的其他标点符号删除,包括:步骤S402,从预设的标点符号保留数据库中查找与多
个相邻的标点符号匹配的标点符号保留方案,其中,标点符号保留数据库包括至少一组由
多个标点符号构成的标点符号组合以及与标点符号组合匹配的标点符号保留方案,标点符
号保留方案为保留多个相邻的标点符号中的一个标点符号的方案;和/或步骤S404,使用自
然语言处理技术对待处理文本中多个相邻的标点符号前的语句进行分析,得到分析结果,
根据分析结果得到保留多个相邻的标点符号中的一个标点符号的方案。
[0042] 可选的,如果多个相邻的标点符号不是相同的标点符号,就需要确定到底保留哪一个标点符号,在这种情况下,可以有两种解决方案,第一种解决方案即预先构建标点符号
保留数据库,标点符号保留数据库中存储有标点符号组合以及针对该标点符号组合的标点
符号保留方案,也就是最终保留多个相邻的标点符号中哪一个标点符号的方案,因此,在知
道了多个相邻的标点符号的情况下,根据标点符号保留数据库,就可以找出匹配的标点符
号保留方案,例如对于连续出现一个句号一个逗号的标点符号组合,标点符号保留数据库
中可以规定该情况的标点符号保留方案为保留逗号,删除句号。
[0043] 此处需要说明的是,标点符号保留数据库是动态变化的,可以对标点符号保留数据库进行修改、增加、删除等操作,并且,标点符号保留数据库中一组标点符号组合对应的
标点符号保留方案可以不仅仅是一个方案,可以为多个方案,本发明可以提供给用户多个
方案来供用户选择。
[0044] 可选的,第二种解决方案为使用自然语言处理技术(NLP)对待处理文本中多个相邻的标点符号前的语句进行分析,得到分析结果,其中,对待处理文本中多个相邻的标点符
号前的语句进行的分析可以是语气分析、语义分析等,语气分析的分析结果可能是疑问句、
感叹句、陈述句等,如果是疑问句则优选为保留多个相邻的标点符号中的问号,如果是感叹
句则优选为保留多个相邻的标点符号中的感叹号,如果是陈述句则优选为保留多个相邻的
标点符号中的问号,此处需要说明的是,在得到分析结果后,根据分析结果得到保留多个相
邻的标点符号中的一个标点符号的方案可以不仅仅是一个方案,可以是多个方案,例如,如
果是疑问句也可以保留多个相邻的标点符号中的句号,如果是感叹句也可以保留多个相邻
的标点符号中的句号,如果是陈述句也可以保留多个相邻的标点符号中的逗号,因此可以
提供给用户多个方案来供用户选择。
[0045] 在一种可选的实施例中,步骤S106中将多个相邻的标点符号中的其他标点符号删除后,方法还包括:步骤S502,存储待处理文本和/或已删除的标点符号在待处理文本中的
位置信息。步骤S106中得到处理后文本之后,还包括:步骤S504,接收对已删除的标点符号
的撤回命令。步骤S506,根据撤回命令和待处理文本,或者根据撤回命令和已删除的标点符
号在待处理文本中的位置信息,将处理后文本恢复为待处理文本。
[0046] 可选的,在用户对待处理文本进行标点符号处理得到处理后文本后,用户可能会对处理的结果不满意,也就是不符合用户预期,为了使处理后文本还能恢复到原始文本,也
就是待处理文本,在将多个相邻的标点符号中的其他标点符号删除后,需要存储待处理文
本和/或从待处理文本中删除的标点符号在待处理文本中的位置信息,在接收到用户的撤
回命令时候,可以执行将处理后文本恢复为待处理文本的操作,具体的,可以在操作界面上
设置撤回键,当用户点击该撤回键时,即可发送撤回命令。
[0047] 在一种可选的实施例中,在对待处理文本进行标点符号处理的操作界面上,可以设置标点符号处理按键,当接收到用户点击该标点符号处理按键产生的标点符号处理命令
时,既可开始进行检测待处理文本中的标点符号,确定是否有多个相邻的标点符号的情况
出现,在待处理文本中有多个相邻的标点符号的情况下,确定并且显示不属于预设标点符
号组合集的多个相邻的标点符号,标点符号处理的操作界面也可以设置对使用错误的标点
符号一次性全部处理以及单独处理的按键,如果用户选择了全部处理的按键,则针对待处
理文本中使用错误的标点符号一次性全部处理,也就是针对待处理文本中所有不属于预设
标点符号组合集中的多个相邻的标点符号,保留每一处多个相邻的标点符号中的一个标点
符号,在执行全部处理操作前,可以由用户确认每一处多个相邻的标点符号的标点符号保
留方案;如果用户选择了单独处理按键,则可以按照不属于预设标点符号组合集的多个相
邻的标点符号在待处理文本中出现的顺序,由用户确认针对每一处多个相邻的标点符号的
标点符号保留方案,然后逐个进行处理,无论用户选择哪种处理方式,均可实现对待处理文
本中不属于预设标点符号组合集的多个相邻的标点符号进行纠正,使每一处多个相邻的标
点符号最终只保留一个标点符号的目的。
[0048] 实施例2
[0049] 根据本发明实施例,提供了一种标点符号处理装置的产品实施例,图2是根据本发明实施例的标点符号处理装置,如图2所示,该装置包括第一确定模块101、第二确定模块
103和处理模块105。
[0050] 其中,第一确定模块101,用于确定待处理文本中是否有多个相邻的标点符号;第二确定模块103,用于在待处理文本中有多个相邻的标点符号的情况下,确定多个相邻的标
点符号是否属于预设标点符号组合集,其中,预设标点符号组合集包括至少一组由多个标
点符号构成的标点符号组合;处理模块105,用于在多个相邻的标点符号不属于预设标点符
号组合集的情况下,保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符
号中的其他标点符号删除,得到处理后文本。
[0051] 在本发明实施例中,采用预先设置标点符号集的方式,首先由第一确定模块101确定待处理文本中是否有多个相邻的标点符号,在待处理文本中有多个相邻的标点符号的情
况下,第二确定模块103确定多个相邻的标点符号是否属于预设标点符号组合集,在多个相
邻的标点符号不属于预设标点符号组合集的情况下,说明标点符号使用错误,处理模块105
保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号中的其他标点符号
删除,最终得到处理后文本,达到了在出现多个相邻的标点符号的情况下最终只保留一个
标点符号的目的,从而对使用错误的标点符号进行了纠正,并且操作简单,易于实现,使纠
正后的文本易于阅读,方便理解,进而解决了现有技术中用户由于手误等原因而使文本中
出现多个连续的标点符号导致文本中标点符号使用错误的技术问题。
[0052] 此处需要说明的是,上述第一确定模块101、第二确定模块103和处理模块105对应于实施例1中的步骤S102至步骤S106,上述模块与对应的步骤所实现的示例和应用场景相
同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以
在诸如一组计算机可执行指令的计算机系统中执行。
[0053] 在一种可选的实施例中,如图3所示,装置还包括:第三确定模块201,用于在处理模块105保留多个相邻的标点符号中的一个标点符号,并将多个相邻的标点符号中的其他
标点符号删除之前,确定多个相邻的标点符号是否是相同的标点符号。
[0054] 此处需要说明的是,上述第三确定模块201对应于实施例1中的步骤S202,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要
说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中
执行。
[0055] 在一种可选的实施例中,如图4所示,处理模块105包括:第一处理模块301,用于在多个相邻的标点符号是相同的标点符号的情况下,保留多个相邻的标点符号中任意一个标
点符号,并将多个相邻的标点符号中的其他标点符号删除。
[0056] 此处需要说明的是,上述第一处理模块301对应于实施例1中的步骤S302,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要
说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中
执行。
[0057] 在一种可选的实施例中,如图5所示,处理模块105包括第二处理模块401和/或第三处理模块403,其中,第二处理模块401,用于在多个相邻的标点符号不是相同的标点符号
的情况下,从预设的标点符号保留数据库中查找与多个相邻的标点符号匹配的标点符号保
留方案,其中,标点符号保留数据库包括至少一组由多个标点符号构成的标点符号组合以
及与标点符号组合匹配的标点符号保留方案,标点符号保留方案为保留多个相邻的标点符
号中的一个标点符号的方案;第三处理模块403,用于在多个相邻的标点符号不是相同的标
点符号的情况下,使用自然语言处理技术对待处理文本中多个相邻的标点符号前的语句进
行分析,得到分析结果,根据分析结果得到保留多个相邻的标点符号中的一个标点符号的
方案。
[0058] 此处需要说明的是,上述第二处理模块401、第三处理模块403对应于实施例1中的步骤S402至步骤S404,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上
述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算
机可执行指令的计算机系统中执行。
[0059] 在一种可选的实施例中,如图6所示,装置还包括存储模块501、接收模块503和撤回模块505。其中,存储模块501,用于在处理模块105将多个相邻的标点符号中的其他标点
符号删除后,存储待处理文本和/或已删除的标点符号在待处理文本中的位置信息;接收模
块503,用于在处理模块105得到处理后文本之后,接收对已删除的标点符号的撤回命令;撤
回模块505,用于根据撤回命令和待处理文本,或者根据撤回命令和已删除的标点符号在待
处理文本中的位置信息,将处理后文本恢复为待处理文本。
[0060] 此处需要说明的是,上述存储模块501、接收模块503和撤回模块505对应于实施例1中的步骤S502至步骤S506,上述模块与对应的步骤所实现的示例和应用场景相同,但不限
于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组
计算机可执行指令的计算机系统中执行。
[0061] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0062] 在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0063] 在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为
一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或
者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互
之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连
接,可以是电性或其它的形式。
[0064] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个
单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0065] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单
元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0066] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上
或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式
体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机
设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或
部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read‑Only Memory)、随机存取存
储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的
介质。
[0067] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应
视为本发明的保护范围。