一种词码的生成方法、识别方法、装置、存储介质转让专利

申请号 : CN201910045595.5

文献号 : CN109766978B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李宝亮

申请人 : 北京悦时网络科技发展有限公司

摘要 :

本发明公开了一种词码的生成方法、识别方法、装置、存储介质,属于机器视觉识别领域。词码生成方法:输入目标词句及对应的目标文件,对目标词句的各文字基于笔画连接点进行拆分,得到拆分序列;随机选取若干拆分序列进行属性值异样处理,生成词码,与词码对应的目标文件建立关联,输出词码;词码识别方法:获取包含词码的图像,识别其中的目标词句;对目标词句按同一规则拆分后识别所有异样拆分序列,判断词码如基于系统设计的码制生成可直接读取,否则将根据词码对应的目标词句序列和异样序列,调用词码预先输入的目标文件,特点是同一词句可生成海量具备不同机器视觉特征的词码,词码形态仍为文字,人眼识别字义与机器识别合一。

权利要求 :

1.一种词码的生成方法,其特征在于,包括:

获取用户输入的目标词句及对应的目标文件;

对所述目标词句的各文字基于笔画连接点进行拆分,得到拆分序列;

判断拆分序列数量是否足以表达目标文件字符,是则基于本系统设计的码制生成词码,选择部分拆分序列进行加粗、变细不同比例、色值、笔触、形状多维度处理,基于不同机器视觉异样特征,来直接对应并表达目标文件的字符;

否则从所述拆分序列中,随机选取若干拆分序列元素进行异样处理,依次记录被异样处理的拆分序列元素的序列号,记做异样序列号;将目标词句对应的各文字发音或首字母缩写与随机数拼接,生成目标词句字义序列号,基于异样序列号及目标词句字义序列号,对应所述词码预先设定的目标文件并生成词码,基于不同拆分序列的排列组合,实现同一个词句可以生成海量具备不同机器视觉特征的词码;词码特点是融合于文字,文字拆分序列属性值异样调整保持了词码的文字可读性,视觉形态仍为文字,既能扫描后基于异样特征调用各自设定的不同目标文件,又能表达字义,机器识别与人眼识别合一。

2.如权利要求1所述的方法,其特征在于,从所述拆分序列中随机选取若干拆分序列元素进行属性值异样处理,生成词码,包括:依次记录被异样处理的拆分序列元素的序列号;

根据所述目标词句生成的目标词句字义序列号和异样序列号合并生成词码序列号,将所述词码序列号分别与所述词码及词码对应的目标文件建立关联;如基于码制生成词码,则直接基于系统设计的规则生成可读取词码,码制词码仍实现于文字构架。

3.如权利要求1所述的方法,其特征在于,对所述拆分序列元素进行的属性值进行处理,选择不同排列组合的序列及属性值维度进行组合,会让同一个词句生成数量更庞大的具备不同机器视觉意义的词码,以对应表达不同的目标文件。

4.一种词码的生成装置,其特征在于,包括:

目标获取模块,用于获取用户输入的目标词句及对应的目标文件,并触发目标拆分模块;

目标拆分模块,用于对所述目标词句的各文字基于笔画连接点进行拆分,得到拆分序列,并触发词码生成模块;

词码生成模块,用于在所述拆分序列数量足以表达目标文件字符的情形下,基于码制生成词码,选择部分拆分序列添加异样特征,基于系统设计的码制直接表达对应的目标文件字符;在所述拆分序列数量不足以表达目标文件字符的情形下,从所述拆分序列中随机选取若干拆分序列元素进行异样处理,依次记录被异样处理的拆分序列元素的序列号,记做异样序列号;将目标词句对应的各文字发音或首字母缩写与随机数拼接,生成目标词句字义序列号;将所述词码与所述目标文件基于目标词句字义序列号及异样序列号建立关联,生成词码。

5.一种词码的识别方法,其特征在于,包括:

获取包含词码的图像,识别所述词码对应的目标词句;

对所述目标词句中的各文字按笔画连接点进行拆分,得到词码拆分序列;

从所述词码拆分序列中识别出异样序列;

判断词码是否基于系统设计的码制生成,是则直接读取,进行目标文件调用;否则从所述拆分序列中,随机选取若干拆分序列元素进行异样处理,依次记录被异样处理的拆分序列元素的序列号,记做异样序列号;将目标词句对应的各文字发音或首字母缩写与随机数拼接,生成目标词句字义序列号;

根据所述目标词句对应的目标词句字义序列号和所述异样序列号,调用所述词码对应的预先设定的目标文件。

6.一种词码的识别装置,其特征在于,包括:

目标词句识别模块,用于获取包含词码的图像,识别所述词码对应的目标词句,触发词码拆分模块;

词码拆分模块,用于对所述目标词句中各文字按笔画连接点进行拆分,得到词码拆分序列,触发异样识别模块;

异样识别模块,用于从所述词码拆分序列中识别出异样序列,触发目标文件调用模块;

目标文件调用模块,用于判断词码是否基于系统设计的码制生成,是则直接读取,进行目标文件调用;否则从所述拆分序列中,随机选取若干拆分序列元素进行异样处理,依次记录被异样处理的拆分序列元素的序列号,记做异样序列号;将目标词句对应的各文字发音或首字母缩写与随机数拼接,生成目标词句字义序列号;

根据所述目标词句对应的目标词句字义序列号和所述异样序列号,调用所述词码对应的预先设定的目标文件。

7.一种词码,其特征在于,

所述词码包括经异样处理的目标词句;

所述异样处理的目标词句用于表达设定的目标文件;

所述目标词句用于生成目标词句字义序列号;

所述经异样处理的目标词句中包括异样元素;

所述异样元素用于生成异样序列号;

所述目标词句字义序列号和所述异样序列号用于生成词码序列号,以获取与所述词码序列号对应的预先保存的目标文件。

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序,所述程序用于实现如权利要求1-3所述的词码的生成方法。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序,所述程序用于实现如权利要求5所述的词码的识别方法。

说明书 :

一种词码的生成方法、识别方法、装置、存储介质

技术领域

[0001] 本发明实施例涉及机器视觉识别领域,具体涉及一种词码生成方法、识别方法、装置、存储介质。

背景技术

[0002] 随着信息技术的发展,二维码、条形码以其编码范围广、信息容量大、使用方式简易等特点得到了广泛应用。
[0003] 在实现本发明实施例的过程中,发明人发现,现有二维码技术至少存在以下问题:二维码仅为完成机器识别而存在,意味着使用二维码会占用额外的版面空间,二维码形态为深色方块视觉突兀,嵌入文章及印刷物会明显破坏阅读体验,造成排版难度且对印刷尺寸和显示精度要求较高;使用时如果不做文字及其它类型的注释,用户不知二维码的意图;
二维码机器可以识别但人眼无法识别,易被人为替换造成各种损失及问题。

发明内容

[0004] 为此,本发明实施例提供一种词码的生成方法、识别方法及装置,以解决现有技术中存在的问题。
[0005] 为了实现上述目的,本发明实施例提供如下技术方案:
[0006] 第一方面,本发明提供一种词码的生成方法,让同一个词句可以生成海量具备不同机器视觉同特征的词码,词码与文字融为一体,特点是生成后视觉形态仍为文字,机器识别后可调用各自设定的目标文件又能人眼阅读其字义,人眼识别机器识别合一。
[0007] 具体包括:
[0008] 获取用户输入的目标词句及对应的目标文件;
[0009] 对所述目标词句的各文字基于笔画连接点进行拆分,得到拆分序列;
[0010] 判断拆分序列数量是否足以表达目标文件字符,是则基于系统设计的码制生成词码,选择部分拆分序列进行加粗、变细不同比例、笔触、形状多维度处理,基于不同异样特征来直接对应并表达目标文件的各字符,文字拆分序列属性值调整又保持了词码的文字可读性;
[0011] 否则从拆分序列中,随机选取若干拆分序列元素进行异样处理,基于异样序列号和目标词句字义序列号,对应词码预先设定的目标文件并生成词码,基于不同序列的排列组合,实现同一个词句可以生成更庞大具备不同机器视觉特征的词码,词码视觉形态仍为文字,扫描后可调用各自设定的不同目标文件,机器识别与人眼识别合一。
[0012] 在本发明另一实施例中,从所述拆分序列中随机选取若干拆分序列元素进行异样处理,生成词码,包括:依次记录被异样处理的拆分序列元素的序列号;
[0013] 根据所述目标词句生成的目标词句字义序列号和异样序列号合并生成词码序列号,将所述词码序列号分别与所述词码及词码对应的目标文件建立关联;如基于码制生成词码,则直接基于系统设计的规则生成可读取词码,包括文件类型及处理方式,码制词码仍实现于各文字拆分序列。
[0014] 在本发明另一实施例中,对所述拆分序列元素进行异样处理,包括对所述拆分序列元素的属性值进行处理,选择不同排列组合的序列及维度混合,让同一个词句可生成海量具备不同机器视觉特征的词码,以对应表达不同的目标文件。
[0015] 本发明另一实施例中,所述的对目标词句的各文字基于笔画连接点进行拆分,包括:
[0016] 对所述目标词句的各文字进行识别,在所述不同语言文字能够基于笔画规则拆分的情形下,根据笔画规则对所述文字进行拆分;在所述文字不能够基于笔画规则拆分的情形下,对所述文字进行笔画连接点分析,基于连接点进行拆分,系统将保持同一拆分规则进行词码读取。
[0017] 本发明另一实施例中,所述方法还包括,
[0018] 根据所述目标词句生成目标词句字义序列号;
[0019] 相应地,从所述拆分序列中随机选取若干拆分序列元素进行异样处理,生成词码,还包括:依次记录被异样处理的拆分序列元素的序列号,记做异样序列号;
[0020] 根据所述目标词句字义序列号和所述异样序列号生成词码序列号,将所述词码序列号分别与所述词码及所述词码对应的目标文件建立关联;基于码制生成词码,则直接基于系统设计的码制生成可读取词码。
[0021] 第二方面,本发明提供一种词码的生成装置,包括:
[0022] 目标获取模块,用于获取用户输入的目标词句及对应的目标文件,并触发目标拆分模块;
[0023] 目标拆分模块,用于对所述目标词句的各文字基于笔画连接点进行拆分,得到拆分序列,并触发词码生成模块;
[0024] 词码生成模块,用于在所述拆分序列数量足以表达目标文件字符的情形下,基于码制生成词码,选择部分拆分序列添加异样特征,基于系统设计的码制直接表达对应的目标文件字符、文件类型及处理方式;在所述拆分序列数量不足以表达目标文件字符的情形下,从所述拆分序列中随机选取若干拆分序列元素进行异样处理,生成词码,将所述词码与所述目标文件基于系统的序列号规则建立关联,输出词码。
[0025] 第三方面,本发明提供一种词码的识别方法,包括:
[0026] 获取包含词码的图像,识别所述词码对应的目标词句;
[0027] 对所述目标词句中的各文字按笔画连接点进行拆分,得到词码拆分序列;
[0028] 从所述词码拆分序列中识别出异样序列;
[0029] 判断词码是否基于码制生成,是则直接读取,进行目标文件调用;否则根据所述目标词句对应的目标词句字义序列号和所述异样序列号,调用所述词码对应的预先设定的目标文件。
[0030] 第四方面,本发明提供一种词码的识别装置,包括:
[0031] 目标词句识别模块,用于获取包含词码的图像,识别所述词码对应的目标词句,触发词码拆分模块;
[0032] 词码拆分模块,用于对所述目标词句中各文字按笔画连接点进行拆分,得到词码拆分序列,触发异样识别模块;
[0033] 异样识别模块,用于从所述词码拆分序列中识别出异样序列,触发目标文件调用模块;
[0034] 目标文件调用模块,用于判断词码是否基于码制生成,是则直接读取,进行目标文件调用;否则根据所述目标词句对应的目标词句字义序列号和所述异样序列号,调用所述词码对应的预先设定的目标文件。
[0035] 第五方面,本发明提供一种词码,
[0036] 所述词码包括经异样处理的目标词句;
[0037] 所述异样处理的目标词句用于表达设定的目标文件;
[0038] 所述目标词句用于生成目标词句字义序列号;
[0039] 所述经异样处理的目标词句中包括异样元素;
[0040] 所述异样元素用于生成异样序列号;
[0041] 所述目标词句字义序列号和所述异样序列号用于生成词码序列号,以获取与所述词码序列号对应的预先保存的目标文件。
[0042] 第六方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序用于实现如上所述的词码的生成方法。
[0043] 第七方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序用于实现如上所述的词码的识别方法。
[0044] 本发明实施例具有如下优点:
[0045] 词码视觉形态为文字,同一个词句可以生成数量庞大具备不同机器视觉特征的词码,既可扫描后读取调用各自设定的不同目标文件,又能表达字义,机器识别与人眼识别合一。
[0046] 与二维码需要文字及各类注释,形态为突兀的深色方块,嵌入文章及印刷物会有明显异物感相比,词码能在各类文字场景保持顺畅阅读的同时,为用户拓展信息及连接服务。
[0047] 另外,词码融合于文字结构易于排版,应用后被人为替换难度大;人眼识别与机器识别合一,意味着无需为了实现扫描功能,使用扫描码耗用额外版面资源。
[0048] 在实际应用场景中,例如扫描不同厂商的印刷品中“操作说明视频”这六个字的词码区域,可打开数十亿不同厂商各自设定的具体产品的操作说明视频链接,用户可极便捷的进行扩展阅读及连接,且对应的目标文件可以时时在线更新;例如扫描同一儿童读物的不同词汇,可以打开不同链接进行知识查询扩展,以此类推。
[0049] 在本发明中,基于目标词句字义序列号和异样序列号打开词组对应目标文件的方式,逐级识别可在第一阶段极大避免识别错误的发生,且不受目标文件资源标识符复杂度限制。

附图说明

[0050] 为了清晰的说明本发明的实施方式,下面将对实施方式、现有技术描述中所需要使用的附图进行陈述介绍。下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
[0051] 本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均在本发明所揭示的技术内容得能涵盖的范围内。
[0052] 图1为本发明一实施例提供的一种词码的生成方法流程图;
[0053] 图2为本发明另一实施例提供的一种词码的生成装置结构图;
[0054] 图3为本发明另一实施例提供的一种词码的识别方法流程图;
[0055] 图4为本发明另一实施例提供的一种词码的识别装置结构图。
[0056] 图中:801为目标词句识别模块、802为词码拆分模块、803为异样识别模块、804为目标文件调用模块。

具体实施方式

[0057] 以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易了解本发明的其他优点及功能,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0058] 本发明中,通过对目标词句基于笔画连接点进行拆分,得到拆分序列,从拆分序列中随机获取若干拆分序列元素,对拆分序列元素进行异样处理,调整粗细、笔触、形态、色值、形状各属性值并进行多维度混合编排生成词码,基于不同序列的排列组合,让同一个词句可以生成海量具备不同机器视觉特征的词码,以码制规则、序列号规则与目标文件建立关联,扫描读取调用各自设定的不同目标文件。
[0059] 词码融合于文字结构,视觉形态仍为文字,在不破坏文字人眼识别性的同时,实现机器识别与人眼识别合一。
[0060] 在本发明的第一方面,提供一种词码的生成方法,如图1所示包括:
[0061] 步骤201:获取用户输入的目标词句及对应目标文件;
[0062] 在本发明实施例中,获取用户输入的目标词句和目标文件,对获取到的目标文件进行识别,其中,目标文件可以为统一资源标识符URL,还可以为图像信息、音频信息、文本信息、视频信息、账户信息各目标文件类型。
[0063] 系统会自动进行有效性校验,如果经过校验判定读取词码后,预先输入的目标文件能够打开,则输出词码供用户使用,用户可选不同尺寸和格式;否则提示用户输入有效的目标文件并重新生成词码。
[0064] 在识别到目标文件为图像信息、音频信息、文本信息、视频信息、账户信息中的一种的情形下,对目标文件进行格式类型识别,判定目标文件的格式类型可读,则保存。否则提示用户重新输入可识别格式类型的文件。
[0065] 进一步,在获取到目标词句及对应目标文件时,还包括:生成一组随机数,按照预设方式根据随机数生成目标词句字义序列号并保存,具体可以将目标词句对应的各文字发音或首字母缩写与随机数拼接,生成目标词句字义序列号。目标词句字义序列号用于标识当前的目标词句。
[0066] 进行举例说明,获取用户输入的目标词句和对应的目标文件,在对目标词句进行识别,识别到目标词句为汉字“我的词组”。对目标文件进行识别,识别到目标文件为统一资源标识符URL。
[0067] 更进一步,获取到的用户输入的目标词句,可以是用户根据预设规则自行进行目标词句的异样设置,相对应的,系统在获取到该目标词句时,仅需对其进行判断,在判定其可用的情形下,生成词码;否则提示用户设置为不可用。
[0068] 步骤202:对目标词句的各文字基于笔画连接点进行拆分,得到拆分序列;
[0069] 在本发明实施例中,对目标词句的各文字基于笔画连接点进行拆分的方法,包括:
[0070] 对目标词句的各文字进行识别,在识别到的文字能够基于笔画规则拆分的情形下,则根据笔画规则对文字进行拆分;否则,对文字进行连接点分析,基于连接点进行拆分,将拆分后得到各个元素作为拆分序列。进一步地,根据拆分序列,建立拆分序列中各元素的笔画序列号,作为拆分序列号。
[0071] 以目标词句为汉字中的“我的词组”进行举例说明:根据汉字笔画规则将“我的词组”进行笔画拆分,并且按照顺序依次为各笔画建立序列号,其中,“我”字中的“丿”笔画序列号为1,“我”字中的“一”笔画序列号为2,“我”字中的“亅”笔画序列号为3,“我”字中的笔画序列号为4,“我”字中的 笔画序列号为5,“我”字中的“丿”笔画序列号为6,“我”字中的“丶”笔画序列号为7,“的”字中的“丿”笔画序列号为8,“的”字中的“丨”笔画序列号为9,按照此方法即汉字笔顺规则,依次为“我的词组”中的每个笔画进行拆分和建立对应的笔画序列号。
[0072] “我的词组”这四个字笔画数30,可产生不同词码数远大于中国手机号数量,对不同组合的笔画序列采取一种异样处理(譬如单一比例加粗),其中进行异样处理的笔画为n,即可产生 种不同的“我的词组”,即产生数量极其庞大的 种词码, 种词码均可对应并经识别后打开 种链接等目标文件,系统会选择小于n不同序列数来生成不同词码,混合不同加粗比例及不同属性值,让同一词句能生成极其庞大的具备不同机器视觉特征的词码,实现扫描同一词句,可调用其各自设定的目标文件,例如扫描不同区域不同商户的同一文字“张记面馆”,可以获取不同名为张记面馆的商户设定的连接、账户信息、内容各类目标文件。
[0073] 以目标词句为英文字母“My Phrase”进行举例说明:对英文字母进行连接点分析,基于规则拆分连接点,并且按照顺序依次建立拆分序列号,将拆分序列号及对应的拆分得到的部分作为元素,组成拆分序列,其它文字以此类推。
[0074] 在本发明实施例中,检测到用户输入的目标词句对应的拆分序列中的元素少于预设值时,可以采用多种异样混合、提高拆分序列数、同一拆分序列不同异样方式叠加的方法,以扩展可生成的不同词码。在特殊文字所对应的词码穷尽时,系统会自动提示用户增加文字数量以拓展词码序列号的组合数。
[0075] 步骤203:判断拆分序列数量是否足以表达目标文件字符,是则执行步骤204;否则执行步骤205;
[0076] 步骤204:基于本系统设计的码制生成词码,选择部分拆分序列添加异样特征,来直接表达对应的目标文件字符;
[0077] 在本发明实施例中,通过判断拆分序列的数量是否足以表达目标文件字符来选择生成词码的方式,在判定拆分序列数量足以表达目标文件字符的情形下,基于码制生成词码。在判定拆分序列数量不足以表达目标文件字符的情形下,基于序列号生成词码。
[0078] 本发明中,还可以获取用户选择的生成词码机制,基于该用户选择的生成词码机制生成词码。其中,用户可选择的生成词码机制包括,基于码制生成词码机制和基于序列号生成词码机制。在依据用户选择的基于码制生成词码的情形下,还需对拆分序列的数量进行判断,在拆分序列的数量足以表达目标文件字符的情形下,基于码制生成词码;否则提示用户基于序列号生成词码。
[0079] 步骤205:从拆分序列中随机选取若干拆分序列元素进行异样处理,生成词码,将词码与目标文件建立关联,输出词码。
[0080] 在本发明实施例中,从拆分序列中随机选取至少一个元素进行异样处理,得到处理后的元素,将处理后的元素与拆分序列中的其他元素,按照拆分序列号重新组合成目标词句,得到词码,将该词码与目标文件建立关联,以使得在词码被触发时,能够获取到与之建立关联的目标文件。
[0081] 在从拆分序列中随机选取若干拆分序列元素进行异样处理时,还包括,获取所有经异样处理的元素,获取各元素的拆分序列号,采用预设方式根据各元素的拆分序列号生成异样序列号,根据异样序列号和目标词句字义序列号生成词码序列号,将词码序列号与词码、目标文件建立关联,保存词码序列号。进一步,为了保证词码及对应的目标文件的唯一性,本发明方法还包括,自动避开已经存在词码序列号及处理方式以不重复。
[0082] 在本发明实施例中,异样处理方式,包括但不限于调整粗细、笔触、形态、色值、形状中各属性值中的至少一种。更进一步,在进行异样处理时,还可以对异样处理方式对应的属性值进行设置,以使得同种异样处理方式采用不同的属性值,所生成的词码序列号不同。例如,基于同一目标词句,对拆分序列中相同的元素,采用不同的加粗比例进行加粗处理时,生成的词码序列号不同。
[0083] 通过在元素粗细、笔触、色值、形状多维度方面的处理,增多了词码序列号的数量,基于同一目标词句可生成词码数量为所有拆分序列的排列组合数,可用不同异样处理方式混合,大幅提高组合数,即同一目标词句可生成具备不同特征的词码数量。
[0084] 进一步,在词码与目标文件建立关联的情况下,还包括:扫描词码,检测是否能够获取到设定的目标文件,如果校验能获取到目标文件,则输出词码;否则返回当前步骤重新生成词码。
[0085] 在本发明中,基于目标词句字义序列号和异样序列号打开词组对应目标文件的方式,逐级识别的优势在于可在第一阶段极大避免识别错误的发生,词码生成后后台会即刻自动扫描校验能否打开设置的目标文件,以保障和提高识别准确率。
[0086] 在本发明的第二方面,提供一种词码的生成装置,如图2所示,包括:
[0087] 目标获取模块401,用于获取用户输入的目标词句及对应目标文件,并触发目标拆分模块402;
[0088] 在本发明实施例中,目标获取模块401,包括:
[0089] 目标获取单元4011,用于获取用户输入的目标词句及对应目标文件,并触发文件识别单元4012;
[0090] 文件识别单元4012,用于对目标文件进行识别,在识别到的目标文件为统一资源标识符URL的情形下,触发目标文件校验单元4013;在识别到的目标文件为非统一资源标识符URL的情形下,触发可读性校验单元4014;
[0091] 目标文件校验单元4013,用于在识别到目标文件的情形下,对目标文件进行有效性校验,并在确定目标文件有效,能够被打开时,触发文件存储单元4015;并在确定目标文件无效时,提示用户输入有效的目标文件。
[0092] 可读性校验单元4014,用于在识别到的目标文件为非统一资源标识符URL的情形下,对目标文件进行格式类别识别,根据格式类别对目标文件进行可读性校验,并在确定目标文件可读时,触发文件存储单元4015;在确定目标文件不可读时,提示用户重新输入可识别格式类型的文件。
[0093] 文件存储单元4015,用于保存目标文件。
[0094] 进一步地,目标获取模块401,还包括:
[0095] 文字序列码生成单元4016,与文件存储单元4015连接,用于生成一组随机数,按照预设方式根据随机数生成目标词句字义序列号并保存,具体可以将目标词句对应的各文字发音或首字母缩写与随机数拼接,生成目标词句字义序列号。目标词句字义序列号用于标识当前的目标词句。
[0096] 目标拆分模块402,用于对目标词句的各文字基于笔画连接点进行拆分,得到拆分序列,并触发词码生成模块403;
[0097] 在本发明实施例中,目标拆分模块402,包括:
[0098] 文字识别单元4021,用于对目标词句进行识别,并触发拆分单元4022;
[0099] 拆分单元4022,用于在识别到的文字能够基于笔画规则拆分的情形下,根据笔画规则对文字进行拆分,得到拆分序列;还用于在识别到的文字不能够基于笔画规则拆分的情形下,对文字进行连接点分析,拆分连接点,得到拆分序列。
[0100] 进一步地,拆分单元4022,具体包括:
[0101] 笔画拆分子单元40221,用于在识别到的文字能够基于笔画规则拆分的情形下,根据笔画规则对目标词句进行笔画拆分,并且按照顺序依次为各笔画建立拆分序列号,将拆分序列号及对应的笔画作为元素,组成拆分序列。
[0102] 连接点拆分子单元40222,用于在识别到的文字不能够基于笔画规则拆分的情形下,对文字进行连接点进行分析,拆分连接点,并按照顺序依次为各拆分得到部分建立拆分序列号,将拆分序列号及对应的拆分得到的部分作为元素,组成拆分序列。
[0103] 词码生成模块403,用于在拆分序列数量足以表达目标文件字符的情形下,基于码制生成词码,选择部分拆分序列添加异样特征,来直接表达对应的目标文件字符;在所述拆分序列数量不足以表达目标文件字符的情形下,从拆分序列中随机选取若干拆分序列元素进行异样处理,生成词码,将词码与目标文件建立关联,输出词码。
[0104] 在本发明实施例中,词码生成模块403,包括:
[0105] 异样处理单元4031,用于从拆分序列中随机选取至少一个元素进行异样处理,得到处理后的元素,将处理后的元素与拆分序列中的其他元素重新组合成目标词句,得到词码。
[0106] 词码序列号生成单元4032,与异样处理单元4031连接,用于在拆分序列数量不足以表达目标文件字符的情形下,获取所有经异样处理的元素,获取各元素的拆分序列号,采用预设方式根据各元素的拆分序列号生成异样序列号,根据异样序列号和目标词句字义序列号生成词码序列号;还用于判断是否已经存在词码序列号,在已经存在词码序列号的情形下,则触发异样处理单元4031,重新对目标词句进行拆分;在不存在词码序列号的情形下,将词码序列号与词码、目标文件建立关联,保存词码序列号。
[0107] 本发明实施例中,还包括:码制生成单元,用于在所述拆分序列数量足以表达目标文件字符的情形下,基于码制生成词码,选择部分拆分序列添加异样特征,来直接表达对应的目标文件字符;。
[0108] 词码校验单元4033,分别与异样处理单元4031、词码输出单元4034连接,用于在异样处理单元4031生成词码的情形下,扫描词码,检测是否能够获取到目标文件,如果在预设时间内获取到目标文件,则触发词码输出单元4034;否则触发异样处理单元4031重新生成词码;
[0109] 词码输出单元4034,用于输出词码。
[0110] 还包括,输出词码文件时添加人眼识别标签以标明可扫描,限定输出尺寸及选择规格,对小尺寸词码进行异样特征增大以保持识别性,用户可选择重新输出、选择样式自定义。
[0111] 在本发明的第三方面,提供一种词码的识别方法,如图3所示,包括:
[0112] 步骤601:获取包含词码的图像,识别词码对应的目标词句;
[0113] 在本发明实施例中,可以采用扫描的方式获取包含词码的图像,从中识别词码对应的目标词句。
[0114] 步骤602:对目标词句中的各文字按笔画连接点进行拆分,得到词码拆分序列;
[0115] 在本发明实施例中,对目标词句的各文字进行识别,在识别到的文字能够基于笔画规则拆分的情形下,则根据笔画规则对文字进行笔画拆分,并且按照顺序依次为各笔画建立拆分序列号,将拆分序列号及对应的笔画作为元素,组成词码拆分序列;在识别到的文字不能够基于笔画规则拆分的情形下,对文字进行连接点分析,拆分连接点,并按照顺序依次为拆分得到的各部分建立拆分序列号,将拆分序列号及对应的拆分得到的部分作为元素,组成词码拆分序列。
[0116] 步骤603:从词码拆分序列中识别出异样序列;
[0117] 在本发明实施例中,获取目标词句在当前环境中的标准文字属性;
[0118] 根据标准文字属性对词码拆分序列进行判断,从中筛选出与标准文字属性不同的拆分序列元素,定义为异样元素,并依次记录其异样属性。
[0119] 进一步,对词码拆分序列进行异样识别前还包括,在应用中对词码基于笔画投影进行倾角计算,根据计算结果对词码的各笔画进行自动补偿,以避免扫描词码时,因图形采集设备与词码之间存在倾角,致使采集到的词码图像变形(例如,前倾扫描词码时,会造成扫描获取到的词码图像上细下粗),造成在对词码进行异样识别时出现误差、甚至识别失败的情形。
[0120] 步骤604:判断词码是否基于码制生成,是则执行步骤605;否则执行步骤606;
[0121] 在本发明实施例中,获取异样序列中预先约定位置处的异样序列元素,根据该预先约定位置处的异样序列元素判断词码是否基于码制生成。
[0122] 步骤605:直接读取,进行目标文件调用;
[0123] 在本发明实施例中,在目标词句的拆分序列较多,足以为公众号或网址的目标文件的情形下,基于码制生成词码,使得无需把目标文件存在一个中央服务器里,节约资源,同时,读取词码调用目标文件更为便捷。
[0124] 步骤606:根据目标词句对应的目标词句字义序列号和异样序列号,调用词码对应的预先设定的目标文件。
[0125] 在本发明实施例中,可以根据异样元素的拆分序列号生成异样序列号,根据异样序列号和目标词句字义序列号生成词码序列号,获取词码序列号对应的目标文件,调用目标文件。
[0126] 进一步,在生成词码序列号时,还包括:判断词码序列号是否存在,是则获取词码序列号对应的目标文件,调用目标文件,结束;否则,提示此文字非词码,结束。
[0127] 在本发明的第四方面,提供一种词码的识别装置,如图4所示,包括:
[0128] 目标词句识别模块801,用于获取包含词码的图像,识别词码对应的目标词句,触发词码拆分模块802;
[0129] 在本发明实施例中,目标词句识别模块801,用于采用扫描的方式获取包含词码的图像,从中识别词码对应的目标词句,触发词码拆分模块802。
[0130] 词码拆分模块802,用于对目标词句中的各文字按笔画连接点进行拆分,得到词码拆分序列,触发异样识别模块803;
[0131] 在本发明实施例中,词码拆分模块802,用于对目标词句的各文字进行识别,在识别到的文字能够基于笔画规则拆分的情形下,则根据笔画规则对文字进行笔画拆分,并且按照顺序依次为各笔画建立拆分序列号,将拆分序列号及对应的笔画作为元素,组成词码拆分序列,触发异样识别模块803;在识别到的文字不能够基于笔画规则拆分的情形下,对文字进行连接点分析,拆分连接点,并按照顺序依次为各拆分得到的各部分建立拆分序列号,将拆分序列号及对应的拆分得到的部分作为元素,组成词码拆分序列,触发异样识别模块803。
[0132] 异样识别模块803,用于从词码拆分序列中识别出异样序列,触发目标文件调用模块804;
[0133] 在本发明实施例中,异样识别模块803,用于获取目标词句在当前环境中的标准文字属性,根据标准文字属性对词码拆分序列进行判断,从中筛选出与标准文字属性不同的元素,作为异样元素,并依次记录其序列。
[0134] 目标文件调用模块804,用于判断词码是否基于码制生成,是则直接读取,进行目标文件调用;否则根据目标词句对应的目标词句字义序列号和异样序列号,调用词码对应的预先设定的目标文件。
[0135] 在本发明实施例中,目标文件调用模块804,用于在词码基于系统设计的码制生成的情形下,直接读取,进行目标文件调用;用于在基于序列号生成词码的情形下,根据异样元素的拆分序列号生成异样序列号,根据异样序列号和目标词句字义序列号生成词码序列号,获取词码序列号对应的目标文件,调用目标文件。
[0136] 进一步,目标文件调用模块804,在生成词码序列号时,还用于判断词码序列号是否存在,是则获取词码序列号对应的目标文件,调用目标文件,结束;否则,提示此文字非词码,结束。
[0137] 在本发明实施例中,提供一种基于系统设计的编码规则,即码制来生成和读取词码的方式,针对词码拆分序列足以表达目标文件的情况,可选择系统中并行的直接生成词码机制来实现,其中,
[0138] 生成词码方法包括:将目标词句所有文字基于笔画节点进行拆分,每一个拆分序列都基于规定的异样特征,包括加粗不同比例、形状及各类不同属性值,来依次对应常用字符,从而表达设置的目标文件,系统会自定义部分拆分序列来表达直读词码、部分序列来表达该词码读取后调用的目标文件类型。例如:文字基于笔画节点拆分后,拆分序列第1笔加粗10%,代表字母a;第1笔加粗20%,代表字母b;第1笔加粗30%,代表字母c;以此类推完成码制编排,实现每1个拆分序列都可基于编码规则,使用加粗、笔触、变细、形状,各种异样方式相互组合来表达和对应不同字符,如表达的字符过长,系统可增加拆分序列、增加各拆分序列上的异样点以容纳更多信息,此种机制保持了字形。
[0139] 识别词码的方法包括:基于系统制定的码制即编码规则来直接读取,系统在识别目标词码时会自动启用该词码识别机制,依次识别所有拆分序列的异样特征就可读取出一个目标文件。
[0140] 在本发明第五方面,提供一种词码,词码包括经异样处理的目标词句;
[0141] 目标词句用于生成目标词句字义序列号;
[0142] 所述异样处理的目标词句用于表达设定的目标文件;
[0143] 经异样处理的目标词句中包括异样元素;
[0144] 异样元素用于生成异样序列号;
[0145] 目标词句字义序列号和异样序列号用于生成词码序列号,以获取与词码序列号对应的目标文件。
[0146] 在本发明实施例中,词码特点是基于词句各文字拆分序列属性值处理来实现,融合于文字结构,让同一个词句可以生成海量具备不同机器视觉特征的词码,实现扫描后可调用各自设定的不同目标文件,又把表达字义融为一体,为用户提供信息连接服务;
[0147] 不破坏文字人眼识别性,词码作为仍可阅读的文字出现,意味着不再需要额外的机器识别码占用版面资源,人眼识别机器识别合一。
[0148] 与二维码等方式不同,词码仅以文字形态出现,优点为既可被机器扫描读取调用对应的目标文件,又能表达文字本身的字义,可顺畅的嵌入文章、视频、图片、印刷品、户外场景。
[0149] 在本发明的第六方面,提供一种计算机可读存储介质,计算机可读存储介质中存储有程序,程序用于实现如上所述的词码的生成方法。
[0150] 在本发明的第七方面,提供一种计算机可读存储介质,计算机可读存储介质中存储有程序,程序用于实现如上所述的词码的识别方法。
[0151] 虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。