一种中文翻译成英文的英语译文质量分析方法转让专利

申请号 : CN201710535667.5

文献号 : CN107357783B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 黄桂敏吴闯黄思睿

申请人 : 桂林电子科技大学

摘要 :

本发明提供一种中文翻译成英文的英语译文质量分析方法,该方法是一个由顺序连接的翻译英语译文预处理模块、翻译英语译文忠实度分析模块、翻译英语译文语义相似度分析模块、翻译英语译文质量分析结果生成模块组成的分析模型。一篇翻译英语译文通过该分析模型处理后,最后能够得到这篇翻译英语译文的质量分析结果。本发明的方法解决了中文翻译成英文的英语译文质量自动分析问题,其分析结果比传统的中文翻译成英文的英语译文质量分析方法的分析结果更好。

权利要求 :

1.一种中文翻译成英文的英语译文质量分析方法,其特征是:包括一个由顺序连接的翻译英语译文预处理模块、翻译英语译文忠实度分析模块、翻译英语译文语义相似度分析模块、翻译英语译文质量分析结果生成模块组成的分析模型,其分析方法包括如下步骤:(1)翻译英语译文预处理模块输入翻译英语译文和标准英语译文,对翻译英语译文和标准英语译文分别进行分词、单词小写化、去除停用词;对分词、单词小写化、去除停用词的翻译英语译文和标准英语译文进行词性标注、词性消歧、短语切块;输出上述处理的翻译英语译文和标准英语译文的预处理结果;

(2)翻译英语译文忠实度分析模块输入翻译英语译文、标准英语译文、翻译英语译文预处理结果、标准英语译文预处理结果,编号翻译英语译文、标准英语译文、翻译英语译文预处理结果、标准英语译文预处理结果中的单词;对翻译英语译文中的单词与标准英语译文中的单词进行精确匹配并记录匹配成功的单词及其编号;对翻译英语译文和标准英语译文精确匹配剩余的单词进行词干匹配并记录匹配成功的单词及其编号;对翻译英语译文和标准英语译文词干匹配剩余的单词进行同义词匹配并记录匹配成功的单词及其编号;利用训练翻译英语译文集和标准英语译文集生成的单词匹配率准确率权重和翻译英语译文中匹配成功的单词总数计算并输出翻译英语译文的忠实度;

(3)翻译英语译文语义相似度分析模块输入翻译英语译文、标准英语译文词性消歧结果;根据词性消歧结果查找并记录单词在英语语义词典中对应的节点编号;在英语语义词典中,从翻译英语译文单词对应的节点编号查找到标准英文单词对应的节点编号,记录下查找路径上每个单词对应的节点编号及节点之间有向边的概率;根据查找路径上每个单词对应的节点编号和节点之间有向边的概率,生成翻译英语译文中单词概率分布二维向量,并迭代计算出标准英语译文中单词概率分布二维向量;合并翻译英语译文中单词概率分布二维向量得到翻译英语译文概率分布二维向量,并从翻译英语译文概率分布二维向量中提取单词概率值,生成翻译英语译文概率分布一维向量;合并标准英语译文单词概率分布二维向量得到标准英语译文概率分布二维向量,并从标准英语译文概率分布二维向量中提取单词概率值,生成标准英语译文概率分布一维向量;根据翻译英语译文概率分布一维向量和标准英语译文概率分布一维向量计算并输出翻译英语译文语义相似度;

(4)翻译英语译文质量分析结果生成模块输入翻译英语译文忠实度分析模块的输出结果、翻译英语译文语义相似度分析模块的输出结果;根据翻译英语译文忠实度分析模块的输出结果、翻译英语译文语义相似度分析模块的输出结果生成翻译英语译文的质量分数和评语。

2.根据权利要求1所述的分析方法,其特征是:所述的翻译英语译文预处理模块处理步骤如下:P201开始;

P202读入翻译英语译文和标准英语译文;

P203判断翻译英语译文与标准英语译文数量是否相同,如果是则转P204,否则转P202;

P204对翻译英语译文分词并将翻译英语译文分词后的单词小写化;

P205输出翻译英语译文的分词结果和翻译英语译文的单词小写化结果;

P206统计翻译英语译文单词总数;

P207对翻译英语译文的分词结果进行词性标注;

P208对翻译英语译文的词性标注结果进行短语切块;

P209对翻译英语译文的短语切块结果进行词性消歧;

P210输出翻译英语译文的词性标注结果、翻译英语译文的词性消歧结果、翻译英语译文的短语切块结果;

P211对标准英语译文分词并将标准英语译文分词后的单词小写化;

P212输出标准英语译文的分词结果和标准英语译文的单词小写化结果;

P213统计标准英语批译文单词总数;

P214对标准英语译文的分词结果进行词性标注;

P215对标准英语译文的词性标注结果进行短语切块;

P216对标准英语译文的短语切块结果进行词性消歧;

P217输出标准英语译文的词性标注结果、标准英语译文的词性消歧结果、标准英语译文的短语切块结果;

P218结束。

3.根据权利要求1所述的分析方法,其特征是:所述的翻译英语译文忠实度分析模块的计算公式定义如下:(1)单词匹配准确率计算公式

单词匹配准确率是指翻译英语译文与标准英语译文之间单词匹配成功个数和翻译英语译文中单词总数的比值,它的计算公式如下:(2)单词匹配召回率计算公式

单词匹配召回率是指翻译英语译文与标准英语译文之间单词匹配成功个数和标准英语译文中单词总数的比值,它的计算公式如下:(3)调和平均值计算公式

调和平均值是指计算公式(1)的单词匹配准确率与计算公式(2)的单词匹配召回率之间的平均值,它的计算公式如下:在计算公式(3)中,单词匹配准确率由计算公式(1)计算得出,单词匹配召回率由计算公式(2)计算得出,a是单词匹配准确率的权重,1-a是单词匹配召回率的权重;

(4)惩罚系数值计算公式

惩罚系数值是减少调和平均值引起的翻译英语译文内容与标准英语译文内容之间误差的系数,它的计算公式如下:在计算公式(4)中,短语数是指翻译英语译文中名词短语和动词短语的总数;b是惩罚系数值大小的调整参数;c是短语数与翻译英语译文中匹配成功的单词数比值大小的调整参数;b和c均由翻译英语译文忠实度分析模块计算得出;

(5)翻译英语译文忠实度计算公式

翻译英语译文忠实度是指翻译英语译文的单词与标准英语译文的单词语义相似程度,它的计算公式如下:翻译英语译文忠实度=(1-惩罚系数值)×调和平均值  (5)在计算公式(5)中,调和平均数值由计算公式(3)计算得出,惩罚系数值由计算公式(4)计算得出。

4.根据权利要求3所述的分析方法,其特征是:所述的翻译英语译文忠实度分析模块处理步骤如下:P301开始;

P302读入翻译英语译文的分词结果和翻译英语译文的单词小写化结果;

P303读入标准英语译文的分词结果和标准英语译文的单词小写化结果;

P304根据翻译英语译文的分词结果和翻译英语译文的单词小写化结果、标准英语译文的分词结果和标准英语译文的单词小写化结果,生成翻译英语译文-标准英语译文的文本对;

P305读入一组翻译英语译文-标准英语译文的文本对;

P306将翻译英语译文-标准英语译文的文本对中翻译英语译文每个单词从零开始编号;

P307将翻译英语译文-标准英语译文的文本对中标准英语译文每个单词从零开始编号;

P308将翻译英语译文-标准英语译文的文本对中翻译英语译文每个单词,以及翻译英语译文-标准英语译文的文本对中的标准英语译文每个单词进行精确匹配;

P309统计翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文精确匹配成功的单词及编号;

P310判断翻译英语译文-标准英语译文的文本对中翻译英语译文是否还有未精确匹配的单词,如果是则转P308,否则转P311;

P311将翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文没有精确匹配成功的单词进行词干化;

P312将词干化后翻译英语译文-标准英语译文的文本对中翻译英语译文中单词,以及词干化后的翻译英语译文-标准英语译文的文本对中标准英语译文的单词进行词干匹配;

P313统计翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文词干匹配成功的单词及编号;

P314判断翻译英语译文-标准英语译文的文本对中翻译英语译文中是否还有未词干化匹配的单词,如果是则转P312,否则转P315;

P315将翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文没有词干匹配成功的单词进行词义释义化;

P316将词义释义化后翻译英语译文-标准英语译文的文本对中翻译英语译文的单词,以及词义释义化后翻译英语译文-标准英语译文的文本对中标准英语译文的单词进行同义词匹配;

P317统计翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文同义词匹配成功的单词及编号;

P318判断翻译英语译文-标准英语译文的文本对中翻译英语译文中是否还有未同义词匹配的单词,如果是则转P315,否则转P319;

P319判断是否还有未批改的翻译英语译文-标准英语译文的文本对,如果是则转P305,否则转P320;

P320读入翻译英语译文-标准英语译文的文本对中翻译英语译文单词,以及翻译英语译文-标准英语译文的文本对中标准英语译文单词精确匹配的结果;

P321读入翻译英语译文-标准英语译文的文本对中翻译英语译文单词,以及翻译英语译文-标准英语译文的文本对中标准英语译文单词词干匹配的结果;

P322读入翻译英语译文-标准英语译文的文本对中翻译英语译文单词,以及翻译英语译文-标准英语译文的文本对中标准英语译文单词同义词匹配的结果;

P323标出翻译英语译文-标准英语译文的文本对中翻译英语译文匹配成功的单词;

P324读入翻译英语译文-标准英语译文的文本对中翻译英语译文单词总数;

P325读入翻译英语译文-标准英语译文的文本对中标准英语译文单词总数;

P326将翻译英语译文-标准英语译文的文本对中翻译英语译文的单词总数,以及翻译英语译文-标准英语译文的文本对中标准英语译文中单词总数,翻译英语译文-标准英语译文的文本对中翻译英语译文精确匹配、词干匹配、同义词匹配成功的单词总数,代入翻译英语译文忠实度分析模块的计算公式(1)、计算公式(2)计算翻译英语译文-标准英语译文的文本对中翻译英语译文单词匹配的准确率和召回率;

P327利用翻译英语译文集和标准英语译文集训练得出最优参数a,b,c的值;

P328将a的值、翻译英语译文-标准英语译文的文本对中翻译英语译文单词匹配的准确率、翻译英语译文-标准英语译文的文本对中翻译英语译文单词匹配的召回率代入翻译英语译文忠实度分析模块的计算公式(3)计算调和平均数;

P329将参数b、c的值,翻译英语译文-标准英语译文的文本对中翻译英语译文短语的数量,翻译英语译文-标准英语译文的文本对中翻译英语译文精确匹配、词干匹配、同义词匹配成功的单词总数,代入翻译英语译文忠实度分析模块的计算公式(4)计算惩罚系数;

P330将调和平均数,惩罚系数代入翻译英语译文忠实度分析模块的计算公式(5)计算翻译英语译文忠实度;

P331结束。

5.根据权利要求3所述的分析方法,其特征是:所述的翻译英语译文语义相似度分析模块的计算公式定义如下:(1)概率分布向量计算公式

概率分布向量是指在英语语义词典中,从翻译英语译文单词对应的节点查找标准英文单词对应的节点,查找路径上每个单词对应的节点编号及节点之间有向边的概率构成的向量,它的计算公式如下:概率分布向量t=(1-a)×邻接矩阵×概率分布向量t-1+a×概率分布向量0      (6)在计算公式(6)中,t表示查找的次数,a表示第t次查找路径上有向边的概率,邻接矩阵表示英语语义词典中的单词邻接矩阵,概率分布向量0表示查找起始位置节点的概率分布向量,概率分布向量t-1表示第t-1次查找节点的概率分布向量,概率分布向量t表示第t次查找节点的概率分布向量;

(2)翻译英语译文语义相似度计算公式

翻译英语译文语义相似度是指翻译英语译文内容与标准英语译文内容之间语义相似程度,它的计算公式如下:在计算公式(7)中,翻译英语译文概率分布一维向量是指在英语语义词典中,从翻译英语译文单词对应的节点编号查找标准英文单词对应的节点编号,查找路径上每个单词对应的节点之间有向边的概率构成的一维向量;标准英语译文概率分布一维向量是指在英语语义词典中,从翻译英语译文单词对应的节点编号查找标准英文单词对应的节点编号,查找路径结束位置节点连接的有向边的概率构成的一维向量;||翻译英语译文概率分布一维向量||是指翻译英语译文概率分布一维向量的模;||标准英语译文概率分布一维向量||是指标准英语译文概率分布一维向量的模。

6.根据权利要求5所述的分析方法,其特征是:所述的翻译英语译文语义相似度分析模块处理步骤如下:P401开始;

P402读取翻译英语译文单词词性消歧结果;

P403遍历翻译英语译文单词词性消歧结果;

P404根据翻译英语译文单词词性消歧结果查找并记录单词在英语语义词典中对应的节点编号;

P405判断是否还有未遍历的翻译英语译文单词词性消歧结果,如果是则转P403,否则转P406;

P406读取标准英语译文单词词性消歧结果;

P407遍历标准英语译文单词词性消歧结果;

P408根据标准英语译文单词词性消歧结果查找并记录单词在英语语义词典中对应的节点编号;

P409判断是否还有未遍历的标准英语译文单词词性消歧结果,如果是则转P407,否则转P410;

P410在英语语义词典中,从翻译英语译文单词对应的节点编号查找标准英文单词对应的节点编号;

P411记录下查找路径上每个单词对应的节点编号及节点之间有向边的概率;

P412根据查找路径上每个单词对应的节点编号和节点之间有向边的概率,生成翻译英语译文单词概率分布二维向量;

P413根据翻译英语译文语义相似度分析模块的计算公式(6)计算出标准英语译文中单词概率分布二维向量;

P414判断翻译英语译文中是否还有未查找的单词,如果是则转P410,否则转P415;

P415合并翻译英语译文单词概率分布二维向量得到翻译英语译文概率分布二维向量;

P416从翻译英语译文概率分布二维向量中提取单词概率值,生成翻译英语译文概率分布一维向量;

P417合并标准英语译文单词概率分布二维向量得到标准英语译文概率分布二维向量;

P418从标准英语译文概率分布二维向量中提取单词概率值,生成标准英语译文概率分布一维向量;

P419根据翻译英语译文语义相似度分析模块的计算公式(7)计算并输出翻译英语译文语义相似度;

P420结束。

7.根据权利要求5所述的分析方法,其特征是:所述的翻译英语译文质量分析结果生成模块的计算公式定义如下:(1)翻译英语译文质量分数计算公式

翻译英语译文质量分数是指翻译英语译文的内容与标准英语译文的内容语义相似程度,它的计算公式如下:英语译文质量分数=0.5×英语译文忠实度+0.5×英语译文语义相似度(8)在计算公式(8)中,翻译英语译文忠实度得分由计算公式(5)计算得出,翻译英语译文语义相似度由计算公式(7)计算得出。

8.根据权利要求7所述的分析方法,其特征是:所述的翻译英语译文质量分析结果生成模块处理步骤如下:P501开始;

P502读取翻译英语译文忠实度;

P503读取翻译英语译文语义相似度;

P504根据翻译英语译文质量分析结果生成模块的计算公式(8)计算并输出翻译英语译文质量分数;

P505根据翻译英语译文质量分数输出翻译英语译文评语;

P506结束。

说明书 :

一种中文翻译成英文的英语译文质量分析方法

技术领域

[0001] 本发明涉及统计自然语言处理技术、中文翻译成英文的译文中的单词语法分析技术、中文翻译成英文中的内容分析技术、具体是一种中文翻译成英文的英语译文质量分析方法。

背景技术

[0002] 传统的中文翻译成英文的英语译文质量分析方法主要有完全匹配方法、编辑距离方法、基于N元语法方法。完全匹配方法对中文翻译成英文的英语译文要求过严,仅当翻译英语译文的内容与标准英语译文的内容完全相同时,才判定翻译的英语译文正确,这种方法完全忽略了英语单词的一词多形问题。编辑距离方法对中文翻译成英文的英语译文质量分析方法是:检查翻译英语译文变换到标准英语译文过程中英语单词的插入、删除、替换次数,然后根据这些次数来分析翻译英语译文的翻译质量,然而这种方法无法检查出翻译英语译文与标准英语译文之间的单词是否为同义词。N元语法方法是对翻译英语译文中出现的N元组与标准英语译文中出现的N元组进行匹配,根据匹配成功的个数来分析英语译文的翻译质量,然而这种方法无法检查出翻译英语译文与标准英语译文之间的语义相似度。本发明为了解决上述问题,提供了一种中文翻译成英文的英语译文质量分析方法。

发明内容

[0003] 本发明的中文翻译成英语的英语译文质量分析方法的总体处理流程如图1所示,其中包括翻译英语译文预处理模块、翻译英语译文忠实度分析模块、翻译英语译文语义相似度分析模块、翻译英语译文质量分析结果生成模块。
[0004] 其中的翻译英语译文预处理模块的处理流程是:第一,输入翻译英语译文和标准英语译文,对翻译英语译文和标准英语译文分别进行分词、单词小写化、去除停用词;第二,对分词、单词小写化、去除停用词的翻译英语译文和标准英语译文进行词性标注、词性消歧、短语切块;第三,输出上述两步处理的翻译英语译文和标准英语译文的预处理结果。
[0005] 其中的翻译英语译文忠实度分析模块的处理流程是:第一,输入翻译英语译文、标准英语译文、翻译英语译文预处理结果、标准英语译文预处理结果,编号翻译英语译文、标准英语译文、翻译英语译文预处理结果、标准英语译文预处理结果中的单词;第二,对翻译英语译文中的单词与标准英语译文中的单词进行精确匹配并记录匹配成功的单词及其编号;第三,对翻译英语译文和标准英语译文精确匹配剩余的单词进行词干匹配并记录匹配成功的单词及其编号;第四,对翻译英语译文和标准英语译文词干匹配剩余的单词进行同义词匹配并记录匹配成功的单词及其编号;第五,利用训练翻译英语译文集和标准英语译文集生成的单词匹配率准确率权重和翻译英语译文中匹配成功的单词总数计算并输出翻译英语译文的忠实度。
[0006] 其中的翻译英语译文语义相似度分析模块的处理流程是:第一,输入翻译英语译文、标准英语译文词性消歧结果;第二,根据词性消歧结果查找并记录单词在英语语义词典中对应的节点编号;第三,在英语语义词典中,从翻译英语译文单词对应的节点编号查找到标准英文单词对应的节点编号,记录下查找路径上每个单词对应的节点编号及节点之间有向边的概率;第四,根据查找路径上每个单词对应的节点编号和节点之间有向边的概率,生成翻译英语译文中单词概率分布二维向量,并迭代计算出标准英语译文中单词概率分布二维向量;第五,合并翻译英语译文中单词概率分布二维向量得到翻译英语译文概率分布二维向量,并从翻译英语译文概率分布二维向量中提取单词概率值,生成翻译英语译文概率分布一维向量;第六,合并标准英语译文单词概率分布二维向量得到标准英语译文概率分布二维向量,并从标准英语译文概率分布二维向量中提取单词概率值,生成标准英语译文概率分布一维向量;第七,根据翻译英语译文概率分布一维向量和标准英语译文概率分布一维向量计算并输出翻译英语译文语义相似度。
[0007] 其中的翻译英语译文质量分析结果生成模块的处理流程是:第一,输入翻译英语译文忠实度分析模块的输出结果、翻译英语译文语义相似度分析模块的输出结果;第二,根据翻译英语译文忠实度分析模块的输出结果、翻译英语译文语义相似度分析模块的输出结果生成翻译英语译文的质量分数和评语。
[0008] 本发明的定义如下:
[0009] 1、单词词性标注集
[0010] 本发明采用美国宾州大学宾州树库标注集,按照该标注集的规则对翻译英语译文和标准英语译文进行单词词性标注。
[0011] 2、单词词性标注结构
[0012] 单词词性标注是对翻译英语译文和标准英语译文中的单词进行词性标注处理,下面是词性标注后的格式:
[0013] 单词1[词性1#词性2#词性3……]单词2[词性1#词性2#词性3……]……[0014] 单词n[词性1#词性2#词性3……]
[0015] 3、短语切块结构
[0016] 短语切块是对翻译英语译文和标准英语译文中的名词短语和动词短语进行切分,下面是短语切块的格式:
[0017] 单词1/短语切块1,单词2/短语切块2,……单词n/短语切块n
[0018] 4、词性消歧结构
[0019] 词性消歧是指,将翻译英语译文和标准英语译文的单词词性标注结果与英语词汇网络词典作对比,并从中去除标注错误的单词词性标注结果,下面是词性消歧后的格式:
[0020] 单词1[词性1#词性2#词性3……]单词2[词性1#词性2#词性3……]……[0021] 单词n[词性1#词性2#词性3……]
[0022] 5、英语语义词典
[0023] 英语语义词典是指按字母顺序组织词条信息,而且基于单词多个释义的语义词典,该词典包含了常见的名词、动词、形容词、副词和虚词五大部分,英语语义词典的格式如下:
[0024] 单词1[词性1][词频1][偏移量1][词典文件详细路径1][词义释义1][词义对应节点编号1][节点之间有向边概率1]
[0025] 单词1[词性2][词频2][偏移量2][词典文件详细路径2][词义释义2][词义对应节点编号2][节点之间有向边概率2]
[0026] ……
[0027] 单词1[词性n][词频n][偏移量n][词典文件详细路径n][词义释义n][词义对应节点编号n][节点之间有向边概率n]
[0028] 单词2[词性1][词频1][偏移量1][词典文件详细路径1][词义释义1][词义对应节点编号1][节点之间有向边概率1]
[0029] 单词2[词性2][词频2][偏移量2][词典文件详细路径2][词义释义2][词义对应节点编号2][节点之间有向边概率2]
[0030] ……
[0031] 单词2[词性n][词频n][偏移量n][词典文件详细路径n][词义释义n][词义对应节点编号n][节点之间有向边概率n]
[0032] 单词n[词性1][词频1][偏移量1][词典文件详细路径1][词义释义1][词义对应节点编号1][节点之间有向边概率1]
[0033] 单词n[词性2][词频2][偏移量2][词典文件详细路径2][词义释义2][词义对应节点编号2][节点之间有向边概率2]
[0034] ……
[0035] 单词n[词性n][词频n][偏移量n][词典文件详细路径n][词义释义n][词义对应节点编号n][节点之间有向边概率n]
[0036] 6、单词匹配准确率计算公式
[0037] 单词匹配准确率是指翻译英语译文与标准英语译文之间单词匹配成功个数和翻译英语译文中单词总数的比值,它的计算公式如下:
[0038]
[0039] 7、单词匹配召回率计算公式
[0040] 单词匹配召回率是指翻译英语译文与标准英语译文之间单词匹配成功个数和标准英语译文中单词总数的比值,它的计算公式如下:
[0041]
[0042] 8、调和平均值计算公式
[0043] 调和平均值是指计算公式(1)的单词匹配准确率与计算公式(2)的单词匹配召回率之间的平均值,它的计算公式如下:
[0044]
[0045] 在计算公式(3)中,单词匹配成功率由计算公式(1)计算得出,单词匹配召回率由计算公式(2)计算得出,a是单词匹配准确率的权重,1-a是单词匹配召回率的权重。
[0046] 9、惩罚系数值计算公式
[0047] 惩罚系数值是减少调和平均值引起的翻译英语译文内容与标准英语译文内容之间误差的系数,它的计算公式如下:
[0048]
[0049] 在计算公式(4)中,短语数是指翻译英语译文中名词短语和动词短语的总数;b是惩罚系数值大小的调整参数;c是短语数与翻译英语译文中匹配成功的单词数比值大小的调整参数;b和c均由翻译英语译文忠实度分析模块计算得出。
[0050] 10、翻译英语译文忠实度计算公式
[0051] 翻译英语译文忠实度是指翻译英语译文的单词与标准英语译文的单词语义相似程度,它的计算公式如下:
[0052] 翻译英语译文忠实度=(1-惩罚系数值)×调和平均值  (5)
[0053] 在计算公式(5)中,调和平均数值由计算公式(3)计算得出,惩罚系数值由计算公式(4)计算得出。
[0054] 11、概率分布向量计算公式
[0055] 概率分布向量是指在英语语义词典中,从翻译英语译文单词对应的节点查找标准英文单词对应的节点,查找路径上每个单词对应的节点编号及节点之间有向边的概率构成的向量,它的计算公式如下:
[0056] 概率分布向量t=(1-a)×邻接矩阵×概率分布向量t-1+a×概率分布向量0  (6)[0057] 在计算公式(6)中,t表示查找的次数,a表示第t次查找路径上有向边的概率,邻接矩阵表示英语语义词典中的单词邻接矩阵,概率分布向量0表示查找起始位置节点的概率分布向量,概率分布向量t-1表示第t-1次查找节点的概率分布向量,概率分布向量t表示第t次查找节点的概率分布向量。
[0058] 12、翻译英语译文语义相似度计算公式
[0059] 翻译英语译文语义相似度是指翻译英语译文内容与标准英语译文内容之间语义相似程度,它的计算公式如下:
[0060]
[0061] 在计算公式(7)中,翻译英语译文概率分布一维向量是指在英语语义词典中,从翻译英语译文单词对应的节点编号查找标准英文单词对应的节点编号,查找路径上每个单词对应的节点之间有向边的概率构成的一维向量;标准英语译文概率分布一维向量是指在英语语义词典中,从翻译英语译文单词对应的节点编号查找标准英文单词对应的节点编号,查找路径结束位置节点连接的有向边的概率构成的一维向量;||翻译英语译文概率分布一维向量||是指翻译英语译文概率分布一维向量的模;||标准英语译文概率分布一维向量||是指标准英语译文概率分布一维向量的模。
[0062] 13、翻译英语译文质量分数计算公式
[0063] 翻译英语译文质量分数是指翻译英语译文的内容与标准英语译文的内容语义相似程度,它的计算公式如下:
[0064] 英语译文质量分数=0.5×英语译文忠实度+0.5×英语译文语义相似度  (8)[0065] 在计算公式(8)中,翻译英语译文忠实度得分由计算公式(5)计算得出,翻译英语译文语义相似度由计算公式(7)计算得出。
[0066] 具体步骤
[0067] 本发明分析方法的翻译英语译文预处理模块、翻译英语译文忠实度分析模块、翻译英语译文语义相似度分析模块、翻译英语译文质量分析结果生成模块的处理流程图如下所述。
[0068] 如图2所示,所述的翻译英语译文预处理模块处理流程如下:
[0069] P201开始;
[0070] P202读入翻译英语译文和标准英语译文;
[0071] P203判断翻译英语译文与标准英语译文数量是否相同,如果是则转P204,否则转P202;
[0072] P204对翻译英语译文分词并将翻译英语译文分词后的单词小写化;
[0073] P205输出翻译英语译文的分词结果和翻译英语译文的单词小写化结果;
[0074] P206统计翻译英语译文单词总数;
[0075] P207对翻译英语译文的分词结果进行词性标注;
[0076] P208对翻译英语译文的词性标注结果进行短语切块;
[0077] P209对翻译英语译文的短语切块结果进行词性消歧;
[0078] P210输出翻译英语译文的词性标注结果、翻译英语译文的词性消歧结果、翻译英语译文的短语切块结果;
[0079] P211对标准英语译文分词并将标准英语译文分词后的单词小写化;
[0080] P212输出标准英语译文的分词结果和标准英语译文的单词小写化结果;
[0081] P213统计标准英语批译文单词总数;
[0082] P214对标准英语译文的分词结果进行词性标注;
[0083] P215对标准英语译文的词性标注结果进行短语切块;
[0084] P216对标准英语译文的短语切块结果进行词性消歧;
[0085] P217输出标准英语译文的词性标注结果、标准英语译文的词性消歧结果、标准英语译文的短语切块结果;
[0086] P218结束。
[0087] 如图3所示,所述的翻译英语译文忠实度分析模块处理流程如下:
[0088] P301开始;
[0089] P302读入翻译英语译文的分词结果和翻译英语译文的单词小写化结果;
[0090] P303读入标准英语译文的分词结果和标准英语译文的单词小写化结果;
[0091] P304根据翻译英语译文的分词结果和翻译英语译文的单词小写化结果、标准英语译文的分词结果和标准英语译文的单词小写化结果,生成翻译英语译文-标准英语译文的文本对;
[0092] P305读入一组翻译英语译文-标准英语译文的文本对;
[0093] P306将翻译英语译文-标准英语译文的文本对中翻译英语译文每个单词从零开始编号;
[0094] P307将翻译英语译文-标准英语译文的文本对中标准英语译文每个单词从零开始编号;
[0095] P308将翻译英语译文-标准英语译文的文本对中翻译英语译文每个单词,以及翻译英语译文-标准英语译文的文本对中的标准英语译文每个单词进行精确匹配;
[0096] P309统计翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文精确匹配成功的单词及编号;
[0097] P310判断翻译英语译文-标准英语译文的文本对中翻译英语译文是否还有未精确匹配的单词,如果是则转P308,否则转P311;
[0098] P311将翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文没有精确匹配成功的单词进行词干化;
[0099] P312将词干化后翻译英语译文-标准英语译文的文本对中翻译英语译文中单词,以及词干化后的翻译英语译文-标准英语译文的文本对中标准英语译文的单词进行词干匹配;
[0100] P313统计翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文词干匹配成功的单词及编号;
[0101] P314判断翻译英语译文-标准英语译文的文本对中翻译英语译文中是否还有未词干化匹配的单词,如果是则转P312,否则转P315;
[0102] P315将翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文没有词干匹配成功的单词进行词义释义化;
[0103] P316将词义释义化后翻译英语译文-标准英语译文的文本对中翻译英语译文的单词,以及词义释义化后翻译英语译文-标准英语译文的文本对中标准英语译文的单词进行同义词匹配;
[0104] P317统计翻译英语译文-标准英语译文的文本对中翻译英语译文,以及翻译英语译文-标准英语译文的文本对中标准英语译文同义词匹配成功的单词及编号;
[0105] P318判断翻译英语译文-标准英语译文的文本对中翻译英语译文中是否还有未同义词匹配的单词,如果是则转P315,否则转P319;
[0106] P319判断是否还有未批改的翻译英语译文-标准英语译文的文本对,如果是则转P305,否则转P320;
[0107] P320读入翻译英语译文-标准英语译文的文本对中翻译英语译文单词,以及翻译英语译文-标准英语译文的文本对中标准英语译文单词精确匹配的结果;
[0108] P321读入翻译英语译文-标准英语译文的文本对中翻译英语译文单词,以及翻译英语译文-标准英语译文的文本对中标准英语译文单词词干匹配的结果;
[0109] P322读入翻译英语译文-标准英语译文的文本对中翻译英语译文单词,以及翻译英语译文-标准英语译文的文本对中标准英语译文单词同义词匹配的结果;
[0110] P323标出翻译英语译文-标准英语译文的文本对中翻译英语译文匹配成功的单词;
[0111] P324读入翻译英语译文-标准英语译文的文本对中翻译英语译文单词总数;
[0112] P325读入翻译英语译文-标准英语译文的文本对中标准英语译文单词总数;
[0113] P326将翻译英语译文-标准英语译文的文本对中翻译英语译文的单词总数,以及翻译英语译文-标准英语译文的文本对中标准英语译文中单词总数,翻译英语译文-标准英语译文的文本对中翻译英语译文精确匹配、词干匹配、同义词匹配成功的单词总数,代入翻译英语译文忠实度分析模块的计算公式(1)、计算公式(2)计算翻译英语译文-标准英语译文的文本对中翻译英语译文单词匹配的准确率和召回率;
[0114] P327利用翻译英语译文集和标准英语译文集训练得出最优参数a,b,c的值;
[0115] P328将a的值、翻译英语译文-标准英语译文的文本对中翻译英语译文单词匹配的准确率、翻译英语译文-标准英语译文的文本对中翻译英语译文单词匹配的召回率代入翻译英语译文忠实度分析模块的计算公式(3)计算调和平均数;
[0116] P329将参数b、c的值,翻译英语译文-标准英语译文的文本对中翻译英语译文短语的数量,翻译英语译文-标准英语译文的文本对中翻译英语译文精确匹配、词干匹配、同义词匹配成功的单词总数,代入翻译英语译文忠实度分析模块的计算公式(4)计算惩罚系数;
[0117] P330将调和平均数,惩罚系数代入翻译英语译文忠实度分析模块的计算公式(5)计算翻译英语译文忠实度;
[0118] P331结束。
[0119] 如图4所示,所述的翻译英语译文语义相似度分析模块处理流程如下:
[0120] P401开始;
[0121] P402读取翻译英语译文单词词性消歧结果;
[0122] P403遍历翻译英语译文单词词性消歧结果;
[0123] P404根据翻译英语译文单词词性消歧结果查找并记录单词在英语语义词典中对应的节点编号;
[0124] P405判断是否还有未遍历的翻译英语译文单词词性消歧结果,如果是则转P403,否则转P406;
[0125] P406读取标准英语译文单词词性消歧结果;
[0126] P407遍历标准英语译文单词词性消歧结果;
[0127] P408根据标准英语译文单词词性消歧结果查找并记录单词在英语语义词典中对应的节点编号;
[0128] P409判断是否还有未遍历的标准英语译文单词词性消歧结果,如果是则转P407,否则转P410;
[0129] P410在英语语义词典中,从翻译英语译文单词对应的节点编号查找标准英文单词对应的节点编号;
[0130] P411记录下查找路径上每个单词对应的节点编号及节点之间有向边的概率;
[0131] P412根据查找路径上每个单词对应的节点编号和节点之间有向边的概率,生成翻译英语译文单词概率分布二维向量;
[0132] P413根据翻译英语译文语义相似度分析模块的计算公式(6)计算出标准英语译文中单词概率分布二维向量;
[0133] P414判断翻译英语译文中是否还有未查找的单词,如果是则转P410,否则转P415;
[0134] P415合并翻译英语译文单词概率分布二维向量得到翻译英语译文概率分布二维向量;
[0135] P416从翻译英语译文概率分布二维向量中提取单词概率值,生成翻译英语译文概率分布一维向量;
[0136] P417合并标准英语译文单词概率分布二维向量得到标准英语译文概率分布二维向量;
[0137] P418从标准英语译文概率分布二维向量中提取单词概率值,生成标准英语译文概率分布一维向量;
[0138] P419根据翻译英语译文语义相似度分析模块的计算公式(7)计算并输出翻译英语译文语义相似度;
[0139] P420结束。
[0140] 如图5所示,所述的翻译英语译文质量分析结果生成模块处理流程如下:
[0141] P501开始;
[0142] P502读取翻译英语译文忠实度;
[0143] P503读取翻译英语译文语义相似度;
[0144] P504根据翻译英语译文质量分析结果生成模块的计算公式(8)计算并输出翻译英语译文质量分数;
[0145] P505根据翻译英语译文质量分数输出翻译英语译文评语;
[0146] P506结束。

附图说明

[0147] 图1是本发明方法的总体处理流程图;
[0148] 图2是本发明方法的翻译英语译文预处理模块处理流程图;
[0149] 图3是本发明方法的翻译英语译文忠实度分析模块处理流程图;
[0150] 图4是本发明方法的翻译英语译文语义相似度分析模块处理流程图;
[0151] 图5是本发明方法的翻译英语译文质量分析结果生成模块处理流程图。

具体实施方式

[0152] 本发明的一种中译英短文翻译质量的分析方法的具体实施方式分为如下五个步骤。
[0153] 第一步骤:执行“翻译英语译文预处理模块”
[0154] 本发明实施方式中输入的英语译文取材于全国大学生英语六级翻译题目,中文翻译题目、某学生作答的翻译英文译文、官方给出的标准英语译文结果如下:
[0155] 中文翻译题目:
[0156] 中国的创新正以前所未有的速度蓬勃发展。为了在科学技术上尽快赶超世界发达国家,中国近年来大幅度增加了研究开发资金。中国的大学和研究所正在积极开展创新研究,这些研究覆盖了从大数据到生物化学,从新能源到机器人等各类高科技领域。它们还与各地的科技园合作,使创新成果商业化。与此同时,无论在产品还是商业模式上,中国企业家也在努力争做创新的先锋,以适应国内外消费市场不断变化和增长的需求。
[0157] 翻译英语译文:
[0158] Innovation is progressing in an unprecedented speed in China.In order to catch up with those developed countries in the world as fast as it can in the science and technology field,China has increased funds for development research substantially in recent years.Universities and research institutions in China are actively carrying out innovation researches,which cover high-technology fields such as big data,biochemistry,new energy and robots,etc.They also cooperate with science park in various regions,commercializing the research results of innovation.Meanwhile,no matter in production and business model,entrepreneurs in China are competing to be pioneers in innovation to adapt to the constantly changing and increasing needs of the consumer market at home and abroad.
[0159] 标准英语译文:
[0160] China's innovation is flourishing faster than ever before.In order to surpass developed countries on science and technology as soon as possible,China has sharply increased  research and development fund.Chinese universities and institutes are actively doing innovative researches,covering various fields of high technology,from big data to biochemistry,and from new energy to robots.They are also cooperating with science and technology parks in different places,so as to commercialize their fruits of innovation.In the meantime,to adapt to the changing foreign and domestic market,and to satisfy the growing demand,Chinese entrepreneurs are also making pioneering efforts to innovate their products and business models.
[0161] (1)对翻译英语译文和标准英语译文进行词性标注后,生成的词性标注结果如下所示:
[0162] 翻译英语译文词性标注结果:
[0163] [Innovation[innovation#NN:UN*],[#null*],is[be#VBZ*],[#null*],progressing[progress#VBG*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],an[a#DT*],[#null*],unprecedented[unprecedented#JJ*],[#null*],speed[speed#NN:UN*,speed#VB*,speed#VBP*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],China[China#NNP*,china#JJ*,china#NN:U*],.[.#.*]]
[0164] [In[In#NNP*,in#IN*,in#NN*,in#RP*],[#null*],order[order#NN:UN*,order#UH*,order#VB*,order#VBP*],[#null*],to[to#IN*,to#TO*],[#null*],catch[catch#NN*,catch#VB*,catch#VBP*],[#null*],up[up#IN*,up#JJ*,up#NN*,up#RP*,up#VB*,up#VBP*],[#null*],with[with#IN*,with#RP*],[#null*],those[those#DT*],[#null*],developed[develop#VBD*,develop#VBN*],[#null*],countries[country#NNS*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],the[the#DT*],[#null*],world[world#JJ*,world#NN:UN*],[#null*],as[as#CC*,as#IN*,as#RB*],[#null*],fast[fast#JJ*,fast#NN*,fast#RP*,fast#VB*,fast#VBP*],[#null*],as[as#CC*,as#IN*,as#RB*],[#null*],it[it#PRP*],[#null*],can[can#MD*,can#NN*,can#VB*,can#VBP*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],the[the#DT*],[#null*],science[science#NN:UN*],[#null*],and[and#CC*],[#null*],technology[technology#NN:UN*],[#null*],field[field#NN*,field#VB*,field#VBP*],,[,#,*],[#null*],China[China#NNP*,china#JJ*,china#NN:U*],[#null*],has[have#VBZ*],[#null*],increased[increase#VBD*,increase#VBN*],[#null*],funds[fund#NNS*,fund#VBZ*],[#null*],for[for#CC*,for#IN*,for#RP*],[#null*],development[development#NN:UN*],[#null*],research[research#NN:U*,research#VB*,research#VBP*],[#null*],substantially[substantially#RB*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],recent[recent#JJ*],[#null*],years[year#NNS*],.[.#.*]]
[0165] [Universities[university#NNS*],[#null*],and[and#CC*],[#null*],research[research#NN:U*,research#VB*,research#VBP*],[#null*],institutions[institution#NNS*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],China[China#NNP*,china#JJ*,china#NN:U*],[#null*],are[are#NN*,be#VBP*],[#null*],actively[actively#RB*],[#null*],carrying[carry#VBG*],[#null*],out[out#IN*,out#NN*,out#RB*,out#RP*,out#UH*,out#VB*,out#VBP*],[#null*],innovation[innovation#NN:UN*],[#null*],researches[research#NNS*,research#VBZ*],,[,#,*],[#null*],which[which#WDT*,which#WP*],[#null*],cover[cover#NN:UN*,cover#VB*,cover#VBP*],[#null*],high-technology[high-technology#JJ*],[#null*],fields[field#NNS*,field#VBZ*],[#null*],such[such#DT*,such#PDT*],[#null*],as[as#CC*,as#IN*,as#RB*],[#null*],big[big#JJ*,big#RB*],[#null*],data[data#NN:UN*,datum#NNS*],,[,#,*],[#null*],biochemistry[biochemistry#NN:U*],,[,#,*],[#null*],new[new#JJ*],[#null*],energy[energy#NN:UN*],[#null*],and[and#CC*],[#null*],robots[robot#NNS*],,[,#,*],[#null*],etc[etc#null*],.[.#.*],[#null*],They[they#PRP*],[#null*],also[also#RB*],[#null*],cooperate[cooperate#VB*,cooperate#VBP*],[#null*],with[with#IN*,with#RP*],[#null*],science[science#NN:UN*],[#null*],park[park#NN*,park#VB*,park#VBP*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],various[various#JJ*],[#null*],regions[region#NNS*],,[,#,*],[#null*],commercializing[commercialize#VBG*],[#null*],the[the#DT*],[#null*],research[research#NN:U*,research#VB*,research#VBP*],[#null*],results[result#NNS*,result#VBZ*],[#null*],of[of#IN*],[#null*],innovation[innovation#NN:UN*],.[.#.*]]
[0166] [Meanwhile[meanwhile#JJ*,meanwhile#NN:U*,meanwhile#RB*],,[,#,*],[#null*],no[no#DT*,no#NN*],[#null*],matter[matter#NN:UN*,matter#VB*,matter#VBP*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],production[production#NN:UN*],[#null*],and[and#CC*],[#null*],business[business#JJ*,business#NN:UN*],[#null*],model[model#JJ*,model#NN*,model#VB*,model#VBP*],,[,#,*],[#null*],entrepreneurs[entrepreneur#NNS*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],China[China#NNP*,china#JJ*,china#NN:U*],[#null*],are[are#NN*,be#VBP*],[#null*],competing[compete#VBG*],[#null*],to[to#IN*,to#TO*],[#null*],be[be#VB*],[#null*],pioneers[pioneer#NNS*,pioneer#VBZ*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],innovation[innovation#NN:UN*],[#null*],to[to#IN*,to#TO*],[#null*],adapt[adapt#VB*,adapt#VBP*],[#null*],to[to#IN*,to#TO*],[#null*],the[the#DT*],[#null*],constantly[constantly#RB*],[#null*],changing[change#VBG*],[#null*],and[and#CC*],[#null*],increasing[increasing#JJ*,increasing#NN:UN*,increase#VBG*],[#null*],needs[needs#RB*,need#NNS*,need#VBZ*],[#null*],of[of#IN*],[#null*],the[the#DT*],[#null*],consumer[consumer#NN:UN*],[#null*],market[market#NN:UN*,market#VB*,market#VBP*],[#null*],at[at#IN*,at#RP*],[#null*],home[home#JJ*,home#NN:UN*,home#VB*,home#VBP*],[#null*],and[and#CC*],[#null*],abroad[abroad#JJ*,abroad#RB*],.[.#.*]]
[0167] 标准英语译文词性标注结果:
[0168] [China[China#NNP*,china#JJ*,china#NN:U*],'['#null*],s[s#POS*],[#null*],innovation[innovation#NN:UN*],[#null*],is[be#VBZ*],[#null*],flourishing[flourishing#JJ*,flourish#VBG*],[#null*],faster[faster#NN*,faster#RB*,faster#RBR*,fast#JJR*],[#null*],than[than#IN*],[#null*],ever[ever#JJ*,ever#RB*,ever#RP*],[#null*],before[before#IN*,before#RP*],.[.#.*]][0169] [In[In#NNP*,in#IN*,in#NN*,in#RP*],[#null*],order[order#NN:UN*,order#UH*,order#VB*,order#VBP*],[#null*],to[to#IN*,to#TO*],[#null*],surpass[surpass#VB*,surpass#VBP*],[#null*],developed[develop#VBD*,develop#VBN*],[#null*],countries[country#NNS*],[#null*],on[on#IN*,on#JJ*,on#RP*],[#null*],science[science#NN:UN*],[#null*],and[and#CC*],[#null*],technology[technology#NN:UN*],[#null*],as[as#CC*,as#IN*,as#RB*],[#null*],soon[soon#JJ*,soon#RB*],[#null*],as[as#CC*,as#IN*,as#RB*],[#null*],possible[possible#JJ*,possible#NN*],,[,#,*],[#null*],China[China#NNP*,china#JJ*,china#NN:U*],[#null*],has[have#VBZ*],[#null*],sharply[sharply#RB*],[#null*],increased[increase#VBD*,increase#VBN*],[#null*],research[research#NN:U*,research#VB*,research#VBP*],[#null*],and[and#CC*],[#null*],development[development#NN:UN*],[#null*],fund[fund#NN:UN*,fund#VB*,fund#VBP*],.[.#.*]]
[0170] [Chinese[Chinese#JJ*,Chinese#NN:U*,Chinese#NNP*],[#null*],universities[university#NNS*],[#null*],and[and#CC*],[#null*],institutes[institute#NNS*,institute#VBZ*],[#null*],are[are#NN*,be#VBP*],[#null*],actively[actively#RB*],[#null*],doing[doing#NN:UN*,do#VBG*],[#null*],innovative[innovative#JJ*],[#null*],researches[research#NNS*,research#VBZ*],,[,#,*],[#null*],covering[covering#JJ*,covering#NN:UN*,cover#VBG*],[#null*],various[various#JJ*],[#null*],fields[field#NNS*,field#VBZ*],[#null*],of[of#IN*],[#null*],high[high#JJ*,high#NN*,high#RP*],[#null*],technology[technology#NN:UN*],,[,#,*],[#null*],from[from#IN*,from#RP*],[#null*],big[big#JJ*,big#RB*],[#null*],data[data#NN:UN*,datum#NNS*],[#null*],to[to#IN*,to#TO*],[#null*],biochemistry[biochemistry#NN:U*],,[,#,*],[#null*],and[and#CC*],[#null*],from[from#IN*,from#RP*],[#null*],new[new#JJ*],[#null*],energy[energy#NN:UN*],[#null*],to[to#IN*,to#TO*],[#null*],robots[robot#NNS*],.[.#.*]]
[0171] [They[they#PRP*],[#null*],are[are#NN*,be#VBP*],[#null*],also[also#RB*],[#null*],cooperating[cooperate#VBG*],[#null*],with[with#IN*,with#RP*],[#null*],science[science#NN:UN*],[#null*],and[and#CC*],[#null*],technology[technology#NN:UN*],[#null*],parks[park#NNS*,park#VBZ*],[#null*],in[in#IN*,in#NN*,in#RP*],[#null*],different[different#JJ*],[#null*],places[place#NNS*,place#VBZ*],,[,#,*],[#null*],so[so#CC*,so#JJ*,so#NN:U*],[#null*],as[as#CC*,as#IN*,as#RB*],[#null*],to[to#IN*,to#TO*],[#null*],commercialize[commercialize#VB*,commercialize#VBP*],[#null*],their[their#PRP$*],[#null*],fruits[fruit#NNS*,fruit#VBZ*],[#null*],of[of#IN*],[#null*],innovation[innovation#NN:UN*],.[.#.*]]
[0172] [In[In#NNP*,in#IN*,in#NN*,in#RP*],[#null*],the[the#DT*],[#null*],meantime[meantime#JJ*,meantime#NN:U*],,[,#,*],[#null*],to[to#IN*,to#TO*],[#null*],adapt[adapt#VB*,adapt#VBP*],[#null*],to[to#IN*,to#TO*],[#null*],the[the#DT*],[#null*],changing[change#VBG*],[#null*],foreign[foreign#JJ*],[#null*],and[and#CC*],[#null*],domestic[domestic#JJ*,domestic#NN*],[#null*],market[market#NN:UN*,market#VB*,market#VBP*],,[,#,*],[#null*],and[and#CC*],[#null*],to[to#IN*,to#TO*],[#null*],satisfy[satisfy#VB*,satisfy#VBP*],[#null*],the[the#DT*],[#null*],growing[growing#NN:UN*,grow#VBG*],[#null*],demand[demand#NN:UN*,demand#VB*,demand#VBP*],,[,#,*],[#null*],Chinese[Chinese#JJ*,Chinese#NN:U*,Chinese#NNP*],[#null*],entrepreneurs[entrepreneur#NNS*],[#null*],are[are#NN*,be#VBP*],[#null*],also[also#RB*],[#null*],making[making#NN:UN*,make#VBG*],[#null*],pioneering[pioneer#VBG*],[#null*],efforts[effort#NNS*],[#null*],to[to#IN*,to#TO*],[#null*],innovate[innovate#VB*,innovate#VBP*],[#null*],their[their#PRP$*],[#null*],products[product#NNS*],[#null*],and[and#CC*],[#null*],business[business#JJ*,business#NN:UN*],[#null*],models[model#NNS*,model#VBZ*],.[.#.*]]
[0173] (2)对翻译英语译文和标准英语译文进行短语切块后,生成的短语切块结果如下所示:
[0174] 翻译英语译文短语切块结果:
[0175] /Innovation/innovation#NN:UN*,B-NP-singular|E-NP-singular/,/#null*/,is/be#VBZ*,B-VP/,/#null*/,progressing/progress#VBG*,I-VP/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,an/a#DT*,B-NP-singular/,/#null*/,unprecedented/unprecedented#JJ*,I-NP-singular/,/#null*/,speed/speed#NN:UN*,speed#VB*,speed#VBP*,E-NP-singular/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,China/China#NNP*,china#JJ*,china#NN:U*,B-NP-singular|E-NP-singular/,./.#.*,O//[0176] /In/In#NNP*,in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,order/order#NN:UN*,order#UH*,order#VB*,order#VBP*,B-NP-singular|E-NP-singular/,/#null*/,to/to#IN*,to#TO*,B-VP/,/#null*/,catch/catch#NN*,catch#VB*,catch#VBP*,I-VP/,/#null*/,up/up#IN*,up#JJ*,up#NN*,up#RP*,up#VB*,up#VBP*,B-PRT/,/#null*/,with/with#IN*,with#RP*,B-PP/,/#null*/,those/those#DT*,B-NP-plural/,/#null*/,developed/develop#VBD*,develop#VBN*,I-NP-plural/,/#null*/,countries/country#NNS*,E-NP-plural/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,the/the#DT*,B-NP-singular/,/#null*/,world/world#JJ*,world#NN:UN*,E-NP-singular/,/#null*/,as/as#CC*,as#IN*,as#RB*,B-ADVP/,/#null*/,fast/fast#JJ*,fast#NN*,fast#RP*,fast#VB*,fast#VBP*,I-ADVP/,/#null*/,as/as#CC*,as#IN*,as#RB*,B-SBAR/,/#null*/,it/it#PRP*,B-NP-singular|E-NP-singular/,/#null*/,can/can#MD*,can#NN*,can#VB*,can#VBP*,B-VP/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,the/the#DT*,B-NP-singular/,/#null*/,science/science#NN:UN*,I-NP-singular/,/#null*/,and/and#CC*,I-NP-singular/,/#null*/,technology/technology#NN:UN*,I-NP-singular/,/#null*/,field/field#NN*,field#VB*,field#VBP*,E-NP-singular/,,/,#,*,O/,/#null*/,China/China#NNP*,china#JJ*,china#NN:U*,B-NP-singular|E-NP-singular/,/#null*/,has/have#VBZ*,B-VP/,/#null*/,increased/increase#VBD*,increase#VBN*,I-VP/,/#null*/,funds/fund#NNS*,fund#VBZ*,B-NP-plural|E-NP-plural/,/#null*/,for/for#CC*,for#IN*,for#RP*,B-PP/,/#null*/,development/development#NN:UN*,B-NP-singular/,/#null*/,research/research#NN:
U*,research#VB*,research#VBP*,E-NP-singular/,/#null*/,substantially/substantially#RB*,B-ADVP/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,recent/recent#JJ*,B-NP-plural/,/#null*/,years/year#NNS*,E-NP-plural/,./.#.*,O//
[0177] /Universities/university#NNS*,B-NP-plural/,/#null*/,and/and#CC*,I-NP-plural/,/#null*/,research/research#NN:U*,research#VB*,research#VBP*,I-NP-plural/,/#null*/,institutions/institution#NNS*,E-NP-plural/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,China/China#NNP*,china#JJ*,china#NN:U*,B-NP-singular|E-NP-singular/,/#null*/,are/are#NN*,be#VBP*,B-VP/,/#null*/,actively/actively#RB*,I-VP/,/#null*/,carrying/carry#VBG*,I-VP/,/#null*/,out/out#IN*,out#NN*,out#RB*,out#RP*,out#UH*,out#VB*,out#VBP*,B-PRT/,/#null*/,innovation/innovation#NN:UN*,B-NP-plural/,/#null*/,researches/research#NNS*,research#VBZ*,E-NP-plural/,,/,#,*,O/,/#null*/,which/which#WDT*,which#WP*,B-NP-singular|E-NP-singular/,/#null*/,cover/cover#NN:UN*,cover#VB*,cover#VBP*,B-VP/,/#null*/,high-technology/high-technology#JJ*,B-NP-plural/,/#null*/,fields/field#NNS*,field#VBZ*,E-NP-plural/,/#null*/,such/such#DT*,such#PDT*,B-PP/,/#null*/,as/as#CC*,as#IN*,as#RB*,I-PP/,/#null*/,big/big#JJ*,big#RB*,B-NP-plural/,/#null*/,data/data#NN:UN*,datum#NNS*,E-NP-plural/,,/,#,*,O/,/#null*/,biochemistry/biochemistry#NN:U*,B-NP-singular|E-NP-singular/,,/,#,*,O/,/#null*/,new/new#JJ*,B-NP-plural/,/#null*/,energy/energy#NN:UN*,I-NP-plural/,/#null*/,and/and#CC*,I-NP-plural/,/#null*/,robots/robot#NNS*,E-NP-plural/,,/,#,*,O/,/#null*/,etc/etc#null*,B-NP-singular|E-NP-singular/,./.#.*,O/,/#null*/,They/they#PRP*,B-NP-singular|E-NP-singular/,/#null*/,also/also#RB*,B-ADVP/,/#null*/,cooperate/cooperate#VB*,cooperate#VBP*,B-VP/,/#null*/,with/with#IN*,with#RP*,B-PP/,/#null*/,science/science#NN:UN*,B-NP-singular/,/#null*/,park/park#NN*,park#VB*,park#VBP*,E-NP-singular/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,various/various#JJ*,B-NP-plural/,/#null*/,regions/region#NNS*,E-NP-plural/,,/,#,*,O/,/#null*/,commercializing/commercialize#VBG*,B-VP/,/#null*/,the/the#DT*,B-NP-plural/,/#null*/,research/research#NN:U*,research#VB*,research#VBP*,I-NP-plural/,/#null*/,results/result#NNS*,result#VBZ*,E-NP-plural/,/#null*/,of/of#IN*,B-PP/,/#null*/,innovation/innovation#NN:UN*,B-NP-singular|E-NP-singular/,./.#.*,O//[0178] /Meanwhile/meanwhile#JJ*,meanwhile#NN:U*,meanwhile#RB*,B-ADVP/,,/,#,*,O/,/#null*/,no/no#DT*,no#NN*,B-NP-singular/,/#null*/,matter/matter#NN:UN*,matter#VB*,matter#VBP*,E-NP-singular/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,production/production#NN:UN*,B-NP-singular/,/#null*/,and/and#CC*,I-NP-singular/,/#null*/,business/business#JJ*,business#NN:UN*,I-NP-singular/,/#null*/,model/model#JJ*,model#NN*,model#VB*,model#VBP*,E-NP-singular/,,/,#,*,O/,/#null*/,entrepreneurs/entrepreneur#NNS*,B-NP-plural|E-NP-plural/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,China/China#NNP*,china#JJ*,china#NN:U*,B-NP-singular|E-NP-singular/,/#null*/,are/are#NN*,be#VBP*,B-VP/,/#null*/,competing/compete#VBG*,I-VP/,/#null*/,to/to#IN*,to#TO*,I-VP/,/#null*/,be/be#VB*,I-VP/,/#null*/,pioneers/pioneer#NNS*,pioneer#VBZ*,B-NP-plural|E-NP-plural/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,innovation/innovation#NN:UN*,B-NP-singular|E-NP-singular/,/#null*/,to/to#IN*,to#TO*,B-VP/,/#null*/,adapt/adapt#VB*,adapt#VBP*,I-VP/,/#null*/,to/to#IN*,to#TO*,B-PP/,/#null*/,the/the#DT*,B-NP-singular/,/#null*/,constantly/constantly#RB*,I-NP-singular/,/#null*/,changing/change#VBG*,E-NP-singular/,/#null*/,and/and#CC*,O/,/#null*/,increasing/increasing#JJ*,increasing#NN:UN*,increase#VBG*,B-VP/,/#null*/,needs/needs#RB*,need#NNS*,need#VBZ*,B-NP-plural|E-NP-plural/,/#null*/,of/of#IN*,B-PP/,/#null*/,the/the#DT*,B-NP-singular/,/#null*/,consumer/consumer#NN:UN*,I-NP-singular/,/#null*/,market/market#NN:UN*,market#VB*,market#VBP*,E-NP-singular/,/#null*/,at/at#IN*,at#RP*,B-PP/,/#null*/,home/home#JJ*,home#NN:UN*,home#VB*,home#VBP*,B-NP-singular|E-NP-singular/,/#null*/,and/and#CC*,O/,/#null*/,abroad/abroad#JJ*,abroad#RB*,B-ADVP/,./.#.*,O//
[0179] 标准英语译文短语切块结果:
[0180] /China/China#NNP*,china#JJ*,china#NN:U*,B-NP-singular|E-NP-singular/,'/'#null*/,s/s#POS*/,/#null*/,innovation/innovation#NN:UN*,E-NP-singular/,/#null*/,is/be#VBZ*,B-VP/,/#null*/,flourishing/flourishing#JJ*,flourish#VBG*,I-VP/,/#null*/,faster/faster#NN*,faster#RB*,faster#RBR*,fast#JJR*,B-ADVP/,/#null*/,than/than#IN*,B-PP/,/#null*/,ever/ever#JJ*,ever#RB*,ever#RP*,B-ADVP/,/#null*/,before/before#IN*,before#RP*,I-ADVP/,./.#.*,O//[0181] /In/In#NNP*,in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,order/order#NN:UN*,order#UH*,order#VB*,order#VBP*,B-NP-singular|E-NP-singular/,/#null*/,to/to#IN*,to#TO*,B-VP/,/#null*/,surpass/surpass#VB*,surpass#VBP*,I-VP/,/#null*/,developed/develop#VBD*,develop#VBN*,B-NP-plural/,/#null*/,countries/country#NNS*,E-NP-plural/,/#null*/,on/on#IN*,on#JJ*,on#RP*,B-PP/,/#null*/,science/science#NN:UN*,B-NP-singular/,/#null*/,and/and#CC*,I-NP-singular/,/#null*/,technology/technology#NN:UN*,E-NP-singular/,/#null*/,as/as#CC*,as#IN*,as#RB*,B-ADVP/,/#null*/,soon/soon#JJ*,soon#RB*,I-ADVP/,/#null*/,as/as#CC*,as#IN*,as#RB*,B-PP/,/#null*/,possible/possible#JJ*,possible#NN*,B-ADJP/,,/,#,*,O/,/#null*/,China/China#NNP*,china#JJ*,china#NN:U*,B-NP-singular|E-NP-singular/,/#null*/,has/have#VBZ*,B-VP/,/#null*/,sharply/sharply#RB*,I-VP/,/#null*/,increased/increase#VBD*,increase#VBN*,I-VP/,/#null*/,research/research#NN:U*,research#VB*,research#VBP*,B-NP-singular/,/#null*/,and/and#CC*,I-NP-singular/,/#null*/,development/development#NN:UN*,I-NP-singular/,/#null*/,fund/fund#NN:UN*,fund#VB*,fund#VBP*,E-NP-singular/,./.#.*,O//
[0182] /Chinese/Chinese#JJ*,Chinese#NN:U*,Chinese#NNP*,B-NP-plural/,/#null*/,universities/university#NNS*,I-NP-plural/,/#null*/,and/and#CC*,I-NP-plural/,/#null*/,institutes/institute#NNS*,institute#VBZ*,E-NP-plural/,/#null*/,are/are#NN*,be#VBP*,B-VP/,/#null*/,actively/actively#RB*,I-VP/,/#null*/,doing/doing#NN:UN*,do#VBG*,I-VP/,/#null*/,innovative/innovative#JJ*,B-NP-plural/,/#null*/,researches/research#NNS*,research#VBZ*,E-NP-plural/,,/,#,*,O/,/#null*/,covering/covering#JJ*,covering#NN:UN*,cover#VBG*,B-VP/,/#null*/,various/various#JJ*,B-NP-plural/,/#null*/,fields/field#NNS*,field#VBZ*,E-NP-plural/,/#null*/,of/of#IN*,B-PP/,/#null*/,high/high#JJ*,high#NN*,high#RP*,B-NP-singular/,/#null*/,technology/technology#NN:UN*,E-NP-singular/,,/,#,*,O/,/#null*/,from/from#IN*,from#RP*,B-PP/,/#null*/,big/big#JJ*,big#RB*,B-NP-plural/,/#null*/,data/data#NN:UN*,datum#NNS*,E-NP-plural/,/#null*/,to/to#IN*,to#TO*,B-VP/,/#null*/,biochemistry/biochemistry#NN:U*,I-VP/,,/,#,*,O/,/#null*/,and/and#CC*,O/,/#null*/,from/from#IN*,from#RP*,B-PP/,/#null*/,new/new#JJ*,B-NP-singular/,/#null*/,energy/energy#NN:UN*,E-NP-singular/,/#null*/,to/to#IN*,to#TO*,B-PP/,/#null*/,robots/robot#NNS*,B-NP-plural|E-NP-plural/,./.#.*,O//
[0183] /They/they#PRP*,B-NP-singular|E-NP-singular/,/#null*/,are/are#NN*,be#VBP*,B-VP/,/#null*/,also/also#RB*,I-VP/,/#null*/,cooperating/cooperate#VBG*,I-VP/,/#null*/,with/with#IN*,with#RP*,B-PP/,/#null*/,science/science#NN:UN*,B-NP-plural/,/#null*/,and/and#CC*,I-NP-plural/,/#null*/,technology/technology#NN:UN*,I-NP-plural/,/#null*/,parks/park#NNS*,park#VBZ*,E-NP-plural/,/#null*/,in/in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,different/different#JJ*,B-NP-plural/,/#null*/,places/place#NNS*,place#VBZ*,E-NP-plural/,,/,#,*,O/,/#null*/,so/so#CC*,so#JJ*,so#NN:U*,O/,/#null*/,as/as#CC*,as#IN*,as#RB*,O/,/#null*/,to/to#IN*,to#TO*,B-VP/,/#null*/,commercialize/commercialize#VB*,commercialize#VBP*,I-VP/,/#null*/,their/their#PRP$*,B-NP-plural/,/#null*/,fruits/fruit#NNS*,fruit#VBZ*,E-NP-plural/,/#null*/,of/of#IN*,B-PP/,/#null*/,innovation/innovation#NN:UN*,B-NP-singular|E-NP-singular/,./.#.*,O//[0184] /In/In#NNP*,in#IN*,in#NN*,in#RP*,B-PP/,/#null*/,the/the#DT*,B-NP-singular/,/#null*/,meantime/meantime#JJ*,meantime#NN:U*,E-NP-singular/,,/,#,*,O/,/#null*/,to/to#IN*,to#TO*,B-VP/,/#null*/,adapt/adapt#VB*,adapt#VBP*,I-VP/,/#null*/,to/to#IN*,to#TO*,B-PP/,/#null*/,the/the#DT*,B-NP-singular/,/#null*/,changing/change#VBG*,I-NP-singular/,/#null*/,foreign/foreign#JJ*,I-NP-singular/,/#null*/,and/and#CC*,I-NP-singular/,/#null*/,domestic/domestic#JJ*,domestic#NN*,I-NP-singular/,/#null*/,market/market#NN:
UN*,market#VB*,market#VBP*,E-NP-singular/,,/,#,*,O/,/#null*/,and/and#CC*,O/,/#null*/,to/to#IN*,to#TO*,B-VP/,/#null*/,satisfy/satisfy#VB*,satisfy#VBP*,I-VP/,/#null*/,the/the#DT*,B-NP-singular/,/#null*/,growing/growing#NN:UN*,grow#VBG*,I-NP-singular/,/#null*/,demand/demand#NN:UN*,demand#VB*,demand#VBP*,E-NP-singular/,,/,#,*,O/,/#null*/,Chinese/Chinese#JJ*,Chinese#NN:U*,Chinese#NNP*,B-NP-plural/,/#null*/,entrepreneurs/entrepreneur#NNS*,E-NP-plural/,/#null*/,are/are#NN*,be#VBP*,B-VP/,/#null*/,also/also#RB*,I-VP/,/#null*/,making/making#NN:UN*,make#VBG*,I-VP/,/#null*/,pioneering/pioneer#VBG*,B-NP-plural/,/#null*/,efforts/effort#NNS*,E-NP-plural/,/#null*/,to/to#IN*,to#TO*,B-VP/,/#null*/,innovate/innovate#VB*,innovate#VBP*,I-VP/,/#null*/,their/their#PRP$*,B-NP-plural/,/#null*/,products/product#NNS*,I-NP-plural/,/#null*/,and/and#CC*,I-NP-plural/,/#null*/,business/business#JJ*,business#NN:
UN*,I-NP-plural/,/#null*/,models/model#NNS*,model#VBZ*,E-NP-plural/,./.#.*,O//
[0185] (3)对翻译英语译文和标准英语译文进行词性消歧后,生成的词性消歧结果如下所示:
[0186] 翻译英语译文词性消歧结果:
[0187] Innovation[innovation#NN:UN,B-NP-singular|E-NP-singular]is[be#VBZ,B-VP]progressing[progress#VBG,I-VP]in[in#IN,B-PP]an[a#DT,B-NP-singular]unprecedented[unprecedented#JJ,I-NP-singular]speed[speed#NN:UN,E-NP-singular]in[in#IN,B-PP]China[China#NNP,B-NP-singular|E-NP-singular].[.#.,<#S>,O][0188] In[in#IN,B-PP]order[order#NN:UN,B-NP-singular|E-NP-singular]to[to#IN,to#TO,B-VP]catch[catch#NN,catch#VB,catch#VBP,I-VP]up[up#IN,up#JJ,up#NN,up#RP,up#VB,up#VBP,B-PRT]with[with#IN,with#RP,B-PP]those[those#DT,B-NP-plural]developed[develop#VBD,develop#VBN,I-NP-plural]countries[country#NNS,E-NP-plural]in[in#IN,B-PP]the[the#DT,B-NP-singular]world[world#NN:UN,E-NP-singular]as[as#RB,B-ADVP]fast[fast#JJ,fast#NN,fast#RP,fast#VB,fast#VBP,I-ADVP]as[as#RB,B-SBAR]it[it#PRP,B-NP-singular|E-NP-singular]can[can#MD,B-VP]in[in#IN,B-PP]the[the#DT,B-NP-singular]science[science#NN:UN,I-NP-singular]and[and#CC,I-NP-singular]technology[technology#NN:UN,I-NP-singular]field[field#NN,field#VB,field#VBP,E-NP-singular],[,#,,O]China[China#NNP,B-NP-singular|E-NP-singular]has[have#VBZ,B-VP]increased[increase#VBN,I-VP]funds[fund#NNS,fund#VBZ,B-NP-plural|E-NP-plural]for[for#CC,for#IN,for#RP,B-PP]development[development#NN:UN,B-NP-singular]research[research#NN:U,research#VB,research#VBP,E-NP-singular]substantially[substantially#RB,B-ADVP]in[in#IN,in#NN,in#RP,B-PP]recent[recent#JJ,B-NP-plural]years[year#NNS,E-NP-plural].[.#.,<#S>,O][0189] Universities[university#NNS,B-NP-plural]and[and#CC,I-NP-plural]research[research#NN:U,research#VB,research#VBP,I-NP-plural]institutions[institution#NNS,E-NP-plural]in[in#IN,B-PP]China[China#NNP,B-NP-singular|E-NP-singular]are[be#VBP,B-VP]actively[actively#RB,I-VP]carrying[carry#VBG,I-VP]out[out#IN,out#NN,out#RB,out#RP,out#UH,B-PRT]innovation[innovation#NN:UN,B-NP-plural]researches[research#NNS,research#VBZ,E-NP-plural],[,#,,O]which[which#WDT,B-NP-singular|E-NP-singular]cover[cover#NN:UN,cover#VB,cover#VBP,B-VP]high-technology[high-technology#JJ,B-NP-plural]fields[field#NNS,E-NP-plural]such[such#DT,B-PP]as[as#CC,as#IN,as#RB,I-PP]big[big#JJ,big#RB,B-NP-plural]data[data#NN:UN,datum#NNS,E-NP-plural],[,#,,O]biochemistry[biochemistry#NN:U,B-NP-singular|E-NP-singular],[,#,,O]new[new#JJ,B-NP-plural]energy[energy#NN:UN,I-NP-plural]and[and#CC,I-NP-plural]robots[robot#NNS,E-NP-plural],[,#,,O]etc[etc#null,B-NP-singular|E-NP-singular].[.#.,O]They[they#PRP,B-NP-singular|E-NP-singular]also[also#RB,B-ADVP]cooperate[cooperate#VB,cooperate#VBP,B-VP]with[with#IN,with#RP,B-PP]science[science#NN:UN,B-NP-singular]park[park#NN,park#VB,park#VBP,E-NP-singular]in[in#IN,in#NN,in#RP,B-PP]various[various#JJ,B-NP-plural]regions[region#NNS,E-NP-plural],[,#,,O]commercializing[commercialize#VBG,B-VP]the[the#DT,B-NP-plural]research[research#NN:U,I-NP-plural]results[result#NNS,result#VBZ,E-NP-plural]of[of#IN,B-PP]innovation[innovation#NN:UN,B-NP-singular|E-NP-singular].[.#.,<#S>,O][0190] Meanwhile[meanwhile#JJ,meanwhile#NN:U,meanwhile#RB,B-ADVP],[,#,,O]no[no#DT,B-NP-singular]matter[matter#NN:UN,E-NP-singular]in[in#IN,B-PP]production[production#NN:UN,B-NP-singular]and[and#CC,I-NP-singular]business[business#JJ,I-NP-singular]model[model#JJ,model#NN,model#VB,model#VBP,E-NP-singular],[,#,,O]entrepreneurs[entrepreneur#NNS,B-NP-plural|E-NP-plural]in[in#IN,B-PP]China[China#NNP,B-NP-singular|E-NP-singular]are[be#VBP,B-VP]competing[compete#VBG,I-VP]to[to#IN,to#TO,I-VP]be[be#VB,I-VP]pioneers[pioneer#NNS,B-NP-plural|E-NP-plural]in[in#IN,B-PP]innovation[innovation#NN:UN,B-NP-singular|E-NP-singular]to[to#IN,to#TO,B-VP]adapt[adapt#VB,adapt#VBP,I-VP]to[to#IN,to#TO,B-PP]the[the#DT,B-NP-singular]constantly[constantly#RB,I-NP-singular]changing[change#VBG,E-NP-singular]and[and#CC,O]increasing[increasing#JJ,increasing#NN:UN,increase#VBG,B-VP]needs[need#NNS,B-NP-plural|E-NP-plural]of[of#IN,B-PP]the[the#DT,B-NP-singular]consumer[consumer#NN:UN,I-NP-singular]market[market#NN:UN,E-NP-singular]at[at#IN,at#RP,B-PP]home[home#NN:UN,B-NP-singular|E-NP-singular]and[and#CC,O]abroad[abroad#JJ,abroad#RB,B-ADVP].[.#.,<#S>,O]
[0191] 标准英语译文词性消歧结果:
[0192]
[0193] China[China#NNP,china#JJ,china#NN:U,B-NP-singular|E-NP-singular]'['#POS]s[s#POS]innovation[innovation#NN:UN,E-NP-singular]is[be#VBZ,B-VP]flourishing[flourish#VBG,I-VP]faster[faster#RBR,fast#JJR,B-ADVP]than[than#IN,B-PP]ever[ever#JJ,ever#RB,ever#RP,B-ADVP]before[before#IN,before#RP,I-ADVP].[.#.,<#S>,O]
[0194] In[in#IN,B-PP]order[order#NN:UN,B-NP-singular|E-NP-singular]to[to#IN,to#TO,B-VP]surpass[surpass#VB,surpass#VBP,I-VP]developed[develop#VBD,develop#VBN,B-NP-plural]countries[country#NNS,E-NP-plural]on[on#IN,on#JJ,on#RP,B-PP]science[science#NN:UN,B-NP-singular]and[and#CC,I-NP-singular]technology[technology#NN:UN,E-NP-singular]as[as#RB,B-ADVP]soon[soon#JJ,soon#RB,I-ADVP]as[as#RB,B-PP]possible[possible#JJ,possible#NN,B-ADJP],[,#,,O]China[China#NNP,B-NP-singular|E-NP-singular]has[have#VBZ,B-VP]sharply[sharply#RB,I-VP]increased[increase#VBN,I-VP]research[research#NN:U,B-NP-singular]and[and#CC,I-NP-singular]development[development#NN:UN,I-NP-singular]fund[fund#NN:UN,fund#VB,fund#VBP,E-NP-singular].[.#.,<#S>,O]
[0195] Chinese[Chinese#JJ,B-NP-plural]universities[university#NNS,I-NP-plural]and[and#CC,I-NP-plural]institutes[institute#NNS,E-NP-plural]are[be#VBP,B-VP]actively[actively#RB,I-VP]doing[doing#NN:UN,do#VBG,I-VP]innovative[innovative#JJ,B-NP-plural]researches[research#NNS,E-NP-plural],[,#,,O]covering[covering#JJ,covering#NN:UN,cover#VBG,B-VP]various[various#JJ,B-NP-plural]fields[field#NNS,E-NP-plural]of[of#IN,B-PP]high[high#JJ,high#NN,high#RP,B-NP-singular]technology[technology#NN:UN,E-NP-singular],[,#,,O]from[from#IN,from#RP,B-PP]big[big#JJ,big#RB,B-NP-plural]data[data#NN:UN,datum#NNS,E-NP-plural]to[to#IN,to#TO,B-VP]biochemistry[biochemistry#NN:U,I-VP],[,#,,O]and[and#CC,O]from[from#IN,from#RP,B-PP]new[new#JJ,B-NP-singular]energy[energy#NN:UN,E-NP-singular]to[to#IN,to#TO,B-PP]robots[robot#NNS,B-NP-plural|E-NP-plural].[.#.,<#S>,O]
[0196] They[they#PRP,B-NP-singular|E-NP-singular]are[be#VBP,B-VP]also[also#RB,I-VP]cooperating[cooperate#VBG,I-VP]with[with#IN,with#RP,B-PP]science[science#NN:UN,B-NP-plural]and[and#CC,I-NP-plural]technology[technology#NN:UN,I-NP-plural]parks[park#NNS,park#VBZ,E-NP-plural]in[in#IN,in#NN,in#RP,B-PP]different[different#JJ,B-NP-plural]places[place#NNS,E-NP-plural],[,#,,O]so[so#RB,O]as[as#CC,as#IN,O]to[to#TO,B-VP]commercialize[commercialize#VB,I-VP]their[their#PRP$,B-NP-plural]fruits[fruit#NNS,E-NP-plural]of[of#IN,B-PP]innovation[innovation#NN:UN,B-NP-singular|E-NP-singular].[.#.,<#S>,O]
[0197] In[in#IN,B-PP]the[the#DT,B-NP-singular]meantime[meantime#JJ,meantime#NN:U,E-NP-singular],[,#,,O]to[to#IN,to#TO,B-VP]adapt[adapt#VB,adapt#VBP,I-VP]to[to#IN,to#TO,B-PP]the[the#DT,B-NP-singular]changing[change#VBG,I-NP-singular]foreign[foreign#JJ,I-NP-singular]and[and#CC,I-NP-singular]domestic[domestic#JJ,I-NP-singular]market[market#NN:UN,E-NP-singular],[,#,,O]and[and#CC,O]to[to#TO,B-VP]satisfy[satisfy#VB,I-VP]the[the#DT,B-NP-singular]growing[growing#NN:UN,grow#VBG,I-NP-singular]demand[demand#NN:UN,E-NP-singular],[,#,,O]Chinese[Chinese#JJ,B-NP-plural]entrepreneurs[entrepreneur#NNS,E-NP-plural]are[be#VBP,B-VP]also[also#RB,I-VP]making[making#NN:UN,make#VBG,I-VP]pioneering[pioneer#VBG,B-NP-plural]efforts[effort#NNS,E-NP-plural]to[to#TO,B-VP]innovate[innovate#VB,I-VP]their[their#PRP$,B-NP-plural]products[product#NNS,I-NP-plural]and[and#CC,I-NP-plural]business[business#JJ,I-NP-plural]models[model#NNS,E-NP-plural].[.#.,<#S>,O]
[0198] 第二步骤:执行“翻译英语译文忠实度分析模块”
[0199] 翻译英语译文忠实度分析模块是利用第一步骤生成的翻译英语译文和标准翻译英语译文预处理模块的分词结果,然后对翻译英语译文中的单词进行精确匹配、词干匹配、及同义词匹配,并记录匹配成功的单词及其编号,最后利用训练英语文本集生成的精确匹配权重、词干匹配权重、同义词匹配权重和翻译英语译文中匹配成功的单词总数计算翻译英语译文的忠实度。本实施方式的翻译英语译文忠实度分析结果如下所示:
[0200] 标出翻译英语译文中翻译正确的英语单词:
[0201] Innovation is progressing in an unprecedented speed in China.In order to catch up with those developed countries in the world as fast as it can in the science and technology field,China has increased funds for development research substantially in recent years.Universities and research institutions in China are actively carrying out innovation researches,which cover high-technology fields such as big data,biochemistry,new energy and robots,etc.They also cooperate with science park in various regions,commercializing the research results of innovation.Meanwhile,no matter in production and business model,entrepreneurs in China are competing to be pioneers in innovation to adapt to the constantly changing and increasing needs of the consumer market at home and abroad.
[0202] 翻译英语译文忠实度:63分。
[0203] 第三步骤:执行“翻译英语译文语义相似度分析模块”
[0204] 翻译英语译文语义相似度分析模块是利用第一步骤生成的翻译英语译文、标准英语译文词性消歧结果,根据词性消歧结果查找并记录单词在英语语义词典中对应的节点编号,在英语语义词典中,从翻译英语译文单词对应的节点编号查找到标准英文单词对应的节点编号,记录下查找路径上每个单词对应的节点编号及节点之间有向边的概率,根据查找路径上每个单词对应的节点编号和节点之间有向边的概率,生成翻译英语译文概率分布一维向量和标准英语译文概率分布一维向量,根据翻译英语译文概率分布一维向量和标准英语译文概率分布一维向量计算并输出翻译英语译文的语义相似度。本实施方式的翻译英语译文的语义相似度分析结果如下所示:
[0205] 翻译英语译文概率分布二维向量:
[0206] 节点编号=2156概率值=3.0124842E-4
[0207] 节点编号=4370概率值=5.800353E-4
[0208] 节点编号=6845概率值=6.6988135E-4
[0209] 节点编号=100600概率值=2.8010816E-4
[0210] 节点编号=10177概率值=2.602892E-4
[0211] 节点编号=46299概率值=0.021831261
[0212] 节点编号=15673概率值=2.3386389E-4
[0213] 节点编号=105382概率值=0.0012974822
[0214] 节点编号=54185概率值=2.3650641E-4
[0215] 节点编号=17634概率值=5.919267E-4
[0216] 节点编号=20446概率值=0.00863843
[0217] 节点编号=14347概率值=4.175197E-4
[0218] 节点编号=20828概率值=6.5931125E-4
[0219] 节点编号=19141概率值=2.867145E-4
[0220] 节点编号=26691概率值=9.737723E-4
[0221] 节点编号=102174概率值=0.0026993442
[0222] 节点编号=28336概率值=2.3122136E-4
[0223] 节点编号=29957概率值=7.412297E-4
[0224] 节点编号=22319概率值=2.4179148E-4
[0225] 节点编号=43079概率值=0.0014851018
[0226] 节点编号=32419概率值=0.00199511
[0227] 节点编号=35642概率值=2.8142944E-4
[0228] 节点编号=4743概率值=3.0917602E-4
[0229] 节点编号=40963概率值=6.0513936E-4
[0230] 节点编号=89379概率值=2.4311275E-4
[0231] 节点编号=44605概率值=2.668955E-4
[0232] 节点编号=55839概率值=3.0124842E-4
[0233] 节点编号=46581概率值=4.294111E-4
[0234] 节点编号=48312概率值=2.906783E-4
[0235] 节点编号=52569概率值=0.018896732
[0236] 节点编号=53413概率值=4.294111E-4
[0237] 节点编号=97348概率值=4.2544733E-4
[0238] 节点编号=41450概率值=0.002328069
[0239] 节点编号=58665概率值=2.8142944E-4
[0240] 节点编号=30269概率值=3.052122E-4
[0241] 节点编号=59301概率值=5.1132956E-4
[0242] 节点编号=62168概率值=4.2676856E-4
[0243] 节点编号=62590概率值=6.276009E-4
[0244] 节点编号=65360概率值=2.4707653E-4
[0245] 节点编号=6306概率值=0.002806367
[0246] 节点编号=67688概率值=3.4881395E-4
[0247] 节点编号=19078概率值=4.6640655E-4
[0248] 节点编号=71778概率值=3.5013523E-4
[0249] 节点编号=72009概率值=4.2676856E-4
[0250] 节点编号=6295概率值=3.3428005E-4
[0251] 节点编号=19068概率值=2.3386389E-4
[0252] 节点编号=113288概率值=4.928318E-4
[0253] 节点编号=43019概率值=2.4179148E-4
[0254] 节点编号=81309概率值=0.001411111
[0255] 节点编号=81657概率值=7.346233E-4
[0256] ……
[0257] 标准英语译文概率分布二维向量:
[0258] 节点编号=2200概率值=2.9596334E-4
[0259] 节点编号=98019概率值=5.4436113E-4
[0260] 节点编号=59686概率值=9.3413435E-4
[0261] 节点编号=67669概率值=0.0016846128
[0262] 节点编号=34130概率值=3.4881395E-4
[0263] 节点编号=91621概率值=0.0010200165
[0264] 节点编号=75648概率值=3.7788178E-4
[0265] 节点编号=46900概率值=6.5931125E-4
[0266] 节点编号=43701概率值=3.1578232E-4
[0267] 节点编号=101190概率值=5.813566E-4
[0268] 节点编号=30921概率值=3.8977317E-4
[0269] 节点编号=45290概率值=0.0020875987
[0270] 节点编号=109167概率值=6.540261E-4
[0271] 节点编号=66046概率值=6.196732E-4
[0272] 节点编号=107567概率值=5.602163E-4
[0273] 节点编号=46880概率值=3.1049727E-4
[0274] 节点编号=53598概率值=2.5500412E-4
[0275] 节点编号=104364概率值=0.0020572094
[0276] 节点编号=38884概率值=2.3386389E-4
[0277] 节点编号=10136概率值=4.1619848E-4
[0278] 节点编号=78469概率值=3.9241568E-4
[0279] 节点编号=56445概率值=0.0011851747
[0280] 节点编号=58041概率值=4.1619848E-4
[0281] 节点编号=42070概率值=4.716916E-4
[0282] 节点编号=13323概率值=3.0124842E-4
[0283] 节点编号=115514概率值=2.9332083E-4
[0284] 节点编号=62812概率值=3.7523927E-4
[0285] 节点编号=53222概率值=2.4839782E-4
[0286] 节点编号=45236概率值=4.18841E-4
[0287] 节点编号=24464概率值=2.6293172E-4
[0288] 节点编号=101119概率值=0.002129879
[0289] 节点编号=97923概率值=4.0827086E-4
[0290] 节点编号=86740概率值=0.001301446
[0291] 节点编号=73962概率值=5.1265076E-4
[0292] 节点编号=80341概率值=2.8803575E-4
[0293] 节点编号=32429概率值=0.0033599767
[0294] 节点编号=112272概率值=4.0430707E-4
[0295] 节点编号=46792概率值=0.0010358717
[0296] 节点编号=30814概率值=3.567415E-4
[0297] 节点编号=61155概率值=0.0028195793
[0298] 节点编号=37190概率值=5.958905E-4
[0299] 节点编号=91486概率值=0.002388847
[0300] 节点编号=43574概率值=0.0017638888
[0301] 节点编号=24409概率值=3.1974612E-4
[0302] 节点编号=61139概率值=5.6946516E-4
[0303] 节点编号=59537概率值=6.196732E-4
[0304] 节点编号=67519概率值=3.54099E-4
[0305] 节点编号=61129概率值=2.4707653E-4
[0306] 节点编号=88276概率值=2.906783E-4
[0307] 节点编号=439概率值=3.4485015E-4
[0308] ……
[0309] 翻译英语译文语义相似度:78.5分。
[0310] 第四步骤:执行“翻译英语译文质量分析结果生成模块”
[0311] 翻译英语译文质量分析结果生成模块是综合第二步骤输出的翻译英语译文忠实度分析结果、第三步骤输出的翻译英语译文语义相似度分析结果,生成并输出翻译英语译文质量分数和评语。本实施方式的英语译文质量分析结果生成格式如下所示:
[0312] 翻译英语译文质量分数:70.8分。
[0313] 翻译英语译文质量评语:英语译文与标准英语译文保持一致性好,能正确表达原文意思。