移动设备农产品数据采集系统及其语音识别系统、方法转让专利

申请号 : CN201110456874.4

文献号 : CN102543074B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 诸叶平赵俊峰海占广刘升平

申请人 : 中国农业科学院农业信息研究所

摘要 :

一种移动设备农产品数据采集系统及其语音识别系统、方法,所采用的语音识别引擎包括特征提取模块、HMM语音识别系统、SVM特征向量提取模块及SVM训练模块和混合解码模块,语音信号的训练样本经过特征提取之后获得特征矢量序列;通过SVM特征向量提取模块获得用于SVM分类器训练的定长的特征矢量;在识别过程中,将HMM语音识别系统识别出来的音节段落信息构建成能够用于SVM分类器分类的特征矢量信息,然后把经过SVM分类器得到的距离信息通过sigmoid函数拟合成后验概率,输入混合解码器获取最后的识别结果。本发明能够有效地克服移动设备操作性差的问题,降低采集过程中对人员信息化水平的要求,提高农业现场信息采集的环境适应性。

权利要求 :

1.一种面向农产品数据采集的移动设备的语音识别系统,其特征在于,该系统包括语音识别模块、会话管理模块及数据管理模块,其中:所述语音识别模块采用基于HMM/SVM混合架构的语音识别引擎,该语音识别引擎包括特征提取模块、HMM语音识别系统、SVM特征向量提取模块及SVM训练模块和混合解码模块,语音信号的训练样本经过特征提取之后获得特征矢量序列;通过SVM特征向量提取模块获得用于SVM分类器训练的定长的特征矢量;在识别过程中,将HMM语音识别系统识别出来的音节段落信息构建成能够用于SVM分类器分类的特征矢量信息,然后把经过SVM分类器得到的距离信息通过sigmoid函数拟合成后验概率,输入混合解码器获取最后的识别结果;

所述会话管理模块负责实现线程调度以及语音识别的功能,所述语音识别系统包括一路系统会话以及一路或多路识别会话,所述系统会话负责管理识别会话和处理系统相关的任务,所述识别会话进行识别以及和识别相关任务的处理;

所述数据管理模块管理模型数据和用户数据,所述模型数据是语音识别算法中所采用的声学层、语言层、词典、拼音文法这些模型文件;用户数据包括用户名、密码、用户描述这些基本信息以及每个用户和所采用模型的对应关系,在连接识别会话之前,用户提供用户数据的基本信息和模型数据,以正确加载模型进行识别。

2.一种移动设备农产品数据采集系统,其特征在于,该农产品数据采集系统包括设于该移动设备中的数据采集模块,该数据采集模块包括如权利要求1所述的面向农产品数据采集的移动设备的语音识别系统,所述移动设备农产品数据采集系统将音频输入前端和语音识别部分独立起来,语音识别作为一个单独的引擎,同时提供该引擎和上层应用程序之间的通讯接口,为应用软件嵌入语音识别功能提供方便。

3.如权利要求2所述的移动设备农产品数据采集系统,其特征在于,所述数据采集系统还包括数据传送模块和数据同步模块,数据采集模块采集到的数据通过无线分组业务或无线局域网上传到数据库服务器,系统能够对移动设备和数据库服务器进行数据同步,保持数据的完整性和一致性。

4.如权利要求3所述的移动设备农产品数据采集系统,其特征在于,所述数据采集系统还包括数据维护查询模块和系统维护模块,其中,数据维护模块包括农产品数据查询模块和农产品数据维护模块,能够在作业现场对农产品价格数据进行查询、浏览、修改和删除;系统维护模块包括用户管理模块、语音库维护模块和农产品种类维护模块,用户管理模块实现对登录用户和密码的验证,限制非法访问,保证系统的安全性;农产品种类维护模块实现对农产品种类信息的添加、删除、修改;语音库维护模块实现识别语音库的装入与卸载。

5.一种面向农产品数据采集的移动设备语音识别方法,其特征在于,该方法结合农业语音数据采集命令词和数字语音识别优先识别的需要,采用中小词汇量连续语音识别系统中统计语言模型技术,该方法包括:语音识别步骤:以HMM的语音识别系统为基础,语音信号的训练样本经过特征提取之后获得特征矢量序列;通过SVM特征向量提取模块获得用于SVM分类器训练的定长的特征矢量;在识别过程中,将HMM语音识别系统识别出来的音节段落信息构建成能够用于SVM分类器分类的特征矢量信息,然后把经过SVM分类器得到的距离信息通过sigmoid函数拟合成后验概率,输入混合解码器获取最后的识别结果;

会话管理步骤:负责实现线程调度以及语音识别的功能,语音识别系统包括一路系统会话以及一路或多路识别会话,所述系统会话负责管理识别会话和处理系统相关的任务,所述识别会话进行识别以及和识别相关任务的处理;

数据管理步骤:用于管理模型数据和用户数据,所述模型数据是语音识别算法中所采用的声学层、语言层、词典、拼音文法这些模型文件;用户数据包括用户名、密码、用户描述这些基本信息以及每个用户和所采用模型的对应关系,在连接识别会话之前,用户提供用户数据的基本信息和模型数据,以正确加载模型进行语音识别。

6.如权利要求5所述的面向农产品数据采集的移动设备语音识别方法,其特征在于,该方法是采用SVM决策树多分类器构造方法,该方法是根据汉语语音的特点,采用音节作为声学载体进行建模,所述SVM决策树多分类器构造方法包括:首先计算特征空间中各类之间的距离;

然后将分离性测度按降序进行排序;

再按二分类问题构造子分类器的训练集;

重新调整训练集,构造完一个节点后删除其正样本,并以下一个样本作为正样本、其他样本为负样本构造下一个节点的二值分类器,直到所有节点分类完成。

7.如权利要求5所述的面向农产品数据采集的移动设备语音识别方法,其特征在于,该方法对语音信号在识别过程中进行综合计算,将SVM的输出转化为后验概率,其所采用的SVM距离到后验概率的计算方法包括:SVM的输出格式是y=sign(f(x)) (1)

其中 (2)x是输入向量,当f(x)>0时y属于正样本,当

f(x)<0时y属于负样本,y在f(x)取值下属于正样本的概率如式(3)所示,f(x)是SVM距离;

(3)

每个类的条件概率假设由高斯函数模型描述为

正样本: (4)

负样本: (5)

则式(3)可表示为:

(6)

A和B是估计参数,在模型训练参数设定时由LibSVM模型工具包获得。

8.如权利要求7所述的面向农产品数据采集的移动设备语音识别方法,其特征在于,所述方法采用了SVM/sigmoid混合训练模型:由于SVM输出值的符号表示其分类结果,其绝对值表示样本到分类面的距离,因此为了得到校准的后验概率,将SVM的输出通过sigmoid函数转换成概率模型以提高模型的性能:式(6)中的参数A和B通过最大似然问题加以确定:

minA,BF(A,B)=-Σi=1(ti(log(pi)+(1-ti)log(1-pi)) (7)其中pi=P(fi),

(8)

N+为正样本数,N_为负样本数。

9.如权利要求8所述的面向农产品数据采集的移动设备语音识别方法,其特征在于,所述SVM/sigmoid混合训练模型的训练方法包括:将采集的语音通过Baum-Welch算法来训练HMM模型,所采用的HMM拓扑结构为自左向右二转移多维混合高斯密度函数连续的HMM模型,在训练过程中,将HMM作为训练模型的一部分和SVM共同组成训练模型,以HMM为训练模型的前级,以此对用于SVM模型训练的训练数据进行有区分性的特征变化,并以HMM的多维概率输出作为后级SVM模型的输入矢量,最后SVM的输出通过Sigmoid函数按(6)式转换为后验概率。

说明书 :

移动设备农产品数据采集系统及其语音识别系统、方法

技术领域

[0001] 本发明涉及农业信息技术领域的智能信息处理技术,尤其是指一种移动设备农产品数据采集系统及其语音识别系统、方法。

背景技术

[0002] 农业数据采集是农业信息化的源头和基础,在现代农业快速、准确、有效的要求下,农业现场数据采集问题日益凸显,虽然“3S”技术、无线传感器技术的应用研究取得一定成果,但面向农业生产者应用的数据采集方法研究仍然较为匮乏,在一些需要人工操作的场合尤为突出,如农业野外现场作业数据采集、农业生产过程中的数据采集和农产品价格数据采集等。传统依赖键盘输入的数据采集方法和手段直接影响数据采集的效率和质量。移动采集设备以其体积小、可靠性高、价格低、便携性好和支持移动作业等特点,广泛应用于农业生产、流通等各个环节,使得农业数据采集在精准性和时效性上有了很大的提升,但存在着可操作性差、采集效率不高和对信息采集人员的信息化水平要求较高的问题。
[0003] 目前我国农产品信息的采集工作主要依赖人工完成,一般由农业部门或市场管理机构派出信息采集员到市场现场查询并记录各种农产品的价格与需求,然后报信息管理员处,经过整理输入到计算机中,再经过计算机分析处理后通过一定的方式发布出去,及时性不高,受人力、时间、空间限制等一系列问题,这些都制约了对消费者服务的提高和有关部门对市场的有效管理。

发明内容

[0004] 本发明要解决的技术问题是:提出一种移动设备农产品数据采集系统及其语音识别系统、方法,通过基于移动设备的语音输入识别方法采集现场数据,摆脱了移动设备小键盘和小屏幕的限制,同时提高了数据采集的效率。
[0005] 本发明的技术解决方案如下:
[0006] 一种面向农产品数据采集的移动设备的语音识别系统,该系统采用基于HMM/SVM混合架构的语音识别引擎,该语音识别引擎包括特征提取模块、HMM语音识别系统、SVM特征向量提取模块及SVM训练模块和混合解码模块,语音信号的训练样本经过特征提取之后获得特征矢量序列;通过SVM特征向量提取模块获得用于SVM分类器训练的定长的特征矢量;在识别过程中,将HMM语音识别系统识别出来的音节段落信息构建成能够用于SVM分类器分类的特征矢量信息,然后把经过SVM分类器得到的距离信息通过sigmoid函数拟合成后验概率,输入混合解码器获取最后的识别结果。
[0007] 一种移动设备农产品数据采集系统,该农产品数据采集系统包括设于该移动设备中的数据采集模块,该数据采集模块包括如上所述的面向农产品数据采集的移动设备的语音识别系统。
[0008] 一种面向农产品数据采集的移动设备语音识别方法,该方法是以HMM的语音识别系统为基础,语音信号的训练样本经过特征提取之后获得特征矢量序列;通过SVM特征向量提取模块获得用于SVM分类器训练的定长的特征矢量;在识别过程中,将HMM语音识别系统识别出来的音节段落信息构建成能够用于SVM分类器分类的特征矢量信息,然后把经过SVM分类器得到的距离信息通过sigmoid函数拟合成后验概率,输入混合解码器获取最后的识别结果。
[0009] 本发明以农产品市场信息化的需求为目标,以节省人力、提高工作效率及时反映定点农产品市场主要农产品的价格行情、产品供求信息为主要依据,采用语音识别作为人机交互方式设计切实可行的农产品数据采集系统,能够有效地克服移动设备操作性差的问题,降低采集过程中对人员信息化水平的要求,提高农业现场信息采集的环境适应性,为加快农产品市场信息体系建设、推动农产品市场经营模式转变提供技术支撑。

附图说明

[0010] 图1为本发明的面向农产品数据采集的移动设备语音识别系统的基本框架图。
[0011] 图2为本发明的面向农产品数据采集的移动设备语音识别系统及方法所采用的语音识别模型的示意图。
[0012] 图3为本发明的面向农产品数据采集的移动设备语音识别系统及方法所采用的多分类器算法流程图。
[0013] 图4为本发明的面向农产品数据采集的移动设备语音识别系统及方法所采用的SVM/sigmoid混合训练模型示意图。
[0014] 图5为本发明的移动设备农产品数据采集系统功能的模块图。

具体实施方式

[0015] 移动设备的便携性在很大程度上是以损失人机交互的方便性为代价的,相对PC而言,手持设备的屏幕小、阳光直射下无法看清以及小键盘操作的不方便性,触摸屏全键盘和手写识别也存在效率低、稳定性差的问题,在很大程度上降低了设备的可操作性。本发明通过基于移动设备的语音输入识别方法采集现场数据,摆脱了移动设备小键盘和小屏幕的限制,同时提高了数据采集的效率。
[0016] 本发明提出一种面向农产品数据采集的移动设备的语音识别系统及方法,该系统采用基于HMM/SVM混合架构的语音识别引擎,该语音识别引擎包括特征提取模块、HMM语音识别系统、SVM特征向量提取模块及SVM训练模块(即图2中的SVM分类器)和混合解码模块,语音信号的训练样本经过特征提取之后获得特征矢量序列;通过SVM特征向量提取模块获得用于SVM分类器训练的定长的特征矢量;在识别过程中,将HMM语音识别系统识别出来段落信息所对应的特征矢量信息同样构建成能够用于SVM分类器分类的特征矢量信息,然后把经过SVM分类器得到的距离信息通过sigmoid函数拟合成后验概率,输入混合解码器获取最后的识别结果。
[0017] 本发明提出一种面向农产品数据采集的移动设备语音识别方法,该方法结合农业语音数据采集命令词和数字语音识别优先识别的需要,利用中小词汇量连续语音识别系统中统计语言模型技术,采用改进的HMM/SVM混合架构的语音识别模型,通过引入sigmoid函数对分类结果采用概率的方式输出。
[0018] 该方法利用SVM能够有效解决小样本、非线性和高维数分类问题的原理,结合具体应用的实际情况,采用高斯径向基函数作为核函数,分析不同信噪比和不同词汇量下高斯核参数和误差惩罚参数的组合对SVM推广性能的影响,选择其最优组合应用与非特定人、中小规模词汇量的抗噪语音识别系统中,以得到较好的识别效果和抗噪声能力。
[0019] 本发明同时保护具有前述语音识别系统的移动设备农产品数据采集系统,该农产品数据采集系统包括数据采集模块,该数据采集模块包括前述基于HMM/SVM混合架构的语音识别引擎。
[0020] 具有该语音识别系统的移动设备是针对农产品市场的日常数据采集管理而设计的,整个设备的主要功能分为五大部分:数据采集模块、数据维护查询模块、数据传送模块、数据同步模块和系统维护模块。工作人员能够在作业现场利用语音识别引擎对农产品价格数据进行采集、查询、修改和删除,采集的数据可以通过无线分组业务和无线局域网两种方式上传到服务器;系统能够对移动设备与数据库服务器进行数据同步,以保持数据的完整性和一致性、保证数据传输时的可靠性和安全性。系统功能模块结构请参照图5。
[0021] 本发明的基于语音识别引擎的移动设备农产品数据采集系统为面向便携式农产品数据采集系统的具体应用,具备非特定人、中小词汇量连续语音识别功能,系统运行稳定、可靠,占用资源少,并具有可伸缩性和扩展性;人机交互友好,操作简单,符合用户认知习惯。
[0022] 具体地,语音识别系统采用结构化设计,将音频输入前端和语音识别部分独立起来,语音识别作为一个单独的引擎,同时提供该引擎和上层应用程序之间的通讯接口,为应用软件嵌入语音识别功能提供了方便,使上层应用程序的开发人员可以忽略语音识别技术的实现细节而实现语音识别功能。该语音识别系统包括前端和后端两个部分,前端是应用程序,后端则是识别引擎。应用程序面向最终用户,通过语音对象来获得用户的输入(一般是语音数据以及环境和信道噪声),再通过调用SAPI(Speech Application Programming Interface)语音识别应用程序开发接口实现与引擎的通信。,负责建立应用程序和识别引擎之间的连接,将应用程序的命令和数据传送给识别引擎,并将引擎的结果返回给应用程序。识别引擎则是后台服务程序,是整个语音识别系统的核心部分,与应用程序处在不同的进程空间,负责接收SAPI的信息并进行相应的处理:来自SAPI的信息主要有两类,一是系统控制信息,负责请求建立连接,请求加载模型等;二是识别信息,将各类语音数据传给引擎,由引擎进行识别处理,返回文字结果或是既定的命令标识。系统基本结构框架图请参照图1所示。
[0023] 根据识别系统的需要,识别引擎除了应该能够进行语音识别之外,还能够实现进程间通信以及对用户数据进行管理。引擎内部结构主要由会话、通信、数据管理和语音识别四部分组成,具体如下:
[0024] 会话管理:是引擎设计的关键部分,既负责实现线程调度,又实现语音识别的功能。为此,将会话分成两类,一类系统会话,一类是识别会话。系统会话只有一路,而识别会话则根据需要可以一路,或者是多路。系统会话负责管理识别会话和处理系统相关的任务,识别会话的主要进行识别以及和识别相关任务的处理。对每一个会话,引擎都会启动一个工作线程与之对应。对于要求实时完成的任务,或是某些算法复杂度低、占用CPU时间少的任务采用同步调用方式;对于算法复杂度高,占用CPU时间多的任务则采用异步调用方式。在异步调用的情况下,为了保证数据不被丢失,我们对每个会话,创建了任务和结果两个循环队列。异步调用的过程可以表述为:
[0025] 1)应用程序调用异步函数,往任务队列填写任务,函数返回;
[0026] 2)引擎从任务队列顺序取出任务,执行完任务后将结果填写到结果队列;
[0027] 3)应用程序从结果队列中取出执行结果。
[0028] 通信机制:由于应用程序和引擎不在同一个进程空间内,支持进程间通信(Inter process Communication,IPC)的主要作用是:创建用于进程间数据传递和交换的管道,利用管道接受应用程序发出的任务,并执行结果通过管道返回给应用程序。考虑到结构化和可扩展性,本设计引擎把通信机制作为一个单独的模块来实现,这样的优点在于如果需要改变引擎和应用程序的通信方式,我们只需要对这个模块进行改写,而尽可能少地涉及其它部分。单机的情况应用程序和引擎运行在一台设备上,采用内存映射文件的方法来实现进程间的通信。其优点是结构清楚,易于实现;而且由于访问的是同一块内存区,可以保证进程间通信的速度和正确率。
[0029] 数据管理:在识别引擎中主要管理模型数据和用户数据,模型数据是指语音识别算法中所采用的声学层、语言层、词典、拼音文法等模型文件;用户数据既包括一些基本信息,如用户名、密码、用户描述等,也包括每个用户和所采用模型的对应关系。在连接识别会话之前,用户必须提供基本信息和模型信息,否则识别器将无法正确加载模型进行识别。本引擎将用户数据按照既定的数据结构,保存在二进制文件里。由于文件读写是独占的过程,采用了临界区技术。
[0030] 语音识别:引擎中采用了基于HMM的语音识别原理,可分为三部分:语音信号预处理与特征提取;声学模型与模式匹配以及语音识别后处理。在建立和应用这一系统时,语音识别核心部分分别表现为模型的建立、训练和识别三个过程,识别后处理部分是一个音字转换过程,根据识别结果,利用基于有调拼音的二元拼音文法进行拼音剪枝,得到精简多长度音节格送入后处理模块,构造拼音图,由词典信息生成词图,搜索得到最后的汉字识别结果。
[0031] 结合图2所示,本发明是以HMM的语音识别系统为基础,增设SVM特征向量提取模块、SVM训练和混合解码模块三大模块,语音信号的训练样本经过特征提取之后获得特征矢量序列;通过SVM特征向量提取模块获得用于SVM分类器训练的定长的特征矢量;在识别过程中,对HMM识别出来音节模型对应的特征矢量信息,将其同样构建成能够用于SVM分类器分类的特征矢量信息,然后把经过SVM分类器得到的距离信息通过sigmoid函数拟合成后验概率,输入混合解码器获取最后的识别结果。下面对本发明所涉及的技术方案进行详细说明:
[0032] 对于语音识别引擎,本发明采用改进HMM/SVM混合架构的语音识别模型。其是针对基于移动设备的农业语音信息识别问题,结合农业语音数据采集命令词和数字语音识别优先识别的需要,利用中小词汇量连续语音识别系统中统计语言模型关键技术,将HMM善于处理语音的动态特性的优点与SVM对静态数据的强分类能力的优点结合起来,这种改进HMM/SVM混合架构的语音识别模型能达到有效提高系统识别准确率的目的。常用的HMM/SVM混合模型是将SVM的输出转化为概率,作为HMM中各个隐状态的输出概率,但训练速度慢,且正样本和负样本数据之间存在混叠现象,对于大样本特征数据不能准确区分。本发明通过引入sigmoid函数对分类结果采用概率的方式输出,有效地解决了样本混叠带来的不确定性,有效提高了识别准确性。
[0033] 设计原理:利用SVM能够有效解决小样本、非线性和高维数分类问题的原理,结合具体应用的实际情况,采用高斯径向基函数作为核函数,分析不同信噪比和不同词汇量下高斯核参数和误差惩罚参数的组合对SVM推广性能的影响,选择其最优组合应用与非特定人、中小规模词汇量的抗噪语音识别系统中,以得到较好的识别效果和抗噪声能力。
[0034] 设计方法:以常规HMM的语音识别系统为基础,增加了SVM特征向量提取模块,SVM训练和混合解码模块三大模块,在图1中由密虚线表示SVM的训练过程,语音信号的训练样本经过特征提取之后获得特征矢量序列O,即观察序列。通过SVM特征向量提取模块获得用于SVM分类器训练的定长的特征矢量。由实线表示识别过程,将HMM识别出来音节段落信息构建成可用于SVM分类器分类的特征矢量信息,然后把经过SVM分类器得到的距离信息通过sigmoid函数拟合成后验概率,输入混合解码器获取最后的识别结果。语音识别模型的主要框架如图2所示。
[0035] 如图所示,本发明采用基于HMM/SVM混合模型的SVM多分类器,基于HMM的语音识别系统通常由声学模型、发音词典、搜索空间、搜索算法模块组成,其中搜索算法是决定系统性能的关键,搜索空间的构造不仅本身影响着内存的占用,而且也影响着搜索的效率,移动设备语音识别大多面向特定的任务和环境。由于先验知识丰富,具有简单、准确高效描述事物某部分特征的特点,本发明采用在决策树中加入基于先验知识的分类器可以有效缓解SVM决策树方案错误累积的问题。
[0036] 结合图3所示,该多分类器的设计方法是根据汉语语音的特点,采用音节作为声学载体进行建模,为有效进行音节区分出多分类的结果,本发明的SVM决策树多分类器构造方法为:首先计算特征空间中各类之间的距离,如此每一类都存在k-1个与其他类之间的距离值,然后将其按由大到小的顺序进行排序,再用二值SVM训练算法构造各类的最优超平面,构造完一个节点后删除其正样本,以下一个样本作为正样本,其他样本为负样本构造下一个节点的二值分类器,直到所有节点分类完成,对应的算法流程如图3所示。
[0037] 需要说明的是,对于语音信号的分类问题,SVM分类性能很好,但是不适合处理连续输入样本,需要将其输出值转换为可用的后验概率输出才能和HMM构建混合模型。本发明采用了一种SVM距离到后验概率的计算方法,对语音信号在识别过程中进行综合计算,将SVM的输出转化为后验概率。本发明所采用的SVM距离到后验概率的计算方法如下:
[0038] SVM的输出格式是y=sign(f(x)) (1)
[0039] 在核化的情况下,对于训练样本集 分类函数可以写为
[0040]
[0041] 式中,x是输入向量,xi∈Rn是支持向量,αi∈R是拉格朗日系数,yi∈{+1,1}是对应的αi的标签,K(·)是核函数,b∈R是最优超平面的偏移量。当f(x)>0时y属于正样本,当f(x)<0时y属于负样本,y在f(x)取值下属于正样本的概率如式(3)所示,f(x)是SVM距离。
[0042]
[0043] 每个类的条件概率假设由高斯函数模型描述为
[0044] 正样本:
[0045] 负样本:
[0046] 则式(3)可表示为:
[0047]
[0048]
[0049] A和B是估计参数,在模型训练参数设定时可由LibSVM模型工具包获得。
[0050] 下面对SVM/sigmoid混合训练模型进行说明:
[0051] 由于SVM输出值的符号表示其分类结果,其绝对值表示样本到分类面的距离,因此为了得到校准的后验概率,将SVM的输出通过sigmoid函数转换成概率模型以提高模型的性能:
[0052] 式(6)中的参数A和B通过最大似然问题加以确定:
[0053] minA,BF(A,B)=∑i=1(ti(log(pi)+(1-ti)log(1-pi)) (7)[0054] 其中pi=P(fi),
[0055]
[0056] N+为正样本数,N-为负样本数。
[0057] 训练方法为将采集的语音通过Baum-Welch算法来训练HMM模型,所采用的HMM拓扑结构为自左向右二转移多维混合高斯密度函数连续的HMM模型,在训练过程中,将HMM作为训练模型的一部分和SVM共同组成训练模型,以HMM为训练模型的前级,以此对用于SVM模型训练的训练数据进行有区分性的特征变化,并以HMM的多维概率输出作为后级SVM模型的输入矢量,最后SVM的输出通过Sigmoid函数按(6)式转换为后验概率,具体训练过程如图4所示。
[0058] 最后,本发明的基于语音识别引擎的移动设备农产品数据采集系统的结构如下:
[0059] (1)数据采集模块:语音识别引擎为语音识别输入提供支持;农产品价格数据采集模块实现在工作现场对各种农产品价格的采集、保存、修改等功能。
[0060] (2)数据维护查询模块:数据维护模块可实现对各种采集到的信息进行浏览、删除、修改等操作;数据查询模块提供对价格数据的查询。
[0061] (3)数据传送模块:远距离情况下,可以把采集的数据通过无线分组方式传送至服务器上;近距离通过采用无线局域网方式,实现服务器与移动设备终端之间的数据传输。
[0062] (4)数据同步模块:该模块主要采用合并复制技术,通过无线局域网使移动设备与服务器之间进行数据交换,以保持两者的一致性。
[0063] (5)系统维护模块:用户管理实现对登录用户和密码的验证,限制非法访问,保证系统的安全性;农产品种类维护实现对农产品种类信息的添加、删除、修改等功能;语音库维护实现识别语音库的装入与卸载。
[0064] 至于各模块的具体组成部分的实现,本领域的技术人员可以根据现有技术采用多种方案,本文中不再详细叙述。
[0065] 虽然本发明已以具体实施例揭示,但其并非用以限定本发明,任何本领域的技术人员,在不脱离本发明的构思和范围的前提下所作出的等同组件的置换,或依本发明专利保护范围所作的等同变化与修饰,皆应仍属本专利涵盖的范畴。