基于深度学习的车载交互控制算法转让专利

申请号 : CN201710873933.5

文献号 : CN107662617B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李嫄源朱庆元朱智勤李鹏华王冠

申请人 : 重庆邮电大学

摘要 :

本发明涉及一种基于深度学习的车载交互控制算法,属于车联网智能控制技术领域。该算法包括:多特征融合下的自然语言数据稀疏表示,使词、句子等多层次结构中的词向量与词性、依存关系等语境向量深度融合,且稀疏表示融合生成的词向量;半监督学习下的自然语言深度学习模型优化,使深度学习模型与自然语言任务匹配,并按不同训练环境快速切换梯度学习机制;表示学习下的自然语言张量知识图构建与推理,使知识图中的实体、概念、类别以及语义关系转换为同一语义空间的数值向量,利用多列卷积神经网络学习获取知识特征向量,通过目标问句向量与知识特征向量的相似度得分计算实现知识推理。本发明能有效应答用户交互的自然语言信息,满足用户的行车需求。

权利要求 :

1.一种基于深度学习的车载交互控制算法,其特征在于:该算法包括以下步骤:

S1:获取行车过程相关控制命令与行车自然语言的训练文本;

S2:采用词向量表征方式融合多语境描述进行数据稀疏表示;

S3:构建优化型卷积神经网络学习模型;

S4:在同一语义空间中利用相似度得分机制实现知识图推理;

所述步骤S1具体为:由网络爬虫从互联网获取行车自然语言数据;过滤冗余信息并人工整合行车控制命令与行车自然语言数据;获取训练文本;

所述步骤S2具体为:用最大熵依存句法分析器划分文本短语并获取语境量化描述;采用word2vec将其融合成词向量,借助无监督最大释然学习实现所述数据稀疏表示;

所述步骤S3具体为:构造条件函数来优化切换多学习机制;对稀疏表示的训练数据进行无监督学习预训练进而获取其训练权值;按照适当比例将人工知识注入部分训练数据进行再学习构成所述神经网络学习模型;

所述学习模型通过训练文本稀疏表示进行重复迭代训练更新权重至误差在预设的误差范围之内;

所述步骤S4具体为:根据人类知识表征结构构造附有语义信息的三维张量定义知识图三元组;通过多列卷积神经网络生成知识实体与所需答案相关特征向量;通过哈希、卷积、池化和语义映射运算后得到所述答案相关特征向量;

相似度得分机制为:对词嵌入学习得到的知识图三元组数值向量采用Recursive sentence基本表示结构,在稀疏化表示后提交给多列卷积神经网络模型CNN;通过该神经网络模型的哈希、卷积、最大池化和语义映射运算之后得到答案类型、答案路径、答案周围实体三种特征向量;将这三种特征向量分别与问句向量做相似度计算,最终的推理得分由三种相似度求和而得;即,S(q,a)=f1(q)Tg1(a)+f2(q)Tg2(a)+f3(q)Tg3(a);其中,S(q,a)表示推理得分,f1(q)Tg1(a)表示答案类型的相似度,f2(q)Tg2(a)表示答案路径的相似度,f3(q)Tg3(a)表示答案周围实体的相似度。

说明书 :

基于深度学习的车载交互控制算法

技术领域

[0001] 本发明属于车联网智能控制技术领域,涉及一种基于深度学习的车载交互控制算法。

背景技术

[0002] 随着汽车行业的快速发展,汽车不断深入进人们的生活之中。与此同时,由于车载智能设备为驾驶者提供了诸多便利与舒适体验,消费者对于车载设备的需求量越来越大,对其性能要求也逐渐提高。
[0003] 现有技术中,通过按钮或键盘进行操作控制的系统只能实现基本控制功能,在短信与导航方面需要反复操作,不利于行车安全并给用户带来了较差的使用体验。而当前使用语音识别控制则多采用类似字符串匹配的方法进行用户交互控制的系统,驾驶员需要记忆并准确呼叫特定语音信息才能实现控制功能,缺乏人性化的人机交互设计,对于行车体验显得复杂而繁琐,降低了用户体验且不利于行车安全。
[0004] 对于目前存在的情况,迫切需要开发一种新型车载交互控制技术,而深度学习近年来在自然语言处理方向迅猛发展为车载交互控制提供了新的思路。

发明内容

[0005] 有鉴于此,本发明的目的在于提供一种基于深度学习的车载交互控制算法,旨在提供用户快捷舒适的操作体验与安全的行车环境。
[0006] 为达到上述目的,本发明提供如下技术方案:
[0007] 一种基于深度学习的车载交互控制算法,包括以下步骤:
[0008] S1:获取行车过程相关控制命令与行车自然语言的训练文本;
[0009] S2:采用词向量表征方式融合多语境描述进行数据稀疏表示;
[0010] S3:构建优化型卷积神经网络学习模型;
[0011] S4:在同一语义空间中利用相似度得分机制实现知识图推理。
[0012] 进一步,由网络爬虫获取互联网行车自然语言,辅以人工整合方式过滤冗杂信息并归类控制命令作所述训练文本。
[0013] 进一步,用HanLP中CRF句法分析器与最大熵依存句法分析器划分文本短语并获取语境量化描述;采用word2vec将其融合成词向量,借助无监督最大释然学习实现所述数据稀疏表示。
[0014] 进一步,构造条件函数来优化切换SGD、LBFGS、CG学习机制构成所述不同梯度学习机制;选择合适的梯度表示完成学习模型检查,对所述稀疏表示的训练数据进行无监督学习预训练进而获取其训练权值;按照适当比例将人工知识注入部分训练数据进行再学习构成所述神经网络模型。
[0015] 进一步,通过表示学习捕获文本分布式语义信息并设计带有语义信息的三维张量来表征知识图中的三元组;构造表征语义关系的映射向量或映射矩阵将知识图中的实体你、概念、类别以及关系转换为同一语义空间的数值向量;利用人工设定模板对已有三元组进行扩展,按照弱监督方式标定训练数据,采用随机破坏方式获取负样本;将稀疏表示的三元组数值向量提交给多列卷积神经网络,通过哈希、卷积、池化和语义映射运算后得到所述答案相关特征向量。
[0016] 本发明的有益效果在于:本发明能有效应答用户交互的自然语言信息,提供用户快捷舒适的操作体验与安全的行车环境,满足用户的行车需求。

附图说明

[0017] 为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
[0018] 图1为车载交互控制算法流程示意图;
[0019] 图2为车载交互控制算法结构示意图;
[0020] 图3为多特征融合下的词向量稀疏编码表示;
[0021] 图4为深度学习下的自然语言理解模型;
[0022] 图5为表示学习下的知识图构建,(a)为三维张量知识表征;(b)为知识实体的语义关系映射。

具体实施方式

[0023] 下面将结合附图,对本发明的优选实施例进行详细的描述。
[0024] 如图1、图2所示,本发明提供一种基于深度学习的车载交互控制算法。该算法通过HanLP与Stanfordparser中的CRF句法分析器与最大熵依存句法分析器将文本划分为词或短语,并获取词性、词序、关键词、依存关系等量化描述。
[0025] 本发明采用word2vec将划分的词或短语转化为词向量,并与获取的量化描述融合成新的词向量。根据不同自然语言处理任务的需要,词向量融合方式可采取拼接、加权、或者哈希计算。词向量融合效果由随后进行的无监督学习下稀疏表示过程的参数进行综合评判。
[0026] 如图3所示,本发明通过在深置信度神经网络的隐藏层神经元中引入稀疏限制和正则项,推导相应的损失函数和惩罚函数,构建稀疏边缘降噪自动编码器;将融合词序、词序、依存关系等语境特征的词向量提交给该编码器,借助损失函数的更新完成深度神经网络的预训练,微调神经网络的权值、偏置、稀疏限制和正则限制项等参数,完成自然语言数据的稀疏表示。
[0027] 如图4所示,本发明根据自然语言处理任务,综合考虑Sigmoid、Tanh、Hard、Soft sign、Rectifier等非线性函数特性,选取能有效降低深度网络训练复杂度的非线性过程,构建面向自然语言的深度学习模型。通过选择合适的梯度表示,对学习模型进行交叉验证,检查学习模型是否存在缺陷。
[0028] 本发明依据选择的基本表示结构,将稀疏表征下自然语言训练数据全集(未进行人工知识标注),提交给构建的深度学习模型进行无监督学习预训练,获得预训练权值。其中,设置深度神经网络隐藏层偏置为0,输出层的偏置为假定权值时的最优值。权值设置为w∈(-r,r), 这里的fanin为前一层网络节点数,fanout为后一层网络节点数。完成预训练后,对训练数据中的部分数据集(不超过整体的20%)进行人工知识标注,将这些数据按照同样的表示结构提交给带有预训练权值的深度学习模型进行有监督训练。
为提高训练速度,在多核机驱动下,构建关于学习率的切换函数实现SGD、LBFGS、CG学习机制的优化切换。
[0029] 如图5(a)所示,本发明通过定义三元组(h,r,t)生成三维张量来构建语义知识图,其中,代表头语义实体,代表语义关系,代表尾语义实体。通过张量分解,得到一个核心张量和一个因子矩阵,核心张量中每个二维矩阵切片代表一种语义关系,因子矩阵中每一行代表一个语义实体。由核心张量和因子矩阵还原的结果可看作对应三元组成立的概率。
[0030] 如图5(b)所示,假设和经过某种与相关的映射后所得的向量相似或相等,在定义能量函数fr(h,t)前提下,构建 学习目标函数来保证知识图中出现的三元组获得较高学习目标值,同时对未出现的三元组进行惩罚。语义关系采用映射向量或映射矩阵来表示,通过设定映射函数将三元组的头实体和尾实体映射到与目标关系相关的语义空间中来实现知识“1-to-1”、“1-to-N”、“N-to-N”的转换。
[0031] 本发明利用人工设定的模板对已有的三元组进行扩展,生成自然语言问句,以弱监督的方式标定大量的训练数据,并采用随机破坏已有“问句--答案”三元组对中元素的方式获取负样本。引入词嵌入概念将获取的知识图训练样本转换为为低维空间向量,使知识推理转化为通过构建深度神经网络处理自然语言问句的问题,从而找到“问句实体--知识图实体”的对应关系,以及“问句自然语言描述--知识图语义关系”的对应关系。
[0032] 本发明对词嵌入学习得到的知识图三元组数值向量采用Recursive sentence基本表示结构,在稀疏化表示后提交给多列卷积神经网络模型(Multi-column CNN)。通过该神经网络模型的哈希、卷积、最大池化和语义映射运算之后得到答案类型、答案路径、答案周围实体三种特征向量。将这三种特征向量分别与问句向量做相似度计算,最终的推理得分由三种相似度求和而得。即,S(q,a)=f1(q)Tg1(a)+f2(q)Tg2(a)+f3(q)Tg3(a)。其中,f1(q)T T Tg1(a)表示答案类型的相似度,f2(q)g2(a)表示答案路径的相似度,f3(q)g3(a)表示答案周围实体的相似度。
[0033] 通过以上的实施方式的描述,所述功能如果以软件功能单元的形式实现并作为独立的产品销售或者使用时,可以存储在计算机或车机可读存储介质中执行各个实施例或者实施例的某些部分所述的方法。
[0034] 最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。