设备控制装置及设备控制方法转让专利

申请号 : CN200480036113.1

文献号 : CN100590710C

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 小山利佳

申请人 : 株式会社建伍

摘要 :

语言解析单元(2)对语音输入单元(1)所输入的语音实施语音识别,确定该语音可能表现的单词和其得分,并将表示它们的单词数据供给智能处理单元(6)。智能处理单元(6)存储对取得单词数据等的数据取得处理、判别处理、输入输出处理进行定义的处理项目数据,并且,定义从一个处理向下一个处理的转移并存储对该转移付与加权系数的数据即线路,执行将处理项目数据和线路作为整体表示的流,由此控制属于输入输出对象设备组(5)的设备。根据由处理所处的地点和线路的连接关系决定的各线路的加权系数,和单词数据的得分,来决定向流内的哪个处理转移。线路和处理项目数据可通过外部服务器下载。

权利要求 :

1.一种设备控制装置,对设备(5)进行控制,其特征在于,包括:

语音信号识别单元(6、61),识别输入的语音信号,确定该语音信号 中包括的语句的候选,对于所述确定的语句的候选的各个候选,计算似然;

处理项目数据存储单元(D4),存储多个处理项目,所述处理项目由通 过所述语音信号识别单元确定的语句的候选来表示;

转移定义数据存储单元(D5),将该语句的候选所表示的处理项目与规 定的常数建立对应并存储,从而存储多个转移定义数据,所述转移定义数 据定义从多个处理项目中的一个处理项目向其他处理项目的转移;

设备控制单元(6),根据所述语音信号识别单元所确定的语句的候选、 所述语音信号识别单元所计算的该语句的似然、以及该转移定义数据所表 示的常数,决定当前的处理项目的下一个执行的处理项目,按照决定的处 理项目,控制所述设备;以及取得单元(6、61、64),在由所述设备控制单元(6)决定的控制所述 设备的处理项目和/或该转移定义数据没有存储于所述处理项目数据存储 单元(D4)和/或所述转移定义数据存储单元(D5)中的情况下,对位于外 部的新的处理项目和/或转移定义数据的供给源(100)进行访问,取得该 新的处理项目和/或转移定义数据,将存储于所述处理项目数据存储单元中 的旧的处理项目、或存储于转移定义数据存储单元中的旧的转移定义数据, 更新为该新的处理项目或转移定义数据。

2.如权利要求1所述的设备控制装置,其特征在于:

所述供给源将所述新的处理项目或转移定义数据压缩后供给,

所述取得单元包括将从所述供给源取得的该新的处理项目或转移定义 数据进行解压的单元。

3.如权利要求1所述的设备控制装置,其特征在于:

上述设备控制单元(6)分别计算由下述乘积表示的值,并将与计算的 值之中最大的值对应的语句的候选所表示的处理项目,作为下一个处理项 目,该乘积是:与从当前的处理项目向包括所述语音信号识别单元所确定 的语句的候选在内的其他处理项目的转移建立了对应的该常数、和所述语 音信号识别单元所计算的该语句的似然的乘积。

4.一种设备控制方法,对设备(5)进行控制,其特征在于,包括:

语音信号识别步骤(S11),识别输入的语音信号,确定该语音信号中 包括的语句的候选,对于所述确定的语句的候选的各个候选,计算似然;

处理项目数据存储步骤,在第一存储器中存储多个处理项目,所述处 理项目由所述语音信号识别步骤中确定的语句的候选来表示;

转移定义数据存储步骤,将该语句的候选所表示的处理项目与规定的 常数建立对应并存储,从而在第二存储器中存储多个转移定义数据,所述 转移定义数据定义从多个处理项目中的一个处理项目向其他处理项目的转 移;

设备控制步骤(S15),根据所述语音信号识别步骤所确定的语句的候 选、所述语音信号识别步骤所计算的该语句的似然、以及该转移定义数据 所表示的常数,决定当前的处理项目的下一个执行的处理项目,按照决定 的处理项目,控制所述设备;以及取得步骤(S22、S34),在由所述设备控制步骤决定的控制所述设备的 处理项目和/或该转移定义数据没有存储于所述第一存储器和/或所述第二 存储器中的情况下,对位于外部的新的处理项目和/或转移定义数据的供给 源(100)进行访问,取得该新的处理项目和/或转移定义数据,将在所述 处理项目数据存储步骤存储的旧的处理项目、或在转移定义数据存储步骤 存储的旧的转移定义数据,更新为该新的处理项目或转移定义数据。

说明书 :

技术领域

本发明涉及设备控制装置、语音识别装置、代理装置及设备控制方法。

背景技术

近年来,已使用着利用语音识别技术来识别语音,响应识别结果而控 制电气设备的方法。例如,在专利文献1中,公开了以下方法,即输入语 音,对输入的语音所表示的单词进行识别,判别被识别的单词是否与规定 的关键词一致,从而根据判别结果来控制外部设备。
专利文献1:特开平8-339288号公报(日本)
但是,难以完全地识别人用嘴发出的指示。因此,在上述方法中,有 不能正确地响应人用语言形式发出的指示的情况。

发明内容

本发明是鉴于上述实际状况而完成的发明,其目的在于,提供一种设 备控制装置、语音识别装置、代理装置及设备控制方法,能够正确地响应 人用语言形式发出的指示来控制设备。
为了实现上述目的,本发明的第一方案的设备控制装置,包括:
输入信息识别单元,识别所输入的输入信息;
处理项目数据存储单元,存储多个处理项目,所述处理项目执行与通 过输入信息识别单元识别出的输入信息对应的处理;
转移定义数据存储单元,存储多个转移定义数据,所述转移定义数据 定义从多个处理项目中的一个处理项目向其他处理项目的转移;以及
更新单元,对位于外部的新的处理项目和/或转移定义数据的供给源进 行访问,取得该新的处理项目和/或转移定义数据,将存储于所述处理项目 数据存储单元中的旧的处理项目、或存储于转移定义数据存储单元中的旧 的转移定义数据,更新为该新的处理项目或转移定义数据;
各个所述转移定义数据分别具有与输入信息对应的条件,
通过所输入的所述输入信息和各转移定义数据的条件的比较,选择一 个转移定义数据,使状态转移到由所选择的转移定义数据指定的处理项目。
也可以是,所述供给源将所述新的处理项目或转移定义数据压缩后供 给,所述取得单元包括将从所述供给源取得的该新的处理项目或转移定义 数据进行解压的单元。
此外,本发明的第二方案的语音识别装置,包括:
语音信号识别单元,识别输入的语音信号;
处理项目数据存储单元,存储多个处理项目,所述处理项目执行与通 过语音信号识别单元识别出的语音信号对应的处理;
转移定义数据存储单元,存储多个转移定义数据,所述转移定义数据 定义从多个处理项目中的一个处理项目向其他处理项目的转移;以及
更新单元,对位于外部的新的处理项目和/或转移定义数据的供给源进 行访问,取得该新的处理项目或转移定义数据,将存储于所述处理项目数 据存储单元中的旧的处理项目、或存储于转移定义数据存储单元中的旧的 转移定义数据,更新为该新的处理项目或转移定义数据;
各个所述转移定义数据分别具有与输入信息对应的条件;
通过所输入的所述语音信号和各个转移定义数据的条件的比较,选择 一个转移定义数据,并使状态转移到由所选择的转移定义数据指定的处理 项目。
也可以是,所述供给源将所述新的处理项目或转移定义数据压缩后供 给,所述更新单元包括将从所述供给元取得的该新的处理项目或转移定义 数据进行解压的单元。
此外,本发明的第3方案的代理装置,包括:
输入信息识别单元,识别所输入的输入信息;
处理项目数据存储单元,存储多个处理项目,所述处理项目执行与通 过输入信息识别单元识别出的输入信息对应的处理;
转移定义数据存储单元,存储多个转移定义数据,所述转移定义数据 定义从多个处理项目中的一个处理项目向其他处理项目的转移;以及
更新单元,对位于外部的新的处理项目和/或转移定义数据的供给源进 行访问,取得该新的处理项目或转移定义数据,将存储于所述处理项目数 据存储单元中的旧的处理项目、或存储于转移定义数据存储单元中的旧的 转移定义数据,更新为该新的处理项目或转移定义数据;
各个所述转移定义数据分别具有与输入信息对应的条件;
通过所输入的所述输入信息和各个转移定义数据的条件的比较,选择 一个转移定义数据,并使状态转移到由所选择的转移定义数据指定的处理 项目。
也可以是,所述供给源将所述新的处理项目或转移定义数据压缩后供 给,所述更新单元包括将从所述供给源取得的该新的处理项目或转移定义 数据进行解压的单元。
此外,本发明的第四方案的设备控制方法,包括:
处理项目数据存储步骤,存储多个处理项目,所述处理项目执行与在 输入信息识别步骤中识别出的输入信息对应的处理;
转移定义数据存储步骤,存储多个转移定义数据,所述转移定义数据 分别具有与输入信息对应的条件,定义从多个处理项目中的一个处理项目 向其他处理项目的转移;以及
更新步骤,对位于外部的新的处理项目或转移定义数据的供给源进行 访问,取得该新的处理项目或转移定义数据,将在所述处理项目数据存储 步骤存储的旧的处理项目、或在转移定义数据存储步骤存储的旧的转移定 义数据,更新为该新的处理项目或转移定义数据;
还具有:
所述输入信息识别步骤,识别所输入的的输入信息;以及
通过所输入的所述输入信息和各转移定义数据的条件的比较,选择一 个转移定义数据,使状态转移到由所选择的转移定义数据指定的处理项目 的步骤。
根据本发明,能够实现正确地响应人以语言形式发出的指示,来控制 设备的设备控制装置、语音识别装置、代理装置及设备控制方法。

附图说明

图1是表示本发明的实施方式涉及的车内空调系统的图。
图2是该实施方式涉及的车内空调系统的更详细的结构图。
图3是示意地表示用于分组(grouping)的标志的具体例的图。
图4是用于说明触发取得处理的图。
图5是用于说明判别处理的图。
图6是用于说明带查询的判别处理的图。
图7是用于说明输入输出处理的图。
图8是表示线路(wire)的图。
图9是表示将处理项目数据库及线路数据库作为整体表现的流的图。
图10(a)、图10(b)是用于说明加权系数的设定的图。
图11是用于说明智能处理单元的动作的流程图。
图12是表示外部服务器(发送服务器)的结构和网络结构的图。
图13(a)、图13(b)是用于说明下载处理的流程图。
标号的说明
1  语音输入单元
2  语言解析单元
3  语音合成处理单元
4  语音输出单元
5  输入输出对象设备组
51 空调机
52 窗开闭控制单元
6  智能处理单元

具体实施方式

以下,参照附图,以设置于车辆内的车内空调系统为例说明本发明的 实施方式。
图1是表示该车内空调系统的结构的方框图。图2是表示各部分的物 理结构例的方框图。
如图1所示,该车内空调系统包括:语音输入单元1、语言解析单元2、 语音合成处理单元3、语音输出单元4、输入输出对象设备组5、以及智能 处理单元6。
语音输入单元1输入语音,由输入的语音生成数字形式的语音数据, 并将该语音数据供给到语言解析单元2。具体地说,如图2所示,语音输入 单元1例如包括:话筒11、AF(Audio Frequency:音频)放大器12、内 置有采样保持电路的A/D(Analog-to-Digital:模数)转换器13等。话筒 11将语音转换为语音信号来输出。AF放大器12放大输出来自话筒11的语 音信号。A/D转换器13对来自AF放大器12的被放大的语音信号进行采样, 通过A/D转换,生成数字语音数据,向语言解析单元2供给。
如图2所示,语言解析单元2和语音合成处理单元3及智能处理单元 6分别包括:例如CPU等构成的处理器21、31、61;存储有这些处理器21、 31、61执行的程序的硬盘装置等非易失性存储器22、32、62;以及具有作 为处理器的工作区域的存储区域的RAM等易失性存储器23、33、63。再有, 也可以将语言解析单元2、语音合成处理单元3及智能处理单元6的一部分 或全部的功能用一个处理器、一个非易失性存储器、一个易失性存储器来 构成。
语言解析单元2对从语音输入单元1供给的语音数据进行语音识别。 语言解析单元2通过语音识别处理,确定语音数据表示的单词的候选和该 候选的似然(得分)。语音识别的方法是任意的。此外,也可以确定多个单 词的候选。语言解析单元2生成表示确定了的候选和该候选的得分的数据 (以下,称为单词数据),并将其供给到智能处理单元6。
语音合成处理单元3的非易失性存储器32存储音片数据库D1和素片 数据库D2。音片数据库D1存储表示单词波形的数据,素片数据库D2存储 用于构成音素的波形的数据。
音片数据库D1存储表示单词波形的数据。素片数据库D2存储用于构 成音素的波形的数据。语音合成处理单元3使用存储在音片数据库D1和/ 或素片数据库D2中的数据,生成数字语音数据,该数字语音数据表示朗读 由智能处理单元6供给的文章数据的语音。
语音合成处理单元3将生成的语音数据提供给语音输出单元4。生成 数字语音数据的方法是任意的,例如可以使用录音编辑方式或规则合成方 式(Rule-based synthesis)。再有,录音编辑方式例如是预先请播音员朗 读单词单位的语音,将它们组合连接输出的方式。而规则合成方式是将音 韵(辅音或元音)或假名那样的比较小的单位组合连接输出的方式。
语音输出单元4再现从语音合成处理单元3供给的数字语音数据所表 示的语音。更详细地说,如图2所示,语音输出单元4包括D/A (Digital-to-Analog)转换器41、AF放大器42及扬声器43。D/A转换器 41将由语音合成处理单元3供给的数字语音数据进行D/A转换,转换为模 拟语音信号。AF放大器42将模拟语音信号放大。扬声器43根据模拟语音 信号产生振动,再现模拟语音数据所表示的语音,并输出语音。
输入输出对象设备组5例如包括空调机51、窗开闭控制单元52等。
空调机51根据控制信号,进行冷气、暖气或送风的动作。此外,空调 机51输出表示自身动作状态的数据,例如表示自身处于冷气工作中、暖气 工作中、向设定温度的温度调整中、送风工作中及停止中的哪个状态的状 态数据。
窗开闭控制单元52根据控制信号进行窗的开闭,其包括;电机;根据 控制信号控制电机的旋转及停止的控制电路;根据电机的旋转移动窗框的 绞盘(winch)等。此外,窗开闭控制单元52的控制电路输出表示窗开闭 控制单元52的工作状态的数据,例如表示窗打开着的量(程度、开度)的 数据。
智能处理单元6包括由调制解调器或分组通信终端等构成的通信控制 装置64,通过该通信控制装置并经由外部的网络(例如,经由无线电话线 路的因特网)连接到后述的发送服务器100。
智能处理单元6的非易失性存储器62存储单词数据库D3。单词数据 库D3将多个单词的数据、和表示多个单词的分组的单词分组用的一个以上 标志相互对应起来存储。
与一个单词对应的各标志与某个概念对应起来被分组。然后,在标志 表示规定的值(在下面,设该值为“1”)的情况下,与该标志对应的单词 被分组在与该标志对应的组中。另一方面,在该标志表示其他的值(例如 “0”)的情况下,该单词不被分组在与该标志对应的组中。
图3是示意地表示分组用的标志的具体例子的图。
在图3的例子中,对于单词“上升”、“热”及“打开”,分别对应着各 四位的单词分组用的标志。四位位组的最高位(MSB)的标志与所谓“温度” 的概念对应。从高位起第2位的标志与所谓“空调机的操作”的概念对应。 从高位起第3位的标志与所谓“窗的开闭”的概念对应。最低位的标志与 所谓“故障”的概念对应。
如图所示,与单词“上升”对应的4位标志组的值是二进制数“1110”, 与单词“热”对应的标志组的值是二进制数“1100”,与单词“打开”对应 的标志组的值是二进制数“1010”。
因此,这种标志组表示单词“上升”、“热”及“打开”被分组在概念 “温度”之下,单词“上升”及“热”被分组在概念“空调机的操作”之 下,单词“热”及“打开”被分组在概念“窗的开闭”之下,“上升”、“热” 或“打开”的任何一个都未被分组在概念“故障”之下。
再有,各单词及各概念被作为存储于处理项目数据库D4中的触发检测 处理的检测对象或各判断处理项目的判别对象而使用。
智能处理单元6的非易失性存储器还存储着处理项目数据库D4及线路 数据库D5。
处理项目数据库D4是存储了将智能处理单元6执行的各种处理、例如 触发取得处理(TGxx)、判别处理(CNxx或QBxx)及输入输出处理(后述 的Exxx)的内容按各个处理项目(指针)记述的数据(处理项目数据)的 数据库。再有,“xx”是识别号码。
在存储于处理项目数据库D4中的处理项目中,记述“触发取得处理 (TGxx)”的内容的数据包含:确定使这些处理开始的触发的触发数据(指 定作为触发取得的数据内容的数据);以及,行进方向决定用的转移常数k (表示向该行进方向转移的程度,成为后述的加权系数J的计算基准的常 数)。
触发数据是任意的,例如,是表示空调机处于冷气工作中、暖气工作 中、温度调整中、送风工作中及停止中的哪个状态的数据、表示窗打开着 的量的数据、表示室内温度的数据、由语言解析单元2供给的上述单词数 据。或者,触发数据也可以是从智能处理单元6自身进行的处理传递来的 数据。此外,在触发数据(触发取得处理中取得的数据)为单词数据的情 况下,也可以是表示被分配在该单词数据表示的单词所属的分组中的“概 念”的数据。其中,触发取得处理的内容是,使多个触发取得处理不相互 取得表示同一单词的单词数据那样地记述的内容。
图4(a)示出触发取得处理TGxx的例子。在该例中,触发TG01是取 得作为触发的单词“热”(识别单词“热”)的处理,用于决定是否进(转 移)至接在该处理后面的处理的转移常数k为0.8。在图4(b)中,表示 触发取得处理TG01的流程图。触发取得处理TG02是取得单词“打开”的 处理。触发取得处理TG03是取得属于与概念“温度”对应的组的单词(在 图3中,取得“上升”、“热”、“打开”中的某一个)的处理。TG04是取得 与概念“空调机的操作”对应的组的单词(在图3中,取得“上升”、“热” 中的某一个)的处理。
处理项目数据库D4中存储的记述“判别处理(CNxx)”的内容的数据, 包含按各判别处理记述了判别条件、作为判别结果可取得的结果列表、用 于按各判别结果决定行进方向的转移常数k、以及后述的返回方向的转移常 数k的数据。
图5(a)示出判别处理CNxx的例子。在该例中,判别处理CN01是“判 别窗是否开着的处理”,在判别为开着时,用于决定是否进至后续处理的转 移常数k为0.3;在判别为未开着时,用于决定是否进至接在其后的处理的 转移常数k为0.4。图5(b)表示该例的流程图。图5(b)所示的节点CN01.1 是表示处理开始点的始点节点,节点CN01.2是判别为窗闭着时的行进方向 的节点,其转移常数k为0.4。再者,节点CN01.3是判别为窗开着时的行 进方向的节点,其转移常数k为0.3。此外,判别处理CN02是判别空调机 51的状态是否接通(是否工作中)的处理,在判别为处于工作中时,用于 决定是否进至后续处理的转移常数k为0.5;在判别为关断(不工作)时, 用于决定是否进至后续处理的转移常数k为0.3。
也可以是,“判别处理”有时从任意的取得源取得用于判别的数据。作 为取得源,考虑例如语言解析单元2、智能处理单元6所执行的其他处理、 属于输入输出对象设备组5的设备、其他外部设备等。因此,这种情况下, 记述判别处理的内容的数据例如还包含指定取得源的数据,该取得源是使 用于判别的数据的取得源。
此外,在“判别处理”中,也可以将规定的数据在判别之前输出到规 定的输出目的地(这种情况下,表示处理的记号例如设为QBxx)。例如,考 虑在判别之前将表示规定的询问的数据传递给语音合成处理单元3等。在 判别处理中,在判别规定数据之前输出规定数据的情况下,记述判别处理 内容的数据例如包含输出的数据的内容、和指定该数据的输出目的地的数 据。
图6(a)表示判别处理QBxx的例子。在该例中,例如判别处理QB01 是向使用者询问“开窗吗?开空调机吗?”,在其应答(使用者的回答)为 “开空调机”时的行进方向的转移常数k为0.7,在应答为“开窗”时的行 进方向的转移常数k为0.4。图6(b)中表示该例的流程图。图6(b)中 所示的节点QB01.1是表示处理的开始点的始点节点,节点QB01.2是判别 出对于查询指定了打开“空调机”时的行进方向的节点,其转移常数k为 0.7。再者,节点QB01.3是判别出指定了开窗时的行进方向的节点,其转 移常数k为0.4。此外,判别处理QB02向使用者询问“关窗吗?”,在其应 答(使用者的回答)为“关”时的行进方向的转移常数k为0.5,在应答为 “不关”时的行进方向的转移常数k为0.3。
记述存储在处理项目数据库D4中的“输入输出处理”的内容的数据, 由指定要输入或输出的数据的内容的数据构成。输入数据及输出数据可以 具有任意的内容。例如,输出数据也可以是表示经由语音合成处理单元3 使语音输出单元4产生的语音读法的数据、或控制外部设备的控制信号。 而且,输入数据也可以是例如从外部设备供给的数据。
图7(a)中表示输出处理EXxx的例子。在该例中,例如,输出处理 EX01是“关窗且使空调机工作”的工作,进行工作后处理的行进方向的加 权系数为0.8。图7(b)示出该例的流程图。图7(b)中示出的节点EX01.1 是表示处理的开始点的始点节点,节点EX01.2是表示处理的结束的节点, 加权系数k为0.8。再有,关于“输入输出处理”,也可以不设定行进方向 的加权系数,这种情况下,在执行了“输入输出处理”后,一定进行行进 方向的节点EX01.2的选择即可。
线路数据库D5由记述多个处理(TG、CNxx、QBxx、EXxx)间的转移的 数据(以下,将这种数据称为线路)的集合构成。线路例如由以图8所示 的格式记述的数据构成,线路Wn(W1、W2…)如图示那样,是对于从在先 的处理X(From(X))向在后的处理Y(To(Y))的转移(From(X)To(Y)), 指定该在先的处理(X)、该在后的处理(Y)、和向该转移付与的加权系数J 的数据。再有,当在先的处理X是判别处理时,甚至需要记述是来自该判 别处理的哪个判别结果的转移。而且,转移源处理X和转移目的地Y分别 由各处理的节点号码确定。各线路的加权系数J不是固定值,而是随着处 理的行进,适当计算并设定的值。线路的加权系数J的计算参照图10在后 面叙述。
智能处理单元6执行将处理项目数据库D4和线路数据库D5作为整体 表现的流(flow)。若处理项目数据库D4及线路数据库D5基于例如图3~ 图8的例子,则作为整体可以记述图9所示的流。
在图9所示的流中,智能处理单元6在触发处理TG01中,等待从语言 解析单元2提供表示“热”的单词的单词数据,如果被提供,则取得该单 词数据后传递给判别处理CN01(线路W1)。
智能处理单元6在判别处理CN01中,从窗开闭控制单元52取得表示 窗是否开着的信息,在判别为开着时,转移到输入输出处理EX01(线路W2)。 在输入输出处理EX01,向窗开闭控制单元52输出指示将窗关闭的控制信 号,向空调机51输出指示开始冷气工作的控制信号。其结果,窗开闭控制 单元52将窗关闭,空调机51开始冷气工作。
另一方面,在判别处理CN01,若判别为窗关着时,将处理转移到包含 询问的判别处理QB01(线路W3)。在判别处理QB01,智能处理单元6首先 将表示“开窗吗?还是打开空调机?”的文章的数据提供给语音合成处理 单元3。语音合成处理单元3通过语音输出单元4再现朗读该文章的语音。
在判别处理QB01中,智能处理单元6接着等待从语言解析单元2供给 表示单词“窗”或单词“空调机”的数据,当该数据被提供时,判别该数 据表示单词“窗”或单词“空调机”的哪一个。然后,在判别为表示单词 “窗”时,处理转移到输入输出处理EX03(线路W5);在判别为表示单词 “空调机”时,处理转移到输入输出处理EX02(线路W6)。
在输入输出处理EX02中,智能处理单元6向空调机5输出指示开始冷 气工作的控制信号。另一方面,智能处理单元6在输入输出处理EX03中向 窗开闭控制单元52输出指示将换气用的窗打开的控制信号。
另一方面,智能处理单元6等待从语言解析单元2供给表示“开窗” 或“开”的单词的数据(触发处理TG02),当被供给时,处理转移到输入输 出处理EX03(线路W4)。
智能处理单元6例如在语言解析单元2供给多个单词数据的情况等中, 并行地进行多个判别处理。这种情况下,智能处理单元6将同一单词作为 输入对象的处理(例如,触发取得处理、判别处理中的数据输入)有多个, 在表示相应的单词的单词数据从语言解析单元2供给的情况下,并行地进 行所有这些处理。
接着,参照图10(a)~图10(c)说明计算各线路的加权系数J的方 法。
在多个处理通过线路W连结的情况下,将当前处理中的处理作为起点, 直至正在关注的线路W为止的转移的路径上的转移常数k依次相乘,由此 求出关注的线路W的加权系数J。
为了容易理解,在图10(a)中假设表示流的处理。
图10(a)的处理,作为整体是在用户发声为“热”时,检测出它而 启动,首先,判别窗是否开着,在关着的情况下,向用户询问是开窗还是 打开空调机,并进行与用户的回答对应的处理。
在图10(a)所示的处理中,对于处理TG101、CN101、QB101的任一 个,各行进方向决定用的转移常数k对于正方向都为0.5、对于反(返回) 方向都为0.1。这种情况下,线路定义成例如图10(b)所示。
例如,在处理(或控制)位于触发取得处理TG101时(处理指针PP指 向触发取得处理TG101时),智能处理单元6将以触发取得处理TG101作为 起点、直至关注的线路为止的路径上的转移常数k依次相乘,由此计算线 路W51~W55(在存在未图示的线路时,包含它们的全部)各自的加权系数 J,使计算结果与线路W51~W55对应地写入到线路数据库D5。
具体地说,在处理位于触发取得处理TG101时,例如,线路W51的加 权系数J成为对触发取得处理TG101的与判别处理CN101连结的节点分配 的转移常数k的值,即0.5。判别处理CN101的线路W52的加权系数J成为, 在与触发取得处理TG101的线路W51有关的转移常数k=0.5上,乘以对与 判别处理CN101的线路W52连结的节点分配的转移常数k=0.5的结果,即 0.25。同样地,判别处理CN101的线路W54的加权系数J成为,在对触发 取得处理TG101的与线路W51连结的节点分配的转移常数k=0.5上,乘以 对判别处理CN101的与线路W54连结的节点分配的转移常数k=0.5的结果, 即0.25。
线路W53的加权系数J成为,在对触发取得处理TG101的与线路W51 连结的节点分配的转移常数k=0.5上,乘以对判别处理CN101的与线路W52 连结的节点分配的转移常数k=0.5之后,再乘以对判别处理QB101的与线 路W53连结的节点分配的转移常数k=0.5的结果,即0.125。同样地,线路 W55的加权系数J成为,在对触发取得处理TG101的与线路W51连结的节点 分配的转移常数k=0.5上,乘以对判别处理CN101的与线路W52连结的节 点分配的转移常数k=0.5之后,再乘以对判别处理QB101的与线路W55连 结的节点分配的转移常数k=0.5的结果、即0.125。
接着,当处理转移到判别处理CN101时,线路W52的加权系数J成为 与对同线路W52连结的节点分配的转移常数k相等的值0.5,线路W54的加 权系数J成为与对同线路W54连结的节点分配的转移常数k相等的值0.5。 此外,线路W53的加权系数J成为对与线路W52连结的节点分配的转移常 数k=0.5和对判别处理QB101的与线路W53连结的节点分配的转移常数 k=0.5之积、即0.25,线路W55的加权系数J成为对与线路W52连结的节 点分配的转移常数k=0.5和对判别处理QB101的与线路W55连结的节点分 配的转移常数k=0.5之积、即0.25。而且,反方向(在返回触发取得处理 TG101的方向)上的线路W51的加权系数J成为与对同线路W51连结的节点 分配的返回方向节点的转移常数k=0.1相等的值0.1。
而且,如果处理转移到判别处理QB101,线路W53和W55的加权系数J 成为与对同线路W53和W55分别连结的节点分配的转移常数k相等的值 0.5。
再者,线路W52的加权系数J成为对与其连结的返回方向的节点分配 的返回方向的转移常数k=0.1。再者,线路W51的加权系数J成为对判别处 理QB101的与线路W52连结的节点分配的返回方向的转移常数k=0.1和对 判别处理CN101的与线路W51连结的返回方向的节点分配的返回方向的转 移常数k=0.1之积0.01。线路W54的加权系数J成为对判别处理QB101的 与线路W52连结的节点分配的返回方向的转移常数k=0.1和对判别处理 CN101的与线路W54连结的节点分配的转移常数k=0.5之积的0.05。
图10(c)中示出各线路wn的加权系数J的变化例。
加权系数J的计算不仅对关联的流的处理执行,而且对于所有流的所 有线路执行,计算出的加权系数J被设定在各线路中。对于与当前处理无 关联的线路,也可以分配预先设定的低的系数值。但是,特别是对于以触 发取得处理TGxx作为先行处理的线路,将转移常数k设定为某种较高程度。 通过这样,也可跳到与之前的会话内容明显不同的会话。
下面,参照图11来说明这样构成的系统整体的工作。
语音输入单元1和语言解析单元2单独地工作,取入、解析语音,将 单词数据提供给智能处理单元6。然后,当从语言解析单元2供给了与判别 条件有关的(一个或多个)单词数据时,智能处理单元6进行以下处理。
首先,智能处理单元6对供给的单词进行辩别(识别)(图11步骤S11), 判别该单词与注册在单词数据库D4中的单词是否相当(步骤S12)。如果未 注册(步骤S12的“否”),则结束单词输入处理。
另一方面,如果已注册(步骤S12的“是”),则对于该单词或该单词 所属分组的“概念”成为条件的处理,计算单词的似然(得分)S和线路的 加权系数J之积S·J(步骤S13)。
例如,正在执行图10(a)所示的流时,处理指针PP指向触发取得处 理TG101。这种情况下的各线路的加权系数J如图10(c-1)所示。
该状态下,假设从语言解析单元2输入了表示得分为80%的单词“热” 和得分为50%的单词“窗”的单词数据。
在图10(a)所示的例子中,在触发取得处理TG101,单词“热”与判 别关联,在判别处理QB101,单词“窗”与判别关联。
如图10(c-1)所示,将输入表示单词“热”的单词数据的处理作为 在先处理的线路W51的加权系数J为0.5,将输入表示单词“窗”的单词数 据的处理作为在先处理的线路W53的加权系数J为0.125。这种情况下,对 线路W51及W53求出的似然S和加权系数J之积,如数学式1及2所示那 样。
(数学式1)关于线路W51的似然S和加权系数J之积J·S:“热”的 得分80%×线路W51的加权系数J(=0.5)=40
(算式2)关于线路W53的似然S和加权系数J之积J·S:“窗”的得 分50%×线路W53的加权系数0.125=6.25
智能处理单元6对流所具有的全部线路进行求得分和加权系数之积的 上述处理。
接着,智能控制单元6选择计算的积S·J为最大的线路(图11的步 骤S14)。智能控制单元6在选择的线路上将控制前进至后续的处理(步骤 S15)。例如,在对线路W51求出的积表示最高值的情况下,输入的单词数 据被识别为是表示单词“热”的单词数据,线路W51转移到作为后续处理 的判别处理CN101。通常,如果以当前处理中的处理作为起点,则与当前处 理有关的线路的加权系数J比较大。因此,一般地,虽然转移到下一个处 理,但输入了与以前完全不同的单词且似然高的单词的情况下,有时也开 始与该单词对应的处理。
智能处理单元6在处理转移时,根据转移后的状态,再次计算各线路 的加权系数J(步骤S16)。
以后,根据其处理的内容推进处理(步骤S17)。在该例中,执行判别 处理CN101。即,智能处理单元6从窗开闭控制单元52取入窗的开闭信息, 根据取入的信息推进处理。再有,表示来自窗开闭控制单元52的窗开闭的 信号,开的似然为100%或0%、闭的似然为0%或100%都可以。并且,也可 以是根据开度而变化。因而,在处理过程中,存在输入输出处理EXxx,如 果智能处理单元6执行该处理并输出语音数据,则其作为语音来出声。
此外,在处理的过程中,如输入输出处理EX01那样,若执行对空调机、 窗开闭控制单元52进行控制的处理,则根据其处理内容,进行对空调机51、 窗开闭控制单元52的控制。
再有,在图8、图9中,主要说明了基于“单词”的判别处理,但是, 基于概念的判别处理,也是同样的。此外,基于单词或概念的来自触发取 得处理的线路也成为判断的对象。对于来自触发取得处理的转移,最好是 设定成高到某种程度的加权系数。具体地说,例如图8的线路组、即在图9 的流中,对于取得表示“开窗”的单词的单词数据的来自触发取得处理TG02 的转移,例如付与加权系数0.8。于是,例如在智能处理单元6的处理与触 发取得处理TG01联系的情况下,用户发音为“开窗”,能够得到例如对于 单词“开窗”的得分为90%的单词数据,则该得分和与“用户是否说过‘开 窗’的判断”有关的线路W5的加权系数之积成为90%×0.8、即72。如果 该值是比对其他线路计算的得分和加权系数J之积更大的值,则输入的语 音被识别为是“开窗”,智能处理单元6跳到判别处理QB101的可能性高。 另一方面,如果将其他线路的加权系数设定得非常低,其结果,可沿着一 定程度假设的会话的流,提高辨别率,进行控制处理。
在该实施方式中,还可能产生向返回方向的转移。但是,现实中大多 不希望会话返回。因此,返回方向的转移常数k比行进方向的转移常数k 设定为更低的值就可以。于是,即使假设从输入的语音中可获得高得分的 语音数据,由于对作为基于返回方向的转移常数k的加权系数J而写入的 线路求出的积为低值,所以可以将向返回方向的转移的可能性抑制得较低。 此外,智能处理单元6可以将求出的积的值与规定条件不一致的处理(例 如,积的值未达到规定值的处理)从执行转移的对象中除去。
再有,例如图8中所示那样,线路以从处理项目至处理项目的形式来 定义转移。因而,通过将线路以图8所示的方式记述并存储在线路数据库 D5中,可将各处理项目之间的关系如计算机的宏处理那样来定义。由此, 可以容易地连接各处理项目。
此外,成为触发的处理项目,由于实际上成为与被连接的线路有关的 识别对象单词等(也可能是来自其他输入对象设备组的输入的情况)等的 得分的判定,所以在线路中触发取得处理项目不被定义为线路的开始点, 将线路本身定义为转移源。
而且,通过如上所述地利用线路来定义各处理项目的连接关系,可以 简单地追加线路。例如,在“热”的语音输入之后,用户打算休息片刻而 输入“寻找家庭饭店”的语音的机会多的情况下,对家庭饭店的检索处理 项目自动地追加线路。于是,在线路自动地被追加后,通过将与家庭饭店 检索处理项目连接的线路的加权系数加大一定程度,可以与该输入“寻找 家庭饭店”适当地对应。但是,这种情况下,智能处理单元6存储例如包 含表示家庭饭店位置的信息的地图数据,或访问外部的地图数据等。这种 线路的自动追加是,对从某个处理项目跳至某个处理项目的跳跃次数进行 计数,在其达到规定次数时自动地进行就可以。
智能处理单元6具有将处理项目数据库D4和线路数据库D5的内容更 新为从外部供给的新的处理项目数据和线路的功能。具体地说,例如,存 储处理项目数据和/或线路的外部服务器被更新其内容时,经由网络,对智 能处理单元6通知发生了处理项目数据和/或线路的更新。于是,智能处理 单元6响应该通知,经由网络,对该服务器进行访问,下载新的处理项目 数据和/或线路。然后,将在自己的处理项目数据库D4和线路数据库D5存 储的旧的处理项目数据和/或线路,更新为下载的新的处理项目数据和/或 线路。此外,如果智能处理单元6访问外部服务器,并且数据库被更新, 则也可以将其下载。
图12中示出外部服务器的结构例。
该外部服务器100是将单词数据、处理项目数据和/或线路数据经由通 信网络发送给多个车辆的智能处理单元6的服务器,其包括:控制单元110、 通信控制单元120、单词数据库130、处理项目数据库140、线路库150、 输入单元160、输出单元170。
控制单元110例如由CPU等构成,对发送服务器100的各单元进行控 制,并且通过执行规定的程序来实现后述的各处理。
通信控制单元120例如由调制解调器、路由器等的通信装置构成,对 经由发送服务器100与车辆的智能处理单元6(通信控制单元)之间的网络 的通信进行控制。
网络的结构是任意的。例如,可以采用专用线、公用线路网、有线电 视(CATV)网、无线通信网、有线广播网等。
单词数据库130例如由硬盘装置等可重写存的储装置构成,将发送服 务器100发送的单词数据同版本信息(例如,时间标记)一起存储。
处理项目数据库140例如由硬盘装置等可重写的存储装置构成,将发 送对象的处理项目数据与版本信息(例如,时间标记)一起存储。
线路数据库150例如由硬盘装置等可重写的存储装置构成,将发送对 象的处理项目数据与版本信息(例如,时间标记)一起存储。
发送服务器100的管理者适当操作输入单元160,更新各数据库130~ 150的信息。
当各车辆的智能处理单元6经由通信控制单元(CCU)64接收来自发 送服务器100的更新通知时,例如开始图13(a)的处理,确立会话(步骤 S21),下载被更新的数据,并更新自身的数据库(步骤S22)。或者,各车 辆的智能处理单元6定期地或适当地对发送服务器100经由通信控制单元 (CCU)64进行访问而确立会话(步骤S31),取得各数据库的版本信息(更 新日期等)(步骤S32)。然后,比较两数据的版本(步骤S33),下载比自 身存储的数据新的数据,从而对数据库进行设置(步骤S34)。
根据这样的结构,仅更新记录在发送服务器100中的信息,就可以适 当更新可利用发送服务器100的所有车辆控制系统的数据。
再有,希望将数据压缩及加密后存储在发送服务器100中,智能处理 单元6下载并将数据解压及解密后设置在数据库。由此,可以抑制通信量, 防止信息泄露。
此外,如上所述,智能处理单元6不限于被通知发生了处理项目数据 和/或线路的更新的情况。例如,在未存储有与用户的要求对应的处理项目 和/或线路的情况下,也可将其检测出来,经由网络访问服务器,下载新的 处理项目数据和/或线路。再者,也可以是,在新追加了与该智能处理单元 6连接的输入输出对象设备5的情况下,或追加了新的功能的情况下,自动 地将其检测出来,与上述同样地,经由网络对服务器进行访问,下载新的 处理项目数据和/或线路。
再有,也可以是,智能处理单元6具有自动地生成新的线路的功能, 但对于下载的新的处理项目及已有的处理项目,关于设定哪种关系的线路, 将记述了该关系的程序一起下载。
以上说明的这种车内空调系统,如果将表示处理内容的数据或线路被 适当地记述,则不需要完全确定作为控制对象的设备或施加的控制内容, 响应用户发出的语言,从该语言来推测用户的需求,适当地判断为了满足 该欲望对哪个设备施加什么样的控制即可,从而将依据判断结果的控制施 加在设备上。
此外,由于处理项目数据和线路随时被更新为新的处理项目数据或线 路,所以改变智能处理单元6的响应方法的余地时常存在,用户不易厌倦 与该车内空调系统的对话。
再有,这种车内空调系统的结构不限于上述结构。
例如,属于输入输出对象设备组5的设备不必是直接带来满足用户需 求的结果的设备,例如,也可以由控制外部的显示装置等,对用户输出用 于催促采取特定行动的设备(例如,液晶显示器等的显示装置)构成。
此外,单词数据库不必仅存储表示单词的数据,可以将由多个单词构 成的表示语句的数据作为单词数据库的要素来存储,也可以将单词的一部 分或表示音素的数据作为单词数据库的要素来存储。此外,单词等不必被 分组在特定的概念之下,在进行分组的情况下,用于进行分组的数据也可 以不采用标志的集合形式。
此外,智能处理单元6可以不等待来自外部的供给源的通知而自发地 下载新的处理项目数据和线路,也可以响应从语言解析单元2供给的单词 数据而开始新的处理项目数据或线路的下载。
此外,智能处理单元6也可以重写线路,以使对各处理节点付与的转 移常数k基于过去执行了该线路表示的转移的数等,并根据规定的基准来 变化,加权系数J成为变化后的值。
具体地说,例如,在线路数据库D5中,对于各个线路存储该线路所表 示的转移被执行的次数。然后,每当该转移被重新进行时,智能处理单元6 通过重写该次数的值,使该次数的值每次增加1,将各个线路用的转移常数 k例如重写为与对于该线路存储的次数成正比的值。因此,在计算加权系数 J时,也根据被变更的转移常数k来计算,所以也使加权系数J基于过去执 行了该线路所表示的转移的数量等而改变。
此外,智能处理单元6也可以使判别处理和输入输出处理中输出的数 据,根据被传递给这些处理的数据、或伴随这些处理输入的数据、或其他 任意的条件来改变。
此外,这种车内空调系统,也可以包括根据智能处理单元6的控制来 输出图像的显示装置(例如,液晶显示器等),智能处理单元6在输入输出 处理或判别处理中,也可以控制该显示装置,以便在每次处理时显示规定 的图像。
此外,也可以是,智能处理单元6在一个输入处理或一个判别处理中, 成批取得连续发声等的多个单词数据。此外,智能处理单元6也可以仅在 确定成批取得的多个单词数据在哪个概念之下被分组在同一组内,并且, 在确定的概念与规定的概念一致的情况下,将取得的单词数据的一部分或 全部用于处理。此外,在输入了多个单词的情况下,仅在取得对存储于输 入的语音的单词数据库D3中的单词的似然(得分),且这些单词属于共同 的概念的情况下,将该共同的概念识别为被输入的概念。此时,也可以求 出概念的得分。概念的得分例如采用将对各单词得到的得分相乘的得分就 可以。然后,向各线路输出共同的概念和对该共同的概念得到的得分。
此外,智能处理单元6也可以由相互连接的多个数据处理装置(例如, 计算机等)构成,这些数据处理装置分担并实施将触发取得处理、判别处 理、输入输出处理等各种处理和线路作为整体形成的流。这种情况下,构 成解析处理单元3的各个数据处理装置,将解析处理单元3可执行的整个 流中的表示自己有可能执行的部分的数据,作为处理项目数据库和线路数 据库的要素来存储就足够了。因而,如果各个数据处理装置所存储的数据 成为将该数据处理装置所执行的部分的处理进行宏定义的数据,则也容易 使多个数据处理装置进行分散处理。
此外,这种车内空调系统也可以包括多个语音输入单元1、语言解析 单元2、或语音输出单元4。
此外,语音输入单元1例如也可以包括从记录了表示语音的数据的记 录介质(例如,软(floppy,注册商标)盘、CD、MO等)中读出波形信号并 供给语言解析单元2的记录介质驱动装置(例如,软(floppy,注册商标) 盘驱动器、CD-ROM驱动器、MO驱动器等)。
以上,说明了本发明的实施方式,但本发明的设备控制装置不论使用 专用的系统,还是普通的计算机系统都可实现。
例如,在连接到输入输出对象设备组5的个人计算机上,通过从存储 了用于使上述语音输入单元1、语言解析单元2、语音合成处理单元3、语 音输出单元4及智能处理单元6工作的程序的记录介质中安装该程序,可 以构成用于执行上述处理的车内空调系统。而且,执行该程序的个人计算 机作为与图1的车内空调系统的动作相当的处理,例如执行图9及图11所 示的流。
再有,在个人计算机中实施上述车内空调系统的功能的程序,例如也 可以上载到通信线路的布告板(BBS),将其经由通信线路进行发送,此外, 也可以通过表示该程序的信号来对载波进行调制,传送得到的调制波,接 收了该调制波的装置对调制波进行解调而恢复该程序。因而,通过起动该 程序,在OS的控制下,与其他应用程序同样地执行,可以执行上述处理。
再有,在OS分担一部分处理的情况下,或者在OS构成本发明的一个 结构要素的一部分的情况下,在记录介质中也可以存储将这部分删除后的 程序。这种情况下,在本发明中,在该记录介质中,存储有用于计算机执 行的各功能或步骤的程序。