自动驾驶车辆中的自适应的乘客舒适度增强转让专利

申请号 : CN201780040951.3

文献号 : CN109415062B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 饶蕾李剑胡荣中

申请人 : 华为技术有限公司

摘要 :

一种用于自适应地实现自动驾驶车辆中的乘客舒适度增强的自学型系统和方法。该系统包括多个传感器输入。每个传感器输入提供表示来自车辆中的乘客的语音响应和图像响应的数据。控制器耦合到所述多个传感器输入。控制器生成并更新包括多种驾驶状态转换的补偿函数。所述补偿函数基于目的地信息和表示语音和图像响应的数据来更新。控制器还生成确定最佳驾驶状态转换的目标函数,并且基于更新的补偿函数和先前的目标函数来更新所述目标函数。控制器还基于更新的目标函数来生成车辆速度控制信号,以控制自动驾驶车辆的速度。

权利要求 :

1.一种用于自适应地实现自动驾驶车辆中的乘客舒适度增强的自学型系统,其特征在于,所述系统包括:多个传感器输入,用于提供表示车辆中的乘客的语音和图像响应的数据;

控制器,耦合到所述多个传感器输入,所述控制器用于生成并更新包括多种驾驶状态转换的补偿函数,所述补偿函数基于接收到的目的地信息和表示话音和图像响应的数据来更新;所述控制器还用于生成确定最佳驾驶状态转换的目标函数,并且基于更新的补偿函数和先前的目标函数来更新所述目标函数;所述控制器还用于基于更新的目标函数来生成车辆速度控制信号,以控制车辆速度,其中,所述最佳驾驶状态转换包括最大化的车辆速度,所述控制器还用于向所述最大化的车辆速度和所述更新的目标函数分配权重,所述权重基于表示语音或图像响应的数据。

2.根据权利要求1所述的系统,其特征在于,所述多种驾驶状态转换中的每一种包括车辆速度范围和路段曲率范围。

3.根据权利要求2所述的系统,其特征在于,所述补偿函数包括指示从第一状态转换到第二状态的可能性的转换和非转换指示的补偿函数矩阵。

4.根据权利要求3所述的系统,其特征在于,所述控制器还用于采用基于图像响应的第一补偿函数值以及采用基于表示语音响应的数据的第二补偿函数值来更新每个转换指示。

5.根据权利要求4所述的系统,其特征在于,在从表示语音响应的数据中收集到连续的正面反馈的情况下,所述第一补偿函数值小于所述第二补偿函数值。

6.根据权利要求1所述的系统,其特征在于,所述控制器还用于确定源地和目的地之间的多个路段,其中,所述控制器基于所述多个路段中的每一个路段的更新的目标函数为每一个路段生成车辆速度控制信号。

7.根据权利要求6所述的系统,其特征在于,所述控制器还用于基于乘客舒适度评级和乘客速度评级来更新所述车辆速度控制信号。

8.根据权利要求1所述的系统,其特征在于,所述多个传感器包括麦克风和图像传感器。

9.一种用于自适应地更新自动驾驶车辆中的乘客舒适度增强的方法,其特征在于,所述方法包括:基于车辆初始位置、目的地和源-目的地路线的路线信息来确定源-目的地路线,所述路线信息包括所述源-目的地路线的多个路线段中的每一个的道路曲率和道路速度限制;

在车辆在所述源-目的地路线上的运行期间获得每个路线段的乘客反馈,所述乘客反馈包括乘客音频数据和乘客图像数据;其中,所述乘客音频数据包括乘客的听觉响应;

将所述乘客图像数据转换成乘客面部表情的二进制表示,其中,向正面的面部表情分配乘客面部表情的第一二进制表示,向负面的面部表情分配乘客面部表情的第二二进制表示;

将所述听觉响应转换成听觉响应的二进制表示,其中,向正面的听觉响应分配听觉响应的第一二进制表示,向负面的听觉响应分配听觉响应的第二二进制表示;

更新包括多种驾驶状态的补偿函数,所述更新基于先前的补偿函数和所述乘客反馈;

基于先前的目标函数和从第一驾驶状态到第二驾驶状态的最佳驾驶状态转换来更新每个路线段的目标函数,其中,所述最佳驾驶状态转换基于更新的补偿函数;

基于更新的目标函数来动态更新每个路线段的车辆速度。

10.根据权利要求9所述的方法,其特征在于,每种驾驶状态包括车辆速度范围和道路曲率范围。

11.根据权利要求10所述的方法,其特征在于,所述第一驾驶状态包括第一车辆速度范围和第一道路曲率范围,所述第二驾驶状态包括第二车辆速度范围和第二道路曲率范围,所述第一驾驶状态不同于所述第二驾驶状态,所述方法还包括:将所述补偿函数设置为初始值;

从所述第一驾驶状态转换到所述第二驾驶状态;

如果所述面部表情的二进制表示是响应于所述转换的第一二进制表示,则向所述补偿函数分配第一加权值,所述第一加权值大于所述初始值;

如果所述面部表情的二进制表示是响应于所述转换的第二二进制表示,则将所述补偿函数维持在当前值;

如果所述听觉响应的二进制表示是响应于所述转换的第一二进制表示,则将所述补偿函数增加到以下两个值中的较小者:当前值和第二加权值的和或预定整数和所述第一加权值的积;

如果听觉响应的二进制表示是响应于所述转换的第二二进制表示,则采用以下两个值中的最大者来减小所述补偿函数:减去所述第二加权值的当前值的差或预定整数。

12.根据权利要求11所述的方法,其特征在于,更新所述目标函数包括:将所述目标函数设置为初始值;

向所述多个路线段中的每一个分配源-目的地路线段状态,其中每个路线段状态包括路线段的速度限制和路线段的曲率范围;

基于从所述多种驾驶状态中确定的最大目标函数值来选取更新的目标函数。

13.一种非瞬时性计算机可读存储介质,其特征在于,所述非瞬时性计算机可读存储介质存储指令,所述指令由自动驾驶车辆的处理电路执行,以进行以下操作:生成包括多种驾驶状态转换的补偿函数;

基于目的地信息和包括表示语音和图像响应的数据的乘客反馈来更新所述补偿函数;

生成确定最佳驾驶状态转换的目标函数;

基于更新的补偿函数和先前的目标函数来更新所述目标函数;

生成车辆速度控制信号,以基于更新的目标函数来控制所述自动驾驶车辆的速度;

基于乘客舒适度评级和速度评级更新所述车辆速度控制信号。

14.根据权利要求13所述的非瞬时性计算机可读存储介质,其特征在于,所述操作确定源地和目的地之间的多个路线段,每个路线段包括具有每个相应路线段的速度限制和道路曲率的指定状态。

15.根据权利要求14所述的非瞬时性计算机可读存储介质,其特征在于,所述操作还更新所述多个路线段中的每一个的车辆速度控制信号。

说明书 :

自动驾驶车辆中的自适应的乘客舒适度增强

[0001] 相关申请案交叉申请
[0002] 本申请要求于2016年7月19日递交的发明名称为“自动驾驶车辆中的自适应的乘客舒适度增强”的第15/213,532号美国专利申请案的在先申请优先权,该在先申请的内容以引入的方式并入本文。

技术领域

[0003] 本发明大体涉及自动驾驶车辆,并且具体涉及自动驾驶车辆中的自学型自适应的乘客舒适度增强。

背景技术

[0004] 自动驾驶车辆(即自驾车辆)目前正被发展成具有能够在无乘客介入的情况下将乘客通过公共街道运送到其期望目的地的能力。这些车辆的发展路径依赖于三个关键因素:安全性、可靠性和舒适度。
[0005] 与安全性和可靠性不同,舒适度是一个主观因素。每位乘客对舒适度的定义可能不同。乘客舒适度可能受例如车辆速度、车辆加速度以及与其他车辆之间的距离等各种因素的影响。
[0006] 自学型车辆通常依靠最初驾驶车辆的驾驶员,而车辆中的自学型系统从在驾驶员演示的过程中得到的一组训练数据中得知驾驶者的驾驶风格。然后,自学型系统可以随后复制这种特定驾驶员的驾驶风格。
[0007] 然而,此类方法取决于嵌入在训练数据中的信息量,并且可能不适用于未被训练数据覆盖的情形。此外,一些车辆(例如,租赁车辆)不能由个人初始驾驶。其他车辆(例如,完全自主的车辆)可能缺少由个人驱动的控制装置(例如,方向盘、加速器/刹车踏板)。

发明内容

[0008] 一种用于自适应地实现自动驾驶车辆中的乘客舒适度增强的自学型系统。该系统包括多个传感器输入,以获得表示车辆中的乘客的语音响应和图像响应的数据。控制器耦合到所述多个传感器输入。控制器生成并更新包括多种驾驶状态转换的补偿函数。所述补偿函数基于接收到的目的地信息和来自乘客的语音和图像响应来更新。所述控制器还生成并更新确定最佳驾驶状态转换的目标函数。所述目标函数基于更新的补偿函数和先前的目标函数来更新。所述控制器还基于更新的目标函数来生成车辆速度控制信号。

附图说明

[0009] 图1是根据各种实施例的自适应的乘客舒适度增强系统的框图;
[0010] 图2是根据各种实施例的用于生成补偿函数的方法的操作流程图;
[0011] 图3是根据各种实施例的矩阵形式的补偿函数;
[0012] 图4是根据各种实施例的道路曲率的示意图;
[0013] 图5是根据各种实施例的目标函数和车辆速度策略控制操作流程图。

具体实施方式

[0014] 以上提到的一些挑战以及其他挑战可以由自适应的乘客舒适度增强系统和方法来应对。例如,所述系统监测响应于驾驶情况的乘客反馈(例如,面部表情、音频响应),从而估计乘客舒适度。然后,所述乘客反馈用于基于各种反馈元素来生成提供乘客舒适度的加权指示的补偿函数。然后,可基于补偿函数、车辆位置、车辆路线和乘客输入参数来生成特定路线的目标函数。由补偿函数中的乘客反馈动态更新的目标函数提供对该特定路线上的车辆速度和加速度的控制。
[0015] 图1是根据各种实施例的自适应的乘客舒适度增强系统100的框图。该系统100仅用于说明目的,因为用于自适应的乘客舒适度增强的方法可以在具有基本相似结果的其他系统中执行。
[0016] 该系统100包括控制系统操作的系统控制器101,并且用于执行用于自适应的乘客舒适度增强的方法。该控制器101包括例如数字信号处理器(digital signal processor,简称DSP)的中央处理器(central processing unit,简称CPU)111和/或其他硬件元件。例如,一些元件可以包括一个或多个微处理器、DSP、现场可编程门阵列(field programmable gate array,简称FPGA)、专用集成电路(application-specific integrated circuit,简称ASIC)、射频集成电路(radio frequency integrated circuit,简称RFIC)以及用于至少执行在此描述的函数的各种硬件和逻辑电路的组合。
[0017] 控制器101还可以包括存储器110。所述存储器110可以包括只读存储器(read-only memory,简称ROM)、随机存取存储器(random access memory,简称RAM)、磁盘存储介质、光存储介质、闪存设备和/或其他存储设备和介质。
[0018] 控制器101耦合到作为到控制器101的输入的各种传感器103、105和107。例如,外部车辆传感器103可以安装在车辆外部,以向控制器101提供车辆周围环境的连续更新。所述外部车辆传感器103可以包括用于测量车辆与前方、后方或相邻的其他车辆之间的距离的测距传感器(例如雷达、激光器)。所述外部车辆传感器103还可以包括图像传感器、光传感器或可用于检测、测量和/或映射车辆周围的外部环境的任何其它传感器。
[0019] 车辆位置和运动传感器105(例如全球定位系统(Global Positioning System,简称GPS)、惯性传感器、加速度计、罗盘、陀螺仪)耦合到控制器101并且可以向控制器101提供关于车辆速度、加速度和/或方向的连续更新。控制器101可以将位置和运动数据作为反馈,以确定其对车辆的控制是否按预期进行。
[0020] 车载传感器107可以安装在车辆内部,并且耦合到控制器101并且向控制器101提供关于乘客舒适度的更新。例如,所述车载传感器107可以包括听觉装置(例如,麦克风、扬声器)、触觉传感器(例如,振动传感器)、图像传感器、用于确定重量是否在特定座位上的座位传感器、温度传感器以及可用于辅助确定乘客舒适度的任何其他传感器。
[0021] 控制器101还耦合到无线电广播设备130,以提供与网络131或其他车辆150之间的无线通信。控制器101可以使用无线电广播设备130通过接入点(access point,简称AP)或蜂窝基站与互联网进行通信,从而下载数据或上传其位置、路线、目的地和/或运动状况。控制器101还可以与其他车辆150或路边结构交流该信息。
[0022] 车辆加速度控制器109耦合到控制器101并接收来自控制器101的控制信息。例如,在执行自适应的乘客舒适度增强方法之后,控制器101可以向车辆加速度控制器109提供控制数据(例如,加速度、速度),以控制车辆的速度和加速度。
[0023] 图1中的系统100用于执行基于乘客反馈来生成补偿函数(例如,补偿矩阵)的指令。然后,可以基于补偿函数、车辆运动状况、期望路线和乘客输入参数来生成目标函数。
[0024] 图2是根据各种实施例的用于生成补偿函数的方法的操作流程图。图2中所示的各个方框可以是表示软件、硬件或者软件和硬件两者的模块。补偿函数可以以如图3所示的补偿矩阵的形式来表示。
[0025] 补偿函数采用音频数据201和生物数据(例如,面部表情)202形式的乘客反馈。例如,图1中的系统100可以通过显示器或扬声器上的声音公告来询问乘客是否舒适。将来自乘客的听觉响应输入到确定乘客如何响应的语音识别算法模块205。
[0026] 所述语音识别算法模块205通过已知的语音识别过程将乘客的语音响应的声音转换成该响应的数字表示(即表示语音响应的数据)。例如,所述语音识别算法模块205可以将乘客的“坏”或“好”的听觉响应分别转换为“坏”或“好”的负面的或正面的数字表示。在其他实施例中,可以使用语音分析器来确定与乘客的语音响应相关联的情绪,例如紧张或兴奋。
[0027] 将乘客的听觉响应的数字表示输入到模数转换模块209,以转换成乘客的听觉响应的数字表示的二进制表示。例如,模数转换模块209可以向正面的听觉响应(例如“好”、“极好”、“很棒”、“优秀”)分配第一二进制表示(例如逻辑“1”),并且向负面的听觉响应(例如“坏”、“恐怖”、“糟糕”)分配第二二进制表示(例如逻辑“0”)。其他实施例可以向正面和负面的响应分配其他二进制表示。然后,这些二进制表示用于如随后所述的补偿矩阵维持算法模块211进行的更新。
[0028] 当车辆移动时,乘客的面部表情可以表示他们的舒适度。因此,当车辆加速、减速和/或以不同的速度穿过不同的道路曲率时,乘客的面部表情可以改变,以展现响应于车辆运动变化的舒适度变化。
[0029] 将乘客的面部表情202输入到面部识别算法模块207。所述面部识别算法模块207通过已知的面部识别过程将乘客的面部响应转换成该响应的数字表示(即表示图像响应的数据)。例如,如果车辆以较高的速率进入曲线从而导致乘客感到不适,则乘客的面部表情可能变成鬼脸。相反,如果车辆以较稳定的速度沿着直道行驶,则乘客的面部表情可以是无表情变化或微笑。所述面部识别算法模块207将这些面部响应转换成它们各自的数字表示(例如鬼脸、微笑、无表情变化),并将该表示输入到模数转换模块209。
[0030] 模数转换模块209将数字面部表示转换成面部表情的二进制表示,以用于如随后所述的补偿矩阵维持算法模块211进行的更新。例如,模数转换模块209可以向笑脸、无表情变化或其他正面的脸部表情分配逻辑“1”的二进制值,以及向鬼脸或其他负面的面部表情分配逻辑“0”的二进制值。
[0031] 补偿矩阵维持算法模块211接受来自模数转换模块209的二进制响应输出,并采用这些二进制值来更新补偿矩阵的先前迭代。例如,如随后所述,当乘客的旅程首次开始时,可以采用特定值将补偿矩阵初始化。然后,采用来自模数转换模块209的二进制响应输出来更新初始补偿矩阵,以提供更新的补偿矩阵215。如果车辆已经在运动并且初始矩阵已被更新,则采用这些二进制响应输出来更新先前的补偿矩阵,并提供更新的补偿矩阵215。
[0032] 图3是根据各种实施例的矩阵形式的补偿函数。补偿函数的这种表示仅用于说明目的,因为可以使用其他表示,例如不同数量的状态或每种状态的初始补偿函数值的不同表示。
[0033] 补偿函数使用状态变量(S[v,c])来表示车辆速度(即v)和道路曲率(即c)。车辆速度和道路曲率已经被离散化,并且速度和曲率变量分别代表不同的速度和曲率范围。
[0034] 速度变量可以如先前所述参考图1中的系统来确定。例如,速度可以由车辆位置和运动传感器105确定。例如,道路曲率可以如图4所述来确定。
[0035] 图4是根据各种实施例的道路曲率的示意图。图4中示出的道路曲率的定义只是一种可能的道路曲率表示。其他实施例可以以其他方式定义道路曲率。
[0036] 图4示出了具有曲线的路段410。垂直切线400与道路中心线相切。在路段410的起点430和终点431之间画出了固定弦长L 401。垂直切线400和弦410之间的角度θ被定义为道路曲率。
[0037] 再次参考图3,在包括五种不同状态(即0-4)的代表性实施例中,每种状态表示不同的车辆速度和道路曲率范围。例如,状态0=[0-10英里每小时(miles per hour,简称mph),0-5度],状态1=[10-20mph,5-10度],状态2=[20-30mph,10-15度],状态3=[20-30mph,15-20度],状态4=[10-20mph,15-20度]。分配给每种状态的这些速度和曲率范围仅用于说明目的,因为速度和曲率变量可以表示不同状态的不同范围。
[0038] 图3中左边的补偿矩阵300示出了一个示例,其中,“x”指示从一种状态到另一种状态的转换不能实现。例如,通过先前定义的示例状态(例如状态0、状态1、状态2、状态3、状态4)可以看出从状态2(20-30mph,10-15度)到状态0(0-10mph,0-5度)的转换不能实现,反之亦然。类似地,从状态3和状态4到状态0或状态1的转换也不能完成,反之亦然。这在左边的补偿矩阵300中由这些位置中的每一个上的“x”表示。
[0039] 然后,可以以这些“x”值开始对补偿矩阵进行初始化。如果补偿矩阵R由Rii表示,则Rij=-1表示从状态i到状态j的转换不能实现,Rij=1表示从状态i到状态j的转换能够实现(即其中Rij≠-1)。
[0040] 图3中示出了更新的补偿函数矩阵301。由“-1”或者其他一些非转换指示表示的每种状态转换随后不会通过乘客反馈来更新,因为这些状态转换是不可能的。然而,由“1”或者其它一些转换指示表示的状态转换可以稍后由基于乘客反馈确定的更新的补偿函数来更新。转换指示可以通过乘客反馈来增加,以便为车辆速度控制策略提供指导。
[0041] 在补偿矩阵R已经被初始化之后,其可以通过来自乘客的反馈来更新和保持。补偿矩阵更新过程可以定义如下:
[0042]
[0043]
[0044] 其中,状态i、状态j和Ri先前已定义,X是系统配置权重参数,并且可以是大于1但小于预定边界值的整数,Base和Bonus可以是这些反馈参数中的每个的特定权重值(例如,Base=10,Bonus=4)。权重参数X在此处公开的方法中不会变化。
[0045] 从补偿矩阵更新过程中可以看出,当车辆从第一状态(例如,状态i)转换到第二状态(例如,状态j)时,其中,该转换是可能的并且其不是到相同状态的转换,确定面部表情反馈是正面反馈(例如,“好”)还是负面反馈(例如,“坏”)。正面的面部表情反馈导致补偿函数值增加到大于初始值的特定值(例如,Base),而负面的面部表情反馈导致补偿函数维持在当前值。类似地,正面的语音表示反馈导致补偿函数值增加到(Rij+Bonus)或(G*Base)中的最小值,而负面语音表示反馈导致补偿函数值减少(Rij-Bonus)或者1中的最大值。如果语音表示反馈是无表情变化的,则Rij的值不变。这只是补偿等级计算的一种实现方式。其他实现方式也可以在所提出的系统架构中运作。
[0046] 从上述过程中可以看出,随着状态转换的连续的正面反馈越来越多,乘客的音频反馈携带的权重越来越大,并且可能超过面部表情反馈的权重。这是由于与乘客口头陈述他们的舒适度好坏有关的确定人类面部表情的固有不准确性。尽管在该过程中考虑了面部表情,但是音频反馈被认为是更准确的,因此不仅仅依赖于面部表情反馈。
[0047] 图5是根据各种实施例的目标函数和车辆速度策略控制操作流程图。图5中所示的各个方框可以是表示软件、硬件或者软件和硬件两者的模块。
[0048] 将各种参数501-503输入到该过程中。例如,这些参数可以是GPS数据501、地图数据502和用户输入503。
[0049] 将GPS数据输入到定位模块511,以确定车辆在一些地理坐标系(例如,纬度、经度)中的初始位置。由传感器测量的GPS数据表示可以使用的任何导航输入数据。例如,可以使用GPS接收器、惯性导航设备、加速度计/罗盘/陀螺仪的组合或者确定车辆相对于某个坐标系的位置的任何其他方式。
[0050] 将地图数据输入到路线信息模块512。地图数据表示用于确定车辆位置的地理坐标系。参考地理坐标系,地图数据和路线信息还可以包括道路信息,例如道路位置、长度、曲率和目的地(例如,名称)。
[0051] 将乘客输入数据输入到目的地模块513。乘客输入数据表示由乘客输入以告知系统以地理坐标系为参考的期望目的地的数据。期望目的地可以参考当前位置并且基于与地图数据和GPS数据中相同的地理坐标系。
[0052] 将车辆位置511、路线512和目的地513输入到轨迹计算模块520,该轨迹计算模块520基于输入数据(例如,车辆位置、车辆目的地、地图道路)确定到达期望目的地要采用的源-目的地路线(例如,道路)。该模块520获得可能影响乘客舒适度并用于之前讨论的补偿函数中的路线信息。例如,该模块520基于GPS数据在当前车辆位置(即源地)与期望目的地(即目的地)之间的确定的路线上获得道路速度限制和道路曲率。
[0053] 如在目标函数G中随后使用的,源-目的地路线由P表示,其中P1[l1,c1],...,Pt[lt,ct]表示源-目的地路线P的路线段状态(例如,路段),变量l1,...,lt表示每个路线段的速度限制,c1,...,ct表示每个路线段的曲率范围信息,t表示路线段编号。
[0054] 将轨迹结果和路线信息输入到目标函数G维持算法521。如前所述,目标函数G基于补偿函数R,并且还可以由Mx M矩阵G(目标,状态)表示,其中“目标”是下一种期望状态,“状态”是当前状态。目标函数矩阵G(目标,状态)被初始化为零,矩阵大小M由[0,max(lt)]*[0,max(ct)]确定。
[0055] 当补偿函数矩阵指示从一种状态到另一种状态的转换时,目标函数矩阵指示实现从一种状态到另一种状态转换的最佳路线。换言之,目标函数矩阵基于(即来自补偿函数的)车辆速度和道路曲率来指示(即来自目标函数的)用于乘客舒适度增强的最佳路线。
[0056] 在模块522中,针对源-目的地路线更新初始化的目标函数G。该更新可以表示如下:
[0057]
[0058] 其中T表示用于穿过源-目的地路线的路线段的最大数量,Gamma表示学习参数,并且可以被初始化为0到1范围内的预定值。学习参数G不被更新,并且可以根据系统运行前的实证研究被选择。可以看出,当通过用户反馈更新补偿函数R时,系统自适应地维持和更新源-目的地路线的目标函数G。
[0059] 上述函数可以被描述为:对于从t到T的每个路段,将Si看作状态,该状态需要落入允许的范围内。换言之,状态Si需要遵循(在给定的度数范围内的)道路曲率,并且速度不能大于特定路线段t的速度限制(l)。然后,考虑到所有可能的下一种状态转换(例如参见图3),选择使G函数(即G(状态,动作)=R(状态,动作)+Gamma*max[G(下一种状态,所有动作)])最大化的下一种状态。当通过乘客反馈更新补偿矩阵时,通过动态地更新每个G(状态,动作)来针对每个特定的源-目的地路线维持目标函数矩阵。
[0060] 目标函数的最终输出表示车辆速度和/或加速度。通过动态地更新具有不同曲率的各种路段上的车辆速度或加速度,并且基于乘客舒适度反馈和更新的目标函数,可以改变乘客舒适度。更新的目标函数输出由车辆速度控制策略模块523表示。源-目的地路线的车辆速度控制策略模块523的策略表示如下:
[0061] Given G,P1[l1,c1],...,Pt[lt,ct],...
[0062] Calculate S1[v1,c1]...,St[vt,ct],...for
[0063] max[w1∑t vt+w2∑t∈[2,T]G(St-1,St)]
[0064] Update w1,w2using user feedback
[0065] w1=w1*(1+(RS-rs)/RS)
[0066] w2=w2*(1+(RC-rc)/RC)
[0067] 其中,上述优化等式中的“w1∑txt”表示通过状态转换控制使总的实现速度最大化,上述优化中的“w2∑t∈[2,T]G(St-1,St)”表示通过状态转换控制使总的乘客舒适度最大化,w1和w2是依据乘客偏好的系统配置权重,v1,...,vt是路线上每个路段的决策变量,rc是来自乘客反馈的舒适度评级,rs是来自乘客反馈的速度评级,RC和RS分别是舒适度和速度评级rc和rs的最高评级。在模块524中示出了用于更新车辆速度控制策略523的舒适度评级和速度评级的乘客反馈。速度控制策略523包括用于控制车辆速度的车辆速度控制信号。
[0068] 舒适度和速度评级rc和rs可以通过可以具有多种实施方式的车载人机界面来获得。例如,舒适度和速度评级rc和rs可以由车辆系统通过询问乘客分数与乘客进行音频交互来收集。在另一实施例中,舒适度和速度评级可以由车辆系统收集通过在车辆内的屏幕上请求和接收输入来收集。其他实施例可以采用其他方法来收集舒适度和速度评级rc和rs。RC和RS评级可以被定义为在预定间隔(例如,时间)内它们各自的rc和rs评级的最高值。
[0069] 因此,图5中的方法接受乘客的目的地输入并生成从源地到所选目的地的路线(即轨迹)。包括多种驾驶状态转换的初始补偿函数基于目的地和来自乘客的语音和图像响应来更新。目标函数确定从第一状态到第二状态的最佳驾驶状态转换。所述目标函数基于更新的补偿函数和先前的目标函数来更新。基于更新的目标函数生成车辆速度控制信号。车辆速度控制信号耦合到车辆加速度控制器109,以控制车辆的加速度和速度。
[0070] 最佳驾驶状态转换可以被定义为最大化(即最高)的车辆速度。控制器进一步向最大化的车辆速度和更新的目标函数分配权重,其中,权重基于来自乘客的语音或图像响应。
[0071] 传统的自学型车辆要求驾驶员至少驾驶车辆一次,从而得知驾驶员的风格和期望的舒适度。用于自适应的乘客舒适度增强的系统和方法的本实施例提供不需要初始车辆操作的自学型系统,从而基于乘客反馈来动态更新车辆速度。通过乘客反馈,个性化的补偿和目标函数可以被更新,从而调整车辆速度。
[0072] 所公开的实现方式可以包括具有机器可执行指令的机器可读存储设备,例如具有计算机可执行指令的计算机可读存储设备。此外,计算机可读存储设备可以是存储由设备内的物理结构表示的数据的物理设备。此类物理设备是非瞬时性设备。机器可读存储设备的示例可以包括但不限于只读存储器(read-only memory,简称ROM)、随机存取存储器(random access memory,简称RAM)、磁盘存储设备、光存储设备、闪存和其他电子、磁性和/或光学存储设备。
[0073] 各实施例可采用硬件、固件和软件中的一种或它们的组合实现。实施例也可实现为存储在计算机可读存储设备上的指令,这些指令可由至少一个处理器读取并执行,以便执行本文所述的操作。计算机可读存储设备可包括用于存储计算机可读形式的信息的任何非瞬时性机制。例如,计算机可读存储设备可包括只读存储器(read-only memory,简称ROM)、随机存取存储器(random access memory,简称RAM)、磁盘存储介质、光存储介质、闪存设备以及其它存储设备和介质。在一些实施例中,系统可包括一个或多个处理器,并可配置有存储在计算机可读存储设备上的指令。
[0074] 以上描述和附图充分说明了特定实施例,以便本领域技术人员能够实践这些特定实施例。其它实施例可包含结构、逻辑、电气、过程和其它变更。一些实施例的部分和特征可包括在其它实施例的部分和特征中或替代其它实施例的部分和特征。权利要求书中提出的实施例涵盖那些权利要求的所有可用的等同物。
[0075] 对说明书摘要有以下理解:其不会用于限制或说明权利要求的范围或含义。以下权利要求据此合并到具体实施方式中,每项权利要求代表一个独立的实施例。