用于操作自动驾驶车辆的方法和装置转让专利

申请号 : CN201810588432.7

文献号 : CN108773373B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 韩博

申请人 : 北京百度网讯科技有限公司

摘要 :

本申请公开了用于操作自动驾驶车辆的方法和装置。所述方法的一具体实施方式包括:收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及驾驶场景信息;根据驾驶方案,确定风险等级;从驾驶场景信息中分解出对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息;对对象信息以及对应的风险等级进行学习,识别出与风险等级相关联的风险对象;针对风险对象,对对象信息、车辆行驶状态信息、驾驶环境信息以及驾驶方案进行学习,确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与驾驶方案之间的关联关系以作为驾驶策略;利用驾驶策略确定候选驾驶方案。该实施方式实现了根据驾驶人员的行为优化候选驾驶方案。

权利要求 :

1.一种用于操作自动驾驶车辆的方法,其特征在于,所述方法包括:收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及所述半自动驾驶车辆所处驾驶场景的驾驶场景信息;

根据驾驶员所采用的驾驶方案,确定所述半自动驾驶车辆在所述驾驶场景下所处驾驶风险的风险等级;

从所述驾驶场景信息中分解出所述驾驶场景中场景对象的对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息;

对对象信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象;

针对所识别出的风险对象,对对象信息、车辆行驶状态信息、驾驶环境信息以及对应的驾驶方案进行学习,确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与驾驶方案之间的关联关系以作为自动驾驶车辆的驾驶策略;

利用所述驾驶策略确定自动驾驶车辆的候选驾驶方案。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述驾驶策略进行优化的步骤,包括:

使用所述驾驶策略,在驾驶模拟器所模拟的场景中控制测试用车辆行驶;

检测所述测试用车辆行驶时是否满足所述驾驶模拟器中预先配置的驾驶规则;

根据检测结果修正所述驾驶策略。

3.根据权利要求2所述的方法,其特征在于,采用强化学习算法修正所述驾驶策略。

4.根据权利要求1-3之一所述的方法,其特征在于,所述方法还包括:将所述驾驶策略添加至半自动驾驶车辆的驾驶策略数据库中;

确定所述驾驶策略被触发时半自动驾驶车辆是否被驾驶员进行异常干预;

若半自动驾驶车辆未被异常干预,则提高所述驾驶策略的可信度。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若半自动驾驶车辆被异常干预,则继续采集驾驶员对半自动驾驶车辆进行干预时所采用的驾驶方案以及对应的驾驶场景信息,以根据新采集的驾驶方案与驾驶场景信息调整所述驾驶策略。

6.一种用于操作自动驾驶车辆的装置,其特征在于,所述装置包括:收集单元,用于收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及所述半自动驾驶车辆所处驾驶场景的驾驶场景信息;

等级确定单元,用于根据驾驶员所采用的驾驶方案,确定所述半自动驾驶车辆在所述驾驶场景下所处驾驶风险的风险等级;

分解单元,用于从所述驾驶场景信息中分解出所述驾驶场景中各个场景对象的对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息;

风险对象学习单元,用于对对象信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象;

驾驶方案学习单元,针对所识别出的风险对象,对对象信息、车辆行驶状态信息、驾驶环境信息以及对应的驾驶方案进行学习,确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与驾驶方案之间的关联关系以作为自动驾驶车辆的驾驶策略;

驾驶方案确定单元,用于利用所述驾驶策略确定自动驾驶车辆的候选驾驶方案。

7.根据权利要求6所述的装置,其特征在于,所述装置还包括驾驶策略优化单元,所述驾驶策略优化单元用于:使用所述驾驶策略,在驾驶模拟器所模拟的场景中控制测试用车辆行驶;

检测所述测试用车辆行驶时是否满足所述驾驶模拟器中预先配置的驾驶规则;

根据检测结果修正所述驾驶策略。

8.根据权利要求6或7所述的装置,其特征在于,所述装置还包括策略修正单元,用于:将所述驾驶策略添加至半自动驾驶车辆的驾驶策略数据库中;

确定所述驾驶策略被触发时半自动驾驶车辆是否被驾驶员进行异常干预;

若半自动驾驶车辆未被异常干预,则提高所述驾驶策略的可信度。

9.根据权利要求8所述的装置,其特征在于,所述策略修正单元还用于:若半自动驾驶车辆被异常干预,则继续采集驾驶员对半自动驾驶车辆进行干预时所采用的驾驶方案以及对应的驾驶场景信息,以根据新采集的驾驶方案与驾驶场景信息调整所述驾驶策略。

说明书 :

用于操作自动驾驶车辆的方法和装置

[0001] 本申请为申请号为CN201610825323.3、申请日为2016年9月14日、发明名称为“用于操作自动驾驶车辆的方法和装置”的中国专利申请的分案申请。

技术领域

[0002] 本申请涉及车辆技术领域,具体涉及无人驾驶车辆技术,尤其涉及用于操作自动驾驶车辆的方法和装置。

背景技术

[0003] 自动驾驶主要涉及识别、决策、控制三种主要技术。对于自动驾驶,安全性是第一位的条件。现有技术中,通常采用人工方式去标注供车载感应器所识别的风险对象,并进一步评估各个对象的风险或通过反复测试建立驾驶方案。
[0004] 然而,完全依靠人工对风险因素进行标注,成本极高。并且,在开放性的驾驶环境中,现有的风险因素难以被设计者与生产者穷尽和人为标注,从而让系统去自动识别。此外,即使设计或制造车辆时已预先标注出当前所有的风险对象,但在车辆投入使用后也会不断有可能造成行车风险的新事物出现在车辆行驶过程中,而现有方式无法及时对这些不断出现的新风险对象进行标注,更无法及时针对这些新风险对象建立风险评估策略或驾驶策略。因此,需要设计出对风险对象的快速、规模化、低成本的识别方法。

发明内容

[0005] 本申请提供了用于操作自动驾驶车辆的方法和装置,用于解决上述背景技术部分存在的技术问题。
[0006] 第一方面,本申请提供了一种用于操作自动驾驶车辆的方法,所述方法包括:收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及所述半自动驾驶车辆所处驾驶场景的驾驶场景信息;根据驾驶员所采用的驾驶方案,确定所述半自动驾驶车辆在所述驾驶场景下所处驾驶风险的风险等级;从所述驾驶场景信息中分解出所述驾驶场景中场景对象的对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息;对对象信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象;针对所识别出的风险对象,对对象信息、车辆行驶状态信息、驾驶环境信息以及对应的驾驶方案进行学习,确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与驾驶方案之间的关联关系以作为自动驾驶车辆的驾驶策略;利用所述驾驶策略确定自动驾驶车辆的候选驾驶方案。
[0007] 在一些实施例中,所述方法还包括:对所述驾驶策略进行优化的步骤,包括:使用所述驾驶策略,在驾驶模拟器所模拟的场景中控制测试用车辆行驶;检测所述测试用车辆行驶时是否满足所述驾驶模拟器中预先配置的驾驶规则;根据检测结果修正所述驾驶策略。
[0008] 在一些实施例中,采用强化学习算法修正所述驾驶策略。
[0009] 在一些实施例中,所述方法还包括:将所述驾驶策略添加至半自动驾驶车辆的驾驶策略数据库中;确定所述驾驶策略被触发时半自动驾驶车辆是否被驾驶员进行异常干预;若半自动驾驶车辆未被异常干预,则提高所述驾驶策略的可信度。
[0010] 在一些实施例中,所述方法还包括:若半自动驾驶车辆被异常干预,则继续采集驾驶员对半自动驾驶车辆进行干预时所采用的驾驶方案以及对应的驾驶场景信息,以根据新采集的驾驶方案与驾驶场景信息调整所述驾驶策略。
[0011] 第二方面,本申请提供了一种用于操作自动驾驶车辆的装置,所述装置包括:所述装置包括:收集单元,用于收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及所述半自动驾驶车辆所处驾驶场景的驾驶场景信息;
[0012] 等级确定单元,用于根据驾驶员所采用的驾驶方案,确定所述半自动驾驶车辆在所述驾驶场景下所处驾驶风险的风险等级;分解单元,用于从所述驾驶场景信息中分解出所述驾驶场景中各个场景对象的对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息;风险对象学习单元,用于对对象信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象;驾驶方案学习单元,针对所识别出的风险对象,对对象信息、车辆行驶状态信息、驾驶环境信息以及对应的驾驶方案进行学习,确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与驾驶方案之间的关联关系以作为自动驾驶车辆的驾驶策略;驾驶方案确定单元,用于利用所述驾驶策略确定自动驾驶车辆的候选驾驶方案。
[0013] 在一些实施例中,所述装置还包括驾驶策略优化单元,所述驾驶策略优化单元用于:使用所述驾驶策略,在驾驶模拟器所模拟的场景中控制测试用车辆行驶;检测所述测试用车辆行驶时是否满足所述驾驶模拟器中预先配置的驾驶规则;根据检测结果修正所述驾驶策略。
[0014] 在一些实施例中,所述装置还包括策略修正单元,用于:将所述驾驶策略添加至半自动驾驶车辆的驾驶策略数据库中;确定所述驾驶策略被触发时半自动驾驶车辆是否被驾驶员进行异常干预;若半自动驾驶车辆未被异常干预,则提高所述驾驶策略的可信度。
[0015] 在一些实施例中,所述策略修正单元还用于:若半自动驾驶车辆被异常干预,则继续采集驾驶员对半自动驾驶车辆进行干预时所采用的驾驶方案以及对应的驾驶场景信息,以根据新采集的驾驶方案与驾驶场景信息调整所述驾驶策略。
[0016] 本申请提供的用于操作自动驾驶车辆的方法和装置,通过驾驶员对半自动驾驶车辆的异常干预行为确定风险等级,并对场景对象与风险等级进行学习,从而从场景对象中识别出与风险等级有关联的风险对象。通过这种方式,可以不断地对用户的异常干预行为进行学习,从而可以从不断出现的场景对象中自动识别出风险对象,实现风险对象的自动标注,从而大大减轻了人工标注的工作量,也能及时对车辆投入使用后新出现的风险因素进行标记。此外,还可以确定风险对象的对象信息与风险等级的关联关系而生成供自动驾驶车辆使用的风险评估策略,从而可以通过学习驾驶人员的异常干预行为对风险识别进行优化。另外,针对所识别出的风险对象,还通过将驾驶员对半自动驾驶车辆进行异常干预时的驾驶方案作为样本进行学习,建立风险对象的对象信息、车辆行驶状态以及驾驶环境与驾驶方案的关联关系,以生成驾驶策略,该驾驶策略可用于确定自动驾驶车辆的候选驾驶方案,从而可以根据驾驶人员的行为优化自动驾驶车辆的候选驾驶方案。

附图说明

[0017] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0018] 图1是本申请可以应用于其中的示例性系统架构图;
[0019] 图2是根据本申请的用于操作自动驾驶车辆的方法的一个实施例的流程图;
[0020] 图3是根据本申请的用于操作自动驾驶车辆的方法的又一个实施例的流程图;
[0021] 图4是根据本申请的用于操作自动驾驶车辆的装置的一个实施例的结构示意图;
[0022] 图5是根据本申请的用于操作自动驾驶车辆的装置的又一个实施例的结构示意图;
[0023] 图6是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

[0024] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0025] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0026] 图1示出了可以应用本申请的用于操作自动驾驶车辆的方法和装置的实施例的示例性系统架构100。
[0027] 如图1所示,系统架构100可以包括半自动驾驶车辆101、102、103,网络104、106,服务器105和自动驾驶车辆107。网络104用以在半自动驾驶车辆101、102、103和服务器105之间提供传输链路的介质,网络104用以在自动驾驶车辆107和服务器105之间提供传输链路的介质。网络104、106可以包括各种连接类型,例如有线、无线传输链路或者光纤电缆等等。半自动驾驶车辆101、102、103以及自动驾驶车辆107中安装有车载电子设备,以进行信息采集、处理以及通信。
[0028] 半自动驾驶车辆101、102、103可以在行驶过程中采集所需要的数据,并将采集到的数据上传到服务器105以便进一步处理。
[0029] 服务器105可以是提供各种服务的服务器,例如对半自动驾驶车辆101、102、103上传的数据提供处理的服务器。服务器105可以利用半自动驾驶车辆101、102、103上传的数据进行训练,以生成风险评估策略或驾驶策略。服务器105可以将相应的策略发送至自动驾驶车辆107,以使用相应的策略操作自动驾驶车辆107完成风险的评估或驾驶方案的确定。此外,服务器105也可以将策略发回至各个半自动车辆,以便各个半自动车辆对相应的策略进行测试,以促进策略的进一步优化。
[0030] 应该理解,图1中的半自动驾驶车辆、自动驾驶车辆、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的半自动驾驶车辆、自动驾驶车辆、网络和服务器。
[0031] 请参考图2,其示出了根据本申请的用于操作无人驾驶车辆的方法的一个实施例的流程200。需要说明的是,本申请实施例所提供的用于操作无人驾驶车辆的方法主要由图1中的服务器105执行,一些步骤也可以由自动驾驶车辆107或半自动驾驶车辆101、102、103执行;相应地,用于操作无人驾驶车辆的装置一般设置于服务器105中,一些单元也可以设置于自动驾驶车辆107或半自动驾驶车辆101、102、103中。该方法包括以下步骤:
[0032] 步骤201,收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及半自动驾驶车辆所处驾驶场景的驾驶场景信息。
[0033] 在本实施例中,用于操作自动驾驶车辆的方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式从驾驶员利用其行驶的半自动驾驶车辆收集数据。其中,半自动驾驶车是具备自动驾驶车辆的感应系统且在驾驶过程中可以被驾驶员进行人工干预的车辆。
[0034] 其中,所收集的数据包括驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及半自动驾驶车辆所处驾驶场景的驾驶场景信息。实践中,这些数据可以是通过以下方式收集的:
[0035] 首先,各个半自动驾驶车辆在行驶过程中检测是否被驾驶员进行异常干预。其次,当检测到被驾驶员执行异常干预时,半自动驾驶车辆采集驾驶员进行异常干预时所采用的驾驶方案并采集此时半自动驾驶车辆所处驾驶场景的驾驶场景信息。其中,驾驶场景信息可以是半自动驾驶车辆上通过各种传感器或者其他手段检测到的、可用于描述所处驾驶场景的数据。例如,可以通过车载摄像机可以采集到用于记录车辆周围环境的视频,可以通过激光雷达可以采集到车辆周围的点云数据,还可以通过网络从云端获取车辆所处路段的高精度地图数据以及当前的天气数据等。这些数据可以用于进一步融合与分析,以得到驾驶场景中多种类别的对象的信息,例如车辆行驶状态信息、驾驶环境信息、场景对象信息等。最后,各个半自动驾驶车辆将所采集的数据(包括驾驶方案以及对应的驾驶场景信息)上传到电子设备,电子设备即可收集到这些数据。
[0036] 在本实施例的一些可选实现方式中,上述驾驶方案包括对车辆行驶速度和/或车辆行驶方向进行控制的控制行为数据。其中,对车辆行驶速度的控制行为主要是指对车辆刹车以及油门等影响车辆速度的部件的控制行为,也可以称为纵向控制行为。对车辆行驶方向的控制行为主要是指对车辆方向盘这一影响车辆行驶方向的部件的控制行为,也可以称为横向控制行为。
[0037] 步骤202,根据驾驶员所采用的驾驶方案,确定半自动驾驶车辆在上述驾驶场景下所处驾驶风险的风险等级。
[0038] 在本实施例中,电子设备可以根据驾驶方案与风险等级之间的预设映射规则,将步骤201中所得到数据中的驾驶方案映射为风险等级,从而确定半自动驾驶车辆在上述驾驶场景下所处驾驶风险的风险等级。通常,风险等级可以通过数值来表征。例如,急刹车对应的风险等级为10级,右转对应的风险等级为9级。实践中,还可以结合控制行为的控制量进一步评级,例如根据刹车或右转的幅度对具体的刹车或右转操作评级。可选的,风险等级的确定还可以针对横向控制行为和纵向控制行为的组合。
[0039] 步骤203,从驾驶场景信息中分解出驾驶场景中各个场景对象的对象信息。
[0040] 在本实施例中,基于步骤201所获取的驾驶场景信息,电子设备可以从中分解出各个场景对象的对象信息。实践中,可以通过一定的算法对驾驶场景信息进行分析,从中分解出驾驶场景中可能会影响车辆所处风险的场景对象。场景对象可能是车辆、步行者、骑自行车的人以及其他运动或静止目标等。对象信息可以是用于表征这些场景对象的特征的信息。这些特征可以包括结构、色彩等静态特征,也可以包括运动方向、运动速度等动态特征。通常,这些特征可以用于对某一具体场景对象的识别。
[0041] 步骤204,对对象信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象,并确定风险对象的对象信息与风险等级之间的关联关系以作为自动驾驶车辆的风险评估策略。
[0042] 在本实施例中,上述电子设备可以根据步骤202中所得到的风险等级以及步骤203中所得到的对象信息进行学习,将风险等级归因到各个场景对象上。其中,归因过程中与风险等级有关联的场景对象可以被识别为风险对象。针对这些风险对象,归因过程中还可以确定这些风险对象的对象信息与风险等级之间的关联关系。其中,该关联关系可以作为自动驾驶车辆的风险评估策略,可供自动驾驶车辆计算风险等级。
[0043] 在本实施例的一些可选实现方式中,步骤204可以采用深度神经网络算法对对象信息以及对应的风险等级进行学习。深度神经网络算法可以使机器自动学习模式特征,并将特征学习融入到了建立模型的过程中,从而减少了人为设计特征造成的不完备。
[0044] 可选的,上述风险对象包括已预先标注出的已知风险对象。在例如,可以通过人工方式将车辆驾驶时常见的已知风险对象标注出来。实践中,需要对这些已知风险对象的模式特征进行标注。通过这种方式,可以使得深度神经网络算法可以不需要对这些频繁出现的风险对象进行模式特征的重新学习,降低了深度神经网络算法进行特征学习时的计算难度,提高计算效率。
[0045] 步骤205,利用风险评估策略识别自动驾驶车辆所处驾驶风险的风险等级。
[0046] 在本实施例中,电子设备可以将该风险评估策略配置到相应的自动驾驶车辆中,如此,自动驾驶车辆可以使用该风险评估策略识别所处驾驶风险的风险等级。自动驾驶车辆在使用该风险评估策略时,可以对从当前所采集的驾驶场景信息中识别出风险对象,并根据风险对象的对象信息计算出当前的风险等级。
[0047] 在本实施例的一些可选的实现方式中,上述方法还包括:从驾驶场景信息中分解出车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息;以及步骤204进一步包括:对对象信息、车辆行驶状态信息、驾驶环境信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象,并确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与风险等级的之间关联关系。在该实现方式中,将风险等级归因于场景对象、车辆行驶状态以及驾驶环境的组合,这样风险评估策略还考虑到场景对象出现时所处的条件,使得风险评估策略考虑的因素更为全面。
[0048] 本申请的上述实施例提供的方法通过驾驶员对半自动驾驶车辆的异常干预行为确定风险等级,并对场景对象与风险等级进行学习,从而从场景对象中识别出与风险等级有关联的风险对象。通过这种方式,可以不断地对用户的异常干预行为进行学习,从而可以从不断出现的场景对象中自动识别出风险对象,实现风险对象的自动标注,从而大大减轻了人工标注的工作量,也能及时对车辆投入使用后新出现的风险因素进行标记。此外,还可以确定风险对象的对象信息与风险等级的关联关系而生成供自动驾驶车辆使用的风险评估策略,从而可以通过学习驾驶人员的异常干预行为对风险识别进行优化。
[0049] 进一步参考图3,其示出了用于操作自动驾驶车辆的方法的又一个实施例的流程300。该方法的流程300,包括以下步骤:
[0050] 步骤301,收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及半自动驾驶车辆所处驾驶场景的驾驶场景信息。
[0051] 在本实施例中,步骤301的具体处理可以参考图2对应实施例中的步骤201,这里不再赘述。
[0052] 步骤302,根据驾驶员所采用的驾驶方案,确定半自动驾驶车辆在驾驶场景下所处驾驶风险的风险等级。
[0053] 在本实施例中,步骤302的具体处理可以参考图2对应实施例中的步骤202,这里不再赘述。
[0054] 步骤303,从驾驶场景信息中分解出驾驶场景中场景对象的对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息。
[0055] 在本实施例中,基于步骤301所收集的驾驶场景信息,电子设备可以根据一定的算法从中分解出驾驶场景中场景对象的对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息。其中,场景对象是车辆驾驶过程可能遭遇到的场景对象,例如行人、路上的其他机动车辆、非机动车辆、其他车辆散落的货物等。车辆行驶状态信息主要是车辆自身的状态信息,例如车辆行驶方向、车辆行驶速度等。驾驶环境信息,则用于指示车辆所处的宏观环境,例如车辆所处道路、当前天气等信息。由于驾驶场景信息是通过多种传感器获取到的信息,各种信息融合在一起,电子设备需要对驾驶场景信息进行分解,从而分解出各个场景对象的对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息。
[0056] 步骤304,对对象信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象。
[0057] 在本实施例中,上述电子设备可以根据步骤202中所得到的风险等级以及步骤203中所得到的对象信息进行学习,将风险等级归因到各个场景对象上。其中,归因过程中与风险等级有关联的场景对象可以被识别为风险对象。
[0058] 步骤305,针对所识别出的风险对象,对对象信息、车辆行驶状态信息、驾驶环境信息以及对应的驾驶方案进行学习,确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与驾驶方案之间的关联关系以作为自动驾驶车辆的驾驶策略。
[0059] 在本实施例中,针对步骤304所识别出的风险对象,电子设备可以基于步骤303中所得到的对象信息、车辆行驶状态信息、驾驶环境信息以及基于步骤301所得到的驾驶方案,电子设备可以将其中涉及到上述风险对象的数据作为样本进行训练,以确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与驾驶方案之间的关联关系,从而作为自动驾驶车辆的驾驶策略。
[0060] 步骤306,利用驾驶策略确定自动驾驶车辆的候选驾驶方案。
[0061] 在本实施例中,基于步骤304所得到的驾驶策略,电子设备可以将其配置到自动驾驶车辆中,从而可以利用该驾驶策略确定该驾驶策略的候选驾驶方案。需要说明的是,候选驾驶方案可以作为自动驾驶车辆最终采用的驾驶方案,也可以作为供自动驾驶车辆进一步处理的驾驶方案。实践中,自动驾驶车辆可以根据其他的辅助决策信息从多个候选驾驶方案中选择最终使用的驾驶方案,辅助决策信息可以包括但不限于驾驶员偏好信息、天气信息、路程信息、能耗信息中的一项或多项。
[0062] 在本实施例的一些可选实现方式中,上述方法还包括对驾驶策略进行优化的步骤,该步骤具体包括:使用驾驶策略在驾驶模拟器所模拟的场景中控制测试用车辆行驶;检测测试用车辆行驶时是否满足驾驶模拟器中预先配置的驾驶规则;根据检测结果修正驾驶策略。
[0063] 在该实现方式中,还通过模拟器模拟场景对驾驶策略进行测试并根据测试效果对驾驶策略进行修正,使得修正后的驾驶策略能使车辆的行驶符合驾驶规则,在行车安全方面对驾驶策略进行优化。
[0064] 在本实施例的一些可选实现方式中,对驾驶策略进行优化的步骤中,采用强化学习算法根据检测结果修正驾驶策略。在该实现方式中,在根据检测结果修正驾驶策略时采用强化学习算法,从而使得驾驶策略中符合驾驶规则的驾驶方案的权重得以增加,不符合驾驶规则的驾驶方案的权重减小。通过大量场景的测试,即可使修正的驾驶策略中在各种驾驶场景下对应的驾驶方案尽可能地符合驾驶规则。
[0065] 在本实施例的一些可选实现方式中,上述方法还包括:将驾驶策略添加至半自动驾驶车辆的驾驶策略数据库中;确定驾驶策略被触发时半自动驾驶车辆是否被驾驶员进行异常干预;若半自动驾驶车辆未被异常干预,则提高驾驶策略的可信度。在该实现方式中,可以将得到驾驶策略配置到半自动驾驶车辆的驾驶策略数据库中,以供半自动驾驶车辆能够进行路上测试。当驾驶策略被触发且未被驾驶员异常干预,则提高驾驶策略的可信度,从而通过实际的道路测试有效地验证驾驶策略的有效性,并在有效时提高其可信度,从而使得驾驶策略尽可能满足驾驶员的实际驾驶需求。
[0066] 在上一实现方式的一些可选实现方式中,上述方法还包括:若半自动驾驶车辆被异常干预,则继续采集驾驶员对半自动驾驶车辆进行干预时所采用的驾驶方案以及对应的驾驶场景信息,以根据新采集的驾驶方案与驾驶场景信息调整驾驶策略。当驾驶策略被触发且被驾驶员异常干预时,意味着所触发的驾驶策略未能满足驾驶员当前的驾驶需求,从而需要继续采集驾驶员对半自动驾驶车辆进行干预时所采用的驾驶方案以及对应的驾驶场景信息,以对驾驶策略进行调整。可选的,已有的驾驶方案和驾驶场景信息以及新采集的驾驶方案和驾驶场景信息可以同时作为生成新的驾驶策略的样本数据。实践中,在使用模型生成新的驾驶策略时,可以对新采集的驾驶方案和驾驶场景信息设置较高的权重,以提高驾驶策略的时效性。
[0067] 本实施例中的用于操作自动驾驶车辆的方法的流程300通过驾驶员对半自动驾驶车辆的异常干预行为确定风险等级,并对场景对象与风险等级进行学习,从而从场景对象中识别出与风险等级有关联的风险对象。通过这种方式,可以不断地对用户的异常干预行为进行学习,从而可以从不断出现的场景对象中自动识别出风险对象,实现风险对象的自动标注,从而大大减轻了人工标注的工作量,也能及时对车辆投入使用后新出现的风险因素进行标记。此外,针对所识别出的风险对象,还通过将驾驶员对半自动驾驶车辆进行异常干预时的驾驶方案作为样本进行学习,建立风险对象的对象信息、车辆行驶状态以及驾驶环境与驾驶方案的关联关系,以生成驾驶策略,该驾驶策略可用于确定自动驾驶车辆的候选驾驶方案,从而可以根据驾驶人员的行为优化自动驾驶车辆的候选驾驶方案。
[0068] 进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种用于操作自动驾驶车辆的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体一般应用于图1中的服务器105中。
[0069] 如图4所示,本实施例所述的用于操作自动驾驶车辆的装置400包括:收集单元401、风险等级确定单元402、分解单元403、学习单元404和识别单元405。其中,收集单元401用于收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及半自动驾驶车辆所处驾驶场景的驾驶场景信息;风险等级确定单元402用于根据驾驶员所采用的驾驶方案,确定半自动驾驶车辆在驾驶场景下所处驾驶风险的风险等级;分解单元403用于从驾驶场景信息中分解出驾驶场景中各个场景对象的对象信息;学习单元404用于对对象信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象,并确定风险对象的对象信息与风险等级之间的关联关系以作为自动驾驶车辆的风险评估策略;而识别单元405用于利用风险评估策略识别自动驾驶车辆所处驾驶风险的风险等级。
[0070] 在本实施例中,收集单元401、风险等级确定单元402、分解单元403、学习单元404和识别单元405的具体处理可以分别参考图2对应实施例中步骤201、步骤202、步骤203、步骤204和步骤205,这里不再赘述。
[0071] 在本实施例的一些可选实现方式中,分解单元403还用于从驾驶场景信息中分解出车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息;以及,学习单元404进一步用于:对对象信息、车辆行驶状态信息、驾驶环境信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象,并确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与风险等级的之间关联关系。该实现方式的具体处理可以参考图2对应实施例中相应的实现方式,这里不再赘述。
[0072] 在本实施例的一些可选实现方式中,上述驾驶方案包括对车辆行驶速度和/或车辆行驶方向进行控制的控制行为数据。该实现方式的具体处理可以参考图2对应实施例中相应的实现方式,这里不再赘述。
[0073] 进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于操作自动驾驶车辆的装置的又一个实施例,该装置实施例与图3所示的方法实施例相对应,该装置具体可以应用于图1中的服务器105中。
[0074] 如图5所示,本实施例所述的用于操作自动驾驶车辆的装置500包括:收集单元501、分解单元502、关联关系确定单元503和驾驶方案确定单元504。其中,收集单元501用于收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及半自动驾驶车辆所处驾驶场景的驾驶场景信息;分解单元502用于从驾驶场景信息中分解出驾驶场景中各个场景对象的对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息;关联关系确定单元503用于确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与驾驶方案之间的关联关系,以作为自动驾驶车辆的驾驶策略;而驾驶方案确定单元504用于利用驾驶策略确定自动驾驶车辆的候选驾驶方案。
[0075] 在本实施例中,收集单元501、等级确定单元、分解单元503、风险对象学习单元503、驾驶方案学习单元505和驾驶方案确定单元506的具体处理可以分别参考图3对应实施例中的步骤301、步骤302、步骤303、步骤304、步骤305和步骤306,这里不再赘述。
[0076] 在本实施例的一些可选实现方式中,装置500还包括驾驶策略优化单元(未示出),驾驶策略优化单元用于:使用驾驶策略,在驾驶模拟器所模拟的场景中控制测试用车辆行驶;检测测试用车辆行驶时是否满足驾驶模拟器中预先配置的驾驶规则;根据检测结果修正驾驶策略。该实现方式的具体处理可以参考图3对应实施例中相应的实现方式,这里不再赘述。
[0077] 在本实施例的一些可选实现方式中,装置500还包括策略修正单元(未示出),用于:将驾驶策略添加至半自动驾驶车辆的驾驶策略数据库中;确定驾驶策略被触发时半自动驾驶车辆是否被驾驶员进行异常干预;若半自动驾驶车辆未被异常干预,则提高驾驶策略的可信度。
[0078] 在本实施例的一些可选实现方式中,上述策略修正单元还用于:若半自动驾驶车辆被异常干预,则继续采集驾驶员对半自动驾驶车辆进行干预时所采用的驾驶方案以及对应的驾驶场景信息,以根据新采集的驾驶方案与驾驶场景信息调整驾驶策略。该实现方式的具体处理可以参考图2对应实施例中相应的实现方式,这里不再赘述。
[0079] 下面参考图6,其示出了适于用来实现本申请实施例服务器或车辆上的车载电子设备的计算机系统600的结构示意图。
[0080] 如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
[0081] 以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
[0082] 特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
[0083] 附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0084] 描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括收集单元、风险等级确定单元、分解单元、关联关系确定单元、识别单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,收集单元还可以被描述为“收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及所述半自动驾驶车辆所处驾驶场景的驾驶场景信息的单元”。
[0085] 作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及所述半自动驾驶车辆所处驾驶场景的驾驶场景信息;根据驾驶员所采用的驾驶方案,确定所述半自动驾驶车辆在所述驾驶场景下所处驾驶风险的风险等级;从所述驾驶场景信息中分解出所述驾驶场景中各个场景对象的对象信息;对对象信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象,并确定风险对象的对象信息与风险等级之间的关联关系以作为自动驾驶车辆的风险评估策略;利用所述风险评估策略识别自动驾驶车辆所处驾驶风险的风险等级。或者,上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:收集驾驶员对半自动驾驶车辆进行异常干预时所采用的驾驶方案以及所述半自动驾驶车辆所处驾驶场景的驾驶场景信息;根据驾驶员所采用的驾驶方案,确定所述半自动驾驶车辆在所述驾驶场景下所处驾驶风险的风险等级;从所述驾驶场景信息中分解出所述驾驶场景中场景对象的对象信息、车辆行驶状态信息以及车辆所处驾驶环境的驾驶环境信息;对对象信息以及对应的风险等级进行学习,识别出场景对象中与风险等级相关联的风险对象;针对所识别出的风险对象,对对象信息、车辆行驶状态信息、驾驶环境信息以及对应的驾驶方案进行学习,确定风险对象的对象信息、车辆行驶状态信息、驾驶环境信息的组合与驾驶方案之间的关联关系以作为自动驾驶车辆的驾驶策略;利用所述驾驶策略确定自动驾驶车辆的候选驾驶方案。
[0086] 以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。