自动驾驶模型训练方法、终端及可读存储介质转让专利

申请号 : CN201810749434.X

文献号 : CN108944944B

文献日 : 2020-04-10

本发明公开了一种自动驾驶模型训练方法，该方法包括以下步骤：车辆进入自动驾驶训练模式时，识别当前驾驶员的身份信息，根据身份信息确定对应的自动驾驶模型；采集当前车辆的行车环境及驾驶员的驾驶操作，确定自动驾驶模型中与行车环境对应的自动驾驶操作；将自动驾驶操作的各驾驶操作选项与驾驶操作分别比较，根据比较结果对各驾驶操作选项进行打分；统计自动驾驶模型中各项自动驾驶操作对应驾驶操作选项的最高分值之和，得到自动驾驶模型的训练分数；自动驾驶模型的训练分数达到预设分数时，确定当前自动驾驶模型完成训练。本发明还提供一种终端及可读存储介质。本发明实现了对自动驾驶模型训练，使自动驾驶操作能够与用户的驾驶风格相符合。

1.一种自动驾驶模型训练方法，其特征在于，所述自动驾驶模型训练方法包括以下步骤：当车辆进入自动驾驶训练模式时，识别当前驾驶员的身份信息，并根据所述身份信息确定对应的自动驾驶模型；

采集当前车辆的行车环境以及驾驶员的驾驶操作，并确定所述自动驾驶模型中与所述行车环境相对应的自动驾驶操作，其中，每一项自动驾驶操作对应多个驾驶操作选项；

将所述自动驾驶操作的各驾驶操作选项与所述驾驶操作分别进行比较，并根据比较结果对各驾驶操作选项进行打分；

统计所述自动驾驶模型中各项自动驾驶操作对应驾驶操作选项的最高分值之和，得到所述自动驾驶模型的训练分数；

当所述自动驾驶模型的训练分数达到预设分数时，确定当前所述自动驾驶模型完成训练；

其中，所述将所述自动驾驶操作的各驾驶操作选项与所述驾驶操作分别进行比较包括：将所述自动驾驶操作的各驾驶操作选项的参数值与所述驾驶操作的参数值进行比较，得到比较结果，所述比较结果为参数值差值；

若所述参数值差值小于预设误差值，则判定所述自动驾驶操作与所述驾驶操作相符合，否则不相符合。

2.如权利要求1所述的自动驾驶模型训练方法，其特征在于，所述自动驾驶模型训练方法还包括：当车辆启动时，检测是否存在完成训练的自动驾驶模型；

若存在，则输出进入自动驾驶模式的提示选项信息。

3.如权利要求2所述的自动驾驶模型训练方法，其特征在于，所述当车辆启动时，检测是否存在完成训练的自动驾驶模型之后包括：若不存在完成训练的自动驾驶模型，则进入自动驾驶训练模式。

4.如权利要求1所述的自动驾驶模型训练方法，其特征在于，所述行车环境包括：车辆行驶过程中的自然环境、道路环境，所述自然环境包括温度、降水量、光线强度，所述道路环境包括路况、交通标识。

5.如权利要求1所述的自动驾驶模型训练方法，其特征在于，所述根据比较结果对各驾驶操作选项进行打分包括：若所述比较结果为所述自动驾驶操作与所述驾驶操作相符合，则对应增加所述自动驾驶操作对应驾驶操作选项的分值；

若所述比较结果为所述自动驾驶操作与所述驾驶操作不相符合，则对应减少所述自动驾驶操作对应驾驶操作选项的分值。

6.如权利要求1所述的自动驾驶模型训练方法，其特征在于，所述自动驾驶模型训练方法还包括：当确定所述自动驾驶模型完成训练时，输出开启自动驾驶的提示信息。

7.一种自动驾驶模型训练终端，其特征在于，所述自动驾驶模型训练终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自动驾驶模型训练程序，所述自动驾驶模型训练程序被所述处理器执行时实现如权利要求1至6中任一项所述的自动驾驶模型训练方法的步骤。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有自动驾驶模型训练程序，所述自动驾驶模型训练程序被处理器执行时实现如权利要求1至6中任一项所述的自动驾驶模型训练方法的步骤。

自动驾驶模型训练方法、终端及可读存储介质

技术领域

[0001] 本发明涉及自动驾驶领域，尤其涉及一种自动驾驶模型训练方法、终端及可读存储介质。

背景技术

[0002] 自动驾驶技术是目前机动车领域的一个重要的技术，也是目前各大厂商着重研究的方向。并且随着自动驾驶技术的不断发展，仅仅实现通过自动驾驶控制汽车等机动车进行常规的形式已经不能够满足用户的使用需求。例如用户在启动自动驾驶时，会因为自动驾驶的风格与自身风格不相同，而导致用户使用自动驾驶的体验大幅度降低。因此如何使自动驾驶系统能够在对车辆进行正常的自动驾驶控制时，又能够使得驾驶风格与用户更加接近是一个急需解决的问题。

发明内容

[0003] 本发明的主要目的在于提供一种自动驾驶模型训练方法、机动车以及计算机可读存储介质，旨在解决如何使自动驾驶系统的驾驶风格与用户的驾驶风格能够相符合的技术问题。

[0004] 为实现上述目的，本发明提供一种自动驾驶模型训练方法，所述自动驾驶模型训练方法包括以下步骤：

[0005] 当车辆进入自动驾驶训练模式时，识别当前驾驶员的身份信息，并根据所述身份信息确定对应的自动驾驶模型；

[0006] 采集当前车辆的行车环境以及驾驶员的驾驶操作，并确定所述自动驾驶模型中与所述行车环境相对应的自动驾驶操作，其中，每一项自动驾驶操作对应多个驾驶操作选项；

[0007] 将所述自动驾驶操作与所述驾驶操作进行比较，得到比较结果，并对所述比较结果进行打分；

[0008] 统计所述自动驾驶模型的各项自动驾驶操作中驾驶操作选项的最高分值之和，得到所述自动驾驶模型的训练分值；

[0009] 当所述自动驾驶模型的训练分值达到预设分数时，确定当前所述自动驾驶模型完成训练。

[0010] 可选地，所述当车辆进入自动驾驶训练模式时的步骤之前包括：

[0011] 当车辆启动时，检测是否存在训练完成的自动驾驶模型；

[0012] 若检测存在训练完成的自动驾驶模型，则输出是否进入自动驾驶模式的提示信息。

[0013] 可选地，所述自动驾驶模型训练方法之后包括：

[0014] 若检测到不存在训练完成的自动驾驶模型，或检测到不进入自动驾驶模型的确认信息，则进入自动驾驶训练模式。

[0015] 可选地，所述自动驾驶模型训练方法包括：

[0016] 所述行车环境包括环境温度、环境降水量以及道路信息。

[0017] 可选地，所述将所述自动驾驶操作与所述驾驶操作进行比较，得到比较结果，并对所述比较结果进行打分的步骤包括：

[0018] 若所述比较结果为所述自动驾驶操作与所述驾驶操作相符合，则对应增加所述自动驾驶操作的分值；

[0019] 若所述比较结果为所述自动驾驶操作与所述驾驶操作不相符合，则对应减少所述自动驾驶操作的分值。

[0020] 可选地，所述自动驾驶模型训练方法的步骤包括：

[0021] 若所述自动驾驶操作与所述驾驶操作的参数值误差小于预设误差值，则判定所述自动驾驶操作与所述驾驶操作相符合；

[0022] 若所述自动驾驶操作与所述驾驶操作的参数值误差大于等于预设误差值，则判定所述自动驾驶操作与所述驾驶操作不相符合。

[0023] 可选地，所述当所述自动驾驶模型的训练分值达到预设分数时，确定当前所述自动驾驶模型完成训练的步骤之后包括：

[0024] 当确定自动驾驶模型训练完成时，输出是否开启自动驾驶的提示信息。

[0025] 此外，为实现上述目的，本发明还提供一种控制终端，所述机动车包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自动驾驶模型训练程序，所述自动驾驶模型训练程序被所述处理器执行时实现如上所述自动驾驶模型训练方法的步骤。

[0026] 此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储的自动驾驶模型训练程序，所述自动驾驶模型训练程序被处理器执行时实现如上所述的自动驾驶模型训练方法的步骤。

[0027] 本发明在用户正常驾驶时，对自动驾驶系统的自动驾驶模型进行训练，并且将自动驾驶模型的中与用户驾驶风格相类似的自动驾驶操作设为自动驾驶模型的优选方案，从而使自动驾驶模型能够更加接近用户的驾驶风格。并且自动驾驶模型的训练过程无需用户单独设置，可以与用户的正常驾驶行为相融合，从而降低了用户的操作难度，并且避免了消耗用户额外的时间。同时训练完成的自动驾驶模型与用户的驾驶风格相符合，可以使用户在开启自动驾驶时，也能够享受到驾驶所带来的乐趣，从而提高了用户体验。

附图说明

[0028] 图1是本发明实施例方案涉及的硬件运行环境的终端\装置结构示意图；

[0029] 图2为本发明自动驾驶模型训练方法一实施例的流程示意图；

[0030] 图3为本发明自动驾驶模型训练方法中另一实施例中S10的步骤的细化流程示意图。

[0031] 本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

[0032] 应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

[0033] 如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

[0034] 本发明实施例终端可以是自动驾驶模型训练终端。

[0035] 可选地，终端还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。当然，终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

[0036] 本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

[0037] 如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及自动驾驶模型训练程序。

[0038] 在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的自动驾驶模型训练程序，并执行以下操作：

[0039] 当车辆进入自动驾驶训练模式时，识别当前驾驶员的身份信息，并根据所述身份信息确定对应的自动驾驶模型；

[0040] 采集当前车辆的行车环境以及驾驶员的驾驶操作，并确定所述自动驾驶模型中与所述行车环境相对应的自动驾驶操作，其中，每一项自动驾驶操作对应多个驾驶操作选项；

[0041] 将所述自动驾驶操作的各驾驶操作选项与所述驾驶操作分别进行比较，并根据比较结果对各驾驶操作选项进行打分；

[0042] 统计所述自动驾驶模型中各项自动驾驶操作对应驾驶操作选项的最高分值之和，得到所述自动驾驶模型的训练分数；

[0043] 当所述自动驾驶模型的训练分数达到预设分数时，确定当前所述自动驾驶模型完成训练。

[0044] 进一步地，处理器1001可以调用存储器1005中存储的自动驾驶模型训练程序，还执行以下操作：

[0045] 当车辆启动时，检测是否存在完成训练的自动驾驶模型；

[0046] 若存在，则输出进入自动驾驶模式的提示选项信息。

[0047] 进一步地，处理器1001可以调用存储器1005中存储的自动驾驶模型训练程序，还执行以下操作：

[0048] 若不存在完成训练的自动驾驶模型，则进入自动驾驶训练模式。

[0049] 进一步地，处理器1001可以调用存储器1005中存储的自动驾驶模型训练程序，还执行以下操作：

[0050] 将所述自动驾驶操作的各驾驶操作选项的参数值与所述驾驶操作的参数值进行比较，得到比较结果，所述比较结果为参数值差值；

[0051] 若所述参数值差值小于预设误差值，则判定所述自动驾驶操作与所述驾驶操作相符合，否则不相符合。

[0052] 进一步地，处理器1001可以调用存储器1005中存储的自动驾驶模型训练程序，还执行以下操作：

[0053] 若所述比较结果为所述自动驾驶操作与所述驾驶操作相符合，则对应增加所述自动驾驶操作对应驾驶操作选项的分值；

[0054] 若所述比较结果为所述自动驾驶操作与所述驾驶操作不相符合，则对应减少所述自动驾驶操作对应驾驶操作选项的分值。

[0055] 进一步地，处理器1001可以调用存储器1005中存储的自动驾驶模型训练程序，还执行以下操作：

[0056] 当确定所述自动驾驶模型完成训练时，输出开启自动驾驶的提示信息。

[0057] 基于上述终端的硬件结构，提出本发明自动驾驶模型训练方法的以下各实施例。

[0058] 参照图2，图2为本发明自动驾驶模型训练方法第一实施例的流程示意图。

[0059] 本发明第一实施例提供一种自动驾驶模型训练方法，所述自动驾驶模型训练方法包括：

[0060] 步骤S10，当车辆进入自动驾驶训练模式时，识别当前驾驶员的身份信息，并根据所述身份信息确定对应的自动驾驶模型；

[0061] 具体地，车辆的自动驾驶系统为了能够针对性的对驾驶员进行自动驾驶服务，因此需要确认驾驶员的身份，通过指纹识别、面部识别等生物识别的方式，可以快速准确的完成对驾驶员的身份确认并获取驾驶员的身份信息。在得到驾驶员的身份信息后，自动驾驶系统会查询数据库中的与驾驶员对应的自动驾驶模型，并进行获取。

[0062] 步骤S20，采集当前车辆的行车环境以及驾驶员的驾驶操作，并确定所述自动驾驶模型中与所述行车环境相对应的自动驾驶操作，其中，每一项自动驾驶操作对应多个驾驶操作选项；

[0063] 具体地，确认自动驾驶模型后，通过车辆中设置的传感器采集当前的行车环境，包括环境温度、降水量、道路情况等信息，同时采集驾驶员的驾驶操作，例如加速或减速、转向或执行，以及操作的幅度与持续时间，并且自动驾驶模型会根据环境信息，在多个驾驶操作选项中选择最优的选型进行虚拟的自动驾驶操作。

[0064] 步骤S30，将所述自动驾驶操作的各驾驶操作选项与所述驾驶操作分别进行比较，并根据比较结果对各驾驶操作选项进行打分；

[0065] 具体地，通过将自动驾驶操作选项与用户的驾驶操作进行比较，可以得到二者是否相符合的比较结果，具体可以使用二者的具体参数是否处于预设误差范围内来判断二者是否相符合。而根据比较结果，可以对自动驾驶操作进行打分，例如得到的比较结果为相符合，则对应增加打分的分值，而结果为不相符合时，则对应减少打分的分值，并且可以根据相符合程度决定分值的增加或减少幅度。打分的分值是用于判断自动驾驶操作与用户驾驶风格是否接近的标准。

[0066] 步骤S40，统计所述自动驾驶模型中各项自动驾驶操作对应驾驶操作选项的最高分值之和，得到所述自动驾驶模型的训练分数；

[0067] 具体地，将自动驾驶模型的各个项自动驾驶操作中分数最高的驾驶操作选项的分值进行求和，得到的就是该自动驾驶模型的训练分值。例如自动驾驶模型中有直行、停车、转弯三个自动驾驶操作，每个驾驶操作中都有多个驾驶操作选项，例如直行有时速30直行、时速40直行和时速50直行，并且每个驾驶操作选项都有一个分值。将其中每个自动驾驶操作的最高分进行求和，就可以得到自动驾驶模型的训练分值。

[0068] 步骤S50，当所述自动驾驶模型的训练分数达到预设分数时，确定当前所述自动驾驶模型完成训练。

[0069] 具体地，自动驾驶模型的训练分值是用于判断自动驾驶模型训练程度的参数，而当训练分值达到预设分数时，表明自动驾驶模型已经达到符合用户驾驶风格的程度，因此可以确定自动驾驶模型的训练完成，该自动驾驶模型能够在自动驾驶时进行使用，并且驾驶风格与对应驾驶员的驾驶风格相符合度较高。

[0070] 在本实施例中，为了能够使用户(即驾驶员)获取到更加符合自身驾驶风格的自动驾驶体验，因此自动驾驶系统需要根据驾驶员针对性的训练自动驾驶模型，自动驾驶模型是包含了驾驶员驾驶风格的架势策略。自动驾驶可以通过训练好的自动驾驶模型进行与驾驶员的驾驶风格接近的自动驾驶，例如在前方有车辆时，是跟随还是超车，遇到红灯路口需要刹车时，是提前放开油门缓慢减速还是在靠近路口时踩刹车直接减速。不同的驾驶员有着不同的驾驶风格，在符合安全法规与不对汽车造成明显损耗的前提下，不同的驾驶风格没有显著的优缺点，但是用户在自动驾驶时，能够体验到与自身驾驶风格相符合的自动驾驶，则可以提高用户对已自动驾驶的使用体验。为了能够使自动驾驶能够与用户的驾驶风格相符合，需要训练与用户驾驶风格相匹配的自动驾驶模型。

[0071] 为了使自动驾驶模型能够准确的反应用户的驾驶风格，因此自动驾驶模型和用户是一一对应的，也就是说一个用户会设置一个对应的自动驾驶模型。而自动驾驶模型需要通过训练来使自动驾驶模型的驾驶策略与用户的驾驶风格相匹配。自动驾驶模型的训练的实质就是在众多的自动驾驶操作中寻找出符合用户的驾驶操作的过程。自动驾驶模型中对于各种不同的行车环境都储存有多个自动驾驶操作选项，例如天气晴朗时，通畅的高速公路的行车环境，自动驾驶会选择匀速直线行驶的自动驾驶操作，而直线匀速行驶的操作中还有以平均速度行驶、以最低限速行驶、以最高限速行驶等不同的自动驾驶操作选项，每个选项都会有一个分数的评价，分数用于衡量该选项是否与用户的驾驶习惯相符合。在未进行过训练时，所有的自动驾驶操作选项都设置为默认的初始分数，因此在进行模拟训练时，自动驾驶模型会随机使用自动驾驶操作中的一个自动驾驶操作选项进行自动驾驶，此处的自动驾驶是自动驾驶模型进行的模拟行为，并非是控制车辆进行真实的驾驶行为，同时会检测驾驶员做出的实际驾驶操作，并与自动驾驶模型进行匹配，从而得出自动驾驶模型是否与用户的驾驶操作相符合。

[0072] 判断自动驾驶操作与驾驶员的驾驶操作是否符合时，需要判断二者动作参数的误差，例如操作动作都是减低车速至车辆停止，驾驶员的驾驶操作是将刹车踏板下压10cm，直至完成全部刹车过程，而自动驾驶模型则是将刹车踏板下压5cm直至完成全部刹车过程，此时虽然模拟操作与驾驶员的驾驶操作都是下压刹车踏板，但是二者的动作幅度不同，并且动作的差距较大，所以也判定为不符合，动作参数的具体半段标准可以根据情况进行调节。因此通过检测自动驾驶模型与驾驶员的驾驶操作是否相符合，可以快速的得出自动驾驶模型中与驾驶员的驾驶风格相符合的自动驾驶操作。

[0073] 自动驾驶操作选项使用分数评价是否与用户的驾驶风格相符合，根据自动驾驶操作是否与实际驾驶员进行的驾驶操作相符合，来调节自动驾驶操作选项的分数，增加与驾驶员的驾驶操作相符合的自动驾驶操作的分数，同时减少不符合的自动驾驶操作的分数。在增加分数时，增加的分值可以根据二者的误差大小进行进一步设定，例如误差越小则增加的分值越高。自动驾驶模型的训练是一个长期的过程，在选择自动驾驶操作时，自动驾驶模型会优先使用分数高的自动驾驶操作选项，这样就可以使自动驾驶模型中的高分方案逐渐调整为与用户驾驶风格接近的自动驾驶操作。

[0074] 与自动驾驶操作选项相同，自动驾驶模型也使用分数作为评价标准，自动驾驶模型的分数是其各项自动驾驶操作对应分数最高的自动驾驶操作信息的分数总和，自动驾驶模型的分数可以用于判断自动驾驶模型的训练是否完成，当自动驾驶模型的分数达到了预设分数时，即表明自动驾驶模型中的各项自动驾驶操作中都训练得出了分数到达一定分值的自动驾驶操作选项，即与用户驾驶风格接近的自动驾驶操作选项，因此使用该自动驾驶模型进行自动驾驶时，可以达到与用户相符合的驾驶风格，所以可以判定自动驾驶模型训练完成。而且自动驾驶模型的训练过程与用户平时的驾驶相结合，不需要用户进行额外的训练步骤，减少了用户训练自动驾驶模型的操作难度与所消耗的额外时间。

[0075] 通过训练自动驾驶模型，可以在使车辆的自动驾驶模型获取到接近用户驾驶风格的自动驾驶操作，这样用户在使用自动驾驶时，也可以获取到与手动驾驶接近的行车体验，例如高速的刺激体验，平稳的舒适体验等，并且自动驾驶模型的训练与用户的日常驾驶相融合，使得自动驾驶模型的训练在获取较高准确性的同时，不需要用户花费额外的时间专门进行，提高了用户的使用体验。

[0076] 进一步地，参照图3，图3为本发明驾驶模型训练方法第二实施例的流程示意图，步骤S10当车辆进入自动驾驶训练模式时的步骤之前包括：

[0077] 步骤S11，当车辆启动时，检测是否存在训练完成的自动驾驶模型；

[0078] 步骤S12，若存在，则输出进入自动驾驶模式的提示选项信息。

[0079] 具体地，在车辆启动时，首先会检测是否已经存在训练完成的自动驾驶模型，而若是存在训练完成的自动驾驶模型，则能够直接根据自动驾驶模型直接进入自动驾驶模式，因此在检测到存在训练完成的自动驾驶模型时，通过输出提示信息提醒用户是否进入自动驾驶模式。

[0080] 本实施例中，自动驾驶模型在训练完成后，则可以用于自动驾驶，而无需再进行额外的训练，因此在检测到存在训练完成的自动驾驶模型时，则通过输出提示信息提醒用户当前能够启动自动驾驶模式，用户则根据自身需求选择是否启动自动驾驶模式，输入对应的确认指令。

[0081] 进一步地，步骤S11当车辆启动时，检测是否存在完成训练的自动驾驶模型之后包括：

[0082] 步骤S13，若不存在完成训练的自动驾驶模型，则进入自动驾驶训练模式。

[0083] 具体地，若是不存在训练完成的自动驾驶模型，则自动驾驶训练模式，训练自动驾驶模型。

[0084] 在不存在训练完成的自动驾驶模型时，需要通过训练使自动驾驶模型尽快完成，因为训练可以使训练完成的自动驾驶模型与用户的驾驶风格更加相符合，从而在后续进行自动驾驶时，获取更好的用户体验。

[0085] 进一步地，本发明自动驾驶模型训练方法中，所述行车环境包括：车辆行驶过程中的自然环境、道路环境，所述自然环境包括温度、降水量、光线强度，所述道路环境包括路况、交通标识。

[0086] 具体地，机动车在行驶时，不同的天气会对车辆的驾驶造成不同的影响，因此需要获取当前的天气信息，来准确判断不同天气下使用怎样的自动驾驶操作。而天气的检测可以通过雨量传感器检测是否处于雨雪天气，通过温度传感器可以检测当前的环境温度是否对车辆行驶有明显影响。除了气候因素外，道路信息也是影响行车环境的总要因素，前方是否有弯道、路面是否有障碍物等信息都会对驾驶操作造成影响，通过交通标识信息则可以获取到相关道路信息与路况信息。

[0087] 机动车在雨雪天气下的行驶方案与晴好天气下的行驶方案是不同的，因为雨雪天气路面湿滑、能见度低，因此需要更加注意行车安全。而环境温度也会对车辆的行驶方案造成影响，低温下可能会出现路面结冰等情况，高温下则容易出现爆胎等情况，因此无论是人工驾驶还是自动驾驶，都需要根据环境中的天气与温度调整行驶方案，而通过传感器可以快速便捷的获取到所需的气候信息。

[0088] 同样的，为了能够对自动驾驶模型进行更加准确的训练，需要对不同的道路情况执行不同的自动驾驶操作进行针对性的训练。而首先需要做的就是获取道路情况，通过车辆的前置摄像头可以拍摄得到车辆前方的路况与交通标识，包括道路前方是否有车辆或者障碍物等道路情况的信息，部分车辆可能会设置有后置摄像头等其他位置的摄像头，则也可获取到相关区域的信息。一般而言，前置摄像头已经足够应对大部分的驾驶情况。除了使用摄像头之外，还可以通过车辆中设置的位置传感器，即感应雷达对车辆周围预设范围内的障碍物进行检测，障碍物也是行车环境中的一个重要的参考因素，车辆周围有障碍物时，则可能需要进行规避等动作，所以驾驶员会根据传感器获取到的道路情况，然后驾驶进行对应的驾驶操作、与此同时自动驾驶模型也会根据目前的道路情况进行选择对应的自动驾驶操作进行自动驾驶模型，用于后续自动驾驶模型的训练。

[0089] 进一步地，步骤S30将所述自动驾驶操作的各驾驶操作选项与所述驾驶操作分别进行比较包括：

[0090] 步骤S31，将所述自动驾驶操作的各驾驶操作选项的参数值与所述驾驶操作的参数值进行比较，得到比较结果，所述比较结果为参数值差值；

[0091] 步骤S32，若所述参数值差值小于预设误差值，则判定所述自动驾驶操作与所述驾驶操作相符合，否则不相符合。

[0092] 具体地，判断自动驾驶操作与驾驶员的驾驶操作是否相符合时，是根据二者的参数值的数值差值大小进行判定的。每个驾驶操作都有参数值，例如直线匀速行驶时，为了能够达到指定的速度并保持匀速，油门踏板需要下压多少距离；左转弯90°需要将方向盘往哪个方向旋转多少度，并且过程需要在多少时间内完成。通过这样参数值的误差是否小于预设误差值，可以判定二者是否相符合。

[0093] 通过检测自动驾驶操作与驾驶员的驾驶操作的参数值的数值差值是否小于预设误差值，能够判定二者是否是相符合的驾驶操作，对于一个驾驶操作，会有多个参数值，需要所有参数值的误差值都小于预设误差值时，才能判定该自动驾驶操作是与用户驾驶风格相符合的。通过计算自动驾驶操作与驾驶员的驾驶操作的参数值误差，可以快速准确的确认二者是否为相符合得到操作。

[0094] 进一步地，步骤S30根据比较结果对各驾驶操作选项进行打分包括：

[0095] 步骤S33，若所述比较结果为所述自动驾驶操作与所述驾驶操作相符合，则对应增加所述自动驾驶操作对应驾驶操作选项的分值；

[0096] 步骤S32，若所述比较结果为所述自动驾驶操作与所述驾驶操作不相符合，则对应减少所述自动驾驶操作对应驾驶操作选项的分值。

[0097] 具体地，通过将自动驾驶操作选项与驾驶员的驾驶操作进行比较，可以得到二者是否是相符合的操作，而自动驾驶模型会通过打分衡量自动驾驶操作信息与用户驾驶风格的相符合程度，分值越高的表明与用户驾驶风格越接近。因此比较得出与用户的驾驶操作选项相符合，则根据相符合程度对应增加自动驾驶操作的分值，不相符合则对应减少分值，使得自动驾驶模型能够根据自动驾驶操作信息的分值判断出该自动驾驶操作信息是否符合用户的驾驶风格。

[0098] 通过自动驾驶操作信息与所述驾驶操作的参数值的差值大小，可以对二者进行快速的比较，判断二者是否相符合。然后根据比较比较结果对自动驾驶操作选项的进行打分。自动驾驶模型在某个行车环境下，会选择对应分数最高的自动驾驶操作选项进行驾驶，例如在气候条件良好的高速路直行的行车环境中，有3个自动驾驶操作选项，以最低限速匀速行驶、以平迅速度匀速行驶和以最高限速运输行驶，其中以平均速度匀速行驶的分值最高，则自动驾驶模型会选择以平均速度匀速行驶。自动驾驶操作信息的分值会根据比较的结果是否与驾驶员的驾驶操作相符合而改变，相符合则分值增加，不相符合则分值减少。在经过一定的训练后，与用户驾驶风格相符合的驾驶操作选项的分值就会明显高于其他驾驶操作，从而可以准确快速的进行与用户驾驶风格相符合的自动驾驶操作选项。

[0099] 进一步地，自动驾驶模型训练方法还包括：

[0100] 步骤S51，当确定所述自动驾驶模型完成训练时，输出开启自动驾驶的提示信息。

[0101] 具体地，自动驾驶模型训练完成后，自动驾驶系统就可以使用训练完成的自动驾驶模型，进行与对应驾驶员的驾驶风格相符合的自动驾驶。因此通过输出提示信息，向用户进行提示。

[0102] 自动驾驶模型训练完成后，自动驾驶系统就可以随时开启，并且通过自动驾驶模型来获取与对应驾驶员相符合的驾驶风格，通过扬声器或显示器将该信息进行输出，用于提醒用户，从而使得用户能够第一时间享受自动驾驶带来的乐趣。

[0103] 此外本发明实施例还提出一种计算机可读存储介质。

[0104] 本发明计算机可读存储介质上存储有自动驾驶模型训练程序，所述自动驾驶模型训练程序被处理器执行时实现如上所述的自动驾驶模型训练方法的步骤。

[0105] 其中，在所述处理器上运行的自动驾驶模型训练程序被执行时所实现的方法可参照本发明自动驾驶模型训练方法各个实施例，在此不再赘述。

[0106] 需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

[0107] 上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

[0108] 通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，机动车，或者网络设备等)执行本发明各个实施例所述的方法。

[0109] 以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

自动驾驶模型训练方法、终端及可读存储介质转让专利

申请号 : CN201810749434.X

文献号 : CN108944944B

文献日 : 2020-04-10

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 刘新 , 宋朝忠 , 刘欣

申请人 : 深圳市易成自动驾驶技术有限公司

摘要 :

权利要求 :

说明书 :