
基本信息:
- 专利标题: 基于大模型的目标序列生成方法、装置、设备、介质和产品
- 申请号:CN202411855816.2 申请日:2024-12-16
- 公开(公告)号:CN119849553A 公开(公告)日:2025-04-18
- 发明人: 周景博 , 黄德强 , 路新江 , 徐童
- 申请人: 百度在线网络技术(北京)有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦
- 专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦
- 代理机构: 北京鸿德海业知识产权代理有限公司
- 代理人: 岳凤羽
- 主分类号: G06N3/0455
- IPC分类号: G06N3/0455 ; G06N20/00 ; G06N3/047 ; G06F16/29 ; G06F40/166
摘要:
本公开提供了一种基于大模型的目标序列生成方法、装置、设备、介质和产品,涉及人工智能技术领域,具体为大模型、自然语言处理、深度学习等技术领域。基于大模型的目标序列生成方法包括:基于大模型获得的候选序列元素的预测概率,确定所述候选序列元素对应的候选路径的质量分数;基于所述质量分数对所述候选路径进行剪枝,以获得剪枝后路径;基于所述预测概率确定目标搜索宽度,以及,基于所述目标搜索宽度,在所述剪枝后路径对应的候选序列元素中,确定目标序列元素;基于所述目标序列元素生成目标序列。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06N | 基于特定计算模型的计算机系统 |
------G06N3/00 | 基于生物学模型的计算机系统 |
--------G06N3/02 | .采用神经网络模型 |
----------G06N3/04 | ..体系结构,例如,互连拓扑 |
------------G06N3/044 | ...循环网络,例如:Hopfield网络 |
--------------G06N3/0455 | ....自动编码器网络;编码器-解码器网络 |