
基本信息:
- 专利标题: 信息处理方法、模型的训练方法、装置、设备及介质
- 申请号:CN202311842624.3 申请日:2023-12-28
- 公开(公告)号:CN117808043B 公开(公告)日:2025-04-22
- 发明人: 朱坤鸿 , 叶超 , 崔自鑫 , 梁智豪 , 林坤海 , 国智 , 李双龙 , 贺登武 , 刘林
- 申请人: 百度在线网络技术(北京)有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦三层
- 专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦三层
- 代理机构: 中科专利商标代理有限责任公司
- 代理人: 杨静
- 主分类号: G06N3/0455
- IPC分类号: G06N3/0455 ; G06N3/08
摘要:
本公开提供了信息处理方法、深度学习模型的训练方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及大模型、大语言模型、Transformer、对话式模型、生成式模型等技术领域。具体实现方案为:利用结果生成模型处理输入信息,得到中间特征和用于响应输入信息的初始输出结果,结果生成模型中集成有目标功能插件,目标功能插件用于评估初始输出结果;利用目标功能插件处理中间特征,得到用于评估初始输出结果的评估结果;以及根据评估结果对初始输出结果进行调整,得到目标输出结果。
公开/授权文献:
- CN117808043A 信息处理方法、模型的训练方法、装置、设备及介质 公开/授权日:2024-04-02
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06N | 基于特定计算模型的计算机系统 |
------G06N3/00 | 基于生物学模型的计算机系统 |
--------G06N3/02 | .采用神经网络模型 |
----------G06N3/04 | ..体系结构,例如,互连拓扑 |
------------G06N3/044 | ...循环网络,例如:Hopfield网络 |
--------------G06N3/0455 | ....自动编码器网络;编码器-解码器网络 |