
基本信息:
- 专利标题: 深度学习与图文大模型相结合的图诊方法、系统、介质及设备
- 申请号:CN202411582997.6 申请日:2024-11-07
- 公开(公告)号:CN119477855A 公开(公告)日:2025-02-18
- 发明人: 罗静 , 周铭坤 , 刘阳 , 李懿祖
- 申请人: 通号通信信息集团有限公司
- 申请人地址: 北京市丰台区汽车博物馆南路1号院
- 专利权人: 通号通信信息集团有限公司
- 当前专利权人: 通号通信信息集团有限公司
- 当前专利权人地址: 北京市丰台区汽车博物馆南路1号院
- 代理机构: 北京纪凯知识产权代理有限公司
- 代理人: 孙楠
- 主分类号: G06T7/00
- IPC分类号: G06T7/00 ; G06V10/764 ; G06V10/774 ; G06V10/82 ; G06N3/08 ; G06N3/098 ; G06N5/022 ; G06N5/04 ; G06N5/045
摘要:
本发明涉及计算机领域,公开了一种深度学习与图文大模型相结合的图诊方法、系统、介质及设备,其包括:通过对图诊任务描述与故障定义,构建基于解耦建模的图诊数据并训练相应的图诊算法,对图像进行初步图诊;将初步图诊结果输入通用图文大模型中生成回复,通过人工核验、数据清洗与增强,构建图诊指令数据集;于图诊指令数据集进行视觉指令微调,得到强化图诊情境和IQA方面能力的调优图文大模型,调优图文大模模型根据场景条件对初步图诊结果进行校正;基于校正后的图诊结果进行告警逻辑处理,对是否告警进行判决,并将告警信号传输至操作员。本发明提升了对依赖高层语义的干扰类别的识别效果,增强了图诊分析的可交互性和可解释性。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06T | 一般的图像数据处理或产生 |
------G06T7/00 | 图像分析,例如从位像到非位像 |