基于OCR的流程快速建模方法、系统、设备及存储介质转让专利

申请号 : CN202210989621.1

文献号 : CN115062876B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李思伟李锦洲池沐霖张旭君申鑫

申请人 : 京华信息科技股份有限公司

摘要 :

本发明涉及一种计算机应用技术,揭露了一种基于OCR的流程快速建模方法、系统、设备及存储介质。本发明对目标审批流程进行多维度的特征采集,并组建申请表集合,其中包括多类申请表;依次确定各类申请表的审批用户,并构建申请表‑审批用户列表;获得申请表审批任务,并确定所述申请表审批任务中目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;构建任务分配模型并分析确定处理所述申请表审批任务的目标审批用户;基于OCR构建表单识别模型,并获得所述目标申请表的识别信息;生成标准目标申请表并发送至所述目标审批用户进行审批。本发明可优化审批流程,同时提高审批效率,进而提高决策频度和工作质量。

权利要求 :

1.一种基于OCR的流程快速建模方法,其特征在于,包括:组建步骤:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;

构建步骤:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表‑审批用户列表;

匹配步骤:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;

确定步骤:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户,包括:提取所述目标审批用户集合中任意一个用户,并采集所述用户的实时任务列表;

根据所述实时任务列表,计算所述用户的实时负载,其中,所述实时负载的计算公式如下:;

其中,所述 是指所述用户,所述 是指所述用户 处理完所述实时任务列表的总时间,即所述实时负载,所述 是指所述实时任务列表中任意一类任务,记作第 类任务 ,所述 是指所述实时任务列表中共有 类任务,所述 是指所述用户 处理完所述实时任务列表中第 类任务 的总时间,所述 是指所述实时任务列表中第 类任务的 总个数,所述 是指所述实时任务列表中第 类任务 中每个任务的处理时间;

将所述申请表审批任务分配至所述用户,结合所述实时负载计算所述用户的预测负载,其中,所述预测负载的计算公式如下:;

其中,所述 是指所述用户 处理所述实时任务列表和所述申请表审批任务的总时间,即所述预测负载,所述 是指所述用户 处理所述申请表审批任务的时间,所述 是指所述申请表审批任务;

基于所述预测负载,在所述目标审批用户集合筛选得到预选目标审批用户集合;

基于所述预选目标审批用户集合,获得所述申请表审批任务的审批工作流,并对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图;

提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合;

基于所述流程任务集合计算所述流程的总时间成本,并根据所述流程的总时间成本确定所述流程的适配度指数;

将所述适配度指数最大作为寻优目标,将所述预选目标审批用户集合作为寻优区域,确定所述目标审批用户;

获得步骤:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;

执行步骤:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。

2.根据权利要求1所述的流程快速建模方法,其特征在于,所述获得步骤包括:构建所述表单识别模型,其中,所述表单识别模型包括预处理层、裁剪层、分割层、识别层;

获得所述目标申请表的图像,并利用所述预处理层对所述图像进行处理,得到预处理图像;

利用所述裁剪层对所述预处理图像进行裁剪,得到内容预处理图像;

利用所述分割层将所述内容预处理图像中的各连续字符依次进行分割,得到多个待识别块;

利用所述识别层依次识别所述多个待识别块的信息,组成目标申请表的识别信息。

3.根据权利要求2所述的流程快速建模方法,其特征在于,所述得到预处理图像,包括:将灰度化单元、二值化单元、降噪单元依次内嵌至所述预处理层;

所述灰度化单元基于最大值法对所述图像进行变换,得到所述图像中各像素点的灰度值,并根据所述各像素点的灰度值得到灰度图;

基于所述各像素点的灰度值,得到所述图像的灰度直方图,并根据所述灰度直方图确定图像最佳阈值;

所述二值化单元基于所述图像最佳阈值对所述灰度图进行二值化处理,得到二值图;

所述降噪单元基于高斯滤波算法原理,对所述二值图进行降噪,得到所述预处理图像。

4.根据权利要求2所述的流程快速建模方法,其特征在于,在所述组成目标申请表的识别信息之后,还包括以下步骤:采集审批流程中的签名数据、印章数据,并组建审批通过数据库;

判断所述目标申请表是否为初始申请表,若所述目标申请表不是初始申请表,提取所述目标申请表的审批意见信息;

对所述审批意见信息进行分析,并将分析结果在所述审批通过数据库中进行遍历,根据遍历结果生成智能审批结果。

5.根据权利要求1所述的流程快速建模方法,其特征在于,所述执行步骤包括:获得所述目标申请表的标准化表单,并提取所述标准化表单的指标类目,组建标准指标类目集;

基于所述识别信息,依次提取所述标准指标类目集中各标准指标类目的识别数据;

将所述识别数据分别填充至所述标准化表单,并人工校验确认后得到所述标准目标申请表。

6.一种基于OCR的流程快速建模系统,所述基于OCR的流程快速建模系统包括存储器和处理器,其特征在于,所述存储器上存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序被所述处理器执行时实现如下步骤:组建步骤:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;

构建步骤:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表‑审批用户列表;

匹配步骤:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;

确定步骤:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户,包括:提取所述目标审批用户集合中任意一个用户,并采集所述用户的实时任务列表;

根据所述实时任务列表,计算所述用户的实时负载,其中,所述实时负载的计算公式如下:;

其中,所述 是指所述用户,所述 是指所述用户 处理完所述实时任务列表的总时间,即所述实时负载,所述 是指所述实时任务列表中任意一类任务,记作第 类任务 ,所述 是指所述实时任务列表中共有 类任务,所述 是指所述用户 处理完所述实时任务列表中第 类任务 的总时间,所述 是指所述实时任务列表中第 类任务 的总个数,所述 是指所述实时任务列表中第类 任务中每个任务 的处理时间;

将所述申请表审批任务分配至所述用户,结合所述实时负载计算所述用户的预测负载,其中,所述预测负载的计算公式如下:;

其中,所述 是指所述用户 处理所述实时任务列表和所述申请表审批任务的总时间,即所述预测负载,所述 是指所述用户 处理所述申请表审批任务的时间,所述 是指所述申请表审批任务;

基于所述预测负载,在所述目标审批用户集合筛选得到预选目标审批用户集合;

基于所述预选目标审批用户集合,获得所述申请表审批任务的审批工作流,并对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图;

提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合;

基于所述流程任务集合计算所述流程的总时间成本,并根据所述流程的总时间成本确定所述流程的适配度指数;

将所述适配度指数最大作为寻优目标,将所述预选目标审批用户集合作为寻优区域,确定所述目标审批用户;

获得步骤:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;

执行步骤:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。

7.一种计算机设备,其特征在于,包括处理器和存储器;

所述处理器,用于处理执行权利要求1‑5中任一项所述的方法;

所述存储器,所述存储器与所述处理器耦合,用于存储程序,当所述程序被所述处理器执行时,使所述处理器以执行权利要求1‑5中任一项所述方法的步骤。

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求1‑5中的任一项所述的基于OCR的流程快速建模方法的步骤。

说明书 :

基于OCR的流程快速建模方法、系统、设备及存储介质

技术领域

[0001] 本发明涉及计算机应用技术领域,特别涉及一种基于OCR的流程快速建模方法、系统、设备及存储介质。

背景技术

[0002] 随着计算机应用技术的快速发展,各行各业均逐渐向智能化方向转换,从而有效提高整体工作效率,进而提高企业在市场中的综合竞争力。现有技术中采用人工方式进行工作业务审批时存在审批不及时导致审批周期过长,审批内容不完善影响审批质量的问题,以及利用耦合程度高、开发效率低的传统审批系统,因多个无用审批层级导致效率低下的问题。审批涉及多个管理部门之间的协同合作,示范性地,油气田生产、销售管理等领域,均涉及生产、销售、财务等多个部门的审批。因此,研究利用计算机技术对审批流程进行快速建模,提高审批流程的智能化程度,对于规范审批流程、提高审批决策处理能力和工作效率等具有重要意义。
[0003] 因此,如何优化审批流程,提高审批效率和审批质量,并为后续决策提供基础成为一个亟待解决的问题。

发明内容

[0004] 本发明的主要目的是提供一种基于OCR的流程快速建模方法、系统、设备及存储介质,旨在提高审批工作效率,进而提高决策频度和工作质量。
[0005] 为实现上述目的,本发明提出一种基于OCR的流程快速建模方法,包括如下步骤:
[0006] 组建步骤:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
[0007] 构建步骤:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表‑审批用户列表;
[0008] 匹配步骤:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;
[0009] 确定步骤:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;
[0010] 获得步骤:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
[0011] 执行步骤:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
[0012] 优选地,所述确定步骤包括:
[0013] 提取所述目标审批用户集合中任意一个用户,并采集所述用户的实时任务列表;
[0014] 根据所述实时任务列表,计算所述用户的实时负载,其中,所述实时负载的计算公式如下:
[0015] ;
[0016] 其中,所述 是指所述用户,所述 是指所述用户 处理完所述实时任务列表的总时间,即所述实时负载,所述 是指所述实时任务列表中任意一类任务,记作第 类任务 ,所述 是指所述实时任务列表中共有 类任务,所述 是指所述用户 处理完所述实时任务列表中第 类任务 的总时间,所述 是指所述实时任务列表中第 类任务 的总个数,所述 是指所述实时任务列表中第 类任务 中每个任务的处理时间;
[0017] 将所述申请表审批任务分配至所述用户,结合所述实时负载计算所述用户的预测负载,其中,所述预测负载的计算公式如下:
[0018] ;
[0019] 其中,所述 是指所述用户 处理所述实时任务列表和所述申请表审批任务的总时间,即所述预测负载,所述 是指所述用户 处理所述申请表审批任务的时间,所述 是指所述申请表审批任务;
[0020] 基于所述用户的预测负载,利用粒子群优化算法确定所述目标审批用户。
[0021] 优选地,在所述利用粒子群优化算法确定所述目标审批用户之前,还包括以下步骤:
[0022] 基于所述预测负载,在所述目标审批用户集合筛选得到预选目标审批用户集合;
[0023] 基于所述预选目标审批用户集合,获得所述申请表审批任务的审批工作流,并对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图;
[0024] 提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合;
[0025] 基于所述流程任务集合计算所述流程的总时间成本,并根据所述流程的总时间成本确定所述流程的适配度指数;
[0026] 将所述适配度指数最大作为寻优目标,将所述预选目标审批用户集合作为寻优区域,确定所述目标审批用户。
[0027] 优选地,所述获得步骤包括:
[0028] 构建所述表单识别模型,其中,所述表单识别模型包括预处理层、裁剪层、分割层、识别层;
[0029] 获得所述目标申请表的图像,并利用所述预处理层对所述图像进行处理,得到预处理图像;
[0030] 利用所述裁剪层对所述预处理图像进行裁剪,得到内容预处理图像;
[0031] 利用所述分割层将所述内容预处理图像中的各连续字符依次进行分割,得到多个待识别块;
[0032] 利用所述识别层依次识别所述多个待识别块的信息,组成目标申请表的识别信息。
[0033] 优选地,所述得到预处理图像,包括:
[0034] 将灰度化单元、二值化单元、降噪单元依次内嵌至所述预处理层;
[0035] 所述灰度化单元基于最大值法对所述图像进行变换,得到所述图像中各像素点的灰度值,并根据所述各像素点的灰度值得到灰度图;
[0036] 基于所述各像素点的灰度值,得到所述图像的灰度直方图,并根据所述灰度直方图确定图像最佳阈值;
[0037] 所述二值化单元基于所述图像最佳阈值对所述灰度图进行二值化处理,得到二值图;
[0038] 所述降噪单元基于高斯滤波算法原理,对所述二值图进行降噪,得到所述预处理图像。
[0039] 优选地,在所述组成目标申请表的识别信息之后,还包括以下步骤:
[0040] 采集审批流程中的签名数据、印章数据,并组建审批通过数据库;
[0041] 判断所述目标申请表是否为初始申请表,若所述目标申请表不是初始申请表,提取所述目标申请表的审批意见信息;
[0042] 对所述审批意见信息进行分析,并将分析结果在所述审批通过数据库中进行遍历,根据遍历结果生成智能审批结果。
[0043] 优选地,所述执行步骤包括:
[0044] 获得所述目标申请表的标准化表单,并提取所述标准化表单的指标类目,组建标准指标类目集;
[0045] 基于所述识别信息,依次提取所述标准指标类目集中各标准指标类目的识别数据;
[0046] 将所述识别数据分别填充至所述标准化表单,并人工校验确认后得到所述标准目标申请表。
[0047] 此外,为实现上述目的,本发明还提出一种基于OCR的流程快速建模系统,所述基于OCR的流程快速建模系统包括存储器和处理器,其特征在于,所述存储器上存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序被所述处理器执行时实现如下步骤:
[0048] 组建步骤:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
[0049] 构建步骤:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表‑审批用户列表;
[0050] 匹配步骤:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;
[0051] 确定步骤:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;
[0052] 获得步骤:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
[0053] 执行步骤:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
[0054] 此外,为实现上述目的,本发明还提出一种计算机设备,其中,包括处理器和存储器;
[0055] 所述处理器,用于处理执行所述的基于OCR的流程快速建模方法;
[0056] 所述存储器,所述存储器与所述处理器耦合,用于存储所述基于OCR的流程快速建模程序,当所述程序被所述处理器执行时,使系统以执行所述基于OCR的流程快速建模方法的步骤。
[0057] 此外,为实现上述目的,本发明还提出一种计算机可读存储介质,其中,所述计算机可读存储介质存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述任一项所述的基于OCR的流程快速建模方法的步骤。
[0058] 本发明对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表‑审批用户列表;获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。相较于现有技术,本发明通过任务分配模型智能化匹配任务处理人员,有效提高任务处理效率、最大化人员价值,实现了优化审批流程的技术目标。通过表单识别模型对待审批表单进行智能化识别分析,降低人员处理任务的工作难度,达到了提高决策频度和工作质量的技术效果。因此,本发明可提高审批工作效率和审批质量。

附图说明

[0059] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
[0060] 图1为本发明基于OCR的流程快速建模方法的流程示意图;
[0061] 图2为本发明基于OCR的流程快速建模方法中确定目标审批用户的流程示意图;
[0062] 图3为本发明基于OCR的流程快速建模方法中组成目标申请表的识别信息的流程示意图;
[0063] 图4为本发明基于OCR的流程快速建模方法中得到预处理图像的流程示意图;
[0064] 图5为本发明基于OCR的流程快速建模方法中得到标准目标申请表的流程示意图;
[0065] 图6为本发明基于OCR的流程快速建模程序第二实施例的运行环境示意图;
[0066] 图7为本发明基于OCR的流程快速建模程序第二实施例的程序模块图。
[0067] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0068] 以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
[0069] 本发明提出一种基于OCR的流程快速建模方法。
[0070] 如图1所示,图1为本发明基于OCR的流程快速建模方法的流程示意图。
[0071] 本实施例中,该方法包括:
[0072] S100:对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
[0073] 所述目标审批流程是指待用所述基于OCR的流程快速建模方法智能化构建标准化审批流程的流程,示范性的如产品销售中的合同审批、出入口审批、发票审批等。通过对所述目标审批流程的审批内容、适用行业和领域、包括的审批类型以及涉及的审批用户等等进行全方位、多维度的特征信息采集,进而基于多特征采集结果,得到所述目标审批流程中包含的所有审批表类型,并组成所述申请表集合。示范性的如产品销售中的合同签订审批、领料出库审批、生产投用审批、产品入库审批、发货审批、回款确认审批等各类审批表。通过对目标审批流程进行针对性特征采集和分析,得到对应的所有申请表类型,为后续针对性建立标准化的申请表提供基础。
[0074] S200:依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表‑审批用户列表;
[0075] 通过多特征采集和分析得到所述目标审批流程中涉及到的所有申请表类型,进一步依次分析各类申请表对应的审批用户,即具有审批各类申请表权限的用户。也就是说,依次确定所述多类申请表中各类申请表的审批用户,并分别组成审批用户集合。其中,所述审批用户集合与各类申请表具有一一对应关系,因此根据所述审批用户集合与所述多类申请表的对应关系构建申请表‑审批用户列表。通过构建申请表‑审批用户列表,达到了为后续优化审批流程,确定各审批任务的最佳处理用户等提供分析筛选范围,进而提高系统可靠性的效果。
[0076] S300:获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;
[0077] 所述申请表审批任务是指待利用所述基于OCR的流程快速建模系统进行审批任务分配、优化审批流程、提高审批智能化程度的审批任务。其中,所述申请表审批任务可以由相关用户新建添加发起,也可以由相关审批用户审批通过后流转至下一审批层级生成。示范性的如某销售经理新建添加一个销售合同,待上级销售主管、部门领导等审批,或者某部门领导审批完成一个出库发货申请表后,该出库发货申请表自动流转至财务部门员工及领导等。进一步的,对所述申请表审批任务进行具体分析,并在所述申请表集合中遍历,从而确定所述申请表审批任务中申请表的类型,即所述目标申请表的类型。进而,结合所述申请表‑审批用户列表匹配得到所述目标申请表的类型的目标审批用户集合。通过遍历、匹配分析确定有权限和责任处理所述申请表审批任务的所有用户人员,并组成目标审批用户集合,为后续确定处理所述申请表审批任务的最佳处理人员提供寻优范围,提高目标审批用户的寻优准确性。
[0078] S400:基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;
[0079] 所述粒子群优化算法用于在所有有权限和责任处理所述申请表审批任务的目标审批用户集合中寻找当前最适合审批处理所述申请表审批任务的用户,通过基于粒子群优化算法构建任务分配模型。其中,所述任务分配模型通过对所述目标审批用户集合中的各个目标审批用户依次进行分析,对其当前的工作情况等进行量化,从而确定当前最适合处理所述申请表审批任务的用户。其中,适合是指有时间处理所述申请表审批任务,同时由其处理可以有效提高整个审批效率,且各用户工作平衡等。最终确定的处理所述申请表审批任务的用户即为所述目标审批用户。通过任务分配模型的智能化计算和分析,实现了优化任务分配,提高审批效率的目标。
[0080] 本实施例中,上述步骤S400包括:
[0081] 第一步:提取所述目标审批用户集合中任意一个用户,并采集所述用户的实时任务列表;
[0082] 第二步:根据所述实时任务列表,计算所述用户的实时负载,其中,所述实时负载的计算公式如下:
[0083] ;
[0084] 其中,所述 是指所述用户,所述 是指所述用户 处理完所述实时任务列表的总时间,即所述实时负载,所述 是指所述实时任务列表中任意一类任务,记作第 类任务 ,所述 是指所述实时任务列表中共有 类任务,所述 是指所述用户 处理完所述实时任务列表中第 类任务 的总时间,所述 是指所述实时任务列表中第 类任务 的总个数,所述 是指所述实时任务列表中第 类任务 中每个任务的处理时间;
[0085] 第三步:将所述申请表审批任务分配至所述用户,结合所述实时负载计算所述用户的预测负载,其中,所述预测负载的计算公式如下:
[0086] ;
[0087] 其中,所述 是指所述用户 处理所述实时任务列表和所述申请表审批任务的总时间,即所述预测负载,所述 是指所述用户 处理所述申请表审批任务的时间,所述 是指所述申请表审批任务;
[0088] 第四步:基于所述用户的预测负载,利用粒子群优化算法确定所述目标审批用户。
[0089] 所述任务分配模型在对所述目标审批用户集合中各个用户进行分析时,首先任意选择所述目标审批用户集合中的一个用户,并查找得到该用户当前待处理的所有审批任务数据,即所述用户的所述实时任务列表。然后对所述实时任务列表中各个任务进行分析,并计算得到所述用户完成所述实时任务列表中所有任务需要花费的时间,并将其定义为所述用户的实时负载。其中,所述实时负载的计算公式如下:
[0090] ;
[0091] 其中,所述 是指所述用户,所述 是指所述用户 处理完所述实时任务列表的总时间,即所述实时负载,所述 是指所述实时任务列表中任意一类任务,记作第 类任务 ,所述 是指所述实时任务列表中共有 类任务,所述 是指所述用户 处理完所述实时任务列表中第 类任务 的总时间,所述 是指所述实时任务列表中第 类任务 的总个数,所述 是指所述实时任务列表中第 类任务 中每个任务的处理时间。也就是说,用户当前处理其所有审批任务需要的时间越长,对应其负载越大。
[0092] 进一步的,假设将所述申请表审批任务分配给该用户,模型进一步智能化分析,并计算得到所述用户分配到所述申请表审批任务后的负载预测,即所述用户的预测负载,其中,所述预测负载的计算公式如下:
[0093] ;
[0094] 其中,所述 是指所述用户 处理所述实时任务列表和所述申请表审批任务的总时间,即所述预测负载,所述 是指所述用户 处理所述申请表审批任务的时间,所述 是指所述申请表审批任务。也就是说,所述用户分配到所述申请表审批任务后的负载为所述用户完成当前实时任务列表中各任务与完成所述申请表审批任务的时间之和。最后对比所述目标审批用户集合中各个目标审批用户的预测负载,筛选预测负载最小的用户作为所述申请表审批任务的处理人,即所述目标审批用户。
[0095] 通过对各个拥有审批权限和审批义务的用户进行分析,确定各个用户当前的审批工作量,并计算得到各个用户的实时负载,实现对各个用户负载的量化和直观化目标,进而对各用户一旦分配到该审批任务后的审批负载进行计算预测,达到了基于直观数据的优化筛选和确认,保证了目标审批用户的分配合理性,并为提高整体审批效率和审批质量提供基础的技术效果。
[0096] 如图2所示,图2为本发明基于OCR的流程快速建模方法中确定目标审批用户的流程示意图。本实施例中,上述确定所述目标审批用户的方法包括:
[0097] 第一步:基于所述预测负载,在所述目标审批用户集合筛选得到预选目标审批用户集合;
[0098] 第二步:基于所述预选目标审批用户集合,获得所述申请表审批任务的审批工作流,并对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图;
[0099] 第三步:提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合;
[0100] 第四步:基于所述流程任务集合计算所述流程的总时间成本,并根据所述流程的总时间成本确定所述流程的适配度指数;
[0101] 第五步:将所述适配度指数最大作为寻优目标,将所述预选目标审批用户集合作为寻优区域,确定所述目标审批用户。
[0102] 根据计算得到的所述目标审批用户集合中各个用户的预测负载数据,筛选分配到所述申请表审批任务后,其任务负载仍处于正常范围,即任务负载不会超过最大负载,出现过饱和情况的用户,将筛选到的符合条件的用户组成所述预选目标审批用户集合。示范性的如相关人员基于公司总审批数量、有审批权限的员工数量、历史人均审核任务负载等综合分析后确定预设负载阈值,从而筛选分配到所述申请表审批任务后,预测负载符合所述预设负载阈值的所有审批用户,作为分配所述申请表审批任务的候选用户,即所述预选目标审批用户集合。
[0103] 进而,分析所述预选目标审批用户集合中,各个用户处理所述申请表审批任务的前后完整审批流程,从而得到所述申请表审批任务的审批工作流,进一步的,对所述审批工作流进行形式化描述转换,得到所述审批工作流的有向无环图。举例如某出库申请表审批任务,可以分配给生产员工、发货员工、生产主管、部门主管等,其中,当该出库申请表审批任务分配给生产员工后,下级审核还包括生产主管、部门主管;当该出库申请表审批任务分配给发货员工后,下级审核同样还包括生产主管、部门主管;当该出库申请表审批任务分配给生产主管后,下级审核仅包括部门主管;当该出库申请表审批任务分配给部门主管后,此次审批完成。
[0104] 再进一步的,依次对所述有向无环图中的各个审批流程进行分析,并计算各个流程审批的时间成本,从而根据审批时间成本计算各个流程的适配度指数,反向匹配适配度指数最高的流程对应的审批用户,将其作为所述申请表审批任务的处理人。具体来说,首先提取所述有向无环图的任意一个流程,并采集所述流程的任务,组成流程任务集合。示范性的如某出库申请表审批任务,可以分配给生产员工、发货员工、生产主管、部门主管等,选取当该出库申请表审批任务分配给生产员工后,下级审核还包括生产主管、部门主管的审批流程,因此该审批流程中包括生产员工审批任务、生产主管审批任务、部门主管审批任务,一共三个流程任务。然后基于所述流程任务集合计算所述流程的总时间成本,其中,总时间成本的计算公式如下:
[0105]   ;
[0106] 其中,所述 是指完成流程任务集合中所有任务的时间,所述 是指审批任务在上下级两层审批之间的流转时间,即任务 和任务 之间的流转时间,且,所述 是指所述流程中所有审批任务的总个数,所述 是指整个流程任务完成需要的总时间。其中,所述 的计算公式如下:
[0107]   ;
[0108] 其中,所述是指完成流程任务集合中所有任务的时间,所述是指流程任务集合中所有审批用户总数量。
[0109] 最后,根据所述流程的总时间成本确定所述流程的适配度指数。其中,适配度指数与所述流程的总时间成本为负相关关系,也就是说,总时间成本越高,对应适配度越低。所述适配度指数的计算公式如下:
[0110]   ;
[0111] 其中,所述 是指有向无环图中第x个审批流程,所述 是指所述第x个审批流程的总时间成本,所述 是指有向无环图中总流程个数。通过计算得到向无环图中各个流程的适配度指数,进而筛选所述适配度指数最大的流程,并确定该流程中的审批用户,并将该审批用户作为所述目标审批用户。
[0112] 通过基于适配度函数计算,确定了审批流转时间成本最低、审批效率最高,且任务分配和审批方案合理的目标审批用户,达到了提高审批任务分配合理性,进而提高系统准确性的技术效果。
[0113] S500:基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
[0114] 所述OCR是指利用扫描仪或图像采集装置等采集申请表图像信息,并基于图像亮、暗情况分析确定图像上的文字信息,从而智能识别审批申请表的技术。通过所述OCR构建得到所述表单识别模型,并利用所述表单识别模型对所述目标申请表进行智能识别,得到识别信息。通过表单识别模型提高了审批申请表的识别效率和识别准确率,缩短了用户审批时阅读申请表的时间,达到了提高系统性能的效果。
[0115] 如图3所示,图3为本发明基于OCR的流程快速建模方法中组成目标申请表的识别信息的流程示意图。本实施例中,上述步骤S500包括:
[0116] 第一步:构建所述表单识别模型,其中,所述表单识别模型包括预处理层、裁剪层、分割层、识别层;
[0117] 第二步:获得所述目标申请表的图像,并利用所述预处理层对所述图像进行处理,得到预处理图像;
[0118] 如图4所示,图4为本发明基于OCR的流程快速建模方法中得到预处理图像的流程示意图。本实施例中,上述得到预处理图像的方法包括:
[0119] 首先:将灰度化单元、二值化单元、降噪单元依次内嵌至所述预处理层;
[0120] 然后:所述灰度化单元基于最大值法对所述图像进行变换,得到所述图像中各像素点的灰度值,并根据所述各像素点的灰度值得到灰度图;
[0121] 接着:基于所述各像素点的灰度值,得到所述图像的灰度直方图,并根据所述灰度直方图确定图像最佳阈值;
[0122] 接着:所述二值化单元基于所述图像最佳阈值对所述灰度图进行二值化处理,得到二值图;
[0123] 最后:所述降噪单元基于高斯滤波算法原理,对所述二值图进行降噪,得到所述预处理图像。
[0124] 第三步:利用所述裁剪层对所述预处理图像进行裁剪,得到内容预处理图像;
[0125] 第四步:利用所述分割层将所述内容预处理图像中的各连续字符依次进行分割,得到多个待识别块;
[0126] 第五步:利用所述识别层依次识别所述多个待识别块的信息,组成目标申请表的识别信息。
[0127] 在利用所述表单识别模型对目标申请表进行智能识别时,首先,通过所述表单识别模型中的预处理层,对相关智能设备采集到的所述目标申请表的图像进行预处理,其中包括通过灰度化单元处理得到所述图像中各像素点的灰度值,并根据所述各像素点的灰度值得到灰度图,接着通过所述二值化单元对灰度化单元处理得到的灰度图进行黑白处理得到二值图,再接着利用降噪单元,对二值化单元处理得到的二值图进行智能降噪。其中,基于所述各像素点的灰度值,得到所述图像的灰度直方图,并根据所述灰度直方图确定图像最佳阈值,所述二值化单元基于所述图像最佳阈值对所述灰度图进行二值化处理,得到二值图。然后,利用所述裁剪层对所述预处理图像进行裁剪,将空白边缘等进行剪除,从而降低系统处理空白部分的内存消耗和计算浪费,同时也为后续识别文字内容等提供基础,并有效降低识别错误率。进一步的,对裁剪得到的内容预处理图像进行分割,将连续的文字片段裁剪为一块,从而得到有字符信息的多个待识别块。最后,利用所述识别层依次识别所述多个待识别块的信息,组成目标申请表的识别信息。
[0128] 通过表单识别模型中各智能层的协作处理,实现对目标申请表中内容的智能识别,降低了人工识别手写文字等的困难,有效提高了申请表内容识别效率和识别准确率,达到了基于OCR的快速识别效果。
[0129] 本实施例中,上述在所述组成目标申请表的识别信息之后,还包括以下步骤:
[0130] 首先,采集审批流程中的签名数据、印章数据,并组建审批通过数据库;
[0131] 然后,判断所述目标申请表是否为初始申请表,若所述目标申请表不是初始申请表,提取所述目标申请表的审批意见信息;
[0132] 最后,对所述审批意见信息进行分析,并将分析结果在所述审批通过数据库中进行遍历,根据遍历结果生成智能审批结果。
[0133] 在利用表单识别模型对目标申请表中的文字内容进行智能识别,并得到对应识别信息后,系统对所述目标申请表的发起信息进行采集,判断所述目标申请表是否为初始申请表,也就是说,判断所述初始申请表是否为用户新建立添加的申请表。其中,当所述目标申请表不是初始申请表,即不是新建立添加的审批申请表时,系统自动提取所述目标申请表的审批意见信息,并对所述审批意见信息进行分析,得到审批意见分析结果。在此之前,首先对目标审批流程中涉及到的审批意见数据进行采集,并构建审批通过数据库。其中,所述审批通过数据库包括签名通过审批、盖章通过审批。进一步,将分析得到的所述审批意见分析结果在所述审批通过数据库中进行遍历,当遍历得到相同的审批意见分析结果时,说明该目标申请表已经通过了上级审批,同时也说明所述目标申请表不是新建立添加的申请表,而是经由其他审批用户审批通过,自动流转得到的审批任务。
[0134] 通过对目标申请表进行来源分析,对新建立添加的申请审批直接进行审批处理,而对审批流程中,其他层级审批通过后流转的审批任务进行上一轮审批通过检验,从而智能化得到当前申请表的审批结果,为用户审批提供参考。
[0135] S600:根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
[0136] 如图5所示,图5为本发明基于OCR的流程快速建模方法中得到标准目标申请表的流程示意图。本实施例中,上述步骤S600包括:
[0137] 首先,获得所述目标申请表的标准化表单,并提取所述标准化表单的指标类目,组建标准指标类目集;
[0138] 然后,基于所述识别信息,依次提取所述标准指标类目集中各标准指标类目的识别数据;
[0139] 最后,将所述识别数据分别填充至所述标准化表单,并人工校验确认后得到所述标准目标申请表。
[0140] 在智能化生成所述目标申请表的标准目标申请表之前,首先分析所述目标申请表的表单类型,并个性化分析确定该类型表单的审批指标和审批类目,即组建标准指标类目集。然后基于所述标准指标类目集,依次对识别信息进行对应提取,得到所述标准指标类目集中各标准指标类目的识别数据。最后,将所述识别数据分别填充至所述标准化表单,并人工校验确认后得到所述标准目标申请表。示范性的如某销售合同审批表中,销售甲方客户名称、销售乙方名称、销售产品名称及规格、销售数量、销售单价、交货时间及方式等,均为销售类合同审批的标准审批指标类目。通过智能化识别各标准指标类目的数据信息,并对应填充至标准化表单,从而实现了智能化生成标准目标申请表的技术目标,同时通过人工校验可以有效提高标准目标申请表的生成准确率,保证审批质量。
[0141] 本发明对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表‑审批用户列表;获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。相较于现有技术,本发明通过任务分配模型智能化匹配任务处理人员,有效提高任务处理效率、最大化人员价值,实现了优化审批流程的技术目标。通过表单识别模型对待审批表单进行智能化识别分析,降低人员处理任务的工作难度,达到了提高决策频度和工作质量的技术效果。因此,本发明可提高审批工作效率和审批质量。
[0142] 本发明提出一种基于OCR的流程快速建模系统。
[0143] 请参阅图6,是本发明基于OCR的流程快速建模程序10第二实施例的运行环境示意图。
[0144] 在本实施例中,基于OCR的流程快速建模程序10安装并运行于电子装置1中。电子装置1可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该电子装置1可包括,但不仅限于,存储器11、处理器12及显示器13。图6仅示出了具有组件11‑13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
[0145] 存储器11在一些实施例中可以是电子装置1的内部存储单元,例如该电子装置1的硬盘或内存。存储器11在另一些实施例中也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括电子装置1的内部存储单元也包括外部存储设备。存储器11用于存储安装于电子装置1的应用软件及各类数据,例如批量注册行为的识别程序10的程序代码等。存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
[0146] 处理器12在一些实施例中可以是一中央处理器(Central Processing Unit, CPU),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行批量注册行为的识别程序10等。
[0147] 显示器13在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light‑Emitting Diode,有机发光二极管)触摸器等。显示器13用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。电子装置1的部件11‑13通过程序总线相互通信。
[0148] 请参阅图7,是本发明基于OCR的流程快速建模10第二实施例的程序模块图。
[0149] 在本实施例中,基于OCR的流程快速建模程序10可以被分割成一个或多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行,以完成本发明。例如,在图7中,基于OCR的流程快速建模程序10可以被分割成组建模块101、构建模块102、匹配模块103、确定模块104、获得模块105、执行模块106。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述基于OCR的流程快速建模程序10在电子装置1中的执行过程,其中:
[0150] 组建模块101:用于对目标审批流程进行多维度的特征采集,并根据特征采集结果组建申请表集合,其中,所述申请表集合包括多类申请表;
[0151] 构建模块102:用于依次确定所述多类申请表中各类申请表的审批用户,分别组成审批用户集合,并根据所述审批用户集合与所述多类申请表的对应关系构建申请表‑审批用户列表;
[0152] 匹配模块103:用于获得申请表审批任务,并分析确定所述申请表审批任务中目标申请表的类型,根据所述目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;
[0153] 确定模块104:用于基于粒子群优化算法构建任务分配模型,并通过所述任务分配模型对所述目标审批用户集合进行分析,确定处理所述申请表审批任务的目标审批用户;
[0154] 获得模块105:用于基于OCR构建表单识别模型,并通过所述表单识别模型获得所述目标申请表的识别信息;
[0155] 执行模块106:用于根据所述目标申请表的识别信息,生成标准目标申请表,并将所述标准目标申请表发送至所述目标审批用户进行审批。
[0156] 本发明还提供一种计算机设备,其中,包括处理器和存储器;
[0157] 该处理器,用于处理执行上述实施例一中任一项所述基于OCR的流程快速建模方法的步骤;
[0158] 该存储器,该存储器与该处理器耦合,用于存储程序,当基于OCR的流程快速建模程序被该处理器执行时,使系统以执行上述任一项基于OCR的流程快速建模方法的步骤。
[0159] 进一步,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有基于OCR的流程快速建模程序,所述基于OCR的流程快速建模程序可被至少一个处理器执行,以使所述至少一个处理器执行上述任一实施例中的基于OCR的流程快速建模方法。
[0160] 以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。