一种基于同态加密及分类优化的财务审计方法和系统转让专利

申请号 : CN202310487853.1

文献号 : CN116245669B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陶琎

申请人 : 南京青春信息科技有限公司

摘要 :

本发明提供了一种基于同态加密及分类优化的财务审计方法,客户端接收用户上传的财务文书和交易流水表单,其中,财务文书包括待审计文书和审计规定;采用文本识别模型对待审计文书和交易流水表单进行识别,分别得到审计事实和交易流水数据;对于审计事实和审计规定,采用文本问题分类模型进行语义识别,得到文本问题分类;对于交易流水数据,通过客户端对数据进行加密,上传至服务器,由服务器执行计算后,将数据发送至第三方审计系统,第三方审计系统判断是否交易收支平衡,并将结果返回至服务器。

权利要求 :

1.一种基于同态加密及分类优化的财务审计方法,其特征在于:客户端接收用户上传的财务文书和交易流水表单,其中,财务文书包括待审计文书和审计规定;采用文本识别模型对待审计文书和交易流水表单进行识别,其中,文本识别模型包括针对财务审计的语义词典,文本识别模型根据语义词典对待审计文书和交易流水表单进行识别,分别得到审计事实和交易流水数据;交易流水数据中包括输入输出交易以及相应的金额;

对审计事实和审计规定,采用文本问题分类模型进行检测,得到文本问题分类;其中,文本问题分类模型依次包括输入层,隐含层和输出层;输入层分别对审计事实和审计规定采用bert模型提取词向量,隐含层中将所述词向量输入Bi‑GRU模型提取特征向量,输出层中,将审计事实和审计规定得到的特征向量进行融合,将融合后的特征向量采用BiLSTM模型进行文本问题分类,得到分类结果;

对于交易流水数据,通过以下步骤进行审计:

步骤1:客户端向服务器发起认证请求,该认证请求用于建立与服务器的连接;步骤2:建立连接后,服务器向客户端发送密钥,客户端采用密钥对交易流水信息进行加密,并上传至服务器;

步骤3:第三方审计系统对服务器中加密后的交易流水数据进行审计,得到审计结果;

具体包括如下步骤:

步骤2.1:定义参数S,E,随机选取私钥sk←[0,S],公钥pk= ,其中,q为设定的素数,gq为阶数为q的有限循环群G的生成元;输出密钥对(pk,sk),对于输入金额为Min,i的第i笔交易和输出金额为Mout,j的第j笔交易,随机生成rin,i←[0,E],rout,j←[0,E],对信息进行加密后得到 = ; ; = ; ;将( , )和( , )上传至服务器,其中,f为G的阶数为q的唯一循环群的生成元;

步骤2.2:服务器端,对于总输入金额为Min的n笔交易输入和总输出金额为Mout的n′笔交易输出,对于第i笔输入交易和第j笔输出交易,计算Cin=( );Cout=( );

随机生成rs←[0,E],计算R= , ;计算 =H(R,,Cout,Cin),其中,H为哈希函数,随机生成rt←[0,E],计算zt=rt+ xt;其中,xt= ‑ ;将( ,zt),( ,)和( , )发送给第三方审计系统;

步骤3.1:第三方审计系统接收到数据后,计算:

R’= ; = ;

当且仅当 =H(R’, ,Cout,Cin)时,交易收支平衡,审计结果通过,输出1,否则不通过,输出0;

步骤3.2:第三方审计系统将审计结果返回服务器,由服务器将结果返回至客户端。

2.根据权利要求1所述的财务审计方法,其特征在于:客户端收集财务文书的文本问题结果反馈,根据用户反馈的结果,对文本问题分类中的数据进行标记,在空闲时,将标记的数据作为训练样本,对本地局部文本问题分类模型进行重新训练,将训练后的局部文本问题分类模型参数反馈至服务器,服务器定期根据多个客户端返回的参数,与其他客户端更新的局部模型参数聚合到全局文本问题分类模型中,将更新后的文本问题分类模型参数返回至客户端。

3.根据权利要求2所述的财务审计方法,其特征在于:在每次迭代训练时,针对文本问题分类模型的隐含层随机生成掩码,由此生成本地局部文本问题分类模型,并且采用随机梯度下降法对模型参数进行优化;对于第t次迭代,对于损失函数Loss,给定固定的学习率η,模型参数θ迭代更新公式为:θt+1←θt−η∇Loss。

4.根据权利要求3所述的财务审计方法,其特征在于:模型训练过程中,采用如下损失函数判断是否停止迭代:Loss= ;其中,A表示训练样本数,D为分类数量;Yt第t次训练第d个样本属于分类a的预测的后验概率,X为第d个样本属于分类a的真实后验概率。

5.一种服务器,其特征在于:包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,服务器与客户端和第三方审计系统进行通信,以实现如权利要求1‑4任意一项所述的财务审计方法。

6.一种客户端,其特征在于:包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,客户端与服务器进行通信,以实现如权利要求1‑4任意一项所述的财务审计方法。

7.一种第三方审计系统,其特征在于:包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述第三方审计系统与服务器进行通信,以实现如权利要求1‑4任意一项所述的财务审计方法。

8.一种基于同态加密及分类优化的财务审计系统,其特征在于:包括客户端,服务器和第三方审计系统,所述客户端,服务器和第三方审计系统进行通信,实现如权利要求1‑4任意一项所述的方法。

9.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求

1‑4任意一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1‑4任意一项所述的方法。

说明书 :

一种基于同态加密及分类优化的财务审计方法和系统

技术领域

[0001] 本发明属于财务审计领域,具体涉及一种基于同态加密及分类优化的财务审计方法和系统。

背景技术

[0002] 财务审计是审计机构按照一定的标准,对企业的资产,交易进行监督的一种机制,可以包括文书审计和与财务相关的交易流水审计。
[0003] 随着互联网的发展,第三方审计机构可以通过服务器对企业上传的数据进行审计。然而,这种情况下,需要企业上传内部数据,这容易导致企业敏感信息泄露,造成安全隐患。因此,通常的做法,是对企业数据进行加密后,上传至服务器。然而,与之而来的,第三方审计机构需要下载加密数据,解密后进行审计的计算,对此,仍不能完全保证企业敏感信息的安全性。并且,由于审计的数据量比较大,第三方审计机构在本地进行解密和数据计算时,对硬件设备要求较高。
[0004] 对于文书审计,一般需要人工进行审查,针对文书中涉及到的审计事实,结合审计规定,给出问题分类,然而这样耗费人力和时间,并且,即使采用了智能语义模型进行识别,由于文本量大,对硬件设备要求较高。

发明内容

[0005] 本发明的目的在于解决上述现有技术中存在的难题,提供一种基于同态加密及分类优化的财务审计方法和系统。
[0006] 本发明是通过以下技术方案实现的:
[0007] 客户端接收用户上传的财务文书和交易流水表单,其中,财务文书包括待审计文书和审计规定;采用文本识别模型对待审计文书和交易流水表单进行识别,其中,文本识别模型包括针对财务审计的语义词典,文本识别模型根据语义词典对待审计文书和交易流水表单进行识别,分别得到审计事实和交易流水数据;交易流水数据中包括输入输出交易以及相应的金额。
[0008] 对审计事实和审计规定,采用文本问题分类模型,得到文本问题分类;其中,文本问题分类模型包括输入层,隐含层和输出层;输入层分别对审计事实和审计规定采用bert模型提取词向量,隐含层中将所述词向量输入Bi‑GRU模型提取特征向量,输出层中,将审计事实和审计规定得到的特征向量进行融合,将融合后的特征向量采用BiLSTM模型进行文本问题分类,得到分类结果。
[0009] 对于交易流水数据,通过以下步骤进行审计:
[0010] 步骤1:客户端向服务器发起认证请求,该认证请求用于建立与服务器的连接;
[0011] 步骤2:建立连接后,服务器向客户端发送密钥,客户端采用密钥对交易流水信息进行加密,并上传至服务器;
[0012] 步骤3:第三方审计系统对服务器中加密后的交易流水数据进行审计,得到审计结果。
[0013] 具体过程包括如下步骤:
[0014] 步骤2.1:定义参数S,E,随机选取私钥sk←[0,S],公钥pk= ,其中,q为设定的素数,gq为阶数为q的有限循环群G的生成元;输出密钥对(pk,sk),对于输入金额为Min,i的第i笔交易和输出金额为Mout,j的第j笔交易,随机生成rin,i←[0,E],rout,j←[0,E],对信息进行加密后得到 = ; ; = ; ;将(, )和( , )上传至服务器,其中,f为G的阶数为q的唯一循环群的生成元;
[0015] 步骤2.2:服务器端,对于总输入金额为Min的n笔交易输入和总输出金额为Mout的n′笔交易输出,对于第i笔输入交易和第j笔输出交易,
[0016] 计算Cin=( );Cout=( );
[0017] 随机生成rs←[0,E],计算R= , ;计算 =H(R,,Cout,Cin),其中,H为哈希函数,随机生成rt←[0,E],计算zt=rt+ xt;其中,xt= ‑ ;将( ,zt),(
, )和( , )发送至第三方审计系统;
[0018] 步骤3.1:第三方审计系统接收到数据后,计算:
[0019] R’= ; = ;
[0020] 当且仅当 =H(R’, ,Cout,Cin)时,交易收支平衡,审计结果通过,输出1,否则不通过,输出0;
[0021] 步骤3.2:第三方审计系统将审计结果返回服务器,由服务器将结果返回至客户端。
[0022] 客户端收集财务文书的文本问题分类结果反馈,根据用户反馈的结果,对文本问题分类中的数据进行标记,在空闲时,将标记的数据作为样本,对本地局部文本问题分类模型进行重新训练,将训练后的局部文本问题分类模型参数反馈至服务器,服务器定期根据多个客户端返回的参数,与其他客户端更新的局部模型参数聚合到全局文本问题分类模型中,将更新后的文本问题分类模型参数返回至客户端。
[0023] 其中,在每次迭代训练时,针对文本问题分类模型的隐含层随机生成掩码,由此生成本地局部文本问题分类模型,并且采用随机梯度下降法对模型参数进行优化;对于第t次迭代,对于损失函数Loss,给定固定的学习率η,模型参数θ迭代更新公式为:θt+1←θt−η∇Loss。模型训练过程中 ,采用如下损失函数判断是否停止迭代:Loss=;其中,A表示训练样本数,D为分类数量;Yt第t次训练第d个
样本属于分类a的预测的后验概率,X为第d个样本属于分类a的真实后验概率。
[0024] 本发明还涉及一种基于同态加密及分类优化的财务审计系统,包括客户端,服务器和第三方审计系统,所述客户端,服务器和第三方审计系统进行通信,以现上述的方法。
[0025] 本发明还涉及一种计算机设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现上述方法。
[0026] 本发明还涉及一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述方法。
[0027] 与现有技术相比,本发明的有益效果是:为了不把用户敏感信息泄露给云服务商或者第三方,数据存储到服务器前对数据进行同态加密处理,针对服务器存储的数据,大量的加密运算在服务器端进行,第三方审计机构只需要验证极少的值,就可以完成交易数据的审计,节约了审计机构的运行成本,实现高效、高速审计,并且确保了企业敏感数据的安全性。
[0028] 另外,本发明可以对待审查文书进行自动识别,减少了人工成本。首先采用文本模型从待审查文书中提取审计事实,剔除了文书中无用的信息,降低了后续文本问题分类模型需要处理的数据量。并且,由于文本问题分类模型运行于客户端,需要定期更新模型,本发明采用联邦学习及时更新模型,实现了分类持续优化,通过随机梯度下降算法,提高了本地模型的迭代更新速度,减少了计算量,降低了运行成本。
[0029] 本发明提供的方法和系统中,既可以对财务文书进行智能审查,又可以使得审查机构对交易数据进行审查,实现了全自动,全面的财务审查。

附图说明

[0030] 图1:本申请中的财务审计方法流程图。
[0031] 图2:文本问题分类模型结构示意图。

具体实施方式

[0032] 下面结合附图对本发明作进一步详细描述:
[0033] 本申请中,客户端接收用户上传的财务文书和交易流水表单,其中,财务文书包括待审计文书和审计规定;采用文本识别模型对待审计文书和交易流水表单进行识别,其中,文本识别模型包括针对财务审计的语义词典,文本识别模型根据语义词典对待审计文书和交易流水表单进行识别,分别得到审计事实和交易流水数据;交易流水数据中包括输入输出交易以及相应的金额。
[0034] 对审计事实和审计规定,采用文本问题分类模型中,得到文本问题分类。图2为本发明文本问题分类模型结构示意图,文本问题分类模型包括输入层,隐含层和输出层;输入层分别对审计事实和审计规定采用bert模型提取词向量,隐含层中将所述词向量输入Bi‑GRU模型提取特征向量,输出层中,将审计事实和审计规定得到的特征向量进行融合,将融合后的特征向量采用BiLSTM模型进行文本问题分类,得到分类结果。
[0035] 对于交易流水数据,通过以下步骤进行审计:
[0036] 步骤1:客户端向服务器发起认证请求,该认证请求用于建立与服务器的连接;步骤2:建立连接后,服务器向客户端发送密钥,客户端采用密钥对交易流水信息进行加密,并上传至服务器;
[0037] 步骤3:第三方审计系统对服务器中加密后的交易流水数据进行审计,得到审计结果。
[0038] 具体审计过程包括如下步骤:
[0039] 步骤2.1:定义参数S,E,随机选取私钥sk←[0,S],公钥pk= ,其中,q为设定的素数,gq为阶数为q的有限循环群G的生成元;输出密钥对(pk,sk),对于输入金额为Min,i的第i笔交易和输出金额为Mout,j的第j笔交易,随机生成rin,i←[0,E],rout,j←[0,E],对信息进行加密后得到 = ; ; = ; ;将(, )和( , )上传至服务器,其中,f为G的阶数为q的唯一循环群的生成元;
[0040] 步骤2.2:服务器端,对于总输入金额为Min的n笔交易输入和总输出金额为Mout的n′笔交易输出,对于第i笔输入交易和第j笔输出交易,
[0041] 计算Cin=( );Cout=( );
[0042] 随机生成rs←[0,E],计算R= , ;计算 =H(R,,Cout,Cin),其中,H为哈希函数,随机生成rt←[0,E],计算zt=rt+ xt;其中,xt= ‑ ;将( ,zt),(
, )和( , )发送给第三方审计系统;
[0043] 步骤3.1:第三方审计系统接收到数据后,计算:
[0044] R’= ; = ;其中( ,)和( , )为加密后的密文;
[0045] 当且仅当 =H(R’, ,Cout,Cin)时,交易收支平衡,审计结果通过,输出1,否则不通过,输出0;
[0046] 步骤3.2:第三方审计系统将审计结果返回服务器,由服务器将结果返回至客户端。
[0047] 图1为本申请财务审计方法流程图,从图中可以看出,第三方审计机构并不直接获得客户端中的审计数据,因此,保证了企业敏感数据的信息安全,并且服务器中的数据为加密后的数据,云服务商也无法直接获得企业数据。
[0048] 客户端收集财务文书的文本问题分类结果反馈,即由用户判断分类结果是否准确,根据用户反馈的结果,相当于对相应的文本问题分类进行了重新标记,因此,在空闲时,基于收集到的进行了重新标记的数据,将其作为训练样本,对本地局部文本问题分类模型进行重新训练,将训练后的局部文本问题分类模型参数反馈至服务器,服务器定期根据多个客户端返回的参数,与其他客户端更新的局部模型参数聚合到全局文本问题分类模型中,将更新后的文本问题分类模型参数返回至客户端。
[0049] 在每次迭代训练时,针对本地文本问题分类模型的隐含层随机生成掩码,,由此生成本地局部文本问题分类模型,并且采用随机梯度下降法对模型参数进行优化。对于第t次迭代,对于损失函数Loss,给定固定的学习率η,模型参数θ迭代更新公式为:θt+1←θt−η∇Loss。模型训练过程中 ,采用如下损失函数判断是否停止迭代:Loss=;其中,A表示训练样本数,D为分类数量;Yt第t次训练第d个
样本属于分类a的预测的后验概率,X为第d个样本属于分类a的真实后验概率。
[0050] 在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0051] 在本发明的描述中,除非另有说明,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0052] 最后应说明的是,上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。