一种基于同态加密及分类优化的财务审计方法和系统转让专利

申请号 : CN202310487853.1

文献号 : CN116245669B

文献日 : 2023-08-25

本发明提供了一种基于同态加密及分类优化的财务审计方法，客户端接收用户上传的财务文书和交易流水表单，其中，财务文书包括待审计文书和审计规定；采用文本识别模型对待审计文书和交易流水表单进行识别，分别得到审计事实和交易流水数据；对于审计事实和审计规定，采用文本问题分类模型进行语义识别，得到文本问题分类；对于交易流水数据，通过客户端对数据进行加密，上传至服务器，由服务器执行计算后，将数据发送至第三方审计系统，第三方审计系统判断是否交易收支平衡，并将结果返回至服务器。

1.一种基于同态加密及分类优化的财务审计方法，其特征在于：客户端接收用户上传的财务文书和交易流水表单，其中，财务文书包括待审计文书和审计规定；采用文本识别模型对待审计文书和交易流水表单进行识别，其中，文本识别模型包括针对财务审计的语义词典，文本识别模型根据语义词典对待审计文书和交易流水表单进行识别，分别得到审计事实和交易流水数据；交易流水数据中包括输入输出交易以及相应的金额；

对审计事实和审计规定，采用文本问题分类模型进行检测，得到文本问题分类；其中，文本问题分类模型依次包括输入层，隐含层和输出层；输入层分别对审计事实和审计规定采用bert模型提取词向量，隐含层中将所述词向量输入Bi‑GRU模型提取特征向量，输出层中，将审计事实和审计规定得到的特征向量进行融合，将融合后的特征向量采用BiLSTM模型进行文本问题分类，得到分类结果；

对于交易流水数据，通过以下步骤进行审计：

步骤1：客户端向服务器发起认证请求，该认证请求用于建立与服务器的连接；步骤2：建立连接后，服务器向客户端发送密钥，客户端采用密钥对交易流水信息进行加密，并上传至服务器；

步骤3：第三方审计系统对服务器中加密后的交易流水数据进行审计，得到审计结果；

具体包括如下步骤：

步骤2.1：定义参数S，E，随机选取私钥sk←[0,S]，公钥pk= ，其中，q为设定的素数，gq为阶数为q的有限循环群G的生成元；输出密钥对（pk，sk），对于输入金额为Min，i的第i笔交易和输出金额为Mout，j的第j笔交易，随机生成rin，i←[0,E]，rout，j←[0，E]，对信息进行加密后得到 = ；； = ； ;将（，）和（，）上传至服务器，其中，f为G的阶数为q的唯一循环群的生成元；

步骤2.2：服务器端，对于总输入金额为Min的n笔交易输入和总输出金额为Mout的ｎ′笔交易输出，对于第i笔输入交易和第j笔输出交易，计算Cin=（）；Cout=（）；

随机生成rs←[0,E]，计算R= , ;计算 =H（R，，Cout，Cin），其中，H为哈希函数，随机生成rt←[0，E]，计算zt=rt+ xt；其中，xt= ‑ ；将（，zt），（，）和（，）发送给第三方审计系统；

步骤3.1：第三方审计系统接收到数据后，计算：

R’= ; = ；

当且仅当 =H（R’，，Cout，Cin）时,交易收支平衡，审计结果通过，输出1，否则不通过，输出0；

步骤3.2：第三方审计系统将审计结果返回服务器，由服务器将结果返回至客户端。

2.根据权利要求1所述的财务审计方法，其特征在于：客户端收集财务文书的文本问题结果反馈，根据用户反馈的结果，对文本问题分类中的数据进行标记，在空闲时，将标记的数据作为训练样本，对本地局部文本问题分类模型进行重新训练，将训练后的局部文本问题分类模型参数反馈至服务器，服务器定期根据多个客户端返回的参数，与其他客户端更新的局部模型参数聚合到全局文本问题分类模型中，将更新后的文本问题分类模型参数返回至客户端。

3.根据权利要求2所述的财务审计方法，其特征在于：在每次迭代训练时，针对文本问题分类模型的隐含层随机生成掩码，由此生成本地局部文本问题分类模型，并且采用随机梯度下降法对模型参数进行优化；对于第t次迭代，对于损失函数Loss，给定固定的学习率η，模型参数θ迭代更新公式为：θt+1←θt−η∇Loss。

4.根据权利要求3所述的财务审计方法，其特征在于：模型训练过程中，采用如下损失函数判断是否停止迭代：Loss= ；其中，A表示训练样本数，D为分类数量；Yt第t次训练第d个样本属于分类a的预测的后验概率，X为第d个样本属于分类a的真实后验概率。

5.一种服务器，其特征在于：包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，服务器与客户端和第三方审计系统进行通信，以实现如权利要求1‑4任意一项所述的财务审计方法。

6.一种客户端，其特征在于：包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，客户端与服务器进行通信，以实现如权利要求1‑4任意一项所述的财务审计方法。

7.一种第三方审计系统，其特征在于：包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，所述第三方审计系统与服务器进行通信，以实现如权利要求1‑4任意一项所述的财务审计方法。

8.一种基于同态加密及分类优化的财务审计系统，其特征在于：包括客户端，服务器和第三方审计系统，所述客户端，服务器和第三方审计系统进行通信，实现如权利要求1‑4任意一项所述的方法。

9.一种计算机设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，所述处理器执行所述计算机可执行指令以实现权利要求

1‑4任意一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令在被处理器调用和执行时，计算机可执行指令促使处理器实现权利要求1‑4任意一项所述的方法。

一种基于同态加密及分类优化的财务审计方法和系统

技术领域

[0001] 本发明属于财务审计领域，具体涉及一种基于同态加密及分类优化的财务审计方法和系统。

背景技术

[0002] 财务审计是审计机构按照一定的标准，对企业的资产，交易进行监督的一种机制，可以包括文书审计和与财务相关的交易流水审计。

[0003] 随着互联网的发展，第三方审计机构可以通过服务器对企业上传的数据进行审计。然而，这种情况下，需要企业上传内部数据，这容易导致企业敏感信息泄露，造成安全隐患。因此，通常的做法，是对企业数据进行加密后，上传至服务器。然而，与之而来的，第三方审计机构需要下载加密数据，解密后进行审计的计算，对此，仍不能完全保证企业敏感信息的安全性。并且，由于审计的数据量比较大，第三方审计机构在本地进行解密和数据计算时，对硬件设备要求较高。

[0004] 对于文书审计，一般需要人工进行审查，针对文书中涉及到的审计事实，结合审计规定，给出问题分类，然而这样耗费人力和时间，并且，即使采用了智能语义模型进行识别，由于文本量大，对硬件设备要求较高。

发明内容

[0005] 本发明的目的在于解决上述现有技术中存在的难题，提供一种基于同态加密及分类优化的财务审计方法和系统。

[0006] 本发明是通过以下技术方案实现的：

[0007] 客户端接收用户上传的财务文书和交易流水表单，其中，财务文书包括待审计文书和审计规定；采用文本识别模型对待审计文书和交易流水表单进行识别，其中，文本识别模型包括针对财务审计的语义词典，文本识别模型根据语义词典对待审计文书和交易流水表单进行识别，分别得到审计事实和交易流水数据；交易流水数据中包括输入输出交易以及相应的金额。

[0008] 对审计事实和审计规定，采用文本问题分类模型，得到文本问题分类；其中，文本问题分类模型包括输入层，隐含层和输出层；输入层分别对审计事实和审计规定采用bert模型提取词向量，隐含层中将所述词向量输入Bi‑GRU模型提取特征向量，输出层中，将审计事实和审计规定得到的特征向量进行融合，将融合后的特征向量采用BiLSTM模型进行文本问题分类，得到分类结果。

[0009] 对于交易流水数据，通过以下步骤进行审计：

[0010] 步骤1：客户端向服务器发起认证请求，该认证请求用于建立与服务器的连接；

[0011] 步骤2：建立连接后，服务器向客户端发送密钥，客户端采用密钥对交易流水信息进行加密，并上传至服务器；

[0012] 步骤3：第三方审计系统对服务器中加密后的交易流水数据进行审计，得到审计结果。

[0013] 具体过程包括如下步骤：

[0014] 步骤2.1：定义参数S，E，随机选取私钥sk←[0,S]，公钥pk= ，其中，q为设定的素数，gq为阶数为q的有限循环群G的生成元；输出密钥对（pk，sk），对于输入金额为Min，i的第i笔交易和输出金额为Mout，j的第j笔交易，随机生成rin，i←[0,E]，rout，j←[0，E]，对信息进行加密后得到 = ；； = ； ;将（，）和（，）上传至服务器，其中，f为G的阶数为q的唯一循环群的生成元；

[0015] 步骤2.2：服务器端，对于总输入金额为Min的n笔交易输入和总输出金额为Mout的ｎ′笔交易输出，对于第i笔输入交易和第j笔输出交易，

[0016] 计算Cin=（）；Cout=（）；

[0017] 随机生成rs←[0,E]，计算R= , ;计算 =H（R，，Cout，Cin），其中，H为哈希函数，随机生成rt←[0，E]，计算zt=rt+ xt；其中，xt= ‑ ；将（，zt），（
，）和（，）发送至第三方审计系统；

[0018] 步骤3.1：第三方审计系统接收到数据后，计算：

[0019] R’= ; = ；

[0020] 当且仅当 =H（R’，，Cout，Cin）时,交易收支平衡，审计结果通过，输出1，否则不通过，输出0；

[0021] 步骤3.2：第三方审计系统将审计结果返回服务器，由服务器将结果返回至客户端。

[0022] 客户端收集财务文书的文本问题分类结果反馈，根据用户反馈的结果，对文本问题分类中的数据进行标记，在空闲时，将标记的数据作为样本，对本地局部文本问题分类模型进行重新训练，将训练后的局部文本问题分类模型参数反馈至服务器，服务器定期根据多个客户端返回的参数，与其他客户端更新的局部模型参数聚合到全局文本问题分类模型中，将更新后的文本问题分类模型参数返回至客户端。

[0023] 其中，在每次迭代训练时，针对文本问题分类模型的隐含层随机生成掩码，由此生成本地局部文本问题分类模型，并且采用随机梯度下降法对模型参数进行优化；对于第t次迭代，对于损失函数Loss，给定固定的学习率η，模型参数θ迭代更新公式为：θt+1←θt−η∇Loss。模型训练过程中，采用如下损失函数判断是否停止迭代：Loss=；其中，A表示训练样本数，D为分类数量；Yt第t次训练第d个
样本属于分类a的预测的后验概率，X为第d个样本属于分类a的真实后验概率。

[0024] 本发明还涉及一种基于同态加密及分类优化的财务审计系统，包括客户端，服务器和第三方审计系统，所述客户端，服务器和第三方审计系统进行通信，以现上述的方法。

[0025] 本发明还涉及一种计算机设备，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，所述处理器执行所述计算机可执行指令以实现上述方法。

[0026] 本发明还涉及一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令在被处理器调用和执行时，计算机可执行指令促使处理器实现上述方法。

[0027] 与现有技术相比，本发明的有益效果是：为了不把用户敏感信息泄露给云服务商或者第三方，数据存储到服务器前对数据进行同态加密处理，针对服务器存储的数据，大量的加密运算在服务器端进行，第三方审计机构只需要验证极少的值，就可以完成交易数据的审计，节约了审计机构的运行成本，实现高效、高速审计，并且确保了企业敏感数据的安全性。

[0028] 另外，本发明可以对待审查文书进行自动识别，减少了人工成本。首先采用文本模型从待审查文书中提取审计事实，剔除了文书中无用的信息，降低了后续文本问题分类模型需要处理的数据量。并且，由于文本问题分类模型运行于客户端，需要定期更新模型，本发明采用联邦学习及时更新模型，实现了分类持续优化，通过随机梯度下降算法，提高了本地模型的迭代更新速度，减少了计算量，降低了运行成本。

[0029] 本发明提供的方法和系统中，既可以对财务文书进行智能审查，又可以使得审查机构对交易数据进行审查，实现了全自动，全面的财务审查。

附图说明

[0030] 图1：本申请中的财务审计方法流程图。

[0031] 图2：文本问题分类模型结构示意图。

具体实施方式

[0032] 下面结合附图对本发明作进一步详细描述：

[0033] 本申请中，客户端接收用户上传的财务文书和交易流水表单，其中，财务文书包括待审计文书和审计规定；采用文本识别模型对待审计文书和交易流水表单进行识别，其中，文本识别模型包括针对财务审计的语义词典，文本识别模型根据语义词典对待审计文书和交易流水表单进行识别，分别得到审计事实和交易流水数据；交易流水数据中包括输入输出交易以及相应的金额。

[0034] 对审计事实和审计规定，采用文本问题分类模型中，得到文本问题分类。图2为本发明文本问题分类模型结构示意图，文本问题分类模型包括输入层，隐含层和输出层；输入层分别对审计事实和审计规定采用bert模型提取词向量，隐含层中将所述词向量输入Bi‑GRU模型提取特征向量，输出层中，将审计事实和审计规定得到的特征向量进行融合，将融合后的特征向量采用BiLSTM模型进行文本问题分类，得到分类结果。

[0035] 对于交易流水数据，通过以下步骤进行审计：

[0036] 步骤1：客户端向服务器发起认证请求，该认证请求用于建立与服务器的连接；步骤2：建立连接后，服务器向客户端发送密钥，客户端采用密钥对交易流水信息进行加密，并上传至服务器；

[0037] 步骤3：第三方审计系统对服务器中加密后的交易流水数据进行审计，得到审计结果。

[0038] 具体审计过程包括如下步骤：

[0039] 步骤2.1：定义参数S，E，随机选取私钥sk←[0,S]，公钥pk= ，其中，q为设定的素数，gq为阶数为q的有限循环群G的生成元；输出密钥对（pk，sk），对于输入金额为Min，i的第i笔交易和输出金额为Mout，j的第j笔交易，随机生成rin，i←[0,E]，rout，j←[0，E]，对信息进行加密后得到 = ；； = ； ;将（，）和（，）上传至服务器，其中，f为G的阶数为q的唯一循环群的生成元；

[0040] 步骤2.2：服务器端，对于总输入金额为Min的n笔交易输入和总输出金额为Mout的ｎ′笔交易输出，对于第i笔输入交易和第j笔输出交易，

[0041] 计算Cin=（）；Cout=（）；

[0042] 随机生成rs←[0,E]，计算R= , ;计算 =H（R，，Cout，Cin），其中，H为哈希函数，随机生成rt←[0，E]，计算zt=rt+ xt；其中，xt= ‑ ；将（，zt），（
，）和（，）发送给第三方审计系统；

[0043] 步骤3.1：第三方审计系统接收到数据后，计算：

[0044] R’= ; = ；其中（，）和（，）为加密后的密文；

[0045] 当且仅当 =H（R’，，Cout，Cin）时,交易收支平衡，审计结果通过，输出1，否则不通过，输出0；

[0046] 步骤3.2：第三方审计系统将审计结果返回服务器，由服务器将结果返回至客户端。

[0047] 图1为本申请财务审计方法流程图，从图中可以看出，第三方审计机构并不直接获得客户端中的审计数据，因此，保证了企业敏感数据的信息安全，并且服务器中的数据为加密后的数据，云服务商也无法直接获得企业数据。

[0048] 客户端收集财务文书的文本问题分类结果反馈，即由用户判断分类结果是否准确，根据用户反馈的结果，相当于对相应的文本问题分类进行了重新标记，因此，在空闲时，基于收集到的进行了重新标记的数据，将其作为训练样本，对本地局部文本问题分类模型进行重新训练，将训练后的局部文本问题分类模型参数反馈至服务器，服务器定期根据多个客户端返回的参数，与其他客户端更新的局部模型参数聚合到全局文本问题分类模型中，将更新后的文本问题分类模型参数返回至客户端。

[0049] 在每次迭代训练时，针对本地文本问题分类模型的隐含层随机生成掩码，，由此生成本地局部文本问题分类模型，并且采用随机梯度下降法对模型参数进行优化。对于第t次迭代，对于损失函数Loss，给定固定的学习率η，模型参数θ迭代更新公式为：θt+1←θt−η∇Loss。模型训练过程中，采用如下损失函数判断是否停止迭代：Loss=；其中，A表示训练样本数，D为分类数量；Yt第t次训练第d个
样本属于分类a的预测的后验概率，X为第d个样本属于分类a的真实后验概率。

[0050] 在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

[0051] 在本发明的描述中，除非另有说明，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

[0052] 最后应说明的是，上述技术方案只是本发明的一种实施方式，对于本领域内的技术人员而言，在本发明公开了应用方法和原理的基础上，很容易做出各种类型的改进或变形，而不仅限于本发明上述具体实施方式所描述的方法，因此前面描述的方式只是优选的，而并不具有限制性的意义。

一种基于同态加密及分类优化的财务审计方法和系统转让专利

申请号 : CN202310487853.1

文献号 : CN116245669B

文献日 : 2023-08-25

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 陶琎

申请人 : 南京青春信息科技有限公司

摘要 :

权利要求 :

说明书 :