一种基于区块链的金融风控管理系统转让专利

申请号 : CN202110781350.6

文献号 : CN113393330B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王莹莹何丽王换仇

申请人 : 深圳市鼎驰科技发展有限公司

摘要 :

本发明公开了一种基于区块链的金融风控管理系统,包括区块链系统,所述区块链系统包括监控节点、预测节点、共识节点、用户节点和专家节点,所述共识节点用于接收到用户节点的任务请求信息;所述监控节点用于向预测节点发送预测请求;所述预测节点用于对金融监测目标的价格变动趋势进行预测,所述用户节点用于获取预测结果。本发明提供的基于区块链的金融风控管理系统,实现对金融网络舆情的实时监控,实现投资者可以对可能出现的市场波动提前做好布局和应急,通过建立模型对可能波动的金融目标进行预测,可提高预测的准确性,避免投资者主观从众心理,为投资者提供理性和参照,有效降低股民、基民与投资机构的投资风险。

权利要求 :

1.一种基于区块链的金融风控管理系统,其特征在于,包括区块链系统,所述区块链系统包括监控节点、预测节点、共识节点、用户节点和专家节点,所述共识节点用于接收到用户节点在区块链中广播的任务请求信息,则与当前周期的监测清单进行比对,所述任务请求信息包括金融监测目标、约定奖励规则的奖励支付智能合约和发放的加密数字货币量;若金融监测目标与监测清单重复,则向用户节点发送驳回信息,否则向监控节点发送查询请求;

所述监控节点用于从预设金融数据源平台获取预设时间段内金融监测目标的点评数据,并将点评数据进行预处理,计算情感指数E,若情感指数E>情感指数阈值E0,则向预测节点发送预测请求;

所述预测节点用于基于构建的投资预测模型对金融监测目标的价格变动趋势进行预测,并将预测结果附带时间戳广播在区块链网络中;

所述用户节点用于获取预测结果,并基于奖励支付智能合约向预测节点发放对应数量的加密数字货币。

2.根据权利要求1所述的管理系统,其特征在于,所述共识节点还用于:若到达更新周期,接收用户节点在区块链网络中加密共享的投资清单;

根据投资清单将投资指数I>投资指数阈值I0的投资标的筛选作为金融监测目标,生成监测清单发送给监控节点。

3.根据权利要求2所述的管理系统,其特征在于,所述接收用户节点在区块链网络中加密共享的投资清单,具体包括:共识节点和用户节点各自将与私钥对应的公钥发送至区块链中;

用户节点计算投资数据对应的哈希值作为私钥,并通过私钥对所述投资数据进行加密,然后通过共识节点的公钥进行二次加密,然后将加密内容发送至区块链中,所述投资数据为投资者ID、投资标的名称和标的金额;

共识节点根据自身私钥对公钥加密后的投资数据进行验证,然后通过用户节点的公钥对加密内容进行解密,获取投资数据;

共识节点计算投资者ID和投资标的名称对应的哈希值,并通过私钥对所述投资数据进行加密,然后将加密内容发送至区块链中。

4.根据权利要求2所述的管理系统,其特征在于,所述投资指数I计算公式如下:其中,I(x)表示投资函数,x表示投资标的序号,αx表示第x个投资标的的金额,α0表示投资标的的总金额,mx表示第x个投资标的的数量,m0表示投资标的的总数量;w1,w2表示权重,满足w1,w2∈[0,1]且w1+w2=1。

5.根据权利要求2所述的管理系统,其特征在于,所述监控节点包括第一优先级处理单元和第二优先级处理单元,其中,第一优先级处理单元包括:第一处理模块,用于删除乱码、空白和图片评论;

第二处理模块,用于当同一IP用户在T1时间内在同一平台发表相同评论数M≥相同评论阈值M1时,删除多余评论且只保留一条评论;

第三处理模块,用于当同一IP用户在T2时间内在同一平台发表评论数M≥评论数阈值M2时,或当同一IP用户在T3时间内在不同平台发表评论数M≥评论数阈值M3时,删除其所有评论,其中,T3≥T2≥T1,且M2≥M3。

6.根据权利要求5所述的管理系统,其特征在于,所述第二优先级处理单元包括:第四处理模块,用于获取评论文本,进行分词并去停用词和去介词处理,获得关键词;

第五处理模块,用于根据筛选模型F(x)对关键词进行筛选,删除值小于阈值F0的关键词,其中,筛选模型F(x)定义如下:其中,F(x)表示筛选函数,x表示关键词的序号,qx表示第x个关键词在评论中出现的次数,cx表示含有第x个关键词的评论中关键词的总数量,N表示评论的总数,n表示关键词出现的评论的数量;

第六处理模块,用于通过预训练的好的分类模型对筛选后关键词进行二分类,获得积极评论或消极评论。

7.根据权利要求6所述的管理系统,其特征在于,所述情感指数E计算公式如下:其中,E表示情感指数,g1表示当前更新周期的积极评论的增长率,p1表示积极评论数,l1表示积极评论点赞数,l2表示积极评论踩人数,g2表示当前更新周期的消极评论的增长率,p2表示消极评论数,l3表示消极评论点赞数,l4表示消极评论踩人数,t表示以小时为单位的时间。

8.根据权利要求7所述的管理系统,其特征在于,所述监控节点还用于:计算分歧指数D,若情感指数E>情感指数阈值E0且分歧指数D>分歧指数阈值D0,则向专家节点发送评定请求,其中,所述分歧指数D计算公式如下:*

其中,D表示分歧指数,m表示当前更新周期内用户节点的任务请求次数,g1表示当前更新周期的积极评论的增长率,p1表示积极评论数,l1表示积极评论点赞数,l2表示积极评论踩人数,g2表示当前更新周期的消极评论的增长率,p2表示消极评论数,l3表示消极评论点赞数,l4表示消极评论踩人数;

所述专家节点用于获取预测节点的预测结果,附加上专家评估建议广播在区块链网络中。

9.根据权利要求2或8所述的管理系统,其特征在于,所述预测节点基于构建的投资预测模型对金融监测目标的价格变动趋势进行预测,具体包括:获取多支股票历史交易数据,将股票交易过程建模为马尔可夫决策过程,具体为:状态用s表示,其为环境状态,由行为策略生成的股票价格信息;

动作用a表示,其包括买入、持有和卖出;

* *

奖励用r(s,a,s)表示,其为当在状态s采取动作a并到达新状态s 时投资价值的变化,即环境反馈的单步奖励值,投资价值为股票价值和余额的总值;

定义未来回报Rt,其为从当前状态到未来状态的所有动作获得的奖励值的加权和,i‑t其中,T表示样本的总量,γ 表示第t个样本对i个样本的奖励折扣系数,r(si,ai,si+1)表示当在状态si采取动作ai并到达新状态si+1时投资价值的变化;

策略用π(s)表示,其为状态s的股票交易策略,即动作a在状态s的概率分布,下一步要采取的行动;

定义状态‑动作值函数Qπ(s,a),其为在状态s下遵循策略π时动作a获得的预期奖励;

通过贝尔曼方程得到最优的状态‑动作值函数Qπ(st,at):其中,Qπ(st,at)是特定状态st下根据特定策略π执行动作at而获得的未来奖励预期,通过对回报r(st,at,st+1)的期望加上下一个状态st+1的预期回报来计算的;E表示期望;

同时,状态‑动作值函数Qπ(st,at)更新过程可以表示如下:δ(t)=r(st,at,st+1)‑Qπ(st,at),其中,在通过环境学习前的初始Q值设置为0,α表示学习率,用于调整从一次试验到下+ ‑一次试验的变化幅度,α=1,α=0,δ(t)表示预测误差,是预期回报Qπ(st,at)与实际回报r(st,at,st+1)之间的差值;

使用贪婪动作at+1来最大化状态st+1的Q(st+1,at+1)如下:将DNN引入Q‑learning的框架中,DNN由Online网络和Target网络组成,Online网络使用带有权重θ的Q函数Q(s,a,θ),以近似最优状态‑动作值函数Qπ(st,at);Target网络使用带‑ ‑有权重θ的Q函数Q(s,a,θ),以提高整个网络的性能,在特定的回合数后,复制Online网络‑的权重θ以更新Target网络的权重θ,利用梯度下降法更新Online网络的权重θ,以获得最小损失函数:‑

其中,L表示损失函数,r表示奖励值,θ和θ表示网络权值, 表示目标Q函数值,Q(s,a,θ)表示预测Q函数值,γ表示折扣因子;

利用训练好的深度学习网络对金融监测目标的价格变动趋势进行预测。

10.根据权利要求2所述的管理系统,其特征在于,所述奖励支付智能合约,具体包括:用户节点获取预测结果,向预测节点支付一半数量的加密数字货币;

在当前更新周期结束时,判断预测是否正确,若正确则向预测节点支付另一半数量的加密数字货币。

说明书 :

一种基于区块链的金融风控管理系统

【技术领域】

[0001] 本发明涉及金融风险管控技术领域,尤其涉及一种基于区块链的金融风控管理系统。【背景技术】
[0002] 随着金融一体化和经济全球化的发展,金融舆情发现的重要性愈加突出,其作用不仅被政府所重视,而且受到广大投资者密切的关注。
[0003] 金融舆情是投资者通过互联网来表达自身对金融投资的看法和情绪,可借助网络快速蔓延,而其形成趋势就可能对股价等造成影响。因此,如果能及时观测到金融舆情,并对金融产品实现及时管理,就能有效降低股民、基民与投资机构的投资风险。【发明内容】
[0004] 有鉴于此,本发明实施例提供了基于区块链的金融风控管理系统。
[0005] 本发明实施例提供了基于区块链的金融风控管理系统,包括区块链系统,所述区块链系统包括监控节点、预测节点、共识节点、用户节点和专家节点,
[0006] 所述共识节点用于接收到用户节点在区块链中广播的任务请求信息,则与当前周期的监测清单进行比对,所述任务请求信息包括金融监测目标、约定奖励规则的奖励支付智能合约和发放的加密数字货币量;若金融监测目标与监测清单重复,则向用户节点发送驳回信息,否则向监控节点发送查询请求;
[0007] 所述监控节点用于从预设金融数据源平台获取预设时间段内金融监测目标的点评数据,并将点评数据进行预处理,计算情感指数E,若情感指数E>情感指数阈值E0,则向预测节点发送预测请求;
[0008] 所述预测节点用于基于构建的投资预测模型对金融监测目标的价格变动趋势进行预测,并将预测结果附带时间戳广播在区块连网络中;
[0009] 所述用户节点用于获取预测结果,并基于奖励支付智能合约向预测节点发放对应数量的加密数字货币。
[0010] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述共识节点还用于:
[0011] 若到达更新周期,接收用户节点在区块链网络中加密共享的投资清单;
[0012] 根据投资清单将投资指数I>投资指数阈值I0的投资标的筛选作为金融监测目标,生成监测清单发送给监控节点。
[0013] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述接收用户节点在区块链网络中加密共享的投资清单,具体包括:
[0014] 共识节点和用户节点各自将与所述私钥对应的公钥发送至区块链中;
[0015] 用户节点计算投资数据对应的哈希值作为私钥,并通过私钥对所述投资数据进行加密,然后通过共识节点的公钥进行二次加密,然后将加密内容发送至区块链中,所述投资数据为投资者ID、投资标的名称和标的金额;
[0016] 共识节点根据自身私钥对公钥加密后的投资数据进行验证,然后通过用户节点的公钥对加密内容进行解密,获取投资数据;
[0017] 共识节点计算投资者ID和投资标的名称对应的哈希值,并通过私钥对所述投资数据进行加密,然后将加密内容发送至区块链中。
[0018] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述投资指数I计算公式如下:
[0019]
[0020] 其中,I(x)表示投资函数,x表示投资标的序号,αx表示第x个投资标的的金额,α0表示投资标的的总金额,mx表示第x个投资标的的数量,m0表示投资标的的总数量;w1,w2表示权重,满足w1,w2∈[0,1]且w1+w2=1。
[0021] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述监控节点包括第一优先级处理单元和第二优先级处理单元,其中,第一优先级处理单元包括:
[0022] 第一处理模块,用于删除乱码、空白和图片评论;
[0023] 第二处理模块,用于当同一IP用户在T1时间内在同一平台发表相同评论数M≥相同评论阈值M1时,删除多余评论且只保留一条评论;
[0024] 第三处理模块,用于当同一IP用户在T2时间内在同一平台发表超过评论数M≥评论数阈值M2时,或当同一IP用户在T3时间内在不同平台发表超过评论数M≥评论数阈值M3时,删除其所有评论,其中,T3≥T2≥T1,且M2≥M3。
[0025] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述第二优先级处理单元包括:
[0026] 第四处理模块,用于获取评论文本,进行分词并去停用词和去介词处理,获得关键词;
[0027] 第五处理模块,用于根据筛选模型F(x)对关键词进行筛选,删除值小于阈值F0的关键词,其中,筛选模型F(x)定义如下:
[0028]
[0029] 其中,F(x)表示筛选函数,x表示关键词的序号,qx表示第x个关键词在评论中出现的次数,c表示含有第x个关键词的评论中关键词的总数量,N表示评论的总数,n表示关键词出现的评论的数量;
[0030] 第六处理模块,用于通过预训练的好的分类模型对筛选后关键词进行二分类,获得积极评论或消极评论。
[0031] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述情感指数E计算公式如下:
[0032]
[0033] 其中,E表示情感指数,g1表示当前更新周期的积极评论的增长率,p1表示积极评论数,l1表示积极评论点赞数,l2表示积极评论踩人数,g2表示当前更新周期的消极评论的增长率,p2表示消极评论数,l3表示消极评论点赞数,l4表示消极评论踩人数,t表示以小时为单位的时间。
[0034] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述监控节点还用于:
[0035] 计算分歧指数D,若情感指数E>情感指数阈值E0且分歧指数D>分歧指数阈值D0,则向专家节点发送评定请求,其中,所述分歧指数D计算公式如下:
[0036]
[0037] 其中,D表示分歧指数,m*表示当前更新周期内用户节点的任务请求次数,g1表示当前更新周期的积极评论的增长率,p1表示积极评论数,l1表示积极评论点赞数,l2表示积极评论踩人数,g2表示当前更新周期的消极评论的增长率,p2表示消极评论数,l3表示消极评论点赞数,l4表示消极评论踩人数;
[0038] 所述专家节点用于获取预测节点的预测结果,附加上专家评估建议广播在区块连网络中。
[0039] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述预测节点基于构建的投资预测模型对金融监测目标的价格变动趋势进行预测,具体包括:
[0040] 获取多支股票历史交易数据,将股票交易过程建模为马尔可夫决策过程,具体为:
[0041] 状态用s表示,其为环境状态,由行为策略生成的股票价格信息;
[0042] 动作用a表示,其包括买入、持有和卖出;
[0043] 奖励用r(s,a,s*)表示,其为当在状态s采取动作a并到达新状态s*时投资价值的变化,即环境反馈的单步奖励值,投资价值为股票价值和余额的总值;
[0044] 定义未来回报Rt,其为从当前状态到未来状态的所有动作获得的奖励值的加权i‑t和, 其中,T表示样本的总量,γ 表示第t个样本对i个样本的奖励折
扣系数,r(si,ai,si+1)表示当在状态si采取动作ai并到达新状态si+1时投资价值的变化;
[0045] 策略用π(s)表示,其为状态s的股票交易策略,即动作a在状态s的概率分布,下一步要采取的行动;
[0046] 定义状态‑动作值函数Qπ(s,a),其为在状态s下遵循策略π时动作a获得的预期奖励;
[0047] 通过贝尔曼方程得到最优的状态‑动作值函数Qπ(st,at):
[0048]
[0049] 其中,Qπ(st,at)是特定状态st下根据特定策略π执行动作at而获得的未来奖励预期,通过对回报r(st,at,st+1的期望加上下一个状态st+1的预期回报来计算的;E表示期望;
[0050] 同时,状态‑动作值函数Qπ(st,at)更新过程可以表示如下:
[0051]
[0052] δ(t)=r(st,at,st+1)‑Qπ(st,at),
[0053] 其中,在通过环境学习前的初始Q值设置为0,a表示学习率,用于调整从一次试验+ ‑到下一次试验的变化幅度,a=1,a=0,δ(t)表示预测误差,是预期回报Qπ(st,at)与实际回报r(st,at,st+1)之间的差值;
[0054] 使用贪婪动作at+1来最大化状态st+1的Q(st+1,at+1)如下:
[0055]
[0056] 将DNN引入Q‑learning的框架中,DNN由Online网络和Target网络组成,Online网络使用带有权重θ的Q函数Q(s,a,θ),以近似最优状态‑动作值函数Qπ(st,at);Target网络使‑ ‑用带有权重θ的Q函数Q(s,a,θ),以提高整个网络的性能,在特定的回合数后,复制Online‑
网络的权重θ以更新Target网络的权重θ,利用梯度下降法更新Online网络的权重θ,以获得最小损失函数:
[0057]
[0058] 其中,L表示损失函数,r表示奖励值,θ和θ′表示网络权值, 表示目标Q函数值,Q(s,a,θ)表示预测Q函数值,γ表示折扣因子;
[0059] 利用训练好的深度学习网络对金融监测目标的价格变动趋势进行预测。
[0060] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述奖励支付智能合约,具体包括:
[0061] 用户节点获取预测结果,向预测节点支付一半数量的加密数字货币;
[0062] 在当前更新周期结束时,判断预测是否正确,若正确则向预测节点支付另一半数量的加密数字货币。
[0063] 上述技术方案中的一个技术方案具有如下有益效果:
[0064] 本发明实施例的方法中提出了基于区块链的金融风控管理系统,实现了对金融网络舆情的实时监控,实现投资者可以对可能出现的市场波动提前做好布局和应急,通过建立模型对可能波动的金融目标进行预测,可提高预测的准确性,避免投资者主观从众心理,为投资者提供理性和参照,有效降低股民、基民与投资机构的投资风险;可以提高处理任务和更新、完善预测模型的积极性。【附图说明】
[0065] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0066] 图1是本发明实施例所提供的基于区块链的金融风控管理系统的构架图;
[0067] 图2是本发明实施例所提供的监控节点的功能方块图;
[0068] 图3是本发明实施例所提供的基于区块链的金融风控管理系统的节点设备的硬件示意图。【具体实施方式】
[0069] 为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0070] 请参考图1,图1是本发明实施例基于区块链的金融风控管理系统的构架图。如图1所示,该基于区块链的金融风控管理系统包括区块链系统,所述区块链系统包括监控节点、预测节点、共识节点、用户节点和专家节点,其中,
[0071] 所述共识节点用于接收到用户节点在区块链中广播的任务请求信息,则与当前周期的监测清单进行比对,所述任务请求信息包括金融监测目标、约定奖励规则的奖励支付智能合约和发放的加密数字货币量;
[0072] 若金融监测目标与监测清单重复,则共识节点向用户节点发送驳回信息,否则向监控节点发送查询请求;
[0073] 所述监控节点用于从预设金融数据源平台获取预设时间段内金融监测目标的点评数据,并将点评数据进行预处理,计算情感指数E,若情感指数E>情感指数阈值E0,则向预测节点发送预测请求;
[0074] 所述预测节点用于基于构建的投资预测模型对金融监测目标的价格变动趋势进行预测,并将预测结果附带时间戳广播在区块连网络中;
[0075] 所述用户节点用于获取预测结果,并基于奖励支付智能合约向预测节点发放对应数量的加密数字货币。
[0076] 本发明的共识节点用于接收到用户节点的任务请求信息,用户节点请求的任务即金融监测目标的价格变动预测,例如某支股票或者基金的涨跌,从而给用户投资提供参考;当前周期的监测清单是指系统对清单内的金融目标监测,并免费为用户节点提供资讯,因此,若用户节点请求的金融监测目标与监测清单重复,则直接驳回用户节点请求无需额外浪费资源,也避免用户节点额外支出;若金融监测目标与监测清单不重复,则向监控节点发送查询请求,监控节点从预设金融数据源平台获取预设时间段内金融监测目标的点评数据,其中,金融数据源平台例如可以是股票论坛、包含基金业务的app等,获取点评数据是为了实现对金融网络舆情的监控,实现投资者可以对可能出现的市场波动提前做好布局和应急;若情感指数E>情感指数阈值E0,则向预测节点发送预测请求,可实现对热度较高的目标实现监测,且设置阈值可减少监控节点和预测节点的工作量;预测节点基于构建的投资预测模型对金融监测目标的价格变动趋势进行预测,通过建立模型对可能波动的金融目标进行预测,一方面,可提高预测的准确性,成为投资者理财的好手段,另一方面,可以避免投资者主观从众心理,为投资者提供理性和参照,有效降低股民、基民与投资机构的投资风险;用户节点获取预测结果,并基于奖励支付智能合约向预测节点发放对应数量的加密数字货币,通过奖励机制,可以提高预测节点处理任务和更新、完善预测模型的积极性,且通过智能合约进行约束,可以保障支付的安全性和积极性。
[0077] 另外,上述奖励支付智能合约,具体包括:
[0078] 用户节点获取预测结果,向预测节点支付一半数量的加密数字货币;
[0079] 在当前更新周期结束时,判断预测是否正确,若正确则向预测节点支付另一半数量的加密数字货币。
[0080] 通过智能合约设定奖励规则,可以实现对预测节点的高效激励。需要说明的是,不同预测节点构建的投资预测模型可以是共享的,也可以是后期更新训练的是独立的,甚至构建的模型也是独立的。针对预测节点可以筛选机制,例如预测节点可以提供注册上链,根据预测节点预测的准确性对预测节点进行不同奖励,甚至淘汰。
[0081] 本发明的共识节点还用于:若到达更新周期,共识节点接收用户节点在区块链网络中加密共享的投资清单;共识节点将投资指数I>投资指数阈值I0的投资标的筛选作为金融监测目标,生成监测清单发送给监控节点;
[0082] 另外,监控节点从预设金融数据源平台获取预设时间段内金融监测目标的点评数据,并将点评数据进行预处理,计算情感指数E,若情感指数E>情感指数阈值E0,则向预测节点发送预测请求;
[0083] 另外、预测节点基于构建的投资预测模型对金融监测目标的价格变动趋势进行预测,并将预测结果附带时间戳广播在区块连网络中。
[0084] 其中,上述投资指数I计算公式如下:
[0085]
[0086] 其中,I(x)表示投资函数,x表示投资标的序号,αx表示第x个投资标的的金额,α0表示投资标的的总金额,mx表示第x个投资标的的数量,m0表示投资标的的总数量;w1,w2表示权重,满足w1,w2∈[0,1]且w1+w2=1。
[0087] 另外,上述情感指数E计算公式如下:
[0088]
[0089] 其中,E表示情感指数,g1表示当前更新周期的积极评论的增长率,p1表示积极评论数,l1表示积极评论点赞数,l2表示积极评论踩人数,g2表示当前更新周期的消极评论的增长率,p2表示消极评论数,l3表示消极评论点赞数,l4表示消极评论踩人数,t表示以小时为单位的时间。
[0090] 另外,上述预测节点基于构建的投资预测模型对金融监测目标的价格变动趋势进行预测,具体包括:
[0091] 获取多支股票历史交易数据,将股票交易过程建模为马尔可夫决策过程,具体为:
[0092] 状态用s表示,其为环境状态,由行为策略生成的股票价格信息;
[0093] 动作用a表示,其包括买入、持有和卖出;
[0094] 奖励用r(s,a,s*)表示,其为当在状态s采取动作a并到达新状态s*时投资价值的变化,即环境反馈的单步奖励值,投资价值为股票价值和余额的总值;
[0095] 定义未来回报Rt,其为从当前状态到未来状态的所有动作获得的奖励值的加权i‑t和, 其中,T表示样本的总量,γ 表示第t个样本对i个样本的奖励折
扣系数,r(si,ai,si+1)表示当在状态si采取动作ai并到达新状态si+1时投资价值的变化;
[0096] 策略用π(s)表示,其为状态s的股票交易策略,即动作a在状态s的概率分布,下一步要采取的行动;
[0097] 定义状态‑动作值函数Qπ(s,a),其为在状态s下遵循策略π时动作a获得的预期奖励;
[0098] 通过贝尔曼方程得到最优的状态‑动作值函数Qπ(st,at):
[0099]
[0100] 其中,Qπ(st,at)是特定状态st下根据特定策略π执行动作at而获得的未来奖励预期,通过对回报r(st,at,st+1的期望加上下一个状态st+1的预期回报来计算的;E表示期望;
[0101] 同时,状态‑动作值函数Qπ(st,at)更新过程可以表示如下:
[0102]
[0103] δ(t)=r(st,at,st+1)‑Qπ(st,at),
[0104] 其中,在通过环境学习前的初始Q值设置为0,a表示学习率,用于调整从一次试验+ ‑到下一次试验的变化幅度,a=1,a=0,δ(t)表示预测误差,是预期回报Qπ(st,at)与实际回报r(st,at,st+1)之间的差值;
[0105] 使用贪婪动作at+1来最大化状态st+1的Q(st+1,at+1)如下:
[0106]
[0107] 将DNN引入Q‑learning的框架中,DNN由Online网络和Target网络组成,Online网络使用带有权重θ的Q函数Q(s,a,θ),以近似最优状态‑动作值函数Qπ(st,at);Target网络使‑ ‑用带有权重θ的Q函数Q(s,a,θ),以提高整个网络的性能,在特定的回合数后,复制Online‑
网络的权重θ以更新Target网络的权重θ,利用梯度下降法更新Online网络的权重θ,以获得最小损失函数:
[0108]
[0109] 其中,L表示损失函数,r表示奖励值,θ和θ′表示网络权值, 表示目标Q函数值,Q(s,a,θ)表示预测Q函数值,γ表示折扣因子;
[0110] 利用训练好的深度学习网络对金融监测目标的价格变动趋势进行预测。
[0111] 本发明构建的投资预测模型可实现对金融监测目标的价格变动趋势预测,且预测准确,鲁棒性强,解决了Q‑learning状态空间过大和收敛速度慢等问题。
[0112] 本发明基于区块链的金融风控系统还为用户节点提供进行免费的金融风控监测,将投资指数I>投资指数阈值I0的投资标的筛选作为金融监测目标,根据用户节点的资产配置保障大多数用户节点的利益,为用户节点减少额外支出,可以不断吸引用户节点加入,有利于系统健康发展。监控节点从预设金融数据源平台获取预设时间段内金融监测目标的点评数据,并将点评数据进行预处理,计算情感指数E,若情感指数E>情感指数阈值E0,则向预测节点发送预测请求,通过设置情感指数阈值E0,不断根据点评数据监测情感指数E,可实现对网络舆情的及时监控,为可能出现的市场波动提前布局。
[0113] 上述接收用户节点在区块链网络中加密共享的投资清单,具体包括:
[0114] 共识节点和用户节点各自将与所述私钥对应的公钥发送至区块链中;
[0115] 用户节点计算投资数据对应的哈希值作为私钥,并通过私钥对所述投资数据进行加密,然后通过共识节点的公钥进行二次加密,然后将加密内容发送至区块链中,所述投资数据为投资者ID、投资标的名称和标的金额;
[0116] 共识节点根据自身私钥对公钥加密后的投资数据进行验证,然后通过用户节点的公钥对加密内容进行解密,获取投资数据;
[0117] 共识节点计算投资者ID和投资标的名称对应的哈希值,并通过私钥对所述投资数据进行加密,然后将加密内容发送至区块链中。
[0118] 本发明通过对投资数据的双重加密共享,可以保障用户节点与共识节点数据共享的安全性,只有共识节点能够解密用户节点的投资数据,可以避免信息泄露。
[0119] 请参考图2,图2是本发明实施例所提供的监控节点的功能方块图。如图2所示,监控节点包括第一优先级处理单元和第二优先级处理单元,其中,第一优先级处理单元包括:
[0120] 第一处理模块,用于删除乱码、空白和图片评论;
[0121] 第二处理模块,用于当同一IP用户在T1时间内在同一平台发表相同评论数M≥相同评论阈值M1时,删除多余评论且只保留一条评论;
[0122] 第三处理模块,用于当同一IP用户在T2时间内在同一平台发表超过评论数M≥评论数阈值M2时,或当同一IP用户在T3时间内在不同平台发表超过评论数M≥评论数阈值M3时,删除其所有评论,其中,T3≥T2≥T1,且M2≥M3。
[0123] 其中,当同一IP用户在T1时间内在同一平台发表相同评论数M≥相同评论阈值M1时,删除多余评论且只保留一条评论,用于作为识别网络卡顿或者延迟,因此,将多余评论删除;而当同一IP用户在T2时间内在同一平台发表超过评论数M≥评论数阈值M2时,或当同一IP用户在T3时间内在不同平台发表超过评论数M≥评论数阈值M3时,删除其所有评论,其中,T3≥T2≥T1,且M2≥M3,用于识别网络水军,将其相关评论进行删除过滤。通过第一优先级处理获得真是的点评数。
[0124] 请参考图2,所述第二优先级处理单元包括:
[0125] 第四处理模块,用于获取评论文本,进行分词并去停用词和去介词处理,获得关键词;
[0126] 第五处理模块,用于根据筛选模型F(x)对关键词进行筛选,删除值小于阈值F0的关键词,其中,筛选模型F(x)定义如下:
[0127]
[0128] 其中,F(x)表示筛选函数,x表示关键词的序号,qx表示第x个关键词在评论中出现的次数,c表示含有第x个关键词的评论中关键词的总数量,N表示评论的总数,n表示关键词出现的评论的数量;
[0129] 第六处理模块,用于通过预训练的好的分类模型对筛选后关键词进行二分类,获得积极评论或消极评论。
[0130] 需要说明的是,分类模型可以采用本领域现有的常见的强化模型进行分类训练,也可以采用本申请如下分类模型进行分类训练:
[0131] 获取配置积极评论或消极评论类别标签的关键词数据,分成训练集和测试集,输入构建好的分类模型进行训练;其中,构建分类模型的构建方法如下:
[0132] 建立最优奖励模型: 其中,E表示期望值,λ表示折现因子,λ∈[0,1];s0表示初始状态,R表示奖励函数,π(st)表示将状态映射到操作的策略;
[0133] 定义Q函数: 其中,πi表示根据等式* *
确定Q值的当前策略,R表示函数,λ表示折现因子,p(s,a,s)表示动作a从状态s转移到s的转移概率,Tπi表示迭代步骤i得到的奖励;
[0134] 新策略的迭代更新如下:
[0135] π(i+1)(s)=argmaxQ(s,a),定义ε‑贪婪行为策略,采用ε‑贪婪行为策略来确定当前状态的行为,其中,每个动作都是以一些预定义的固定概率 随机选择的;
[0136] Q值通过学习迭代逼近最优策略的获取;
[0137] 通过预训练的好的分类模型对筛选后关键词进行二分类,获得积极评论或消极评论。
[0138] 在本发明实施例中,所述监控节点还用于:
[0139] 监控节点计算分歧指数D,若情感指数E>情感指数阈值E0且分歧指数D>分歧指数阈值D0,则向专家节点发送评定请求,其中,所述分歧指数D计算公式如下:
[0140]
[0141] 其中,D表示分歧指数,m*表示当前更新周期内用户节点的任务请求次数,g1表示当前更新周期的积极评论的增长率,p1表示积极评论数,l1表示积极评论点赞数,l2表示积极评论踩人数,g2表示当前更新周期的消极评论的增长率,p2表示消极评论数,l3表示消极评论点赞数,l4表示消极评论踩人数;
[0142] 所述专家节点用于获取预测节点的预测结果,附加上专家评估建议广播在区块连网络中。
[0143] 本发明通过设置专家节点实现在投资分歧较大的特定情况下通过金融专利人工介入为投资者解决投资难题,监控节点计算分歧指数D,若情感指数E>情感指数阈值E0且分歧指数D>分歧指数阈值D0,则向专家节点发送评定请求,为用户节点提供评估建议,保障投资者利用,实现更高效的金融风控。
[0144] 图3是本发明的一个实施例节点设备的硬件示意图。请参考图3,在硬件层面,该节点设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random‑Access Memory,RAM),也可能还包括非易失性存储器(non‑volatile memory),例如至少1个磁盘存储器等。当然,该节点设备还可能包括其他业务所需要的硬件。
[0145] 处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
[0146] 存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
[0147] 在一种可能实现的方式中,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,也可从其它设备上获取相应的计算机程序,以在逻辑层面上形成对应的装置。处理器,执行存储器所存放的程序,以通过执行的程序实现本发明任一实施例中提供的节点工作方法。
[0148] 本发明实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的节点设备执行时,能够使该节点设备执行本发明任一实施例中提供的节点工作方法。
[0149] 上述如本发明图实施例提供的节点设备执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0150] 结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0151] 本发明实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的节点设备执行时,能够使该节点设备执行本发明任一实施例中提供的节点工作方法。
[0152] 上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0153] 为了描述的方便,描述以上装置时以功能分为各种单元或模块分别描述。当然,在实施本发明时可以把各单元或模块的功能在同一个或多个软件和/或硬件中实现。
[0154] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0155] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0156] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0157] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0158] 在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0159] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0160] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD‑ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0161] 还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0162] 本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0163] 本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0164] 本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0165] 以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。。