图书荐购方法、系统及存储介质转让专利

申请号 : CN202310992223.X

文献号 : CN116720927B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 毕锋

申请人 : 北京人天书店集团股份有限公司

摘要 :

一种图书荐购方法、系统及存储介质,其获取所有阅读者的图书荐购请求;对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单;获取图书馆资源描述数据;以及,基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单。这样,可以将荐购图书进行优先级排序,以结合图书馆资源的自身状况来确定荐购图书的优先级,进而在读者和图书馆之间取得平衡。

权利要求 :

1.一种图书荐购方法,其特征在于,包括:

获取所有阅读者的图书荐购请求,所述图书荐购请求包括候选图书;

对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单,其中,所述初始图书荐购清单中各个候选图书以被荐购的频次来进行排序;

获取图书馆资源描述数据,其中,所述图书馆资源描述数据包括藏书量、流通率、更新率和主题分布;以及基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单;

基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单,包括:对所述图书馆资源描述数据进行语义编码以得到图书馆资源语义编码特征向量;

对所述初始图书荐购清单进行语义编码以得到多个候选图书上下文编码特征向量;

基于所述各个候选图书的被荐购的频次,对所述多个候选图书上下文编码特征向量进行加权优化以得到多个加权后候选图书上下文编码特征向量;

分别计算所述各个加权后候选图书上下文编码特征向量与所述图书馆资源语义编码特征向量之间的关联特征矩阵以得到多个关联特征矩阵;以及基于所述多个关联特征矩阵,对所述初始图书荐购清单进行更新以得到更新图书荐购清单;

基于所述多个关联特征矩阵,对所述初始图书荐购清单进行更新以得到更新图书荐购清单,包括:将所述多个关联特征矩阵分别通过分类器以得到多个概率值;以及基于所述多个概率值之间的排序,生成所述更新图书荐购清单。

2.根据权利要求1所述的图书荐购方法,其特征在于,对所述图书馆资源描述数据进行语义编码以得到图书馆资源语义编码特征向量,包括:使用基于转换器的Bert模型对所述图书馆资源描述数据进行语义编码以得到所述图书馆资源语义编码特征向量。

3.根据权利要求2所述的图书荐购方法,其特征在于,对所述初始图书荐购清单进行语义编码以得到多个候选图书上下文编码特征向量,包括:使用所述基于转换器的Bert模型对所述初始图书荐购清单进行语义编码以得到所述多个候选图书上下文编码特征向量。

4.根据权利要求3所述的图书荐购方法,其特征在于,基于所述各个候选图书的被荐购的频次,对所述多个候选图书上下文编码特征向量进行加权优化以得到多个加权后候选图书上下文编码特征向量,包括:以所述各个候选图书的被荐购的频次作为权重分别对所述多个候选图书上下文编码特征向量进行加权以得到多个初始加权后候选图书上下文编码特征向量;

将所述多个候选图书上下文编码特征向量进行级联以获得第一级联特征向量;

将所述初始加权后候选图书上下文编码特征向量进行级联以获得第二级联特征向量;

基于所述第一级联特征向量对所述第二级联特征向量进行希尔伯特空间启发式序列跟踪均衡化以得到优化第二级联特征向量;以及将所述优化第二级联特征向量进行特征向量切分以得到所述多个加权后候选图书上下文编码特征向量。

5.根据权利要求4所述的图书荐购方法,其特征在于,基于所述第一级联特征向量对所述第二级联特征向量进行希尔伯特空间启发式序列跟踪均衡化以得到优化第二级联特征向量,包括:以如下优化公式基于所述第一级联特征向量对所述第二级联特征向量进行希尔伯特空间启发式序列跟踪均衡化以得到优化第二级联特征向量;

其中,所述优化公式为:

其中,V1为所述第一级联特征向量,V2为所述第二级联特征向量,V2'为所述优化第二级T联特征向量,V2为所述第二级联特征向量的转置向量,||(V1;V2)||2表示所述第一级联特征向量V1和所述第二级联特征向量V2的级联向量的二范数, 表示所述第一级联特征向量V1和所述第二级联特征向量V2的所有特征值构成的并集集合的均值,且所述第一级联特征向量V1和所述第二级联特征向量V2均为行向量,⊙表示按位置点乘, 表示按位置加法,是所述第一级联特征向量中所有位置的特征值的集合, 是所述第二级联特征向量中所有位置的特征值的集合。

6.根据权利要求5所述的图书荐购方法,其特征在于,分别计算所述各个加权后候选图书上下文编码特征向量与所述图书馆资源语义编码特征向量之间的关联特征矩阵以得到多个关联特征矩阵,包括:以如下关联公式分别计算所述各个加权后候选图书上下文编码特征向量与所述图书馆资源语义编码特征向量之间的关联特征矩阵以得到多个关联特征矩阵;

其中,所述关联公式为:

其中,Vs表示所述各个加权后候选图书上下文编码特征向量, 表示所述各个加权后候选图书上下文编码特征向量的转置向量,Vb表示所述图书馆资源语义编码特征向量,Mb表示所述多个关联特征矩阵, 表示向量相乘。

7.一种图书荐购系统,其特征在于,包括:

荐购请求获取模块,用于获取所有阅读者的图书荐购请求,所述图书荐购请求包括候选图书;

统计分析模块,用于对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单,其中,所述初始图书荐购清单中各个候选图书以被荐购的频次来进行排序;

资源描述数据获取模块,用于获取图书馆资源描述数据,其中,所述图书馆资源描述数据包括藏书量、流通率、更新率和主题分布;以及荐购清单更新模块,用于基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单;

所述荐购清单更新模块,具体用于:

对所述图书馆资源描述数据进行语义编码以得到图书馆资源语义编码特征向量;

对所述初始图书荐购清单进行语义编码以得到多个候选图书上下文编码特征向量;

基于所述各个候选图书的被荐购的频次,对所述多个候选图书上下文编码特征向量进行加权优化以得到多个加权后候选图书上下文编码特征向量;

分别计算所述各个加权后候选图书上下文编码特征向量与所述图书馆资源语义编码特征向量之间的关联特征矩阵以得到多个关联特征矩阵;以及基于所述多个关联特征矩阵,对所述初始图书荐购清单进行更新以得到更新图书荐购清单;

所述荐购清单更新模块,具体用于:

将所述多个关联特征矩阵分别通过分类器以得到多个概率值;以及基于所述多个概率值之间的排序,生成所述更新图书荐购清单。

8.一种存储介质,其特征在于,包括:其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1至6中任一项所述的图书荐购方法。

说明书 :

图书荐购方法、系统及存储介质

技术领域

[0001] 本申请涉及智能化图书技术领域,并且更具体地,涉及一种图书荐购方法、系统及存储介质。

背景技术

[0002] 图书荐购是指读者向图书馆提出购买某本书的请求或建议。当读者在图书馆找不到他们想要阅读的书籍时,他们可以向图书馆提出荐购请求,以便图书馆购买并将该书纳入馆藏。图书馆通常鼓励读者提出图书荐购请求,因为这有助于满足读者的需求,并丰富图书馆的馆藏。读者可以通过填写荐购表格、发送电子邮件或在图书馆网站上提交荐购请求来提出荐购。
[0003] 但是,如果图书馆因预算有限且考虑到现存图书资源,不可能响应所有读者的荐购请求,这就需要给荐购图书进行优先级排序,以结合图书馆资源的自身状况来确定荐购图书的优先级,以在读者和图书馆之间取得平衡。

发明内容

[0004] 为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种图书荐购方法、系统及存储介质,其获取所有阅读者的图书荐购请求;对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单;获取图书馆资源描述数据;以及,基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单。这样,可以将荐购图书进行优先级排序,以结合图书馆资源的自身状况来确定荐购图书的优先级,进而在读者和图书馆之间取得平衡。
[0005] 第一方面,提供了一种图书荐购方法,其包括:
[0006] 获取所有阅读者的图书荐购请求,所述图书荐购请求包括候选图书;
[0007] 对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单,其中,所述初始图书荐购清单中各个候选图书以被荐购的频次来进行排序;
[0008] 获取图书馆资源描述数据,其中,所述图书馆资源描述数据包括藏书量、流通率、更新率和主题分布;以及
[0009] 基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单。
[0010] 第二方面,提供了一种图书荐购系统,其包括:
[0011] 荐购请求获取模块,用于获取所有阅读者的图书荐购请求,所述图书荐购请求包括候选图书;
[0012] 统计分析模块,用于对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单,其中,所述初始图书荐购清单中各个候选图书以被荐购的频次来进行排序;
[0013] 资源描述数据获取模块,用于获取图书馆资源描述数据,其中,所述图书馆资源描述数据包括藏书量、流通率、更新率和主题分布;以及
[0014] 荐购清单更新模块,用于基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单。
[0015] 第三方面,提供了一种存储介质,包括:其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如所述的图书荐购方法。

附图说明

[0016] 为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017] 图1为根据本申请实施例的图书荐购方法的流程图。
[0018] 图2为根据本申请实施例的图书荐购方法的架构示意图。
[0019] 图3为根据本申请实施例的图书荐购方法中步骤140的子步骤的流程图。
[0020] 图4为根据本申请实施例的书荐购系统的框图。
[0021] 图5为根据本申请实施例的图书荐购方法的场景示意图。

具体实施方式

[0022] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0023] 除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
[0024] 在本申请实施例记载中,需要说明的是,除非另有说明和限定,术语“连接”应做广义理解,例如,可以是电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
[0025] 需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。
[0026] 应可以理解,图书荐购是指读者向图书馆提出购买某本书的请求或建议。当读者在图书馆找不到他们想要阅读的书籍时,他们可以向图书馆提出荐购请求,以便图书馆购买并将该书纳入馆藏。
[0027] 图书馆通常鼓励读者提出图书荐购请求,因为这有助于满足读者的需求,并丰富图书馆的馆藏。通过读者的荐购请求,图书馆可以了解到读者对特定书籍的需求和兴趣,从而更好地满足读者的阅读需求。读者可以通过多种方式提出图书荐购请求,如填写荐购表格、发送电子邮件或在图书馆网站上提交荐购请求。通常,读者需要提供书籍的基本信息,如书名、作者、出版社等,以便图书馆能够准确地购买所需的书籍。
[0028] 然而,需要注意的是,图书馆可能由于预算有限或其他因素无法满足所有读者的荐购请求。在这种情况下,图书馆需要对荐购图书进行优先级排序,以结合图书馆资源的自身状况来确定购买图书的优先级。这样可以在读者和图书馆之间取得平衡,使图书馆的馆藏更好地满足广大读者的需求。
[0029] 图书荐购是一种读者与图书馆之间的互动方式,通过读者的建议和请求,图书馆可以更好地了解读者的需求,并购买适合的图书来丰富馆藏,提供更好的阅读服务。
[0030] 其中,图书馆通常拥有有限的购书预算,由于无法购买所有读者的荐购图书,对荐购图书进行优先级排序可以帮助图书馆更有效地管理预算,确保购买的图书能够最大限度地满足广大读者的需求。
[0031] 通过对荐购图书进行优先级排序,可以更好地利用图书馆现有的资源,优先考虑读者需求较高的图书,可以提高图书的借阅率和流通率,使图书馆的资源得到更充分的利用。图书荐购的目的是满足读者的阅读需求,通过对荐购图书进行优先级排序,可以更好地了解读者的需求和兴趣,将有限的资源用于购买最符合读者需求的图书,提供更好的阅读体验。
[0032] 优先级排序可以帮助图书馆在馆藏发展上实现平衡,通过考虑不同类型、领域和题材的图书,避免过度集中在某一类图书上,使馆藏更加多样化和全面化,满足读者的多样化阅读需求。通过对荐购图书进行优先级排序,图书馆可以更好地规划和管理馆藏,提供更精准和个性化的图书推荐和服务,有助于增强读者对图书馆的满意度,提升图书馆的服务质量和声誉。
[0033] 给荐购图书进行优先级排序是为了更好地管理预算、提高资源利用率、满足读者需求、平衡馆藏发展和提高服务质量。这样可以在有限的资源条件下,使图书馆能够更好地满足读者的阅读需求,并为读者提供更丰富和优质的图书服务。
[0034] 图1为根据本申请实施例的图书荐购方法的流程图。图2为根据本申请实施例的图书荐购方法的架构示意图。如图1和图2所示,所述图书荐购方法,包括:110,获取所有阅读者的图书荐购请求,所述图书荐购请求包括候选图书;120,对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单,其中,所述初始图书荐购清单中各个候选图书以被荐购的频次来进行排序;130,获取图书馆资源描述数据,其中,所述图书馆资源描述数据包括藏书量、流通率、更新率和主题分布;以及,140,基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单。
[0035] 其中,在所述步骤110中,确保能够收集到所有阅读者的荐购请求,可以通过多种途径,如荐购表格、电子邮件或在线提交系统。确保荐购请求中包含足够的信息,如书名、作者、出版社等,以便进行后续的统计分析和排序。其中,通过获取所有阅读者的荐购请求,图书馆可以了解到广大读者的需求和兴趣,为后续的图书采购和馆藏发展提供参考和依据。
[0036] 在所述步骤120中,对荐购请求进行统计分析时,需要考虑不同请求的重要性和紧迫性,可以根据荐购请求的频次、读者的意愿和需求等因素来确定图书的排序。其中,通过统计分析,可以得到初始的图书荐购清单,其中候选图书按照被荐购的频次进行排序。这样可以将有限的资源用于购买最受欢迎和需求最高的图书,提高图书馆的服务质量和读者满意度。
[0037] 在所述步骤130中,确保获取准确和全面的图书馆资源描述数据,可以通过图书馆的管理系统或其他相关数据来源获取。资源描述数据应包括图书馆的藏书量、流通率(借阅次数)、更新率(新书上架频率)和主题分布(不同主题图书的数量和比例)等信息。其中,通过获取图书馆资源描述数据,可以了解到图书馆现有馆藏的情况,包括图书的流通情况、更新情况和主题分布。这有助于在后续的图书荐购中更好地平衡馆藏发展,避免重复购买和提供更多多样化的图书选择。
[0038] 在所述步骤140中,在对初始图书荐购清单进行更新时,需要综合考虑图书馆的资源情况和读者的需求。根据图书馆的资源描述数据,可以对初始清单进行筛选和调整,确保购买的图书能够更好地补充馆藏、提高流通率和满足读者的需求。其中,通过基于图书馆资源描述数据的更新,可以得到更加精确和符合实际情况的图书荐购清单。有助于优化图书馆的馆藏发展,提供更符合读者需求的图书选择,提高图书馆的服务质量和读者满意度。
[0039] 通过上述步骤,图书馆可以更有效地管理图书荐购流程,优化图书馆的馆藏发展,提供更好的图书服务。
[0040] 具体地,在所述步骤110和所述步骤120中,获取所有阅读者的图书荐购请求,所述图书荐购请求包括候选图书;以及,对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单,其中,所述初始图书荐购清单中各个候选图书以被荐购的频次来进行排序。
[0041] 针对上述技术需求:如果图书馆因预算有限且考虑到现存图书资源,不可能响应所有读者的荐购请求,这就需要给荐购图书进行优先级排序,以结合图书馆资源的自身状况来确定荐购图书的优先级,以在读者和图书馆之间取得平衡,本申请的技术构思为基于阅读者的荐购需求和图书馆现有图书资源分析来对候选图书进行优先级排序,生成图书荐购清单。
[0042] 具体地,在本申请的技术方案中,获取所有阅读者的图书荐购请求,其中,所述图书荐购请求包括候选图书。接着,对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单,其中,所述初始图书荐购清单中各个候选图书以被荐购的频次来进行排序。也就是,以所述各个候选图书被荐购的频次作为统计关键键值来生成所述初始图书荐购清单。这里,应注意到所述初始图书荐购清单仅考虑了阅读者的荐购需求而没有结合图书馆的现存资源情况。
[0043] 应可以理解,通过获取所有阅读者的图书荐购请求,图书馆可以更好地了解读者的兴趣和需求。有助于图书馆购买更符合读者期望的图书,提供更多样化和个性化的阅读选择,从而增强读者的满意度和阅读体验。
[0044] 对所有阅读者的图书荐购请求进行统计分析可以确定哪些图书受到了更多的关注和需求。以被荐购的频次来排序候选图书可以帮助图书馆优先购买那些最受欢迎和需求最高的图书,有助于提高图书的借阅率和流通率,使图书馆的资源得到更充分的利用。
[0045] 通过统计分析图书荐购请求,图书馆可以获得关于读者需求的定量数据。这些数据可以用于指导图书采购决策,帮助图书馆更准确地选择和购买图书。这样可以避免购买过多的不受欢迎或重复的图书,提高图书馆采购的效率和准确性。
[0046] 通过积极回应和采纳读者的图书荐购请求,图书馆可以树立良好的形象和声誉。这表明图书馆关注读者的需求,并愿意为其提供所需的图书资源。有助于增加读者对图书馆的信任和忠诚度,吸引更多读者使用图书馆的服务。
[0047] 也就是,获取所有阅读者的图书荐购请求并进行统计分析可以满足读者需求,提高图书流通率,优化图书采购决策,并提升图书馆的声誉。这些有益效果有助于提高图书馆的服务质量,增强读者满意度,并使图书馆成为读者喜爱的阅读场所。
[0048] 具体地,在所述步骤130中,获取图书馆资源描述数据,其中,所述图书馆资源描述数据包括藏书量、流通率、更新率和主题分布。
[0049] 基于此,在本申请的技术方案中,进一步获取图书馆资源描述数据,其中,所述图书馆资源描述数据包括藏书量、流通率、更新率和主题分布。获取所有阅读者的图书荐购请求可以了解读者的兴趣和需求,而获取图书馆资源描述数据可以了解图书馆现有馆藏的情况。通过综合分析这两方面的信息,可以更好地平衡读者需求和图书馆的资源情况,确保购买的图书能够更好地补充馆藏、提高流通率和满足读者的需求。
[0050] 通过对图书馆资源描述数据的分析,可以确定图书馆已有的图书种类和数量。在更新图书荐购清单时,可以避免购买重复的图书,避免浪费资源。同时,可以发现馆藏中存在的空白领域或不足之处,从而针对性地购买那些缺失的图书,丰富馆藏,提供更全面的阅读选择。
[0051] 通过更新图书荐购清单,购买符合读者需求的图书,可以提高图书的流通率和借阅率。如果图书馆的馆藏能够更好地满足读者的需求,读者更有可能借阅这些图书,从而提高图书馆的使用率和效益。
[0052] 通过对图书荐购清单的更新,可以根据读者需求和图书馆资源情况进行更精确的馆藏发展策略。有助于图书馆更好地规划和管理馆藏,使其更符合读者的兴趣和需求,提高图书馆的服务质量和读者满意度。
[0053] 获取所有阅读者的图书荐购请求和获取图书馆资源描述数据对最后对初始图书荐购清单进行更新起到了综合考虑读者需求和馆藏情况、避免重复购买、填补馆藏空白、提高图书流通率和借阅率,以及优化馆藏发展策略等作用。这些作用有助于提高图书馆的服务质量,满足读者需求,并使图书馆成为读者喜爱的阅读场所。
[0054] 具体地,在所述步骤140中,基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单。图3为根据本申请实施例的图书荐购方法中步骤140的子步骤的流程图,如图3所示,基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单,包括:141,对所述图书馆资源描述数据进行语义编码以得到图书馆资源语义编码特征向量;142,对所述初始图书荐购清单进行语义编码以得到多个候选图书上下文编码特征向量;143,基于所述各个候选图书的被荐购的频次,对所述多个候选图书上下文编码特征向量进行加权优化以得到多个加权后候选图书上下文编码特征向量;144,分别计算所述各个加权后候选图书上下文编码特征向量与所述图书馆资源语义编码特征向量之间的关联特征矩阵以得到多个关联特征矩阵;以及,145,基于所述多个关联特征矩阵,对所述初始图书荐购清单进行更新以得到更新图书荐购清单。
[0055] 在本申请中,首先,通过将图书馆资源描述数据和初始图书荐购清单进行语义编码,可以更好地理解和比较它们之间的语义关系。加权优化和关联特征矩阵的计算可以提高候选图书与图书馆资源之间的匹配程度,从而提高图书荐购的准确性和相关性。然后,通过对候选图书进行加权优化和关联特征矩阵的计算,可以根据读者的兴趣和图书馆资源的特点,提供更个性化的图书推荐和服务。有助于满足读者的需求,增加他们对图书馆的满意度和忠诚度。接着,基于关联特征矩阵,可以对初始图书荐购清单进行更新和优化,使其更符合图书馆的馆藏发展策略和读者需求。这提供了决策支持,帮助图书馆进行高效的荐购决策,优化馆藏发展,提升图书馆的服务质量。
[0056] 对于所述步骤141,包括:使用基于转换器的Bert模型对所述图书馆资源描述数据进行语义编码以得到所述图书馆资源语义编码特征向量。
[0057] 接着,对所述图书馆资源描述数据进行语义编码以得到图书馆资源语义编码特征向量,也就是,对所述图书馆资源描述数据进行语义理解以得到用于表示图书馆现存资源分布语义特征的所述图书馆资源语义编码特征向量。
[0058] 特别地,在本申请的技术方案中,需结合阅读者的图书荐购请求和所述图书馆资源分布来更新所述图书荐购清单,即,结合图书馆资源的自身状况来确定荐购图书的优先级,以在读者和图书馆之间取得平衡。
[0059] 进一步地,通过对图书馆资源描述数据进行语义编码,可以将文本转换为语义空间中的特征向量,这样做可以帮助图书馆更好地理解文本的语义含义,而不仅仅是基于关键词的匹配。通过比较不同资源描述数据之间的语义相似度,图书馆可以更准确地确定资源之间的关联性和相似性,从而更好地进行馆藏发展和图书推荐。
[0060] 基于BERT模型的语义编码可以用于文本分类和聚类任务,图书馆可以利用这些特征向量对图书资源进行分类,例如按照主题、类型或类别进行分类。这有助于组织和管理馆藏,使读者更容易找到他们感兴趣的图书。此外,通过聚类相似的资源,图书馆可以创建主题集合或推荐相关图书,提供更个性化的阅读建议。
[0061] 通过对图书馆资源描述数据进行语义编码,可以构建推荐系统和提供个性化的服务。基于用户的兴趣和偏好,可以利用资源的语义编码特征向量来推荐相似或相关的图书。这样可以提高读者的发现性和满意度,使他们更容易找到符合自己兴趣的图书。
[0062] 通过对图书馆资源描述数据进行语义编码,可以进行更深入的馆藏分析和决策支持。例如,可以分析不同主题或类型的图书在馆藏中的分布情况,了解各个领域的覆盖程度。这样可以帮助图书馆确定馆藏的发展方向和策略,填补馆藏空白,提高资源的全面性和多样性。对于所述步骤142,包括:使用所述基于转换器的Bert模型对所述初始图书荐购清单进行语义编码以得到所述多个候选图书上下文编码特征向量。
[0063] 相应地,在本申请的技术方案中,为了进行“阅读者的图书荐购请求和所述图书馆资源分布”之间的结合分析,将所述初始图书荐购清单通过包含词嵌入层的上下文编码器以得到多个候选图书上下文编码特征向量。也就是,同样使用所述包含词嵌入层的上下文编码器对所述初始图书荐购清单中各个候选图书进行语义编码以得到所述多个候选图书上下文编码特征向量。并且,因所述各个候选图书的被荐购的频次不同,其在一定程度上表示各个候选图书的“重要性”不同,因此,为了更为可区分所述各个候选图书上下文编码特征向量,进一步地以所述各个候选图书的被荐购的频次作为权重分别对所述多个候选图书上下文编码特征向量进行加权以得到多个加权后候选图书上下文编码特征向量。
[0064] 对于所述步骤143,包括:以所述各个候选图书的被荐购的频次作为权重分别对所述多个候选图书上下文编码特征向量进行加权以得到多个初始加权后候选图书上下文编码特征向量;将所述多个候选图书上下文编码特征向量进行级联以获得第一级联特征向量;将所述初始加权后候选图书上下文编码特征向量进行级联以获得第二级联特征向量;基于所述第一级联特征向量对所述第二级联特征向量进行希尔伯特空间启发式序列跟踪均衡化以得到优化第二级联特征向量;以及,将所述优化第二级联特征向量进行特征向量切分以得到所述多个加权后候选图书上下文编码特征向量。
[0065] 特别地,在本申请的技术方案中,将所述初始图书荐购清单通过包含词嵌入层的上下文编码器得到的所述多个候选图书上下文编码特征向量分别表达候选图书的上下文关联文本语义,而在以所述各个候选图书的被荐购的频次作为权重分别对所述多个候选图书上下文编码特征向量进行加权后,所得到的多个加权后候选图书上下文编码特征向量在由荐购频次整体加权后,可能导致偏离原候选图书的文本语义,从而使得分类过程中对文本语义的利用不够,也就是,候选图书的文本语义特征与荐购频次特征之间具有分类过程中的信息不均衡。
[0066] 基于此,本申请的申请人首先将所述多个候选图书上下文编码特征向量级联以获得第一级联特征向量,例如记为 ,再将所述多个加权后候选图书上下文编码特征向量级联以获得第二级联特征向量,例如记为 并以作为候选图书的文本语义表达的第一级联特征向量 来对所述第二级联特征向量 进行希尔伯特空间启发式序列跟踪均衡化,具体表示为:以如下优化公式基于所述第一级联特征向量对所述第二级联特征向量进行希尔伯特空间启发式序列跟踪均衡化以得到优化第二级联特征向量;其中,所述优化公式为:
[0067]
[0068] 其中, 为所述第一级联特征向量, 为所述第二级联特征向量, 为所述优化第二级联特征向量, 为所述第二级联特征向量的转置向量, 表示所述第一级联特征向量 和所述第二级联特征向量 的级联向量的二范数, 表示所述第一级联特征向量 和所述第二级联特征向量 的所有特征值构成的并集集合的均值,且所述第一级联特征向量 和所述第二级联特征向量 均为行向量, 表示按位置点乘, 表示按位置加法, 是所述第一级联特征向量中所有位置的特征值的集合,是所述第二级联特征向量中所有位置的特征值的集合。
[0069] 这里,利用具有内积的希尔伯特空间的完备内积空间特性,来通过所述第一级联特征向量 和所述第二级联特征向量 的序列聚合的集合性均值(collective average),探索所述第一级联特征向量 和所述第二级联特征向量 在特定参数加权下的基于序列的空间分布启发式(heuristics),从而将所述第二级联特征向量 的各个局部特征分布转化为融合空间内的序列跟踪实例(tracked instance),以实现序列的特征空间分布的跟踪小片段认知的(tracklet‑aware)分布均衡化。然后,再将所述第二级联特征向量 还原为所述多个加权后候选图书上下文编码特征向量,就通过所述第二级联特征向量 相对于所述第一级联特征向量 的分布均衡化,实现了候选图书的文本语义特征与荐购频次特征之间在分类过程中的信息利用均衡化,从而改进通过分类器获得的分类结果的准确性。
[0070] 对于所述步骤144,在得到所述多个加权后候选图书上下文编码特征向量后,分别计算所述各个加权后候选图书上下文编码特征向量与所述图书馆资源语义编码特征向量之间的关联特征矩阵以得到多个关联特征矩阵。也就是,以所述各个加权后候选图书上下文编码特征向量与所述图书馆资源语义编码特征向量之间的关联特征矩阵来表示各个候选图书的荐购语义特征向量和现存图书资源分布特征之间的关联信息。
[0071] 具体地,以如下关联公式分别计算所述各个加权后候选图书上下文编码特征向量与所述图书馆资源语义编码特征向量之间的关联特征矩阵以得到多个关联特征矩阵;其中,所述关联公式为:
[0072]
[0073] 其中, 示所述各个加权后候选图书上下文编码特征向量, 表示所述各个加权后候选图书上下文编码特征向量的转置向量, 表示所述图书馆资源语义编码特征向量, 表示所述多个关联特征矩阵, 表示向量相乘。
[0074] 对于所述步骤145,包括:将所述多个关联特征矩阵分别通过分类器以得到多个概率值;以及,基于所述多个概率值之间的排序,生成所述更新图书荐购清单。
[0075] 进一步地,将所述多个关联特征矩阵分别通过分类器以得到多个概率值。也就是,使用所述分类器对所述多个关联特征矩阵进行分类以得到所述多个概率值,所述各个概率值用于表示各个候选图书获得最高优先级的概率值。在得到所述多个概率值后,基于所述多个概率值之间的排序,生成更新图书荐购清单。
[0076] 综上,基于本申请实施例的图书荐购方法100被阐明,于阅读者的荐购需求和图书馆现有图书资源分析来对候选图书进行优先级排序,生成图书荐购清单。
[0077] 在本申请的一个实施例中,图4为根据本申请实施例的书荐购系统的框图。如图4所示,根据本申请实施例的书荐购系统200,包括:荐购请求获取模块210,用于获取所有阅读者的图书荐购请求,所述图书荐购请求包括候选图书;统计分析模块220,用于对所述所有阅读者的图书荐购请求进行统计分析以得到初始图书荐购清单,其中,所述初始图书荐购清单中各个候选图书以被荐购的频次来进行排序;资源描述数据获取模块230,用于获取图书馆资源描述数据,其中,所述图书馆资源描述数据包括藏书量、流通率、更新率和主题分布;以及,荐购清单更新模块240,用于基于所述图书馆资源描述数据,对所述初始图书荐购清单进行更新以得到更新图书荐购清单。
[0078] 这里,本领域技术人员可以理解,上述书荐购系统中的各个单元和模块的具体功能和操作已经在上面参考图1到图3的书荐购方法的描述中得到了详细介绍,并因此,将省略其重复描述。
[0079] 如上所述,根据本申请实施例的书荐购系统200可以实现在各种终端设备中,例如用于书荐购的服务器等。在一个示例中,根据本申请实施例的书荐购系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该书荐购系统200可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该书荐购系统200同样可以是该终端设备的众多硬件模块之一。
[0080] 替换地,在另一示例中,该书荐购系统200与该终端设备也可以是分立的设备,并且书荐购系统200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
[0081] 在本申请中,提供了一种存储介质,包括:其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如所述的图书荐购方法。
[0082] 应可以理解,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等) 上实施的计算机程序产品的形式。
[0083] 本申请实施例的方法、系统、和计算机程序产品的流程图和/或框图来描述的。应理解可由计算机程序指令实现流程图和/或框图中的每一流程和/或方框、以及流程图和/或框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的装置。
[0084] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能。
[0085] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的步骤。
[0086] 图5为根据本申请实施例的图书荐购方法的场景示意图。如图5所示,在该应用场景中,首先,,获取所有阅读者的图书荐购请求(例如,如图5中所示意的C1),以及,获取图书馆资源描述数据(例如,如图5中所示意的C2);然后,将获取的图书荐购请求和图书馆资源描述数据输入至部署有图书荐购算法的服务器(例如,如图5中所示意的S)中,其中所述服务器能够基于图书荐购算法对所述图书荐购请求和所述图书馆资源描述数据进行处理,以对所述初始图书荐购清单进行更新以得到更新图书荐购清单。
[0087] 还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
[0088] 提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
[0089] 为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。