网页资源推送方法、服务器及存储介质转让专利

申请号 : CN201810886682.9

文献号 : CN109063142B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 许榕榕王文灿

申请人 : 网宿科技股份有限公司

摘要 :

本发明实施方式涉及互联网技术领域,公开了一种网页资源推送方法及服务器。本发明实施方式中,网页资源推送方法包括:预存各网页的网页记录项;其中,网页记录项中包括网页的特征信息以及页面资源信息;接收到客户端的网页请求时,根据网页请求中包括的统一资源定位符URL信息,获取网页请求的特征信息;在预存的网页记录项中,查找与网页请求的特征信息匹配的网页记录项;将查找到的网页记录项的页面资源信息推送至客户端。本发明实施方式还提供了一种服务器。采用本发明实施方式,不仅能够减少人工干预的配置操作,而且能够缩短客户端的网页加载时长。

权利要求 :

1.一种网页资源推送方法,其特征在于,包括:

预存各网页的网页记录项;其中,所述网页记录项中包括根据所述网页的统一资源定位符URL信息生成的特征信息以及页面所包含的资源对象的URL信息;

接收到客户端的网页请求时,根据所述网页请求中包括的URL信息,获取所述网页请求的特征信息;

在所述预存的网页记录项中,查找与所述网页请求的特征信息匹配的网页记录项;

将查找到的所述网页记录项的页面所包含的资源对象的URL信息推送至所述客户端;

所述在预存的网页记录项中,查找与所述网页请求的特征信息匹配的网页记录项,具体包括:计算各所述网页记录项的特征信息与所述网页请求的特征信息的相似度;

将最高相似度的网页记录项作为与所述网页请求的特征信息匹配的网页记录项。

2.根据权利要求1所述的网页资源推送方法,其特征在于,所述根据所述网页请求中包括的统一资源定位符URL信息,获取所述网页请求的特征信息,具体包括:获取所述URL信息中包括的域名信息以及统一资源标识符URI信息;

根据所述URI信息生成特征值以及特征向量;

将所述域名信息、所述特征值以及所述特征向量作为所述网页请求的特征信息。

3.根据权利要求2所述的网页资源推送方法,其特征在于,所述根据所述URI信息生成特征值以及特征向量,具体包括:获取所述URI信息中包括的各字符串;

对各所述字符串进行哈希运算,获取各所述字符串对应的哈希值;

根据各所述字符串对应的哈希值,计算得到所述特征值;以及根据各所述字符串在所述URI信息中的位置顺序以及各所述字符串对应的哈希值,生成所述特征向量。

4.根据权利要求1所述的网页资源推送方法,其特征在于,所述计算各所述网页记录项的特征信息与所述网页请求的特征信息的相似度,具体包括:利用余弦相似度和欧氏距离的混合算法,计算各所述网页记录项的特征信息与所述网页请求的特征信息的相似度。

5.根据权利要求1所述的网页资源推送方法,其特征在于,所述将查找到的所述网页记录项的页面所包含的资源对象的URL信息推送至所述客户端前,还包括:判断所述最高相似度是否大于预设阈值;

若判断结果为是,则执行所述将查找到的所述网页记录项的页面所包含的资源对象的URL信息推送至所述客户端。

6.根据权利要求1所述的网页资源推送方法,其特征在于,所述页面所包含的资源对象的URL信息为所述网页中优先级和出现频率符合预设条件的资源对象URL信息。

7.根据权利要求6所述的网页资源推送方法,其特征在于,所述预设条件为:所述优先级中所述出现频率最高的资源对象。

8.根据权利要求1所述的网页资源推送方法,其特征在于,所述根据所述网页的统一资源定位符URL信息生成的特征信息包括根据所述网页的URL信息获取的所述网页的域名、特征值和特征向量。

9.一种服务器,其特征在于,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一所述的网页资源推送方法。

10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的网页资源推送方法。

说明书 :

网页资源推送方法、服务器及存储介质

技术领域

[0001] 本发明实施方式涉及互联网技术领域,特别涉及网页资源推送方法及服务器。

背景技术

[0002] 互联网工程任务组在2015年发布了超文本传输协议HTTP/2协议,着重于改进传输性能,实现低延迟和高吞吐量。相对于HTTP/1.1协议而言,HTTP/2的主要改进如下:二进制传输、头部压缩、多路复用和服务器推送(Server Push)。当前,大部分传统内容分发网络CDN (Content Delivery Network,简称CDN)厂商、云厂商已宣布支持HTTP/2,同时,对于Server Push的支持也被提上议程。但是,本专利申请的发明人发现:
[0003] 现有技术中的Server Push方法大多是通过链接Link头来携带需要推送的页面资源信息。即,服务器需要先接收来自源站或上游节点的响应,并解析响应得到Link头,再根据Link 头中所携带的资源推送信息,向客户端推送相应的资源信息。这样,不仅需要人工干预进行 link头的配置,操作较为繁琐,而且服务器在推送资源信息前,会存在一定的等待时间(接收上游节点或源站的响应及解析link头的时间),从而会导致客户端的网页加载时间较长,用户体验较差。

发明内容

[0004] 本发明实施方式的目的在于提供一种网页资源推送方法及服务器,不仅能够减少人工干预的配置操作,而且能够缩短客户端的网页加载时长。
[0005] 为解决上述技术问题,本发明的实施方式提供了一种网页资源推送方法,包括:
[0006] 预存各网页的网页记录项;其中,网页记录项中包括网页的特征信息以及页面资源信息;
[0007] 接收到客户端的网页请求时,根据网页请求中包括的统一资源定位符URL(Uniform Resource Locator,简称URL)信息,获取网页请求的特征信息;
[0008] 在预存的网页记录项中,查找与网页请求的特征信息匹配的网页记录项;
[0009] 将查找到的网页记录项的页面资源信息推送至客户端。
[0010] 本发明的实施方式还提供了一种服务器,包括:
[0011] 至少一个处理器;以及,
[0012] 与至少一个处理器通信连接的存储器;其中,
[0013] 存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行上述的网页推送方法。
[0014] 本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述的网页推送方法。
[0015] 本发明实施方式相对于现有技术而言,服务器中预存有各网页的网页记录项,网页记录项中包括该网页的特征信息以及页面资源信息。这样,服务器在接收到客户端的网页请求时,便可以根据网页请求中的URL信息获取该网页请求的特征信息,将网页请求的特征信息与预存的网页的特征信息自行匹配以获取网页请求对应的网页记录项,以便于根据所获取的网页记录项进行页面资源信息的推送。通过这种方式,服务器在接收到客户端的网页请求后,通过特征信息的匹配,能够自动地进行页面资源信息的推送,不仅无需人工干预进行link头的配置,智能化程度较高,也无需等待接收上游节点或源站的响应及解析link头的时间,进而缩短了客户端的网页加载时长。
[0016] 另外,根据网页请求中包括的统一资源定位符URL信息,获取网页请求的特征信息,具体包括:获取URL信息中包括的域名信息以及统一资源标识符URI  (Uniform Resource Identifier,简称URI)信息;根据URI信息生成特征值以及特征向量;将域名信息、特征值以及特征向量作为网页请求的特征信息。这样,将网页请求中字符串形式的URL信息进行数值化成特征信息,便于与预存的网页的特征信息进行对比和匹配。另外也提供了根据网页请求中包括的统一资源定位符URL信息,获取网页请求的特征信息的一种具体实现形式,增加了本发明实施方式的灵活性。并且,根据URL信息中包括的域名信息以及 URI信息来获取特征信息,能够保证所获取的特征信息与网页请求的关联度较大,令所获取的特征信息具有较强的代表性。
[0017] 另外,在预存的网页记录项中,查找与网页请求的特征信息匹配的网页记录项,具体包括:计算各网页记录项的特征信息与网页请求的特征信息的相似度;将最高相似度的网页记录项作为与网页请求的特征信息匹配的网页记录项,从而为服务器推送的页面资源信息与用户需求的高匹配度提供了可能。
[0018] 另外,将查找到的网页记录项的页面资源信息推送至客户端前,还包括:判断最高相似度是否大于预设阈值;若判断结果为是,则执行将查找到的网页记录项的页面资源信息推送至客户端。这样,能够保证推送的页面资源信息的准确性,令服务器推送至客户端的页面资源信息与用户实际需求的匹配度较高,有效地保证了用户良好地上网体验。
[0019] 另外,页面资源信息为网页中优先级和出现频率符合预设条件的资源对象URL信息。这样,服务器无需将网页中的所有资源对象的URL信息都进行推送,降低了服务器的推送压力以及客户端的页面加载压力。并且,服务器能够尽可能地将热点资源对象推送给客户端,从而进一步地提升了页面资源信息的准确性,令服务器推送至客户端的页面资源信息与用户实际需求的匹配度更高。

附图说明

[0020] 一个或多个实施方式通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施方式的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
[0021] 图1是根据第一实施方式中网页资源推送方法的具体流程图;
[0022] 图2是根据第一实施方式中服务器根据URL信息,获取网页请求的特征信息的具体流程图;
[0023] 图3是根据第四实施方式的服务器的示意图。

具体实施方式

[0024] 为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
[0025] 本发明的第一实施方式涉及一种网页资源推送方法,具体流程如图1所示。本实施方式中的网页资源推送方法在服务器上进行实施,步骤如下:
[0026] 步骤101,接收到客户端的网页请求时,根据网页请求中包括的统一资源定位符URL信息,获取网页请求的特征信息。
[0027] 具体地说,用户可以通过手机、电脑、平板电脑上的浏览器或其他应用程序向服务器发送网页请求,以便于服务器在接收到客户端的网页请求时,根据网页请求中包括的统一资源定位符URL信息,获取网页请求的特征信息。
[0028] 更具体地说,服务器根据URL信息,获取网页请求的特征信息的方式可以如图2所示,服务器执行步骤1011,获取URL信息中包括的域名信息以及URI信息;而后,服务器执行步骤1012,根据URI信息生成特征值以及特征向量;最后,服务器执行步骤1013,将域名信息、特征值以及特征向量作为网页请求的特征信息。以下对图2所示的方法进行举例说明:
[0029] 如,URL信息为https://news.qq.com/a/20180701/015941.htm,则服务器执行步骤1011,获取的域名信息为news.qq.com,URI信息为/a/20180701/015941.htm。而后,服务器执行步骤 1012生成特征值的部分,如,服务器根据URI信息中包括的各字符串,对各字符串进行哈希运算,获取各字符串对应的哈希值,以便于根据各字符串对应的哈希值,计算特征值。如, URI信息为/a/20180701/015941.htm,所包括的字符串为a、20180701、015941、htm,服务器对a、20180701、015941、htm进行哈希运算,获取各字符串对应的哈希值,如,a、20180701、 015941、htm这些字符串对应的哈希值分别为1、2、3、4,那么,服务器可以将各字符串对应的哈希值进行相加,从而获取特征值10;并且,服务器执行步骤1012生成特征向量的部分,如,服务器根据各字符串在URI信息中的位置顺序,以及根据各字符串对应的哈希值,获取特征向量,如上述举例,服务器获取到特征向量可以为[1,2,3,4]。
[0030] 由此可见,服务器最终获取的网页请求的特征信息为:news.qq.com,10,[1,2,3,4]。不难看出,在上述服务器对URL信息进行处理的过程中,服务器以较小的计算量实现了字符型URL信息的数值化,因而服务器在接收到客户端的网页请求时,能够较为快速地获取到网页请求的特征信息。并且,服务器根据URL信息中包括的域名信息以及URI信息来获取特征信息,能够保证所获取的特征信息与网页请求的关联度较大,令所获取的特征信息具有较强的代表性。
[0031] 需要注意的是,图2对服务器获取特征信息的举例仅作为示例性说明,本实施方式中并不对服务器如何获取特征信息的具体实现形式做任何限定。
[0032] 步骤102,在预存的网页记录项中,查找与网页请求的特征信息匹配的网页记录项。
[0033] 具体地说,网页记录项中包括网页的特征信息以及页面资源信息,技术人员可以预先将各网页的网页记录项输入并保存在服务器中,或者,服务器可以预先自动生成各网页的网页记录项。如,技术人员可以预先将上述举例的特征信息的计算方法输入并保存在CDN服务器中,以实现CDN服务器上各网页的网页记录项的自动生成。以下进行具体说明:
[0034] 具体地说,门户网站(如,新浪新闻、腾讯新闻、百度等)会将用户的访问流量引导到 CDN服务器上进行流量疏导或加速处理,因此CDN服务器可以获取门户网站下的各网页与用户间的交互信息,从而获取门户网站下各网页的页面相关信息(如,网页的URL信息、网页所包含的各css资源对象的URL信息、各js资源对象的URL信息等)。也就是说,服务器为CDN服务器时,服务器可以直接通过对用户的访问信息进行记录的方式,实现各门户网站下各网页的页面相关信息的采集与记录。
[0035] 这样,服务器生成某一网页的网页记录项时,服务器可以根据获取到的该网页的URL信息、网页所包含的各css资源对象的URL信息、各js资源对象的URL信息等信息,将网页的各css资源对象的URL信息、各js资源对象的URL信息作为页面资源信息添加至网页记录项中。并且,服务器还可以根据预设的特征信息的计算方法以及网页的URL信息,生成网页的特征信息,将特征信息添加至网页记录项中,网页的特征信息包括根据该网页的URL信息获取和计算得到的该网页的域名、特征值和特征向量。其中,由于网页所包含的资源对象并非是固定不变的,因此技术人员还可以在服务器上设置更新周期,从而令服务器能够定期地更新网页记录项所包含的页面资源信息,为提高推送信息的准确性提供了基础。
[0036] 需要注意的是,服务器也可以为第三方服务器,如,技术人员将特征信息的计算方法输入并保存第三方服务器中,且CDN服务器将采集的数据传输给第三方服务器。这样,也能在第三方服务器上实现各网页的网页记录项的自动生成。
[0037] 值得一提的是,服务器在获取网页记录项后,还可以根据网页记录项中特征信息的域名信息,对网页记录项进行分类。如,服务器可以将特征信息中域名信息相同的网页记录项归置在一起,从而相当于为每个门户网站单独设置了一份网页记录项表。
[0038] 本实施方式中,服务器查找与网页请求的特征信息匹配的网页记录项的方式可以为:服务器计算各网页记录项的特征信息与网页请求的特征信息的相似度,将最高相似度的网页记录项作为网页请求的特征信息对应的网页记录项。如,服务器可以先根据网页请求的特征信息中所包括的域名信息,获取特征信息中域名信息与上述域名信息相同的各网页记录项,将这些网页记录项记为待选择网页记录项,而后,服务器可以利用余弦相似度和欧氏距离的混合算法,计算各待选择网页记录项的特征值、特征向量与网页请求的特征值、特征向量的相似度,从而将最高相似度的网页记录项作为网页请求的特征信息对应的网页记录项。如,服务器可以利用余弦相似度计算出一个相似度、利用欧氏距离计算出另一个相似度,而后,服务器可以根据余弦相似度对应的权重以及欧氏距离对应的权重,对所计算出的两个相似度进行处理,从而获取最终的网页记录项与网页请求的相似度。
[0039] 需要注意的是,若服务器预先对网页记录项按照域名信息进行了分类,则服务器可以直接根据网页请求的特征信息所包括的域名信息,获取对应的分类,从而将该分类下的各网页记录项作为待选择网页记录项,操作较为便捷快速。
[0040] 步骤103,将查找到的网页记录项的页面资源信息推送至客户端。
[0041] 具体地说,服务器根据所获取的页面资源信息,创建新的HTTP/2推送流,以便于将页面资源信息推送至客户端。
[0042] 综上所述,本实施方式中的服务器预设了一个“先验数据库”,该先验数据库中包括各网页的网页记录项。这样,服务器在接收到客户端的网页请求时,可以根据网页请求中的URL 信息,自行在“先验数据库”中匹配出合适的网页记录项,以便于根据所获取的网页记录项进行页面资源信息的推送。通过这种方式,服务器在接收到客户端的网页请求后,能够自动地进行页面资源信息的推送,不仅无需人工干预进行link头的配置,智能化程度较高,也无需等待接收上游节点或源站的响应及解析link头的时间,进而缩短了客户端的网页加载时长。
[0043] 本发明的第二实施方式涉及一种网页推送方法。第二实施方式在第一实施方式的基础上加以改进,主要改进之处在于:在本发明第二实施方式中,服务器需要对最高相似度进行判断,以确保页面资源信息的准确性。以下进行具体说明:
[0044] 本实施方式中,服务器判断最高相似度是否大于预设阈值,在判定最高相似度大于预设阈值的情况下,才将查找到的网页记录项的页面资源信息推送至客户端。
[0045] 具体地说,若最高相似度小于或等于预设阈值,则说明服务器目前存储的网页记录项中不存在与用户需求匹配度较高的网页记录项,此时服务器并不进行页面资源信息的推送,只对网页请求进行正常处理,如,服务器针对网页请求中包括的内容,对网页请求进行响应。若最高相似度大于预设阈值,则说明服务器目前存储的网页记录项中存在与用户需求匹配度较高的网页记录项,此时服务器除了根据网页请求中包括的内容,对网页请求进行响应外,还进行页面资源信息的推送,主动地将一些资源对象(如,css资源对象、js资源对象等)的 URL信息推送给客户端,令客户端获取到数量较多的、与用户需求匹配度较高的信息。
[0046] 与第一实施方式相比,本实施方式中的服务器能够有选择地判断是否进行页面资源信息的推送,有效地保证了页面资源信息的准确性。
[0047] 本发明的第三实施方式涉及一种网页推送方法。第三实施方式与第一实施方式大致相同,主要区别之处在于:网页记录项所包括的页面资源信息不同,以下进行具体说明:
[0048] 具体地说,网页中可能存在较多的资源对象,服务器在生成网页的页面资源信息时,可以摘选出网页中的部分资源对象作为需要推送的资源对象,以避免推送过多资源对象给用户造成困扰的情况。也就是说,服务器上预设有资源对象的筛选策略。
[0049] 本实施方式中,服务器预设的资源对象的筛选策略为:服务器根据优先级以及出现频率,摘选出符合预设条件的若干个资源对象,将这若干个资源对象的URL信息作为页面资源信息。这样,服务器对网页中的资源对象进行一个筛选,能够保留热度较高或价值较高的资源对象的URL信息作为页面资源信息。其中,预设条件可以由技术人员预先设置并保存在服务中,如,预设条件可以为优先级中出现频率最高的资源对象。这样,服务器便可以将每一优先级中出现频率最高的资源对象推送给客户端,令客户端网页加载后所显示的内容尽可能为热点信息,从而能够进一步地提升页面资源信息的准确性,令服务器推送至客户端的页面资源信息与用户实际需求的匹配度更高。其中,优先级用于表示资源对象在网页中使用的先后顺序,优先级越高的资源对象在网页中的使用越靠前。
[0050] 在实际操作时,服务器上预设的资源对象的筛选策略也可以为:服务器对网页中的各资源对象按照出现频率的高低进行排序,将排序位于前N的各资源对象的URL信息作为页面资源信息。其中,N为自然数,N的数值可以由技术人员预先设置并保存在服务器中,如, N可以为10。
[0051] 由此可见,技术人员可以根据实际需求设置资源对象的筛选策略,因而上述对资源对象的筛选策略的举例仅作为示例性说明,本实施方式并不对资源对象的筛选策略做任何限定。
[0052] 需要注意的是,服务器在筛选出若干个资源对象后,还可以根据各资源对象的优先级,将资源对象按照优先级的高低顺序进行排序,以便于根据排序结果将各资源对象的URL信息添加至页面资源信息中。这样,客户端在接收到服务器推送的页面资源信息后,可以实现资源对象的顺序展示,用户体验较好。
[0053] 与第一实施方式相比,本实施方式中的服务器无需将网页中的所有资源对象的URL信息都进行推送,降低了服务器的推送压力以及客户端的页面加载压力。并且,服务器能够尽可能地将热点资源对象推送给客户端,从而进一步地提升了页面资源信息的准确性,令服务器推送至客户端的页面资源信息与用户实际需求的匹配度更高。
[0054] 上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
[0055] 本发明第四实施方式涉及一种服务器,如图3所示,包括:至少一个处理器301;以及,与至少一个处理器301通信连接的存储器302;其中,存储器302存储有可被至少一个处理器301执行的指令,该指令被至少一个处理器301执行,以使至少一个处理器301能够执行上述方法实施方式中的网页推送方法。
[0056] 其中,存储器302和处理器301采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器301和存储器302的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器301处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器301。
[0057] 处理器301负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器302可以被用于存储处理器301在执行操作时所使用的数据。
[0058] 本发明的实施方式相对于现有技术而言,不仅能够减少人工干预的配置操作,而且能够缩短客户端的网页加载时长。
[0059] 本发明第五实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施方式中的网页推送方法。
[0060] 本发明的实施方式相对于现有技术而言,不仅能够减少人工干预的配置操作,而且能够缩短客户端的网页加载时长。
[0061] 即,本领域技术人员可以理解,实现上述实施方式方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM, Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0062] 本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施方式,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。