一种网址推荐方法、装置和通信系统转让专利

申请号 : CN201210456802.4

文献号 : CN103812906B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘健

申请人 : 腾讯科技(深圳)有限公司

摘要 :

本发明实施例公开了一种网址推荐方法、装置和通信系统。本发明实施例采用在接收到用户输入的网址信息后,根据网址规范对该用户输入的网址信息进行预处理,并根据该预处理后网址信息分别在本地访问记录的网址集合中以及云端服务器中的域名知识库系统中进行匹配,得到本地匹配网址集合和云端匹配网址集合,然后再综合这两个网址集合后在浏览器的网址推荐区显示推荐网址;该方案相对于现有技术中只进行简单的字符匹配而言,可以更加准确地为用户推荐网址,而且也可以提高推荐域名的安全性。

权利要求 :

1.一种网址推荐方法,其特征在于,包括:

接收用户输入的网址信息,并根据网址规范对所述用户输入的网址信息进行预处理,得到预处理后网址信息;

根据所述预处理后网址信息在本地访问记录的网址集合中进行匹配,得到本地匹配网址集合;

将所述预处理后网址信息发送给云端服务器,并接收云端服务器返回的云端匹配网址集合,所述云端匹配网址集合由云端服务器根据所述预处理后网址信息在域名知识库系统中进行匹配而得;

计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合;

在浏览器的网址推荐区显示所述推荐网址集合。

2.根据权利要求1所述的方法,其特征在于,

所述域名知识库系统包括各个网址的域名热度、域名信任度和用户选择率。

3.根据权利要求1或2所述的方法,其特征在于,所述预处理包括:将所述用户输入的网址信息中的域名和协议部分转化为小写字母;

在确定用户未输入协议号时为所述用户输入的网址信息添加预置的协议头;

确定用户未输入网址斜杠结尾时,为所述用户输入的网址信息添加斜杠结尾;

确定所述用户输入的网址信息中存在非法字符时,将所述非法字符替换为预置的对应字符,或者,删除所述非法字符。

4.根据权利要求1或2所述的方法,其特征在于,所述在浏览器的网址推荐区显示所述推荐网址集合,包括:获取用户设置的显示参数,所述显示参数指示优先推荐本地匹配网址集合,或者优先推荐云端匹配网址集合;

根据所述显示参数的指示在浏览器的网址推荐区显示所述推荐网址集合。

5.根据权利要求1或2所述的方法,其特征在于,所述在浏览器的网址推荐区显示所述推荐网址集合之后,还包括:接收用户从所述网址推荐区中选择的网址;

将所述选择的网址发送给云端服务器,以便所述云端服务器根据所述选择的网址更新所述域名知识库系统。

6.一种网址推荐方法,其特征在于,包括:

接收终端设备发送的预处理后网址信息,所述预处理后网址信息由终端设备根据网址规范对用户输入的网址信息进行预处理所得;

根据所述预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合;

将所述云端匹配网址集合发送给终端设备。

7.根据权利要求6所述的方法,其特征在于,

所述域名知识库系统包括各个网址的域名热度、域名信任度和用户选择率。

8.根据权利要求7所述的方法,其特征在于,根据所述预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合,所述域名知识库系统包括各个网址的域名热度、域名信任度和用户选择率,包括:在预置的域名知识库系统中查找包含所述预处理后网址信息的网址,得到第一网址集合;

根据第一网址集合中各个网址的域名热度、域名信任度和用户选择率计算各个网址的推荐指数,并根据推荐指数的高低对所述第一网址集合中各个网址进行排序;

按照从高到低的排序顺序在第一网址集合中选择前K个网址,得到云端匹配网址集合,K为预置的正整数。

9.根据权利要求6至8任一项所述的方法,其特征在于,所述预处理包括:将所述用户输入的网址信息中的域名和协议部分转化为小写字母;

在确定用户未输入协议号时为所述用户输入的网址信息添加预置的协议头;

确定用户未输入网址斜杠结尾时,为所述用户输入的网址信息添加斜杠结尾;

确定所述用户输入的网址信息中存在非法字符时,将所述非法字符替换为预置的对应字符,或者,删除所述非法字符。

10.根据权利要求6至8任一项所述的方法,其特征在于,所述将所述云端匹配网址集合发送给终端设备之后,还包括:接收终端设备发送的用户从所述网址推荐区中选择的网址;

根据所述选择的网址更新所述域名知识库系统。

11.根据权利要求7或8所述的方法,其特征在于,所述接收终端设备发送的预处理后网址信息之前,还包括:根据各个网址的域名热度、域名信任度和用户选择率建立域名知识库系统。

12.一种网址推荐装置,其特征在于,位于终端侧,包括:第一接收单元,用于接收用户输入的网址信息;

预处理单元,用于根据网址规范对所述用户输入的网址信息进行预处理,得到预处理后网址信息;

匹配单元,用于根据所述预处理后网址信息在本地访问记录的网址集合中进行匹配,得到本地匹配网址集合;

发送单元,用于将所述预处理后网址信息发送给云端服务器;

第二接收单元,用于接收云端服务器返回的云端匹配网址集合,所述云端匹配网址集合由云端服务器根据所述预处理后网址信息在域名知识库系统中进行匹配而得;

运算单元,用于计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合;

显示单元,用于在浏览器的网址推荐区显示所述推荐网址集合。

13.根据权利要求12所述的网址推荐装置,其特征在于,所述第二接收单元,具体用于接收云端服务器返回的云端匹配网址集合,所述云端匹配网址集合由云端服务器根据所述预处理后网址信息在域名知识库系统中进行匹配而得,所述域名知识库系统包括各个网址的域名热度、域名信任度和用户选择率。

14.根据权利要求12或13所述的网址推荐装置,其特征在于,所述预处理单元包括转化子单元、添加子单元和替换子单元;

转化子单元,用于将所述用户输入的网址信息中的域名和协议部分转化为小写字母;

添加子单元,用于在确定用户未输入协议号时为所述用户输入的网址信息添加预置的协议头;以及在确定用户未输入网址斜杠结尾时,为所述用户输入的网址信息添加斜杠结尾;

替换子单元,用于确定所述用户输入的网址信息中存在非法字符时,将所述非法字符替换为预置的对应字符,或者,删除所述非法字符。

15.根据权利要求12或13所述的网址推荐装置,其特征在于,所述显示单元包括参数获取子单元和显示子单元;

参数获取子单元,用于获取用户设置的显示参数,所述显示参数指示优先推荐本地匹配网址集合,或者优先推荐云端匹配网址集合;

显示子单元,用于根据所述显示参数的指示在浏览器的网址推荐区显示所述推荐网址集合。

16.根据权利要求12或13所述的网址推荐装置,其特征在于,第一接收单元,还用于接收用户从所述网址推荐区中选择的网址;

发送单元,还用于将所述选择的网址发送给云端服务器,以便所述云端服务器根据所述选择的网址更新所述域名知识库系统。

17.一种网址推荐装置,其特征在于,位于网络侧,包括:接收单元,用于接收终端设备发送的预处理后网址信息,所述预处理后网址信息由终端设备根据网址规范对用户输入的网址信息进行预处理所得;

匹配单元,用于根据所述预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合;

发送单元,用于将所述云端匹配网址集合发送给终端设备。

18.根据权利要求17所述的网址推荐装置,其特征在于,所述匹配单元,具体用于根据所述预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合,所述域名知识库系统包括各个网址的域名热度、域名信任度和用户选择率。

19.根据权利要求18所述的网址推荐装置,其特征在于,所述匹配单元包括查找子单元、排序子单元和选择子单元;

查找子单元,用于在预置的域名知识库系统中查找包含所述预处理后网址信息的网址,得到第一网址集合;

排序子单元,用于根据第一网址集合中各个网址的域名热度、域名信任度和用户选择率计算各个网址的推荐指数,并根据推荐指数的高低对所述第一网址集合中各个网址进行排序;

选择子单元,用于按照从高到低的排序顺序在第一网址集合中选择前K个网址,得到云端匹配网址集合,K为预置的正整数。

20.根据权利要求17至19任一项所述的网址推荐装置,其特征在于,还包括更新单元;

所述接收单元,还用于接收终端设备发送的用户从所述网址推荐区中选择的网址;

所述更新单元,用于根据所述选择的网址更新所述域名知识库系统。

21.根据权利要求18或19任一项所述的网址推荐装置,其特征在于,还包括建立单元;

建立单元,用于根据各个网址的域名热度、域名信任度和用户选择率建立域名知识库系统。

22.一种通信系统,其特征在于,包括权利要求12至16中任一种位于终端侧的网址推荐装置和权利要求17至21种任一种位于网络侧的网址推荐装置。

说明书 :

一种网址推荐方法、装置和通信系统

技术领域

[0001] 本发明涉及通信技术领域,具体涉及一种网址推荐方法、装置和通信系统。

背景技术

[0002] 随着互联网的不断普及,越来越多网民开始通过浏览器访问网络上丰富多样的资源。一般而言,获取网络上特定的资源需要用户在浏览器地址栏中输入相应的网址,即统一资源定位符(URL,Uniform Resource Locator)。不同网址代表不同的网络资源,即使输入的网址只有微小差别,也可能得到截然不同的网页内容。比如,目标网页的网址为“www.12345.com”,若输成“www.12346.com”,则会访问与该目标网页毫无关联的另外一个网页。
[0003] 现有技术中,一般的,浏览器在用户输入网址时都会根据输入内容进行网址的自动补全和推荐,以方便用户迅速完成网址的输入。例如,当用户输入字符串“tao”后,浏览器就会根据输入字符串自动进行网址匹配,推荐包含“tao”的各种网址,方便用户快捷访问。
[0004] 在对现有技术的研究和实践过程中,本发明的发明人发现,由于现有技术采用简单的字符串匹配方案进行网址推荐,所以当用户少输入字符,或输入错误字符时,浏览器将无法推荐合理的网址,甚至有可能会推荐一些恶意网站,安全性不高。

发明内容

[0005] 本发明实施例提供一种网址推荐方法、装置和通信系统,可以提高网址推荐的正确性和安全性。
[0006] 一种网址推荐方法,包括:
[0007] 接收用户输入的网址信息,并根据网址规范对所述用户输入的网址信息进行预处理,得到预处理后网址信息;
[0008] 根据所述预处理后网址信息在本地访问记录的网址集合中进行匹配,得到本地匹配网址集合;
[0009] 将所述预处理后网址信息发送给云端服务器,并接收云端服务器返回的云端匹配网址集合,所述云端匹配网址集合由云端服务器根据所述预处理后网址信息在域名知识库系统中进行匹配而得;
[0010] 计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合;
[0011] 在浏览器的网址推荐区显示所述推荐网址集合。
[0012] 一种网址推荐方法,包括:
[0013] 接收终端设备发送的预处理后网址信息,所述预处理后网址信息由终端设备根据网址规范对用户输入的网址信息进行预处理所得;
[0014] 根据所述预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合;
[0015] 将所述云端匹配网址集合发送给终端设备。
[0016] 一种网址推荐装置,位于终端侧,包括:
[0017] 第一接收单元,用于接收用户输入的网址信息;
[0018] 预处理单元,用于根据网址规范对所述用户输入的网址信息进行预处理,得到预处理后网址信息;
[0019] 匹配单元,用于根据所述预处理后网址信息在本地访问记录的网址集合中进行匹配,得到本地匹配网址集合;
[0020] 发送单元,用于将所述预处理后网址信息发送给云端服务器;
[0021] 第二接收单元,用于接收云端服务器返回的云端匹配网址集合,所述云端匹配网址集合由云端服务器根据所述预处理后网址信息在域名知识库系统中进行匹配而得;
[0022] 运算单元,用于计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合;
[0023] 显示单元,用于在浏览器的网址推荐区显示所述推荐网址集合。
[0024] 一种网址推荐装置,位于网络侧,包括:
[0025] 接收单元,用于接收终端设备发送的预处理后网址信息,所述预处理后网址信息由终端设备根据网址规范对用户输入的网址信息进行预处理所得;
[0026] 匹配单元,用于根据所述预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合;
[0027] 发送单元,用于将所述云端匹配网址集合发送给终端设备。
[0028] 一种通信系统,包括本发明实施例提供的任一种位于终端侧的网址推荐装置和任一种位于网络侧的网址推荐装置。
[0029] 本发明实施例采用在接收到用户输入的网址信息后,根据网址规范对该用户输入的网址信息进行预处理,并根据该预处理后网址信息分别在本地访问记录的网址集合中以及云端服务器中的域名知识库系统中进行匹配,得到本地匹配网址集合和云端匹配网址集合,然后再综合这两个网址集合后在浏览器的网址推荐区显示推荐网址;由于本地访问记录的网址集合可以反映出用户的使用习惯,而域名知识库系统则综合地考虑了各个网址的多种因素,比如域名热度、域名信任度和用户选择率等,所以,该方案相对于现有技术中只进行简单的字符匹配而言,可以更加准确地为用户推荐网址,而且由于其中考虑了域名的多种因素,比如信任度等,所以也可以提高推荐域名的安全性。

附图说明

[0030] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0031] 图1是本发明实施例提供的网址推荐方法的流程图;
[0032] 图2是本发明实施例提供的网址推荐方法的另一流程图;
[0033] 图3是本发明实施例提供的网址推荐方法的又一流程图;
[0034] 图4是本发明实施例提供的位于终端侧的网址推荐装置的结构示意图;
[0035] 图5是本发明实施例提供的位于网络侧侧的网址推荐装置的结构示意图。

具体实施方式

[0036] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0037] 本发明实施例提供一种网址推荐方法、装置和通信系统。以下分别进行详细说明。
[0038] 实施例一、
[0039] 本实施例将从位于终端侧的网址推荐装置的角度进行描述,该位于终端侧的网址推荐装置具体可以集成在终端设备中,比如作为一个模块集成在终端设备中,或者,也可以作为一个插件嵌入到终端设备的浏览器中,等等。该终端设备具体可以为家庭计算机、平板电脑或手机等设备。
[0040] 一种网址推荐方法,包括:接收用户输入的网址信息,根据网址规范对该用户输入的网址信息进行预处理,得到预处理后网址信息;根据该预处理后网址信息在本地访问记录的网址集合中进行匹配,得到本地匹配网址集合,将该预处理后网址信息发送给云端服务器,接收云端服务器返回的云端匹配网址集合,其中,云端匹配网址集合由云端服务器根据所述预处理后网址信息在域名知识库系统中进行匹配而得,域名知识库系统包括各个网址的域名热度、域名信任度和用户选择率;计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合;在浏览器的网址推荐区显示所述推荐网址集合。
[0041] 如图1所示,具体流程可以如下:
[0042] 101、接收用户输入的网址信息;
[0043] 例如,具体可以接收用户输入的几个字母,比如“abc”等。
[0044] 102、根据网址规范(比如RFC3986)对步骤101中用户输入的网址信息进行预处理,得到预处理后网址信息;
[0045] 其中,预处理可以包括:
[0046] (1)将用户输入的网址信息中的域名和协议部分转化为小写字母;
[0047] 例如,如果用户输入的网址信息为“HTTP://www.Example.com/”,则可以转化为“http://www.example.com/”,等等。
[0048] (2)在确定用户未输入协议号时为所述用户输入的网址信息添加预置的协议头;
[0049] 例如,如果用户输入的网址信息为“www.example.com/”,则可以转化为“http://www.example.com/”,等等。
[0050] (3)确定用户未输入网址斜杠结尾时,为用户输入的网址信息添加斜杠结尾;
[0051] 例如,如果用户输入的网址信息为“http://www.example.com”,则可以转化为“http://www.example.com/”,等等。
[0052] (4)确定用户输入的网址信息中存在非法字符时,将该非法字符替换为预置的对应字符,或者,删除所述非法字符;
[0053] 由于域名里一般只包含26个英文字母、十个阿拉伯数字和英文的连词号“-”,并以英文的点号“.”作为分隔符,而其他出现在域名中的字符则均为非法字符,比如用户可能误输入逗号“,”或下划线“_”等。当出现非法字符时,可以该非法字符替换为预置的对应字符,比如,将逗号“,”转化为点好“.”,将下划线“_”转化为连词号“-”,等等。
[0054] 可选的,也可以不直接将该非法字符替换为预置的对应字符,而是先提醒用户,若用户未进行任何修正,再进行转化。比如,具体可以在非法字符处高亮提示用户及时修正错误输入,如果用户未进行任何修正,则根据标准键盘键位分布和云端匿名收集到的用户误输入网址数据综合考虑,统一将逗号转为点号,下划线转为连词号,其他非法字符直接删除,如“http://www,test_example=.com/”转化为“http://www.test-example.com/”。
[0055] 103、根据步骤102中预处理后网址信息在本地访问记录的网址集合中进行匹配,得到本地匹配网址集合;例如,具体可以如下:
[0056] 在得到预处理后网址信息如预处理后的输入字符串s后,会在用户本地访问记录的网址集合中进行匹配,找出包含有字符串s的所有网址的集合S。
[0057] 需说明的是,此时可以将集合S展现在浏览器的网址推荐区中,当浏览器收到云端服务器推荐的k个网址集合R后,再重新刷新展示在浏览器的网址推荐区。
[0058] 104、将步骤102中的得到的预处理后网址信息发送给云端服务器。
[0059] 105、接收云端服务器返回的云端匹配网址集合,其中,该云端匹配网址集合由云端服务器根据预处理后网址信息在域名知识库系统中进行匹配而得。
[0060] 其中,域名知识库系统为预置的网址信息数据库,该域名知识库系统可以包括各个网址的域名热度(Popularity)、域名信任度(Reputation)和用户选择率(USR,User Selection Rate)等信息,具体可以如下:
[0061] (1)域名热度;
[0062] 域名热度反映预置时间内用户访问此域名下网址的次数,其中,预置时间可以根据实际应用的需求进行设置,比如:
[0063] 如果最近1周内用户访问此域名下网址的次数为x,则域名热度可以为:
[0064] 当x>10时,y=log10(x);
[0065] 当x为其他值时,y=1。
[0066] (2)域名信任度;
[0067] 域名信任度反映预置时间内所有用户访问此域名下恶意网址的次数与此域名所有网址的被访问次数的比值,其中,预置时间可以根据实际应用的需求进行设置,比如:
[0068] 如果最近1周内所有用户访问到此域名下恶意网址的次数与此域名所有网址的被访问次数之比为x,则域名信任度可以为:
[0069] y=1-log10(1+x)/log102,其中,x取值在0~1之间。
[0070] (3)用户选择率;
[0071] 用户选择率反映预置时间内,在用户输入网址信息A的情况下,当系统推荐网址B时用户点击网址B的概率,其中,预置时间可以根据实际应用的需求进行设置,比如:
[0072] 可以计算在一周内,在用户输入网址A的情况下,当系统推荐网址B时用户点击网址B的次数除以系统推荐网址B的次数,其中,选择率越高说明系统推荐的准确率越高。
[0073] 106、计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合;
[0074] 例如,如果在步骤103中,得到本地匹配网址集合S,在步骤106中,得到云端匹配网址集合R,则此时可以计算S和R的并集,得到推荐网址集合“R∪S”。
[0075] 107、在浏览器的网址推荐区显示所述推荐网址集合。
[0076] 比如,如果在步骤106中得到推荐网址集合“R∪S”,则此时,可以在浏览器的网址推荐区显示该推荐网址集合“R∪S”。
[0077] 可选的,也可以设置选项,让用户自由选择云端推荐优先或者本地访问记录优先,以控制R∪S集合中网址在推荐区展示的优先顺序,即该网址推荐方法还可以包括:
[0078] 获取用户设置的显示参数,其中,显示参数指示优先推荐本地匹配网址集合,或者优先推荐云端匹配网址集合;
[0079] 根据获取到的显示参数的指示在浏览器的网址推荐区显示所述推荐网址集合。
[0080] 此外,在浏览器的网址推荐区显示该推荐网址集合(即步骤107)之后,还可以将用户选择的网址上报到云端服务器,以便云端服务器更新和调整域名知识库系统,从而可以为用户提供更为精确的推荐网址,即,在浏览器的网址推荐区显示该推荐网址集合(即步骤107)之后,该网址推荐方法还可以包括:
[0081] 接收用户从网址推荐区中选择的网址,将该选择的网址发送给云端服务器,以便云端服务器根据该选择的网址更新所述域名知识库系统。
[0082] 由上可知,本实施例采用在接收到用户输入的网址信息后,根据网址规范对该用户输入的网址信息进行预处理,并根据该预处理后网址信息分别在本地访问记录的网址集合中以及云端服务器中的域名知识库系统中进行匹配,得到本地匹配网址集合和云端匹配网址集合,然后再综合这两个网址集合后在浏览器的网址推荐区显示推荐网址;由于本地访问记录的网址集合可以反映出用户的使用习惯,而域名知识库系统则综合地考虑了各个网址的域名热度、域名信任度和用户选择率,所以,该方案相对于现有技术中只进行简单的字符匹配而言,可以更加准确地为用户推荐网址,而且由于其中考虑了域名的信任度,所以也可以提高推荐域名的安全性,大大降低了用户上网的风险。
[0083] 实施例二、
[0084] 本实施例将从位于网络侧的网址推荐装置的角度进行描述。该网络侧的网址推荐装置具体可以作为独立的实体,也可以集成在网络侧设备中,比如集成云端服务器中,为了描述方便,在本发明实施例中,将以该位于网络侧的网址推荐装置具体集成在云端服务器中为例进行说明。
[0085] 一种网址推荐方法,包括:接收终端设备发送的预处理后网址信息,其中,该预处理后网址信息由终端设备根据网址规范对用户输入的网址信息进行预处理所得;根据该预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合,将该云端匹配网址集合发送给终端设备;其中,域名知识库系统包括各个网址的域名热度、域名信任度和用户选择率。
[0086] 如图2所示,具体流程可以如下:
[0087] 201、接收终端设备发送的预处理后网址信息;
[0088] 其中,预处理后网址信息由终端设备根据网址规范对用户输入的网址信息进行预处理所得,例如,预处理可以包括:
[0089] (1)将用户输入的网址信息中的域名和协议部分转化为小写字母;
[0090] (2)在确定用户未输入协议号时为所述用户输入的网址信息添加预置的协议头;
[0091] (3)确定用户未输入网址斜杠结尾时,为用户输入的网址信息添加斜杠结尾;
[0092] (4)确定用户输入的网址信息中存在非法字符时,将该非法字符替换为预置的对应字符,或者,删除所述非法字符;
[0093] 可选的,也可以不直接将该非法字符替换为预置的对应字符,而是先提醒用户,若用户未进行任何修正,再进行转化。比如,具体可以在非法字符处高亮提示用户及时修正错误输入,如果用户未进行任何修正,则根据标准键盘键位分布和云端匿名收集到的用户误输入网址数据综合考虑,统一将逗号转为点号,下划线转为连词号,其他非法字符直接删除,等等。
[0094] 该预处理的方法具体可参见实施例一,在此不再赘述。
[0095] 202、根据步骤201中得到的预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合;例如,具体可以如下:
[0096] 在预置的域名知识库系统中查找包含所述预处理后网址信息的网址,得到第一网址集合,根据第一网址集合中各个网址的域名热度、域名信任度和用户选择率计算各个网址的推荐指数(RI,Recommendation Index),并根据推荐指数的高低对该第一网址集合中各个网址进行排序,按照从高到低的排序顺序在第一网址集合中选择前K个网址,得到云端匹配网址集合,其中,K为预置的正整数。例如,如果K为5的话,则可以根据第一网址集合中各个网址的域名热度、域名信任度和用户选择率计算各个网址的推荐指数,然后按照从高到低的顺序选择前5个推荐指数较高的网址,作为云端匹配网址集合。
[0097] 其中,域名知识库系统为预置的网址信息数据库,该域名知识库系统可以包括各个网址的域名热度、域名信任度和用户选择率等信息,具体可参见实施例一,在此不再赘述。
[0098] 需说明的是,域名知识库系统具体可以设置在位于网络侧的网址推荐装置比如云端服务器中,也可以设置在其他的服务器上,然后由位于网络侧的网址推荐装置比如云端服务器从该设置由域名知识库系统的服务器上获取相关信息,在此不再赘述。
[0099] 203、将步骤202中得到的云端匹配网址集合发送给终端设备。
[0100] 这样,当终端设备接收到该云端匹配网址集合后,就可以计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合,然后在浏览器的网址推荐区显示该推荐网址集合,以供用户选择,具体可参见实施例一,在此不再赘述。
[0101] 可选的,在将该云端匹配网址集合发送给终端设备之后,还可以接收终端设备发送的用户从所述网址推荐区中选择的网址,并根据该选择的网址更新域名知识库系统,这样,就可以为用户提供更为精确的推荐网址。
[0102] 此外,在接收终端设备发送的预处理后网址信息之前,该网址推荐方法还可以包括:
[0103] 根据各个网址的域名热度、域名信任度和用户选择率建立域名知识库系统。
[0104] 由上可知,本实施例采用接收终端设备发送的预处理后网址信息,然后根据该预处理后网址信息在域名知识库系统中进行匹配,得到云端匹配网址集合,然后再将该云端匹配网址集合提供给终端设备,以便终端设备可以综合本地匹配网址集合和该云端匹配网址集合后在浏览器的网址推荐区显示推荐网址;由于该域名知识库系统综合地考虑了各个网址的域名热度、域名信任度和用户选择率,所以,该方案相对于现有技术中只进行简单的字符匹配而言,可以更加准确地为用户推荐网址,而且由于其中考虑了域名的信任度,所以也可以提高推荐域名的安全性,大大降低了用户上网的风险。
[0105] 实施例三、
[0106] 根据实施例一和二所描述的方法,以下将举例作进一步详细说明。
[0107] 在本实施例中,将以该位于终端侧的网址推荐装置具体集成在终端设备中,而位于网络侧的网址推荐装置具体集成在云端服务器为例进行说明。
[0108] 如图3所示,一种网址推荐方法,具体流程可以如下:
[0109] 301、终端设备接收用户输入的网址信息;
[0110] 例如,终端设备具体可以接收用户输入的几个字母,比如“Exam”等。
[0111] 302、终端设备根据网址规范(比如RFC3986)对步骤101中用户输入的网址信息进行预处理,得到预处理后网址信息,比如得到预处理后的输入字符串s(以下将以预处理后网址信息具体为预处理后的输入字符串s为例进行说明)。
[0112] 例如,具体可以进行如下预处理操作:
[0113] (1)将用户输入的网址信息中的域名和协议部分转化为小写字母;
[0114] 例如,如果用户输入的网址信息为“HTTP://www.Example.com/”,则可以转化为“http://www.example.com/”,等等。
[0115] (2)在确定用户未输入协议号时为所述用户输入的网址信息添加预置的协议头;
[0116] 例如,如果用户输入的网址信息为“www.example.com/”,则可以转化为“http://www.example.com/”,等等。
[0117] (3)确定用户未输入网址斜杠结尾时,为用户输入的网址信息添加斜杠结尾;
[0118] 例如,如果用户输入的网址信息为“http://www.example.com”,则可以转化为“http://www.example.com/”,等等。
[0119] (4)确定用户输入的网址信息中存在非法字符时,将该非法字符替换为预置的对应字符,或者,删除所述非法字符;
[0120] 由于域名里一般只包含26个英文字母、十个阿拉伯数字和英文的连词号“-”,并以英文的点号“.”作为分隔符,而其他出现在域名中的字符则均为非法字符,比如用户可能误输入逗号“,”或下划线“_”等。当出现非法字符时,可以该非法字符替换为预置的对应字符,比如,将逗号“,”转化为点好“.”,将下划线“_”转化为连词号“-”,等等。
[0121] 可选的,也可以不直接将该非法字符替换为预置的对应字符,而是先提醒用户,若用户未进行任何修正,再进行转化。比如,具体可以在非法字符处高亮提示用户及时修正错误输入,如果用户未进行任何修正,则根据标准键盘键位分布和云端匿名收集到的用户误输入网址数据综合考虑,统一将逗号转为点号,下划线转为连词号,其他非法字符直接删除,如“http://www,test_example=.com/”转化为“http://www.test-example.com/”。
[0122] 303、终端设备根据预处理后的输入字符串s在用户本地访问记录的网址集合中进行匹配,找出包含有字符串s的所有网址的集合,得到本地匹配网址集合S。
[0123] 可选的,此时,终端设备可以将本地匹配网址集合S展现在浏览器的网址推荐区中,当浏览器收到云端服务器推荐的云端匹配网址集合R后,再重新刷新展示在浏览器的网址推荐区。
[0124] 304、终端设备将预处理后的输入字符串s发送给云端服务器。
[0125] 305、云端服务器接收到该预处理后的输入字符串s后,根据该预处理后的输入字符串s在预置的域名知识库系统中进行匹配,得到云端匹配网址集合R,例如,具体可以如下:
[0126] 在预置的域名知识库系统中查找包含有该字符串s的网址,得到第一网址集合W,根据第一网址集合W中各个网址的域名热度、域名信任度和用户选择率计算各个网址的推荐指数,并根据推荐指数的高低对该第一网址集合中各个网址进行排序,按照排序顺序在第一网址集合中选择K个网址,得到云端匹配网址集合R,具体如下:
[0127] 将字符串s与域名知识库系统中推荐网站集合W进行比较,并根据以下公式计算出推荐指数(RI,Recommendation Index):
[0128] RI(r|s)=Sim(r,s)×Popularity(r)×Reputation(r)×USR(r|s),r∈W;
[0129] 其中,RI(r|s)表示当输入字符串为s时,网址r的推荐指数,RI(r|s)越高,则网址r越有可能被推荐系统所推荐;
[0130] Sim(r,s)表示网址r与字符串s的相似度,这里采用编辑距离来实现。所谓编辑距离(又称Levenshtein距离),是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。允许的编辑操作包括将一个字符替换成另一个字符,插入一个字符,或删除一个字符。而相似度等于“编辑距离加一”的倒数。例如,字符串“abcd”和“bcd”的编辑距离为1,则相似度为1/(1+1)=0.5;
[0131] Popularity(r)和Reputation(r)分别代表网址r的热度和信任度,而USR(r|s)则为当输入网址s时推荐网址r的用户选择率。
[0132] 当推荐指数计算完毕后,云端服务器将筛选出推荐指数最大的K个推荐网址作为云端匹配网址集合R,发送给终端设备。
[0133] 其中,K可以根据实际应用的需求进行设置,K为正整数,例如,具体可以根据终端设备的性能和网络质量来设置和动态调整K的取值,比如,对于网速较快的用户,K可以取5~10之间的数值,而对于网速较慢的用户,K可以选择在3~5之间的数值以节省带宽,等等。这是因为,如果K取值过小的话,则推荐网址的覆盖率太低,会降低用户的满意度,但是如果K取值过大的话,从云端服务器发送到终端服务器的数据量会较大,响应时间也会较长,不利于提高用户体验。
[0134] 306、云端服务器发送云端匹配网址集合R给终端设备。
[0135] 307、终端设备接收到该云端匹配网址集合R后,计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合“R∪S”。
[0136] 308、终端设备在浏览器的网址推荐区显示该推荐网址集合“R∪S”。
[0137] 可选的,也可以设置选项,让用户自由选择云端推荐优先或者本地访问记录优先,以控制R∪S集合中网址在推荐区展示的优先顺序。
[0138] 此外,在浏览器的网址推荐区显示该推荐网址集合之后,终端设备还可以将用户选择的网址上报到云端服务器,以便云端服务器更新和调整域名知识库系统,从而可以为用户提供更为精确的推荐网址。
[0139] 由上可知,本实施例采用在接收到用户输入的网址信息后,根据网址规范对该用户输入的网址信息进行预处理,得到预处理的字符串s,根据该字符串s分别在本地访问记录的网址集合中以及云端服务器中的域名知识库系统中进行匹配,得到本地匹配网址集合S和云端匹配网址集合R,然后再取S和R的并集,将S和R的并集在浏览器的网址推荐区显示出来,以供用户选择;由于本地访问记录的网址集合可以反映出用户的使用习惯,而域名知识库系统则综合地考虑了各个网址的域名热度、域名信任度和用户选择率,所以,该方案相对于现有技术中只进行简单的字符匹配而言,可以更加准确地为用户推荐网址,而且由于其中考虑了域名的信任度,所以也可以提高推荐域名的安全性,大大降低了用户上网的风险。
[0140] 实施例四、
[0141] 为了更好地实施以上方法,本发明实施例还提供一种网址推荐装置,位于终端侧,如图4所示,该网址推荐装置包括第一接收单元401、预处理单元402、匹配单元403、发送单元404、第二接收单元405、运算单元406和显示单元407;
[0142] 第一接收单元401,用于接收用户输入的网址信息,比如,具体可以接收用户输入的几个字母,比如“abc”等。
[0143] 预处理单元402,用于根据网址规范(比如RFC3986)对用户输入的网址信息进行预处理,得到预处理后网址信息;
[0144] 匹配单元403,用于根据预处理单元402得到的预处理后网址信息在本地访问记录的网址集合中进行匹配,得到本地匹配网址集合;
[0145] 发送单元404,用于将预处理后网址信息发送给云端服务器;
[0146] 第二接收单元405,用于接收云端服务器返回的云端匹配网址集合,其中,云端匹配网址集合由云端服务器根据发送单元404发送的预处理后网址信息在域名知识库系统中进行匹配而得;
[0147] 其中,域名知识库系统为预置的网址信息数据库,该域名知识库系统可以包括各个网址的域名热度、域名信任度和用户选择率等信息,具体可以如下:
[0148] (1)域名热度;
[0149] 域名热度反映预置时间内用户访问此域名下网址的次数,其中,预置时间可以根据实际应用的需求进行设置,比如:
[0150] 如果最近1周内用户访问此域名下网址的次数为x,则域名热度可以为:
[0151] 当x>10时,y=log10(x);
[0152] 当x为其他值时,y=1。
[0153] (2)域名信任度;
[0154] 域名信任度反映预置时间内所有用户访问此域名下恶意网址的次数与此域名所有网址的被访问次数的比值,其中,预置时间可以根据实际应用的需求进行设置,比如:
[0155] 如果最近1周内所有用户访问到此域名下恶意网址的次数与此域名所有网址的被访问次数之比为x,则域名信任度可以为:
[0156] y=1-log10(1+x)/log102,其中,x取值在0~1之间。
[0157] (3)用户选择率;
[0158] 用户选择率反映预置时间内,在用户输入网址信息A的情况下,当系统推荐网址B时用户点击网址B的概率,其中,预置时间可以根据实际应用的需求进行设置,比如:
[0159] 可以计算在一周内,在用户输入网址A的情况下,当系统推荐网址B时用户点击网址B的次数除以系统推荐网址B的次数,其中,选择率越高说明系统推荐的准确率越高。
[0160] 运算单元406,用于计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合;
[0161] 显示单元407,用于在浏览器的网址推荐区显示运算单元406得到的推荐网址集合。
[0162] 其中,预处理单元402可以包括转化子单元、添加子单元和替换子单元;
[0163] 转化子单元,用于将用户输入的网址信息中的域名和协议部分转化为小写字母;
[0164] 例如,如果用户输入的网址信息为“HTTP://www.Example.com/”,则可以转化为“http://www.example.com/”,等等。
[0165] 添加子单元,用于在确定用户未输入协议号时为所述用户输入的网址信息添加预置的协议头;以及在确定用户未输入网址斜杠结尾时,为该用户输入的网址信息添加斜杠结尾;
[0166] 例如,如果用户输入的网址信息为“www.example.com/”,则可以转化为“http://www.example.com/”,等等。
[0167] 又例如,如果用户输入的网址信息为“http://www.example.com”,则可以转化为“http://www.example.com/”,等等。
[0168] 替换子单元,用于确定用户输入的网址信息中存在非法字符时,将该非法字符替换为预置的对应字符,或者,删除该非法字符。
[0169] 由于域名里一般只包含26个英文字母、十个阿拉伯数字和英文的连词号“-”,并以英文的点号“.”作为分隔符,而其他出现在域名中的字符则均为非法字符,比如用户可能误输入逗号“,”或下划线“_”等。当出现非法字符时,可以该非法字符替换为预置的对应字符,比如,将逗号“,”转化为点好“.”,将下划线“_”转化为连词号“-”,等等。
[0170] 可选的,替换子单元也可以不直接将该非法字符替换为预置的对应字符,而是先提醒用户,若用户未进行任何修正,再进行转化。比如,具体可以在非法字符处高亮提示用户及时修正错误输入,如果用户未进行任何修正,则根据标准键盘键位分布和云端匿名收集到的用户误输入网址数据综合考虑,统一将逗号转为点号,下划线转为连词号,其他非法字符直接删除,如“http://www,test_example=.com/”转化为“http://www.test-example.com/”。
[0171] 可选的,也可以设置选项,让用户自由选择云端推荐优先或者本地访问记录优先,以控制推荐网址集合中网址在推荐区展示的优先顺序,即显示单元407可以包括参数获取子单元和显示子单元;
[0172] 参数获取子单元,用于获取用户设置的显示参数,其中,显示参数指示优先推荐本地匹配网址集合,或者优先推荐云端匹配网址集合;
[0173] 显示子单元,用于根据参数获取子单元获取到的显示参数的指示在浏览器的网址推荐区显示运算单元406得到的推荐网址集合。
[0174] 此外,在浏览器的网址推荐区显示该推荐网址集合之后,还可以将用户选择的网址上报到云端服务器,以便云端服务器更新和调整域名知识库系统,从而可以为用户提供更为精确的推荐网址,即:
[0175] 第一接收单元401,还可以用于接收用户从网址推荐区中选择的网址;
[0176] 发送单元404,还可以用于将用户从网址推荐区中选择的网址发送给云端服务器,以便云端服务器根据该选择的网址更新域名知识库系统。
[0177] 具体实施时,以上各个单元可以作为独立的实体实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
[0178] 该位于终端侧的网址推荐装置具体可以集成在终端设备中,比如作为一个模块集成在终端设备中,或者,也可以作为一个插件嵌入到终端设备的浏览器中,等等。该终端设备具体可以为家庭计算机、平板电脑或手机等设备。
[0179] 由上可知,本实施例的网址推荐装置采用在第一接收单元401接收到用户输入的网址信息后,由预处理单元402根据网址规范对该用户输入的网址信息进行预处理,并由匹配单元403根据该预处理后网址信息在本地访问记录的网址集合中进行匹配,以得到本地匹配网址集合,以及由第二接收单元40从云端服务器中获取云端匹配网址集合,然后再由运算单元406综合这两个网址集合后,由显示单元407在浏览器的网址推荐区显示推荐网址;由于本地访问记录的网址集合可以反映出用户的使用习惯,而域名知识库系统则综合地考虑了各个网址的域名热度、域名信任度和用户选择率,所以,该方案相对于现有技术中只进行简单的字符匹配而言,可以更加准确地为用户推荐网址,而且由于其中考虑了域名的信任度,所以也可以提高推荐域名的安全性,大大降低了用户上网的风险。
[0180] 实施例五、
[0181] 相应的,本发明实施例还提供一种网址推荐装置,位于网络侧,如图5所示,该网址推荐装置包括接收单元501、匹配单元502和发送单元503;
[0182] 接收单元501,用于接收终端设备发送的预处理后网址信息,其中,预处理后网址信息由终端设备根据网址规范对用户输入的网址信息进行预处理所得;例如,预处理可以包括:
[0183] (1)将用户输入的网址信息中的域名和协议部分转化为小写字母;
[0184] (2)在确定用户未输入协议号时为所述用户输入的网址信息添加预置的协议头;
[0185] (3)确定用户未输入网址斜杠结尾时,为用户输入的网址信息添加斜杠结尾;
[0186] (4)确定用户输入的网址信息中存在非法字符时,将该非法字符替换为预置的对应字符,或者,删除所述非法字符;
[0187] 可选的,也可以不直接将该非法字符替换为预置的对应字符,而是先提醒用户,若用户未进行任何修正,再进行转化。比如,具体可以在非法字符处高亮提示用户及时修正错误输入,如果用户未进行任何修正,则根据标准键盘键位分布和云端匿名收集到的用户误输入网址数据综合考虑,统一将逗号转为点号,下划线转为连词号,其他非法字符直接删除,等等。
[0188] 关于预处理的描述具体可参见前面的实施例,在此不再赘述。
[0189] 匹配单元502,用于根据接收单元501接收到的预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合;
[0190] 其中,域名知识库系统包括各个网址的域名热度、域名信任度和用户选择率,具体可参见的实施例,在此不再赘述。
[0191] 发送单元503,用于将所述云端匹配网址集合发送给终端设备。
[0192] 这样,当终端设备接收到该云端匹配网址集合后,就可以计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合,然后在浏览器的网址推荐区显示该推荐网址集合,以供用户选择,具体可参见前面的实施例,在此不再赘述。
[0193] 其中,匹配单元502可以包括查找子单元、排序子单元和选择子单元;
[0194] 查找子单元,用于在预置的域名知识库系统中查找包含该预处理后网址信息的网址,得到第一网址集合;
[0195] 排序子单元,用于根据第一网址集合中各个网址的域名热度、域名信任度和用户选择率计算各个网址的推荐指数,并根据推荐指数的高低对该第一网址集合中各个网址进行排序;
[0196] 选择子单元,用于按照从高到低的排序顺序在第一网址集合中选择前K个网址,得到云端匹配网址集合,K为预置的正整数。
[0197] 在发送单元503将该云端匹配网址集合发送给终端设备之后,还可以接收终端设备发送的用户从所述网址推荐区中选择的网址,并根据该选择的网址更新域名知识库系统,这样,就可以为用户提供更为精确的推荐网址。即该位于网络侧的网址推荐装置还可以包括更新单元;
[0198] 接收单元501,还用于接收终端设备发送的用户从网址推荐区中选择的网址;
[0199] 更新单元,用于根据接收到的用户从网址推荐区中选择的网址更新域名知识库系统。
[0200] 此外,该位于网络侧的网址推荐装置还可以建立单元;
[0201] 建立单元,用于根据各个网址的域名热度、域名信任度和用户选择率建立域名知识库系统,关于域名知识库系统的具体描述具体可参见前面实施例,在此不再赘述。
[0202] 需说明的是,具体实施时,以上各个单元可以作为独立的实体实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
[0203] 该网络侧的网址推荐装置具体可以作为独立的实体,也可以集成在网络侧设备中,比如集成云端服务器中。
[0204] 由上可知,本实施例的网址推荐装置的接收单元501可以接收终端设备发送的预处理后网址信息,然后由匹配单元502根据该预处理后网址信息在域名知识库系统中进行匹配,得到云端匹配网址集合,然后再由发送单元503将该云端匹配网址集合提供给终端设备,以便终端设备可以综合本地匹配网址集合和该云端匹配网址集合后在浏览器的网址推荐区显示推荐网址;由于该域名知识库系统综合地考虑了各个网址的域名热度、域名信任度和用户选择率,所以,该方案相对于现有技术中只进行简单的字符匹配而言,可以更加准确地为用户推荐网址,而且由于其中考虑了域名的信任度,所以也可以提高推荐域名的安全性,大大降低了用户上网的风险。
[0205] 实施例六、
[0206] 相应的,本发明实施例还提供一种通信系统,包括本发明实施例提供的任一种位于终端侧的网址推荐装置和任一种位于网络侧的网址推荐装置,其中,位于终端侧的网址推荐装置具体可参见实施四,位于网络侧的网址推荐装置具体可参见实施例五,例如,以位于终端侧的网址推荐装置具体为终端设备,位于网络侧的网址推荐装置具体为云端服务器,则具体可以如下:
[0207] 终端设备,用于接收用户输入的网址信息,根据网址规范对该用户输入的网址信息进行预处理,得到预处理后网址信息;根据该预处理后网址信息在本地访问记录的网址集合中进行匹配,得到本地匹配网址集合;将该预处理后网址信息发送给云端服务器,接收云端服务器返回的云端匹配网址集合;计算本地匹配网址集合和云端匹配网址集合的并集,得到推荐网址集合;在浏览器的网址推荐区显示所述推荐网址集合。
[0208] 云端服务器,用于接收终端设备发送的预处理后网址信息;根据该预处理后网址信息在预置的域名知识库系统中进行匹配,得到云端匹配网址集合,将该云端匹配网址集合发送给终端设备。
[0209] 其中,终端设备和云端服务器的具体实施可参见前面的实施例,在此不再赘述。
[0210] 由上可知,本实施例的通信系统的终端设备采用在接收到用户输入的网址信息后,根据网址规范对该用户输入的网址信息进行预处理,并根据该预处理后网址信息分别在本地访问记录的网址集合中以及云端服务器中的域名知识库系统中进行匹配,得到本地匹配网址集合和云端匹配网址集合,然后再综合这两个网址集合后在浏览器的网址推荐区显示推荐网址;由于本地访问记录的网址集合可以反映出用户的使用习惯,而域名知识库系统则综合地考虑了各个网址的域名热度、域名信任度和用户选择率,所以,该方案相对于现有技术中只进行简单的字符匹配而言,可以更加准确地为用户推荐网址,而且由于其中考虑了域名的信任度,所以也可以提高推荐域名的安全性,大大降低了用户上网的风险。
[0211] 本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
[0212] 以上对本发明实施例所提供的一种网址推荐方法、装置和通信系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。