一种智能搜索导向系统及方法转让专利
申请号 : CN202010743794.6
文献号 : CN111914154B
文献日 : 2021-11-05
发明人 : 张发宝 , 李欣梅
申请人 : 上海梅斯医药科技有限公司
摘要 :
权利要求 :
1.一种智能搜索导向系统,其特征在于,包括:关键词获取模块,用于获取用户搜索的搜索关键词;
搜索词库,用于存储各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;
查询比对模块,用于将所述搜索关键词在所述搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别,在确定所述目标版块类别时,若采用搜索频次,则全部采用搜索频次来选取所述目标版块类别,若采用出现频次,则全部采用出现频次来选取所述目标版块类别,若搜索频次相同,则再参考出现频次,选取出现频次更高的版块类别作为所述目标版块类别;
版块判断模块,用于判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;
搜索提示模块,用于当判定所述用户未在所述目标版块类别中搜索所述搜索关键词时,提示所述用户至所述目标版块类别中进行搜索;
还包括:搜索频次更新模块或出现频次更新模块;其中:所述搜索频次更新模块,用于确定所述用户搜索所述搜索关键词所在的最终版块类别,并在所述搜索词库中,将所述搜索关键词在所述最终版块类别的搜索次数加一;
所述出现频次更新模块包括:
关键词确定子模块,用于当各版块类别中每新增一篇数据信息时,确定所述数据信息涉及的关键词;并通过所述查询比对模块在所述搜索词库中查询所述数据信息涉及的关键词;
频次更新子模块,用于当所述搜索词库中存在对应的搜索关键词时,将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;当所述搜索词库中不存在对应的搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
或所述出现频次更新模块包括:
关键词判断子模块,用于当各版块类别中每新增一篇数据信息时,判断所述数据信息是否涉及所述搜索词库中的相应版块类别的搜索关键词;
统计计算子模块,用于当判定所述数据信息涉及所述搜索词库中的搜索关键词时,在所述搜索词库中,将涉及的搜索关键词在所述数据信息所属的版块类别的出现频次加一;
或,获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次数,计算所述对应关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关键词在所述数据信息所属的版块类别的出现频次中。
2.根据权利要求1所述的一种智能搜索导向系统,其特征在于,还包括:新增模块,用于当所述搜索关键词在所述搜索词库中未比对上时,在所述搜索词库中新增所述搜索关键词。
3.根据权利要求2所述的一种智能搜索导向系统,其特征在于,所述新增模块包括:搜索频次新增子模块,用于在所述搜索词库中新增所述搜索关键词;获取所述用户搜索所述搜索关键词所在的版块类别,并记录所述搜索关键词在所述版块类别的搜索频次;
或
出现频次新增子模块,用于在所述搜索词库中新增所述搜索关键词;将所述搜索关键词在各版块类别中分别进行搜索,获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
4.根据权利要求1所述的一种智能搜索导向系统,其特征在于,所述搜索词库还存储有:同义词典、近义词典及同音词典;所述查询比对模块包括:词典查找子模块,用于根据所述同义词典,获取所述搜索关键词的同义词;
关键词查找子模块,用于在所述搜索词库中查询所述搜索关键词及所述搜索关键词的同义词;
排序记录子模块,用于当查询到所述搜索词库中存在所述搜索关键词或所述搜索关键词的同义词时,将查询结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
所述词典查找子模块,还用于当判定所述搜索词库中未存在所述搜索关键词或所述搜索关键词的同义词时,根据所述近义词典,获取所述搜索关键词的近义词;
所述关键词查找子模块,还用于在所述搜索词库中查询是否存在所述搜索关键词的近义词;
所述排序记录子模块,还用于当查询到所述搜索词库中存在所述搜索关键词的近义词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
所述词典查找子模块,还用于当判定所述搜索词库中未存在所述搜索关键词、所述搜索关键词的同义词、或所述搜索关键词的近义词时,根据所述同音词典,获取所述搜索词关键词的同音词;
所述排序记录子模块,还用于当查询到所述搜索词库中存在所述搜索关键词的同音词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别。
5.根据权利要求1所述的一种智能搜索导向系统,其特征在于,所述搜索词库,还用于存储所述用户的自身搜索浏览信息,所述自身搜索浏览信息包括:关键词、浏览的版块类别、浏览的数据信息及对应的浏览时长;所述智能搜索导向系统还包括:所述查询比对模块,还用于在所述搜索词库中查询预设时间段内的自身搜索浏览信息中是否有与所述搜索关键词匹配的关键词;
信息获取模块,用于当查询到所述自身搜索浏览信息中有与所述搜索关键词匹配的关键词时,获取所述关键词对应的版块类别,浏览的数据信息和对应的浏览时长;
时长判断模块,用于判断获取的浏览时长中,是否存在大于参考时长的浏览时长;
所述搜索提示模块,还用于当判定存在大于参考时长的浏览时长时,将所述对应的版块类别作为目标版块类别推荐给所述用户;或将浏览时长大于参考时长的浏览的数据信息作为目标数据信息,推荐给所述用户;
所述查询比对模块,还用于当判定不存在大于参考时长的浏览时长时,将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别。
6.根据权利要求5所述的一种智能搜索导向系统,其特征在于,还包括:时长计算模块,用于统计浏览的每篇数据信息的字数,并结合参考浏览速度,计算出每篇数据信息的参考时长;
所述时长判断模块,还用于比较每篇数据信息的参考时长与实际的浏览时长的大小;
所述时长计算模块,还用于在确定所述浏览时长大于所述参考时长时,计算所述浏览时长与所述参考时长的差值;
所述搜索提示模块,还用于当所述浏览时长与所述参考时长的差值处于预设的差值范围时,将对应的数据信息所在的版块类别作为目标版块类别推荐给所述用户;或将所述对应的数据信息作为目标数据信息,推荐给所述用户。
7.根据权利要求1‑6任一项所述的一种智能搜索导向系统,其特征在于,所述智能搜索导向系统应用于专业领域数据库或专业领域网站的搜索。
8.一种智能搜索导向方法,其特征在于,包括:获取用户搜索的搜索关键词;
将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别;所述搜索词库中存储有各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;在确定所述目标版块类别时,若采用搜索频次,则全部采用搜索频次来选取所述目标版块类别,若采用出现频次,则全部采用出现频次来选取所述目标版块类别,若搜索频次相同,则再参考出现频次,选取出现频次更高的版块类别作为所述目标版块类别;
判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;
当判定所述用户未在所述目标版块类别中搜索所述搜索关键词时,提示所述用户至所述目标版块类别中进行搜索;
还包括:
更新所述搜索词库中各搜索关键词在各版块类别的搜索次数或出现次数;具体包括:确定所述用户搜索所述搜索关键词所处的最终版块类别,并在所述搜索词库中,将所述搜索关键词在所述最终版块类别的搜索次数加一;
或,
当各版块类别中每新增一篇数据信息时,确定所述数据信息涉及的关键词;
在所述搜索词库中查询所述数据信息涉及的关键词;
当所述搜索词库中存在对应的搜索关键词时,将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
当所述搜索词库中不存在对应的搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
或,
当各版块类别中每新增一篇数据信息时,判断所述数据信息是否涉及所述搜索词库中的相应版块类别的搜索关键词;
当判定所述数据信息涉及所述搜索词库中的搜索关键词时,在所述搜索词库中,将涉及的搜索关键词在所述数据信息所属的版块类别的出现频次加一;或获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次数,计算所述搜索关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关键词在所述数据信息所属的版块类别的出现频次中。
9.根据权利要求8所述的一种智能搜索导向方法,其特征在于,还包括:当所述搜索关键词在所述搜索词库中未比对上时,在所述搜索词库中新增所述搜索关键词;具体包括:
当所述搜索词库中新增所述搜索关键词,且在所述搜索词库中存储的各搜索关键词在各版块类别中的频次为搜索频次时;获取所述用户搜索所述搜索关键词所在的版块类别,并记录所述搜索关键词在所述版块类别的搜索频次;
当所述搜索词库中新增所述搜索关键词,且所述搜索词库中存储的各搜索关键词在各版块类别中的频次为出现频次时;将所述搜索关键词在各版块类别中分别进行搜索,获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
10.根据权利要求8所述的一种智能搜索导向方法,其特征在于,所述搜索词库还存储有:同义词典、近义词典及同音词典;所述将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别具体包括:根据预存的同义词典,获取所述搜索关键词的同义词;
在所述搜索词库中查询是否存在所述搜索关键词或所述搜索关键词的同义词;
当查询到所述搜索词库中存在所述搜索关键词或所述搜索关键词的同义词时,将查询结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
当判定所述搜索词库中未存在所述搜索关键词或所述搜索关键词的同义词时,根据预存的近义词典,获取所述搜索关键词的近义词;
在所述搜索词库中查询是否存在所述搜索关键词的近义词;
当查询到所述搜索词库中存在所述搜索关键词的近义词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
当判定所述搜索词库中未存在所述搜索关键词、所述搜索关键词的同义词、或所述搜索关键词的近义词时,根据预存的同音词典,获取所述搜索词关键词的同音词;
当查询到所述搜索词库中存在所述搜索关键词的同音词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别。
11.根据权利要求8所述的一种智能搜索导向方法,其特征在于,所述搜索词库,还用于存储所述用户的自身搜索浏览信息,所述自身搜索浏览信息包括:关键词、浏览的版块类别、浏览的数据信息及对应的浏览时长;
在步骤将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别之前还包括:在所述搜索词库中查询预设时间段内的自身搜索浏览信息中是否有与所述搜索关键词匹配的关键词;
当查询到所述自身搜索浏览信息中有与所述搜索关键词匹配的关键词时,获取所述关键词对应的版块类别,浏览的数据信息和对应的浏览时长;
判断获取的浏览时长中,是否存在大于参考时长的浏览时长;
当判定存在大于参考时长的浏览时长时,将所述对应的版块类别作为目标版块类别推荐给所述用户;或将浏览时长大于参考时长的浏览的数据信息作为目标数据信息推荐给所述用户;
当判定不存在大于参考时长的浏览时长时,将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别。
说明书 :
一种智能搜索导向系统及方法
技术领域
背景技术
内搜索因其针对性强,在一定的检索范围内的便利性,更能满足用户的检索需求,并为后续
研究用户行为提供来源保障。而如何使网络用户快捷、准确和有效地定位自己需要的信息
一直是大中型专业网站的难题。专业类的门户网站,栏目众多,信息多达几十万条,而且信
息不会像一般的社会新闻,过时就很少有人关注,大量早期信息仍然有学术价值、也仍然可
能有阅读量。专业网站丰富的内容吸引了大量的专业用户,但由于网站信息量指数级增长,
用户想要快速定位到所需资源非常困难,所以亟需研究智能搜索导向技术。
发明内容
的,本发明的技术方案如下:
次;或
应的出现频次。
类别作为目标版块类别;
标版块类别;
词关键词的同音词;
标版块类别。
关键词;
搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词
在所述数据信息所属的版块类别的出现频次加一;
加一;或,获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位
置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次
数,计算所述对应关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关
键词在所述数据信息所属的版块类别的出现频次中。
索导向系统还包括:
信息作为目标数据信息,推荐给所述用户;
目标版块类别。
述对应的数据信息作为目标数据信息,推荐给所述用户。
在各版块类别的搜索频次或出现频次;
别,并记录所述搜索关键词在所述版块类别的搜索频次;
获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
别;
一;
关键词在所述数据信息中出现的位置及次数,根据预设的不同位置的权重信息,结合所述
搜索关键词在所述数据信息中出现的位置、及不同位置出现的次数,计算所述搜索关键词
本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关键词在所述数据信息所
属的版块类别的出现频次中。
述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最
高的目标版块类别之前还包括:
给所述用户;
存在,则可直接查看其在各版块类别的频次(搜索频次或出现频次),提醒用户至频次最高
的版块类别中进行搜索。对于频次最高的版块类别,则最有可能含有用户需要的信息,最有
可能是与用户输入的关键词相关度最大的版块类别。因此,采用本申请可帮助用户及时定
位至正确的版块类别中进行搜索,智能指导用户进行更精准地搜索。
或者在新增数据信息时及时更新,从而确保后续的搜索导向的精确性。
般提供给专业的人员进行查看,大部分人员较为容易直接定位至正确的版块类别中进行搜
索,而对于少部分用户而言,如果自身无法确定去哪个版块类别搜索,则可通过本方案来获
取到当前输入的搜索关键词,在哪个版块类别被搜索的最多,从而帮助该用户定位至对应
的版块类别。如果不采用搜索频次,则还可以采用出现频次,该方案则并不受用户搜索行为
的影响,而更多的是与数据文献自身相关,出现频次最高的版块类别,则一般为涉及当前输
入的关键词的数据资料最多的版块类别。从另一方面,也说明了该出现频次最高的版块类
别与当前输入的关键词最为相关。
词后,会优先与自身搜索浏览信息进行比对,看其中是否有与该搜索关键词匹配的关键词,
如果有的话,则再进一步获取该关键词对应的版块类别,及与该关键词相关的浏览的数据
信息和对应的浏览时长,判断是否存在超过对应参考时长的浏览时长,若有,则说明该用户
可能花费了较多时间去浏览阅读,可能是该用户想要的资料信息,那么可以将该浏览时长
对应的浏览的数据信息推荐给用户,或者将对应的关键词所在的版块类别作为目标版块类
别推荐给用户,从而帮助用户快速导向正确的版块类别或数据信息。
附图说明
领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其
他的附图。
具体实施方式
例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的
所有其它实施例,都属于本申请保护的范围。
并从中提取出关键词来。此外,搜索关键词也不仅限于一个,可以是一个或多个搜索关键
词,若是多个搜索关键词,则后续分别对每个搜索关键词来进行搜索比对。
搜索关键词外,还存储有每个搜索关键词在各个板块的频次(搜索频次或出现频次),我们
以某医学网站站内搜索为例,该医学网站搜索词库中,存储有大量医学搜索关键词,同时还
记录了每个医学搜索关键词在每个版块类别中的搜索频次(即搜索次数);版块类别为网站
设置的各栏目版块,比如某专业的生物医药学网站,其设置了“医药产业”、“制药”、“生物研
究”、“转化医学”、“医疗健康”等版块,当然,每个版块也还可以再细分成几个小类别。设置
不同的版块类别,可以将信息进行分类展示。又比如,某临床医生发展平台,该网站内根据
科室的不同设置了不同的版块类别,比如设的“心血管科”、“消化科”、“精神心理科”、“神经
科”、“儿科”、“口腔科”、“康复科”、“皮肤科”等等,而搜索词库200则存储了每个科室里可能
涉及的搜索关键词,当然,同一个搜索关键词,可能会涉及到多个科室,因此,除了存储有搜
索关键词外,还存储有每个搜索关键词在各科室(版块类别)的搜索频次或出现频次(即每
个搜索关键词在各版块类别的搜索次数或在各版块类别的出现的数量)。
索关键词,则再进一步查看其在各版块类别的搜索频次或出现频次,并将搜索频次或出现
频次最高的版块类别作为目标版块类别。当然,本申请方案中,频次要求保持一致性,即若
采用搜索频次,则全部采用搜索频次来选取目标版块类别,若采用出现频次,则全部采用出
现频次来选取目标版块类别。当然,特殊情况下,如果搜索频次相同,则可再参考出现频次,
选取出现频次更高的版块类别作为目标版块类别。
的目标版块类别是最可能正确的版块类别,也就是说该版块类别最有可能涵盖有用户想要
查找的信息资料。
标版块类别进行搜索查询,如果用户选择“是”,则直接跳往对应的目标版块类别中,呈现给
用户该目标版块类别关于该搜索关键词的搜索结果。
进行搜索的话则会大大浪费时间。而如果进行全网站搜索的话,一方面信息量可能比较大,
另一方面,可能很多并不是用户需要的信息也会呈现排序在前面,用户往往要翻好几页可
能才找到自己想要的信息资料,而采用本实施例的技术方案,特别是专业领域的网站,则可
帮助用户快速定位至正确的版块类别中进行搜索查询。
次;
录“颈动脉斑块”在“心脑血管”版块类别的搜索频次:1次。
应的出现频次。
增到搜索词库中,再将该搜索关键词在全网搜索,并分别统计该搜索关键词在各个版块类
别分别出现在多少篇文献资料中。最后,将统计结果记录在搜索词库中,以供后续系统就
“颈动脉斑块”这一搜索关键词,帮助用户进行快速定位至最信息最多最全的版块。
的版块类别作为目标版块类别;
作为目标版块类别;
所述搜索词关键词的同音词;
作为目标版块类别。
东西(同样具有参考价值),还可能用户输入时笔误输错了关键词中的某个字。对于这些情
况,本实施例中增加了同义词典、近义词典、及同音词典。在实际使用中,首先系统获取到用
户输入的关键词后,便会通过同义词典查找该关键词的同义词,然后再将该用户输入的关
键词及其同义词在搜索词库中进行查询比对,看是否有对应的搜索关键词,如果有则将记
录的频次(搜索关键词在各版块类别的搜索频次或者出现频次)按照从高到低的顺序进行
排序,选取排序最靠前的版块类别作为目标版块类别,提醒用户前往查询。当然,如果还是
不存在对应的搜索关键词,则再在近义词典中查找用户输入的关键词的近义词,然后再将
该近义词在搜索词库中再进行查询比对,看是否可以找到相应的搜索关键词,同样如果查
询到了的话,则按照记录的频次高低进行排序,选取排序最靠前的版块类别作为目标版块
类别。如果还是没找到,则再通过同音词典,查看是否存在与用户输入的关键词同音的词
语,如果找到了,便再在搜索词库中搜索与该同音词匹配的搜索关键词,同样将查询结果按
照记录频次高低进行排序,选取频次最高的版块类别作为目标版块类别,提示用户是否前
往该目标版块类别进行查询。当然,如果在同音词典中也还是没有找到同音的词语或者找
到的同音词未存储在搜索词库中,也就是说用户输入的搜索关键词,在搜索词库中找不到,
且其同义词、近义词、同音词也都查询不到结果的话,则不提示用户,直接将该搜索的关键
词在用户当前查询的版块进行搜索查询,并在当前版块类别中,显示关于该关键词的搜索
结果。此外,再将该搜索的关键词新增至搜索词库中。
主要用于提示用户是否输错、是否是要检索的内容,相近词汇除了用于提示用于提示外,还
可以作为领域知识点的提示。
索频次基础上加1。如果用户没有接受系统的智能导向建议,还是在当前的版块类别B上查
询关键词a,那么查询结束后,系统还是会在搜索词库中更新关键词a在版块类别B的搜索次
数:在原搜索频次基础上加1。
关键词;
息,便需要先根据该数据信息的内容进行关键词的提取,具体的,根据全文内容或者根据文
章的摘要内容提取关键词,可以采用现有技术,此次不再展开赘述。获取到新增数据信息涉
及的关键词信息后,便再在搜索词库中进行查询,查看搜索词库中是否已存在这些关键词。
搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词
在所述数据信息所属的版块类别的出现频次加一;
现频次加一。而对于在搜索词库中匹配不到的关键词,则直接在该搜索词库中新增,当然,
除了新增该关键词外,还需要记录该新增的关键词在对应的版块类别(新增的数据信息所
属的版块类别)的出现频次:一次(原来为0次,新增后加一,则为一次)。
新方案外,还可以采用下述的出现频次更新,具体的,所述出现频次更新模块包括:
中的任意一个或多个。值得注意的是,搜索词库中,可以按照搜索关键词来查看各搜索关键
词,及其在各版块类别的频次,也可以按照版块类别来查看,各版块类别中涉及的各搜索关
键词及其频次。
加一;或,获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位
置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次
数,计算所述对应关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关
键词在所述数据信息所属的版块类别的出现频次中。
出现多少次都会影响到该数据文献是否与该搜索关键词的相关度。因此,本实施例中,根据
搜索关键词出现在数据信息的位置的不同而设定了不同的权重,比如,出现在标题的权重
最高,摘要次之,其它地方则更次之。具体的,比如,搜索关键词m在新增的数据信息的摘要
中出现一次,在全文内容中出现5次。那么我们便会根据预先设定的摘要权重和全文权重,
计算搜索关键词m在该新增的数据信息的本次频次值:1*摘要权重+5*全文权重。如果在搜
索词库中,该搜索关键词m在版块类别X的出现频次为S,那么新增该数据文献后,该搜索关
键词m在版块类别X的出现频次则更新为S+本次频次值(1*摘要权重+5*全文权重)。
或用语,因此,搜索关键词较好设定和查询,采用本方案的系统也更为适用,也更精准。
浏览的数据信息及对应的浏览时长;所述智能搜索导向系统还包括:
信息作为目标数据信息,推荐给所述用户;
目标版块类别。
户自身的搜索浏览记录,比如用户搜索的关键词,或者用户浏览的一类数据信息的关键词
等等,每个关键词至少对应一个版块类别,每个关键词还关联到对应的浏览过的与该关键
词相关的数据信息。若用户当前在该网站某版块查询一搜索关键词,那么首先该网站后台
系统会先将该搜索关键词与搜索词库中存储的预设时间段内的(比如近一周)该用户的自
身搜索浏览数据信息进行比对,看该用户是否历史搜索过相关关键词或浏览过与该关键词
相关的文献数据等;如果有的话,则再看浏览时长是否超过参考时长,一般超过参考时长的
话,则说明用户可能比较感兴趣,或者浏览的内容是他想要的内容。而如果浏览的时长未超
出参考时长,则说明浏览的内容不是用户想要找的内容。因此,对于判断出浏览时长超过参
考时长的情况下,则会直接引导用户前往之前浏览的数据信息或对应的版块类别;而对于
浏览时长未超出参考时长的情况,则如实施例一中一样,再从搜索词库中找搜索关键词在
各版块类别的搜索频次或出现频次(即该网站统计的访问查询该搜索关键词的总的搜索频
次或该网站中关于该搜索关键词的出现频次),按照搜索频次或出现频次的高低排序,推荐
频次最高的目标版块类别给用户,指引用户前往该目标版块类别查询。
述对应的数据信息作为目标数据信息,推荐给所述用户。
数据信息的字数,然后再结合参考浏览速度,计算出参考浏览时长。对于参考浏览速度可以
是按照广大用户的平均浏览速度,比如一般用户的浏览速度为400字/分钟;当然,还可以根
据用户的不同设定不同的参考浏览速度,比如有的用户浏览速度比较快,可以达到800字/
分钟,那么则可设定该用户的参考浏览速度为800字/分钟。每个用户的参考浏览速度可以
用户自行设定,也可通过浏览测试后系统设定。
太大的话,则可能存在用户有其它事情离开,该数据信息被打开,但是用户由于在做其它事
情去了而实际并没有在浏览,因此,设定一个预设的差值范围,则可有效筛选出这些不符合
实际的浏览时长,提高了最终的推荐信息的准确度。
关键词在各版块类别的搜索频次或出现频次;
别,并记录所述搜索关键词在所述版块类别的搜索频次;
获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
的同义词,然后再将该用户输入的关键词及其同义词在搜索词库中进行查询比对,看是否
有对应的搜索关键词,如果有则将记录的频次(搜索关键词在各版块类别的搜索频次或者
出现频次)按照从高到低的顺序进行排序,选取排序最靠前的版块类别作为目标版块类别,
提醒用户前往查询。当然,如果还是不存在对应的搜索关键词,则再在近义词典中查找用户
输入的关键词的近义词,然后再将该近义词在搜索词库中再进行查询比对,看是否可以找
到相应的搜索关键词,同样如果查询到了的话,则按照记录的频次高低进行排序,选取排序
最靠前的版块类别作为目标版块类别。如果还是没找到,则再通过同音词典,查看是否存在
与用户输入的关键词同音的词语,如果找到了,便再在搜索词库中搜索与该同音词匹配的
搜索关键词,同样将查询结果按照记录频次高低进行排序,选取频次最高的版块类别作为
目标版块类别,提示用户是否前往该目标版块类别进行查询。当然,如果在同音词典中也还
是没有找到同音的词语或者找到的同音词未存储在搜索词库中,也就是说用户输入的搜索
关键词,在搜索词库中找不到,且其同义词、近义词、同音词也都查询不到结果的话,则不提
示用户,直接将该搜索的关键词在用户当前查询的版块进行搜索查询,并在当前版块类别
中,显示关于该关键词的搜索结果。此外,再将该搜索的关键词新增至搜索词库中。
前后一致性,即若采用搜索频次,则整个实施过程均采用搜索频次,若采用出现频次,则整
个实施过程均采用出现频次。
词时,将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;当所述搜索词
库中不存在对应的搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并
将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
关键词时,在所述搜索词库中,将涉及的搜索关键词在所述数据信息所属的版块类别的出
现频次加一;
关键词时,获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同
位置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的
次数,计算所述搜索关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索
关键词在所述数据信息所属的版块类别的出现频次中。
语,因此,搜索关键词较好设定和查询,采用本方案也更为适用,更精准。
自身搜索浏览信息,该自身搜索浏览信息包括:关键词、浏览的版块类别、浏览的数据信息
及对应的浏览时长;其中,关键词与版块类别存在对应关系,浏览的数据信息按照关键词的
不同进行分类存储(相当于数据信息的标签便是对应的关键词)。本实施例方法流程包括:
后,会优先与自身搜索浏览信息进行比对,看其中是否有与该搜索关键词匹配的关键词,如
果有的话,则再进一步获取该关键词对应的版块类别,及与该关键词相关的浏览的数据信
息和对应的浏览时长,判断是否存在超过参考时长的浏览时长,若有,则说明该用户可能花
费了较多时间去浏览阅读,可能是该用户想要的资料信息,那么可以将该浏览时长对应的
浏览的数据信息推荐给用户,或者将对应的关键词所在的版块类别作为目标版块类别推荐
给用户,从而帮助用户快速导向正确的版块类别或数据信息。
为目标数据信息,推荐给所述用户;
步统计每篇数据信息的字数,然后再结合参考浏览速度,计算出参考浏览时长。获取到参考
浏览时长后,则再计算出用户实际浏览该篇数据信息的浏览时长与对应的参考浏览时长的
差值,然后再判定该差值是否处于预设的差值范围内,因为,如果差值太大的话,则可能存
在用户有其它事情离开,该数据信息被打开,但是用户由于在做其它事情去了而实际并没
有在浏览,因此,设定一个预设的差值范围,则可有效筛选出这些不符合实际的浏览时长,
提高了最终的推荐信息的准确度。
选实施例以及落入本申请范围的所有变更和修改。
之内,则本申请也意图包含这些改动和变型在内。