信息搜索提供装置及信息搜索提供系统转让专利

申请号 : CN200580030013.2

文献号 : CN101014954B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 上田平重树上田平美嗣

申请人 : 因特曼股份有限公司

摘要 :

需要设计一种能甄别值得信赖的网页内容和不值得信赖的网页内容的新的信息搜索服务。获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置(100),具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容的收集部(128);按照收集部(128)可否收集评价对象的网页内容,增减评价对象的网页内容的信赖度的信赖度控制部(130)。因此,能按照可否收集评价对象的网页内容从信赖度方面评价该网页内容,结果,能实现甄别值得信赖的网页内容和不值得信赖的网页内容、对用户来说便利性高的信息搜索服务。

权利要求 :

1.一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其特征在于具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容的收集部;

按照上述收集部可否收集上述评价对象的网页内容,增减上述评价对象的网页内容的信赖度的信赖度控制部。

2.根据权利要求1所述的信息搜索提供装置,其特征在于还具备获取来自用户的搜索条件的搜索条件获取部;

搜索符合上述获取的搜索条件的网页内容的搜索部;

向用户提示上述搜索到的网页内容的上述信赖度的信赖度提示部。

3.根据权利要求2所述的信息搜索提供装置,其特征在于还具备根据供上述评价对象的网页内容中包含的该网页内容的存续期间的推测用的要素,预测上述评价对象的网页内容的信赖度的预测部,上述信赖度提示部向用户提示上述预测的信赖度。

4.根据权利要求1所述的信息搜索提供装置,其特征在于上述信赖度控制部,在上述收集部在一定的时间内连续收集上述评价对象的网页内容的期间内时,慢慢增加上述评价对象的网页内容的信赖度。

5.根据权利要求1所述的信息搜索提供装置,其特征在于还具备根据上述收集部可否收集上述评价对象的历史,控制该评价对象的网页内容的信赖度的增加幅度的历史增加幅度控制部。

6.根据权利要求1所述的信息搜索提供装置,其特征在于还具备判断上述评价对象的网页内容和信赖度高的网页内容之间的关联性的有无的关联性判断部,上述信赖度控制部进行控制,使上述关联性判断部判断有关联性时的上述评价对象的网页内容的信赖度的增加幅度比判断没有关联性时的上述评价对象的网页内容的信赖度的增加幅度高。

7.根据权利要求6所述的信息搜索提供装置,其特征在于上述关联性判断部,根据在上述信赖度高的网页内容内是否包含表示该网页内容和上述评价对象的网页内容之间有关联性的关联信息,判断上述评价对象的网页内容和信赖度高的网页内容之间的关联性的有无。

8.根据权利要求1所述的信息搜索提供装置,其特征在于还具备参照表示公开的网页的服务器地址的地址信息,访问服务器的访问部;

判断上述访问部可否访问上述服务器的访问可否判断部;

保存上述访问可否判断部的判断结果与上述访问部访问上述服务器的时间之间的对应关系的访问历史保存部;

参照上述对应关系,确定上述访问部访问上述服务器的最初可能的时间的时间确定部,上述信赖度控制部在上述确定的时间开始上述信赖度的增减控制。

9.根据权利要求1所述的信息搜索提供装置,其特征在于还具备确定上述评价对象的网页内容的地址的地址信息的确定部,将由上述信赖度控制部增减上述评价对象的网页内容的信赖度变换为上述地址信息的信赖度的信赖度变换部。

10.根据权利要求9所述的信息搜索提供装置,其特征在于还具备根据每个共通属性将上述地址信息分为多个组的地址信息分类部,算出上述每个被分类的组的地址信息的信赖度的地址信息组信赖度算出部。

11.根据权利要求9所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的域名,信赖度控制部将上述评价对象的网页内容的信赖度变换为上述域名的信赖度。

12.根据权利要求9所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的IP地址,信赖度变换部将上述评价对象的网页内容的信赖度变换为上述IP地址的信赖度。

13.根据权利要求9所述的信息搜索提供装置,其特征在于上述信赖度变换部按照求得的上述地址信息的信赖度,进一步算出包含上述地址信息的电子邮件地址的信赖。

14.一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其特征在于具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容的收集部;

比较上述收集到的评价对象的网页内容的具体内容和从登载该网页内容的网页的同一网页上下一次收集到的评价对象的网页内容的具体内容的比较部;

根据比较结果判断上述评价对象的网页内容是否已更新的更新判断部;

按照上述判断结果增减上述评价对象的网页内容的信赖度的信赖度控制部。

15.根据权利要求14所述的信息搜索提供装置,其特征在于上述信赖度控制部,在上述更新判断部在规定的时间内连续判断上述评价对象的网页内容被更新的期间内,慢慢增加上述评价对象的网页内容的信赖度。

16.根据权利要求14所述的信息搜索提供装置,其特征在于还具备参照上述收集到的评价对象的网页内容的具体内容,分析该网页内容是否是本来就应该需要更新的更新分析部,上述信赖度控制部按照上述更新判断部的判断结果及上述更新分析部的分析结果,增减上述评价对象的网页内容的信赖度。

17.根据权利要求14所述的信息搜索提供装置,其特征在于还具备参照表示公开的网页的服务器地址的地址信息,访问服务器的访问部;

判断上述访问部可否访问上述服务器的访问可否判断部;

保存上述访问可否判断部的判断结果与上述访问部访问上述服务器的时间之间的对应关系的访问历史保存部;

参照上述对应关系,确定上述访问部访问上述服务器的最初可能的时间的时间确定部,上述信赖度控制部在上述确定的时间开始上述信赖度的增减控制。

18.根据权利要求14所述的信息搜索提供装置,其特征在于还具备确定上述评价对象的网页内容的地址的地址信息的确定部,将由上述信赖度控制部增减上述评价对象的网页内容的信赖度变换为上述地址信息的信赖度的信赖度变换部。

19.根据权利要求18所述的信息搜索提供装置,其特征在于还具备根据每个共通属性将上述地址信息分为多个组的地址信息分类部,算出上述每个被分类的组的地址信息的信赖度的地址信息组信赖度算出部。

20.根据权利要求18所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的域名,信赖度控制部将上述评价对象的网页内容的信赖度变换为上述域名的信赖度。

21.根据权利要求18所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的IP地址,信赖度变换部将上述评价对象的网页内容的信赖度变换为上述IP地址的信赖度。

22.根据权利要求18所述的信息搜索提供装置,其特征在于上述信赖度变换部按照求得的上述地址信息的信赖度,进一步算出包含上述地址信息的电子邮件地址的信赖。

23.一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其特征在于具备获取与评价对象的网页内容关联的网页内容的关联网页内容获取部;

参照上述获取的网页内容,抽出影响上述评价对象的网页内容的信赖度的增加或减少的要素的要素抽出部;

参照抽出的要素,增减上述评价对象的网页内容的信赖度的信赖度控制部。

24.根据权利要求23所述的信息搜索提供装置,其特征在于上述要素抽出部抽出上述每个信赖度的评价方面中影响上述评价对象的网页内容的信赖度的增加或减少的要素,上述信赖度控制部参照每个信赖度的评价方面中抽出的要素,增减上述评价对象的网页内容的信赖度。

25.根据权利要求23所述的信息搜索提供装置,其特征在于还具备将上述抽出的要素分别分为影响上述评价对象的网页内容的信赖度增加的第1组,或影响上述评价对象的网页内容的信赖度减少的第2组的分类部,在上述分类部分类的第1组内的要素比上述第2组内的要素数多时,上述信赖度控制部增加评价对象的网页内容的信赖度。

26.根据权利要求23所述的信息搜索提供装置,其特征在于还具备参照表示公开的网页的服务器地址的地址信息,访问服务器的访问部;

判断上述访问部可否访问上述服务器的访问可否判断部;

保存上述访问可否判断部的判断结果与上述访问部访问上述服务器的时间之间的对应关系的访问历史保存部;

参照上述对应关系,确定上述访问部访问上述服务器的最初可能的时间的时间确定部,上述信赖度控制部在上述确定的时间开始上述信赖度的增减控制。

27.根据权利要求23所述的信息搜索提供装置,其特征在于还具备确定上述评价对象的网页内容的地址的地址信息的确定部,将由上述信赖度控制部增减上述评价对象的网页内容的信赖度变换为上述地址信息的信赖度的信赖度变换部。

28.根据权利要求27所述的信息搜索提供装置,其特征在于还具备根据每个共通属性将上述地址信息分为多个组的地址信息分类部,算出上述每个被分类的组的地址信息的信赖度的地址信息组信赖度算出部。

29.根据权利要求27所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的域名,信赖度控制部将上述评价对象的网页内容的信赖度变换为上述域名的信赖度。

30.根据权利要求27所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的IP地址,信赖度变换部将上述评价对象的网页内容的信赖度变换为上述IP地址的信赖度。

31.根据权利要求27所述的信息搜索提供装置,其特征在于上述信赖度变换部按照求得的上述地址信息的信赖度,进一步算出包含上述地址信息的电子邮件地址的信赖。

32.一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其特征在于具备获取包含判断对象项目的网页内容的网页内容获取部;

确定上述获取的网页内容中的、上述判断对象项目的信息发生源即本网页内容的网页内容确定部;

比较上述确定的本网页内容的具体内容和上述获取的网页内容中的上述本网页内容以外的其他网页内容的具体内容,判断上述判断对象项目的统一性的有无的统一性判断部;

按照上述判断的结果,增减上述本网页内容的信赖度和上述其他网页内容的信赖度的信赖度控制部。

33.根据权利要求32所述的信息搜索提供装置,其特征在于在上述本网页内容的信赖度和上述其他网页内容的信赖度都高,上述统一性判断部判断上述判断对象项目有统一性时,上述信赖度控制部都增加上述本网页内容的信赖度和上述其他网页内容的信赖度。

34.根据权利要求32所述的信息搜索提供装置,其特征在于还具备参照表示公开的网页的服务器地址的地址信息,访问服务器的访问部;

判断上述访问部可否访问上述服务器的访问可否判断部;

保存上述访问可否判断部的判断结果与上述访问部访问上述服务器的时间之间的对应关系的访问历史保存部;

参照上述对应关系,确定上述访问部访问上述服务器的最初可能的时间的时间确定部,上述信赖度控制部在上述确定的时间开始上述信赖度的增减控制。

35.根据权利要求32所述的信息搜索提供装置,其特征在于还具备确定上述评价对象的网页内容的地址的地址信息的确定部,将由上述信赖度控制部增减上述评价对象的网页内容的信赖度变换为上述地址信息的信赖度的信赖度变换部。

36.根据权利要求35所述的信息搜索提供装置,其特征在于还具备根据每个共通属性将上述地址信息分为多个组的地址信息分类部,算出上述每个被分类的组的地址信息的信赖度的地址信息组信赖度算出部。

37.根据权利要求35所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的域名,信赖度控制部将上述评价对象的网页内容的信赖度变换为上述域名的信赖度。

38.根据权利要求35所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的IP地址,信赖度变换部将上述评价对象的网页内容的信赖度变换为上述IP地址的信赖度。

39.根据权利要求35所述的信息搜索提供装置,其特征在于上述信赖度变换部按照求得的上述地址信息的信赖度,进一步算出包含上述地址信息的电子邮件地址的信赖。

40.一种包含连接在网络上的终端装置;通过上述网络提供网页的服务器;提供收集该服务器上的网页上登载的网页内容,将上述收集的网页内容中符合搜索条件的网页内容作为搜索结果提供给终端装置的信息搜索提供装置的信息搜索提供系统,其特征在于上述信息搜索提供装置具备

通过网络在规定的时间内收集网页上登载的评价对象的网页内容的收集部;

按照上述收集部可否收集上述评价对象的网页内容,增减上述评价对象的网页内容的信赖度的信赖度控制部。

41.一种信息搜索提供系统,其特征在于

具备在网页上登载评价对象的网页内容的网页内容提供装置;

通过网络访问上述评价对象的网页内容的终端装置;

获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,上述终端装置具有发送终端装置附带的客户信息的信息发送部,上述信息搜索提供装置具有直接或间接接收通过上述网络访问上述评价对象的网页内容的上述终端装置发送的客户信息的信息接收部;

根据上述客户信息,增减上述评价对象的网页内容的信赖度的信赖度增减部。

42.根据权利要求41所述的信息搜索提供系统,其特征在于上述信息发送部将与访问上述评价对象的网页内容关联的信息作为上述客户信息发送,上述信赖度增减部按照上述终端装置对上述评价对象的网页内容的访问状况,增减上述评价对象的网页内容的信赖度。

43.根据权利要求41所述的信息搜索提供系统,其特征在于上述信息发送部将上述终端装置传送给上述评价对象的网页内容的信息作为上述客户信息发送,上述信赖度增减部按照上述终端装置传送给上述评价对象的网页内容的信息,增减上述评价对象的网页内容的信赖度。

44.根据权利要求41所述的信息搜索提供系统,其特征在于上述终端装置访问上述评价对象的网页内容时,将上述终端装置对上述评价对象的网页内容的访问状况及/或上述终端装置传送给上述评价对象网页内容的信息,从上述终端装置发送给上述信息搜索提供装置。

45.一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其特征在于具有直接或间接接收访问评价对象的网页内容的终端装置发送的客户信息的信息接收部;

根据上述客户信息,增减上述评价对象的网页内容的信赖度的信赖度增减部。

46.根据权利要求45所述的信息搜索提供装置,其特征在于上述信息接收部接收作为上述客户信息的、有关上述终端装置对上述评价对象的网页内容的访问状况的信息,上述信赖度增减部按照上述访问状况增减上述评价对象的网页内容的信赖度。

47.根据权利要求45所述的信息搜索提供装置,其特征在于上述信息接收部接收作为上述客户信息的、上述终端装置传送给上述评价对象的网页内容的信息,上述信赖度增减部按照上述终端装置传送给上述评价对象的网页内容的信息,增减上述评价对象的网页内容的信赖度。

48.根据权利要求45所述的信息搜索提供装置,其特征在于还具备确定上述评价对象的网页内容的地址的地址信息的确定部,将由上述信赖度控制部增减上述评价对象的网页内容的信赖度变换为上述地址信息的信赖度的信赖度变换部。

49.根据权利要求48所述的信息搜索提供装置,其特征在于还具备根据每个共通属性将上述地址信息分为多个组的地址信息分类部,算出上述每个被分类的组的地址信息的信赖度的地址信息组信赖度算出部。

50.根据权利要求48所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的域名,信赖度控制部将上述评价对象的网页内容的信赖度变换为上述域名的信赖度。

51.根据权利要求48所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的IP地址,信赖度变换部将上述评价对象的网页内容的信赖度变换为上述IP地址的信赖度。

52.根据权利要求48所述的信息搜索提供装置,其特征在于上述信赖度变换部按照求得的上述地址信息的信赖度,进一步算出包含上述地址信息的电子邮件地址的信赖。

53.一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其特征在于具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容及上述评价对象的网页内容以外的比较用网页内容的收集部;

对于上述评价对象的网页内容及上述比较用网页内容,分别获取其与上述评价对象的网页内容的提供者关联的判定项目的登载状况,通过比较上述评价对象的网页内容中的上述判定项目的登载状况和上述比较用网页内容中的上述判定项目的登载状况,判断上述评价对象的网页内容是否恰当地被更新的更新判断部;

按照上述更新判断部的结果增减上述评价对象的网页内容的信赖度的信赖度控制部。

54.根据权利要求53所述的信息搜索提供装置,其特征在于上述更新判断部,在上述比较用网页内容中登载上述判定项目时,上述评价对象的网页内容中未登载上述判定项目的情况下,判断上述评价对象的网页内容未被适当地更新。

55.根据权利要求53所述的信息搜索提供装置,其特征在于上述更新判断部,在上述比较用网页内容中登载上述判定项目之后,上述比较用网页内容中登载上述判定项目的情况下,判断上述评价对象的网页内容已被适当地更新。

56.根据权利要求53所述的信息搜索提供装置,其特征在于还具备确定上述评价对象的网页内容的地址的地址信息的确定部,将由上述信赖度控制部增减上述评价对象的网页内容的信赖度变换为上述地址信息的信赖度的信赖度变换部。

57.根据权利要求56所述的信息搜索提供装置,其特征在于还具备根据每个共通属性将上述地址信息分为多个组的地址信息分类部,算出上述每个被分类的组的地址信息的信赖度的地址信息组信赖度算出部。

58.根据权利要求56所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的域名,信赖度控制部将上述评价对象的网页内容的信赖度变换为上述域名的信赖度。

59.根据权利要求56所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的IP地址,信赖度变换部将上述评价对象的网页内容的信赖度变换为上述IP地址的信赖度。

60.根据权利要求56所述的信息搜索提供装置,其特征在于上述信赖度变换部按照求得的上述地址信息的信赖度,进一步算出包含上述地址信息的电子邮件地址的信赖。

61.一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其特征在于具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容的收集部;

判断在不同的时间收集的上述评价对象的网页内容的同一性的同一性判断部;

按照上述同一性的判断结果,增减上述评价对象的网页内容的信赖度的信赖度控制部。

62.根据权利要求61所述的信息搜索提供装置,其特征在于上述同一性判断部对先前的时间收集的上述评价对象的网页内容与后来收集的上述评价对象的网页内容的一部分是否同一进行判断,信赖度控制部,在先前的时间收集的上述评价对象的网页内容与后来收集的上述评价对象的网页内容的一部分被判断为同一时,增加上述评价对象的网页内容的信赖度。

63.根据权利要求61所述的信息搜索提供装置,其特征在于还具备确定上述评价对象的网页内容的地址的地址信息的确定部,将由上述信赖度控制部增减上述评价对象的网页内容的信赖度变换为上述地址信息的信赖度的信赖度变换部。

64.根据权利要求63所述的信息搜索提供装置,其特征在于还具备根据每个共通属性将上述地址信息分为多个组的地址信息分类部,算出上述每个被分类的组的地址信息的信赖度的地址信息组信赖度算出部。

65.根据权利要求63所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的域名,信赖度控制部将上述评价对象的网页内容的信赖度变换为上述域名的信赖度。

66.根据权利要求63所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的IP地址,信赖度变换部将上述评价对象的网页内容的信赖度变换为上述IP地址的信赖度。

67.根据权利要求63所述的信息搜索提供装置,其特征在于上述信赖度变换部按照求得的上述地址信息的信赖度,进一步算出包含上述地址信息的电子邮件地址的信赖。

68.一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其特征在于具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容及上述评价对象的网页内容以外的比较用网页内容的收集部;

比较上述评价对象的网页内容和在收集上述评价对象的网页内容的时间点已经收集到的上述比较用网页内容,判断上述评价对象的网页内容的独特性的独特性判断部;

根据上述独特性的判断结果,增减上述评价对象的网页内容的信赖度的信赖度控制部。

69.根据权利要求68所述的信息搜索提供装置,其特征在于上述独特性判断部,在收集上述评价对象的网页内容的时间点,上述评价对象的网页内容是已经收集到的上述比较用网页内容的改变的情况下,判断上述评价对象的网页内容没有独特性,上述信赖度控制部减少判断为是上述比较用网页内容的改变的上述评价对象的网页内容的信赖度。

70.根据权利要求68所述的信息搜索提供装置,其特征在于还具备确定上述评价对象的网页内容的地址的地址信息的确定部,将由上述信赖度控制部增减上述评价对象的网页内容的信赖度变换为上述地址信息的信赖度的信赖度变换部。

71.根据权利要求70所述的信息搜索提供装置,其特征在于还具备根据每个共通属性将上述地址信息分为多个组的地址信息分类部,算出上述每个被分类的组的地址信息的信赖度的地址信息组信赖度算出部。

72.根据权利要求70所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的域名,信赖度控制部将上述评价对象的网页内容的信赖度变换为上述域名的信赖度。

73.根据权利要求70所述的信息搜索提供装置,其特征在于上述确定部确定作为上述地址信息的IP地址,信赖度变换部将上述评价对象的网页内容的信赖度变换为上述IP地址的信赖度。

74.根据权利要求70所述的信息搜索提供装置,其特征在于上述信赖度变换部按照求得的上述地址信息的信赖度,进一步算出包含上述地址信息的电子邮件地址的信赖。

说明书 :

技术领域

本发明涉及信息搜索提供装置及信息搜索提供系统,特别涉及将因特网等网络上的网页上登载的文章、图像、程序等的网页内容作为搜索结果提供的信息搜索提供装置及信息搜索提供系统。

背景技术

近年来,随着因特网的利用,其主要应用即WWW(万维网)的用户激增,电子化信息的流通变得非常地活跃。与此同时,发生了由于信息量爆炸式的增加,用户获取真正想要的信息变得困难起来的问题。为了减轻这样的问题,在因特网等网络上出现了各种各样的搜索引擎。
过去,已经公开了如下技术,用户进行搜索,推定在哪个网页能找到目标信息,然后从其推定结果中赋予搜索关键字及网页的URL(网页地址)价值点,按照该价值点从大到小的顺序,决定在之后的搜索中的网页内容搜索结果的提示顺序。
专利文献1特开2004-29943号公报

发明内容

发明要解决的课题
的确,根据专利文献1,用户获取包含所希望的信息的网页的可能性变高,但是用户在利用网页上登载的网页内容时,如果其网页内容是不值得信赖的网页内容的话,用户受损失的可能性变高。因此,需要设计提供减轻这种不良情况的新的信息搜索服务。
本发明是鉴于这个问题而开发完成的,其目的是提供一种能甄别值得信赖的网页内容和不值得信赖的网页内容的新的信息搜索服务的信息搜索提供装置及信息搜索提供系统。
解决课题的方案
本发明的一种方式涉及信息搜索提供装置。该信息搜索提供装置,是一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容的收集部;以及按照收集部可否收集评价对象的网页内容,增减评价对象的网页内容的信赖度的信赖度控制部。
根据该方式,能按照可否收集评价对象的网页内容从信赖度的侧面评价该网页内容,结果,能实现甄别值得信赖的网页内容和不值得信赖的网页内容,对用户来说便利性高的信息搜索服务。
该方式的信息搜索提供装置,还可具备接收来自用户的搜索条件的搜索条件接收部;搜索符合接收到的搜索条件的网页内容的搜索部;向用户提示搜索到的网页内容的信赖度的信赖度提示部。还可以具备根据供评价对象的网页内容中包含的该网页内容的存续期间的推测用的要素,预测评价对象的网页内容的信赖度的预测部,信赖度提示部可向用户提示预测的信赖度。
信赖度控制部,可以在收集部于一定的时间内连续收集评价对象的网页内容的期间内时,慢慢增加评价对象的网页内容的信赖度。例如,可以在第1时间以后,收集部收集评价对象的网页内容,之后,在第2时间以后,收集部未收集评价对象的网页内容,再之后,在第3时间以后,收集部收集评价对象的网页内容时,由增加幅度控制部进行控制,使第3时间时的评价对象的网页内容的信赖度的增加幅度比第1时间时的评价对象的网页内容的信赖度的增加幅度低。
该方式的信息搜索提供装置,还可具备根据收集部可否收集评价对象的历史,控制该评价对象的网页内容的信赖度的增加幅度的历史增加幅度控制部。还可以具备判断评价对象的网页内容和信赖度高的网页内容之间的关联性的有无的关联性判断部,信赖度控制部可进行控制,使关联性判断部判断有关联性时的评价对象的网页内容的信赖度的增加幅度比判断没有关联性时的评价对象的网页内容的信赖度的增加幅度高。
关联性判断部,可根据表示评价对象的网页内容和信赖度高的网页内容之间有关联性的关联信息是否包含在评价对象的网页内容内,判断评价对象的网页内容和信赖度高的网页内容之间的关联性的有无。关联性判断部,可根据信赖度高的网页内容内是否包含表示该信息和评价对象的网页内容之间有关联性的关联信息,判断评价对象的网页内容和信赖度高的网页内容之间的关联性的有无。
本发明另一种方式也涉及信息搜索提供装置。该信息搜索提供装置,是一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容的收集部;比较收集到的评价对象的网页内容的具体内容和从登载该网页内容的网页的同一网页上下一次收集到的评价对象的网页内容的具体内容的比较部;根据比较结果判断评价对象的网页内容是否已更新的更新判断部;按照判断结果增减评价对象的网页内容的信赖度的信赖度控制部。
信赖度控制部,可以在更新判断部于规定的时间内连续判断评价对象的网页内容被更新的期间内,慢慢增加评价对象的网页内容的信赖度。还可以具备参照收集到的评价对象的网页内容的具体内容,分析该网页内容是否是本来就应该需要更新的更新分析部,信赖度控制部可按照更新判断部的判断结果及更新分析部的分析结果,增减评价对象的网页内容的信赖度。
本发明的另一种方式也涉及信息搜索提供装置。该信息搜索提供装置是一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其具备获取与评价对象的网页内容关联的网页内容的关联网页内容获取部;参照获取的网页内容,抽出影响评价对象的网页内容的信赖度的增加或减少的要素的要素抽出部;参照抽出的要素,增减评价对象的网页内容的信赖度的信赖度控制部。
要素抽出部抽出每个信赖度的评价方面中的影响评价对象的网页内容的信赖度的增加或减少的要素,信赖度控制部可参照每个信赖度的评价方面中抽出的要素,增减评价对象的网页内容的信赖度。
该方式的信息搜索提供装置,还具备将抽出的要素分别分为影响评价对象的网页内容的信赖度增加的第1组,或影响评价对象的网页内容的信赖度减少的第2组的分类部,在分类部分类的第1组内的要素比第2组内的要素数多时,信赖度控制部可增加评价对象的网页内容的信赖度。
本发明的另一种方式也涉及信息搜索提供装置。该信息搜索提供装置是一种获取搜索条件,将提供符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其具备获取包含判断对象项目的网页内容的具体内容获取部;确定获取的网页内容中的、判断对象项目的信息发生源即本网页内容的具体内容确定部;比较确定的本网页内容的具体内容和获取的网页内容中的本网页内容以外的他网页内容的具体内容,判断判断对象项目的统一性的有无的统一性判断部;按照判断的结果,增减本网页内容的信赖度和他网页内容的信赖度的信赖度控制部。
该方式的信息搜索提供装置,在本网页内容的信赖度和他网页内容的信赖度都高时,统一性判断部判断判断对象项目有统一性,这时信赖度控制部可都增加本网页内容的信赖度和他网页内容的信赖度。
上述的信息搜索提供装置,还可以具备参照表示公开的网页的服务器地址的地址信息,访问该服务器的访问部;判断访问部可否访问服务器的可否判断部;保存访问可否判断部的判断结果与访问部访问服务器的时间之间的对应关系的访问历史保存部;参照对应关系,确定访问部访问服务器的最初可能的时间的时间确定部,信赖度控制部可在确定的时间开始信赖度的增减控制。
本发明的另一种方式涉及信息搜索提供系统。该信息搜索提供系统,是包含连接在网络上的终端装置;通过网络提供网页的服务器;提供收集该服务器上的网页上登载的网页内容,将收集的网页内容中符合搜索条件的网页内容作为搜索结果提供给终端装置的信息搜索提供装置的信息搜索提供系统,信息搜索提供装置具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容的收集部,和按照收集部可否收集评价对象的网页内容,增减评价对象的网页内容的信赖度的信赖度控制部。
本发明的另一种方式涉及信息搜索提供系统。该信息搜索提供系统,具备在网页上登载评价对象的网页内容的网页内容提供装置;通过网络访问评价对象的网页内容的终端装置;获取搜索条件,将符合搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,终端装置具有发送终端装置附带的客户信息的信息发送部,信息搜索提供装置具有直接或间接接收通过网络访问评价对象的网页内容的终端装置发送的客户信息的信息接收部;根据客户信息,增减评价对象的网页内容的信赖度的信赖度增减部。
本发明的另一种方式涉及信息搜索提供装置。该信息搜索提供装置是一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,具有直接或间接接收通过网络访问评价对象的网页内容的终端装置发送的客户信息的信息接收部;根据客户信息,增减评价对象的网页内容的信赖度的信赖度增减部。
本发明的另一种方式涉及信息搜索提供系统。该信息搜索提供系统,具备在网页上登载评价对象的网页内容的网页内容提供装置;通过网络访问评价对象的网页内容的终端装置;获取搜索条件,将符合搜索条件的网页内容作为搜索结果提供的信息搜索提供装置。终端装置具有发送终端装置附带的客户信息的信息发送部,信息搜索提供装置具有直接或间接接收通过网络访问评价对象的网页内容的终端装置发送的客户信息的信息接收部;根据客户信息,增减评价对象的网页内容的估计资产价值的资产价值增减部。
本发明的另一种方式涉及信息搜索提供装置.该信息搜索提供装置是一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,具有直接或间接接收通过网络访问评价对象的网页内容的终端装置发送的客户信息的信息接收部;根据客户信息,对评价对象的网页内容增减估计资产价值的资产价值增减部.
本发明的另一种方式涉及信息搜索提供装置。该信息搜索提供装置是一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容及评价对象的网页内容以外的比较用网页内容的收集部;对于评价对象的网页内容及比较用网页内容,分别获取其与评价对象的网页内容的提供者关联的判定项目的登载状况,通过比较评价对象的网页内容中判定项目的登载状况和比较用网页内容中判定项目的登载状况,判断评价对象的网页内容是否恰当地被更新的更新判断部;按照更新判断部的结果增减评价对象的网页内容的信赖度的信赖度控制部。
本发明的另一种方式涉及信息搜索提供装置。该信息搜索提供装置是一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容的收集部;判断在不同的时间收集的评价对象的网页内容的同一性的同一性判断部;按照同一性的判断结果,增减评价对象的网页内容的信赖度的信赖度控制部。
本发明的另一种方式涉及信息搜索提供装置。该信息搜索提供装置是一种获取搜索条件,将符合该搜索条件的网页内容作为搜索结果提供的信息搜索提供装置,其具备通过网络在规定的时间内收集网页上登载的评价对象的网页内容及评价对象的网页内容以外的比较用网页内容的收集部;比较评价对象的网页内容和在收集评价对象的网页内容的时间点已经收集到的比较用网页内容,判断评价对象的网页内容的独特性的独特性判断部;根据独特性的判断结果,增减评价对象的网页内容的信赖度的信赖度控制部。
发明效果
采用本发明,能提供对用户来说便利性高的信息搜索服务。

附图说明

图1是表示实施方式1的信息搜索提供系统的构成的附图。
图2是表示实施方式1的终端装置的构成的附图。
图3是表示实施方式1的信息搜索提供装置的构成的附图。
图4是表示存储在搜索信息保存部的搜索信息文件的数据构造的例子的附图。
图5是表示存储在访问历史保存部的访问历史文件的数据构造的例子的附图。
图6是表示实施方式1的网页内容收集处理的流程的附图。
图7是表示可继续收集时的评价对象的网页内容的信赖度和时间之间的关系的附图。
图8是表示评价对象的网页内容途中不可收集时的信赖度和时间之间的关系的附图。
图9是表示实施方式2的信息搜索提供装置的构成的附图。
图10是表示评价对象的网页内容的信赖度和时间之间的关系的附图。
图11是表示实施方式3的信息搜索提供装置的构成的附图。
图12图12(a)表示评价对象的网页内容连续被更新时的信赖度和时间之间的关系,图12(b)是评价对象的网页内容途中未被更新时的信赖度和时间之间的关系的附图.
图13是表示实施方式4的信息搜索提供装置的构成的附图。
图14是表示实施方式5的信息搜索提供装置的构成的附图。
图15是表示评价对象的网页内容途中产生链接中断时的网页内容的信赖度和时间之间的关系的附图。
图16是表示实施方式6的信息搜索提供装置的构成的附图。
图17是表示实施方式7的信息搜索提供装置的构成的附图。
图18是表示本网页内容和他网页内容的信赖度的相关关系的示意图。
图19是表示搜索初期画面的例子的附图。
图20是表示搜索结果画面的例子的附图。
图21是表示实施方式9的信息搜索提供系统的构成的附图。
图22是表示实施方式9的网络利用终端装置的构成的附图。
图23是表示实施方式9的网络服务器的构成的附图。
图24是表示实施方式9的信息搜索提供装置的构成的附图。
图25是表示实施方式9的存储在接收信息保存部的接收信息的数据构造的例子的附图。
图26是表示实施方式9的存储在搜索信息保存部的搜索信息文件的数据构造的例子的附图。
图27是表示实施方式9的对接收的信息进行信赖度增减处理的流程的流程图。
图28是表示实施方式10的信息搜索提供系统的构成的附图。
图29是表示实施方式10的存储在获取网页内容信息保存部的搜索信息文件的数据构造的例子的附图。
图30是表示实施方式10的存储在搜索信息保存部的接收信息的数据构造的例子的附图。
图31是表示实施方式10的存储在时间保存部的搜索信息文件的数据构造的例子的附图。
图32是表示实施方式10的存储在委托信息保存部的数据构造的例子的附图。
图33是表示实施方式11的信息搜索提供系统的构成的附图。
图34是表示实施方式12的信息搜索提供系统的构成的附图。
图35是表示存储在比较用网页内容保存部的比较用网页内容信息文件的例子的附图。
图36是表示实施方式13的信息搜索提供系统的构成的附图。
图37是表示存储在搜索信息保存部的搜索信息文件的数据构造的例子的附图。
图38是表示存储在组别化信息保存部的IP地址信息一览表的例子的附图。
图39是表示存储在地址信息信赖度保存部的各种信赖度一览表的例子的附图。
图40是表示存储在地址信息信赖度保存部的各种信赖度一览表的例子的附图。
图41是表示存储在地址信息信赖度保存部的各种信赖度一览表的例子的附图。
图42是表示域名种类一览表的例子的附图。
附图标记说明
10信息搜索提供系统、12网络、50终端装置、54获取部、100信息搜索提供装置、112搜索条件获取部、114检索部、122访问部、124访问可否判断部、126时间确定部、128收集部、130信赖度控制部、132历史增加幅度控制部、134关联性判断部、136比较部、138更新判断部、142关联网页内容获取部、144要素抽出部、146分类部、147网页内容获取部、148本网页内容特定部、150统一性判断部、190访问历史保存部、200网络服务器、R1本网页内容。

具体实施方式

实施本发明的最佳方式
实施方式1
图1是表示本实施方式的信息搜索提供系统10的构成的附图。图1所示的信息搜索提供系统10具备信息搜索提供装置100,网络服务器200,及网络12。网络12上连接有信息搜索提供装置100,网络服务器200,及终端装置50。本实施方式的网络12是WAN(Wide Area Network)(广域网),但是作为其他的例子,也可以是LAN(Local Area Network)(局域网)或者按照TCP/IP(Transmission Control Protocol/InternetProtocol)(传输控制协议/互联网协议)等通信标准接收发送规定的数据的通信网络。终端装置50是个人电脑,PDA(Personal DigitalAssistance)(掌上电脑)或者手机等,另一方面,信息搜索提供装置100和网络服务器200安装在个人电脑上。网络服务器200通过网络12公开网页上登载的网页内容。网页内容是指文本数据,图像数据,动画数据,声音数据等可电子化的数据。
用户利用终端装置50上搭载的图中未表示的WWW浏览器访问信息搜索提供装置100,指定搜索条件进行搜索。信息搜索提供装置100接收该搜索条件的搜索执行指示,从保存在图1中未表示的数据库中的庞大的信息中,抽出符合搜索条件的网页内容和该网页内容附带的信息(以下,称“网页内容附带信息”),再将其一览化作为搜索结果提供给终端装置。这时,还提示网页内容的信赖度。网页内容附带信息包括网页的URL,网页内容的大小,网页内容的更新日期,网页内容的标题等。此外,数据库中保存的庞大的网页内容由信息搜索提供装置100内的图1中未表示的收集控制部从网页定期或不定期的收集。
图2是表示本实施方式的终端装置50的构成的附图。终端装置50具备搜索条件接收部62、发送部52、获取部54和提示部64。搜索条件接收部62获取用户通过键盘、鼠标、及其他的外部机器输入的数据,即这里的搜索条件。搜索条件可是如“牛肉”、“料理”、“菜谱”样的关键字的形式,也可是如“想知道使用牛肉的料理的菜谱”样的自然文的形式。
发送部52通过网络12向信息搜索提供装置100发送搜索条件接收部62获取的来自用户的搜索条件的信息。这时,信息搜索提供装置100进行搜索处理。获取部54通过网络12获取符合搜索条件的网页内容和网页内容附带信息作为搜索结果,如该网页内容的大小,URL等的一览。这时,还提示网页内容的信赖度。提示部64整理获取部54获取的信息,通过图中未表示的显示器向用户显示。此外,也可通过图中未表示的扬声器用声音通知用户。
图3是表示本实施方式的信息搜索提供装置100的构成的附图.信息搜索提供装置100具备搜索符合用户指定的搜索条件的网页内容并作为搜索结果提供给终端装置50的搜索控制部110;定期或不定期的收集网络服务器200的网页上登载的网页内容的收集控制部120;保存收集的网页内容的搜索信息保存部180;保存收集控制部120访问网络服务器的访问历史的访问历史保存部190.搜索控制部110具备搜索条件获取部112、搜索部114、搜索结果提供部116和信赖度提示部118.收集控制部120具备访问部122、访问可否判断部124、时间确定部126、收集部128、信赖度控制部130和历史增加幅度控制部132.
信息搜索提供装置100的各构成要素,通过硬件组成的话,可以由任何计算机的CPU(Central Processing Unit)(中央处理器),存储器,以及其他元件,通过软件组成的话,可以由加载到存储器的具有信息搜索、收集功能、存储功能,及其他功能的程序等实现,但是,这里描述了通过其结合实现的功能模块。因此所属技术领域的技术人员是可以理解为该些功能模块能以只是硬件,只是软件或者是其组合的各种各样的形式实现。
搜索条件获取部112获取发送部52发送的来自用户的搜索条件。这时,搜索条件如果是自然文的形式的话,搜索条件获取部112可向图中未表示的关键字抽出部发送一次该搜索条件。这时,关键字抽出部分解形式要素,主要是将名词,用前面的搜索条件的例子说的话是“牛肉”、“料理”、“菜谱”等作为关键字抽出,搜索条件获取部112将组合该些关键字的条件作为新的搜索条件获取。
搜索部114,从存储在搜索信息保存部180的搜索信息文件中,搜索符合搜索条件获取部112获取的搜索条件的网页内容,该网页内容的信赖度和网页内容附带信息。这时,搜索部114可利用包含存储在搜索信息保存部180的网页内容的索引语的文件,即索引文件进行搜索。这样能实现搜索处理的高速化。搜索结果提供部116将搜索得到的信息一览化,作为搜索结果提供给终端装置50。这时,信赖度提示部118在终端装置50提示搜索到的网页内容的后述信赖度。因此,用户能够知道信息具有什么程度的信赖度。
访问部122参照包含后述的访问历史保存部190内的访问历史文件中的表示网络服务器200地址的地址信息,如IP地址,访问网络服务器200。作为另一个例子,访问部122也可参照网页的URL和域名,访问该网页。本实施方式的访问部122一天一次,如上午0时按照顺序对访问历史文件中包含的、包括未使用的IP地址在内的全部IP地址进行访问。然而,访问部122的访问频率不仅限于“一天一次”,“一天两次”或“两日一次”都可。访问部122也可定期或不定期地进行访问。
访问可否判断部124判断访问部122对网页的访问可否进行。这时,访问可否判断部124判断为不可访问时,在该IP地址且后述访问历史栏内的现在的日期栏内设定标记“×”。另一方面,访问可否判断部124判断访问部122的访问可以时,在该IP地址且后述的访问历史栏内的现在的日期栏内设定标记“○”。
时间确定部126参照访问历史文件,确定访问部122最初可访问网页的时间。具体来说,时间确定部126将过去的访问历史至今是“×”,最初变成“○”的日期作为网页的提供开始日。时间确定部126判断现在的日期相当于网页的提供开始日时,在后述网页提供开始日栏内设定现在的日期。网页已经存在于网络12上,以后访问部122访问过时,时间确定部126可判断有访问时的日期相当于网页的提供开始日期。
但是,近年来,随着连接到网络上的服务器的增加,IP地址的枯竭成为问题.根据本实施方式,通过将长时间标记为“×”的IP地址作为未使用的IP地址,能确定未使用的IP地址.结果,通过管理IP地址的第三方机构向希望获取其他的IP地址的信息提供者提供该未使用的IP地址,能高效地灵活运用IP地址.
访问历史保存部190保存包含访问可否判断部124的判断结果与访问部122的访问网页的时间的对应关系的访问历史文件。访问历史文件中保存网络12上可能存在的全部IP地址。当然,也可以不全部保存,而是保存一部分IP地址。搜索信息保存部180保存后述的收集部128收集的包括网页内容,网页内容附带信息,信赖度等搜索信息文件。
访问可否判断部124判断可访问网页时,收集部128在规定的时间内,这里是一天一次地收集该网页上登载的评价对象的网页内容。然而,访问部122利用IP地址和域名的访问时,收集部128可收集网络服务器上的全部网页登载的网页内容。网页内容收集时,收集部128生成收集到的网页内容的网页内容附带信息,存储在搜索信息保存部180内。如果在网页内容内HTML(Hyper Text Markup Language)(超文本标志语言)的开头部位,如~之间记录有元标识符(META标识符)的话,收集部128可按照该元标识符包含的区域内描述的指示内容收集。也就是说,明示不要录入信息搜索提供装置100的话,收集部128可不收集该网页的信息。
信赖度控制部130按照收集部128可否收集评价对象的网页内容,在规定的时间内,这里是一日一次地增减评价对象的网页内容的信赖度。具体地说,信赖度控制部130从网页收集评价对象的网页内容时,按规定的增加幅度增加该评价对象的网页内容设定的信赖度。另一方面,收集部128不能从网页收集评价对象的网页内容时,减少该评价对象的网页内容中设定的信赖度。此外,信赖度控制部130从网页的提供日开始,便开始了该网页上登载的信息的信赖度的增减的控制。
并且,信赖度控制部130,在收集部128在规定的时间内连续收集评价对象的网页内容的期间内,慢慢增加评价对象的网页内容的信赖度。然而,在本实施方式中,虽然是在增减网页内容的信赖度,但是实质上这是等同于增减登载网页内容的网页的信赖度,公开该网页的网络服务器和运营该网络服务器的信息提供者的信赖度。并且,实质上等同于增减运营该网络服务器的信息提供者提供的包括计算机系统在内的其他各种服务提供服务器,例如,邮件服务器、FTP(File Transfer Protocol)(文件传输协议)服务器、新闻服务器等的信赖度。
根据本实施方式的信息搜索提供装置100,通过给网页内容设定信赖度,可向用户提示该网页内容具有怎样程度的信赖度。结果,用户通过信息搜索提供装置100提供的信息搜索服务,能容易地知道信息的信赖度。例如,某个公司和其他企业交易时,想知道对方的来历。这时,可以通过信息搜索提供装置100的搜索结果知道该企业提供的网页的信赖度。与海外企业交易时,与国内企业比较,不知道对方的来历的时候很多,因此特别的有意义。并且,可以节省委托调查企业信用的调查机构对贸易对象的调查,所以能够节省人工和成本。
根据本实施方式的信息搜索提供装置100,随着网页上连续登载网页内容,其信赖度也随之上升。因此,网络服务器200一直越来越稳定地提供网页的话,信赖度也变得越来越高。网页,如提供网上购物服务的购物商场的网页,如果其网页上登载的信息的信赖度高的话,用户便能知道提供网页的提供者从以前开始持续稳定的销售。相反,如果其信赖度低的话,可能是网页的提供者刚开始销售,或者是不停地变换网页的所谓恶意从业者的可能性很大。
根据本实施方式的信息搜索提供装置100,按照信赖度甄别值得信赖的网页内容和不值得信赖的网页内容,并向用户提示,用户能够从搜索结果中只选择信赖度高的网页内容。因此,用户通过选择信赖度高的网页内容,能利用优质从业者提供的服务。结果,信息搜索提供装置100实现了便利性高的搜索服务。
历史增加幅度控制部132按照收集部128可否收集评价对象的网页内容的历史,控制该评价对象的网页内容的信赖度的增加幅度。例如,“2004年1月1日”以后,收集部128收集评价对象的网页内容,之后“2004年2月1日”以后,收集部128未收集评价对象的网页内容,再之后,“2004年3月1日”以后,收集部128收集评价对象的网页内容时,历史增加幅度控制部132控制使“2004年3月1日”时的评价对象的网页内容的信赖度的增加幅度比“2004年1月1日”时的评价对象的网页内容的信赖度的增加幅度低。此外,历史增加幅度控制部132,经过一定的期间的话,可使低控制网页内容的信赖度的增加幅度返回到未低控制时假定的原增加幅度。具体来说,可使“2004年3月1日”的增加幅度的减少部分,在一年后的“2005年3月1日”,加到现在的信赖度的增加幅度上。
因此,从过去开始可连续收集网页内容的网页的信赖度的增加幅度比在途中网页内容变得不可收集的网页的信赖度的增加幅度大,能使两者的增加幅度差别化。结果,能进一步提高连续提供网页内容的重要性。
图4是表示存储在搜索信息保存部180中的搜索信息文件的数据构造的例子的附图。图4中的搜索信息文件包含IP地址栏302、URL栏304、网页内容栏306,网页提供开始日期栏308,信赖度栏310、增加幅度栏312。收集部128收集的信息存储在网页内容栏306,作为网页内容附带信息的一部分信息的URL存储在URL栏内。
IP地址栏302,包含与网络12连接的网络服务器200的IP地址。存储在本图中的IP地址栏302中的IP地址是IPv4形式的,作为其他的例子,也可是IPv6形式的。URL栏304具有表示网络12上的网页的所在的信息即URL。网页内容栏306包含收集部128收集的网页内容,在本图中为HTML(超文本标志语言)语言记述的文本数据。网页提供开始日期栏目308包含网络服务器200提供网页的开始日期。信赖度栏310包含网页上登载的信息的信赖度。增加幅度栏312包含信赖度的增加幅度。
例如,拿数据314来说,图中显示,网络服务器200的IP地址是“200.100.100.001”,网络服务器200上的网页的URL是“http://~1/”,网页的提供开始日期是“2004年1月1日”,现在的信息的信赖度是“600”,信赖度的增加幅度是“5”。也就是说,其表示,URL为“http://~1/”的网页上登载的信息的信赖度,在信息在该网页内登载的期间内时,以一定的时间,这里是一天一次地增加“5”。
图5表示存储在访问历史保存部190的访问历史文件的数据构造的例子的附图。对于与图4同等的构成赋予相同的标记,适当省略说明。图5中的数据表包含IP地址栏302和访问历史栏322。访问历史栏322,将表示访问部122可否访问网络服务器200的信息作为访问历史保存。具体来说,在确定的日期标记“○”被存储的话,表示该日可访问网页,另一方面,如果标记“×”被存储的话,表示不可访问网页。
本图为了方便,省略了“1月2日”到“5月1日”的期间,“5月5日”到“5月30日”的期间,及“6月3日”到“8月31日”的期间的访问历史的表示,但是各期间内的访问历史,原封不动地保存了各期间开始日的前一日的标记的值.此外,本图中表示了“2004年1月1日”开始到现在的日期“2004年9月1日”的访问历史,当然,访问历史栏322也可以具备“2003年12月31日”以前的访问历史.
例如,拿第1数据324来说,图中显示,网络服务器200的IP地址是“200.100.100.001”,“1月1日”开始到现在的日期“9月1日”,访问部122可访问网页。也就是说,表示网络服务器200在该期间中,连续提供网页。另一方面,拿第2数据326来说,图中显示,到“5月31日”不可访问网页,“6月1日”以后,可以访问网页。也就是说,表示IP地址是“200.100.100.002”的网络服务器200上的网页在“6月1日”开始被提供。此外,根据第3数据328,IP地址是“200.100.100.003”的网络服务器200在“5月3日”开始提供网页,但是“5月4日”以后,不提供网页。此外,信赖度增减控制的开始日期,拿第2数据326来说的话是“6月1日”。
图6表示本实施方式的信息收集处理的流程。信息搜索提供装置100对记录访问历史文件中的全部IP地址,一天一次地进行以下的信息收集处理。访问部122从存储在访问历史保存部190中的访问历史文件中获取信息收集对象的网络服务器200的IP地址(S10),然后访问网络服务器200。访问可否判断部124判断访问部122可否访问网络服务器200,判断为不可访问时(S12的N),在该IP地址且访问历史栏322内的现在的日期栏内设定标记“×”(S14)。
访问可否判断部124判断访问部122可访问时(S12的Y),在该IP地址且访问历史栏322内的现在的日期栏内设定标记“○”(S18)。时间确定部126参照访问历史文件,判断现在的日期为网页的提供开始日期时(S20的Y),在网页提供开始日期栏308设定现在的日期。时间确定部126判断现在的日期不是网页的提供开始日期时(S20的N),跳过在网页提供开始日期栏308设定现在的日期的动作。
收集部128可收集该IP地址的网络服务器上的网页上登载的网页内容时(S24的Y),收集部128将网页内容存储在搜索信息文件内的网页内容栏306中(S26)。这时,也存储网页内容附带的信息。历史增加幅度控制部132参照访问历史文件,判断现在的日期的前一日访问部122不可访问时(S28的Y),增加幅度减少“1”(S30),信赖度控制部130只按增加的幅度增加现在的网页内容的信赖度(S32)。历史增加幅度控制部132参照访问历史文件,判断现在的日期的前一日访问部122不是不可访问时(S28的N),信赖度控制部130按增加的幅度增加现在的网页内容的信赖度(S32)。
收集部128不可收集该IP地址的网页上登载的网页内容时(S24的N),信赖度控制部130减少现在的网页内容的信赖度(S34)。收集控制部120判断对访问历史文件中的全部的IP地址的网页内容收集处理是否结束,如果有网页内容收集未结束的IP地址(S16的N),对于该IP地址,执行网页内容收集处理。如果结束的话,信息搜索提供装置100结束该日的网页内容收集处理(S16的Y)。
图7是表示可连续收集时的评价对象的网页内容的信赖度和时间的关系的附图。纵轴表示网页内容的信赖度,横轴表示时间。图中的日期D0表示网页的提供开始日,该日以后的日期每经过一日的日期用日期D1~D4表示。本实施新方式中,每经过一日网页内容的信赖度上下波动,因此实际的信赖度表现为离散值,但是当然随着时间的经过信赖度可连续变化,本图即表示了这种情况。如图所示,在收集部128可持续收集评价对象的网页内容的期间内,即日期D1以后的期间内,评价对象的网页内容的信赖度慢慢增加。
图8是表示评价对象的网页内容在途中不可收集时的信息的信赖度和时间的关系的附图。纵轴表示网页内容的信赖度,横轴表示时间。对于与图7同等的部分赋予相同的标记,适当省略说明。本图显示了在日期D0,网页的提供开始,该日期以后可收集该网页上登载的网页内容,日期D2以后不可收集网页内容,D3以后再次可收集网页内容时的信赖度的变化情况。在可收集网页内容的期间即日期D0到日期D1的期间及日期D3以后的期间内,信赖度控制部139慢慢增加网页内容的信赖度,但是控制使后者期间内的信赖度的增加幅度比前者期间内的信赖度的增加幅度小。
实施方式2
在实施方式1中按照可否收集评价对象的网页内容增减该网页内容的信赖度,但是在实施方式2中,在可否收集的结果的基础上,再根据反映评价对象的网页内容和高信赖度的网页内容间的关联性有无的结果增减评价对象的网页内容的信赖度。图9是表示实施方式2的信息搜索提供装置100的构成的附图。对于与图3同等的构成赋予相同的标记,适当省略说明。实施方式2的信息搜索提供装置100还设有与图3表示的实施方式1的信息搜索提供装置100不同的构成要素即关联性判断部134。
关联性判断部134根据信赖度高的网页内容内是否包含表示该网页内容和评价对象的网页内容之间有关联性的关联信息,判断评价对象的网页内容和信赖度高的网页内容之间关联性的有无。这时,例如,关联性判断部134判断在信赖度高的网页内容内,是否包含从该关联信息如从信赖度高的网页内容到评价对象的网页内容的链接。具体来说,关联性判断部134判断信赖度高的网页内容包含的标识符内的“~”是否包含评价对象的网页内容的URL。用另外的例子来说,关联性判断部134判断在信赖度高的网页内容内的出店信息栏,介绍信息栏,提携信息栏和推荐信息栏等栏内,是否有来自评价对象的网页内容的链接,登载评价对象的网页内容的网页的URL和该网页提供者的名称。这时,这些由关联性判断部134从搜索信息文件中获取。
信赖度控制部130,进行控制,使在关联性判断部134判断有关联性时的评价对象的网页内容的信赖度的增加幅度比判断无关联性时的评价对象的网页内容的信赖度的增加幅度高。因此,例如,在信赖度高的网页内有和没有对评价对象的网页内容的链接时,能使评价对象的网页内容的信赖度有所差别。
如果多个信赖度高的网页内容中,有与评价对象的网页内容的URL一致的URL,信赖度控制部130可增加与信赖度高的网页内容的数目一致的信赖度的增加幅度。例如,如果三个信赖度高的网页内容内有与评价对象的网页内容的URL一致的URL,在现在的评价对象的网页内容的增加幅度的基础上再加上“3”。这样,在更多的信赖度高的网页内容内,从信赖度高的网页内容到评价对象的网页内容的链接越多,越能扩大信赖度的增加幅度。
此外,在多个信赖度高的网页内容内,该网页内容内的出店信息栏,介绍信息栏,提携信息栏和推荐信息栏等栏内,如果包含来自评价对象的网页内容的链接,登载评价对象的网页内容的网页的URL和网页的信息提供者的名称,信赖度控制部130可增加包含的信赖度高的网页内容的数目的评价对象的网页内容的信赖度。例如,包含的信赖度高的网页内容的数目是两个的话,在现在的评价对象的网页内容的增加幅度的基础上再加上“2”。
信赖度高的网页内容的信息提供者,从评价对象的网页内容的信息提供者来看是第三方,因此,通常,评价对象的网页内容的信息提供者不能随便改编该信赖度高的网页内容的具体内容.因此,在信赖度高的网页内容内,登载从信赖度高的网页内容到评价对象的网页内容的链接和介绍评价对象的网页内容等的信息的话,该些事实都是应该被尊重的.如上所述,为了使两者差别化,本实施方式的信赖度控制部130控制使登载上述链接和信息时的信赖度的增加幅度比未登载时的信赖度的增加幅度高.
图10是表示评价对象的网页内容的信赖度和时间的关系的附图。纵轴表示网页内容的信赖度,横轴表示时间。对于与图7同等的部分赋予相同的标记,适当省略说明。图中实线L1表示信赖度高的网页内容内未链接评价对象的网页内容时的信赖度的变化情况,另一方面,实线L2表示在日期D0时关联性判断部134判断有关联性,该日以后在信赖度高的网页内容内链接有评价对象的网页内容时的信赖度的变化情况。实线L2时的信赖度的增加幅度,比实线L1时的信赖度的增加幅度大,因此实线L2比实线L1的信赖度高。
实施方式3
在实施方式1中,按照可否收集评价对象的网页内容增减该网页内容的信赖度,但是在实施方式3中,按照该网页内容是否被更新来增减该网页内容的信赖度。图11是表示实施方式3的信息搜索提供装置100的构成的附图。对于与图3同等的构成赋予相同的标记,适当省略说明。在实施方式3的信息搜索提供装置100中,不用图3所示的实施方式1的信息搜索提供装置100的历史增加幅度控制部132,而是进一步设有新的构成要素、即比较部136及更新判断部138。
比较部136比较收集部128收集的评价对象的网页内容的具体内容和从登载该网页内容的网页的同一网页上下一次收集的评价对象的网页内容的具体内容。比较时,比较部136参照如两者的网页内容中包含的HTML语言构造,文本文字,图像和程序等。比较部136的内部可具备分析HTML语言构造,文本文字,图像和程序等的变位量的图中未表示的变位量分析部。比较部136可以比较网页固有的信息如企业名,住所,电话号码等。上一次收集的网页内容中记载的企业名,住所,电话号码等在下一次收集的网页内容中没有理由地被变更时,信赖度控制部130减少网页内容的信赖度。
更新判断部138,根据比较部136的比较结果判断评价对象的网页内容是否被更新。这时,上一次收集的网页内容的具体内容和下一次收集的网页内容的具体内容包含的,如文字在特定数量以上不同时,更新判断部138判断评价对象的网页内容已被更新。此外,即使只有1个字不同时也可判断该网页内容已被更新。
作为其他的例子,以HMTL语言的构造为例,位于上一次收集的评价对象的网页内容内的特定位置的标识符被别的标识符置换,追加插入最新的标识符时,更新判断部138可判断评价对象的网页内容有更新。作为其他例子,以图像为例,网页内容内的人物的照片与10年前比没有变化时,可判断没有更新。再作为其他的例子,网页内容内的日记中记载的文章中断时和对于论坛的不恰当使用没有采取任何对策时,更新判断部138可判断评价对象的网页内容没有更新。
信赖度控制部130按照更新判断部138的判断结果在规定的时间内,这里是一日一次地增减评价对象地网页内容的信赖度。也就是说,更新判断部138判断评价对象的网页内容已经被更新时,评价对象的网页内容一被更新,在一日一次的连续判断的期间内,就慢慢增加该网页内容的信赖度。另一方面,更新判断部138判断评价对象的网页内容没有更新时,在一日一次的连续判断的期间内,则慢慢减少该网页内容的信赖度。
根据本实施方式的信息搜索提供装置100,网页上登载的网页内容定期更新的越频繁,信赖度上升的可能性越高。通过向用户提示该网页内容的信赖度,用户能简单地知道该网页内容具有什么程度的信赖度。例如,用户可以通过信赖度高的网上购物服务的网页,安心地购物。另一方面,网页提供者这一方为了提高自身的网页内容的信赖度,可能会积极地进行定期的更新。这样,网络上存在的网页全体性被更新的可能性变高,甚至影响因特网全体的活化。
图12(a)是表示评价对象的网页内容连续被更新时的信赖度和时间的关系的附图,图12(b)是表示评价对象的网页内容途中未被更新时的信赖度和时间的关系的附图。纵轴表示网页内容的信赖度,横轴表示时间。对于与图7同等的部分赋予相同的标记,适当省略说明。在图12(a)中,日期D0以后,因网页内容每日更新,所以图中的信赖度慢慢增加。另一方面,在图12(b)中,在日期D0~日期D2的期间内网页内容每日更新,但是日期D2以后网页内容未被更新,该日以后,信赖度慢慢减少。
实施方式4
在实施方式3中按照评价对象的网页内容是否被更新来增减该网页内容的信赖度,但是在实施方式4中,在该网页内容是否被更新的基础上,再根据该网页内容是否是本来就应该需要更新的分析结果来增减评价对象的网页内容的信赖度。图13是表示本实施方式4的信息搜索提供装置100的构成的示图。对于与图11同等的构成赋予相同的标记,适当省略说明。实施方式4的信息搜索提供装置100还设有对图11所示的实施方式3的信息搜索提供装置100来说是新的构成要素即更新分析部140。
更新分析部140参照收集部128收集的评价对象的网页内容的具体内容,判断该网页内容是否是本来就应该需要更新。具体来说,更新判断部140将评价对象的网页内容分类为“本来就需要更新的组”和“本来就不需要更新的组”两组。“本来就需要更新的组”是指包含高频度更新信息有意义的网页内容,如提供新闻快报,天气,日记的网页内容的组。另一方面,“本来就不需要更新的组”是指包含不更新有意义的网页内容,如提供政治家的主张,公司的基本运营方针的网页内容的组。
具体来说,如果网页内容中包含“新闻”“天气”等高频度更新有意义的关键字的话,更新分析部140将该网页内容分到“本来就需要更新的组”。另一方面,如果网页内容中包含“主张”“基本方针”等不更新有意义的关键字的话,更新分析部140将该网页内容分到“本来就不需要更新的组”。将网页内容分到该些组的关键字可不预先录入到信息搜索提供装置100。
更新分析部140还可将“本来就需要更新的组”进一步分为“需要定期更新的组”和“不需要定期更新的组”。更新分析部140分析分到“需要定期更新的组”的网页内容是否定期更新。“需要定期更新的组”包含登载涉及存在的人物的年龄的信息,容貌姿态的图像等的网页内容。存在的人物的年龄,容貌姿态等持续变化,因此从提供最新的信息的方面来看,涉及存在的人物的年龄的信息,容貌姿态的图像等需要定期地更新。作为登载存在的人物的容貌姿态的图像的例子,可列举婚姻介绍所等主办的相亲照片脸部图像,公司介绍中登载的代表者的脸部的图像,属于某个协会的会员的脸部图像等。定期更新存在的人物的容貌姿态的图像,在之后实际见到该人物时特别有用处。
信赖度控制部130按照更新判断部138的判断结果及更新分析部140的分析结果,增减评价对象的网页内容的信赖度.也就是说,对于分到“本来就需要更新的组”的评价对象的网页内容,信赖度控制部130在更新判断部138判断网页内容已经被更新时,增加信赖度,判断未被更新时减少信赖度.另一方面,对于分到“本来就不需要更新的组”的评价对象的网页内容,信赖度控制部130在更新判断部138判断网页内容未被更新时,增加信赖度,判断已更新时减少信赖度.
根据本实施方式,在判断网页内容的更新有无的基础上,再加上判断网页内容是否是本来就应该需要更新作为信赖度的增减的判断因素,这样即使网页内容未被更新,但是该网页内容本来就是不应该更新的话,能增加信赖度,对该网页内容进行补救。
实施方式5
在实施方式3中,按照评价对象的网页内容是否被更新来增减该网页内容的信赖度,但是在实施方式5中,调查该网页内容是否被更新时,调查该网页内容内是否发生链接中断。图14是表示实施方式5的信息搜索提供装置100的构成的附图。对于与图11同等的构成赋予相同的标记,适当省略说明。实施方式5的信息搜索提供装置还具有对图11所示的实施方式3的信息搜索提供装置100来说是新的构成要素即链接中断判断部141。
链接中断判断部141访问收集部128收集的评价对象的网页内容内描述的链接地址的网页,判断该网页上是否登载某些网页内容。具体来说,链接中断判断部141参照评价对象的网页内容中包含的标识符内的“~”访问其他的网络服务器上的网页。上述的标识符如果为多个就访问多个网页。这时,例如如果出现“已经移动”和“文件不存在”等文字,判断发生了链接中断。另一方面,网页上某些网页内容,例如包含上述文字以外的网页内容被登载的话,判断未发生链接中断。
当然,链接中断判断部141可访问同一网络服务器上的同一网页的链接地址和同一网络服务器上的不同的网页的链接地址。这时,例如,链接地址的图像和影像数据等不存在时,链接中断判断部141判断发生链接中断。
信赖度控制部130按照链接中断判断部141的判断结果,控制评价对象的网页内容的信赖度的增减。具体来说,如果判断发生链接中断的话,在链接中断发生的期间内,信赖度控制部130保持评价对象的网页内容的信赖度固定。此外,这时也可减少信赖度。另一方面,评价对象的网页内容被更新,链接中断被解除的话,就增加网页内容的信赖度。
根据本实施方式,通过使网页内有链接中断时的信赖度比网页内没有链接中断时的信赖度低,能使两者差别化。因连接网页和网页的链接是因特网得以发展的重要要素之一,所以将是否有链接中断作为评价网页内容的信赖度时的指标是很有意义的。通过根据链接中断向用户提示信赖度,用户能只利用没有链接中断的信赖度高的网页内容。另一方面,网页提供者这一方为了提高网页内容的信赖度,可能会积极地进行链接中断的修复。这样,从整体来看,网络上存在的链接中断被修复的可能性得到提高,因此,这也关系到网页总体质量的提高。
图15是表示评价对象的网页内容中,途中发生链接中断的情况时的网页内容信赖度和时间的关系的附图.纵轴表示网页内容的信赖度,横轴表示时间.对于与图7同等的部分赋予相同的标记,适当省略说明.本图表不了在日期D0,网页的提供开始,该日以后该网页上登载的网页内容一天一次地被更新,日期D2以后网页内容发生链接中断,但是在日期D3以后,由于网页内容的更新,链接中断被修复时的信赖度的变化情况.如图所示,在发生链接中断的期间即D2至D3的期间内,信赖度控制部130保持网页内容的信赖度固定.
实施方式6
在实施方式1中,按照网页内容可否收集增减评价对象的网页内容的信赖度,但是在实施方式6中,按照影响评价对象的网页内容的信赖度的增加或减少的要素增减评价对象的信赖度。图16是表示实施方式6的信息搜索提供装置100的构成的附图。对于与图3同等的构成赋予相同的标记,适当省略说明。实施方式6的信息搜索提供装置100中,不用图3所示的实施方式1的信息搜索提供装置100的历史增加幅度控制部132,而是另外设有新的构成要素即关联网页内容获取部142,要素抽出部144及分类部146。
关联网页内容获取部142获取与评价对象的网页内容关联的网页内容。例如,搜索部114指定评价对象的网页内容中包含的搜索条件,例如“ABC公司”,然后进行搜索,关联网页内容获取部142可将符合该搜索条件的网页内容作为关联的网页内容(以下称“关联网页内容”)。这时,搜索部114可从搜索信息保存部180获取关联网页内容,也可利用其他的搜索引擎和网页获取关联网页内容。搜索条件可通过终端装置50由用户指定,也可由信息搜索提供装置100内部的图中未表示的搜索条件生成部用字典定期生成。此外,关联网页内容可包含评价对象的网页内容本身。
要素抽出部144从获取的网页内容中抽出影响评价对象的网页内容的信赖度的增加或减少的要素。例如,影响信赖度增加的要素是指“新产品开发”、“专利取得”、“新发展”、“收益增加”等的关键字,影响信赖度减少的要素是指“裁判”、“减少”、“负债”、“收益减少”等的关键字。影响信赖度的增加或减少的全部关键字可以预先保存在图中未表示的影响保存部。这时,要素抽出部144从影响保存部获取关键字,对关联网页内容获取部142获取的网页内容,指定该些关键字搜索,获取符合的信息。
分类部146将要素抽出部144抽出的要素分别分为影响评价对象的网页内容的信赖度增加的第1组,或影响评价对象的网页内容的信赖度减少的第2组。
信赖度控制部130参照要素抽出部144抽出的要素,增减评价对象的网页内容的信赖度。具体来说,在分类部146分的第1组内的要素数比第2组内的要素数多时,信赖度控制部130增加评价对象的网页内容的信赖度。另一方面,第2组内的要素数比第1组内的要素数多时,信赖度控制部130减少评价对象的网页内容的信赖度。
根据本实施方式,信息搜索提供装置100按照评价对象的网页内容被其他网页和网页内容怎样评价,增减评价对象的网页内容的信赖度。这时,不仅考虑影响评价对象的网页内容的信赖度上升的要素,还考虑影响评价对象的网页内容的信赖度下降的要素,提高了信赖度的评价的精度。
实施方式7
实施方式1~6都是单独增减评价对象的网页内容的信赖度,而实施方式7是同时控制相互关联的网页内容的信赖度。图17是表示实施方式7的信息搜索提供装置100的构成的附图。对于与图3同等的构成赋予相同的标记,适当省略说明。实施方式7的信息搜索提供装置100,不用图3所示的实施方式1的信息搜索提供装置100的历史增加幅度控制部132,而是另外设有新的构成要素即网页内容获取部147,本网页内容确定部148及统一性判断部150。
网页内容获取部147获取包含判断对象项目的网页内容.所谓判断对象项目可以是统一性的判断对象的数据,如住所,电话号码,传真号,也可是其他的录用关联信息和财务关联信息等.录用关联信息是指如明年的录用预定人数和今年的实际录用人数等,财务关联信息是指销售额和常年利润额等.此外,判断对象项目的数据形式不限,可以是文本数据,图像数据,声音数据和影像数据等.本网页内容确定部148确定获取的网页内容中判断对象项目的信息发生源为本网页内容.以下,表示了确定本网页内容时的判断因素的例子.当然判断因素由以下组合构成也可.
(1)参照网页内容的URL确定。
(2)参照网页内容的具体内容确定。
(3)参照从其他的网页,搜索引擎和数据库得到的搜索结果确定。
(4)确定网页内容中的粘贴的链接的总数
(5)确定网页内容的提供开始日。
(1)的情况时,本网页内容确定部148,参照获取的网页内容的URL,例如判断对象项目是确定的企业的电话号码,判断URL内是否包含该企业的域名“abc”,如果包含的话,则判断该网页内容为本网页内容。这时,访问部122可访问管理域名的第三方机构的数据库,获取该企业的域名。
(2)的情况时,本网页内容确定部148参照获取的网页内容的具体内容,例如,判断对象项目是确定的企业的电话号码,网页内容内的标题部分,例如,在标识符中包含的区域内如果有企业的名称的话,则判断为本网页内容。
(3)的情况时,本网页内容确定部148,指定判断对象项目为搜索条件,从其他的网页,搜索引擎,和数据库等得到的搜索结果中,判断位于最上面的网页内容为本网页内容。(4)的情况,本网页内容确定部148参照网页内容内的标识符,判断其他的网页内容中粘贴的链接数最多的网页内容为本网页内容。
(5)的情况时,本网页内容确定部148参照与获取的网页内容涉及的网页的提供开始日,判断提供开始日最早的网页内容为本网页内容。
统一性判断部150比较本网页内容确定部148确定的本网页内容的具体内容和获取的网页内容中本网页内容以外的其他网页内容的具体内容,判断判断对象项目的统一性的有无。
信赖度控制部130按照统一性判断部150的判断结果,增减本网页内容的信赖度和他网页内容的信赖度。也就是说,在本网页内容的信赖度和他网页内容的信赖度都高,统一性判断部150判断判断对象的项目有统一性时,信赖度控制部130都增加网页内容的信赖度和他网页内容的信赖度。在本网页内容的信赖度和他网页内容的信赖度都高,判断判断对象的项目无统一性时,信赖度控制部130降低两方的信赖度。这时,信息搜索提供装置100具备图中未表示的通知部,通知登载各网页内容的网页的信息提供者判断对象项目的修正指示。
在本网页内容的信赖度高他网页内容的信赖度低,判断有统一性时,信赖度控制部130提高他网页内容的信赖度,但是不增减本网页内容的信赖度。并且,在本网页内容的信赖度高他网页内容的信赖度低,判断无统一性时,信赖度控制部130降低他网页内容的信赖度,但是不增减本网页内容的信赖度。也就是说,信赖度低的他网页内容本来是不值得信赖的具体内容,因此信赖度控制部130不被其左右地控制本网页内容的信赖度。
图18是关于本网页内容和他网页内容的判断对象项目的关系的示意图。本网页内容R1包含判断对象项目“信息X=鹿儿岛县”,他网页内容R2包含判断对象项目“信息X=鹿儿岛县”,他网页内容R3包含判断对象项目“信息X=冲绳县”。统一性判断部150比较本网页内容R1和他网页内容R2,或者比较本网页内容R1和他网页内容R3,判断统一性的有无。本图的情况下,统一性判断部150对于本网页内容R1和他网页内容R2判断有统一性,对于本网页内容R1和他网页内容R3判断无统一性。
他网页内容可以是官方的或者公共性高的事业部门提供的网页内容。官方的或者公共性高的事业部门是指例如由国家,地方公共团体和第三方机构运营的事业部门。该些事业部门提供的网页内容的信赖度一般很高,因此统一性判断部150对于判断对象项目,例如电话号码,住所等,如果判断本网页内容和他网页内容有统一性的话,能增加本网页内容的信赖度。
一般地,有的网页内容中会含有虚假和错误的具体内容。因此,判断信息提供者发送的具体内容与其他网页内容、网页上登载的具体内容之间统一性的有无是有意义的。根据本实施方式的信息搜索提供装置100,通过根据统一性的有无通知用户网页内容的信赖度,使用户能只利用包含虚假,错误的具体内容的可能性小,信赖度高的网页内容。另一方面,网页提供者这一方为了提高网页内容的信赖度,可能会积极地进行虚假和错误的改正。因此,从总体上改正整个网页内容虚假和错误的可能性变高,因此与提高网页的总体质量也是有关系的。
实施方式8
实施方式8的信息搜索提供装置100具备实现实施方式1、实施方式3、实施方式5、实施方式6及实施方式7的功能的构成要素。这时,各个实施方式的构成要素实现的信赖度,分别作为不同的信赖度由搜索信息文件内的信赖度栏310管理。此外,实施方式8的信息搜索提供装置100也可以不用实现实施方式1的功能的构成要素,而代之以实现实施方式2的功能的构成要素,不用实现实施方式3的功能的构成要素而代之以实现实施方式4的功能的构成要素。
图19是表示信息搜索提供装置100提供的搜索初期画面的例子的附图。搜索初期画面400由接收搜索条件的第1输入框402、第2输入框404、第3输入框406、开始按钮408及取消按钮410等构成。在第1输入框402中输入关于公司名称,代表者姓名,商品名称等的搜索条件,在第2输入框404中输入URL,电话号码,传真号,住所等,在第3输入框406中由用户输入进行所谓的自由搜索时的搜索条件。在至少有一个框内输入搜索条件后,按下开始按钮408时,输入的搜索条件被发送部52发送给信息搜索提供装置100,进行搜索处理。如果在发送过程中,按下取消按钮410的话,信息搜索提供装置100停止搜索处理。
图20是表示信息搜索提供装置100提供的搜索结果画面401的例子的附图。搜索结果画面401上显示符合搜索条件的网页内容和与该网页内容关联的各种信息,如信赖度。搜索结果画面401由显示登载网页内容的网页的信息提供者的区域412,显示网页的提供开始日期的区域414,用表的形式提示信赖度和时间的关系的信赖度表420,记载被提示的网页内容的评价具体内容的其他网页内容一览的一览区域430,及用字母的形式提示确定的项目中的信赖度的信赖度排名表440等构成。
信赖度表420具备5个第1~第5信赖度表420a~420e.这里,第1信赖度表420a是关于实施方式1或者实施方式2的网页内容的连续性的信赖度表,第2信赖度表420b是关于实施方式3或者实施方式4的网页内容的更新状况的信赖度表,第3信赖度表420c是关于实施方式5的网页内容的链接地址状况的信赖度表,第4信赖度表420d是关于实施方式6的网页内容的来自他网页内容的评价的信赖度表,第5信赖度表420e是综合第1~第4信赖表420a~420d的结果的信赖度表.5个第1~第5信赖度表420a~420e中的点A表示现在的网页内容的信赖度.
一览区域430具有存储对搜索到的网页内容评价良好的其他网页的一览的第1一览区域422和存储对搜索到的网页内容评价不好的其他网页的一览的第1一览区域424。具体来说,实施方式6的关联网页内容获取部142获取的网页内容中,提示影响评价对象的网页内容的信赖度的增减的网页内容。如图所示,第1一览区域422存储登载包含使搜索到的网页内容的信赖度增加的关键字的网页内容的网页的一览,第2一览区域424存储登载包含使搜索到的网页内容的信赖度减少的关键字的网页内容的网页的一览。
信赖度排名表440包含项目栏442及排名栏444。该表是表示实施方式7的构成要素作为统一性判断结果控制信赖度的表。该信赖度排名表440包含上述判断对象项目即住所,电话号码,传真号,录用关联信息等。排名栏444所包含的信息按照网页内容的信赖度大小顺序分为几个范围,用字母表示。例如,排名“A”表示信赖度高的状态,以下随着信赖度按照顺序降低,也按照顺序用字母“B”,“C”,“D”表示。
根据本实施方式,通过从多个方面,例如网页内容的连续性,网页内容的更新状况的方面向用户提示网页内容的信赖度,使用户能知道多方面的网页内容的信赖度。特别是综合评价的信赖度,总结多方面的信赖度,在平衡性方面很优秀,用户也能知道有关网页内容的信赖度高的评价结果。
实施方式9
在实施方式1中,按照可否收集评价对象的网页内容增减该网页内容的信赖度。在实施方式9中,在可否收集评价对象的网页内容的基础上,按照通过网络访问该网页内容的网络利用终端装置上附带的客户信息,增减该网页内容的信赖度。作为客户信息,可列举涉及上述网络利用终端装置访问该网页内容的访问状况的信息,上述网络利用终端装置输入到该网页内容的信息。
图21是表示实施方式9的信息搜索提供系统11的构成的附图。对于实施方式9的信息搜索提供系统11,对于与图1同等的构成赋予相同的标记,适当省略说明。实施方式9的信息搜索提供系统11在图3所示的实施方式1的信息搜索提供系统10的基础上还具有利用该网页内容的网络利用终端装置500。
图22是表示实施方式9的网络利用终端装置500的构成的附图。网络利用终端装置500具备网页内容获取部502,终端信息保存部504和信息发送部506。
网页内容获取部502通过网络12获取网络服务器200提供的网页内容。具体来说,从网络利用终端装置500上搭载的图中未表示的WWW浏览器发送网络服务器200提供的网页内容的获取要求。按照该网页内容获取要求,网络服务器200发送的网页内容被读入到网络利用终端装置500中,显示在WWW浏览器上。网页内容获取部502的网页内容获取时间,网页内容的获取次数等作为例如cookie等的访问情况记录数据保存在网络利用终端装置500中。
终端信息保存部504保存与网络利用终端装置500相关的信息。作为终端信息保存部504保存的信息的例子,可以列举出来自cookie的可获取的网页内容获取时间,网页内容获取次数等的信息,获取网页内容时经由的URL的相关信息,网络利用终端装置500的操作系统(以下,称OS)的相关信息,网络利用终端装置500使用的浏览器,网络利用终端装置500利用的网络服务提供商(以下称ISP)的相关信息等。
信息发送部506向网络服务器200发送网络利用终端装置500附带的客户信息。信息发送部506发送的客户信息的具体例子为上述网页内容获取时间,网页内容获取次数,0S相关信息,ISP相关信息等。此外,如后述,网页内容提供部202提供的网页内容是利用因特网进行商品的销售的网页内容时,信息发送部506将商品购入者的姓名,商品名称,购入商品的单价及个数等信息作为客户信息,发送给网络服务器200。
图23是表示实施方式9的网络服务器200的构成的附图。实施方式9的网络服务器200具备网页内容提供部202,访问感知部204,输入信息接收部206,信息获取部208,信息发送部210。
网页内容提供部202按照网络利用终端装置500的要求提供网页内容。网页内容提供部202提供的网页内容不仅是以新闻,博客,图像,动画等的阅览为目的的具体内容,还可是利用因特网进行商品的销售的具体内容。网页内容提供部202为了实现上述信息发送部506的客户信息的发送,最好在网络利用终端装置500阅览该网页内容时及对该网页内容输入某些信息时,提供写入使信息传送给网络服务器200的命令程序(用Java描述语言描述)的网页内容。
对该网页内容输入某些信息时,可使用例如用CGI程序等编程的、由文本框和单选按钮等组成的输入窗体。
访问感知部204感知网络利用终端装置500阅览该网页内容,网络利用终端装置500对该网页内容输入某些信息等的网络利用终端装置500对该网页内容的访问。
输入信息接收部206接收来自网络利用终端装置500的输入给该网页内容的输入信息。例如,网页内容提供部202提供的网页内容是利用因特网进行商品销售的网页时,输入信息接收部206作为输入信息接收商品购入者的姓名,商品名称,购入商品的单价及个数等信息。
信息获取部208获取网络利用终端装置500的信息发送部506发送的网页内容获取时间,网页内容获取次数,OS相关信息,ISP相关信息等。
信息发送部210向信息搜索提供装置100发送获取的客户信息。
图24是表示实施方式9的信息搜索提供装置100的构成的附图。关于图24所示的信息搜索提供装置100,对于与图3同等的构成赋予相同的标记,适当省略说明。实施方式9的信息搜索提供装置100,在图3所示的实施方式1的信息搜索提供装置100的构成要素的基础上,还具备接收信息保存部510和分析条件保存部520。此外,实施方式9的收集控制部120还具有信息接收部530,信息接收结束判断部531,信息分析部532,客户判断部534,常客利用度控制部535,交易评价部536,交易评价更新部537,资产价值算出部538和资产价值更新部539。
信息接收部530接收网络服务器200的信息发送部210发送的信息,存储在接收信息保存部510中.网络利用终端装置500的访问连续进行时,接收一连串的访问中的客户信息.
图25是表示接收信息保存部510中存储的接收信息的数据构造的例子的附图。在图25中,对于与图4同等的构成赋予相同的标记,适当省略说明。网络利用终端装置500访问该网页内容时,网络利用终端装置500经由网络12,使用访问的浏览器等的网页内容阅览用软件。接收信息保存部510保存信息接收部530接收的、与网络利用终端装置500的访问历史关联的客户信息及与网络利用终端装置500输入的数据关联的客户信息。
作为与访问历史关联的客户信息,可列举出网络利用终端装置500访问该网页内容的访问时间550,分配网络利用终端装置500给的元IP地址552,网络利用终端装置500保存的经由地址URL554,网络利用终端装置500中使用的0S信息556等。
作为与输入数据关联的客户信息,可列举出网络利用终端装置500设置在该网页内容上的商品购入用窗口的输入,或者自动输入的购入金额568,商品名称560,利用者姓名562等。
返回到图24的构成说明,信息接收结束判断部531判断信息的接收是否在继续,判断一连串的访问在何时结束。例如,判断信息的接收是否在继续,通过来自同一网络利用终端装置500的信息的接收间隔是否在规定的时间内来判断。
信息分析部532根据保存在分析条件保存部520中的、影响信赖度的分析条件,分析保存在接收信息保存部510中的信息。信赖度控制部130根据该分析结果增减保存在搜索信息保存部180中的信赖度。上述分析条件最好预先保存在分析条件保存部520中,但是也可以在必要时适当更新。
例如,分析条件保存部520中设定有“如果是来自同一网络利用终端装置500的访问的话使其信赖度比最开始的访问高”条件时,信息分析部532参照接收信息保存部510中保存的过去的接收信息,分析是不是来自同一网络利用终端装置500的访问。如果是来自同一网络利用终端装置500的访问,与来自不同的网络利用终端装置500的访问比,信赖度控制部130增加的信赖度更大。
网络利用终端装置500阅览该网页内容时,作为增加该网页内容的信赖度的主要原因的例子,可列举出网络利用终端装置500对该网页内容的访问的增加,经过信赖度高的网站的访问,使用信赖度高的OS的网络利用终端装置500对该网页内容的访问等。相反地,作为信赖度减少的主要原因的例子,可列举出网络利用终端装置500对该网页内容的访问的减少,经过信赖度低的网站的访问,使用信赖度低的OS的网络利用终端装置500对该网页内容的访问等。关于网站的信赖度,参照保存在搜索信息保存部180中的信息。另外,可根据网络利用终端装置500使用的浏览器和程序的种类,更新版本,对脆弱性对策的有无,对其他地址造成危害的可能性的有无,网络利用终端装置500利用的ISP的信赖度等,增减该网页内容的信赖度。
网络利用终端装置500对该网页内容输入某些信息时,作为增加该信赖度的主要原因的例子,可列举出网络利用终端装置500利用该网页内容购物,同一网络利用终端装置500用该网页内容多次购物。利用该网页内容进行购物,可以认为是网络利用终端装置500信任并利用该网页内容的证据。因此,进行购物的网络利用终端装置500越多,越能增加该网页内容的信赖度。此外,同一网络利用终端装置500利用该网页内容多次购物时,判断是该网页内容的常客,可认为这样的常客越多越能提高该网页内容的信赖度。
此外,网络利用终端装置500利用该网页内容进行购物时,用信用卡结帐时,能判断为来自信赖度更高的用户的访问。因此,根据与输入数据关联的客户信息,判定是不是利用信用卡购物,利用信用卡进行购物的网络利用终端装置500越多越能提高该网页内容的信赖度。使用信用卡是可确定使用网络利用终端装置500的用户的身份的例子。但是可确定用户身份的方法不仅限于信用卡的使用。
客户判定部534确认接收信息保存部510中保存的该网页内容的利用者是否与接收信息保存部510中保存的最新的利用者姓名562中的一个一致。
图26是表示搜索信息保存部180中存储的搜索信息文件的数据构造的例子的附图。关于本实施方式的搜索信息保存部180,对于与图4同等的构成赋予相同的标记,适当省略说明。本实施方式的搜索信息保存部180在图4所示的构成的基础上,还具有累计购入金额570,累计商品特性评价572,常客利用度574及资产价值576。
常客利用度控制部535,在客户判定部534确认一致时,增加搜索信息保存部180中保存的常客利用度。
例如,(http://~1)的网页内容中,“山崎太郎用29600日元购入A101商品”的信息被存储在接收信息保存部510中时,在搜索信息保存部180的符合网页内容(http://~1)的累计购入金额在“250000日元”的基础上加上“29600日元”变成了“279600日元”。此外,“A101”商品作为不易流行的食品,接受5段评价的最高排名“5”的评价的话,累计商品特性评价在“6”的基础加“5”变成了11。并且,过去“山崎太郎”在(http://~1)的网页内容中有“3”次购买历史的话,常客利用度在“20”的基础上加“3”变成“23”。
交易评价部536,获取保存在接收信息保存部510中的最新购入金额568和商品名称560。交易评价部536通过获取购物过程中输入的结算金额和商品信息,求得该网页内容中的结算规模和交易具体内容。信赖度控制部130可根据该网页内容中的结算规模和交易具体内容增减信赖度。此外,交易评价部536对于商品名称可根据流行性,商品的种类等商品的特性进行评价。这时,最好预先准备好商品特性评价的基准。
例如,该网页内容中一个月结算的金额在一定的金额以上时,交易不能影响流行的商品,常客多时,信赖度控制部130可大幅度增加信赖度。
交易评价更新部537按照交易评价部536的处理,更新保存在搜索信息保存部180的累计购入金额570及累计商品特性评价572。
这样,通过收集该网页内容中与结算相关的信息,可算出该网页内容的交易及该网页内容具有的资产价值等。
资产价值算出部538获取保存在接收信息保存部510的最新购入金额568及商品名称560的同时,从存储与该网页内容关联的数据的销售系统(图中未表示)、经理系统(图中未表示)等中获取商品的购入额,算出交易利益。考虑在特定的期间内累计的该利益的值,常客的利用度及商品的特性,预测将来的收益,算出该网页内容的资产价值。
资产价值更新部539根据资产价值算出部538算出的资产价值,更新保存在搜索信息保存部180中的资产价值。
例如,求(http://~1)的网页内容资产价值时,如果一年的利益额是“1亿日元”,常客利用度是“20”,累计商品特性评价是“6”的话,根据常客利用度和累计商品特性评价预测该利益持续3年.通过这些,算出该网页内容的资产价值是“3亿日元”.此外,最好预先准备好常客利用度和累计商品特性评价的利益算定期间算出的基准.
图27是表示本实施方式的信赖度增减处理的流程的附图。首先,信息搜索提供装置100处于等待接收网络服务器200发送的信息的状态。信息接收部530接收到客户信息(S110)后,接收到的客户信息被存储在接收信息保存部510(S120)中。
信息接收结束判断(S130)判断继续有信息的接收时(S130的Y),继续存储接收的客户信息。但是,从最初接收来自网络利用终端装置500的客户信息开始经过一定的时间后,以此为条件,可进入信息分析步骤(S140)。
另一方面,信息接收结束判断部531判断没有继续接收信息(S130的N)的话,由信息分析部532进行信息分析(S140)。信息分析部532分析“增减信赖度”时(S140的Y),信赖度控制部130进行信赖度增减处理(S150),然后结束处理。另一方面,信息分析部532分析“对信赖度没有影响”时(S140的N),结束处理。
根据本实施方式,通过利用网页内容的网络利用终端装置500具有的信息,信赖度的控制成为可能。并且,通过收集网络利用终端装置500和该网页内容间的结算信息等,可算出网页内容具有的资产价值。网络,特别是因特网上无论法人还是个人都在运营各种各样的网页内容,其中存在很多有利益的网页内容。但是,还未确立起评价网页内容运营的历史长短,实际空间存在的土地和建筑物的方法。网页内容的资产价值算出部与信赖度的算出不仅有利于个人所有网页内容的转让,传承,法人所有的网页内容的继承和转让,或者具有有利益的网页内容的法人的合并和吸收,以及对上述法人的投资和融资的顺利进行,而且还可以期待成为网页内容流通的新方法的基础。
此外,在实施方式9中,网络利用终端装置500的客户信息经由网络服务器200传达给信息搜索提供装置100,但是,网络利用终端装置500的客户信息也可直接传达给信息搜索提供装置100。此外,网络利用终端装置500的客户信息也可经由第三方运营的信息收集装置传达给100。另外,信息搜索提供装置100还可以兼具有提供网页内容的网络服务器200。实施方式10
在实施方式3中,按照评价对象的网页内容是否被更新,增减评价对象的网页内容的信赖度。在实施方式10中,对于与评价对象的网页内容提供者相关的判定项目,分别获取其在评价对象的网页内容及比较用网页内容中的登载状况,通过比较评价对象的网页内容中的判定项目的登载状况及上述比较用网页内容中的判定项目的登载状况,判断评价对象的网页内容是否适当地被判定。与评价对象的网页内容提供者相关的判定项目具体来说是运营评价对象的主办者自己使之公知的事件信息等。
一般地,什么事件公知时,该事件信息不仅登载在主办者自身运营的评价对象的网页内容上,也登载在主办者不运营的、评价对象以外的网页内容上。作为登载在评价对象以外的网页内容上的信息源,通过网络12时,可以列举出评价对象的网页内容等,在不通过网络12时,可以列举新闻发布,单独采访等。这里,不仅仅在评价对象的网页内容上未登载事件信息情况下,还在评价对象以外的网页内容上登载事件信息的情况下,以及评价对象的网页内容上登载事件信息之前在评价对象以外的网页内容上登载的情况下,判断评价对象的网页内容未适当更新。
在本实施方式中,事件信息不限于因主办者而公知,也可因主办者以外的第三者而公知.例如,有这种情况:主办者的不正当和社会恶事等不由主办者自己使之公知,而是在第三方运营的网页内容中登载,使之公知.在这种情况下,在在第三者运营的网页内容上登载主办者的错误等的事件信息时,按照在第三者运营的网页内容上是否登载关于该事件的适当的评论或者谢罪等,能够判断主办者运营的网页内容是否正常的被更新.
图28是表示实施方式10的信息搜索提供装置100的构成的附图。对于图28与图11同等的构成赋予相同的标记,适当省略说明。实施方式10的信息搜索提供装置100,在图11所示的实施方式3的信息搜索提供装置100的构成的基础上,还具备获取网页内容信息保存部600、事件保存部610和委托信息保存部630。此外,本实施方式的更新判断部138还具有事件抽出部640、事件主办者网页内容确定部641、事件发生控制部642、网页内容信息源判断部650、和更新适当判断部660。网页内容信息源判断部650包含,事件发生委托部651、事件发生接收部652、事件监视部653、事件信息源控制部654。
图29是表示存储在获取网页内容信息保存部600内的搜索信息文件的数据构造的附图。在图29中,搜索信息文件包含IP地址601,URL602,网页内容603,网页内容获取日604的数据列。收集部128收集的网页内容不仅保存在搜索信息保存部180内,也保存在获取网页内容信息保存部600内。获取的网页内容存储在网页内容603的栏内,网页内容附带信息的一部分-URL存储在URL602的栏内。
图30是表示存储在搜索信息保存部180的接收信息的数据构造的例子的附图。对于实施方式10的搜索信息保存部180,与图4同等的构成,赋予相同的标记,适当省略说明。图30中记载的数据构造,在与图4相同的构成的基础上,还具有网页内容主办者620及网页内容信息源622的数据列。这里,网页内容主办者是指运营网页内容的公司、个人、团体等。网页内容信息源是指登载在网页内容上的事件是参照什么登载的。
图31是表示存储在时间保存部610中的搜索信息文件的数据构造的例子的附图。图31中表示的搜索信息文件包含事件611,事件主办者612,事件主办者在本网页内容的登载613,本网页内容的登载以前发生的单独采访614,本网页内容的登载以后发生的网页615,本网页内容的登载以后发生的单独采访616的数据列。
这里,所谓“事件主办者在本网页内容的登载”是指网页内容主办者在自己的网页内容上登载自己使之发生的事件。“本网页内容的登载以前发生的单独采访”是指在自己的网页内容上登载已经发生的事件以前,通过单独采访等登载在其他的网页内容上。“本网页内容的登载以后发生的网页”是指在自己的网页内容上登载已经发生的事件以后,参照该被登载的网页内容而登载在其他网页内容上。“本网页内容的登载以后发生单独采访”是指在自己的网页内容上登载已经发生的事件以后,通过单独采访等在其他的网页内容上登载。
图32是表示存储在委托信息保存部630中的数据构造的例子的附图。图32中所示的搜索信息文件包含事件631,使事件发生的网页内容主办者632,公知日633,事件公知方法634的数据列。
回到图28的构成的说明,事件抽出部640随时分析蓄积的网页内容,进行事件的抽出。例如,将“2月4日A公司新发售商品X”这样的信息作为事件抽出。
事件主办者网页内容确定部641在事件抽出部640抽出事件时,参照存储在搜索信息保存部180中的图30的网页内容主办者620,确定事件主办者的网页内容.在确定的网页内容中如果有“2月4日A公司新发售商品X”,可知A公司是该事件的主办者.网页内容主办者620中如果有A公司的话,能够获取与A公司运营的网页内容相关的信息.此外,通过比较获取的网页内容的URL602和URL栏304,也能确定取得的网页内容的网页内容主办者.例如,分析网页内容(登载有“2月4日A公司新发售商品X”)的URL是(http://~1/a.html)时,从包含A公司的URL(http://~1/),可知A公司的主办事件登载在A公司的本网页内容上.另一方面,分析网页内容(登载有“2月4日A公司新发售商品X”)的URL是(http://~3/c.html)时,从包含在X团体的URL(http://~3/)中时,可知A公司的主办事件登载在X团体的网页内容上.此外,通过参照网页内容信息源632,能确定网页内容主办者的网页内容的信息源.在上述例子中,X团体的网页内容信息源是“单独采访”得到的.
网页内容信息源判断部650用于确定图30所示的网页内容信息源622的值。
事件发生委托部651委托保存在搜索信息保存部的网页内容主办者(以下称使事件发生的网页内容主办者)在网页上不登载但是公知的事件或者只登载在网页的公知的事件的发生。有该委托,事前可使结果符合事件发生的网页内容主办者的意志。使事件发生的网页内容主办者用委托的方法使事件公知,并向事件发生接收部652发送该事件信息。例如,在图32中可知对于使事件发生的网页内容主办者D公司发生的事件(录用预定人数发布500人),是通过不在网页上登载而公知的事件。
事件发生接收部652接收上述发生的事件信息,并保存在委托信息保存部630中。之后,事件监视部653监视保存在委托信息保存部630的事件是否被事件抽出部640抽出。未在网页上登载而公知的事件被抽出时,判断该网页内容主办者的网页内容信息源来单独采访。另一方面,只登载在网页上而公知的事件被抽出时,可以判断该网页内容主办者的网页内容信息源来自网页。
网页内容信息源控制部654,将事件监视部653的监视结果存储在,保存在搜索信息保存部180中的图30中的对应的网页内容信息源622中。另外,关于网页内容信息源622,可对网页内容运营者等进行问答调查,再输入值。
事件发生控制部642,抽出事件,确定事件主办者、登载事件的网页内容主办者及网页内容信息源后,将如图31所示的数据保存在事件保存部610中。如果在事件保存部610中有相同的事件的话,事件发生控制部642则增加该符合事件的项目,即事件主办者本网页内容的登载613,本网页内容的登载以前发生单独采访614,本网页内容的登载以后发生网页615及本网页内容的登载以后发生单独采访616的数量的数值。如果没有相同的事件,事件发生控制部642则作为新的事件追加记录,输入事件611及事件主办者612,并且输入符合事件主办者本网页内容的登载613及本网页内容的登载以前发生单独采访614的数量的数值1。通常,可以考虑,关于事件,如果经过一定的期间后,出现次数会减少。因此,从事件的初次发生经过一定的期间后事件被抽出的情况下,也可以什么都不做而进行控制。
更新适当判断部660参照事件保存部610,判断事件主办者的本网页内容是否被适当地更新。
例如,图31所示的事件(9/6,录用预定人数发布,W公司),事件主办者是(W公司),主办者本网页内容的登载是“0”,本网页内容的登载以前发生单独采访是“10”.这是判断虽然在他网页内容上登载但是在本网页内容上未登载.这时,判断为未进行适当的更新.同样的,事件(2/6,R氏来鹿儿岛访问,A公司),事件主办者是(A公司),主办者本网页内容的登载是“1”,本网页内容的登载以前发生单独采访是“5”,本网页内容的登载以后发生网页是“6”,本网页内容的登载以后发生单独采访是“8”.这是,虽然在本网页内容上登载,但是在这之前通过在其他的网页内容上登载,可判断本网页内容的登载较晚.这时判断为未进行适当更新.但是,也可在本网页内容的“登载以前发生单独采访”等的数值在经过一定的峰值时判断是否更新.作为判断为适当被更新的例子,有事件(2/4,新销售商品X,A公司),事件主办者为(A公司).这时,本网页内容的登载以后,也在他网页内容上登载.这时,判断为适当更新.这时,本网页内容的“登载以后发生单独采访”为“0”或者极少的话,通过判断不是作为单独采访的网页内容处理的重要的事件,可不判断是否时适当的更新.
在本实施方式中,判断网页内容是否被适当更新的方法是观测评价对象的网页内容主办者使发生的事件如何影响评价对象的网页内容即本网页内容及他网页内容。这使得运营网页内容的人注意实时的信息更新,并且致力于提高网页内容的信赖度。
在本实施方式中,事件发生委托部651委托的事件是单独的,但是事件发生委托部651可同时期委托网页上未登载的公知事件及只登载在网页上的公知事件。这时,最好两事件的种类是相似的。此外,“同时期”不仅包含同日,还包含数日或者数周的范围。
根据这些,与只登载在网页上的公知的事件相关的信息将影响他网页内容的情况做为与某类事件相关的信息影响他网页内容的情况的基准,按照该基准,判断与网页上未登载的公知的事件相关的信息影响他网页内容的情况。
例如,可以将只在网页上登载事件公知之后,一直到在他网页内容上登载的时间及经过时间,以及登载该事件的他网页内容的数量的增加的方法作为影响他网页内容的情况的评价基准。与未在网页上登载而公知的事件相关的信息影响他网页内容的情况与该评价基准相同或类似时,能推定未在网页上登载而公知的事件,会在公知后快速在登载在本网页内容上。
此外,未在网页上登载而公知的事件在他网页内容中在第2个之后被抽出时,与未在网页上登载而公知的事件种类类似,且同时期只在网页上登载而公知的事件,在上述第2个以后被抽出的他网页内容上登载或者过去被登载时,能推定上述第2个以后被抽出的他网页内容的信息源是最初登载未被登载而公知的事件的他网页内容,也就是说来自网页。另一方面,只登载在网页上公知的事件,未被登载在上述第2个之后被抽出的他网页内容上,且过去也未被登载时,能推定上述第2个之后被抽出的他网页内容的信息源是单独采访得到的。
实施方式11
在实施方式1中,按照评价对象的网页内容可否收集增减该网页内容的信赖度,但是在实施方式11中,在可否收集的结果的基础上,判断不同的时间收集的评价对象的网页内容的同一性,按照该判断结果,增减评价对象的网页内容的信赖度。图33是表示实施方式11的信息搜索提供装置100的构成的附图。与图3同等的构成赋予相同的标记,适当省略说明。实施方式11的信息搜索提供装置100在图3所示的实施方式1的信息搜索提供装置100的构成的基础上还具备同一性判断部700。
同一性判断部700判断不同的时间收集的评价对象的网页内容的同一性.具体来说,在进行评价对象的网页内容的同一性判断时,收集部128收集新的评价对象的网页内容.同一性判断部700比较存储在搜索信息保存部180的网页内容栏306内的过去收集的评价对象的网页内容和新收集的评价对象的网页内容,判断是否保持评价对象的网页内容的同一性.
同一性判断部700判断具有评价对象的网页内容的同一性时,信赖度控制部130增加评价对象的网页内容的信赖度。另一方面,同一性判断部700判断不具有评价对象的网页内容的同一性时,信赖度控制部130减少评价对象的网页内容的信赖度。根据这些,例如,能使具有网页内容的同一性的网页与不具有网页内容的同一性的网页的信赖度差别化。
此外,同一性判断部700没有必要将过去收集的评价对象的网页内容的网页内容和新收集的评价对象的网页内容的网页内容完全一致作为判断同一性的条件。例如,在博客、新闻等的网页内容中,有在过去记载的事项上按照顺序追加记载新事项的情况。这时,同一性判断部700在判断先前的时间收集的评价对象的网页内容是后来的事件收集的评价对象的网页内容的一部分或与其相同时,可判断保持了同一性。根据这些,先前的时间收集的评价对象的网页内容作为后来的时间收集的评价对象的网页内容的一部分包含在其中,并且先前的时间收集的评价对象的网页内容的同一性被保持时,增加评价对象的信赖度。
实施方式12
在实施方式1中,按照评价对象的网页内容可否收集增减该网页内容的信赖度,但是在实施方式12中,在可否收集的结果的基础上,判断收集的评价对象的网页内容的独特性,按照该判断结果,增减评价对象的网页内容的信赖度。图34是表示实施方式12的信息搜索提供装置100的构成的附图。与图3同等的构成赋予相同的标记,适当省略说明。实施方式12的信息搜索提供装置100在图3所示的实施方式1的信息搜索提供装置100的构成的基础上,还具备比较用网页内容录入部800,比较用网页内容保存部802及独特性判断部810。
比较用网页内容录入部800处理作为比较用网页内容的具有独特性的图像、动画、文章、声音数据、程序等的网页内容,录入在比较用网页内容保存部802中。比较用网页内容,最好是有著作权的。在本实施方式中,录入网页内容时,网页内容的录入者及网页内容的权利人的信息一并录入。
图35是表示存储在比较用网页内容保存部802中的比较用网页内容信息文件的例子。比较用网页内容信息文件对应识别网页内容的网页内容ID803存储网页内容804、录入日805、录入者806及权利人807。
独特性判断部810比较评价对象的网页内容和在评价对象的网页内容被收集的时间点已经收集到的比较用网页内容,判断评价对象的网页内容的独特性。独特性判断部810参照比较用网页内容保存部802,调查评价对象的网页内容是否已经被录入。评价对象的网页内容未在比较用网页内容保存部802中录入时,判断评价对象的网页内容独特性高。
此外,独特性判断部810可判断评价对象的网页内容虽未录入比较用网页内容保存部802中,但是评价对象的网页内容是比较用网页内容保存部802中录入的网页内容的部分改变时,独特性判断部810可判断评价对象的网页内容独特性低.评价对象的网页内容是否是比较用网页内容保存部802上录入的网页内容的部分改变,例如,可通过将评价对象的网页内容和比较用网页内容保存部802中录入的网页内容的相似性按照一定的基准数值化,判定得到的数值是否在基准值以上来判断.
在独特性判断部810判断评价对象的网页内容的独特性高时,信赖度控制部130增加评价对象的网页内容的信赖度。另一方面,在独特性判断部810判断评价对象的网页内容是其他的网页内容的改变时,信赖度控制部130可减少评价对象的网页内容的信赖度。此外,评价对象的网页内容即使是其他的网页内容的改变,但是比较用网页内容保存部802的权利人及评价对象的网页内容的提供者相同的话,没有必要降低评价对象的网页内容的信赖度。根据这些,例如,能使网页内容的独特性高的网页和网页内容的独特性低的网页的信赖度差别化。
实施方式13
在实施方式1中,按照评价对象的网页内容可否收集增减该网页内容的信赖度。以上已经陈述了该网页内容的信用度与运营该网页内容的信息提供者的其他系统的信用度对应。在实施方式13中,该网页内容的地址信息的信赖度按照该网页内容的信赖度求得。作为该网页内容的地址信息的具体的例子可列举该网页内容的URL,甚至从上述URL抽出的域名。另外,分配给域名的IP地址是固定的时侯,可以通过对应IP地址和该网页内容的信赖度,求得该IP地址的信赖度。此外,通过对应含有域名的电子邮件的地址的信赖度和该网页内容的信赖度,求得电子邮件地址的信赖度。通过求得各个域名和IP地址的信赖度,能进一步求得根据域名和IP地址的确定属性分类的每个组的信赖度。
图36是表示实施方式13的信息搜索提供装置100的构成的附图。对于实施方式13的信息搜索提供装置100,与图3同等的构成赋予相同的标记,适当省略说明。实施方式13的信息搜索提供装置100在图3所示的实施方式1的信息搜索提供装置100的构成的基础上还具备地址信息抽出部1000,信赖度变换部1100,组别信赖度算出部1200,组别化信息保存部1250,地址信息信赖度保存部1300。此外,实施方式13的信息搜索提供装置100所具备的搜索控制110还包含搜索条件分析部1500。
地址信息抽出部1000从保存在搜索信息保存部180的URL中抽出域名的部分,存储在搜索信息保存部180中。例如,地址信息抽出部1000从“http://www.abc.co.jp/a.html”URL中抽出“abc.co.jp”域名部分。图37是表示存储在搜索信息保存部180中的搜索信息文件的数据构造的例子的附图。本实施方式的搜索信息保存部180在图4所示的构成的基础上还具有抽出域名1400。由地址信息抽出部1000抽出的域名写入抽出域名140的栏内。
信赖度变换部1100包含域名信赖度变换部1110,电子邮件地址信赖度变换部1120和IP地址信赖度变换部1130。
域名信赖度变换部1110,根据网页内容的信赖度算出域名的信赖度,存储在地址信息信赖度保存部1300中。原则上域名的信赖度可从网页内容的信赖度直接求得,但是也可追加网页内容的信赖度以外的其他信息算出域名的信赖度。例如,追加具有域名的团体或者域名的属性,域名的不正当利用等的信息算出域名的信赖度。
可认为算出域名的信赖度与算出包含该域名的电子邮件地址的信赖度相同.因此电子邮件地址的信赖度变换部1120根据网页内容的信赖度算出包含在电子邮件地址中的域名的信赖度,存储在地址信息信赖度保存部1300中.原则上电子邮件地址的信赖度与从网页内容的信赖度求得的域名的信赖度一致,但是也可追加网页内容的信赖度以外的其他信息.例如,可追加上述域名被用在垃圾邮件等的网页内容以外信息算出电子邮件地址的信赖度.
此外,还可认为域名的信赖度与分配给该域名的IP地址的信赖度相同。因此,IP地址信赖度变换部1130根据网页内容的信赖度算出域名的信赖度,将算出的信赖度作为分配给该域名的IP地址的信赖度存储在地址信息信赖度保存部1300中。
组别信赖度算出部1200包含域名种类分类部1210,域名种类信赖度算出部1220,ISP分类部1230和ISP信赖度算出部1240。
域名种类分类部1210,从从保存在信息保存部180中的URL中抽出的域名中,进一步抽出com、co.jp等类别域名,存储在信息保存部180中。如图37所示,本实施方式的信息保存部180中,还另外加有域名种类1402数据列。域名种类分类部1210抽出的域名种类写入域名种类1402的栏内。
域名种类信赖度算出部1220算出com、co.jp等每个域名的种类的信赖度,存储在地址信息信赖度保存部1300中。例如,com域名的域名信赖度1306分别是300、300、200的话可求得域名信赖度为(300+300+200)÷3=267
ISP分类部1230参照组别化信息保存部1250,从储存在搜索信息保存部180中的IP地址栏302中获取对应的ISP相关的信息,存储在搜索信息保存部180中。图38是表示存储在组别化信息保存部1250中的IP地址信息一览表的例子的附图。图38所示的IP地址信息一览表包含IP地址1262,担当各个IP地址的国别担当注册表1264和担当各个IP地址的担当ISP1266。此外,存储在组别化信息保存部1250的IP地址及其附带的担当ISP等的信息可通过组别化信息输入部(图中未表示),适当追加或修正。
ISP分类部1230获取与某个IP地址对应的担当ISP的信息时,参照图8所示的IP地址信息一览表,参照与该IP地址对应的担当ISP,存储在搜索信息保存部180中。如图37所示,本实施方式的搜索信息保存部180还另外加有担当ISP1404数据列。ISP分类部1230抽出的ISP写入担当ISP1404的栏内。搜索信息保存部180可存储与IP地址对应的担当注册表,服务器名等的信息。
ISP信赖度算出部1240参照搜索信息保存部180,算出每个ISP的信赖度,存储在地址信息信赖度保存部1300中。例如,A公司的ISP的IP地址信赖度分别是600、200、80的话,可求的ISP信赖度是(600+200+80)÷3=293。
地址信息信赖度保存部1300保存域名及各IP地址的信赖度,各域名种类的信赖度,各担当ISP的信赖度等与网页内容的地址相关的信息度。
图39,图40及图41是表示存储在地址信息信赖度保存部1300的各种信赖度一览表的例子的附图。
图39是表示与域名及IP地址对应的信赖度一览表的例子的附图。图39所示的信赖度一览表包含IP地址1302,抽出域名1304,域名信赖度1306,电子邮件地址信赖度1308及IP地址信赖度1310。通过参照图39所示的信赖度一览表,能抽出确定的IP地址1302或者抽出域名1304对应的域名信赖度1306,电子邮件地址信赖度1308或IP地址信赖度1310。
图40是表示域名种类对应的信赖度一览表的例子的附图.图40所示的信赖度一览表包含域名种类1312及域名种类信赖度1314.通过参照图40所示的信赖度一览表,能抽出确定的域名1312对应的域名种类信赖度1314.
图41是表示与担当ISP对应的信赖度一览表的例子的附图。图41所示的信赖度一览表包含担当ISP1316及ISP信赖度1318。通过参照图41所示的信赖度一览表,能抽出与特定的担当ISP1316对应的ISP信赖度1318。
用户输入到终端装置50的搜索条件,被信息搜索提供装置100的搜索条件获取部112获取。搜索条件分析部1500分析获取的搜索条件中是否含有域名,电子邮件地址,或IP地址。
搜索条件是否包含域名通过判断搜索条件是否满足域名的构成样式来判断。例如,搜索条件满足以下的条件时,判断为搜索条件包含域名。
【条件】
(1)、文字列被句号“.”分开。
(2)、从右数最初的句号的右侧的部分文字列符合“com”、“net”、“jp”等的最高级别域。
(3)、从右数第2各句号与从右数最初的句号之间的部分文字列符合“ac”、“co”等的第2级别域。
搜索条件是否包含电子邮件地址通过判断搜索条件是否满足电子邮件地址的构成样式来判断。例如,搜索条件如果是“x@y.z”(x是任意文字或数字的列,y.z是符合上述条件的域名)时,判断为搜索条件包含电子邮件地址。
此外,搜索条件是否包含IP地址通过判断搜索条件是否满足IP地址的构成样式来判断。例如,搜索条件如果在“0.0.0.0~255.255.255.255”的范围内的话,判断为搜索条件包含IP地址。
搜索条件分析部1500判断搜索条件中含有域名时,搜索部114参照存储在搜索信息保存部180中的搜索信息文件,从抽出域名1400中搜索符合搜索条件的域名的信息。搜索结果提供部116将搜索得到的信息一览化作为搜索结果提供给终端装置50。这时信赖度提供部118参照图39向终端装置50提供抽出域名1304对应的域名信赖度1306。
搜索条件分析部1500判断搜索条件中包含电子邮件地址时,搜索部114参照存储在搜索信息保存部180中的搜索信息文件,从抽出域名1400中搜索符合搜索条件的电子邮件地址中包含的域名的信息。搜索结果提供部116将搜索得到的信息一览化作为搜索结果提供给终端装置50。这时信赖度提供部118参照图39向终端装置50提供抽出域名1304对应的电子邮件地址信赖度1308。
搜索条件分析部1500判断搜索条件中包含IP地址时,搜索部114参照存储在搜索信息保存部180中的搜索信息文件,从IP地址栏302中搜索符合搜索条件的IP地址的信息。搜索结果提供部116将搜索得到的信息一览化作为搜索结果提供给终端装置50。这时信赖度提供部118参照图39向终端装置50提供IP地址1302对应的IP地址信赖度1310。
此外,搜索条件获取部112获取搜索条件时,搜索条件分析部1500可分析获取的搜索条件中是否包含域名种类或ISP名。
搜索条件是否包含域名种类是根据在搜索条件是否满足域名的构成样式的基础上,域名可否分类为规定的种类来判断.这时,最好组别化信息保存部1250保存图42所示的域名种类组.图42所示的域名种类组对应域名种类1268,包含使用或运用的目的1270,该域名种类被分配的国家1272.
此外,搜索条件中是否含有ISP,通过参照图41所示的信赖度一览表,看搜索条件是否符合担当ISP1316的任何一个来判断。
搜索条件分析部1500判断搜索条件中包含域名种类时,搜索部114参照存储在搜索信息保存部180中的搜索信息文件,从域名种类1402中搜索符合搜索条件的域名种类的信息。搜索结果提供部116将搜索得到的信息一览化作为搜索结果提供给终端装置50。这时信赖度提供部118参照图40向终端装置50提供域名种类1312对应的I域名种类信赖度1314。
另一方面,搜索条件分析部1500判断搜索条件中包含ISP时,搜索部114参照存储在搜索信息保存部180中的搜索信息文件,从担当ISP1404中搜索符合搜索条件的ISP的信息。搜索结果提供部116将搜索得到的信息一览化作为搜索结果提供给终端装置50。这时信赖度提供部118参照图41向终端装置50提供担当ISP1316对应的ISP信赖度1318。
根据本实施方式,通过以网页内容具有的信赖度为基础,算出该网页内容对应的IP地址,域名的信赖度,能求得以电子邮件地址的信赖度为首的担当ISP,注册表,甚至每个国家的域名种类等的信赖度。这样,通过不仅数值化网页内容,还数值化与网页内容关联的域名等的信赖度,可能具有促进域名等运营者对网页内容的信赖度的改善的效果。具体来说,ISP可以不向恶意从业者分配IP地址来进行自律,国家总体制定IP地址管理的适当的实施政策。
本实施方式,根据提供的网页内容的信赖度,提供域名,电子邮件地址或者IP地址的信赖度,但是也可提供包含域名,电子邮件地址或者IP地址中的至少一个的信赖度的全部组合的构成的信赖度。
以上,说明了本发明的实施方式。所属技术领域的技术人员能够明白实施方式是示例性的,根据该各构成要素和各处理程序的组合,可得到各种各样的变形例,这样的变形例也在本发明的范围内。下面,列举一些变形例。
变形例1
实施方式中的信息搜索提供装置100作为一个装置存在,但是在变形例的构成中,信息搜索提供装置100通过2个服务器的协作来实现。作为例子,可以在搜索用服务器侧设置图3的搜索控制装置110,在收集用服务器侧设置其他的功能块。当然,也可以将图3的构成分割成上述之外的部分,分配在搜索用服务器侧和收集用服务器侧。如何分配好,可考虑便于服务器管理者管理,两个服务器的平衡,两者的通信量等要素而定。
变形例2
实施方式8的信息搜索提供装置100具备实施方式1,实施方式3,实施方式5,实施方式6及实施方式7的信息搜索提供装置100具有的构成要素,但是作为其他的变形例,其组合不仅限于此。例如可以是具有包含实施方式1的信息搜索提供装置100的构成要素和实施方式2的信息搜索提供装置100的构成要素的装置的新的信息搜索提供装置100。
变形例3
在实施方式3中,按照评价对象的网页内容是否被更新增减网页内容的信赖度,作为其他的变形例,信息搜索提供装置100具有分析该网页内容的具体内容的分析部,分析部的分析结果,包含提高评价对象的网页内容的信赖度的项目时,可增加评价对象的网页内容的信赖度.以下,是表示该项目的例子.此外,该分析部内部其有获取时间信息的定时器和分析程序的源代码的源代码分析部.
(A)网页内容中采用SSL(Secure Sockets Layer)(加密套接字协议层)对策等的安全对策时。
(B)网页内容涉及信用结算时。
(C)网页内容使用收费域名时。
(D)网页内容未使用恶意程序时。
(E)网页内容的利用者及访问数多时。
(F)网页内容的访问的应答时间短时。
(G)网页内容内的电子邮件地址包含有该网页内容的网页的域名时。
(H)不包含性内容及暴力内容等违反公序良俗的具体内容时。
变形例4
在实施方式中,保存在搜索信息保存部180中的全部网页内容作为搜索结果的提示对象,但是作为其他的变形例,信息搜索提供装置100也可具有向用户只提示搜索结果中信赖度高的网页内容的提示限制部。在互联网上有不良网页,通过最初便不向用户提示信赖度低的网页内容,可以减轻全体用户对信赖度低的网页的访问。
变形例5
在实施方式7中,按照判断对象项目,如根据录用关联信息的统一性的有无,同时控制互相关联的本网页内容和他网页内容的信赖度,作为另外的变形例,可以在网页内容获取部147获取的网页内容中登载判断对象项目的网页内容越多时,越提高本网页内容的信赖度。例如,判断对象项目是录用关联信息,为“招聘应届毕业生”时,包含该“招聘应届毕业生”的网页内容越多,信赖度控制部130便增加网页内容的信赖度。
变形例6
还有,作为另外的变形例,在实施方式1~8的信息搜索提供装置100上还可设有预测将来的网页内容的信赖度的预测部。预测部根据供评价对象的网页内容中包含的网页内容的存续期间的推测用的要素,预测评价对象的网页内容的信赖度。例如,如果网页内容的信息提供者是个人的话,影响网页内容的存续期间的推测的要素相当于该个人的年龄,如果是企业的话,影响网页内容的存续期间的推测的要素相当于公司的成长率。用前边的例子来说,如果个人的年龄是“30岁”的话,到通常人的寿命为“80岁”,也就是说根据现在预测50年后的网页内容的信赖度。预测时,可以根据维持现在的信赖度的增加幅度的条件,预测50年后的网页内容的信赖度。通过这些,用户不仅可知道过去信赖度的变化,还可以只知道将来的网页内容的信赖度,信赖度进一步增加,能更安心地利用网页内容。
变形例7
在实施方式1中,按照收集部128可否收集网页内容进行信赖度地增减控制,但是作为另一种变形例,收集部128未收集网页内容时,新设置在信息搜索提供装置100上的确认部,可进行对于确认对象项目有关网页内容的不可收集的确认。以下,表示确认对象的项目的一个例子。服务器转移信息及服务器故障信息中包含的关键字预先保存在图中未表示的确认对象项目保存部。
(A)网页内容内是否有“已经转移”等的服务器转移信息。
(B)网页内容内是否有“网络服务器故障中”等服务器故障信息。
该些服务器转移信息和服务器故障信息包含在评价对象的网页内容中时,即使不收集评价对象的网页内容,信赖度控制部130可控制使评价对象的网页内容的信赖度不减少。此外,这时,访问可否判断部124在该信息登载在网页内容上的期间内,在评价对象的网页内容的访问历史栏322内设定标记“○”。此外,例如,评价对象的网页内容的不可收集持续10日的话,确认部可访问管理域名的第三方机构,锁定登载评价对象的网页内容的网页网络服务器的域名,掌握提供该网络服务器的信息提供者的状态。因此,信息提供者没有推卸责任的理由,信息提供者不能提供网页内容时,不减少该网页内容的信赖度,能对该网页内容进行补救。
变形例8
在实施方式1~8中,信息搜索提供装置100作为搜索结果向用户提示网页内容及网页内容的信赖度的一览,但是作为其他的变形例,用户运用该信息,例如实际亲自去店铺,或者通过网络购物买卖时,信息搜索提供装置100获取来自用户的对该网页内容的有关信赖度的评价值,反映在现在的该网页内容的信赖度。在本变形例中,实施方式1~8中的信息搜索提供装置100上新设有评价值获取部。
评价值获取部获取来自用户的对网页内容的有关信赖度的评价值。通过该评价值获取部,获取来自用户的有关网页内容的信赖度的,用从低到高的“-5”~“5”的10段评价表示的评价值,信赖度控制部130将该评价值加到现在的网页内容的信赖度上。因此,能写入利用网页内容时的来自用户的对该网页内容的评价,实现确切的提示信赖度的信息搜索服务。
变形例9
在实施方式2中,按照在信赖度高的网页内容内,是否包含表示在该网页内容和评价对象的网页内容之间存在关联性的关联信息,判断关联性的有无。在本变形例中,按照在评价对象的网页内容内,是否包含表示在评价对象的网页内容和信赖度高的网页内容之间存在关联性的关联信息,判断关联性的有无。例如,关联性判断部134判断在评价对象的网页内容内,是否包含该关联信息,如从评价对象的网页内容到信赖度高的网页内容的链接。具体来说,关联性判断部134评价对象的网页内容中包含的标识符内的“~”中是否包含登载信赖度高的网页内容的网页的URL。这时,登载信赖度高的网页内容的网页的URL由关联性判断部134从保存在搜索信息保存部180中的搜索信息文件中获取。
信赖度控制部130进行控制,使关联性判断部134判断由关联性时的评价对象的网页内容的信赖度的增加幅度比判断无关联性时的评价对象的网页内容的信赖度的增加幅度高。因此,例如,能使评价对象的网页内容内有信赖度高的网页的链接时和没有信赖度高的网页的链接时差别化。信赖度控制部130,在评价对象的网页内容内如果有多个符合信赖度高的网页内容的URL,则只增加该符合数目的信赖度的增加幅度。例如,符合的是3个的话,则在评价对象的网页内容的现在的增加幅度上再加“3”。因此,评价对象的网页内容中信赖度高的网页内容的链接粘贴得越多,信赖度的增加幅度越大。
变形例10
在实施方式2及变形例9中,判断评价对象的网页内容和信赖度高的网页内容之间的关联性有无,作为其他的变形例,判断评价对象的网页内容和信赖度低的网页内容之间的关联性的有无。在本变形例中,关于关联性判断部134判断关联性有无的方法,与实施方式2及变形例9中的关联性方法相同。也就是说,关联性判断部134按照在信赖度低的网页内容内,是否包含表示该网页内容和信赖度低的网页内容之间存在关联性的关联信息,判断评价对象的网页内容和信赖度低的网页内容之间关联性的有无。并且,关联性判断部134还可按照在评价对象的网页内容内,是否包含表示该网页内容和信赖度低的网页内容之间存在关联性的关联信息,判断评价对象的网页内容和信赖度低的网页内容之间关联性的有无。
前者的判断时,信赖度控制部130用评价对象的网页内容的信赖度的增加幅度的增减来反映关联性判断部134判断关联性有无的结果。信赖度低的网页内容具有不值得信赖的信息的可能性高,因为忽视链接等的关联信息的存在也有意义。后者的判断,信赖度控制部130控制使关联性判断部134判断有关联性时的评价对象的网页内容的信赖度的增加幅度比判断无关联性时的评价对象的网页内容的信赖度的增加幅度低。因此,例如,使具有评价对象的网页内容内含有性内容和暴力内容等违反公序良俗的具体内容,可以使得信赖度低的网页内容的链接时和没有信赖度低的网页内容的链接差别化。
变形例11
实施方式6是从单一的方面增减评价对象的网页内容的信赖度,但是在本变形例中,从多方面增减评价对象的网页内容的信赖度。这时,要素抽出部144抽出每个信赖度的评价方面中,影响上述评价对象的网页内容的信赖度增加或减少的要素。具体来说,例如,信赖度的方面如果是“录用”的话,要素抽出部144从从关联网页内容获取部142获取的网页内容中抽出与“录用”相关的、影响评价对象的网页内容的信赖度增加或减少的要素。
信赖度的评价方面,例如与“录用”相关的关键字,可预先保存在图中未表示的方面保存部中。与“录用”相关的关键字可列举如“实际录用人数”和“预定录用人数”等。这时,要素抽出部144,对关联网页内容获取部142获取的网页内容,指定方面保存部中保存的关键字及上述影响保存部中保存的关键字,然后进行搜索,获取符合的信息。具体来说,要素抽出部144把“实际录用人数”和“增加”作为AND条件搜索的话,可从“录用”的方面中抽出影响信赖度增加的要素。
信赖度控制部130参照从每个信赖度的评价方面中抽出的要素,增减评价对象的网页内容的信赖度。例如,评价对象的网页内容是“ABC”公司提供的,获取的网页内容中记载着“ABC公司的录用人数增加”的话,从“录用”的方面中要素抽出部144抽出“增加”要素,分类部146将该要素分到上述第1组。这时,信赖度控制部130从“录用”的方面来看增加评价对象的网页内容的信赖度。此外,信赖度控制部130设定每个方面的信赖度,按照要素抽出部144从每个信赖度的评价方面中抽出的结果,分别增加每个方面的信赖度。这时,信赖度控制部130可合计从每个方面得到的各信赖度,作为一个评价对象的网页内容的信赖度。根据本变形例,能从各种方面评价评价对象的网页内容的信赖度,提高信赖度的精度。
产业上利用的可能性
本发明可提供对用户来说便利性高的信息搜索服务。