用于向通用信息检索提供权威回答的计算机实现系统和方法转让专利

申请号 : CN200510108970.4

文献号 : CN1766879B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : B·D·福瑞斯特

申请人 : 微软公司

摘要 :

一种计算机实现的提供权威回答的系统和方法,开发在用于通用网络信息检索用户的基于团体的问题回答服务中。该基于团体的问题回答服务接收来自第一用户的问题,并接收来自团体成员关于该问题的回答。然后通过团体成员决定该回答的权威性,并且如果权威性为可接受的程度,该问题连同它的权威回答被添加到包括所有已权威回答问题的数据库中。该回答服务含有一个向网络用户的询问展示该数据库内容的界面,网络用户不需要是该回答服务的成员。在一则实施例中,来自对基于团体的数据库的问询结果与来自对包含通用网络信息的第二数据库的问询相集成。也提供了增强型的通用信息检索服务,包括来自基于团体的回答服务所生成的权威回答的问询结果。

权利要求 :

1.一种使用基于团体的回答服务为可用于通用信息检索的回答提供权威性关联的计算机实现方法,其特征在于,包括:获得一个来自用户的问询输入;

使用所述问询输入,从先前已回答问题数据库中获得第一检索结果;

向所述用户提供所述第一检索的结果;

接收用户输入,表示涉及到所述问询输入的问题应该被递交给基于团体的回答服务;

从所述团体接收回答;

量化所述回答的权威性的级别;

基于量化的权威性的级别,自动地确定所述回答是否具有足够的权威性;以及响应于基于量化的权威性的级别确定所述回答具有足够的权威性,有条件地提供包括所述问题和所述回答的信息检索输入,作为到第二检索结果的输入,并将所述问题和所述回答存储在所述先前已回答问题数据库中。

2.如权利要求1所述的方法,其特征在于,所述权威性决定步骤包括由至少一个个人对所述回答的评估,所述个人选自包括所述用户、团体、以及超级用户的组。

3.如权利要求1所述的方法,其特征在于,还包括将所述问题与类型相关联。

4.如权利要求1所述的方法,其特征在于,所述问题被递交给一组人,这些人选自包括社交网络、团体专家组、以及整个团体的组。

5.如权利要求1所述的方法,其特征在于,所述信息检索输入还包括已决定的权威性的量化。

6.如权利要求1所述的方法,其特征在于,所述第一检索结果还包括来自通用信息检索的结果。

7.一种用于计算机实现的基于团体的问题回答服务的系统,其特征在于,包括:问询输入接收组件,接收来自服务的第一成员的问询;

回答接收组件,接收至少一个来自服务的第二成员的回答;

激励给予组件,向回答问题的参加者提供激励;

权威指定组件,量化至少一个所收到的回答的权威性的级别,并基于量化的权威性的级别自动确定所述至少一个所收到的回答是否具有足够的权威性;

已回答问题数据库,与所述权威指定组件通信,其中如果所述至少一个所收到的回答被所述权威指定组件基于量化的权威性的级别确定为具有足够的权威性,那么所述至少一个所收到的回答被存储在所述数据库中;

以及输出组件,向检索引擎提供已关联权威性的信息。

8.如权利要求7所述的系统,其特征在于,所述权威指定组件包括用于所述至少一个回答的评估接收子组件,接收来自至少一个个人的输入,所述个人选自包括:所述用户、团体、以及超级用户的组。

9.如权利要求7所述的系统,其特征在于,所述输出组件包括筛选子组件,从向所述检索引擎的输出中筛选不够权威性的回答。

10.如权利要求7所述的系统,其特征在于,所述输出组件包括权威指定子组件,将已决定的权威性的量化和所述回答相关联。

11.如权利要求7所述的系统,其特征在于,所述激励给予组件包括表示有益行为的分值系统。

12.如权利要求11所述的系统,其特征在于,所述激励给予组件包括报酬子组件,允许已赚取足够总分值的用户接受报酬,所述报酬选自包括:折扣、优惠券、服务、以及虚拟财产的组。

13.一种用于计算机实现的信息检索服务的系统,包括:

问询输入接收组件以及问询结果生成组件,其中,所述问询结果生成组件包括:通用信息数据库,产生第一输出,所述第一输出包括来自基于通用信息的检索的检索结果;以及权威性回答数据库,产生第二输出,所述第二输出包括对权威性回答的基于团体的数据库检索的检索结果,其中只有那些已经被基于通过量化回答的权威性的级别而得出的量化的权威性的级别确定为具有足够的权威性的回答能被自动地存储到基于团体的所述权威性回答数据库中;以及结果组合器组件,组合所述第一输出和所述第二输出以产生所述问询结果。

14.如权利要求13所述的系统,其特征在于,所述问询输入接收组件包括分析自然语言问题的分析器。

15.如权利要求13所述的系统,其特征在于,所述问询输入接收组件包括分析关键字串的分析器。

16.如权利要求13所述的系统,其特征在于,所述问询结果组合器组件包括邀请子组件,产生递交相关问题至计算机实现的基于团体的问题回答服务的提议。

17.如权利要求13所述的系统,其特征在于,所述结果组合器组件包括输出子组件,从所述第一输出产生将被提供给用户界面的第一区域的第一列表,并从所述第二输出产生将被提供给用户界面的第二区域的第二列表。

18.如权利要求17所述的系统,其特征在于,所述结果组合器组件包括权威输出子组件,提供至少一个包括在所述第二列表中的字段,所述字段表示提供给所述用户界面的结果中至少一个项目的权威性。

19.如权利要求13所述的系统,其特征在于,所述结果组合器组件包括列表集成子组件,集成来自所述第一输出和所述第二输出的条目,所述第一输出和第二输出将被提供在用户界面的单个区域中。

20.如权利要求19所述的系统,其特征在于,所述列表集成子组件包括权威输出子组件,提供至少一个包括在所述列表中的字段,所述字段表示提供给所述用户界面的结果中至少一个项目的权威性。

说明书 :

用于向通用信息检索提供权威回答的计算机实现系统和方

[0001] 相关发明的交叉引用
[0002] 本申请要求递交于2004年10月29日的美国临时申请No.60/623,505的优先权。
[0003] 关于联邦赞助的研究或开发的声明
[0004] (STATEMENT REGARDING FEDERALLY SPONSORED RESEARCH OR DEVELOPMENT)[0005] 不适用

技术领域

[0006] 本发明通常涉及通过一个计算机实现的服务向问题提供权威回答,尤其是,本发明涉及一种用于开发大型权威回答数据库并将这些回答集成在通用信息检索中的增强型技术。

背景技术

[0007] 通过因特网和其他网络,存在有大量可供带有网络连接的计算机用户使用的信息。单单是web页面数量目前估计达几十亿个。在线的人数估计达数亿人。检索服务诸如TM TM TMMicrosoft MSN Search 主要基于文本串匹配,向用户提供了web页面连接的列表。
[0008] Web检索服务提供了即刻的回应,但结果的权威性值得怀疑。例如,一个希望知道“最好的防止排雨沟阻塞的方法是什么?”的用户会设计一个基于问题的询问并递交给检索服务。他会发现大量的页面没有在该主题上权威地给出意见。可能会存在一批来自对该问题销售各自特定解决方案的提供商的页面。也可能存在一些页面顺带描述了一个特定的个人事件。也可能会存在一些由喜剧作家写的对该问题开玩笑的页面。可能会存在一些页面在特定的语言上恰好匹配,但它们谈论的是两个或多个不相关的主题范围。也可能存在一些由专家所写的关于该主题的页面但不能回答该特定问题,因为它们集中在该问题的一些其他方面但没有给出回答。这样,该用户花费了大多时间在浏览权威性不可接受的结果。他面对着的权威受到销售倾向、与他本人相似的权威、完全没有权威、以及误导或含糊的权威的玷污。用户通常在因为含有被玷污的权威而丢弃它们之前,投入了大量时间在每个这些回应上。这个问题的根本的原因是由检索引擎返回的大部分Web页面是由不含有优良权威性的人所写的。即使当遇到了一个权威性的回应,用户问题和可用Web页面之间的甚至一点微小区别也会使用户不满意于他接收到的回应。Web页面上频繁缺少的实质性联系信息通常妨碍了用户向他所发现的最好的页面中写作内容的专家询问问题。联系信息通常允许联系Web页面维护者,而不是提供信息的专家。即使在Web上得到的直接回答,它的真实性也是不确定的,仅仅因为它是查找自Web。普遍存在的权威性缺乏使任何在Web上偶然找到的回答变得不可信。
[0009] 在检索更佳权威性的经历中,信息搜索者可能参加线上社交网络、专业网络、或“朋友圈”网络。这些网络允许用户向一个团体递交一个问题,并评估对他或她的问题做出的回应。不幸的是许多这样的网络受到秘密性、孤立性、有限制的浏览、或只有名义上的参加权的困扰。如果回应被私下保存在社交网络范围内,它就不可用于信息检索服务。如果该网络处于一个孤立的专业知识领域,检索引擎就不能识别与这些网络有关联的专业知识。网络通常服务那些专业知识领域的专家们,这样通过对所提供的回答的有限制的浏览就阻碍了回答的输出。典型网络Web—记录(或博客(BLOG))可对于不知道的人是无法理解的,这样这些回答可能对于除了那些已经是专家的人以外的所有人都是无法理解的。如果只有一小部分积极的参加者(这是经常的情况)回答通常是不及时的。出于这些原因,由这些网络开发的小型数据库不会显著地有利于一个通用信息检索服务。因为权威信息是不为所知的或是被错过了,权威回答经常被通用信息检索服务丢失在极多数量的非权威回答中。而社交网络的使用其本身对于线上用户而言也不是一个令人满意的解决方案,主题内容通常被限制在一个特定的、狭小的问题范围中,并且/或者数据库通常很小。因此回答常常不是立即的。
[0010] 出于多种原因,向搜索询问提供通用权威回答数据库的尝试已经产生了一些非常有限大小的数据库。许多解决方案是不可升级的。即,支付给研究者的成本已经是非常昂贵的。一些服务提供者已经提供了,以一个给定的费用,对研究性问题进行权威地回答。当用户可以凭借他们自己的劳动试着使用免费Web检索服务,并且这样他们的劳动就不会有益于带有同样问题的其他人时,则只有小部分在线用户选择支付这样的费用。电子辞典TM TMMicrosoft Encarta 带有一个称为“Encarta回答”的功能,使用一个由可以回答问题的收费研究者创建的数据库。这样一个数据库受限于销售利润可以支撑的研究工作者数量。
维京辞典(Wikipedia)是一个协作型大百科全书,依靠志愿者来书写条目,但这是非权威的因为(正如他们所承认的)所有人都可以编辑它,并且改变过的信息可以在审阅之前就被公布。这样公布的并索引的条目可能是由恶作剧的希望出名的编者创建的。除了作者以外没有人有必要审阅出现的条目。
[0011] 这样在因特网检索服务领域存在着长期的需求,以减少用户花费在评估他们找到的在Web上可用回答的权威性上的时间。同样也存在着对于一个用于创建大型的关于用户递交的问题的权威回答数据库的系统和方法长期需求。类似地,存在着对于一种以表示已提供回答的权威性的方式输出团体网络中可访问的权威信息到一个通用信息检索服务的方法的长期需求。

发明内容

[0012] 本发明通过提供一种先进的使用基于团体的回答服务,为通用信息检索可用的回答提供权威性关联的计算机实现方法满足了上述需求并克服了一个或多个现有技术的不足。该方法从通过计算机网络访问服务的,且不必是基于团体的回答服务中成员的潜在大量用户中的一个那里获得一个询问输入。随后基于一个先前回答过的权威问题数据库分析该询问,并且向用户提供一个表示基于团体的数据库最合适内容的结果。当用户不满意所提供的结果时,该方法能够构建新的回答,这样服务接收到一个用户输入,表示涉及询问输入的问题应该要被递交给基于团体的回答服务。该方法从回答服务的团体成员那里接收到至少一个回答,并判断该回答的权威性。如果该回答有充分的权威性,那么该回答被至少结合其相关的问题并且这个数据随后作为一个输入提供给第二信息检索结果。
[0013] 在本发明另一个方面,提供了一个计算机实现的基于团体的问题回答服务。一个问询输入接收组件接收了来自该服务的第一成员的问询输入。响应该问询输入,回答接收组件接收来自该回答服务第二成员的至少一个回答。该回答的权威性由权威指定组件判断。一个激励给予组件因为很好地回答问题而向回答的参加者提供激励。一个已回答问题数据库是由所有经权威指定组件判断的充分权威性的问题编译而成。一个与这个数据库和一个通用信息检索引擎通信的输出组件向该通用信息检索引擎提供权威性关联信息。
[0014] 根据本发明另一个方面,提供了一种计算机实现的信息检索服务,以及一种操作此服务的方法。该服务包括一个问询输入接收组件以及一个问询结果产生组件,问询输入接收组件接收来自该服务用户的问询,用户不必是基于团体的服务的成员,响应该问询,信息检索服务提供了来自一个通用信息数据库和一个权威回答数据库的问询结果。经由询问这两个数据库而得到的结果在用于产生问询结果的结果合成器中合成。这个问询结果被传送给用户计算机并呈现给用户。

附图说明

[0015] 本发明结合附图在下文中详细描述。其中:
[0016] 图1是一个适合使用来实现本发明的计算系统环境的框图。
[0017] 图2是一个示出了用于计算机用户与基于团体的回答服务和通用功能检索引擎交互和示例性系统的框图。
[0018] 图3是一个使用基于团体的回答服务,为可用于通用信息检索服务的回答提供权威性关联的计算机实现方法的流程图。
[0019] 图4是一个计算机实现的基于团体的问题回答服务的框图。
[0020] 图5是一个计算机实现的信息检索服务的框图。

具体实施方式

[0021] 本发明提供了一种通过使用基于团体的问题回答服务,提供一个可用于通用信息检索用户的权威回答问题的大型数据库的增强性系统和方法。下文提供了一个用于通用信息检索或基于团体的问题回答服务用户的示例性的操作环境。
[0022] 参考简略的附图并从图1开始,其中同样的标号在多个附图中标识同样的组件,一个用于实现本发明的示例性操作系统被示出并被通常设计为操作环境100。计算系统环境100仅仅是一个合适的计算环境示例且不旨在提供任何对本发明使用范围或功能的限制。计算环境100也不能被解释为与示例性操作环境100所示组件中的任何一个或其组合有任何依赖或要求。该环境对使用膝上型或台式个人计算机110来利用通用信息检索或参加基于团体的问题回答服务的用户而言是典型的。虽然不被称作“计算机”,许多其他设备也在计算机110所表示的范围内。一个设备诸如Web-电视、微浏览器、信息设备、Web-可用PDA、Web-可用蜂窝电话、Web-可用电视游戏、智能电话、或其他有检索能力的设备,也可利用本发明。随后的讨论会涉及诸如计算机的设备,但不排斥任何这些用于使用本发明的其他设备的可选使用。
[0023] 本发明可被描述为计算机可执行指令的通常格式,诸如由一个或多个计算机或其他设备执行的程序模块。通常有,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、以及诸如此类。此外,本领域熟练技术人员可以理解本发明也可用于多种计算机系统配置,包括手持设备、微处理器系统、微处理器或可编程消费品电器、微机、大型机,等等。本发明还可被实现于分布式计算环境,后者中的任务被由通信网络连接在一起的远程处理设备所执行。在一个分布式计算环境中,程序模块可位于本地以及远程计算机存储介质包括内存存储器设备。
[0024] 参考图1,一个用于实现本发明的示例性系统100包括一个通用功能计算设备,其形式为计算机110,包括一处理单元120、一系统存储器130、以及将包括系统存储器130在内的各种系统组件连接到处理单元120的系统总线121。
[0025] 计算机110通常包括多种计算机可读介质。通过示例,而非限制,计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质的示例包括,但不限于,随机访问存储器(RAM)、只读存储器(ROM)、电可擦可编程只读存储器(EEPROM)、闪速存储器或其他存储器技术、CD-ROM、数字通用盘(DVD)或其他光学或全息盘存储器;磁带盒、磁带、磁盘存储器或其他磁存储器设备;或任何其他可被用来存储所需信息并能够由计算机110访问的介质。系统存储器130包括易失和/或非易失存储器形式的计算机存储器介质,诸如ROM 131以及RAM 132。基本输入/输出系统133(BIOS)一般被存储在ROM 131中,它包括(诸如在驱动过程中)有助于计算机110内基本元件间传递信息的基本例程,RAM 132通常包括可由处理单元120立即访问和/或进行操作的数据和/或程序模块。通过示例,而非限制,图1示出了可包括一个浏览器的操作系统134、同样可包括一个浏览器的应用程序135、其他程序模块136、以及程序数据137。
[0026] 计算机110也可包括其他可移动/不可移动的易失/非易失计算机存储介质。仅仅作为示例,图1示出了从不可移动非易失磁性介质读取或写入的硬盘驱动器141、从可移动非易失磁盘152读取或写入的磁盘驱动器151、以及一个从诸如CD-ROM或其他光学介质的可移动非易失光盘156读取或写入的光盘驱动器155。其他可在示例性计算环境1中使用的可移动/不可移动、易失/非易失计算机存储介质包括,但不限于,磁带盒、闪速存储器单元、数字通用盘、数字录像带、固态RAM、固态ROM,等等。硬盘驱动器141通常通过诸如接口140的不可移动存储器接口连接到系统总线121,磁盘驱动器151以及光盘驱动器155通常是通过一个诸如接口150的可移动存储器接口连接到系统总线121。
[0027] 以上讨论且示于图1中的驱动器和它们相关的计算机存储介质为来自计算机120的计算机可读指令、数据结构、程序模块以及其他数据提供了存储。例如,硬盘驱动器141被示为存储操作系统144、应用程序145、其他程序模块146、以及程序数据147。注意这些组件可与操作系统134、应用程序135、其他程序模块136、以及程序数据137相同或相异。通常,存储在RAM的操作系统、应用程序或诸如此类是读取自存储在硬盘驱动器141上的相应系统、程序或数据的一部分,部分的大小和范围变化取决于功能要求。操作系统144、应用程序145、其他程序模块146、以及程序数据147这里被给予了不同的标号用于表示,在最小限度下,它们是不同的拷贝。用户可以经由一输入设备诸如键盘162,以及通常为鼠标、轨迹球或触摸板的指针设备161,带有诸如触摸屏的用户输入能力的屏幕以及能够接收触笔输入的屏幕;无线输入接收组件163;或诸如远程控制的无线资源;输入命令和信息进入到计算机110中。其他输入设备(没有示出)可包括麦克风、操纵杆、游戏垫、卫星天线、扫描仪等等。这些及其他输入设备经常经由连接到系统总线用户输入接口160连接到处理单元
120,但也可通过其他接口和总线结构进行连接,诸如并行端口、游戏端口、IEEE 1394端口、或通用串行总线(USB)、或一个红外线(IR)总线。
[0028] 显示器191也经由诸如视频接口190的接口被连接到系统总线121。显示设备191可为显示计算机110输出的任何设备,不限于监视器、LCD屏幕、薄膜晶体管(TFT)屏幕、平板显示器、常规电视机、或屏幕放映机。除了显示器191,计算机也可包括其他外围输出设备诸如扬声器197以及打印机196、它们可被经由输出外围设备接口195连接。
[0029] 使用到一个或多个诸如远程计算机180的远程计算机的逻辑连接,本发明中的计算机110可操作在一个网络环境下。远程计算机180可为个人计算机、服务器,并通常包括许多或所有上述涉及计算机110的元件。图1描述的逻辑连接包括局域网(LAN)171和广域网(WAN)173,但也包括其他网络,诸如到城域网(MAN)、内部网或因特网的连接。
[0030] 当用于LAN网络环境时,计算机110通过网络接口或适配器170连接到LAN 171上。当用于WAN网络环境时,计算机110通常包括调制解调器172或其他装置,用于在诸如因特网的WAN 173上建立通信。调制解调器172可以是内置的或外置的,它通过网络接口170或其他合适的机制连接到系统总线121上。调制解调器172可为一个电缆调制解调器、DSL调制解调器、或其他宽带设备。在网络环境中,与计算机110相关描述的程序模块或它的部分可存储在远程存储器设备中。通过示例,而非限制,图1示出了远程应用程序185驻留在存储器设备181上。可以被理解的是,所示网络连接是示例性的,且可以使用在计算机之间建立通信连接的其他装置。
[0031] 虽然计算机110的许多其他内部组件没有被示出,本领域熟练技术人员可以理解这些组件以及互连是众所周知的。例如,在计算机110中包括多种诸如电视转换卡和网络接口卡的扩展卡是常规的。相应地,关于计算机110内部结构的额外详细资料不需要结合本发明来披露。
[0032] 通常,当计算机110启动或重新启动时,存储在ROM 131中的BIOS 133指示处理单元120从硬盘驱动器141上加载操作系统、或它的必要部分,到RAM 132。一旦当操作系统的复制部分,被命名为操作系统144,被加载入ROM 132,处理单元120执行操作系统代码并结合操作系统134的用户接口产生视觉要素以显示在显示设备191上。通常,当应用程序145被用户打开时,从硬盘驱动器上读取程序代码和相关数据并将必要的部分复制到RAM 132中,复制部分在此由标号数字135表示。
[0033] 如前所述,本发明可被描述为计算机可执行指令的通常形式。计算机可执行指令包括函数、过程、概要、例程、代码段、以及可由一个或多个计算机或其他设备使用的模块。计算机可执行指令形成一个接口来允许计算机根据输入源做出回应,响应接收到数据,结合所接收的数据的源,指令结合其他代码段以启动多种任务。
[0034] 图2示出了一个允许计算机用户通过用户界面214与一个基于团体的回答服务222以及一个检索引擎240交互的示例性系统。该交互可经由用户计算机210、通过网络
250的基于团体的服务器220和检索引擎服务器230来提供。用户通过用户界面214一般依靠运行在用户计算机210上的浏览器212接收并发送信息。通常提供了连接用户计算机和远程服务器230或220的通信协议组,可能包括IP和TCP或UDP。运行在用户计算机120上的浏览器212可连接到运行在检索引擎服务器230上的检索引擎240。这允许用户通过向检索引擎240提供问询,执行网络上可用信息的通用信息检索。这些问询,通过示例,包括产生自用户计算机210的关键词列表或自然语言问题。这些由检索引擎分析,并作为回应提供一个可能证明是对用户有用的问询结果。该结果可包括一个以反向评估的重要性排序的网络可用链接的子集、一个可能是相关信息的简单摘要、以及其他潜在关联的链接。在一个方面,本发明将来自基于团体的服务的权威回答结合到这个问询回答中。一个运行在用户计算机210上的浏览器212也可连接到运行在团体服务器220的基于团体的回答服务
222。这允许用户询问存储在团体服务器220上的问题数据库。本发明便利地将获得自通用信息检索引擎240的问询结果和基于团体的回答服务222的结果组合在一起。这可完成为,例如,通过将来自基于团体的回答服务222的结果同提供自通用信息检索引擎240的结果集成在一起,并提供给用户界面214。或者,基于团体的回答服务可将来自通用信息检索引擎240的结果同提供自基于团体的回答服务222的结果集成在一起,并提供给用户界面
214。还有另一种替代是使用第三个服务器(没有示出)来提供这些结果的集成。仍然有另一种替代是使用用户计算机210来生成单独的问询并集成检索结果,如待批的通常可授权的专利申请,序列号11/001,134,所披露的,其内容结合在此作为参考。团体服务器220和检索引擎服务器230通过示例的方式示出为单独的主机。在其他实施例中可在同一台机器上主持各个服务,或者它们的服务可由分布式服务器网络来提供。到一个或多个服务的界面可以是用于即时消息、日志平台、聚合器、或其他服务客户机的本机的操作系统、浏览器、客户机界面。
[0035] 现在转到图3,示出了一个使用基于团体的回答服务为通用信息检索可用的回答提供权威关联的计算机实现方法的流程图。在高标准描述中,基于团体的回答服务222通过在权威性关联信息在基于团体的回答数据库315的共享,向通用服务器230中的信息检索服务350提供权威性关联信息。该高标准描述在不丧失通用性下评估了一个实施例,其中权威性信息集成为通用信息检索服务的一个部分。通用信息检索服务350能够访问包含在基于团体的回答数据库315中的权威回答。数据库315先前被扩大了,当来自第一用户的第一问询输入在步骤338中最终产生了权威性问题和回答给数据库时,如以下进一步描述。通用信息检索服务350在步骤355中从第二用户获取了第二问询输入,并依次在步骤360询问基于团体的回答数据库315,并最终在步骤380向用户递交了该信息,该信息在步骤375中集成了步骤370中从通用信息数据库获得的结果。该回答会关联一些级别的权威性。例如权威关联可简单地表示先前递交过问题的用户接收所给予回答为权威的。通过量化第一用户用一个或多个方法放置在回答上的可信度,权威性可进一步被关联在提供给通用信息检索的结果中。这些量化的示例可包括,但非限制,分级系统,如:A+、A、A-、B+、B、B-...;表示所给予的回答的接受度的百分数,如:100%、90%、50%;级别,如:五星级别中的星级;团体中提供回答的人的状态,如:超级用户、专家、初学者,等等;团体关于接收度的投票结果,如:68%、大部分、等等;团体专家关于回答的意见,如:非常好、好、一般、差、等等。这些权威性的量化允许在表示给第二用户的信息之间执行评分等级。这些“软权威”也可用作为用于决定向第二用户的替代信息呈递的顺序或状态的输入。
[0036] 基于团体的问题回答服务300提供了一种创建对问题的权威回答的大型数据库的便利方法。该方法提供了一个开放型用户界面,用于与网络参加者进行交互,其中网络参加者不需要是回答服务中任何团体的成员。该方法在步骤305从第一用户获得第一问询输入。该输入可以是关键字列表的形式,其中关键字的排序可表示或不表示重要程度。或者,该输入可为自然语言问题。可以在不丧失通常性下假设用户提供了自然语言问题。如果在步骤305中获得了关键字列表,则在步骤325后显示为肯定输入时获得自然语言问题。第一问询输入被解析以获得多个有意义的文本匹配成分。在步骤310使用这些成分以检索基于团体的回答数据库315。在步骤320该检索的结果被提供给第一用户。通常,问询结果在数据库中部分地匹配多个类似的问题,随后这些通过在本领域众所周知的一些标准,按照匹配强度排序结果被提供给用户。这些结果也可同通用信息检索的结果集成。这当基于团体的回答数据库的匹配强度弱时尤其有利。本发明向第一用户提供了在步骤325向基于团体的回答服务递交问题的机会。如果用户选择不递交问题,那么第一用户可在步骤330中选择由基于团体的回答数据库提供的多个链接中的一个,或选择由通用信息检索结果提供的多个链接中的一个。
[0037] 如果用户选择向基于团体的回答服务递交问题,该方法继续。基于团体的回答服务是一个回答服务,在其中成员向其他成员请求任何种类问题的回答,其中一些成员是自身专业的专家。问题可为多种多样的。它们可为纯粹的事实:“香港的人口密度是多少?”它们可为琐事:“《泰坦尼克》的主演是谁?”它们可为实用性的:“防止雨沟堵塞的最好方法是什么?”给予团体成员定量的或定性的激励以提供相关回答。例如,当成员提供了大量的被接受的回答后,该成员获得激励。定性激励的一个示例可以是一个头衔,诸如大师,相对于次级头衔诸如初学者。这些头衔可以列在成员档案中、和团体摘要列在一起、或列在他的评价中。定量激励的一个示例可以是反映有用表现分值总和的数字,诸如“总分值1032”。
[0038] 在步骤325中,用户可表示他希望向基于团体的回答服务递交问题。这个输入可包括问题的一个或多个类别指标、问题的受众、以及用于可接受回答的给予分值数目。给予可接受回答的分值诱使其他成员尝试回答该问题以获得激励。
[0039] 类别是一个主题范围,不超出该问题可能涉及到的所有可能主题类别。例如,关于组织的问题可被放置在关于个人卫生学的类别中,或者是关于生物科学的类别中。类似的关于保龄球的问题可递交给娱乐性运动类别以及递交给琐事类别。当问题递交给基于团体的回答服务时,一个或多个类别被优先建议给第一用户。所建议的类别是基于该问题与每个类别中其他问题的相关度。基于第一用户、或系统的选择,将该问题关联一个或多个类别。
[0040] 问题的受众是第一用户希望将问题递送给的团体成员组。受众的示例可为:整个团体、专家团体(或所有对特定类别有兴趣的人)、团体内的社交网络诸如所有好友列表的成员、团体内所有已经达到一个特定荣誉级别的人,等等。
[0041] 较佳地,当用户在步骤325选择向基于团体的回答服务递交它的问题时,在他能够在步骤332中接受到来自团体的回答前,用户提供成员凭证,诸如注册、以及密码。如果用户还不是一名成员,则创建并启用一个账号。这样可由已认证的用户来完成权威的判定。成为一名成员允许用户访问只适用于成员的单独信息,诸如,关于其他成员的更多详细信息、还没有被权威地回答的问题或回答,等等。
[0042] 在步骤332中,从团体成员那里收到关于该公开问题的回答。在步骤334中,问出问题的用户判定该回答的权威性。最小程度的判定包括问题提供者对所提供的回答的主观意见。该判定也可包括,或结合经由团体或超级用户的对回答的评估。当回答在步骤336中被证明是足够权威时,在步骤338中将该回答和问题集合在一起并添加至权威回答数据库315。在数据库中的回答然后会基于成员对所提供的回答的评论并基于用于接受度授权的标准而获得一个特定级别的授权。较佳地,如上文所述,数据库也提供量化的授权。假设回答没有足够的权威,它就离开数据库,然后该方法回到步骤332以等待其他关于问题的回答。
[0043] 图4示出了一个计算机实现的基于团体的问题回答服务222的框图。在宏观上,该服务基于与潜在大量表示为410、412、到414的志愿用户的交互,向检索引擎460提供了权威回答。这是通过使用问询输入接收组件425、回答接收组件430、激励给予组件445以及权威指定组件435、产生已回答问题数据库440、和输出组件450来完成的。
[0044] 问询输入接收组件425接受来自用户的问题,其中用户已经决定让团体尝试回答问题,如上文结合步骤325所讨论的。该组件向成为团体成员的用户提供了界面,以适当地输入公开问题,并使这些问题可供团体成员使用。适当地输入问题包括接收与问题相关的数据,诸如,成员、可给予的分值、问题的受众、以及问题保持开放的时间长度。可使问题对团体的成员是可用,例如,通过经由诸如XML供给的集合输出公布类别、或通过允许成员向它们的集合输入添加特定问题,诸如用户联合XML供给。
[0045] 回答接收组件430接受来自团体成员的可能回答,并将这些需要考虑的回答发送给适当的成员组。起初一个回答只公布给递交相关问题的个人。如果其他诸如超级用户或团体的成员要求评估,该组件也向这些成员提供该回答。
[0046] 权威指定组件435向已回答问题数据库440提供权威回答。该组件评估表示权威性的标准,并判断何时回答含有足够的权威性以包括入数据库。该组件可选地包括请求、计算并提供关于回答的评估结果的评估接收子组件。该子组件可接收来自递交问题的成员、或来自服务中的团体、或来自超级用户的评估输入。
[0047] 激励给予组件445向表现出色的成员提供激励。该组件较佳地包括一个分值系统。分值作为一种由基于团体的回答服务创造的人造货币。成员可在他们加入付费成员时、或通过转让分值、或因为回答他们的问题,而获得确定的分值。回答的成员从其他用户、或从系统、或从两者那里接收分值。完成了重要任务的成员通过分值获得威望和荣誉。下面的表格是一个可以向成员提供合适激励系统的分值分配示例。如前所述的,可实现其他激励系统以刺激用户有目的地参与。
[0048]
[0049] 激励给予组件较佳地包括反赌博子组件。该子组件是必要的,用来防止恶意成员“赌博”系统并使货币实质上贬值。一个“赌博”系统方法的示例是不友好的成员创建了一系列的ID并回答每个其他问题。另一个赌博策略是创建一系列不使用的ID并将分值转让给第一个ID以获得虚假的声望。反赌博子组件可包括一个或多个下述技术:将所有问题提出给过半数表决、使用自动检测赌博、审查记录文件以检测系列用户、自动去除违法分值、创建临时超级用户以批准最佳回答并举报欺骗用户、在任何个人的档案页上列出回答他们问题的用户列表并提示“举报此欺骗用户”、以及在问题递交时使用CAPTCHA。
[0050] 除了与高总分值相关联的声望或荣誉以外,系统可选地包含报酬子组件,允许已赚取足够的总分值用户接受报酬。这可实现为报酬是给予那些已经达到某个分值级别且没有减少已赚取分值的用户的红利。或者是可为了报酬而交易分值。报酬可包括商品或服务的折扣、用于商业交易的优惠券、免费商品或服务、或虚拟财产。虚拟财产的示例是用于临时计算机服务的许可证、用于电子游戏的“作弊代码”、或是给予更高级别的电子游戏成果、能力或得分权的标记或所有权。
[0051] 输出组件450向检索引擎460提供了权威数据库440的权威性关联。输出组件通过包含阻止不充分权威回答被提供给检索引擎的筛选子组件来提供权威性关联。输出子组件也可包括给权威回答关联已判断权威性的量化的权威指定子组件。以上已经讨论了多种量化权威性的方法。
[0052] 图5示出了可选的计算机实现的信息检索服务240的框图。在最顶层,该服务提供了检索引擎,结合了经由询问输入接收组件525接收来自标准用户510的询问的组件。该服务然后通过问询结果生成组件550提供结果。问询结果生成组件550包括权威回答数据库530、通用信息数据库535、以及结果组合器540。这些组件通常一起驻留在单独的服务器上,或在通用信息检索服务服务器组上,但可部分实现为用户计算机上的代理、或在一个或多个团体服务器上、或上述的组合。
[0053] 该服务被提供用于由510,和512,到514所示的潜在大量志愿用户,他们不需要是问题回答服务的成员。问询输入接收组件525接受来自决定使用本发明的增强通用信息检索服务的用户的问题。该组件向用户提供界面,以接收他们的问询。如先前所注明的,这些问询可为关键字串的形式,或者为自然语言句子。较佳地,这些问询可为自然语言问题的形式,因为这允许更多的信息以帮助检索先前已回答问题,这些问题可被提供给用户。该问询接收组件含有可用于标准用户510的界面。
[0054] 权威回答数据库530提供第一输出,作为对所接收的问询分析以及与权威已回答问题比较的结果。如之前详细所述,这些权威已回答问题没有被输入数据库,除非有最小限度的独立人评价该回答的权威性为可接受的程度。较佳地,该权威性也在数据库中被量化为分级系统、表示接收度的百分数、级别、团体中个人状态、团体投票结果、至少一个团体专家关于回答的意见。这些权威性的量化可便于提供给结果组合器以增强不同数据来源之间的组织以呈现给用户。
[0055] 通用信息数据库535,提供第二输出,作为对所接收的问询分析以及与本领域众所周知的通常在网络上可访问的信息比较的结果。该数据库被询问,作为由组件525接收到的问询输入的结果,并使用用来询问数据库520的一个或多个分析器。或者,该数据库可被单独询问,使用一个或多个类似分析器,此分析器运行在由组件525接收到的相同问询输入上。
[0056] 结果组合器组件540集成作为对权威回答数据库530的问询结果而生成的第一输出,以及作为对通用信息数据库535的问询结果而生成的第二输出。该结果组合器组件较佳地包括邀请子组件,它提供链接和邀请以递交问询或相关问题给基于团体的回答服务。一个或多个建议的类别、以及团体内本领域专家的数量、或用于一个回应平均等待时间可被集成到该邀请中。这样,如果用户对所集成的回应不满意,那么提供了一个便利的办法以获得权威回答。
[0057] 在一则实施例中,结果组合器组件540较佳地也包括一个输出子组件,它允许由服务生成的数据呈现为一个有序的方式。该子组件提供了一个基于第一输出的第一列表,该列表提取了问询与通用信息数据库中的条目的相互关系,并且提供了基于第二输出的第二列表,该列表提取了问询与基于团体的信息数据库中的条目的相互关系。该第一列表最终在输入问询的用户的用户界面的第一区域中被呈现给用户。第二列表最终在用户界面的第二区域中被呈现给用户。这允许用户分开来自不同来源的信息,并容易地评估由两个数据库提供的信息的相对优点。也可用权威输出子组件来增强结果组合器组件,权威输出子组件提供至少一个包含在第二列表中的表示提供给用户界面的结果中至少一个项目的权威性的字段。这可采取对每个所提取的项目,或表示整个第二列表权威性强度的字段,进行权威衡量或分级的形式。该字段可被具体为一个级别、表示回应可接受度的百分数、五星级别中的星级、团体中提供回答的个人的状态、团体的投票结果、或是团体专家关于回答的意见。
[0058] 或者,在另一则实施例中,结果组合器组件540也包括列表集成子组件,它允许由服务生成的数据被表示为一个统一的形式。该子组件将整个基于第一输出的第一列表和基于第二输出的第二列表集成入一个列表。该第一列表通常仅由信息匹配强度排序,但可能有两个标准用以排序第二列表:信息匹配强度、以及由权威回答数据库530中量化的权威性强度。这样存在三个独立的可被分别衡量以折衷各列表为一个单独表现的列表的标准:列表1的信息匹配强度、列表2的信息匹配强度、以及列表2的权威性强度。在第一则实施例中,不使用或不要求量化的权威性,而只衡量匹配强度以将两个列表放在单个尺度上以组合这些列表。其他实施例可执行类似的基于任何两个或三个这些标准的衡量以执行整合。也可包含一个权威输出子组件来增强结果组合器组件,权威输出子组件提供至少一个包含在所组合的列表中的表示提供给用户界面的结果中至少一个项目的权威性的字段。这可采取对每个所提取的来自第二列表的项目,或表示来自第二列表的元素的权威性强度的字段进行权威衡量或分级的形式。该字段可被具体为一个级别、表示回应可接受度的百分数、五星级别中的星级、团体中提供回答的个人的状态、团体的投票结果、或是团体专家关于回答的意见。
[0059] 这样,可以了解到本发明向用户提供了一个用于从更可能回答用户问题的检索服务中获得回答的系统和方法。
[0060] 基于对说明书包括附图的审阅而属于本发明的替代实施例和实现对本领域熟练技术人员而言是显而易见的。因此,由附加权利要求书而不是前面的描述来定义本发明的范围。