会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 商业智能 / 用于兴趣驱动商业智能系统中使用的兴趣驱动数据可视化系统的系统和方法

用于兴趣驱动商业智能系统中使用的兴趣驱动数据可视化系统的系统和方法

申请号 CN201380060480.4 申请日 2013-10-10 公开(公告)号 CN104813319A 公开(公告)日 2015-07-29
申请人 百科纳有限公司; 发明人 P·普拉布; B·M·沃瑟; K·S·毕耶; J·G·伊施勒曼; J·姆赫兰德;
摘要 示出了根据本发明的实施例的用于兴趣驱动数据可视化系统的系统和方法。在一个实施例中,兴趣驱动数据可视化系统包括处理器、被连接并且被配置为存储兴趣驱动数据可视化应用的存储器和元数据存储器,其中,兴趣驱动数据可视化应用配置处理器以:限定报告数据要求;基于报告数据要求产生数据取回作业数据;传送数据取回作业数据;接收融合数据;使用接收的融合数据和报告数据要求创建至少一条报告数据;关联描述该至少一条报告数据的视觉外观的可视化元数据与报告数据;并且使用报告数据要求和可视化元数据产生报告。
权利要求

1.一种兴趣驱动数据可视化系统,包括:

处理器;

存储器,与处理器连接并且被配置为存储兴趣驱动数据可视化应用;以及元数据存储器,被配置为存储描述原始数据的数据描述元数据,其中,兴趣驱动数据可视化应用配置处理器以:

限定报告数据要求,其中报告数据要求包含至少一条报告数据元数据;

基于报告数据要求中的所述至少一条报告数据元数据和数据描述元数据产生数据取回作业数据;

向兴趣驱动商业智能系统传送数据取回作业数据;

从兴趣驱动商业智能系统接收融合数据,其中兴趣驱动商业智能系统被配置为:处理数据取回作业数据以使用原始数据来产生融合数据,其中原始数据的一部分是非结构化的数据;以及存储融合数据和通过存储于兴趣驱动数据可视化系统的元数据存储装置内的数据描述元数据描述的原始数据;

使用接收的融合数据、数据描述元数据和报告数据元数据来创建至少一条报告数据;

关联可视化元数据与报告数据,其中可视化元数据描述所述至少一条报告数据的视觉外观;以及使用所述至少一条报告数据、报告数据要求和可视化元数据来产生报告,其中产生的报告被配置为使用显示装置被显示。

2.根据权利要求1所述的系统,其中,兴趣驱动数据可视化应用配置处理器以从兴趣驱动商业智能系统接收融合数据元数据,其中融合数据元数据包含描述与使用原始数据产生补充融合数据相关联的延迟的时间估计数据,所述时间估计数据是基于产生融合数据的至少一部分所花费的时间产生的。

3.根据权利要求2所述的系统,其中,兴趣驱动数据可视化应用配置处理器以在产生的报告中包含显示报告元数据,其中显示报告元数据配置报告以包含与产生补充融合数据相关联的延迟的指示。

4.根据权利要求2所述的系统,其中,兴趣驱动数据可视化应用配置处理器以:基于数据取回作业数据和接收的融合数据产生补充数据取回作业数据;

向兴趣驱动商业智能系统传送补充数据取回作业数据;

从兴趣驱动商业智能系统接收补充融合数据;

使用补充融合数据、数据描述元数据和报告数据元数据更新所述至少一条报告数据中的至少一条;以及使用更新的报告数据更新报告。

5.根据权利要求4所述的系统,其中,兴趣驱动数据可视化应用配置处理器以:关联提醒与补充数据取回作业数据,其中提醒包含将要执行的动作;以及当接收补充融合数据时,执行与提醒相关联的动作。

6.根据权利要求1所述的系统,其中,兴趣驱动数据可视化应用配置处理器以:使用产生的报告捕获可视化快照,其中可视化快照包含报告数据的一部分、报告数据要求和显示数据元数据;以及在存储器内存储可视化快照。

7.根据权利要求6所述的系统,其中,兴趣驱动数据可视化应用配置处理器以向与兴趣驱动数据可视化系统分开的远程系统传送可视化快照,其中远程系统被配置为在不与兴趣驱动商业智能系统通信的情况下显示可视化快照。

8.根据权利要求1所述的系统,其中,兴趣驱动数据可视化应用配置处理器以:使用第二兴趣驱动商业智能系统确定数据描述元数据,其中第二兴趣驱动商业智能系统与兴趣驱动商业智能系统分开,并且该数据描述元数据描述经由第二兴趣驱动商业智能系统可获得的新的融合数据;

使用所述数据描述元数据创建替代报告数据;

基于报告数据要求和所述数据描述元数据来确定替代报告数据的一部分与可视化元数据之间的映射;以及使用替代报告数据和所述数据描述元数据产生替代报告。

9.根据权利要求1所述的系统,其中,可视化元数据包含便携可视化。

10.根据权利要求1所述的系统,其中,可视化元数据是基于报告数据和报告数据要求自动产生的。

11.一种用于创建兴趣驱动数据可视化的方法,包括:使用兴趣驱动数据可视化系统来限定报告数据要求,其中报告数据要求包含至少一条报告数据元数据;

使用兴趣驱动数据可视化系统基于报告数据要求中的所述至少一条报告数据元数据以及数据描述元数据来产生数据取回作业数据;

使用兴趣驱动数据可视化系统向兴趣驱动商业智能系统传送数据取回作业数据;

使用兴趣驱动数据可视化系统从兴趣驱动商业智能系统接收融合数据,其中兴趣驱动商业智能系统被配置为:处理数据取回作业数据以使用原始数据来产生融合数据,其中原始数据的一部分是非结构化的数据;以及存储融合数据和通过存储于兴趣驱动数据可视化系统的元数据存储装置内的数据描述元数据描述的原始数据;

使用兴趣驱动数据可视化系统基于接收的融合数据、数据描述元数据和报告数据元数据来创建至少一条报告数据;

使用兴趣驱动数据可视化系统来关联可视化元数据与报告数据,其中可视化元数据描述所述至少一条报告数据的视觉外观;以及使用兴趣驱动数据可视化系统基于所述至少一条报告数据、报告数据要求和可视化元数据来产生报告。

12.根据权利要求11所述的方法,还包括使用兴趣驱动数据可视化系统从兴趣驱动商业智能系统来接收融合数据元数据,其中融合数据元数据包含描述与使用原始数据来产生补充融合数据相关联的延迟的时间估计数据,所述时间估计数据是基于产生融合数据的至少一部分所花费的时间产生的。

13.根据权利要求12所述的方法,还包括使用兴趣驱动数据可视化系统在产生的报告中显示报告元数据,其中显示报告元数据配置报告以包含与产生补充融合数据相关联的延迟的指示。

14.根据权利要求12所述的方法,还包括:

使用兴趣驱动数据可视化系统基于数据取回作业数据和接收的融合数据来产生补充数据取回作业数据;

使用兴趣驱动数据可视化系统向兴趣驱动商业智能系统传送补充数据取回作业数据;

使用兴趣驱动数据可视化系统从兴趣驱动商业智能系统接收补充融合数据;

使用兴趣驱动数据可视化系统基于补充融合数据、数据描述元数据和报告数据元数据更新所述至少一条报告数据中的至少一条;以及使用兴趣驱动数据可视化系统基于更新的报告数据更新报告。

15.根据权利要求14所述的方法,还包括:

使用兴趣驱动数据可视化系统来关联提醒与补充数据取回作业数据,其中提醒包含将要执行的动作;以及当接收补充融合数据时,使用兴趣驱动数据可视化系统执行与提醒相关的动作。

16.根据权利要求11所述的方法,还包括:

使用兴趣驱动数据可视化系统基于产生的报告来捕获可视化快照,其中可视化快照包含报告数据的一部分、报告数据要求和显示数据元数据;以及使用兴趣驱动数据可视化系统来存储可视化快照。

17.根据权利要求16所述的方法,还包括使用兴趣驱动数据可视化系统向与兴趣驱动数据可视化系统分开的远程系统传送可视化快照,其中远程系统被配置为在不与兴趣驱动商业智能系统通信的情况下显示可视化快照。

18.根据权利要求11所述的方法,还包括:

使用第二兴趣驱动商业智能系统和兴趣驱动数据可视化系统来确定数据描述元数据,其中第二兴趣驱动商业智能系统与兴趣驱动商业智能系统分开,并且该数据描述元数据描述经由第二兴趣驱动商业智能系统可获得的新的融合数据;

使用兴趣驱动数据可视化系统基于所述数据描述元数据创建替代报告数据;

使用兴趣驱动数据可视化系统基于报告数据要求和所述数据描述元数据确定替代报告数据的一部分与可视化元数据之间的映射;以及使用兴趣驱动数据可视化系统基于替代报告数据和所述数据描述元数据产生替代报告。

19.根据权利要求11所述的方法,其中,可视化元数据包含便携可视化。

20.根据权利要求11所述的方法,其中,使用兴趣驱动数据可视化系统基于报告数据和报告数据要求自动产生可视化元数据。

说明书全文

用于兴趣驱动商业智能系统中使用的兴趣驱动数据可视化

系统的系统和方法

技术领域

[0001] 本发明涉及数据可视化系统,更具体地,涉及用于兴趣驱动商业智能系统中的兴趣驱动数据可视化系统。

背景技术

[0002] 术语“商业智能”通常用于指示用于识别、处理和分析商业数据的技术。商业智能系统可提供商业经营的历史、当前和预测性观察。可根据数据周围的上下文和知识来使在商业经营过程中产生的商业数据结构化、半结构化或非结构化,包含从商业处理产生的数据和由雇员和顾客创建的附加数据。在许多情况下,从商业处理产生的数据被结构化,而从顾客与商业的交互作用产生的数据被半结构化或非结构化。由于在商业运营过程中一般产生的数据的量,商业智能系统通常在数据仓库的顶部被构建并且利用该数据仓库。
[0003] 数据仓库被用于存储、分析和报告数据;例如,商业数据。数据仓库利用数据库从而以多产的和成本有效的方式存储、分析和控制数据。通常利用各种数据库,这些数据库包括:关系数据库管理系统(RDBMS),诸如来自California的Santa Clara的Oracle Corporation的Oracle Database,或大规模并行处理分析数据库,诸如来自Ohio的Miamisburg的Teradata Corporation的Teradata。诸如来自North Carolina的SAS Institute,Inc.的SAS的商业智能(BI)和分析工具被用于访问存储于数据库中的数据并且向开发人员提供接口从而产生报告、管理和挖掘存储的数据、执行统计分析、商业计划、预测和其它商业功能。使用BI工具创建的大多数报告由数据库管理员创建,并且,可针对期望的访问模式调整底层的数据库。数据库管理员可索引、预先融合或限制对具体关系的访问、允许自组织报告和探索。
[0004] 雪花架构是RDBMS中的表格的排列,它具有与一个或多个维度表格连接的中心事实表格。雪花架构中的维度表格被规格化为多个相关的表格-对于复杂架构,将在维度表格之间存在许多关系,从而导致看起来类似雪花的架构。星形架构是具有参照一个或多个维度表格的事实表格的雪花架构的特定形式。但是,在星形架构中,维度被归一化为单个表格-事实表格是中心并且维度表格是星形的“点”。
[0005] 在线交易处理(OLTP)系统被设计为促进和管理基于交易的应用。OLTP可指诸如数据库管理系统交易、商业或商业交易的各种交易。OLTP系统典型地具有对于用户请求的低延迟响应。
[0006] 作为OLTP的变型的在线分析处理(OLAP)是回答多维度分析询问的方法。OLAP工具使得用户能够使用三种基本分析操作来分析多维度数据:联合(融合数据)、下钻(导航数据细节)和分割和分切(从多个观点取得数据和观察的具体集合)。任何OLAP系统的基础是OLAP立方。OLAP立方是具有操作和分析来自多个观点的数据的能力的允许快速分析数据的数据结构。OLAP立方一般由通过维度分类的被称为量度的数字事实构成。通常从RDBMS中的表格的星形架构或雪花架构创建这些事实和量度。

发明内容

[0007] 示出了根据本发明的实施例的用于兴趣驱动数据可视化系统的系统和方法。在一个实施例中,兴趣驱动数据可视化系统包括:处理器;与处理器连接并且被配置为存储兴趣驱动数据可视化应用的存储器;和被配置为存储描述原始数据的数据描述元数据的元数据存储器,其中兴趣驱动数据可视化应用配置处理器以:限定报告数据要求,其中报告数据要求包含至少一条报告数据元数据;基于报告数据要求中的该至少一条报告数据元数据和数据描述元数据产生数据取回作业数据;向兴趣驱动商业智能系统传送数据取回作业数据;从兴趣驱动商业智能系统接收融合数据,其中,兴趣驱动商业智能系统被配置为:处理数据取回作业数据以使用原始数据产生融合数据,其中,原始数据的一部分是非结构化的数据,并且存储融合数据和通过存储于兴趣驱动数据可视化系统的元数据存储装置内的数据描述元数据描述的原始数据;使用接收的融合数据、数据描述元数据和报告数据元数据创建至少一条报告数据;关联可视化元数据与报告数据,其中,可视化元数据描述该至少一条报告数据的视觉外观;以及使用该至少一条报告数据、报告数据要求和可视化元数据产生报告,其中,产生的报告被配置为通过使用显示装置被显示。
[0008] 在本发明的另一实施例中,兴趣驱动数据可视化应用配置处理器以从兴趣驱动商业智能系统接收融合数据元数据,其中,融合数据元数据包含描述与使用原始数据产生补充融合数据相关的延迟的时间估计数据,该时间估计数据是基于产生融合数据的至少一部分所花费的时间产生的。
[0009] 在本发明的另一实施例中,兴趣驱动数据可视化应用配置处理器以在产生的报告中包含显示报告元数据,其中,显示报告元数据配置报告以包含与产生补充融合数据相关的延迟的指示。
[0010] 在本发明的另一实施例中,兴趣驱动数据可视化应用配置处理器以:基于数据取回作业数据和接收的融合数据产生补充数据取回作业数据;向兴趣驱动商业智能系统传送补充数据取回作业数据;从兴趣驱动商业智能系统接收补充融合数据;使用补充融合数据、数据描述元数据和报告数据元数据更新至少一条报告数据中的至少一条;以及使用更新的报告数据更新报告。
[0011] 在本发明的又一实施例中,兴趣驱动数据可视化应用配置处理器以:关联提醒与补充数据取回作业数据,其中,提醒包含将要执行的动作;以及当接收补充融合数据时,执行与提醒相关联的动作。
[0012] 在本发明的又一实施例中,兴趣驱动数据可视化应用配置处理器以:使用产生的报告捕获可视化快照,其中,可视化快照包含报告数据的一部分、报告数据要求和显示数据元数据;以及在存储器内存储可视化快照。
[0013] 在本发明的又一实施例中,兴趣驱动数据可视化应用配置处理器以向与兴趣驱动数据可视化系统分开的远程系统传送可视化快照,其中,远程系统被配置为在不与兴趣驱动商业智能系统通信的情况下显示可视化快照。
[0014] 在本发明的又一实施例中,兴趣驱动数据可视化应用配置处理器以:使用第二兴趣驱动商业智能系统确定数据描述元数据,其中,第二兴趣驱动商业智能系统与兴趣驱动商业智能系统分开,并且,该数据描述元数据描述经由第二兴趣驱动商业智能系统可获得的新的融合数据;使用该数据描述元数据创建替代报告数据;基于报告数据要求和该数据描述元数据确定替代报告数据的一部分与可视化元数据之间的映射;以及使用替代报告数据和该数据描述元数据产生替代报告。
[0015] 在本发明的又一实施例中,可视化元数据包含便携可视化。
[0016] 在本发明的又一实施例中,可视化元数据是基于报告数据和报告数据要求自动产生的。
[0017] 本发明的又一实施例包括一种用于创建兴趣驱动数据可视化的方法,该方法包括:通过使用兴趣驱动数据可视化系统限定报告数据要求,其中,报告数据要求包含至少一条报告数据元数据;使用兴趣驱动数据可视化系统基于报告数据要求中的该至少一条报告数据元数据和数据描述元数据产生数据取回作业数据;使用兴趣驱动数据可视化系统向兴趣驱动商业智能系统传送数据取回作业数据;使用兴趣驱动数据可视化系统从兴趣驱动商业智能系统接收融合数据,其中,兴趣驱动商业智能系统被配置为:处理数据取回作业数据以使用原始数据产生融合数据,其中,原始数据的一部分是非结构化的数据;以及存储融合数据和通过存储于兴趣驱动数据可视化系统的元数据存储装置内的数据描述元数据描述的原始数据;使用兴趣驱动数据可视化系统基于接收的融合数据、数据描述元数据和报告数据元数据创建至少一条报告数据;使用兴趣驱动数据可视化系统关联可视化元数据与报告数据,其中,可视化元数据描述至少一条报告数据的视觉外观;以及使用兴趣驱动数据可视化系统基于该至少一条报告数据、报告数据要求和可视化元数据产生报告。
[0018] 在本发明的又一附加实施例中,创建兴趣驱动数据可视化还包括使用兴趣驱动数据可视化系统从兴趣驱动商业智能系统接收融合数据元数据,其中,融合数据元数据包含描述与使用原始数据产生补充融合数据相关的延迟的时间估计数据,该时间估计数据是基于产生融合数据的至少一部分所花费的时间产生的。
[0019] 在本发明的又一附加实施例中,创建兴趣驱动数据可视化还包括使用兴趣驱动数据可视化系统在产生的报告中显示报告元数据,其中,显示报告元数据配置报告以包含与产生补充融合数据相关联的延迟的指示。
[0020] 在本发明的又一附加实施例中,创建兴趣驱动数据可视化还包括:使用兴趣驱动数据可视化系统基于数据取回作业数据和接收的融合数据产生补充数据取回作业数据;使用兴趣驱动数据可视化系统向兴趣驱动商业智能系统传送补充数据取回作业数据;使用兴趣驱动数据可视化系统从兴趣驱动商业智能系统接收补充融合数据;使用兴趣驱动数据可视化系统基于补充融合数据、数据描述元数据和报告数据元数据更新至少一条报告数据中的至少一条;以及使用兴趣驱动数据可视化系统基于更新的报告数据更新报告。
[0021] 在本发明的又一实施例中,创建兴趣驱动数据可视化还包括:使用兴趣驱动数据可视化系统关联提醒与补充数据取回作业数据,其中,提醒包含将要执行的动作;以及当接收补充融合数据时,使用兴趣驱动数据可视化系统执行与提醒相关联的动作。
[0022] 在本发明的又一实施例中,创建兴趣驱动数据可视化还包括:使用兴趣驱动数据可视化系统基于产生的报告来捕获可视化快照,其中,可视化快照包含报告数据的一部分、报告数据要求和显示数据元数据;以及使用兴趣驱动数据可视化系统存储可视化快照。
[0023] 在本发明的又一实施例中,创建兴趣驱动数据可视化还包括使用兴趣驱动数据可视化系统向与兴趣驱动数据可视化系统分开的远程系统传送可视化快照,其中,远程系统被配置为在不与兴趣驱动商业智能系统通信的情况下显示可视化快照。
[0024] 在本发明的又一附加实施例中,创建兴趣驱动数据可视化还包括:使用第二兴趣驱动商业智能系统和兴趣驱动数据可视化系统确定数据描述元数据,其中,第二兴趣驱动商业智能系统与兴趣驱动商业智能系统分开,并且,该数据描述元数据描述经由第二兴趣驱动商业智能系统可获得的新的融合数据;使用兴趣驱动数据可视化系统基于该数据描述元数据创建替代报告数据;使用兴趣驱动数据可视化系统基于报告数据要求和该数据描述元数据确定替代报告数据的一部分与可视化元数据之间的映射;以及使用兴趣驱动数据可视化系统基于替代报告数据和该数据描述元数据产生替代报告。
[0025] 在本发明的又一附加实施例中,其中,可视化元数据包含便携可视化。
[0026] 在本发明的又一附加实施例中,其中,使用兴趣驱动数据可视化系统基于报告数据和报告数据要求自动产生可视化元数据。

附图说明

[0027] 图1是包含根据本发明的实施例的兴趣驱动数据可视化系统的商业智能系统的网络示图。
[0028] 图2是根据本发明的实施例的兴趣驱动数据可视化系统的概念图。
[0029] 图3是根据本发明的实施例的兴趣驱动数据可视化系统的视觉外观的示图。
[0030] 图4是示出根据本发明的实施例的用于数据的兴趣驱动可视化的处理的流程图。
[0031] 图5是示出根据本发明的实施例的用于使用兴趣驱动数据可视化系统创建可视化的处理的流程图。
[0032] 图6是示出根据本发明的实施例的用于使用兴趣驱动数据可视化系统估计用于分析员产生的动作的时间要求的处理的流程图。
[0033] 图7是示出根据本发明的实施例的用于使用兴趣驱动数据可视化系统探索数据的处理的流程图。
[0034] 图8是示出用于根据本发明的实施例的用于使用兴趣驱动数据可视化系统创建可视化快照的处理的流程图。

具体实施方式

[0035] 现在转到附图,示出了根据本发明的实施例的兴趣驱动数据可视化系统。兴趣驱动数据可视化系统使得使用包含但不限于兴趣驱动商业智能系统的各种系统的分析员能够使用通过兴趣驱动商业智能系统取回并且保持在存储器中的数据迅速地产生报告,并且同时具有下钻到底层的原始数据中以动态创建新报告的能力。兴趣驱动商业智能系统是被配置为动态地构建兴趣驱动数据管道以向分析员提供感兴趣的信息的商业智能系统。兴趣驱动商业智能系统能够以如下的方式管理巨量的数据集,该方式向分析员提供对可获得的数据的完全可见性和动态重新配置兴趣驱动商业智能系统以提供对所希望信息的访问的能力。为了实现高度交互的性能,兴趣驱动商业智能系统动态地构建兴趣驱动数据管道从而基于希望的数据消耗将感兴趣的数据加载到系统存储器中。在报告层面上规定的变化可由兴趣驱动商业智能系统自动编辑并且回溯从而创建合适的兴趣驱动数据管道以满足新的报告要求。兴趣驱动商业智能系统进一步构建关于兴趣驱动商业智能系统中可获得的数据的元数据并且向兴趣驱动数据可视化系统提供该元数据以使得能够使用元数据构建报告。兴趣驱动商业智能系统中可获得的数据包含但不限于原始数据、融合数据、过滤的数据和报告数据。兴趣驱动商业智能系统中可获得的数据可依赖于创建该数据所需要的处理时间量;因而,可获得的数据可以与指示产生该可获得的数据所需要的时间的估计的数据访问时间元数据相关联。在Eshlema等人在2012年2月29日提交的且名称为“Interest-Driven Business Intelligence Systems and Methods of Data Analysis Using Interest-Driven Data Pipelines”的美国专利申请No.13/408872中公开了用于兴趣驱动商业智能系统的系统和方法,其内容通过引用全文并入。
[0036] 这些报告的可视化和新报告可利用已由兴趣驱动商业智能系统提供的报告数据并且/或者导致将由兴趣驱动商业智能系统产生的新报告数据填充该报告。由兴趣驱动商业智能系统提供的报告数据包含从商业智能系统中的原始数据存储器加载的原始数据,该原始数据已经被处理并且被加载到数据结构中以提供对该数据的迅速访问。原始数据包含但不限于结构化的数据、半结构化的数据和非结构化的数据,并且可被存储于与兴趣驱动商业智能系统相关联的一个或多个数据源中。在各种实施例中,结构化的和半结构化的数据包含描述该数据的元数据,诸如索引或其它关系;非结构化的数据缺少任何定义结构。在几个实施例中,原始数据的处理包括但不限于融合原始数据并且过滤原始数据。根据多个实施例,商业智能系统将原始数据加载到各种数据结构中,这些数据结构包含但不限于在线分析处理(OLAP)立方。在许多实施例中,可视化是出现在兴趣驱动数据可视化系统中的报告数据的可视表示。
[0037] 可视化可采取使得能够观察包含于报告中的数据的许多形式,诸如饼图、条形图、表格或任何其它形式。在各种实施例中,可视化是多维度的并且使用与可视化相关的报告数据,诸如通过针对不同条的报告数据分层和/或合成不同的可视化,允许多重同时显示。可视化自身与其操作的报告数据无关,允许针对不同条的报告数据飞速创建分析。通过关联多条报告数据与图元并且组合图元以形成可视化的复合呈现,实现可视化的呈现。复合呈现考虑多条报告数据的本质和属性,使得能够通过分析可视化正确地解释来自完全不同的源的多条报告数据。在本发明的几个实施例中,报告和/或可视化被配置为使用显示装置被显示。
[0038] 在本发明的许多实施例中,在兴趣驱动数据可视化系统中利用的报告包含使用从兴趣驱动商业智能系统接收的报告数据确定的一组数据集和一组可视化。兴趣驱动数据可视化系统被配置为使得能够动态关联数据集与可视化以提供描述数据的各种交互报告。可视化的各个方面,包含可视化的颜色、样式、尺寸和维度可被映射到包含于数据集中的事实以产生报告。另外,可视化的方面可被实时动态更新。兴趣驱动数据可视化系统提供对描述从兴趣驱动商业智能系统可获得的原始数据的元数据的访问,并且使用该元数据以使得能够请求用于报告中的新的和更新的报告数据。在各种实施例中利用元数据存储器,包括包含于兴趣驱动数据可视化系统和/或提供该元数据的单独的装置中的存储器,以存储描述从兴趣驱动商业智能系统可获得的原始数据的元数据。在兴趣驱动商业智能系统不能立即提供请求的报告数据的情况下,诸如在兴趣驱动商业智能系统取回并且处理原始数据以产生请求报告数据的情况下,兴趣驱动数据可视化系统被配置为提供直到请求的报告数据可获得的剩余时间的指示。在几个实施例中,兴趣驱动数据可视化系统被配置为基于由兴趣驱动商业智能系统提供的请求报告数据增量更新报告。
[0039] 以下进一步讨论根据本发明的实施例的用于兴趣驱动数据可视化系统的系统和方法。
[0040] 系统概要
[0041] 在图1中示出根据本发明的实施例的兴趣驱动商业智能系统。兴趣驱动商业智能系统100包括被配置为存储原始商业数据的分布计算平台110。分布计算平台110被配置为经由网络114与中间处理系统112通信。在本发明的几个实施例中,网络114是局域网络。在许多实施例中,分布计算平台110经由因特网114与中间处理系统112通信。在本发明的许多实施例中,分布计算平台110是被配置为分布计算平台的计算机集群。分布计算平台110可被配置为充当兴趣驱动商业智能系统内的原始数据存储系统和数据仓库。在各种实施例中,利用备选的分布处理系统。
[0042] 在几个实施例中,还使用计算装置中的一个或集群实现中间处理系统112。基于由分析员规定的可视化,中间处理系统112自动创建和/或更新一个或多个兴趣驱动数据管道以创建或更新报告数据。典型地通过将数据取回作业下推到分布计算平台110配置兴趣驱动数据管道,从而创建源数据并然后使用中间处理系统112向源数据施加各种过滤器和/或融合处理以产生存储于存储器中的报告数据从而改善产生报告数据的响应时间。在多个实施例中,数据取回作业数据被用于代表和传送数据取回作业。在几个实施例中,当报告数据不存储于存储器中时,中间处理系统112被配置为使用存储于分布计算平台110中的原始数据产生报告数据。中间处理系统112还被配置为经由网络114与包含但不限于蜂窝电话116、个人计算机118和呈现装置120的一个或多个兴趣驱动数据可视化系统通信。在本发明的许多实施例中,兴趣驱动数据可视化系统包括能够接收和/或显示数据的任何计算装置。在本发明的几个实施例中,兴趣驱动数据可视化系统被配置为与中间处理系统
112通信。在多个实施例中,兴趣驱动数据可视化系统被配置为与分布计算平台110通信。
[0043] 根据本发明的实施例的兴趣驱动数据可视化系统使得分析员能够规定包含数据可视化的报告,这些数据可视化使得分析员能够使用由中间处理系统112产生的报告数据探索存储于分布计算平台110内的原始数据。以包括但不限于雪花架构和星形架构的各种形式提供报告数据。在许多实施例中,报告数据是包含使用存储于分布计算平台110内的原始数据填充的数据字段。兴趣驱动数据可视化系统被配置为创建具有各种可视化中的一个或多个的报告;可视化具有一个或多个可视化特性。兴趣驱动数据可视化系统进一步被配置为使用报告数据产生数据集并且接收输入且使用该输入以将数据集中的数据字段映射到一个或多个可视化特性。根据本发明的实施例,兴趣驱动数据可视化系统可通过各种形式接收输入,包括但不限于基于网络的接口、本机应用、机器执行脚本以及经由应用编程接口调用。
[0044] 兴趣驱动数据可视化装置还提供描述存储于分布计算平台110内的原始数据的列表的元数据;元数据中描述的原始数据可以或者可以不被包含于由中间处理系统112提供的报告数据中。兴趣驱动数据可视化系统被配置为使得能够通过使用由分布计算平台110提供的元数据和/或由中间处理系统112提供的报告数据创建数据目录来探索存储于分布计算平台110内的原始数据。当请求附加的报告数据以用于报告中时,兴趣驱动数据可视化系统创建并且向中间处理层112传送请求,导致中间处理层112动态更新一个或多个兴趣驱动数据管道以使用从分布计算平台110接收的原始数据创建包含请求的附加报告数据的新的和/或更新的报告数据。
[0045] 虽然在图1中在概念地示出根据本发明的实施例的兴趣驱动商业智能系统的具体结构,但也可利用被配置为存储大的数据集并且基于使用兴趣驱动数据可视化系统构建的报告自动构建兴趣驱动数据管道的各种结构中的任一个。以下进一步讨论根据本发明的实施例的用于兴趣驱动数据可视化系统的系统和方法。
[0046] 兴趣驱动数据可视化系统
[0047] 兴趣驱动数据可视化系统被配置为使用数据集通过将数据的字段映射到报告中的可视化特性来创建报告,这些数据集是使用由兴趣驱动商业智能系统提供的报告数据确定的。兴趣驱动数据可视化系统进一步被配置为使得能够探索描述原始数据的元数据并且基于原始数据请求附加报告数据从而支持新的和更新的报告。图2中概念地示出根据本发明的实施例的兴趣驱动数据可视化系统。兴趣驱动数据可视化系统200包含与易失性存储器220和非易失性存储器230通信的处理器210。兴趣驱动数据可视化系统200还包含被配置为在网络连接上发送和接收数据的网络接口240。在多个实施例中,网络接口240与处理器210、非易失性存储器230和易失性存储器220通信。
[0048] 在几个实施例中,非易失性存储器是被配置为存储包含但不限于报告数据234的各种数据的任何形式的非易失性存储器。在示出的实施例中,非易失性存储器230还被配置为存储配置处理器210以执行兴趣驱动数据可视化处理的数据可视化应用232,这些兴趣驱动数据可视化处理包括但不限于探索具有一个或多个数据字段的报告数据、通过将数据字段映射到可视化来限定可视化以及使用限定的可视化创建各种报告。在许多实施例中,使用外部服务器系统存储并且由兴趣驱动数据可视化系统200使用网络接口240接收数据可视化应用232和/或报告数据234。根据各种实施例的外部服务器系统包含但不限于兴趣驱动商业智能系统、分布计算平台和中间处理系统。在许多实施例中,数据可视化应用232配置处理器210以产生对附加报告数据的请求。在几个实施例中,处理器210被配置为使用网络接口240传送请求。
[0049] 虽然在图2中在概念地示出根据本发明的实施例的兴趣驱动数据可视化系统的具体结构,但还可以利用各种结构中的任一种,这些结构包含在盘或一些其它形式的存储器上存储数据或应用并且在运行时间被加载到易失性存储器220中的结构。以下进一步讨论根据本发明的实施例的用于兴趣驱动数据可视化的方法。
[0050] 兴趣驱动数据可视化
[0051] 报告是供分析员可视化、探索和呈现存储于兴趣驱动商业智能系统中的数据的主要方法。兴趣驱动数据可视化系统被配置为使得能够产生报告并与其交互作用。使用兴趣驱动数据可视化系统产生的报告还可限定和导致兴趣驱动数据管道的更新。图4中示出了根据本发明的实施例的用于兴趣驱动数据可视化的处理。处理400包含选择(410)报告数据。选择(412)数据集。数据集中的数据字段被映射(414)到可视化。确定(416)可视化的视觉外观。在多个实施例中,可视化被定制(418)。如果请求(420)附加的报告数据,那么选择(410)附加的报告数据。如果不请求(420)附加的报告数据,那么处理完成。
[0052] 在各种实施例中,从兴趣驱动商业智能系统接收选择(410)的报告数据。报告数据包含一个或多个数据集。在多个实施例中,选择(412)数据集包含选择存在于选择(410)的报告数据中的数据集。在许多实施例中,选择(412)数据集包含选择从兴趣驱动商业智能系统取回的报告数据中的数据集。在许多实施例中,报告数据要求包含选择(412)的数据集。在几个实施例中,报告数据要求还包含可从其取回所选择(412)的数据集的一个或多个数据源的参照。数据集包含一个或多个数据字段。在几个实施例中,(映射)414数据字段到可视化包含关联数据字段与在可视化中限定的可视化特性。在许多实施例中,使用一般的映射和/或基于映射模板的映射执行映射(414)数据字段到可视化。在各种实施例中,可以使用一般的映射和/或映射模板,从而使用描述数据字段中存储的具体数据的报告数据元数据并且匹配数据字段的描述到可视化的具体性能,映射(414)数据字段到可视化。以这种方式,映射(414)数据字段到可视化允许向各种报告数据施加一般化的可视化。在几个实施例中,基于选择(412)的数据集和/或选择(410)的报告数据自动执行数据字段到可视化的映射(414)。
[0053] 可使用兴趣驱动数据系统创建许多类型的可视化,包括但不限于条形图、饼图、线图、点图和热图。根据映射(414)的字段和可视化的类型,可视化可以是二维、三维或n维的。在多个实施例中,基于映射(414)的数据字段动态地确定(416)可视化的类型。在各种实施例中,基于映射(414)的数据字段动态地确定(416)多个可视化。在几个实施例中,手动确定(416)可视化的类型。在许多实施例中,定制(418)可视化包含改变可视化的宽度、高度、颜色、比例和几何尺寸。根据本发明的各种实施例,可根据具体应用的要求利用以上没有具体列出的可在可视化中定制(418)的多个属性。
[0054] 在几个实施例中,请求(420)附加的报告数据包含选择(410)存在于兴趣驱动数据可视化系统中的附加的报告数据。在许多实施例中,请求(420)附加的报告数据包含从兴趣驱动商业智能系统接收附加的报告数据。在各种实施例中,请求(420)附加的报告数据包含从兴趣驱动商业智能系统接收增量报告数据更新,此处的兴趣驱动商业智能系统配置兴趣驱动数据管道以使用利用非结构化的原始数据产生的融合数据产生一或多条增量报告数据。原始数据可存储于包括分布数据存储系统的各种系统中。在2013年3月8日提交的名称为“Systems and Methods for Interest-Driven Distributed Data Server Systems”的美国专利申请No.13/790624中公开了根据本发明的实施例可以被利用的用于使用分布数据存储系统产生报告数据的系统和方法,其通过引用全文并入此处。以下参照图7描述根据多个实施例的用于请求(420)附加的报告数据的附加的处理。
[0055] 现在转到图3,示出根据本发明的实施例的在兴趣驱动数据可视化系统中使用以执行兴趣驱动数据可视化的示例用户界面。用户界面300包含多个数据集310、一组可视化特性312、呈现的可视化314和一组过滤器316。数据集310典型地指示存在于从一条或多条报告数据选择的数据集中的多个数据字段和/或从兴趣驱动商业智能系统接收的元数据。一组可视化特性312包含用于呈现的可视化314的所有可视化特性的列表,连同哪些数据字段已经被映射到哪个可视化特性的指示。存在于数据集310与可视化特性320之间的一个映射是数据字段“date.Year”到可视化特性“Columns”的映射320。根据本发明的各种实施例的要求,可以利用没有具体示出的多个映射。呈现的可视化314是映射的可视化表示并且可通过调整可视化特性312被更新和修改。该组过滤器316包含可以被用于在不改变数据字段到可视化特性的映射的情况下改变呈现的可视化314的显示的过滤器。以上参照图3描述了特定的界面;但是,根据本发明的实施例,可以利用适于特定应用的要求的各种用户界面。
[0056] 虽然以上参照图4描述了用于兴趣驱动数据可视化的特定处理,但是,根据本发明的实施例,可以利用各种处理中的任一个。以下进一步讨论根据本发明的实施例的用于创建可视化、选择用于报告的数据和使用兴趣驱动数据可视化系统探索数据的处理。
[0057] 在兴趣驱动数据可视化系统中创建可视化
[0058] 顾名思义,可视化是存在于兴趣驱动数据可视化系统中的报告数据的实际可视表示。可视化关联报告中的多条报告数据与报告数据的可显示表现。以这种方式,可视化使得能够通过分析报告中的一条或多条报告数据解释和探索报告。在图5中示出根据本发明的实施例的用于限定和填充可视化的处理。处理500涉及限定(510)可视化。在几个实施例中,限定(510)可视化包含对存储于兴趣驱动商业智能系统中的数据限定过滤器和/或融合。在各种实施例中,限定过滤器和/或融合导致兴趣驱动数据可视化系统从兴趣驱动商业智能系统请求附加的报告数据。在许多实施例中,限定(510)可视化涉及在OLAP立方上执行操作,诸如切割、分切和下钻。在各种实施例中,OLAP立方存在于兴趣驱动数据可视化系统中。在多个实施例中,OLAP立方不存在兴趣驱动数据可视化系统中并且由兴趣驱动商业智能系统产生。在几个实施例中,兴趣驱动商业智能系统通过动态重新编辑兴趣驱动数据管道以产生OLAP立方来产生OLAP立方。限定(510)可视化也可涉及创建诸如数据透视表或汇总的各种数据总结以及与其的交互作用。
[0059] 一旦可视化被限定,就取回(512)包含支持可视化的数据的报告数据。在多个实施例中,报告数据可以是任何数量的存储器内数据模型,诸如OLAP立方、关系模型或存储于兴趣驱动数据可视化系统中的对象。使用报告数据,填充(514)可视化,使得能够观看存在于可视化中的数据。
[0060] 虽然在图5中示出用于创建可视化的特定处理,但可以利用各种处理中的任一个以使用根据本发明的实施例的兴趣驱动数据可视化系统来创建可视化。以下进一步讨论根据本发明的实施例的用于使用兴趣驱动数据可视化系统探索数据并且可视化与报告有关的信息的处理。
[0061] 在兴趣驱动数据可视化系统中可视化估计的执行时间
[0062] 兴趣驱动数据可视化系统动态地向分析员提供经由由兴趣驱动商业智能系统产生的报告数据和元数据的对各种原始数据的访问。兴趣驱动数据可视化系统典型地提供包含从兴趣驱动商业智能系统可获得的数据的列表的数据目录。在许多情况下,可用数据当前不可经由诸如OLAP立方的报告数据访问,该报告数据是由正在被用于产生分析员当前正在探索的报告的兴趣驱动商业智能系统提供的。以这种方式,分析员对报告的探索不受由兴趣驱动商业智能系统产生的报告数据限制。兴趣驱动可视化系统可向兴趣驱动商业智能系统提供指令,这些指令使得能够自动重新编辑兴趣驱动数据管道,以向分析员提供能够产生新报告的新报告数据和/或满足分析员的数据请求的可视化。但是,提供报告数据的兴趣驱动商业智能系统可能不能在所有情况下以低延迟的方式提供数据。图6中示出了根据本发明的实施例的用于估计向分析员提供特定条的数据、数据组、数据融合和/或可视化所涉及的时间量的过程。处理600涉及呈现(610)目录概要;该目录概要包含存在于兴趣驱动商业智能系统中的数据的列表。在多个实施例中,数据的列表包含存在于包含于兴趣驱动数据可视化系统中的报告数据中的数据。在各种实施例中,数据的列表包含从描述存在于兴趣驱动商业智能系统上的融合数据和/或原始数据的元数据导出的数据。
[0063] 在许多实施例中,兴趣驱动数据可视化系统向分析员建议(612)可能感兴趣的可视化。在多个实施例中,兴趣驱动数据可视化系统建议(614)在探索时分析员可能感兴趣的数据。从目录选择(616)希望的数据。确定(618)数据的可获得性,并且显示(620)指示取回希望的数据的时间量的视觉指示物。可通过根据本发明的实施例的兴趣驱动数据可视化系统和/或兴趣驱动商业智能系统确定数据的可获得性。在几个实施例中,使用描述在兴趣驱动商业智能系统上可用的数据的元数据和/或报告数据,确定(618)数据的可用性。
[0064] 例如,可以利用红绿灯系统以指示取回希望的数据的时间量;绿色指示可快速访问数据,黄色指示可在几分钟内访问数据,红色指示在几个小时内不可以从兴趣驱动商业智能系统获得数据访问。可以利用适于本发明的特定实施例的特定要求的诸如估计时间的各种其它的视觉指示物。在许多实施例中,提醒与数据的可获得性相关联。当数据的部分变得可获得时,提醒被触发。根据本发明的特定实施例的特定要求,可以利用各种提醒,包括但不限于弹出提醒、声音提醒、电子邮件提醒、电话提醒、社交媒体提醒和小消息服务提醒。例如,如果请求一年的记录且可在十分钟内产生第一个六个月的数据且产生第二个六个月的数据将耗费一周,那么兴趣驱动数据可视化系统可提供第一个六个月的数据并且使用第一个六个月的数据产生报告和可视化并且设定电子邮件提醒。一周后,当第二个六个月的数据变得可获得时,发送通知感兴趣的用户第二个六个月的数据现在可获得且可使用全年的记录创建报告和可视化的电子邮件提醒。
[0065] 虽然以上参照图6描述了用于使用兴趣驱动数据可视化系统估计数据访问时间的特定处理,但是,根据本发明的实施例,可以利用各种处理中的任一个。作为上述基于时间的红绿灯系统的替代,这些处理可基于各种度量,诸如处理功率估计。以下进一步讨论根据本发明的实施例的用于使用兴趣驱动数据可视化系统探索数据的处理。
[0066] 兴趣驱动数据可视化系统中的数据探索
[0067] 兴趣驱动数据可视化系统使得能够探索包含于兴趣驱动商业智能系统中的原始数据并且与该原始数据交互作用,使得分析员能够找到用于产生报告的附加报告数据。图7中示出了根据本发明的实施例的用于使用兴趣驱动数据可视化系统探索数据的处理。处理700涉及呈现(710)目录概要;目录概要包含存在于兴趣驱动商业智能系统中的使用描述由兴趣驱动商业智能系统提供的可获得的原始数据的元数据和报告数据产生的数据的列表。使用存在于目录概要中的数据创建(712)询问。询问被处理(714)。由兴趣驱动数据可视化系统接收(716)询问的结果。
[0068] 在许多实施例中,使用兴趣驱动数据管道执行询问的处理(714),该兴趣驱动数据管道是诸如但不限于以上通过引用并入的美国专利申请No.13/408872中描述的兴趣驱动数据管道中的一个。在各种实施例中,被处理(714)的询问导致使用兴趣驱动商业智能系统产生新的报告数据以及通过兴趣驱动数据可视化系统接收(716)新的报告数据。在多个实施例中,接收的(716)报告数据作为兴趣驱动数据可视化系统中可获得的一个或多个数据集被添加。在几个实施例中,被处理(714)的询问结果包含由兴趣驱动数据可视化系统接收的描述在兴趣驱动商业智能系统上可获得的数据的新的和/或更新的元数据。在许多实施例中,接收(716)的元数据被包含于数据目录中,使得能够进一步探索兴趣驱动商业智能系统上可获得的数据。
[0069] 在多个实施例中,询问的结果能够被兴趣驱动数据可视化系统的所有分析员使用。这种询问结果的共享可在兴趣驱动数据可视化系统中导致许多有意思的特征。例如,在本发明的实施例的许多兴趣驱动数据可视化系统中提供含有通信功能连同共享询问结果的协作方面。可在各种兴趣驱动数据可视化系统之中(或者在同一兴趣驱动数据可视化系统中的不同报告之中)产生和共享便携可视化,其中,使用描述多条报告数据的属性的元数据,将便携可视化映射到不同报告中的多条报告数据。以这种方式,适于可视化的合适的多条报告数据可被识别并且被映射到可视化,使得能够跨报告和兴趣驱动数据可视化系统重新使用同一可视化。根据本发明的许多实施例的兴趣驱动数据可视化系统包含其中可使用兴趣驱动数据可视化系统跨不同的商业购买和出售特定询问和定制可视化的市场。可使用描述报告数据的特性的元数据并且将这些特性与可视化中的字段匹配来将可视化中的字段映射到与获取商业相关联的兴趣驱动商业智能系统内的特定条的报告数据,由此创建其中使用与获取商业相关联的报告数据替代原始报告数据的替代报告。
[0070] 以上参照图7描述了根据本发明的实施例的兴趣驱动数据可视化系统中的数据探索的具体处理;但是,根据本发明的实施例,可以利用各种处理。
[0071] 可视化快照
[0072] 一旦创建了可视化,它就可被存储并与各种源共享。存储的可视化可包含与可视化相关联的报告数据,从而使得可在不可访问兴趣驱动商业智能系统的装置上显示存储的可视化,其中可从该兴趣驱动商业智能系统取回报告数据。在图8中表示根据本发明的实施例的用于创建和显示可视化快照的处理。处理800包含获得(810)可视化。捕获(812)可视化快照。存储(814)可视化快照。在许多实施例中,共享(816)可视化快照。
[0073] 在各种实施例中,通过关联报告中的报告数据获得(810)可视化,其中,报告数据包含使用存储于兴趣驱动商业智能系统中的非结构化的原始数据创建的融合数据。以上讨论了根据本发明的实施例的用于创建可被获得(810)的可视化的各种处理。在多个实施例中,捕获(812)快照可视化包含捕获获得(810)的可视化的属性连同与获得(810)的可视化相关联的报告数据的一部分。在几个实施例中,捕获(812)的可视化快照中包含整个报告(和/或附加数据)。在多个实施例中,可使用兴趣驱动数据可视化系统和/或与兴趣驱动数据可视化系统分开的远程系统存储(814)可视化快照。在各种实施例中,共享(816)可视化快照包含向与兴趣驱动数据可视化系统分开的远程系统传送可视化快照。在许多实施例中,远程系统被配置为使用包含于可视化快照内的报告数据来显示可视化快照。在几个实施例中,远程系统被配置为与兴趣驱动商业智能系统通信以基于存储于可视化快照中的报告数据请求更新的数据。
[0074] 以上参照图8讨论了根据本发明的实施例的用于创建和共享可视化快照的处理;但是,根据本发明的实施例,可以利用各种处理。
[0075] 虽然已经描述了本发明的某些具体方面,但是对于本领域技术人员而言,许多附加的修改和变更是清楚的。因此,应当理解,在不脱离本发明的范围和精神的情况下,可以通过具体描述的方式以外的方式实施本发明。因此,本发明的实施例应在所有的方面上被视为描述性的,不是限制性的。因此,本发明的范围不应由示出的实施例确定,而由所附的权利要求及其等同物确定。