会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 工业自动化和数控机床 / 坐标系 / 一种基于平行坐标系的海量文件流转可视化方法

一种基于平行坐标系的海量文件流转可视化方法

阅读:1051发布:2021-01-31

IPRDB可以提供一种基于平行坐标系的海量文件流转可视化方法专利检索,专利查询,专利分析的服务。并且本发明专利涉及一种基于平行坐标系的海量文件流转可视化方法。首先,对文件流转数据进行预处理,转换为中间表示;其次,将中间表示数据集转换为虚拟坐标集合,作为平行坐标系的可视化数据源;然后,根据虚拟坐标集合绘制平行坐标系,平行坐标上的点表示单位,点与点之间的折线表示流转关系;最后,根据数据特征或人机交互对平行坐标系的报送流程进行高亮显示和过虑显示;本发明的优点是能够支持海量文件报送的可视化管理,提高管理效率。,下面是一种基于平行坐标系的海量文件流转可视化方法专利的具体信息内容。

1.一种基于平行坐标系的海量文件流转可视化方法,包括以下步骤:(1)对海量文件流转数据预处理;

将海量文件、投递单位、接受单位进行预处理,转换为一个结构化数据集,该结构化数据集所采用的数据结构可以表示为一个三元组:DataSubmision=(FileId,FromDeptId,AcceptDeptId)其中:FileId表示流转文件标识,FromDeptId表示流转文件的投递单位,AcceptDeptId表示流转文件的接受单位;

(2)将结构化数据集转换为中间表示数据集;

对结构化数据集进行重组,以流转文件标识为Key,以流转文件的投递单位和接受单位为Value进行重组,可以表示为如下一个键值对列表:TempData1=(3)对中间表示数据集进行重组;

(3.1)以流转文件标识为Key,将Key相同的Value值作为ValueList,构建键值对列表并按照流转Key从小到大进行排序,该表示如下:TempData2=其中,FileId流转文件标识,ValueList={(FromDeptId,AcceptDeptId)}表示FileId相同的二元组列表集合;

(3.2)将键值对集合中文件流转过程相同的Key进行合并,合并为流转文件标识列表KeyList,可表示为如下:TempData3=其中,KeyList={FileId}表示文件流转过程相同的流转文件标识列表,ValueList表示文件流转过程集合;

(4)将中间表示键值对集合中的ValueList转换为一个虚拟坐标集合;

遍历中间表示键值对集合中的ValueList,将其转换为相应平行坐标轴上的虚拟坐标集合,该虚拟坐标集合对应平行坐标轴上面的虚拟坐标,表示如下:VirData=其中:KeyList表示报送流程相同的文件列表,VirValueList={(i,axisI)|i表示坐标轴编号,axisI表示该值在坐标轴i上的虚拟坐标};

(5)根据虚拟坐标轴集合绘制平行坐标系;

(5.1)设定平行坐标系坐标轴个数与轴距;

根据虚拟坐标集合中VirValueList中坐标个数的最大值,设定为平行坐标轴的个数,然后根据对应分辨率设置平行坐标轴的轴距;

(5.2)将虚拟坐标集合映射为平行坐标系的物理坐标集合;

将虚拟坐标集合VirValueList映射为平行坐标系的物理坐标集合。相应的物理坐标中X坐标是根据虚拟坐标集合每个坐标点的第一个分量得到平行坐标系中相对应的X轴所对应的X坐标,即Xi;相应的物理坐标中Y坐标根据虚拟坐标集合的第二个分量设定平行坐标系中在Xi轴对应的坐标点的Y坐标。由此可得到相应的物理坐标点(Xi,Y);

(5.3)画出平行坐标系之间的折线;

遍历每个虚拟坐标集合中相应的物理坐标点(Xi,Y),连成对应的折线;

(6)对平行坐标系的报送流程进行高亮显示和过虑显示;

(6.1)根据数据特征高亮显示平行坐标系中的可视化元素;

根据文件数据特征,局部高亮显示平行坐标系中的点与折线,以凸显这些文件的报送特征;

(6.2)根据用户输入过虑显示平行坐标系中的可视化元素;

采取人机交互方式,筛选出用户感兴趣的平行坐标系的可视化元素,以提高人机交互式体验。

说明书全文

一种基于平行坐标系的海量文件流转可视化方法

技术领域

[0001] 本发明专利涉及一种基于平行坐标系的海量文件流转可视化方法。首先,对文件流转数据进行预处理,转换为中间表示;其次,将中间表示数据集转换为虚拟坐标集合,作为平行坐标系的可视化数据源;然后,根据虚拟坐标集合绘制平行坐标系,平行坐标上的点表示单位,点与点之间的折线表示流转关系;最后,根据数据特征或人机交互对平行坐标系的报送流程进行高亮显示和过虑显示;本发明的优点是能够支持海量文件报送的可视化管理,提高管理效率。

背景技术

[0002] 数据可视化是利用人眼的感知能力对数据进行交互的可视化表达以增强认知的技术,它将不可见或难以直接显示的数据转化为可感知的图形、符号、颜色、纹理等,增强数据识别效率,传递有效信息,其基本方法是将每一个数据项作为单个图像元素表示,将大量的数据集合构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。
[0003] 数据可视化分析是指在数据分析、数据挖掘时,利用支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术,有效融合计算机的计算能力和人的认知能力,获得对于大规模数据集的洞察能力。
[0004] 随着互联网的快速发展和应用,政府部门和企事业单位部署了许多网上办公系统,这些系统往往会产生海量文件,并在不同部门、不同单位之间进行流转,这些海量文件的流转信息由于结构复杂、数据体量较大,难以依靠人来发现其中存在的规律,比如文件的流向、文件的时间、文件处理的及时性等。为此,基于可视化技术将海量文件的流转以可视化方式展现出来具有较重要的意义,这有助于直观的发现文件流转过程中的规律性知识。
[0005] 平行坐标技术在90年代初由Inselberg和Dimsdale提出的,它克服了传统的笛卡尔直角坐标系易耗尽空间、难以表达三维以上数据的难题,它将多维数据通过多条水平(或者垂直)等距离的平行轴映射到二维平面上,每一条轴线代表一个属性维,轴线上的取值范围从对应属性的最小值到最大值均匀分布。这样,每一个数据项都可以依据其属性维度取值而用一条跨越多调平行轴的折线段表示,相似的对象就具有相似的折现走向趋势。平行坐标系为分析多维数据提供了有效的可视化手段。
[0006] 国内外许多学者和研究机构对平行坐标系可视化也进行了相关的研究。Gen等人(IEEE Transaction on Visualization and Computer Graphics,2011)建立了一种具有多角度的柱状图平行坐标,进行具体的量化分析和处理,表示某个维度属性上的一个区域内的数量,以及支持用户根据密度和角度进行多维分析,从而更直观高效的展现数据在某个维度上的分布特征;HuhMyung-Hoe(Computational Statistics and Data Analysis,2008)提出了一种增强的平行坐标图,这种图对变量进行最优化重新排列,这些变量间的距离是成比例的,并且把变量和数据点用光滑的曲线连接,此外,该文还提出了在平行坐标图中各变量轴间可以是非等间距的思想;Xu Yonghong(Lecture Notes in Computer Science,2007)提出了基于平行坐标及其优化的平行筛可视化分类方法,该方法利用线性判别进行子空间搜索,利用决策树进行分类;Harri Siirtola(Interacting with Computers,2006)主要介绍了当前平行坐标浏览器的可交互技术,并在文字上比较了其可视化设计思想。同时,研究了可视化平行坐标的直接可用性;Natsuhiko Kumasakaa(Computational Statistics and Data Analysis,2008)提出了一种基于平行坐标图的新的高维数据可视化方法——纺织图,它是在平行坐标图的基础上调整和设置坐标轴的刻度,并同时选择连接的线,用每一线代表一种属性,使它们尽可能水平的排列。翟旭君(计算机应用研究,2005)等提出了一种分层平行坐标对数据集进行分层显示,克服当数据集很大时显示的数据层次混乱,并应用到聚类分析中;陈谊(系统仿真学报,2013)等人提出了一种简单、快捷的多视图协同可视化方法,充分利用各种可视化技术的优点,从不同的视角揭示多维数据,在平行坐标中嵌入直方图等统计方法来解决局部可视化的缺陷。

发明内容

[0007] 本发明要克服现有技术的上述特点,提供一种基于平行坐标系的海量文件流转可视化方法。
[0008] 一种基于平行坐标系的海量文件流转可视化方法,包括以下步骤:
[0009] (1)对海量文件流转数据预处理;
[0010] 将海量文件、投递单位、接受单位进行预处理,转换为一个结构化数据集,该结构化数据集所采用的数据结构可以表示为一个三元组:
[0011] DataSubmision=(FileId,FromDeptId,AcceptDeptId)
[0012] 其中:FileId表示流转文件标识,FromDeptId表示流转文件的投递单位,AcceptDeptId表示流转文件的接受单位;
[0013] (2)将结构化数据集转换为中间表示数据集;
[0014] 对结构化数据集进行重组,以流转文件标识为Key,以流转文件的投递单位和接受单位为Value进行重组,可以表示为如下一个键值对列表:
[0015] TempData1=
[0016] (3)对中间表示数据集进行重组;
[0017] (3.1)以流转文件标识为Key,将Key相同的Value值作为ValueList,构建键值对列表并按照流转Key从小到大进行排序,该表示如下:
[0018] TempData2=
[0019] 其中,FileId流转文件标识,ValueList={(FromDeptId,AcceptDeptId)}表示FileId相同的二元组列表集合;
[0020] (3.2)将键值对集合中文件流转过程相同的Key进行合并,合并为流转文件标识列表KeyList,可表示为如下:
[0021] TempData3=
[0022] 其中,KeyList={FileId}表示文件流转过程相同的流转文件标识列表,ValueList表示文件流转过程集合;
[0023] (4)将中间表示键值对集合中的ValueList转换为一个虚拟坐标集合;
[0024] 遍历中间表示键值对集合中的ValueList,将其转换为相应平行坐标轴上的虚拟坐标集合,该虚拟坐标集合对应平行坐标轴上面的虚拟坐标,表示如下:
[0025] VirData=
[0026] 其中:KeyList表示报送流程相同的文件列表,VirValueList={(i,axisI)|i表示坐标轴编号,axisI表示该值在坐标轴i上的虚拟坐标};
[0027] (5)根据虚拟坐标轴集合绘制平行坐标系;
[0028] (5.1)设定平行坐标系坐标轴个数与轴距;
[0029] 根据虚拟坐标集合中VirValueList中坐标个数的最大值,设定为平行坐标轴的个数,然后根据对应分辨率设置平行坐标轴的轴距;
[0030] (5.2)将虚拟坐标集合映射为平行坐标系的物理坐标集合;
[0031] 将虚拟坐标集合VirValueList映射为平行坐标系的物理坐标集合。相应的物理坐标中X坐标是根据虚拟坐标集合每个坐标点的第一个分量得到平行坐标系中相对应的X轴所对应的X坐标,即Xi;相应的物理坐标中Y坐标根据虚拟坐标集合的第二个分量设定平行坐标系中在Xi轴对应的坐标点的Y坐标。由此可得到相应的物理坐标点(Xi,Y);
[0032] (5.3)画出平行坐标系之间的折线;
[0033] 遍历每个虚拟坐标集合中相应的物理坐标点(Xi,Y),连成对应的折线;
[0034] (6)对平行坐标系的报送流程进行高亮显示和过虑显示;
[0035] (6.1)根据数据特征高亮显示平行坐标系中的可视化元素;
[0036] 根据文件数据特征,局部高亮显示平行坐标系中的点与折线,以凸显这些文件的报送特征;
[0037] (6.2)根据用户输入过虑显示平行坐标系中的可视化元素;
[0038] 采取人机交互方式,筛选出用户感兴趣的平行坐标系的可视化元素,以提高人机交互式体验。
[0039] 海量的文件的流转数据具有结构复杂体量巨大、流向参差不齐等特点,为了分析挖掘海量文件流转数据中的规律性知识,本发明专利提供了一种基于平行坐标系的海量文件流转可视化方法,通过对流转数据建模、流转数据映射、流转数据可视化、交互式分析等手段提供了有效的可视化手段,这在大数据背景下分析海量文件的流转特征具有重要的作用。
[0040] 本发明的优点主要表现是:本发明提出的可视化方法能够对海量文件在不同部门之间的流转情况进行可视化管理,并结合文件特征、人机交互等对平行坐标系进行高亮显示和过虑显示,提高管理效率和用户体验。

附图说明

[0041] 图1.将虚拟坐标集合映射为平行坐标系的物理坐标集合
[0042] 图2.根据物理坐标集合绘制相应平行坐标系中的折线
[0043] 图3.基于平行坐标系的海量文件流转可视化结果
[0044] 图4.根据文件特征高亮显示平行坐标系
[0045] 图5.根据用户输入过虑显示平行坐标系;

具体实施方式

[0046] 下面结合附图,对本发明做进一步说明。
[0047] 以表1所示的文件流转数据集为例,以两千份流转文件为数据源,对本发明专利的实施方式进行说明,步骤如下:
[0048] 表1文件流转数据集
[0049]文件 报送部门 接收部门
F1 D1 D2
F1 D2 D3
F1 D3 D4
F2 D2 D3
F2 D3 D4
F2 D4 D5
F2 D5 D6
F3 D3 D5
F3 D5 D7
F4 D3 D5
F4 D5 D7
…… …… ……
Fn Dj Dm
[0050] 注:n=2000,m=500分别为正整数
[0051] (1)对海量文件流转数据预处理;
[0052] 将海量文件、投递单位、接受单位进行预处理,转换为一个结构化数据集,表1中的文件流转数据可以表示为如下三元组集合:
[0053] {(F1,D1,D2),(F1,D2,D3),(F1,D3,D4),(F2,D2,D3),
[0054] (F2,D3,D4),(F2,D4,D5),(F2,D5,D6),
[0055] (F3,D3,D5),(F3,D5,D7),
[0056] (F4,D3,D5),(F4,D5,D7)}
[0057] (2)将结构化数据集转换为中间表示数据集;
[0058] 对结构化数据集进行重组,以流转文件标识为Key,以流转文件的投递单位和接受单位为Value进行重组,可表示为如下中间表示数据集:
[0059] {
[0060] ,[0061]
[0062] }
[0063] (3)对中间表示数据集进行重组;
[0064] (3.1)以流转文件标识为Key,将Key相同的Value值作为ValueList,构建键值对列表并按照流转Key从小到大进行排序,得到:
[0065] {,
[0066] ,
[0067]
[0068] }
[0069] (3.2)将键值对集合中文件流转过程相同的Key进行合并,合并为流转文件标识列表KeyList,得到:
[0070] {<{F1},{(D1,D2),(D2,D3),(D3,D4)}>,
[0071] <{F2},{(D2,D3),(D3,D4),(D4,D5),(D5,D6)}>,
[0072] <{F3,F4},{(D3,D5),(D5,D7)}>}
[0073] (4)将中间表示键值对集合中的ValueList转换为一个虚拟坐标集合;
[0074] 遍历中间表示键值对集合中的ValueList,将其转换为相应平行坐标轴上的虚拟坐标集合VirValueList,该集合对应平行坐标轴上面的虚拟坐标,得到:
[0075] {<{F1},{(1,D1),(2,D2),(3,D3),(4,D4)}>
[0076] <{F2},{(1,D2),(2,D3),(3,D4),(4,D5),(5,D6)}>
[0077] <{F3,F4},{(1,D3)(2,D5),(3,D7)}>}
[0078] (5)根据虚拟坐标轴集合绘制平行坐标系;
[0079] (5.1)设定平行坐标系坐标轴个数与轴距;
[0080] 根据虚拟坐标集合中VirValueList中坐标个数的最大值,即F2文件报送流程中虚拟坐标集合中坐标个数5设定平行坐标轴的个数,包括X1、X2、X3、X4、X5,然后根据对应分辨率设置平行坐标轴的轴距;
[0081] (5.2)将虚拟坐标集合映射为平行坐标系的物理坐标集合;
[0082] 将虚拟坐标集合VirValueList映射为平行坐标系的物理坐标集合。相应的物理坐标中X坐标是根据虚拟坐标集合每个坐标点的第一个分量得到平行坐标系中相对应的X轴所对应的X坐标,即Xi;相应的物理坐标中Y坐标根据虚拟坐标集合的第二个分量设定平行坐标系中在Xi轴对应的坐标点的Y坐标。以<{F1},{(1,D1),(2,D2),(3,D3),(4,D4)}>为例,得到相应的物理坐标点,如图1所示;
[0083] (5.3)画出平行坐标系之间的折线;
[0084] 遍历每个虚拟坐标集合中相应的物理坐标点,连成对应的折线,如图2所示,海量流转文件流转的平行坐标可视化结果如图3所示;
[0085] (6)对平行坐标系的报送流程进行高亮显示和过虑显示;
[0086] (6.1)根据数据特征高亮显示平行坐标系中的可视化元素;
[0087] 根据文件的报送时间段,高亮显示平行坐标系中的点与折线,以凸显这些文件在整体报送中的报送特征,如图4所示;
[0088] (6.2)根据用户输入过虑显示平行坐标系中的可视化元素;
[0089] 采取人机交互方式,筛选出接收单位是D1、D2、D3的文件报送情况,显示结果如图5所示。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用