针对多维整值型数据集的平行坐标改进方法转让专利

申请号 : CN201810131947.4

文献号 : CN108319715B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈红倩程中娟

申请人 : 北京工商大学

摘要 :

本发明涉及一种针对多维整值型数据集的平行坐标改进方法,属于计算机图形学与可视化技术领域。实现步骤为:针对数据集中的每一个整值型数据维统计其数据值的种类数;统计不同数据值在数据集中的占比,并以此建立分段坐标轴,通过坐标轴分段的高度比例展现数据值的占比;针对数据集中的每一条记录,通过偏移映射方法在可视化映射过程中不断更新偏移值,从而使不同记录的整值在坐标轴上映射为不同高度,从而解决同点映射问题;本发明可直观的获得各数据维中各数据值的记录数占比情况,并可快速分析各维数据间的关联关系和关联强度,提高了针对多维整值型数据集的可视分析能力。

权利要求 :

1.针对多维整值型数据集的平行坐标改进方法,包含如下步骤:

步骤1:针对数据集中的每一个整值型数据维统计其数据值的种类数,并计算各数据值的占比;

针对其中一个整值型数据维Di的计算方法如下:

步骤1.1:将整值型数据维Di的所有数据,提取为一个向量Vi,假如数据集中的数据记录数为T,则Vi向量的分量数据个数为T;

步骤1.2:统计Vi向量中数据值的种类个数NVi;

步骤1.3:统计Vi向量中各数据值的记录数,按照记录数由多到少进行排序,将Vi向量中的各数据值,根据记录数由多到少的顺序,转换数据值为1至NVi,命名转换值为j的数据值为Vij,命名整值型数据维Di中满足Vi=Vij的记录数为NVij;

将Vi向量中的各数据值的转换后的数据值称为“转换值”,Vi向量中各数据值的转换值取值范围为1至NVi;

步骤1.4:计算Vi向量中各数据值对应的记录占比;

步骤2:根据数据集中的所有整值型数据维的数据分布建立坐标轴,假如数据集中同时存在非整值型数据维,则非整值型数据维对应的坐标轴建立方法保持传统方法不变;

针对整值型数据维Di对应的坐标轴建立方法为:

将坐标轴划分为NVi个分段,每个分段称为“坐标轴分段”,每个坐标轴分段对应整值型数据维Di中的一种数据值,各坐标轴分段的高度与对应数据值的所占比例相关;

坐标轴中各分段信息的计算方法为:

步骤2.1:根据最终可视化结果中“平行坐标系”中坐标轴的高度,计算各数据值对应的“坐标轴分段”高度Hij;

步骤2.2:计算各“坐标轴分段”的起始高度Hstartij和结束高度Hendij;

步骤3:针对所有整值型数据维对应坐标轴的每一个“坐标轴分段”计算一条数据记录的偏移高度,将整值型数据维Di中转换值为j的坐标轴分段的一条数据记录的偏移高度命名为Iij;

步骤4:根据步骤3中建立的坐标轴的相邻关系,计算所有“整值型数据维对应坐标轴”的数据值映射基础数据;

具体计算方法分为两种情况:一种是左侧相邻坐标轴对应的数据维为整值型数据维,该种情况下继续执行步骤5;另一种是左侧相邻坐标轴对应的数据维为非整值型数据维或当前数据维对应的坐标轴为最左侧坐标轴,该种情况下跳转至步骤6;

步骤5:本步骤是针对左侧相邻坐标轴对应的数据维为数值型数据维的情况下,数据值映射基础数据的计算方法;

针对当前整值型数据维Di对应的坐标轴,计算数据值映射基础数据步骤如下:步骤5.1:设定当前“整值型数据维Di”坐标轴左侧“相邻坐标轴”所对应的为整值型数据维Du、该整值型数据维Du所提取的向量为Vu、向量Vu中数据值的种类数为NVu,其中NVu可根据步骤1.2的方法计算得出;

步骤5.2:统计整值型数据维Du与整值型数据维Di的交叉记录数,针对整值型数据维Du的每一个转换值p和整值型数据维Di的每一个转换值q,将数据集中符合条件“Du维转换值为p”且“Di维转换值为q”的记录数命名为步骤5.3:根据向量Vu中数据值的种类数NVu,将当前坐标轴中数据值Viq所对应的坐标轴分段划分为NVu个“坐标轴子分段”;

步骤5.4:计算当前坐标轴中所有坐标轴子分段的高度,将整值型数据维Du转换值为p且整值型数据维Di转换值为q对应的坐标轴子分段的高度命名为步骤5.5:计算当前坐标轴中所有坐标轴子分段的起始高度,将整值型数据维Du转换值为p且整值型数据维Di转换值为q对应的坐标轴子分段的起始高度记为步骤5.6:为当前坐标轴的每个“坐标轴子分段”设置该坐标轴子分段的“下一映射高度”,初始值赋值为该坐标轴子分段的起始高度;

步骤6:本步骤是针对整值型数据维Di左侧相邻坐标轴为非整值型数据维或整值型数据维Di为最左侧数据维对应的坐标轴的情况下,数据值映射基础数据的计算方法;

针对整值型数据维Di转换值为q对应的“坐标轴分段”的下一映射高度Hnextiq的初始值赋值为该坐标轴分段的Hstartiq,Hstartiq即为根据步骤2.2得出的数据值Viq对应的坐标轴分段的起始高度;

步骤7:针对数据集中的每一条记录,计算其各维数据值在其对应坐标轴上的映射高度;

针对每一条记录,假如当前数据维为非整值型数据维,则使用传统方法计算其数据值在其对应坐标轴上的映射高度;

假如当前数据维为整值型数据维,且对应的坐标轴左侧相邻的坐标轴为整值型数据维坐标轴,则继续执行步骤7.1;

假如当前数据维为整值型数据维,且对应的坐标轴为最左侧坐标轴或左侧相邻坐标轴为非整值型数据维,则继续执行步骤7.3;

步骤7.1:针对左侧的整值型数据维Du转换值为p且当前整值型数据维Di转换值为q的数据记录,在步骤5中获取其所对应的坐标轴子分段的下一映射高度 即为该条数据在整值型数据维Di对应的坐标轴上的映射高度;

步骤7.2:根据当前记录在整值型数据维Di的转换值q,在步骤3中获取对应的“坐标轴分段”的一条记录偏移高度Iiq,更新跳转至步骤8;

步骤7.3:针对当前整值型数据维Di转换值为q的数据记录,在步骤6中得到的Viq对应的坐标轴子分段的下一映射高度Hnextiq,Hnextiq即为该条数据在数据维Di对应的坐标轴上的映射高度;

步骤7.4:根据当前记录在整值型数据维Di的转换值q,在步骤3中获取对应的“坐标轴分段”的一条记录偏移高度Iiq,更新Hnextiq=Hnextiq+Iiq;

步骤8:为区分整值型数据维对应坐标轴中的各坐标轴分段,可为各坐标轴分段设置不同的纹理,纹理的选择可使用具有区分性的颜色或底纹;

步骤9:根据步骤1至步骤8中得出的坐标轴信息、所有记录的映射高度及各坐标轴分段纹理,绘制当前数据集的改进后的平行坐标可视化结果。

说明书 :

针对多维整值型数据集的平行坐标改进方法

技术领域

[0001] 本发明涉及针对多维整值型数据集的平行坐标改进方法,属于计算机图形学与可视化技术领域。技术背景
[0002] “整值型数据”是在数据集中的一种常见的内容,整值型数据是如性别(男、女)、地区(省、市)、农药毒性(剧毒、高毒、中毒、低毒)等形式的类别数据,其在进行数值化转换从而用于数据分析时,常被转换为离散的整值型数据,而非连续型数据。
[0003] 平行坐标方法是针对多维数据分析常用的可视化方法,但其面对多维整值型数据时,会造成很多困扰,如在平行坐标可视化方法中,整值型数据中的同一数值在可视化映射过程中会在坐标轴上映射于同一位置(本发明中称为同点映射),造成可视化结果无法反映数据的分布、数量信息,以及类别数据间的关联强度等信息,从而很大程度的降低了交叉关联分析的有效性。
[0004] 本发明针对多维整值型数据集提出了一种平行坐标可视化方法的改进方案,将“分段坐标轴”的理念引入到平行坐标系的坐标轴中,并通过提出“偏移映射”的方法使得整值型数据中的不同记录即便数据值相同其在坐标轴的映射位置也不同,从而解决“同点映射”问题,以此提高多维整值型数据集或包含整值型数据维的数据集的分析能力和分析效率。
[0005] 从可视化方法来说,本发明中提出的针对多维整值型数据集的平行坐标改进方法,在已公开的文献中,还未发现同类技术。

发明内容

[0006] 本发明的目的是针对多维整值型数据集或包含整值型数据维的数据集,提出一种平行坐标改进方法,包含如下步骤:
[0007] 步骤1:针对数据集中的每一个整值型数据维统计其数据值的种类数,并计算各数据值的占比。
[0008] 针对其中一个整值型数据维(设定为Di)的计算方法如下:
[0009] 步骤1.1:将整值型数据维Di的所有数据,提取为一个向量(表示为Vi)。假如数据集中的数据记录数为T,则Vi向量的分量数据个数为T。
[0010] 步骤1.2:统计Vi向量中数据值的种类个数(表示为NVi)。
[0011] 步骤1.3:统计Vi向量中各数据值的记录数,按照记录数由多到少进行排序。将Vi向量中的各数据值,根据记录数由多到少的顺序,转换数据值为1至NVi,命名转换值为j的数据值为Vij,命名数据维Di中满足Vi=Vij的记录数为NVij。
[0012] 本发明中将Vi向量中的各数据值的转换后的数据值称为“转换值”,Vi向量中各数据值的转换值取值范围为1至NVi。
[0013] 步骤1.4:计算Vi向量中各数据值对应的记录占比。满足Vi=Vij的记录占比Rij计算方法如公式(1):
[0014]
[0015] 其中T为步骤1.1所述的数据集中的所有记录数。
[0016] 步骤2:根据数据集中的所有整值型数据维的数据分布,建立坐标轴。假如数据集中同时存在非整值型数据维,则非整值型数据维对应的坐标轴建立方法保持传统方法不变。
[0017] 针对整值型数据维Di对应的坐标轴建立方法为:
[0018] 将坐标轴划分为NVi个分段,每个分段(称为坐标轴分段)对应数据维Di中的一种数据值,各坐标轴分段的高度与对应数据值的所占比例相关。通过本方法所建立的“整值型数据维”所对应的坐标轴,由不同种类的数据值对应的坐标轴分段组成,这种坐标轴在本发明中称为“分段坐标轴”。
[0019] 坐标轴中各分段信息的计算方法为:
[0020] 步骤2.1:根据最终可视化结果中“平行坐标系”中坐标轴的高度(表示为height),计算各数据值对应的“分段坐标轴”高度。
[0021] 以整值型数据维Di为例,数据值Vij对应的坐标轴分段高度计算方法如公式(2):
[0022] Hij=height*Rij    (2)
[0023] 其中Rij为根据步骤1.4得出的满足Vi=Vij的记录占比。
[0024] 步骤2.2:计算各“分段坐标轴”的起始高度和结束高度。以数据值Vij对应的“分段坐标轴”为例,其起始高度的计算方法如公式(3):
[0025]
[0026] 结束高度的计算方法如公式(4):
[0027]
[0028] 步骤3:针对所有整值型数据维对应坐标轴的每一个“坐标轴分段”,计算一条数据记录的偏移高度。以数据值Vij对应的“坐标轴分段”为例,一条记录的偏移高度的计算方法如公式(5):
[0029]
[0030] 其中Hij为步骤2.1得出的数据值Vij对应的坐标轴分段高度,NVij为根据步骤1.3得出的满足Vi=Vij的记录数。
[0031] 步骤4:根据步骤3中建立的坐标轴的相邻关系,计算所有“整值型数据维对应坐标轴”的数据值映射基础数据。
[0032] 本发明针对整值型数据维中不同记录中的同一数据值,映射不同的高度,从而解决“同点映射”的问题,并有效降低连线的交叉。在本发明中该映射方法命名为“偏移映射”方法。
[0033] 在偏移映射方法中,数据值的映射高度取决于两个因素。一是本条记录在数据集中的顺序,二是本条记录的其他维数据值在左侧相邻坐标轴的映射高度(当前数据维对应坐标轴为最左侧坐标轴则不考虑本因素)。
[0034] 具体映射方法分为两种情况:一种是左侧相邻坐标轴对应的数据维为整值型数据维,该种情况下继续执行步骤5;另一种是左侧相邻坐标轴对应的数据维为非整值型数据维或当前数据维对应的坐标轴为最左侧坐标轴,该种情况下跳转至步骤6。
[0035] 步骤5:本步骤是针对左侧相邻坐标轴对应的数据维为数值型数据维的情况下,数据值映射基础数据计算。
[0036] 针对当前坐标轴,计算数据值映射基础数据步骤如下:
[0037] 步骤5.1:设定当前“整值型数据维”坐标轴左侧“相邻坐标轴”所对应的为整值型数据维Du,设定该整值型数据维所提取的向量为Vu,向量Vu中数据值的种类数为NVu(NVu可根据步骤1.2计算得出)。
[0038] 步骤5.2:统计整值型数据维Du与Di的交叉记录数,即针对任一Vu的转换值p和Vi的转换值q,统计满足Vu=Vup且Vi=Viq的记录数,命名该记录数为 其中Vup为转换值p对应的Vu中的数据值,Viq为转换值q对应的Vi中的数据值。
[0039] 步骤5.3:根据向量Vu中数据值的种类数NVu,将当前坐标轴中数据值Viq所对应的坐标轴分段划分为NVu个“坐标轴子分段”。
[0040] 步骤5.4:计算当前坐标轴中,所有坐标轴子分段的高度。
[0041] 以Vu=Vup且Vi=Viq为例,其所对应的坐标轴子分段的高度 计算方法如公式(6):
[0042]
[0043] 其中NViq为根据步骤1.3得出的满足Vi=Viq的的记录数,Hiq为根据步骤2.1得出的Vi=Viq对应的坐标轴分段高度, 为根据步骤5.2得出的满足Vu=Vup且Vi=Viq的记录数。
[0044] 步骤5.5:计算当前坐标轴中,所有坐标轴子分段的起始高度。
[0045] 以Vu=Vup且Vi=Viq为例,其所对应的坐标轴子分段的起始高度记为 计算方法如公式(7):
[0046]
[0047] 其中Hstartiq为根据步骤2.2得出的数据值Viq对应的坐标轴分段的起始高度,为根据步骤5.4得出的满足Vu=Vuk且Vi=Viq的坐标轴子分段的高度。
[0048] 步骤5.6:为当前坐标轴的每个“坐标轴子分段”设置该“坐标轴子分段”的“下一映射高度”。
[0049] 以Vu=Vup且Vi=Viq为例,其所对应的坐标轴子分段的下一映射高度 的初始值赋值为其所在的坐标轴分段起始高度
[0050] 跳转至步骤7。
[0051] 步骤6:本步骤是针对左侧相邻坐标轴为非整值型数据维或当前数据维为最左侧数据维对应的坐标轴的情况下,数据值映射基础数据计算。
[0052] 由于左侧不存在整值型数据维对应的坐标轴,则当前坐标轴的分段无需继续分为坐标轴子分段,直接设置所有坐标轴分段的“下一映射高度”即可。
[0053] 以Vi=Viq为例,其对应坐标轴分段的下一映射高度Hnextiq的初始值赋值为相应的Hstartiq,即为根据步骤2.2得出的数据值Viq对应的坐标轴分段的起始高度。
[0054] 步骤7:针对数据集中的每一条记录,计算其各维数据值在其对应坐标轴上的映射高度。
[0055] 针对每一条记录,假如当前数据维为非整值型数据维,则使用传统方法计算其数据值在其对应坐标轴上的映射高度;
[0056] 假如当前数据维为整值型数据维,且对应的坐标轴左侧相邻的坐标轴为整值型数据维坐标轴,则继续执行步骤7.1;
[0057] 假如当前数据维为整值型数据维,且对应的坐标轴为最左侧坐标轴或左侧相邻坐标轴为非整值型数据维,则继续执行步骤7.3。
[0058] 步骤7.1:以整值型数据维Di中的数据值Vi=Viq为例,在其左侧坐标轴对应的数据维向量(命名为Vu)中获取该条记录的数据值(命名为Vup),即该条记录满足Vu=Vup且Vi=Viq。
[0059] 根据Vu=Vup且Vi=Viq,在步骤5中获取其所对应的坐标轴子分段的下一映射高度即为该条数据在数据维Di对应的坐标轴上的映射高度。
[0060] 步骤7.2:根据Vi=Viq,在步骤3中获取数据值Viq对应的“坐标轴分段”的一条记录偏移高度Iiq,更新 如公式(8),
[0061]
[0062] 跳转至步骤8。
[0063] 步骤7.3:以整值型数据维Di中的数据值Vi=Viq为例,在步骤6中得到的Viq对应的坐标轴子分段的下一映射高度Hnextiq,Hnextiq即为该条数据在数据维Di对应的坐标轴上的映射高度。
[0064] 步骤7.4:根据Vi=Viq,在步骤3中获取数据值Viq对应的“坐标轴分段”的一条记录偏移高度Iiq,更新Hnextiq如公式(9),
[0065] Hnextiq=Hnextiq+Iiq       (9)
[0066] 步骤8:为区分整值型数据维对应坐标轴中的各坐标轴分段,可为各坐标轴分段设置不同的纹理,纹理的选择可使用具有区分性的颜色或底纹。
[0067] 步骤9:根据步骤1至步骤8中得出的坐标轴信息、所有记录的映射高度及各坐标轴分段纹理,绘制当前数据集的改进后的平行坐标可视化结果。
[0068] 有益效果
[0069] 通过本发明中提出的平行坐标改进方法,可通过坐标轴中各分段的高度比例,直观的获得各数据维中各数据值的记录数占比情况;在数据筛选交互过程中,可快速得出各维数据间的关联关系和关联强度;提高了针对多维整值型数据集的可视分析能力。

附图说明

[0070] 附图1为本发明具体实施方式中针对多维整值型数据集的平行坐标改进方法的实现流程图;
[0071] 附图2为本发明提出的针对多维整值型数据集的平行坐标改进方法,应用于一个农残检测结果数据集(已脱敏脱密)的可视化效果。
[0072] 附图3为基于附图2可视化结果的交互筛选后可视化结果。

具体实施方式

[0073] 下面结合附图和实施例,对本发明作进一步的说明。
[0074] 以农残检测结果数据集为例,数据维度包括(地区,年,月,农产品,农药),数据记录数共1241条,其中前10条数据记录如表1所示。
[0075] 表1 农残检测结果数据集示例数据
[0076]
[0077] 将原始数据进行整值型数据转换后,如表2所示。
[0078] 表2 农残检测结果数据集示例数据转化为整值型数据集
[0079]
[0080] 本实施例中的针对多维整值型数据集的平行坐标改进方法的实现流程图如附图1所示,结合该农残检测结果数据集,描述本发明的具体操作过程如下:
[0081] 步骤1:针对数据集中的每一个整值型数据维统计其数据值的种类数,并计算各数据值的占比。
[0082] 针对其中一个整值型数据维“月”(设定为D3)的计算方法如下:
[0083] 步骤1.1:将整值型数据维D3的所有数据,提取为一个向量(表示为V3),V3=(11,3,1,...,2,1)。数据集中数据记录数为T=1241,则V3向量的分量数据个数为T=1241。
[0084] 步骤1.2:数据维D3向量V3=(11,3,1,...,2,1)中数据值种类个数NV3=9。
[0085] 步骤1.3:统计V3向量中各数据值的记录数,按照记录数由多到少进行排序。将V3向量中的各数据值,根据记录数由多到少的顺序,转换数据值为1至NV3(NV3=9,由步骤1.2计算得出),转换值为1的数据值为2月(命名为V3,1),数据维D3中满足V3=V3,1的记录数为NV3,1=283。
[0086] 本发明中将V3向量中的各数据值的转换后的数据值称为“转换值”,V3向量中各数据值的转换值取值范围为1至NV3(由步骤1.2计算得出)。
[0087] 步骤1.4:计算V3=(11,3,1,...,2,1)向量中各数据值对应的记录占比。满足V3=V3,1的记录占比R3,1,根据公式(1)计算得到R3,1的计算方法如公式(10):
[0088]
[0089] 其中T=1241为步骤1.1所述的数据集中的所有记录数。
[0090] 步骤2:数据集中的所有整值型数据维的数据分布,建立坐标轴。假如数据集中同时存在非整值型数据维,则非整值型数据维对应的坐标轴建立方法保持传统方法不变。
[0091] 针对整值型数据维D3对应的坐标轴建立方法为:
[0092] 将坐标轴划分为NV3个分段,每个分段(称为坐标轴分段)对应数据维D3中的一种数据值,各坐标轴分段的高度与对应数据值的所占比例相关。通过本方法所建立的“整值型数据维”所对应的坐标轴,由不同种类的数据值对应的坐标轴分段组成,这种坐标轴在本发明中称为“分段坐标轴”。
[0093] 坐标轴中各分段信息的计算方法为:
[0094] 根据步骤2.1:根据最终可视化结果中“平行坐标系”中坐标轴的高度(表示为height=520),计算各数据值对应的“分段坐标轴”高度。
[0095] 以整值型数据维D3为例,根据公式(2)计算得到数据值V3,1对应的坐标轴分段高度的计算方法如公式(11):
[0096]
[0097] 其中R3,1为根据步骤1.4得出的满足V3=V3,1的记录占比。
[0098] 步骤2.2:计算各“分段坐标轴”的起始高度和结束高度。以数据值V3,1对应的“分段坐标轴”为例,根据公式(3)计算得到其起始高度的计算方法如公式(12):
[0099] Hstart3,1=0(j=1)    (12)
[0100] 根据公式(4)计算得到其结束高度的计算方法如公式(13):
[0101]
[0102] 根据步骤3:针对所有整值型数据维对应坐标轴的每一个“坐标轴分段”,计算一条数据记录的偏移高度。以数据值V3,1对应的“坐标轴分段”为例,根据公式(5)计算得到一条记录的偏移高度的计算方法如公式(14):
[0103]
[0104] 其中 为步骤2.1得出的数据值V3,1对应的坐标轴分段高度,NV3,1为根据步骤1.3得出的满足V3=V3,1的记录数。
[0105] 步骤4:根据步骤3中建立的坐标轴的相邻关系,计算所有“整值型数据维对应坐标轴”的数据值映射基础数据。
[0106] 本发明针对整值型数据维中不同记录中的同一数据值,映射不同的高度,从而解决“同点映射”的问题,并有效降低连线的交叉。在本发明中该映射方法命名为“偏移映射”方法。
[0107] 在偏移映射方法中,数据值的映射高度取决于两个因素。一是本条记录在数据集中的顺序,二是本条记录的其他维数据值在左侧相邻坐标轴的映射高度(当前数据维对应坐标轴为最左侧坐标轴则不考虑本因素)。
[0108] 具体映射方法分为两种情况:一种是左侧相邻坐标轴对应的数据维为整值型数据维,该种情况下继续执行步骤5;另一种是左侧相邻坐标轴对应的数据维为非整值型数据维或当前数据维对应的坐标轴为最左侧坐标轴,该种情况下跳转至步骤6。
[0109] 步骤5:本步骤是针对左侧相邻坐标轴对应的数据维为数值型数据维的情况下,数据值映射基础数据计算。
[0110] 针对当前坐标轴,计算整值型数据维上的每一条记录的映射高度步骤如下:
[0111] 步骤5.1:设定当前“整值型数据维”坐标轴左侧“相邻坐标轴”所对应的为整值型数据维D2,设定该整值型数据维所提取的向量为V2,向量V2中数据值的种类数为NV2=3(NV2可根据步骤1.2计算得出)。
[0112] 步骤5.2:统计整值型数据维D2与D3的交叉记录数,即针对任一V2的转换值p=1和V3的转换值q=1,统计满足V2=V2,1且V3=V3,1的记录数(命名为 该记录数其中V2,1为转换值p=1对应的V2中的数据值,V3,1为转换值q=1对应的V3中的数据值。
[0113] 步骤5.3:根据向量V2中数据值的种类数NV2=3,将当前坐标轴中数据值V3,1所对应的坐标轴分段划分为NV2=3个“坐标轴子分段”。
[0114] 步骤5.4:计算当前坐标轴中,所有坐标轴子分段的高度。
[0115] 以V2=V2,1且V3=V3,1为例,根据公式(6)其所对应的坐标轴子分段的高度 的计算方法如公式(15):
[0116]
[0117] 其中NV3,1为根据步骤1.3得出的满足V3=V3,1的的记录数,H3,1为根据步骤2.1得出的V3=V3,1对应的坐标轴分段高度, 为根据步骤5.2得出的满足V2=V2,1且V3=V3,1的记录数。
[0118] 步骤5.5:计算当前坐标轴中,所有坐标轴子分段的起始高度。
[0119] 以V2=V2,1且V3=V3,1为例,根据公式(7)计算得出其所对应的坐标轴子分段的起始高度 计算方法如公式(16):
[0120]
[0121] 其中Hstart3,1为根据步骤2.2得出的数据值V3,1对应的坐标轴分段的起始高度。
[0122] 步骤5.6:为当前坐标轴的每个“坐标轴子分段”设置该“坐标轴子分段”的“下一映射高度”。
[0123] 以V2=V2,1且V3=V3,1为例,其所对应的坐标轴子分段的下一映射高度 的初始值赋值为其所在的坐标轴分段起始高度
[0124] 跳转至步骤7。
[0125] 步骤6:本步骤是针对左侧相邻坐标轴为非整值型数据维或当前数据维为最左侧数据维对应的坐标轴的情况下,数据值映射基础数据计算。
[0126] 由于左侧不存在整值型数据维对应的坐标轴,则当前坐标轴的分段无需继续分为坐标轴子分段,直接设置所有坐标轴分段的“下一映射高度”即可。
[0127] 以V1=V1,1为例,其对应坐标轴分段的下一映射高度Hnext1,1的初始值赋值为相应的Hstart1,1=0,即为根据步骤2.2得出的数据值V1,1对应的坐标轴分段的起始高度。
[0128] 步骤7:针对数据集中的每一条记录,计算其各维数据值在其对应坐标轴上的映射高度。
[0129] 针对每一条记录,假如当前数据维为非整值型数据维,则使用传统方法计算其数据值在其对应坐标轴上的映射高度;
[0130] 假如当前数据维为整值型数据维,且对应的坐标轴左侧相邻的坐标轴为整值型数据维坐标轴,则继续执行步骤7.1;
[0131] 假如当前数据维为整值型数据维,且对应的坐标轴为最左侧坐标轴或左侧相邻坐标轴为非整值型数据维,则继续执行步骤7.3。
[0132] 步骤7.1:以整值型数据维D3中的数据值V3=V3,1为例,在其左侧坐标轴对应的数据维向量(命名为V2)中获取该条记录的数据值(命名为V2,1),即该条记录满足V2=V2,1且V3=V3,1。
[0133] 根据V2=V2,1且V3=V3,1,在步骤5中获取其所对应的坐标轴子分段的下一映射高度即为该条数据在数据维D3对应的坐标轴上的映射高度。
[0134] 步骤7.2:根据V3=V3,1,在步骤3中获取数据值V3,1对应的“坐标轴分段”的一条记录偏移高度I3,1,更新 根据如公式(8)计算得出 计算公式如(17):
[0135]
[0136] 跳转至步骤8。
[0137] 步骤7.3:以整值型数据维D3中的数据值V3=V3,1为例,在步骤6中得到的V3,1对应的坐标轴子分段的下一映射高度Hnext3,1,Hnext3,1即为该条数据在数据维D3对应的坐标轴上的映射高度。
[0138] 步骤7.4:根据V3=V3,1,在步骤3中获取数据值V3,1对应的“坐标轴分段”的一条记录偏移高度I3,1,根据公式(9)更新Hnext3,1。
[0139] 步骤8:为区分整值型数据维对应坐标轴中的各坐标轴分段,可为各坐标轴分段设置不同的纹理,纹理的选择可使用具有区分性的颜色或底纹。
[0140] 本发明中,选择斜条纹和交叉条纹作为坐标轴分段纹理。
[0141] 步骤9:根据步骤1至步骤8中得出的坐标轴信息、所有记录的映射高度及各坐标轴分段纹理,绘制当前数据集的改进后的平行坐标可视化结果。
[0142] 附图2为本发明提出的针对多维整值型数据集的平行坐标改进方法,应用于一个农残检测结果数据集(已脱敏脱密)的可视化效果。从该可视化结果中,能够对农残检测数据集实例数据进行多维度对比可视分析结论包括:
[0143] (1)在平行坐标绘制过程中应用本发明方法后,每个坐标轴被分成多段,每一段的高度代表该段数据值的数据记录数,实现数据记录数的对比。在“地区”维度中,朝阳区的数据记录数是最多的,房山区的数据记录数是最少的。在“年”维度中,2012年的数据记录数最多,其次是2014年,最后是2013年。在“月”维度中二月份的数据记录数最多,七月份的数据记录数最少。在“日”维度中五号的录数最多,十八号的记录数最少。在“农产品”维度中黄瓜的记录数最多,桃的记录数最少。在“农药”维度中,无检出农药最多,说明大部分农产品中的农药使用是符合标准的。
[0144] (2)可以通过调整坐标轴顺序实现每两个坐标轴之间的关联关系分析。“年”维度可以分析与“地区”维度的关联关系,也可以分析和“月”维度的关联关系,也可以分析与“日”维度的关联关系。
[0145] 本发明中可以通过筛选不同维度的数据值,分析不同维度的数据值在其它维度的各数据值中的分布情况。附图3为基于附图2可视化结果筛选朝阳区的数据可视化结果,地区维度中数据值为“朝阳区”的数据记录显示,其余不显示。从筛选后的可视化结果可得分析结论为:在“年”维度中,数据记录数分布在2012年中最多,2014和2013的分布情况大致相同;在“月”维度中,数据记录数分布在十月的数量最多,九月的数据记录数最少;在“日”维度中,10号的数据记录数最多,14号的数据记录数最少。