一种基于弹簧模型优化颜色表的数据可视化方法及系统转让专利
申请号 : CN202010807016.9
文献号 : CN112052057B
文献日 : 2021-10-22
发明人 : 王晓慧 , 殷家伟 , 程博文
申请人 : 北京科技大学
摘要 :
权利要求 :
1.一种基于弹簧模型优化颜色表的数据可视化方法,其特征在于,所述方法包括利用数据样本取值及数据样本在颜色空间中的位置建立弹簧模型,利用弹簧模型优化生成颜色表并将颜色表映射至相应的数据以完成数据的可视化;
所述弹簧模型包括等比例原则的量化和数据墨水原则的量化;
将所述等比例原则具体量化为:任意相邻的两个数据样本在颜色空间中的欧式距离与两个数据样本取值的差值成正比;
将所述数据墨水原则具体量化为:任意相邻的两个数据样本在颜色空间中的实际距离与理想距离成正比;
所述方法具体包括以下步骤:
S1:获取每个数据样本取值及每个数据样本在颜色空间中的对应位置;
S2:利用等比例原则将任意相邻的两个数据样本取值和两个数据样本在颜色空间中的欧式距离量化为第一能量函数E1:其中,数据样本的取值为v1,v2,...,vn;minv是所有数据样本取值的最小值,maxv是所有数据样本取值的最大值,在LAB颜色空间中,pi是第i个数据样本在LAB颜色空间中的位置pi=(xi,yi,zi);p′i=(x′i,y′i,z′i),x′i=xi/maxx,y′i=yi/maxy,z′i=zi/maxz,maxx、maxy和maxz是颜色空间X、Y、Z轴的最大值;p′i‑p′j是两个数据样本在LAB颜色空间中的欧式距离;
利用数据墨水原则将任意相邻的两个数据样本在颜色空间中的实际距离与理想距离量化为第二能量函数E2:
其中,lij是pi和pj之间的理想距离,计算如下:设两个数据样本取值vi和vj之间的距离为dij,对于vi和vj,dij=|vi‑vj|,那么lij定义为其中L是显示区域中单条边的长度,lij是对称的,即lij=lji(i≠j);
参数kij是系统中pi和pj之间的力量强度,定义如下:其中,K为一个常数,kij是对称的,即kij=kji(i≠j),因为弹簧的张力使得系统中的任意两个粒子保持一定的距离,进而实现数据样本在颜色空间中的分布尽可能分散;
S3:利用第一能量函数和第二能量函数优化得到数据样本在颜色空间中新的对应位置,作为颜色表;
S4:将所述颜色表映射至对应的数据,完成数据的可视化;
所述S3具体包括:
S31:利用第一能量函数E1和第二能量函数E2构建系统总能量公式:E=αE1+E2;其中,α为用于平衡两部分能量权重的比例因子,0≤α≤1;
S32:基于系统总能量公式对数据样本的位置分别迭代优化,得到数据样本在颜色空间中新的对应位置,作为颜色表;
根据数据样本的不同构成,通过调节所述比例因子α控制可视化结果。
2.一种基于弹簧模型优化颜色表的数据可视化系统,其特征在于,所述系统应用如权利要求1所述的方法,包括:
数据获取模块,被配置为获取每个数据样本取值及每个数据样本在颜色空间中的对应位置;
弹簧模型建立模块,被配置为利用等比例原则将任意相邻的两个数据样本取值和两个数据样本在颜色空间中的欧式距离量化为第一能量函数E1,利用数据墨水原则将任意相邻的两个数据样本在颜色空间中的实际距离与理想距离量化为第二能量函数E2;
能量优化模块,被配置为利用第一能量函数和第二能量函数构建整体优化方程,优化得到数据样本在颜色空间中新的对应位置,作为颜色表;
可视化模块,将所述颜色表映射至对应的数据,完成数据的可视化。
3.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成如权利要求1所述的方法。
4.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成如权利要求1所述的方法。
说明书 :
一种基于弹簧模型优化颜色表的数据可视化方法及系统
技术领域
背景技术
据值映射到给定颜色表的可区分颜色值,即得到一个颜色映射函数f:D‑>C,将数据值集合D
映射到颜色集合C。
Colorgorical、ColorCAT。PRAVDAColor是针对连续数据的颜色表在线选择工具。本方面提
出的颜色表生成方法既适用于离散数据也适用于连续数据。
入数据的取值范围平均映射到颜色表内颜色的取值范围,例如彩虹颜色表。数据驱动的方
法考虑数据的属性,例如数据分布。对于非均匀分布的数据,Tominski(C.Tominski,
G.Fuchs,and H.Schumann.Task‑driven color coding.pp.373‑380,2008.)总结了数据取
值的分布,并提出颜色直方图均衡化的方法。Qiong Zeng(Q.Zeng,Y.Wang,J.Zhang,
W.Zhang,C.Tu,I.Viola,and Y.Wang.Data‑driven colormap optimization for 2d
scalar field visualization.pp.266–270,10 2019.)提出了一张非线性优化的颜色表生
成方法,用于二维标量场数据的可视化。
数量较多的中间值数据被映射为颜色表中的临近颜色,占用了较少的颜色空间,造成所展
示的数据分布无法显示细节信息。为了在渲染结果中突出占绝大多数数据的分布,本发明
基于数据分布的生成颜色表,使得渲染结果可以展现更多的数据信息。并通过均匀颜色条
的非均匀数据标注实现数据值的准确定位。本方法充分考虑数据分布特点,为不均匀分布
数据提供了更有助于查看数据分布和数据值定位的颜色表生成方法。
发明内容
数据非均匀分布的场景,有助于完成基于数据分布的模式识别任务和数据值定位任务。
弹簧模型优化生成颜色表并将颜色表映射至相应的数据以完成数据的可视化。
置pi=(xi,yi,zi);p'i=(x'i,y'i,z'i),x'i=xi/maxx,y'i=yi/maxy,z'i=zi/maxz,maxx、
maxy和maxz是颜色空间X、Y、Z轴的最大值;pi'‑p'j是两个数据样本在LAB颜色空间中的欧式
距离;
相邻的两个数据样本在颜色空间中的实际距离与理想距离量化为第二能量函数E2;
明第一方面所述的方法。
问题得到数值与颜色表的匹配,使得渲染结果可以展现更多的数据信息,并通过均匀颜色
条的非均匀数据标注实现数据值的准确定位。本方法充分考虑数据分布特点,为不均匀分
布数据提供了更有助于查看数据分布和数据值定位的颜色表生成方法。
附图说明
具体实施方式
中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附
权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
互换,以便这里描述的本公开的实施例例如能够以除了在这里图示或描述的那些以外的顺
序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例
如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些
步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它
步骤或单元。
单独存在B这三种情况。
并将颜色表映射至相应的数据以完成数据的可视化。
颜色空间,使用LAB颜色空间时,pi是第i个数据样本在LAB颜色空间中的位置pi=(xi,yi,
zi);p'i=(x'i,y'i,z'i),x'i=xi/maxx,y'i=yi/maxy,z'i=zi/maxz,maxx、maxy和maxz是颜色
空间X、Y、Z轴的最大值;p'i‑p'j是两个数据样本在LAB颜色空间中的欧式距离;
相邻的两个数据样本在颜色空间中的实际距离与理想距离量化为第二能量函数E2;
本寻找唯一的位置p1,p2,...,pn。将颜色表生成问题量化为求解颜色空间中一个动态系统
的平衡问题。本发明的步骤为:
等比例原则量化为如下函数,
颜色空间,使用LAB颜色空间时,pi是第i个数据样本在LAB颜色空间中的位置pi=(xi,yi,
zi);p'i=(x'i,y'i,z'i),x'i=xi/maxx,y'i=yi/maxy,z'i=zi/maxz,maxx、maxy和maxz是颜色
空间X、Y、Z轴的最大值;p'i‑p'j是两个数据样本在LAB颜色空间中的欧式距离。
可能分散,让数据样本占用尽可能多的颜色。将LAB颜色空间中n个数据样本相互连接,像弹
簧一样。优化的目标是让n个数据样本在弹性系统中达到动态平衡。E2为该系统中的弹簧势
能:
样本,继续进行调整,直至所有数据样本的最大位移量都小于阈值。这样,每一个数据样本
都在颜色空间中确定了唯一的位置,即每个数据都确定了唯一的颜色。
数值分布是均匀的,颜色排列也是均匀的,将样本的取值范围与颜色列表一一对应,没有考
虑样本的分布特点(即每个取值的数量是多少),使得占比例较大的取值范围,如34度至41
度之间,都被编码为相同颜色(如非洲和美洲部分),无法看出数据分布的细节;如图3(b)所
示,当采用本申请所述的基于弹簧模型优化的颜色表进行可视化时,其生成的颜色表数值
分布是非均匀的,颜色排列是均匀的,根据数据样本分布特点建立了每个样本与颜色的对
应关系,使得占比例较大的取值范围,如34度至41度之间,被编码为更多颜色,可以看出数
据分布的细节。因此,本申请能够获取更多的细节信息,让用户深入挖掘数据背后的模式,
在数据分布的呈现上具有显著优势。
到3之间;如图4(a)所示,采用直方图均衡化方法生成的颜色表数值分布是均匀的,颜色排
列是非均匀的;如图4(b)所示,采用本申请所述的基于弹簧模型优化的颜色表生成的颜色
表,数据分布是非均匀的,颜色排列是均匀的。由于直方图均衡化方法压缩了颜色表,使得
无法精确的判断0.2和1所对应的颜色,因此无法在可视化结果中准确定位到这两个数值。
本申请所述的颜色表能够根据每个取值的样本数来排列数据,使得用户更容易进行数据值
定位,无需查阅原始数据。
且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有
的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该
要素的过程、方法、物品或者装置中还存在另外的相同要素。
者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出
贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如
ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空
调器,或者网络设备等)执行本发明各个实施例所述的方法。
在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多
形式,这些均属于本发明的保护之内。