一种基于HDFS的磁盘定位方法、装置、设备及介质转让专利

申请号 : CN201910156422.0

文献号 : CN109918354B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 何建军

申请人 : 浪潮商用机器有限公司

摘要 :

本发明公开了一种基于HDFS的磁盘定位方法、装置、设备及介质。该方法的步骤包括:获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件;根据关系文件中的映射关系生成对应的可视化分布图,以供系统维护人员根据可视化分布图定位各磁盘;其中,可视化分布图中以图形化方式记录有磁盘与服务器之间的挂载关系。本方法通过可视化分布图记录磁盘所在的服务器,系统维护人员能够通过可视化分布图更加直观的获悉磁盘与服务器间关系,进而能够相对高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,从而保证了HDFS的整体工作效率。此外,本发明还提供一种基于HDFS的磁盘定位装置、设备及介质,有益效果同上所述。

权利要求 :

1.一种基于HDFS的磁盘定位方法,其特征在于,包括:

获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件,所述服务器为构成HDFS的设备节点,磁盘与服务器之间映射关系是指服务器与服务器所挂载的磁盘之间的对应关系;

根据所述关系文件中的映射关系生成对应的可视化分布图,以供系统维护人员根据所述可视化分布图定位各所述磁盘;其中,所述可视化分布图中以图形化方式记录有所述磁盘与所述服务器之间的挂载关系;

所述获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件包括:获取包含有所述映射关系的JSON格式的所述关系文件,具体通过分析所述HDFS的操作系统信息以获取包含有所述映射关系的JSON格式的所述关系文件,所述HDFS的操作系统信息记录有数据读写过程中服务器与磁盘之间交互时的数据流动方向。

2.根据权利要求1所述的方法,其特征在于,所述关系文件中还包含有所述服务器与机柜之间的映射关系,以及所述机柜与机房之间的映射关系;

相应的,所述可视化分布图中还以图形化方式记录有所述服务器与所述机柜之间的放置关系,以及所述机柜与所述机房之间的放置关系。

3.根据权利要求1至2任意一项所述的方法,其特征在于,该方法进一步包括:当存在工作状态异常的目标磁盘时,以高亮度显示的方式将所述目标磁盘显示于所述可视化分布图。

4.一种基于HDFS的磁盘定位装置,其特征在于,包括:

关系文件获取模块,用于获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件,所述服务器为构成HDFS的设备节点,磁盘与服务器之间映射关系是指服务器与服务器所挂载的磁盘之间的对应关系;

分布图生成模块,用于根据所述关系文件中的映射关系生成对应的可视化分布图,以供系统维护人员根据所述可视化分布图定位各所述磁盘;其中,所述可视化分布图中以图形化方式记录有所述磁盘与所述服务器之间的挂载关系;

所述获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件包括:获取包含有所述映射关系的JSON格式的所述关系文件,具体通过分析所述HDFS的操作系统信息以获取包含有所述映射关系的JSON格式的所述关系文件,所述HDFS的操作系统信息记录有数据读写过程中服务器与磁盘之间交互时的数据流动方向。

5.一种基于HDFS的磁盘定位设备,其特征在于,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如权利要求1至3任一项所述的基于HDFS的磁盘定位方法的步骤。

6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的基于HDFS的磁盘定位方法的步骤。

说明书 :

一种基于HDFS的磁盘定位方法、装置、设备及介质

技术领域

[0001] 本发明涉及大数据领域,特别是涉及一种基于HDFS的磁盘定位方法、装置、设备及介质。

背景技术

[0002] 随着计算机的普及和互联网技术的发展,数据文件正在海量且迅速地增长,这些数据文件通常被保存于计算机存储系统中以便用户对数据文件进行检索、分析。
[0003] 为了利用开源技术拓展性高的这一优势并且降低存储设备的费用,越来越多的企业和政府机构在低成本商用硬件上,基于Hadoop分布式文件系统HDFS(Hadoop Distributed File System)构建具有高容错、高吞吐特性的海量数据存储系统。然而,由于集群规模庞大和硬件本身的可靠性原因,集群中的服务器节点经常由于硬件故障需要停机维护。为了保证数据完整性和集群可用性,系统维护人员通常都是在HDFS报告磁盘故障的情况下对出现故障的磁盘进行诊断和更换,但是由于一台服务器中往往挂载多个磁盘,并且构成HDFS的服务器节点的整体数量也往往较多,因此当前系统维护人员在获悉到构成HDFS的某一磁盘出现异常时,难以高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,进而无法对异常磁盘进行及时的维护,难以确保HDFS的整体工作效率。
[0004] 由此可见,提供一种基于HDFS的磁盘定位方法,以实现系统维护人员相对高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,进而能够对异常磁盘进行及时的维护,从而确保HDFS的整体工作效率,是本领域技术人员亟待解决的问题。

发明内容

[0005] 本发明的目的是提供一种基于HDFS的磁盘定位方法、装置、设备及介质,以实现系统维护人员相对高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,进而能够对异常磁盘进行及时的维护,从而确保HDFS的整体工作效率。
[0006] 为解决上述技术问题,本发明提供一种基于HDFS的磁盘定位方法,包括:
[0007] 获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件;
[0008] 根据关系文件中的映射关系生成对应的可视化分布图,以供系统维护人员根据可视化分布图定位各磁盘;其中,可视化分布图中以图形化方式记录有磁盘与服务器之间的挂载关系。
[0009] 优选的,关系文件中还包含有服务器与机柜之间的映射关系,以及机柜与机房之间的映射关系;
[0010] 相应的,可视化分布图中还以图形化方式记录有服务器与机柜之间的放置关系,以及机柜与机房之间的放置关系。
[0011] 优选的,获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件包括:
[0012] 获取包含有映射关系的JSON格式的关系文件。
[0013] 优选的,获取包含有映射关系的JSON格式的关系文件包括:
[0014] 通过分析HDFS的操作系统信息以获取包含有映射关系的JSON格式的关系文件。
[0015] 优选的,该方法进一步包括:
[0016] 当存在工作状态异常的目标磁盘时,以高亮度显示的方式将目标磁盘显示于可视化分布图。
[0017] 此外,本发明还提供一种基于HDFS的磁盘定位装置,包括:
[0018] 关系文件获取模块,用于获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件;
[0019] 分布图生成模块,用于根据关系文件中的映射关系生成对应的可视化分布图,以供系统维护人员根据可视化分布图定位各磁盘;其中,可视化分布图中以图形化方式记录有磁盘与服务器之间的挂载关系。
[0020] 此外,本发明还提供一种基于HDFS的磁盘定位设备,包括:
[0021] 存储器,用于存储计算机程序;
[0022] 处理器,用于执行计算机程序时实现如上述的基于HDFS的磁盘定位方法的步骤。
[0023] 此外,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的基于HDFS的磁盘定位方法的步骤。
[0024] 本发明所提供的基于HDFS的磁盘定位方法,首先获取包含有HDFS中磁盘与服务器之间映射关系的关系文件,进而根据关系文件中的映射关系生成对应的可视化分布图,以通过图像化的方式记录磁盘与服务器之间的挂载关系,从而供系统维护人员根据生成的可视化分布图定位各磁盘所在的服务器。本方法通过可视化分布图的方式记录磁盘所在的服务器,系统维护人员能够通过可视化分布图更加直观的获悉磁盘与服务器之间的关系,进而能够相对高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,以此确保系统维护人员对异常磁盘的及时维护,从而保证了HDFS的整体工作效率。此外,本发明还提供一种基于HDFS的磁盘定位装置、设备及介质,有益效果同上所述。

附图说明

[0025] 为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026] 图1为本发明实施例提供的一种基于HDFS的磁盘定位方法的流程图;
[0027] 图2为本发明实施例提供的一种基于HDFS的磁盘定位装置的结构图。

具体实施方式

[0028] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
[0029] 本发明的核心是提供一种基于HDFS的磁盘定位方法,以实现系统维护人员相对高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,进而能够对异常磁盘进行及时的维护,从而确保HDFS的整体工作效率。本发明的另一核心是提供一种基于HDFS的磁盘定位装置、设备及介质。
[0030] 为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
[0031] 实施例一
[0032] 图1为本发明实施例提供的一种基于HDFS的磁盘定位方法的流程图。请参考图1,基于HDFS的磁盘定位方法的具体步骤包括:
[0033] 步骤S10:获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件。
[0034] 需要说明的是,本步骤的目的是获取构成HDFS的所采用的磁盘与服务器之间的映射关系,也就是构成HDFS的各个服务器与各服务器所挂载的磁盘之间的对应关系。本方法中的服务器指的是构成HDFS的设备节点,而设备节点之所以能够提供数据存储空间,进而能构成HDFS以提供数据存储服务是由于在设备节点上挂载有磁盘,此外,由于构成HDFS的各个设备节点所提供的存储空间可以互不相同,因此本方法中的各个服务器所挂载的磁盘的数量,以及磁盘的容量可以不同。需要强调的是,本步骤中的关系文件中包含但可以不仅包含有磁盘与服务器之间映射关系,还可以包含有基于磁盘与服务器进行更加宏观或微观的映射关系划分,例如,在关系文件中还可以进一步记录有,基于磁盘划分的存储分区等。
[0035] 步骤S11:根据关系文件中的映射关系生成对应的可视化分布图,以供系统维护人员根据可视化分布图定位各磁盘。
[0036] 其中,可视化分布图中以图形化方式记录有磁盘与服务器之间的挂载关系。
[0037] 本步骤是根据关系文件中的映射关系生成可视化分布图,即以图形化方式记录磁盘与服务器之间的挂载关系,具体可以是采取块状图或树状图等表现形式,体现磁盘与服务器之间的挂载关系,目的是为了使系统维护人员能够根据可视化分布图更加直观且高效的定位到各个磁盘所在的挂载位置。
[0038] 本发明所提供的基于HDFS的磁盘定位方法,首先获取包含有HDFS中磁盘与服务器之间映射关系的关系文件,进而根据关系文件中的映射关系生成对应的可视化分布图,以通过图像化的方式记录磁盘与服务器之间的挂载关系,从而供系统维护人员根据生成的可视化分布图定位各磁盘所在的服务器。本方法通过可视化分布图的方式记录磁盘所在的服务器,系统维护人员能够通过可视化分布图更加直观的获悉磁盘与服务器之间的关系,进而能够相对高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,以此确保系统维护人员对异常磁盘的及时维护,从而保证了HDFS的整体工作效率。
[0039] 实施例二
[0040] 在上述实施例的基础上,本发明还提供以下一系列优选的实施方式。
[0041] 作为一种优选的实施方式,关系文件中还包含有服务器与机柜之间的映射关系,以及机柜与机房之间的映射关系;
[0042] 相应的,可视化分布图中还以图形化方式记录有服务器与机柜之间的放置关系,以及机柜与机房之间的放置关系。
[0043] 需要说明的是,由于考虑到当前HDFS往往是由大量的服务器构成的,并且各个服务器上均需要挂载有一定数量的磁盘,因此为了进一步确保系统维护人员能够准确的定位到磁盘所在的位置,需要先对服务器进行准确的定位,而服务器往往被放置于机柜上,并且随着服务器的数量不断增加,用于放置服务器的机柜数量也在不断增加,而一个机房中能够放置的机柜数量是有限的,当构成HDFS的服务器达到一定的数量后,则需要多个机房来承载用于放置服务器的机柜,因此在本实施方式中,关系文件中还包含有服务器与机柜之间的映射关系,以及机柜与机房之间的映射关系,相应的,可视化分布图中还以图形化方式记录有服务器与机柜之间的放置关系,以及机柜与机房之间的放置关系,本实施方式通过在关机文件中,进一步增加了与服务器与机柜的映射关系以及机柜与机房的映射关系,进而根据映射关系生成的可视化分布图,能够更加全面的以图形化方式记录磁盘的整体拓扑结构,从而进一步确保系统维护人员高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器。
[0044] 在上述实施方式的基础上,作为一种优选的实施方式,获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件包括:
[0045] 获取包含有映射关系的JSON格式的关系文件。
[0046] 需要说明的是,由于考虑到在实际应用场景中,磁盘与服务器之间的映射关系数量较多,并且相对复杂,因此以文件的形式对映射关系进行记录时往往需要占用较大的数据空间,并且还会导致对文件进行传输时过多的占用传输带宽,而JSON格式相对简单,是纯文本,因此在相同数据空间的前提下,通过JSON格式能够记录更多的映射关系,因此本实施方式能够相对降低根据映射关系生成的关系文件对存储空间以及对传输带宽的过多占用。
[0047] 在上述实施方式的基础上,作为一种优选的实施方式,获取包含有映射关系的JSON格式的关系文件包括:
[0048] 通过分析HDFS的操作系统信息以获取包含有映射关系的JSON格式的关系文件。
[0049] 需要说明的是,HDFS是基于服务器与磁盘之间的映射关系,通过控制服务器以达到对磁盘的存储空间进行使用的目的,而HDFS的操作系统信息往往记录有数据读写过程中服务器与磁盘之间交互时的数据流动方向,由于操作系统信息是在HDFS运行中产生的,因此本实施方式中通过操作系统信息获取包含有映射关系的JSON格式的关系文件,能够相对确保关系文件中映射关系的准确性以及实时性。
[0050] 在上述一系列实施方式的基础上,作为一种优选的实施方式,该方法进一步包括:
[0051] 当存在工作状态异常的目标磁盘时,以高亮度显示的方式将目标磁盘显示于可视化分布图。
[0052] 需要说明的是,本实施方式是当HDFS运行过程中存在工作状态异常的目标磁盘时,在生成可视化分布图的过程中,将存在异常的目标磁盘以高亮度显示的方式进行呈现,更进一步的,可以通过特定的颜色对图形化的目标磁盘进行标记,以此确保系统维护人员能够相对高效、便捷的在可视化分布图中定位到异常磁盘所处的机房、机柜以及所挂载的服务器,提高了可视化分布图的整体实用性。
[0053] 实施例三
[0054] 在上文中对于基于HDFS的磁盘定位方法的实施例进行了详细的描述,本发明还提供一种与该方法对应的基于HDFS的磁盘定位装置,由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
[0055] 图2为本发明实施例提供的一种基于HDFS的磁盘定位装置的结构图。本发明实施例提供的基于HDFS的磁盘定位装置,包括:
[0056] 关系文件获取模块10,用于获取包含有HDFS中的磁盘与服务器之间映射关系的关系文件。
[0057] 分布图生成模块11,用于根据关系文件中的映射关系生成对应的可视化分布图,以供系统维护人员根据可视化分布图定位各磁盘;其中,可视化分布图中以图形化方式记录有磁盘与服务器之间的挂载关系。
[0058] 本发明所提供的基于HDFS的磁盘定位装置,首先获取包含有HDFS中磁盘与服务器之间映射关系的关系文件,进而根据关系文件中的映射关系生成对应的可视化分布图,以通过图像化的方式记录磁盘与服务器之间的挂载关系,从而供系统维护人员根据生成的可视化分布图定位各磁盘所在的服务器。本装置通过可视化分布图的方式记录磁盘所在的服务器,系统维护人员能够通过可视化分布图更加直观的获悉磁盘与服务器之间的关系,进而能够相对高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,以此确保系统维护人员对异常磁盘的及时维护,从而保证了HDFS的整体工作效率。
[0059] 实施例四
[0060] 此外,本发明还提供一种基于HDFS的磁盘定位设备,包括:
[0061] 存储器,用于存储计算机程序;
[0062] 处理器,用于执行计算机程序时实现如上述的基于HDFS的磁盘定位方法的步骤。
[0063] 本发明所提供的基于HDFS的磁盘定位设备,首先获取包含有HDFS中磁盘与服务器之间映射关系的关系文件,进而根据关系文件中的映射关系生成对应的可视化分布图,以通过图像化的方式记录磁盘与服务器之间的挂载关系,从而供系统维护人员根据生成的可视化分布图定位各磁盘所在的服务器。本设备通过可视化分布图的方式记录磁盘所在的服务器,系统维护人员能够通过可视化分布图更加直观的获悉磁盘与服务器之间的关系,进而能够相对高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,以此确保系统维护人员对异常磁盘的及时维护,从而保证了HDFS的整体工作效率。
[0064] 此外,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的基于HDFS的磁盘定位方法的步骤。
[0065] 本发明所提供的计算机可读存储介质,在执行时首先获取包含有HDFS中磁盘与服务器之间映射关系的关系文件,进而根据关系文件中的映射关系生成对应的可视化分布图,以通过图像化的方式记录磁盘与服务器之间的挂载关系,从而供系统维护人员根据生成的可视化分布图定位各磁盘所在的服务器。本计算机可读存储介质通过可视化分布图的方式记录磁盘所在的服务器,系统维护人员能够通过可视化分布图更加直观的获悉磁盘与服务器之间的关系,进而能够相对高效且准确地在众多的服务器节点中定位到挂载有异常磁盘的目标服务器,以此确保系统维护人员对异常磁盘的及时维护,从而保证了HDFS的整体工作效率。
[0066] 以上对本发明所提供的一种基于HDFS的磁盘定位方法、装置、设备及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
[0067] 还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。