时序化的数据处理方法、装置及系统转让专利

申请号 : CN200910235460.1

文献号 : CN101673192B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨耀敏蒋建平

申请人 : 北京云快线软件服务有限公司

摘要 :

本发明公开了一种时序化数据处理方法、装置及系统,所述方法包括:获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;所述序列化通道对应应用类型;根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。所述方法、装置及系统能够优化数据的存储和管理。

权利要求 :

1.一种时序化的数据处理方法,其特征在于,该方法包括:

获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;

根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;

通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。

2.根据权利要求1所述的方法,其特征在于,所述获取步骤之前还包括:接收用户的数据处理请求。

3.根据权利要求2所述的方法,其特征在于,通过以下方式获取待处理数据的时间信息、所归属的序列化通道:从所述数据处理请求中获取待处理数据的时间信息;从所述数据处理请求中获取待处理数据的路径信息,根据所述路径信息确定待处理数据的类型,进而确定待处理数据所归属的序列化通道。

4.根据权利要求3所述的方法,其特征在于,所述应用处理类型为写入时,通过以下方式确定所述待处理数据的存储单元:判断所述时间信息指示的时间与当前时间之间的时间间隔是否大于第一时间阈值,如果是,确定所述待处理数据的存储单元为第二存储单元;否则,确定所述待处理数据的存储单元为序列化通道对应的第一存储单元。

5.根据权利要求4所述的方法,其特征在于,所述通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作包括:通过所述第二存储单元或者所述序列化通道对应的第一存储单元对所述待处理数据进行应用处理类型指示的处理操作。

6.根据权利要求5所述的方法,其特征在于,当所述应用处理类型为写入时,将待写入数据写入确定的所述第二存储单元通过以下步骤实现:判断第二存储单元中当前存储磁盘中的剩余存储空间是否大于所述待写入数据的数据量,如果是,将待写入数据写入当前存储磁盘;否则,将当前存储磁盘的下一个存储磁盘作为当前存储磁盘,进行所述判断操作,直到最后一个存储磁盘的剩余存储空间仍不大于所述待写入数据的数据量时,循环至第一个存储磁盘。

7.根据权利要求3所述的方法,其特征在于,所述应用处理类型为读取或删除时,通过以下方式确定所述待处理数据的存储单元:根据时间信息查找所述序列化通道对应的数据信息表,将从所述数据信息表中查找得到的对应数据作为待处理数据,并获取所述待处理数据的存储路径信息。

8.根据权利要求7所述的方法,其特征在于,还包括:

从所述数据信息表中获取所述待处理数据的状态信息,并根据状态信息判断各待处理数据是否处于可处理状态,如果是,执行所述进行应用处理类型指示的处理操作的步骤。

9.一种时序化的数据处理装置,其特征在于,包括:

第一获取单元,用于获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;所述序列化通道对应数据类型;

确定单元,用于根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;

处理单元,用于通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。

10.根据权利要求9所述的装置,其特征在于,还包括:

第二获取单元,用于接收用户的数据处理请求,把所述请求发送给第一获取单元。

11.根据权利要求10所述的装置,其特征在于,第一获取单元具体用于:从所述数据处理请求中获取待处理数据的时间信息以及应用处理类型;从所述数据处理请求中获取待处理数据的路径信息,根据所述路径信息确定待处理数据的类型,进而确定待处理数据所归属的序列化通道。

12.根据权利要求11所述的装置,其特征在于,所述应用处理类型为写入时,确定单元具体用于:判断所述时间信息指示的时间与当前时间之间的时间间隔是否大于第一时间阈值,如果是,确定所述待处理数据的存储单元为第二存储单元;否则,确定所述待处理数据的存储单元为序列化通道对应的第一存储单元。

13.根据权利要求12所述的装置,其特征在于,处理单元包括:第一处理子单元,用于通过所述序列化通道对应的第一存储单元对所述待处理数据进行应用处理类型指示的处理操作;或者,第二处理子单元,用于通过所述第二存储单元对所述待处理数据进行应用处理类型指示的处理操作。

14.根据权利要求13所述的装置,其特征在于,第二处理子单元具体用于:判断第二存储单元中的当前存储磁盘中剩余存储空间是否大于所述待写入数据的数据量,如果是,将待写入数据写入当前存储磁盘;否则,将当前存储磁盘的下一个存储磁盘作为当前存储磁盘,进行所述判断操作,直到最后一个存储磁盘的剩余存储空间仍不大于所述待写入数据的数据量时,循环至第一个存储磁盘。

15.根据权利要求11所述的装置,其特征在于,所述应用处理类型为读取或删除时,确定单元具体用于:根据时间信息查找所述序列化通道对应的数据信息表,将查找得到的数据作为待处理数据,从所述数据信息表中获取所述待处理数据的存储路径信息。

16.根据权利要求15所述的装置,其特征在于,确定单元还用于:从所述数据信息表中获取所述待处理数据的状态信息,并根据状态信息判断各待处理数据是否处于可处理状态,如果是,控制处理单元执行所述处理操作。

17.一种时序化的数据处理系统,其特征在于,包括:应用终端、数据处理装置以及存储单元;其中,应用终端,用于接收用户的数据处理请求,把该请求发送给数据处理装置;

数据处理装置,用于接收所述应用终端发送的数据处理请求,从所述数据处理请求中获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;其中,所述序列化通道对应数据类型;根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作;

存储单元,用于存储数据,并在数据处理装置的控制下进行数据处理。

说明书 :

时序化的数据处理方法、装置及系统

技术领域

[0001] 本发明涉及数据存储与管理技术,尤其涉及一种时序化的数据处理方法、装置及系统。

背景技术

[0002] 随着高密度海量数据存储需求的不断发展,越来越多的应用场合通过集中存储系统来实现对于各种数据的存储和访问,例如,数据备份、视频监控、视频编辑、地质勘探、数据归档应用等,而在这些数据处理的过程中,其都具有明确的时间特征,同时具有如下特点:
[0003] 所述数据的存储通常是非结构化存储或近似非结构化存储,且存储过程对IO带宽要求比较高,如必须达到数十MB/s以上,数据总量比较大且是不间断产生的;而所述数据的访问通常都具有或者暗含时序性特征信息;所述数据一旦进入存储系统,再次访问的概率往往较低,但往往又不能完全离线存储,据统计,所述数据的访问频率,大部分可能低于1次/月。
[0004] 在现有的集中存储系统中,数据的存储和访问通常使用如下方法:根据数据被访问的特性,将数据分为3个层次,在线存储、近线存储和离线存储。上面所述数据的存储可以归类为典型的近线存储需求,但近线存储的关键点和难点是数据进入近线存储系统的判断依据,所以,近些年来围绕近线存储的一些方法和系统,基本上都是围绕热点数据进行管理,所谓热点,就是在一定的时间窗口内,对各个数据的访问频率统计,根据统计情况,将数据分别存储在在线存储系统和近线存储系统。对于上面所述数据管理的需求,则难以通过热点进行分类,主要的问题在于数据普遍的访问率低下,再次访问也是在偶然情况下发生,几乎不会出现阶段性局部数据被反复访问的情况。
[0005] 发明人发现:由于分级存储的所有数据都是根据访问频率进行分级的,在数据量很大,且所存储的数据不具有热点特征,则需要容量很大的在线存储系统予以支撑,而这往往会使得文件基本操作的时间较长,进而导致用户进行数据处理的时间过长,从而降低了前端应用系统的数据处理效率。

发明内容

[0006] 有鉴于此,本发明要解决的技术问题是,提供一种时序化的数据处理方法、装置及系统,在进行数据处理时考虑数据之间的时序性关系,从而能够优化数据的存储和管理。
[0007] 为此,本发明实施例采用如下技术方案:
[0008] 一种时序化的数据处理方法,该方法包括:
[0009] 获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;
[0010] 根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;
[0011] 通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。
[0012] 一种时序化的数据处理装置,包括:
[0013] 第一获取单元,用于获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;所述序列化通道对应数据类型;
[0014] 确定单元,用于根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;
[0015] 处理单元,用于通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。
[0016] 一种时序化的数据处理系统,包括:应用终端、数据处理装置以及存储单元;其中,
[0017] 应用终端,用于接收用户的数据处理请求,把该请求发送给数据处理装置;
[0018] 数据处理装置,用于接收所述应用终端发送的数据处理请求,从所述数据处理请求中获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;其中,所述序列化通道对应数据类型;根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作;
[0019] 存储单元,用于存储数据,并在数据处理装置的控制下进行数据处理。
[0020] 对于上述技术方案的技术效果分析如下:
[0021] 以数据的时间信息作为数据处理的索引,并为各个不同类型的数据设置对应的序列化通道,依据数据的时间信息以及序列化通道确定数据的存储单元,进而对数据进行应用处理类型指示的处理,整个过程中,以数据的时间信息和序列化通道作为依据,考虑到了数据本身的时序性特点以及类型特点,从而数据的存储和管理。

附图说明

[0022] 图1为本发明实施例时序化的数据处理方法流程示意图;
[0023] 图2为本发明实施例时序化的数据写入方法流程示意图;
[0024] 图3为本发明实施例时序化的数据转移方法流程示意图;
[0025] 图4为本发明实施例数据清除方法流程示意图;
[0026] 图5为本发明实施例时序化的数据读取方法流程示意图;
[0027] 图6为本发明实施例时序化的数据删除方法流程示意图;
[0028] 图7为本发明实施例时序化的数据处理装置结构示意图;
[0029] 图8为本发明实施例另一种时序化的数据处理装置结构示意图;
[0030] 图9为本发明实施例时序化的数据处理系统结构示意图。

具体实施方式

[0031] 本发明实施例的基本思想在于,在数据处理过程中充分考虑被处理数据的时序性并结合数据类型,从而提供了一种时序化的数据处理方法、装置及系统,从而能够提高数据处理效率。
[0032] 具体的,考虑到数据其生产的时序性关系和访问特点,采用一种基于时序的分级管理方式,可以有效降低在线存储系统的规模和成本。在新的存储系统中,采用两级存储体系,一级存储系统用于存储最新生成的数据,二级存储系统用于存储具有某个时间阈值之前的数据,前者采用一般的、符合在线存储需求的系统,如NAS、SAN、甚至是DSA系统,后者采用一个或多个廉价的存储设备,并将所述存储设备形成一个逻辑闭环的存储链进行管理。数据存储时,首先存入一级存储系统中,同时,元数据服务器记录所存储数据的存储地址及时间特征,然后,通过一定的工程技术,当数据存储时间超过指定时间阈值后,数据从一级存储自动转移到二级存储链中,同时更新元数据服务器中的数据存储的记录,同时更新所二级存储链中,独立存储设备所关联的时间范围。当数据被访问时,根据所约定的路径规则,提取数据的时间,定位存储设备,向锁定存储设备访问相关数据。在拥有多个类似应用的情形下,可以进一步的在二级存储链中实施序列化通道机制,即:通过路径映射,将不同应用的数据存储到约定路径之中,从而实现二级存储链在多个应用中的共享,实现多个一级存储系统对一个二级存储链。通过上述设计,一级存储可以实现瘦身,从而达到降低成本的目的;二级存储设备在大部分时间都处于局部工作状态,可以实施休眠机制,降低系统的能耗;同时,二级存储基于存储链的管理方式,可以方便实施动态扩容,管理上非常简单;通过元数据服务器提供的统一视图,可以实现POSIX兼容。
[0033] 以下,结合附图详细说明本发明实施例时序化数据处理方法、装置及系统的实现。
[0034] 在该方法中,将数据的存储分为一级存储和二级存储,其中,将存储时间与当前时间的时间间隔不大于预设第一时间阈值的数据进行一级存储;将存储时间与当前时间的时间间隔大于预设第一时间阈值的数据进行二级存储。其中,用于对数据进行一级存储的存储单元称为一级存储系统,其在具体实施时可以使用适合业务需要的存储系统作为存储环境,例如SAN、NAS、DAS、集群文件系统、RAID、甚至是具有SSD、IDA的存储系统;而二级存储可以使用廉价的磁盘或者带RAID的主机作为二级存储单元。
[0035] 另外,该方法还根据应用类型,为不同应用的数据设置对应的序列化通道,例如,为视频监控数据设置对应的序列化通道1,为地质勘测数据设置对应的序列化通道2等。并且,为各个序列化通道建立数据信息表,在该数据信息表中记录数据的时间信息、数据量、状态信息等属性信息。其中,数据的时间信息可以以时间的方式实现。所述状态信息根据应用处理类型可以划分为:转移、写入、读取、删除、正常等。当数据的状态为正常时,可以响应其他的如读取、删除、转移等应用处理,但是,当处于读取状态时,则不允许进行删除、转移等应用处理,当数据处于删除、转移等状态时类似,这里不赘述。另外,可以将所有的序列化通道对应的数据信息表统一存储,形成元数据服务系统,以便于统一管理。
[0036] 其中,每个序列化通道对应一个一级存储系统,每个存储单元的具体存储量可以根据实际应用以及应用类型等确定,这里并不限制,这里限定序列化通道对应一个一级存储系统的意在限定每个序列化通道对应不同的一级存储系统。所述二级存储单元为所有序列化通道共用,一般包括多个存储单元,这时,将所述多个存储单元进行编号排序,在进行数据存储时,以存储单元的顺序依次将数据存储于所述磁盘上,在待存储数据的数据量大于当前磁盘的剩余存储空间时,将当前存储单元的下一个存储单元作为当前存储单元进行后续的存储操作,直至最后一个存储单元无法存储当前待存储数据时,转到第一个存储单元,将第一个存储单元作为当前磁盘,如此循环。通过只对二级存储单元中当前存储单元进行处理,且依照存储单元顺序进行数据存储,从而可以使得未被使用的磁盘处于休眠状态,只在需要时才进行激活,这样,可以减少存储单元的能耗。具体的,当判断磁盘是否可以休眠时,可以根据磁盘是否被访问、最后被访问时间、当前磁盘中所存储数据的状态信息等确定,这里不再赘述。
[0037] 如图1所示,为本发明时序化数据处理方法流程示意图,包括以下步骤:
[0038] 步骤101:获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型。
[0039] 步骤102:根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元。
[0040] 步骤103:通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。
[0041] 图1所示的本发明实施例,以数据的时间信息作为数据处理的索引,并为各个不同类型的数据设置对应的序列化通道,依据数据的时间信息以及序列化通道确定数据的存储单元,进而对数据进行应用处理类型指示的处理,整个过程中,以数据本身的时间信息和应用类型作为处理依据,从而可以优化数据的存储和管理。
[0042] 图2为本发明时序化数据处理方法中的数据写入方法流程示意图,包括以下步骤:
[0043] 步骤201:接收用户的数据写入请求。
[0044] 其中,在具体实施时用户一般通过前端的应用终端进行数据的各种应用处理。
[0045] 步骤202:根据数据写入请求获取所述待写入数据的时间信息以及应用处理类型。
[0046] 其中,所述待写入数据的时间信息可以为:接收到所述数据写入请求的时间或者所述待写入数据的生成时间等,可以在实际应用中根据应用环境设置,这里并不限制。
[0047] 其中,应用处理类型包括:写入、读取、删除等,在本实施例的上述步骤中,仅仅以数据写入请求为例,因此,应用处理类型为写入。
[0048] 步骤203:根据所述数据写入请求的路径信息确定待写入数据所归属的序列化通道。
[0049] 具体的,本步骤的实现可以包括但不局限为:根据所述数据写入请求的路径信息确定待写入数据的数据类型;根据待写入数据的数据类型确定所述待写入数据所归属的序列化通道;其中,一般不同类型的数据,其对应用户所使用的应用终端不同,而不同应用终端对应的路径信息也不同,因此可以根据数据写入请求所属应用终端,也即根据数据写入请求的路径信息确定数据来源,进而确定待写入数据的数据类型。
[0050] 步骤204:根据时间信息以及序列化通道确定待写入数据的存储单元。
[0051] 具体的,本步骤的实现可以包括但不局限为:判断待写入数据的时间信息对应的时间与当前时间的时间间隔是否大于第一时间阈值,如果否,将待写入数据存储于序列化通道对应的一级存储单元中;如果是,将待写入数据存储于二级存储单元中。
[0052] 步骤205:将待写入数据存储在确定的所述存储单元中。其中,本实施例中的所述待写入数据可以是一个文件,也可以是多个文件,这里并不限制。
[0053] 其中,如果所确定的存储单元为二级存储单元时,鉴于二级存储单元中包含多个存储磁盘,则本步骤的实现可以包括但不局限为:
[0054] 判断第二存储单元中的当前存储磁盘中的剩余存储空间是否大于所述待写入数据的数据量,如果是,将待写入数据写入当前存储磁盘;否则,将当前存储磁盘的下一个存储磁盘作为当前存储磁盘,进行所述判断操作,直到最后一个存储磁盘的剩余存储空间仍不大于所述待写入数据的数据量时,循环至第一个存储磁盘,继续进行判断。
[0055] 步骤206:将待写入数据的存储路径信息更新到其存储单元对应的数据信息表中。
[0056] 其中,所述数据信息表记录各个数据的状态信息、存储路径信息以及其他信息,如数据量等。其中,一般以文件为个体进行记录,以便于后期的数据读取等操作。
[0057] 在图2所示的实施例中,给出了进行数据写入处理的具体方法流程,其中,在进行数据写入时,在每个序列化通道中,根据数据的时间信息进行数据的存储,从而因为在数据存储时考虑到了数据的时序性,所以能够很好的提高数据处理效率。
[0058] 当数据存储到对应的序列化通道的一级存储单元后,且当文件的时间信息对应的时间与当前时间的时间间隔超过时间阈值时,将发生数据从一级存储单元到二级存储单元的数据转移过程。
[0059] 所述数据转移过程如图3所示,包括以下步骤:
[0060] 步骤301:获取一级存储单元中数据的时间信息和状态信息。
[0061] 具体的获取方式为:从一级存储单元所属序列化通道所对应的数据信息表中获取,但并不局限于此。
[0062] 步骤302:判断该时间信息对应的存储时间与当前时间之间的时间间隔是否超过第一时间阈值,如果是,执行步骤303,否则,返回获取一级存储单元中的下一数据的时间信息。
[0063] 所述数据可以以单个文件的形式作为执行对象,也即所述当前数据指的是当前文件,所述下一数据指的是下一个文件。
[0064] 步骤303:判断所述数据是否处于可转移状态,如果是,执行步骤304,否则,返回步骤302,进行下一数据的判断。
[0065] 这里,主要通过分析所述数据的状态信息,根据分析结果确定判断所述数据是否处于正常状态,来确定所述数据是否处于可转移状态,如果所述分析结果指示所述数据处于其他如删除、读取等状态时,则认为该数据处于不可转移状态。
[0066] 步骤304:将所述数据存储到二级存储单元中。
[0067] 具体过程与上述步骤205的存储过程基本相同,这里不赘述。
[0068] 步骤305:更新数据信息表中相应数据的数据信息。
[0069] 其中,在进行数据从一级存储单元到二级存储单元的转移时,可以不对一级存储单元中数据立即删除,而只是将被转移数据对应的信息标记为删除,以保证转移数据的安全。此后,需要对一级存储单元中的数据进行统一清理,以防占用过多的存储资源。图4为一级存储单元中自主进行数据清除的方法流程示意图,该图4中所示方法可以预先设置处理周期,在预定时间自主触发,或者也可以预先配置触发策略,这里并不限制。其中图4所示方法包括:
[0070] 步骤401:获取序列化通道所对应的数据信息表。
[0071] 步骤402:从所述数据信息表中查找到状态为“已经转移”的数据,并获取查找到的数据的时间信息。
[0072] 步骤403:根据所述获取到的数据的时间信息,判断所述数据时间信息对应的时间与当前时间的间隔是否大于第二时间阈值,如果是,执行步骤404;否则,返回获取下一个数据。
[0073] 这里的所述数据一般以文件作为个体,因此,步骤403一般为循环步骤,也即:本步骤中依次判断每个文件的时间信息对应的时间与当前时间的时间间隔是否大于第二时间阈值,并进行相应处理。
[0074] 步骤404:判断该数据的当前状态是否处于可清理状态,如果是,则执行步骤405;否则,返回步骤403,获取下一个数据的数据信息。
[0075] 步骤405:删除所述处于可清理状态的数据。
[0076] 步骤406:更新数据信息表中相应数据的数据信息。
[0077] 图5为本发明实施例数据读取方法流程示意图,如图5所示,包括:
[0078] 步骤501:接收用户的数据读取请求。
[0079] 步骤502:根据数据读取请求获取待读取数据的时间信息、序列化通道以及应用处理类型。
[0080] 这里,与步骤203类似的,可以通过读取请求的路径信息来获取序列化通道,这里不再赘述。
[0081] 步骤503:根据所述序列化通道以及时间信息确定待读取数据,并相应获取待读取数据的状态信息以及存储路径信息。
[0082] 这里,可以从前述的数据状态信息表查询到待读取数据以及所述数据的状态信息以及存储路径信息。另外,查询到的待读取数据可能为多个文件,这时,需要步骤504的循环执行以确定是否可以读取查询到的每个文件。
[0083] 步骤504:判断所述数据的状态是否可以支持所述应用处理类型指示的处理(即:是否处于可读取状态),如果是,执行步骤505,否则,拒绝所述数据的读取,执行步骤506。
[0084] 这里,也可以通过判断所述数据的状态是否正常来完成。
[0085] 步骤505:更新所述数据的状态信息为读取,并且读取所述数据后将读取到的数据返回给用户。
[0086] 其中,通过将待读取数据的状态信息更新为读取,可以防止其他如删除等操作的执行,以免影响读取过程或者删除过程等。当读取结束后,需要将数据的状态信息修改为:正常。
[0087] 步骤506:向用户返回拒绝数据读取的信息。
[0088] 本步骤的实现可以为:通过向用户所在的客户端返回拒绝数据读取信令等方式来通知用户所在的应用终端当前数据的拒绝读取状态,进而通过应用终端通知用户,这里不再赘述。
[0089] 图5所示的本发明实施例数据读取方法,通过应用类型确定序列化通道,并根据时间信息确定待读取数据,进而根据状态信息确定是否可以进行数据读取,利用所述序列化通道以及时间信息,从而提高了待读取数据的查找速率,进而提高了数据读取效率。
[0090] 图6为本发明实施例数据删除方法流程示意图,如图6所示,该数据删除方法包括:
[0091] 步骤601:接收用户的数据删除请求。
[0092] 步骤602:根据数据删除请求获取待删除数据的时间信息、序列化通道以及应用处理类型。本实施中,所述应用处理类型为删除。
[0093] 步骤603:根据所述序列化通道以及时间信息确定待删除数据的状态以及存储路径信息。
[0094] 步骤604:判断所述数据的当前状态是否可以支持所述应用处理类型指示的处理(即:是否处于可删除状态),如果是,执行步骤605;否则,拒绝用户的删除操作,执行步骤606。
[0095] 判断数据的当前状态是否处于可删除状态前需要确定:该数据目前未被访问、该数据目前未处于转移状态等。
[0096] 步骤605:根据所述存储路径信息删除所述待删除数据;执行步骤607。
[0097] 这里,一般会存在相应的进行删除的应用程序,通过调用该应用程序删除所述数据,具体实现方法这里不再赘述。
[0098] 步骤606:向用户返回拒绝数据删除的信息。
[0099] 具体的,本步骤的实现可以为:通过向用户所在的客户端返回拒绝数据删除信令等的方式将拒绝数据删除的信息通知用户所在的应用终端,进而通过应用终端通知用户,这里不再赘述。
[0100] 步骤607:更新数据信息表中相应数据的数据信息。
[0101] 图6所示的本发明实施例中,根据数据的时间信息以及类型查找待删除数据,从而提高了查找速率,进而提高了删除处理的处理效率。
[0102] 图7为本发明实施例时序化数据处理装置结构示意图,如图7所示,该处理装置包括:
[0103] 第一获取单元710,用于获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;
[0104] 确定单元720,用于根据所述第一获取单元710获取到的时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;
[0105] 处理单元730,用于通过所述确定单元720确定的存储单元对所述待处理数据进行应用处理类型指示的处理操作。
[0106] 图7所示的本发明实施例数据处理装置,以数据的时间信息作为数据处理的索引,并为各个不同类型的数据设置对应的序列化通道,依据数据的时间信息以及序列化通道确定数据的存储单元,进而对数据进行应用处理类型指示的处理,整个过程中,以数据的时间信息和序列化通道作为依据,从而考虑到了数据的时序性和类型,提高了数据处理效率。
[0107] 图8为数据写入时的数据处理装置结构示意图,如图8所示,该装置在图7所示实施例的基础上还包括:
[0108] 第二获取单元840,用于接收用户的数据处理请求,并把所述请求发送给第一获取单元810。
[0109] 进一步地,第一获取单元810具体可以用于:
[0110] 从所述数据处理请求中获取待处理数据的时间信息以及应用处理类型;从所述数据处理请求中获取待处理数据的路径信息,根据所述路径信息确定待处理数据的类型,进而确定待处理数据所归属的序列化通道;
[0111] 此时,第一获取单元810可以通过如图8所示的子单元完成,包括:
[0112] 第一获取子单元8101,用于从所述数据处理请求中获取待处理数据的时间信息以及应用处理类型;
[0113] 第二获取子单元8102,用于从所述数据处理请求中获取待处理数据的路径信息,根据所述路径信息确定待处理数据的类型,进而确定待处理数据所归属的序列化通道。
[0114] 确定单元820具体可以用于:判断所述时间信息指示的时间与当前时间之间的时间间隔是否大于第一时间阈值,如果是,确定所述待处理数据的存储单元为第二存储单元;否则,确定所述待处理数据的存储单元为序列化通道对应的第一存储单元。
[0115] 所述处理单元830可以具体用于:通过所述第二存储单元或者所述序列化通道对应的第一存储单元对所述待处理数据进行应用处理类型指示的处理操作。此时,处理单元830可以包括:
[0116] 第一处理子单元8301,用于通过所述序列化通道对应的第一存储单元对所述待处理数据进行应用处理类型指示的处理操作;或者,
[0117] 第二处理子单元8302,用于通过所述第二存储单元对所述待处理数据进行应用处理类型指示的处理操作。
[0118] 另外,第二处理子单元8302还可以具体用于:判断第二存储单元中的当前存储磁盘中剩余存储空间是否大于所述待写入数据的数据量,如果是,将待写入数据写入当前存储磁盘;否则,将当前存储磁盘的下一个存储磁盘作为当前存储磁盘,进行所述判断操作,直到最后一个存储磁盘的剩余存储空间仍不大于所述待写入数据的数据量时,循环至第一个存储磁盘。
[0119] 当应用处理类型为读取或删除时的数据处理装置结构与图8所示的结构相同,其与图8所示装置的区别在于:
[0120] 确定单元820具体可以用于:根据时间信息查找所述序列化通道对应的数据信息表,将查找得到的数据作为待处理数据,从所述数据信息表中获取所述待处理数据的存储路径信息。
[0121] 另外,确定单元820还可以用于:从所述数据信息表中获取所述待读取数据的状态信息,并根据状态信息判断各待读取数据是否处于可处理状态,如果是,控制处理单元830执行所述处理操作。
[0122] 图8所示的数据处理装置,在进行数据处理时,以数据的时间信息以及所归属的序列化通道为依据,从而提高了数据处理效率。
[0123] 图9所示为本发明实施例时序化的数据处理系统,如图9所示,包括:
[0124] 应用终端910、数据处理装置920以及存储单元930,所述存储单元930包括:第一存储单元和第二存储单元;其中,
[0125] 应用终端910,用于接收用户的数据处理请求,并把该请求发送给数据处理装置920;
[0126] 数据处理装置920,用于接收数据处理请求,获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;所述数据处理装置920获取到的序列化通道对应应用类型;根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作;
[0127] 存储单元930,用于存储数据,并在数据处理装置的控制下进行数据处理。
[0128] 其中,所述系统还包括:元数据库940,用于存储数据信息,其中所述元数据库940存储的数据信息包括:数据的时间信息、所归属的序列化通道以及状态信息。
[0129] 所述元数据库940可以设置于数据处理装置之外的设备中,例如建立与数据处理装置连接的元数据库服务器等;或者,所述元数据库940也可以设置于数据处理装置中,这里并不限制,只要数据处理装置可以获取数据信息即可。
[0130] 本领域普通技术人员可以理解,实现上述实施例方法的过程可以通过程序指令相关的硬件来完成,所述的程序可以存储于可读取存储介质中,该程序在执行时执行上述方法中的对应步骤。
[0131] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。