应用模糊矩阵的文件管理方法及管理系统转让专利

申请号 : CN201110045400.0

文献号 : CN102117324B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 康晓勇

申请人 : 上海北大方正科技电脑系统有限公司

摘要 :

本发明公开了一种应用模糊矩阵的文件管理方法及管理系统,管理方法包括下列步骤:1)对硬盘中的文件进行遍历搜索,针对每个文件,获得它在NTFS中的所有特征;2)根据文件特征,生成隶属度模糊矩阵,隶属度表示文件与特征的相关程度;3)根据用户指定的文件特征,调用隶属度模糊矩阵,列出具备该特征的文件。管理系统包括文件搜索引擎、操作系统资源管理器、模糊矩阵生成器、文件查询器。本发明实现了对文件的模糊管理,解决了NTFS系统无法进行模糊处理,用户需要对检索到的文件进一步判断才能得到需要的文件的不足。通过自动检索文件,生成模糊矩阵,当用户需要使用某一特征的文件时,可以迅速检索到相关文件,提高了效率。

权利要求 :

1.一种应用模糊矩阵的文件管理方法,包括如下步骤:

1)对硬盘中的文件进行遍历搜索,针对每个文件,获得它在NTFS中的所有特征;

2)根据文件特征,生成隶属度模糊矩阵,隶属度表示文件与特征的相关程度;所述隶属度模糊矩阵的生成方法为:A、按照特征的优先级,生成单个文件的特征稀疏矩阵,矩阵的非零元表示文件的特征;

B、在特征优先级的基础上获取单个文件与单个特征相关的隶属度;

C、将包含同一特征的所有文件的隶属度生成模糊集;

D、将所有特征的模糊集组合形成隶属度模糊矩阵,隶属度模糊矩阵为总特征稀疏矩阵,矩阵中的一个非零元代表一种特征;

3)根据用户指定的文件特征,调用隶属度模糊矩阵,列出具备该特征的文件。

2.根据权利要求1所述的应用模糊矩阵的文件管理方法,其特征在于所述遍历搜索的文件为硬盘中的用户文件。

3.根据权利要求1所述的应用模糊矩阵的文件管理方法,其特征在于通过单个特征稀疏矩阵定位所有包含同一特征的文件生成模糊集。

4.根据权利要求1所述的应用模糊矩阵的文件管理方法,其特征在于所述模糊集中元素按照隶属度大小排序。

5.根据权利要求1所述的应用模糊矩阵的文件管理方法,其特征在于所述调用模糊矩阵列出文件的方法包括:调用隶属度模糊矩阵,根据用户指定特征提取模糊矩阵中对应的非零元素;

根据非零元素对应的隶属度,列出隶属度对应的文件。

6.根据权利要求1所述的应用模糊矩阵的文件管理方法,其特征在于所述调用模糊矩阵列出文件的方法为:调用总特征稀疏矩阵,根据用户指定特征对应的位置,提取总特征稀疏矩阵对应的元素;

调出元素对应的模糊集;

列出模糊集记录的所有文件。

7.根据权利要求1或5或6所述的应用模糊矩阵的文件管理方法,其特征在于所列出的文件按隶属度由高到低输出。

8.根据权利要求1所述的应用模糊矩阵的文件管理方法,其特征在于所述文件管理方法利用操作系统的空闲资源自动进行。

9.一种应用模糊矩阵的文件管理系统,其特征在于包括:文件搜索引擎,用于遍历搜索硬盘中所有用户文件;

操作系统资源管理器,监控系统的空闲资源并根据系统资源的使用率启动或关闭文件搜索引擎;

模糊矩阵生成器,获取隶属度,生成隶属度模糊矩阵;所述隶属度模糊矩阵的生成方法为:A、按照特征的优先级,生成单个文件的特征稀疏矩阵,矩阵的非零元表示文件的特征;

B、在特征优先级的基础上获取单个文件与单个特征相关的隶属度;

C、将包含同一特征的所有文件的隶属度生成模糊集;

D、将所有特征的模糊集组合形成隶属度模糊矩阵,隶属度模糊矩阵为总特征稀疏矩阵,矩阵中的一个非零元代表一种特征;

文件查询器,根据用户指定的文件特征,查询隶属度模糊矩阵,并列出对应的文件。

说明书 :

应用模糊矩阵的文件管理方法及管理系统

技术领域

[0001] 本发明涉及一种文件管理方法及管理系统,尤其涉及一种应用模糊矩阵的文件管理方法及系统。

背景技术

[0002] 信息化浪潮使得电子化的资料大量增加,而大容量硬盘技术的快速发展则在技术和财务上为用户提供了在计算机中存储大量文件的可能性。当计算机硬盘中存储的文件达到一定数量时,如何有效的管理、查找和使用这些文件就成为一个重要的问题。特别是当用户需要针对文件管理进行软件开发时,该问题就显得更加突出。换句话说,和容量问题相比,效率问题正显得越来越重要。
[0003] 目前用户可以使用操作系统中自建的文件管理系统,针对目前广泛流行的Windows操作系统,普遍使用的文件管理系统是FAT32和NTFS,并且NTFS目前已成为Windows操作系统的主流文件管理系统。应用软件在使用文件时,需要使用这两种文件管理系统来进行操作。由于这两种文件系统的封闭性,使得我们无法进一步获得其工作细节,而就其运行表现来看,在进行文件的批量处理时,如某一类型文件的批量使用、具有某些相同特征文件的检索等,具有以下不足:
[0004] 1、按照文件名来管理文件。文件名作为文件最重要的特征,是NTFS的基础,要求文件名在一定程度上具有唯一性,在展示给用户时,也以文件名作为最主要的展示特征。而在实际使用中,用户有时会为不同路径下的不同文件赋予相同的文件名,当用户检索这些文件时,很难加以区别。
[0005] 2、对文件采用精确管理的策略。NTFS会根据文件的各项特征对其进行精确管理,如文件名称,类型,关键字,创建日期,修改日期,路径等。当多个文件针对同一主题时,如果这些文件在NTFS中的特征没有显性的相关性,如:查看某一员工的人力资源文件,可能包括员工信息文件,劳动合同文件等,但有时国家法律法规文件,公司相关人力政策文件等也会出现在结果中。NTFS无法自动判断用户的需要而给出符合要求的结果,用户必须手动实现或通过数据库软件来自动实现。
[0006] 3、完全采用按需使用的策略。即:当用户需要使用具有某种特征的文件时,Windows才会通过NTFS文件管理系统进行查找,查找完毕后,才会按照用户需要进行操作。这样就使得针对文件进行操作,特别是所要操作的文件数量较多时,执行效率偏低。

发明内容

[0007] 本发明的目的是提供一种应用模糊矩阵的文件管理方法和管理系统,自动对文件进行遍历搜索,建立模糊集,根据其所表征的特征及隶属度的值建立文件管理。当用户针对具有某一特征的文件进行操作时,本文件管理系统可以根据此前已经建立好的模糊集,快速找到相关文件,并根据其隶属度排序,供用户使用。
[0008] 本发明提供一种文件管理方法,包括:
[0009] 1)对硬盘中的文件进行遍历搜索,针对每个文件,获得它在NTFS中的所有特征;
[0010] 2)根据获得的文件的特征,生成文件的隶属度模糊矩阵,隶属度表示文件与特征的相关程度;
[0011] 3)根据用户指定的文件特征,调用隶属度模糊矩阵,列出具备该特征的文件。当用户需要针对具有某一特征的文件进行操作时,本发明的方法可以根据模糊矩阵中具有该特征的文件的各隶属度,列出具备该特征的相应的文件;
[0012] 所述文件管理方法利用操作系统的空闲资源自动进行。
[0013] 所述遍历搜索的文件为硬盘中的用户文件。系统文件不进行搜索。用户文件的识别可利用终端操作系统的现有技术实现。
[0014] 所述隶属度模糊矩阵的生成方法为:
[0015] A、根据特征与文件相关的级别,即特征的优先级,生成单个文件的特征稀疏矩阵,矩阵的非零元表示该文件的特征;
[0016] B、在特征优先级的基础上获取一个文件与一个特征的隶属度值,即获取文件与特征的相关程度值。隶属度值可由用户手动设定,也可采用现在广泛应用的二元对比排序法通过计算自动设定。
[0017] C、将包含同一特征的所有文件的隶属度生成模糊集;
[0018] D、将所有特征的模糊集组合形成隶属度模糊矩阵,隶属度模糊矩阵为总特征稀疏矩阵,矩阵中的一个非零元表示一种特征。总特征稀疏矩阵不再是针对某一个特定文件的稀疏矩阵了,而是针对所有用户文件的特征稀疏矩阵,非零元对应的特征都对应一个模糊集。将每一个模糊集都看做是稀疏矩阵中的一个元素,直接生成稀疏矩阵即可,这里只是数学概念的简单应用,总特征稀疏矩阵的生成为现有技术。
[0019] 所述模糊集的生成是通过单个特征稀疏矩阵定位所有包含同一特征的文件。文件的特征稀疏矩阵用来标示文件所具有的特征,通过稀疏矩阵,可快速定位包含某一特征的所有文件。从而快速生成文件的隶属度;大大减少计算时间。
[0020] 所述模糊集中元素的排序是根据隶属度大小排序。即根据隶属度值的大小对模糊集中元素进行排序调整。
[0021] 所述调用模糊矩阵列出文件的方法包括:
[0022] 调用隶属度模糊矩阵,根据用户指定特征提取模糊矩阵中的非零元素;
[0023] 根据非零元素对应隶属度,列出隶属度对应的文件。
[0024] 更进一步,所述调用模糊矩阵列出文件的方法为:
[0025] 调用总特征稀疏矩阵,根据用户指定特征对应的位置,提取总特征稀疏矩阵对应的元素;
[0026] 调出元素对应的模糊集;
[0027] 列出模糊集记录的所有文件。由于在总特征稀疏矩阵的生成过程中,已经记录了每个特征所对应的位置,因此在调用时,只需应用数学现有的简单的稀疏矩阵特征提取方法,提取总特征稀疏矩阵中标示特征的元素,即该特征的模糊集。模糊集记录了所有包含该特征的文件及其隶属度,这样就找到了所有具有该特征的文件。
[0028] 所列出的文件按隶属度大小顺序输出。
[0029] 同时本发明还提供一种文件管理系统,包括:
[0030] 文件搜索引擎,用于遍历搜索硬盘中所有用户文件。文件搜索引擎可自动执行,能够区分系统文件和用户文件;
[0031] 操作系统资源管理器,监控系统的空闲资源并根据系统资源的使用率启动或关闭文件搜索引擎;
[0032] 模糊矩阵生成器,获取隶属度,生成隶属度模糊矩阵;
[0033] 文件查询器,根据用户指定特征,搜索隶属度模糊矩阵,列出包含该特征的文件。当用户需要查询满足某特征的文件时,该查询器根据特征在模糊矩阵中查询符合条件的隶属度,列出隶属度所对应的文件。查询的过程是提取隶属度模糊矩阵中的对应该特征的元素的过程,其运用的数学原理是:如果要提取共m行、n列稀疏矩阵中第i行、第j列位置的元素,只需使用一个n行、m列矩阵与其进行相乘即可,要求该矩阵除第j行、第i列位置元素为1以外,其他位置元素都为0。
[0034] 发明的优点与积极效果:
[0035] 建立依靠文件特征隶属度的文件管理系统,从而实现对文件的模糊管理,可以针对模糊特征的文件使用,解决了NTFS系统无法进行模糊处理,用户需要对检索到的文件进一步判断才能得到需要的文件的不足。在使用文件前,通过自动检索文件、生成特征稀疏矩阵和模糊矩阵,建立起对文件系统的管理,当用户需要使用某一特征的文件时,可以迅速检索到相关文件,提高了利用效率。

附图说明

[0036] 图1是本发明的管理方法的流程框图;
[0037] 图2是本发明实施例中处理用户文件步骤的流程框图;
[0038] 图3是本发明实施例中处理单个用户文件时的流程框图;
[0039] 图4是本发明实施例中处理用户文件中单个特征的流程框图;

具体实施方式

[0040] 为了解决NTFS系统无法进行文件的模糊管理和进行文件模糊使用使检索速度慢的问题,本发明提供了一套文件管理办法和系统,通过建立模糊矩阵,将文件特征的重要性及文件与特征的相关性加以量化。当用户需要使用包含某一模糊特征的文件时,本发明将为用户按相关程度和重要性进行排序后的文件列表。
[0041] 本发明的文件管理系统包括文件搜索引擎,遍历搜索硬盘中所有用户文件。
[0042] 操作系统资源管理器,监控系统的空闲资源,当系统资源使用率较低时,启动文件搜索引擎,当系统资源使用率较高时,关闭文件搜索引擎;
[0043] 模糊矩阵生成器,计算或获取文件的隶属度,并根据文件的隶属度生成模糊集,根据模糊集生成隶属度模糊矩阵;
[0044] 文件查询器,当用户需要查询满足某特征的文件时,该查询器根据特征在模糊矩阵中查询符合条件的隶属度,按隶属度的高低顺序列出对应的文件。
[0045] 本发明的实施例是进行“人力资源相关文件”这一模糊特征的文件查询。员工的相关文件可能包含多种不同特征,包括员工基本信息、员工绩效信息、员工考核评价、公司关于员工工作岗位的规定和政策,国家关于人力资源的法律法规、公司关于人力资源的条例规程,员工特有的其他文件等等。这些特征分散在不同的文件中,当用户需要针对模糊特征的文件进行处理时,哪些文件被当成是“人力资源相关文件”需要根据特征的优先级和特征与文件的相关程度而定。因此,为所有相关文件设定优先级和隶属度,当用户查询时,将根据优先级的高低和隶属度的大小排序后的文件列表提供给用户,使得优先展示的文件更满足用户的主观判断,从而节省了用户的主观判断时间。用户需要划定优先级和隶属度下限值,下限以下的文件都不作为“人力资源文件”,下限以上的文件才被作为搜索结果加以显示。
[0046] 图1是本发明管理方法的总体流程框图。
[0047] 首先,文件搜索引擎对硬盘上的所有用户文件进行遍历检索并提取每个文件在NTFS系统中的特征,典型特征有文件名和文件类型等。
[0048] 第二,模糊矩阵生成器根据用户文件的每个特征,生成文件隶属度的模糊矩阵集合,即隶属度模糊矩阵。模糊矩阵的具体生成步骤如下:
[0049] (一)按照已设定的特征的优先级,为用户文件建立特征稀疏矩阵;
[0050] (二)获取每个文件中的每一个特征的隶属度,具体生成过程参见图2、3、4。
[0051] 图2是图1中用户文件的处理流程图。在本发明实施例中,该程序会对诸如具有“人力资源文件”这样模糊特征的文件进行处理,确定文件针对该特征的优先级和隶属度。在处理用户文件的流程中,首先初始化已处理文件表和文件特征管理总表;然后提取用户文件;判断该文件是否已经处理,如果处理过则提取下一个用户文件,若该文件未处理过则处理该文件,并更新已处理文件表和文件特征管理总表。
[0052] 图3是图2中处理该文件的流程图,当用户文件为新的未处理过的用户文件时,则提取文件的所有特征并生成该文件的特征管理表,同时根据该特征管理表,生成单个文件特征稀疏矩阵,矩阵的非零元表示文件的的特征。若该用户文件是处理过的用户文件,则找到该用户文件已有的文件特征管理表及对应的文件特征稀疏矩阵;然后读取文件特征管理表中的每个特征,对每个特征进行处理。
[0053] 图4则显示了对文件特征管理表中一个特征进行处理的流程。首先判定该特征是否已经处理过,若处理过则返回文件处理;若没有处理过则判断该特征是否为新特征,若不为新特征,则直接读取该特征的隶属度值,若该特征为新特征则生成该特征的隶属度值,该值由二元对比排序法生成;最后更新文件的特征管理表。
[0054] 经过上述处理即可获得一个文件中包含的一个特征的隶属度值。
[0055] 表1是某一文件的文件特征管理表示例。文件特征管理表包括特征的名称或描述,在示例中用大写字母A、B、C表示,代表了用户所需要表示的特征。优先级代表了文件与特征的相关级别,优先级高的特征,表明该特征相对该文件的重要程度也高,优先级高的特征将被优先提供给用户使用。隶属度表示该文件与各个特征的具体相关程度,在优先级相同的情况下,隶属度高的文件将被优先提供给用户使用。
[0056] 表1文件特征管理表
[0057]特征 A B C D
优先级 1 2 3 4
隶属度 0.75 0.88 0.63 0.44
[0058] (三)生成隶属度模糊集
[0059] 在经过上述的文件处理,获得每个文件相对每个特征的隶属度后,将包含同一特征的所有文件的隶属度生成模糊集;如表2所示,包含人力资源特征的文件有“员工绩效信息”、“员工考核评价”、“员工基本信息”、“员工岗位规定”、“公司人力制度”。
[0060] 表2人力资源文件管理表
[0061]文件 员工绩效信息 员工考核评价 员工基本信息 员工岗位规定 公司人力制度
优先级 1 1 3 2 4
隶属度 0.78 0.84 0.60 0.65 0.43
[0062] (四)将所有特征的模糊集组合形成隶属度模糊矩阵,隶属度模糊矩阵为总特征稀疏矩阵,矩阵中的一个非零元对应了一个模糊集。该矩阵优选对角线稀疏矩阵。模糊集中的元素按隶属度高低顺序排列。
[0063] 第三,获得模糊矩阵后用户即可进行文件操作。
[0064] 根据用户指定的文件特征,调用模糊矩阵,按照该特征对应的模糊集,沥出模糊集中隶属度对应的文件,并且按隶属度由高到低输出。如图1所示,用户可以通过自己开发的应用程序通过文件查询器中的模糊数据处理接口对文件进行操作,也就是说,用户可以在模糊处理接口中输入用户需要检索的特征及所需的优先级下限和隶属度下限,找出符合条件的文件。
[0065] 比如查询“人力资源”这个特征时,假设用户设定优先级下限值为3,隶属度下限值为0.70。如果将二者的关系设定为“或”,则搜索结果将显示优先级高于3级,隶属度高于0.70的所有文件。则“员工绩效信息”、“员工考核评价”、“员工岗位规定”这三个文件,全部成为搜索结果;“员工基本信息”,虽然优先级符合要求,但是隶属度低于0.70,不能成为搜索结果;“公司人力制度”,同样不能成为搜索结果。如果将二者的关系设定为“与”,则仅“员工绩效信息”、“员工考核评价”这两个个文件成为搜索结果,“员工岗位规定”由于隶属度低于0.70,不作为搜索结果。搜索结果按照优先级和隶属度的高低顺序以二维的形式列出给用户。