一种正则化RBF网络多标签分类方法转让专利

申请号 : CN201510213367.6

文献号 : CN105046323B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 孙霞王佳荣冯筠陈勇吴宁海

申请人 : 西北大学西安麦多信息科技有限公司陕西瑞海电力工程有限公司

摘要 :

本发明公开了一种正则化RBF网络多标签分类方法,属于多标签分类技术领域。采用的技术方案为:(1)构造RBF网络,包括构造网络输入层结点、隐藏层结点、输出层结点;(2)用训练数据训练RBF网络;(3)利用RBF网络预测标签。本发明方法在对多标签分类算法的设计中,利用正则化技巧,聚类速度快、泛化性能好,能够有效增强RBF网络的泛化性能。

权利要求 :

1.一种正则化RBF网络多标签分类方法,其特征在于,包括以下步骤:步骤1:构建RBF网络;

包括构造网络的输入层结点、隐藏层结点及输出层结点;

输入层结点,由n个结点组成,每一个结点对应输入样本向量的一个特征;

隐藏层结点,依次对多标签数据集对应的标签集中的每一个标签l的正样本集Ul进行聚类,聚类之后得到k=α·|Ul|个聚类中心,α为常量参数;所有的标签聚类形成的聚类中心构成了径向基函数RBF的隐藏层结点;

输出层结点,由q个结点组成,每一个输出层结点都是一个潜在的输出标签;

所述的RBF网络构建,具体包括以下步骤:

1)设 或者 表示维度为n的样本空间;其中, 表示维度为n的实数空间, 表示维度为n的复数空间; 表示具有q个可能的类标签的标签空间,多标签训练集为:包含m个样本数据, 是一个n维的特征向量, 是与xi相对应的标签集;

网络的输入层由n个结点组成,用于将n维的样本xi输入网络;

2)对标签空间 中的每一个标签yl的正样本集Ul进行聚类,具体包括以下步骤:

(1)标签集合 中的每一个标签yl,找出正样本集合Ul={xj|(xj,Yj)∈D,yjl∈Yj,yjl>0};

其中,(xj,Yj)为多标签训练集 中的一个样本, 是一个n维的特征向量,是与xj相对应的标签集,yjl是集合Yj的一个元素;

(2)利用SOM聚类法,对正样本集合Ul聚类,聚类之后得到k个聚类中心,k=α·|Ul|,α为常量参数,形成聚类中心为向量cl,cl={cl1,…,clk};

(3)重复步骤(1)和(2),直至标签集中的每一个标签对应的正样本集合都聚类产生聚类中心,并将这些聚类中心合并,得到网络隐藏层结点为向量c,c={c1,…,cl,…,cq},隐藏层结点数量为L,

3)标签空间 的维度为q,网络的输出层结点由q个结点组成,一个输出结点对应标签空间中的一个标签,则网络输出为向量f:向量f=[f1,f2,...,fq];

向量f的每一个分量值fl对应网络的一个输出结点的输出值;

步骤2:用训练数据训练RBF网络;

建立带正则项的RBF网络多标签分类模型,选取公开多标签数据集,选择其中的一部分作为训练数据集,对RBF网络多标签分类器进行正则参数寻优,得到连接隐藏层和输出层的权值矩阵;

具体包括以下步骤:

1)对于样本xj, 是一个n维的特征向量,RBF网络输出层的第l个输出结点,其输出值fl形式化的定义如下:设:

β为连接隐藏层和输出层的权值矩阵,βil为矩阵β的第i行第l列元素,L为网络的隐藏层结点数量,m为多标签训练集的总训练样本数量;φi(xj,ci)为RBF网络的隐藏层结点ci在网络输入样本为xj时,隐藏层结点ci的输出函数值;

RBF网络的隐藏层函数采用高斯函数作为径向基函数,则φi(xj,ci)函数形式化的定义如下:其中,ci为径向基函数φi(·)的中心,即RBF网络隐藏层结点,σ称为径向基函数的扩展常数,反应函数图像的宽度,通过计算每对网络隐藏层结点之间的距离来获得,形式化的定义为:其中,μ为调节参数,为网络的隐藏层结点数量,ct和ch为网络隐藏层结点;

则,RBF网络输出向量f=[f1,f2,...,fq]形式化的定义为:f=Hβ    (6)

向量f的每一个分量值fl为网络的一个输出结点的输出值;

2)最小化网络输出误差值,如下式:

其中,T为多标签训练集的m个训练样本的目标标签矩阵,f为RBF网络输出向量,λΩ(f)为正则项,λ为正则参数;

则有,最小化 等价于:

minw(||Hβ-T||+λβ)    (8)利用岭回归的方法求解,隐藏层和输出层的权值矩阵β表示为:β=(HTH+λI)-1HTT    (9);

其中,I为单位矩阵;

3)选取若干个公开多标签数据集,利用每个多标签数据集的训练数据集训练RBF网络,寻找RBF网络多标签分类器在每一个数据集上的最优正则化参数λ,优化得到连接隐藏层和输出层的权值矩阵β;

步骤3:利用RBF网络预测标签;

对于RBF网络的输出层结点,设定常量0为阈值;利用连接隐藏层和输出层的权值矩阵值,得出网络中每个结点的输出值,比较每个结点输出值与阈值0的大小关系,大于阈值0的作为样本的潜在标签,实现多标签分类;

RBF网络多标签分类器预测的标签为标签集h(xi):其中,xi为多标签数据集的第i个样本, 是一个n维的特征向量,yl为标签空间中的一个标签,fl为网络的一个输出结点的输出值,t(xi)为阈值函数,设为常量0;

比较fl和0的大小,若大于0,则标签yl为xi的潜在的一个标签。

2.根据权利要求1所述的一种正则化RBF网络多标签分类方法,其特征在于,步骤2所述的训练RBF网络的公开多标签数据集为流行的公开多标签数据集,采用Yeast数据集、Scene数据集、Genbase数据集、Emotions数据集、Enron数据集或TMC2007数据集。

说明书 :

一种正则化RBF网络多标签分类方法

技术领域

[0001] 本发明属于多标签分类技术领域,具体涉及一种正则化RBF网络多标签分类方法。

背景技术

[0002] 在传统机器学习的框架下,分类问题研究如何将待分类样本准确的划分到唯一的某一类中。如果候选类别只有两个,这类问题被称作二值分类问题。如果候选类别有多个,这类问题被称作多类分类问题。二值分类问题和多类分类问题都是单标签分类问题。然而,在真实世界中,同时具有多个概念标记的歧义性对象广泛存在。例如在文档分类中,每篇文档可能同时属于多个主题,从不同的角度分析一篇新闻报道,可将其划分为“政治”和“经济”类;在功能基因组研究中,每个基因可能同时具有“新陈代谢”和“转录”等多种功能;在场景分类中,每幅图像可能同时包含“海滩”和“落日”等多种语义信息。这样的分类问题被称作多标签分类问题。
[0003] M.-L.Zhang.ML-RBF:RBF neural networks for multi-label learning.Neural Processing Letters,2009,29(2):61-74.提出了RBF神经网络的多标签分类算法,该方法包括:首先,对于训练集中的每一个标签,利用Kmeans算法对其聚类,聚类得出的中心点作为RBF的隐藏层节点;其次,通过最小化平方和误差函数解得输出层权重向量。但是该方法没有进行正则化处理,使得分类结果不能达到最优的效果。
[0004] M.-L.Zhang,Z.-J.Wang.MIMLRBF:RBF neural networks for multi-instance multi-label learning.Neurocomputing,2009,72(16-18):3951-3956.提出了多实例多标签问题的RBF神经网络算法,该方法包括:首先,对于训练集中的每一个标签,利用k-MEDOIDS算法对其聚类,聚类得出的中心点作为网络的隐藏层神经元;其次,通过最小化平方和误差函数,优化隐藏层神经元与输出层神经元之间的权值矩阵。该方法是针对多实例多标签问题的,不能直接用于解决单独的多标签分类问题,并且该方法也没有进行正则化处理,使得分类方法不能得到最优的分类结果。
[0005] 上述RBF网络多标签分类方法,都没有使用正则化技术,限制了分类方法的分类结果,降低了分类方法的泛化性能。

发明内容

[0006] 为了克服上述现有技术存在的缺陷,本发明的目的在于提供一种正则化RBF网络多标签分类方法,该方法聚类速度快、泛化性能好,能够增强RBF网络的泛化性能。
[0007] 本发明是通过以下技术方案来实现:
[0008] 一种正则化RBF网络多标签分类方法,包括以下步骤:
[0009] 步骤1:构建RBF网络
[0010] 包括构造网络的输入层结点、隐藏层结点及输出层结点;
[0011] 输入层结点,由n个结点组成,每一个结点对应输入样本向量的一个特征;
[0012] 隐藏层结点,依次对数据集对应的标签集中的每一个标签 的正样本集 进行聚类,聚类之后得到 个聚类中心,α为常量参数;所有的标签聚类形成的聚类中心构成了径向基函数RBF的隐藏层结点;
[0013] 输出层结点,由q个结点组成,每一个输出层结点都是一个潜在的输出标签;
[0014] 步骤2:用训练数据训练RBF网络
[0015] 建立带正则项的RBF网络多标签分类模型,选取公开多标签数据集,选择其中的一部分作为训练数据集,对RBF网络多标签分类器进行正则参数寻优,得到连接隐藏层和输出层的权值矩阵;
[0016] 步骤3:利用RBF网络预测标签
[0017] 对于RBF网络的输出层结点,设定常量0为阈值;利用连接隐藏层和输出层的权值矩阵值,得出网络中每个结点的输出值,比较每个结点输出值与阈值0的大小关系,大于阈值0的作为样本的潜在标签,实现多标签分类。
[0018] 步骤1所述的RBF网络构建,具体包括以下步骤:
[0019] 1)设 或者 表示维度为n的样本空间;其中, 表示维度为n的实数空间, 表示维度为n的复数空间; 表示具有q个可能的类标签的标签空间,
多标签训练集为:
[0020]
[0021] 包含m个样本数据, 是一个n维的特征向量 是与xi相对应的标签集;
[0022] 网络的输入层由n个结点组成,用于将n维的样本xi输入网络;
[0023] 2)对标签空间 中的每一个标签 的正样本集 进行聚类;
[0024] 3)标签空间 的维度为q,网络的输出层结点由q个结点组成,一个输出结点对应标签空间中的一个标签,则网络输出为向量f:
[0025] 向量f=[f1,f2,…,fq];
[0026] 向量f的每一个分量值 对应网络的一个输出结点的输出值。
[0027] 步骤2)所述对正样本集 进行聚类的具体步骤为:
[0028] (1 )标签集合 中的每一个标签 找出正样本集合
[0029] 其中,(xj,Yj)为多标签训练集 中的一个样本, 是一个n维的特征向量,是与xj相对应的标签集, 是集合Yj的一个元素;
[0030] (2)利用SOM聚类法,对正样本集合 聚类,聚类之后得到k个聚类中心,α为常量参数,形成聚类中心为向量
[0031] (3)重复步骤(1)和(2),直至标签集中的每一个标签对应的正样本集合都聚类产生聚类中心,并将这些聚类中心合并,得到网络隐藏层结点为向量c,隐藏层结点数量为L,
[0032] 步骤2所述训练RBF网络,具体包括以下步骤:
[0033] 1)对于样本xj, 是一个n维的特征向量,RBF网络输出层的第 个输出结点,其输出值 形式化的定义如下:
[0034]
[0035] 设:
[0036]
[0037]
[0038] β为连接隐藏层和输出层的权值矩阵, 为矩阵β的第i行第 列元素,L为网络的隐藏层结点数量,m为多标签训练集的总训练样本数量;φi(xj,ci)为RBF网络的隐藏层结点ci在网络输入样本为xj时,隐藏层结点ci的输出函数值;
[0039] RBF网络的隐藏层函数采用高斯函数作为径向基函数,则φi(xj,ci)函数形式化的定义如下:
[0040]
[0041] 其中,ci为径向基函数φi(·)的中心,即RBF网络隐藏层结点,σ称为径向基函数的扩展常数,反应函数图像的宽度,通过计算每对网络隐藏层结点之间的距离来获得,形式化的定义为:
[0042]
[0043] 其中,μ为调节参数,为网络的隐藏层结点数量,ct和ch为网络隐藏层结点;
[0044] 则,RBF网络输出向量f=[f1,f2,…,fq]形式化的定义为:
[0045] f=Hβ    (6)
[0046] H和β定义如式(2)和式(3),向量f的每一个分量值 为网络的一个输出结点的输出值,定义如式(1)所示;
[0047] 2)最小化网络输出误差值,如下式:
[0048]
[0049] 其中,T为多标签训练集的m个训练样本的目标标签矩阵,f为RBF网络输出向量,λΩ(f)为正则项,λ为正则参数;
[0050] 则有,最小化 等价于:
[0051] minw(||Hβ-T||+λβ)    (8)
[0052] 利用岭回归的方法求解,隐藏层和输出层的权值矩阵β表示为:
[0053] β=(HTH+λI)-1HTT    (9);
[0054] 其中,I为单位矩阵;
[0055] 3)选取若干个公开多标签数据集,利用每个多标签数据集的训练数据集训练RBF网络,寻找RBF网络多标签分类器在每一个数据集上的最优正则化参数λ,优化得到连接隐藏层和输出层的权值矩阵β。
[0056] 步骤2所述的训练RBF网络的公开多标签数据集为流行的公开多标签数据集,为:Yeast数据集、Scene数据集、Genbase数据集、Emotions数据集、Enron数据集或TMC2007数据集。
[0057] 步骤3所述利用RBF网络预测标签,RBF网络多标签分类器预测的标签为标签集h(xi):
[0058]
[0059] 其中,xi为多标签数据集的第i个样本, 是一个n维的特征向量, 为标签空间 中的一个标签, 为网络的一个输出结点的输出值,t(xi)为阈值函数,设为常量0;比较 和0的大小,若大于0,则标签 为xi的潜在的一个标签。
[0060] 与现有技术相比,本发明具有以下有益的技术效果:
[0061] 本发明首先构造RBF网络结构,RBF网络具有结构简单、全局最优、训练速度快的优点,很适合解决分类问题;其次,为了提高分类方法的速度,RBF网络的隐藏层结点使用SOM(Self Organization Map)聚类方法得到;然后,在训练RBF网络过程中,采用正则化技术在训练出网络参数,通过参数值进一步计算出多标签分类方法的函数输出值,最后将输出值与阈值函数比较,根据比较结果预测出标签,从而完成多标签分类任务。本发明改用聚类速度更快的SOM聚类方法,并且加入正则化技术,增强了RBF神经网络的泛化性能。

附图说明

[0062] 图1为多标签RBF网络结构;
[0063] 图2为SOM结构图;
[0064] 图3为训练RBF网络流程图;
[0065] 图4为预测Yeast测试数据集标签流程图。

具体实施方式

[0066] 下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。
[0067] 本发明公开了一种正则化RBF网络多标签分类方法(Regularized RBF Neural Network Multi-label Classification Algorithm,R-RBF-ML),包括以下步骤:
[0068] 步骤1:构建RBF网络,包括构造网络输入层结点、隐藏层结点、输出层结点;
[0069] 输入层:网络的输入层由n个结点组成,每个结点对应输入样本向量的一个特征。
[0070] 隐藏层:在隐含层,依次对数据集对应的标签集中的每一个标签 的正样本集进行聚类,聚类之后得到 个聚类中心,α为常量参数, 表示正样本集的大小。所有的标签聚类形成的聚类中心构成了径向基函数RBF的隐藏层结点。
[0071] 输出层:输出层结点由q个结点组成,每一个输出结点都是一个可能的输出标签。
[0072] 步骤2:用训练数据训练RBF网络;
[0073] 建立带正则项的RBF网络多标签分类模型,选取公开多标签数据集,选择一部分作为训练数据集,对RBF网络多标签分类器进行正则参数寻优,同时优化连接隐藏层和输出层的权值矩阵。
[0074] 步骤3:利用RBF网络预测标签。
[0075] 对于RBF网络的输出结点,设定常量0为阈值,比较网络的每个结点输出值与0的大小关系,大于0的作为样本可能的标签。
[0076] 步骤1所述RBF网络构建包括:
[0077] (1 )设 表示维度为n的实数空间 或者复数空间表示具有q个可能的类标签的标签空间,多标签训练集为
包 含m 个样 本数 据 , 是 一个 n维的 特征向 量 ,
是与xi相对应的标签集;网络的输入层由n个结点组成,用于将
n维的样本xi输入网络。
[0078] (2)对标签空间 中的每一个标签 的正样本集 进行聚类,具体步骤为:
[0079] ●标签集合 中的每一个标签 找出正样本集合
[0080]
[0081] 其中,(xj,Yj)为多标签训练集 中的一个样本, 是一个n维的特征向量,是与xj相对应的标签集, 是集合Yj的一个元素。
[0082] ●利用SOM对正样本集合 聚类,聚类之后得到 个聚类中心,α为常量参数, 表示正样本集的大小,聚类之后形成聚类中心为向量
[0083] 参见图2,是SOM结构图,SOM自组织特征映射模型是一个两层结构。一层为输入层,另一层为输出层。输出层为二维的格形,输出层神经元与输入层的每个结点都有连接。
[0084] ●重复以上两个步骤,直到标签集中的每一个标签对应的正样本集合都聚类产生聚类中心,合并这些聚类中心。
[0085] 经过以上三步操作,找出网络隐藏层结点为向量c, 网络的隐藏层结点数量为L,
[0086] (3)标签空间 的维度为q,所以网络的输出层结点由q个结点组成,一个输出结点对应标签空间中的一个标签,网络输出为向量f=[f1,f2,…,fq],向量f的每一个分量值 对应网络的一个输出结点的输出值。
[0087] 步骤2所述训练RBF网络,包括以下步骤:
[0088] 训练RBF网络包括:
[0089] (1)RBF网络输出层的每一个结点的输出值 可以形式化的定义如下:
[0090]
[0091] 若设
[0092] β为连接隐藏层和输出层的权值矩阵, 为矩阵β的第i行第 列元素,L为网络的隐藏层结点数量,m为多标签训练集的总训练样本数量。φi(xj,ci)为RBF网络的隐藏层结点ci在网络输入样本为xj时,隐藏层结点ci的输出函数值,RBF网络的隐藏层函数采用高斯函数作为径向基函数,则φi(xj,ci)函数形式化的定义如下:
[0093]
[0094] 其中,ci为径向基函数φi(·)的中心,即RBF网络隐藏层结点,σ称为径向基函数的扩展常数,反应函数图像的宽度,通过计算每对网络隐藏层结点之间的距离来获得,形式化的定义为:
[0095]
[0096] 其中,μ为调节参数,L为网络的隐藏层结点数量,ct和ch为网络隐藏层结点;
[0097] 则RBF网络输出向量f=[f1,f2,…,fq]可以形式化的定义为:
[0098] f=Hβ     (6)
[0099] 其中H和β的定义如式(2)和式(3)所示。
[0100] (2)最小化网络输出误差值,需要最小化如下公式:
[0101]
[0102] 其中,T为多标签训练集的m个训练样本的目标标签矩阵,f为RBF网络输出向量,λΩ(f)为正则项,λ为正则参数。正则项也被称为权值衰减、惩罚项、函数光滑或平坦、权值修剪、先验概率、和最大间隔等。正则化技术有利于改善神经网络的泛化性能。
[0103] 最小化 等价于:
[0104] minw(||Hβ-T||+λβ)    (8)
[0105] 其中H和β的定义如式(2)和式(3)所示。
[0106] 利用岭回归的方法求解,隐藏层和输出层的权值矩阵β可以表示为:
[0107] β=(HTH+λI)-1HTT      (9)
[0108] (3)选取6个公开多标签数据集,分别为Yeast数据集、Scene数据集、Genbase数据集、Emotions数据集、Enron数据集和TMC2007数据集,数据集的描述如表1所示,其中标签的基即每一个对象的平均标签数量,若标签的基记为LC,则表达式为 标签密度是在标签空间内对标签的基的归一化,计算表达式为: 利用数据集对RBF网络进行正则参数λ寻优,同时优化连接隐藏层和输出层的权值矩阵β。
[0109] 表1公开数据集
[0110]
[0111] RBF网络多标签分类器预测的标签为标签集h(xi),其中xi为多标签数据集的第i个样本, 是一个n维的特征向量, 为标签空间
中的一个标签, 为网络的一个输出结点的输出值,t(xi)为阈值函数,设
为常量0,比较 和0的大小,若大于0,则标签 为xi的可能的一个标签。
[0112] 实施例
[0113] 本实例以Yeast数据集为例,数据集属于生物学领域,包括1500个训练样本和917个测试样本,训练样本用于训练多标签分类系统,测试样本作为未知标签的样本,用于标签预测。Yeast数据集有103维特征和14个标签,平均标签数量为4.24,标签密度为0.303。
[0114] 正则化RBF网络多标签分类方法,如图1所示,利用包含1500个样本的训练数据集构造RBF网络包括3个步骤,具体流程如下:
[0115] 步骤1:网络输入层包括103个结点;
[0116] 步骤2:对数据集的维度为14的标签空间 中的每一个标签 在训练数据集中找出正样本集 进行聚类,具体步骤为:
[0117] 1)标签集合 中的标签y1,在训练数据集中找出正样本集合U1,U1={xj|(xj,Yj)∈D,yj1∈Yj,yj1>0},(xj,Yj)为第j个样本,yj1为标签集Yj的第一个标签,集合U1包含元素个数为|U1|=476,即有476个正样本;
[0118] 2)利用SOM法对正样本集合U1聚类,聚类中心数量为k,k=α·|U1|,α为0.01,则k=5,最终形成包含5个元素的聚类中心向量c1,c1={c1,1,…,c1,5};
[0119] 3)重复以上两个步骤,直到标签集中的14个标签对应的正样本集合都聚类产生聚类中心,合并这些聚类中心。
[0120] 经过以上三步操作,找出网络隐藏层结点为向量c, 网络的隐藏层结点数量为L,
[0121] 步骤3:网络的输出层包括14个结点,网络输出向量f=[f1,f2,…,f14]。
[0122] 如图3所示,利用包含1500个样本的训练数据集作为网络的输入,训练RBF网络具体流程如下:
[0123] 1)根据训练样本解出 其中
[0124]
[0125] φi(xj,ci)为RBF网络的隐藏层结点ci在网络输入样本为xj时,隐藏层结点ci的输出函数值,xj为1500个样本中的第j个样本,ci为网络的第i个隐藏层结点,σ为径向基函数的扩展常数,μ为调节参数,且μ=1,ct和ch为网络隐藏层结点;
[0126] 2)优化连接隐藏层和输出层的权值矩阵β
[0127] (1)隐藏层和输出层的权值矩阵β
[0128] β=(HTH+λI)-1HTT
[0129] 其中,矩阵T为训练数据集的1500行14列的标签矩阵,I为69行69列的单位矩阵。
[0130] (2)优化权值矩阵β即优化正则项λ。为了获得最优参数λ,λ的
[0131] 值被依次设置为27,26,…,2-3,依次解出相应的权值矩阵β。Average precision是一个流行的多标签评价指标,它被作为调节正则参数λ和β的依据。
[0132] 如图4所示,预测Yeast测试数据集的标签,测试数据集包括917个样本数据,具体流程如下:
[0133] (1)RBF网络输出向量f=[f1,f2,…,f14],f=Htestβ,其中
[0134]
[0135] (x1,c1)为第1个样本在第1个隐藏层结点上的输出值,其余以此类推。β为RBF网络隐藏层和输出层的权值矩阵。
[0136] (2)对向量f=[f1,f2,…,f14]的每一个分量值fA∈f,RBF网络多标签分类器预测的标签为标签集h(xi), 大于0的分量值 对应的标签即为样本xi的预测标签。
[0137] 选择Hamming loss,One-error,Coverage,Ranking loss,Average-precision这5个流行的多标签评价指标,结果参见表2-7所示,评估方法的性能:
[0138] 选择传统的ML-RBF(Multi-label RBF neural network)、Rank-SVM、BP-MLL(Back-Propagation for Multi-label Learning)、ML-KNN(Multi-label k Nearest Neighbor)和MLNB(Multi-label Naive Bayes)多标签分类算法与正则化RBF网络多标签分类算法进行比较。得到结果如表2~7所示:
[0139] 表2在6个数据集上各算法的Hamming loss
[0140]
[0141] Hamming loss作为流行的多标签分类方法评价指标,在评价时,Hamming loss值越小多标签分类方法越好,在表2中,最好的结果被加粗显示,从表2中可以看出,正则化RBF网络多标签分类方法(R-RBF-ML)在所有的数据集上均取得了最好的结果。因此,根据Hamming loss评价指标,正则化RBF网络多标签分类方法是所有多标签分类方法中最好的。其中BP-MLL和MLNB计算复杂度太高,无法对TMC2007数据集进行分类,因此没有相应的Hamming loss值。
[0142] 表3在6个数据集上各算法的Coverage
[0143]
[0144] Coverage作为流行的多标签分类方法评价指标,在评价时,Coverage值越小多标签分类方法越好,在表3中,最好的结果被加粗显示,从表3中可以看出,在6个数据集上,正则化RBF网络多标签分类方法(R-RBF-ML)在其中4个数据集上都取得了最好的结果。因此,根据Coverage评价指标,正则化RBF网络多标签分类方法是所有多标签分类方法中相对最好的。其中BP-MLL和MLNB计算复杂度太高,无法对TMC2007数据集进行分类,因此没有相应的Coverage值。
[0145] 表4在6个数据集上各算法的One error
[0146]
[0147] One error作为流行的多标签分类方法评价指标,在评价时,One error值越小多标签分类方法越好,在表4中,最好的结果被加粗显示,从表4中可以看出,正则化RBF网络多标签分类方法(R-RBF-ML)在所有的数据集上均取得了最好的结果。因此,根据One error评价指标,正则化RBF网络多标签分类方法是所有多标签分类方法中最好的。其中,BP-MLL和MLNB计算复杂度太高,无法对TMC2007数据集进行分类,因此没有相应的One error值。
[0148] 表5在6个数据集上各算法的Average precision
[0149]
[0150]
[0151] Average precision作为流行的多标签分类方法评价指标,在评价时,Average precision值越大多标签分类方法越好,在表5中,最好的结果被加粗显示,从表5中可以看出,正则化RBF网络多标签分类方法(R-RBF-ML)在所有的数据集上均取得了最好的结果,因此,根据Average precision评价指标,正则化RBF网络多标签分类方法是所有多标签分类方法中最好的。其中BP-MLL和MLNB计算复杂度太高,无法对TMC2007数据集进行分类,因此没有相应的Average precision值。
[0152] 表6在6个数据集上各算法的Ranking loss
[0153]
[0154]
[0155] Ranking loss作为流行的多标签分类方法评价指标,在评价时,Ranking loss值越小多标签分类方法越好,在表6中,最好的结果被加粗显示,从表6中可以看出,在6个数据集上,正则化RBF网络多标签分类方法(R-RBF-ML)在其中4个数据集上都取得了最好的结果。因此,根据Ranking loss评价指标,正则化RBF网络多标签分类方法是所有多标签分类方法中相对最好的。其中BP-MLL和MLNB计算复杂度太高,无法对TMC2007数据集进行分类,因此没有相应的Coverage值。
[0156] 表7在6个数据集上各算法的运行时间
[0157]
[0158]
[0159] 从表7中可以看出,在RBF网络多标签分类方法中,正则化RBF网络多标签分类方法(R-RBF-ML)消耗的网络训练时间少于ML-RBF方法,尤其在大型数据集TMC2007上更加明显。与其他多标签分类方法相比,正则化RBF网络多标签分类方法(R-RBF-ML)的时间多于ML-kNN多标签分类方法。
[0160] 综合表2~表7可以总结出,本发明的正则化RBF网络多标签分类方法(R-RBF-ML)在消耗较少时间的条件下取得了最好的分类效果。