一种正则化RBF网络多标签分类方法转让专利

申请号 : CN201510213367.6

文献号 : CN105046323B

文献日 : 2017-03-22

相似专利: 请登录后查看

本发明公开了一种正则化RBF网络多标签分类方法，属于多标签分类技术领域。采用的技术方案为：(1)构造RBF网络，包括构造网络输入层结点、隐藏层结点、输出层结点；(2)用训练数据训练RBF网络；(3)利用RBF网络预测标签。本发明方法在对多标签分类算法的设计中，利用正则化技巧，聚类速度快、泛化性能好，能够有效增强RBF网络的泛化性能。

1.一种正则化RBF网络多标签分类方法，其特征在于，包括以下步骤：步骤1：构建RBF网络；

包括构造网络的输入层结点、隐藏层结点及输出层结点；

输入层结点，由n个结点组成，每一个结点对应输入样本向量的一个特征；

隐藏层结点，依次对多标签数据集对应的标签集中的每一个标签l的正样本集Ul进行聚类，聚类之后得到k＝α·|Ul|个聚类中心，α为常量参数；所有的标签聚类形成的聚类中心构成了径向基函数RBF的隐藏层结点；

输出层结点，由q个结点组成，每一个输出层结点都是一个潜在的输出标签；

所述的RBF网络构建，具体包括以下步骤：

1)设或者表示维度为n的样本空间；其中，表示维度为n的实数空间，表示维度为n的复数空间；表示具有q个可能的类标签的标签空间，多标签训练集为：包含m个样本数据，是一个n维的特征向量，是与xi相对应的标签集；

网络的输入层由n个结点组成，用于将n维的样本xi输入网络；

2)对标签空间中的每一个标签yl的正样本集Ul进行聚类，具体包括以下步骤：

(1)标签集合中的每一个标签yl，找出正样本集合Ul＝{xj|(xj,Yj)∈D,yjl∈Yj，yjl＞0}；

其中，(xj,Yj)为多标签训练集中的一个样本，是一个n维的特征向量，是与xj相对应的标签集，yjl是集合Yj的一个元素；

(2)利用SOM聚类法，对正样本集合Ul聚类，聚类之后得到k个聚类中心，k＝α·|Ul|，α为常量参数，形成聚类中心为向量cl，cl＝{cl1,…,clk}；

(3)重复步骤(1)和(2)，直至标签集中的每一个标签对应的正样本集合都聚类产生聚类中心，并将这些聚类中心合并，得到网络隐藏层结点为向量c，c＝{c1,…,cl,…,cq}，隐藏层结点数量为L，

3)标签空间的维度为q，网络的输出层结点由q个结点组成，一个输出结点对应标签空间中的一个标签，则网络输出为向量f：向量f＝[f1,f2,...,fq]；

向量f的每一个分量值fl对应网络的一个输出结点的输出值；

步骤2：用训练数据训练RBF网络；

建立带正则项的RBF网络多标签分类模型，选取公开多标签数据集，选择其中的一部分作为训练数据集，对RBF网络多标签分类器进行正则参数寻优，得到连接隐藏层和输出层的权值矩阵；

具体包括以下步骤：

1)对于样本xj，是一个n维的特征向量，RBF网络输出层的第l个输出结点，其输出值fl形式化的定义如下：设：

β为连接隐藏层和输出层的权值矩阵，βil为矩阵β的第i行第l列元素，L为网络的隐藏层结点数量，m为多标签训练集的总训练样本数量；φi(xj，ci)为RBF网络的隐藏层结点ci在网络输入样本为xj时，隐藏层结点ci的输出函数值；

RBF网络的隐藏层函数采用高斯函数作为径向基函数，则φi(xj，ci)函数形式化的定义如下：其中，ci为径向基函数φi(·)的中心，即RBF网络隐藏层结点，σ称为径向基函数的扩展常数，反应函数图像的宽度，通过计算每对网络隐藏层结点之间的距离来获得，形式化的定义为：其中，μ为调节参数，为网络的隐藏层结点数量，ct和ch为网络隐藏层结点；

则，RBF网络输出向量f＝[f1,f2,...,fq]形式化的定义为：f＝Hβ (6)

向量f的每一个分量值fl为网络的一个输出结点的输出值；

2)最小化网络输出误差值，如下式：

其中，T为多标签训练集的m个训练样本的目标标签矩阵，f为RBF网络输出向量，λΩ(f)为正则项，λ为正则参数；

则有，最小化等价于：

minw(||Hβ-T||+λβ) (8)利用岭回归的方法求解，隐藏层和输出层的权值矩阵β表示为：β＝(HTH+λI)-1HTT (9)；

其中，I为单位矩阵；

3)选取若干个公开多标签数据集，利用每个多标签数据集的训练数据集训练RBF网络，寻找RBF网络多标签分类器在每一个数据集上的最优正则化参数λ，优化得到连接隐藏层和输出层的权值矩阵β；

步骤3：利用RBF网络预测标签；

对于RBF网络的输出层结点，设定常量0为阈值；利用连接隐藏层和输出层的权值矩阵值，得出网络中每个结点的输出值，比较每个结点输出值与阈值0的大小关系，大于阈值0的作为样本的潜在标签，实现多标签分类；

RBF网络多标签分类器预测的标签为标签集h(xi)：其中，xi为多标签数据集的第i个样本，是一个n维的特征向量，yl为标签空间中的一个标签，fl为网络的一个输出结点的输出值，t(xi)为阈值函数，设为常量0；

比较fl和0的大小，若大于0，则标签yl为xi的潜在的一个标签。

2.根据权利要求1所述的一种正则化RBF网络多标签分类方法，其特征在于，步骤2所述的训练RBF网络的公开多标签数据集为流行的公开多标签数据集，采用Yeast数据集、Scene数据集、Genbase数据集、Emotions数据集、Enron数据集或TMC2007数据集。

一种正则化RBF网络多标签分类方法

技术领域

[0001] 本发明属于多标签分类技术领域，具体涉及一种正则化RBF网络多标签分类方法。

背景技术

[0002] 在传统机器学习的框架下，分类问题研究如何将待分类样本准确的划分到唯一的某一类中。如果候选类别只有两个，这类问题被称作二值分类问题。如果候选类别有多个，这类问题被称作多类分类问题。二值分类问题和多类分类问题都是单标签分类问题。然而，在真实世界中，同时具有多个概念标记的歧义性对象广泛存在。例如在文档分类中，每篇文档可能同时属于多个主题，从不同的角度分析一篇新闻报道，可将其划分为“政治”和“经济”类；在功能基因组研究中，每个基因可能同时具有“新陈代谢”和“转录”等多种功能；在场景分类中，每幅图像可能同时包含“海滩”和“落日”等多种语义信息。这样的分类问题被称作多标签分类问题。

[0003] M.-L.Zhang.ML-RBF:RBF neural networks for multi-label learning.Neural Processing Letters,2009,29(2):61-74.提出了RBF神经网络的多标签分类算法，该方法包括：首先，对于训练集中的每一个标签，利用Kmeans算法对其聚类，聚类得出的中心点作为RBF的隐藏层节点；其次，通过最小化平方和误差函数解得输出层权重向量。但是该方法没有进行正则化处理，使得分类结果不能达到最优的效果。

[0004] M.-L.Zhang,Z.-J.Wang.MIMLRBF:RBF neural networks for multi-instance multi-label learning.Neurocomputing,2009,72(16-18):3951-3956.提出了多实例多标签问题的RBF神经网络算法，该方法包括：首先，对于训练集中的每一个标签，利用k-MEDOIDS算法对其聚类，聚类得出的中心点作为网络的隐藏层神经元；其次，通过最小化平方和误差函数，优化隐藏层神经元与输出层神经元之间的权值矩阵。该方法是针对多实例多标签问题的，不能直接用于解决单独的多标签分类问题，并且该方法也没有进行正则化处理，使得分类方法不能得到最优的分类结果。

[0005] 上述RBF网络多标签分类方法，都没有使用正则化技术，限制了分类方法的分类结果，降低了分类方法的泛化性能。

发明内容

[0006] 为了克服上述现有技术存在的缺陷，本发明的目的在于提供一种正则化RBF网络多标签分类方法，该方法聚类速度快、泛化性能好，能够增强RBF网络的泛化性能。

[0007] 本发明是通过以下技术方案来实现：

[0008] 一种正则化RBF网络多标签分类方法，包括以下步骤：

[0009] 步骤1：构建RBF网络

[0010] 包括构造网络的输入层结点、隐藏层结点及输出层结点；

[0011] 输入层结点，由n个结点组成，每一个结点对应输入样本向量的一个特征；

[0012] 隐藏层结点，依次对数据集对应的标签集中的每一个标签的正样本集进行聚类，聚类之后得到个聚类中心，α为常量参数；所有的标签聚类形成的聚类中心构成了径向基函数RBF的隐藏层结点；

[0013] 输出层结点，由q个结点组成，每一个输出层结点都是一个潜在的输出标签；

[0014] 步骤2：用训练数据训练RBF网络

[0015] 建立带正则项的RBF网络多标签分类模型，选取公开多标签数据集，选择其中的一部分作为训练数据集，对RBF网络多标签分类器进行正则参数寻优，得到连接隐藏层和输出层的权值矩阵；

[0016] 步骤3：利用RBF网络预测标签

[0017] 对于RBF网络的输出层结点，设定常量0为阈值；利用连接隐藏层和输出层的权值矩阵值，得出网络中每个结点的输出值，比较每个结点输出值与阈值0的大小关系，大于阈值0的作为样本的潜在标签，实现多标签分类。

[0018] 步骤1所述的RBF网络构建，具体包括以下步骤：

[0019] 1)设或者表示维度为n的样本空间；其中，表示维度为n的实数空间，表示维度为n的复数空间；表示具有q个可能的类标签的标签空间，
多标签训练集为：

[0020]

[0021] 包含m个样本数据，是一个n维的特征向量是与xi相对应的标签集；

[0022] 网络的输入层由n个结点组成，用于将n维的样本xi输入网络；

[0023] 2)对标签空间中的每一个标签的正样本集进行聚类；

[0024] 3)标签空间的维度为q，网络的输出层结点由q个结点组成，一个输出结点对应标签空间中的一个标签，则网络输出为向量f：

[0025] 向量f＝[f1,f2,…,fq]；

[0026] 向量f的每一个分量值对应网络的一个输出结点的输出值。

[0027] 步骤2)所述对正样本集进行聚类的具体步骤为：

[0028] (1 )标签集合中的每一个标签找出正样本集合

[0029] 其中，(xj,Yj)为多标签训练集中的一个样本，是一个n维的特征向量，是与xj相对应的标签集，是集合Yj的一个元素；

[0030] (2)利用SOM聚类法，对正样本集合聚类，聚类之后得到k个聚类中心，α为常量参数，形成聚类中心为向量

[0031] (3)重复步骤(1)和(2)，直至标签集中的每一个标签对应的正样本集合都聚类产生聚类中心，并将这些聚类中心合并，得到网络隐藏层结点为向量c，隐藏层结点数量为L，

[0032] 步骤2所述训练RBF网络，具体包括以下步骤：

[0033] 1)对于样本xj，是一个n维的特征向量，RBF网络输出层的第个输出结点，其输出值形式化的定义如下：

[0034]

[0035] 设：

[0036]

[0037]

[0038] β为连接隐藏层和输出层的权值矩阵，为矩阵β的第i行第列元素，L为网络的隐藏层结点数量，m为多标签训练集的总训练样本数量；φi(xj,ci)为RBF网络的隐藏层结点ci在网络输入样本为xj时，隐藏层结点ci的输出函数值；

[0039] RBF网络的隐藏层函数采用高斯函数作为径向基函数，则φi(xj,ci)函数形式化的定义如下：

[0040]

[0041] 其中，ci为径向基函数φi(·)的中心，即RBF网络隐藏层结点，σ称为径向基函数的扩展常数，反应函数图像的宽度，通过计算每对网络隐藏层结点之间的距离来获得，形式化的定义为：

[0042]

[0043] 其中，μ为调节参数，为网络的隐藏层结点数量，ct和ch为网络隐藏层结点；

[0044] 则，RBF网络输出向量f＝[f1,f2,…,fq]形式化的定义为：

[0045] f＝Hβ (6)

[0046] H和β定义如式(2)和式(3)，向量f的每一个分量值为网络的一个输出结点的输出值，定义如式(1)所示；

[0047] 2)最小化网络输出误差值，如下式：

[0048]

[0049] 其中，T为多标签训练集的m个训练样本的目标标签矩阵，f为RBF网络输出向量，λΩ(f)为正则项，λ为正则参数；

[0050] 则有，最小化等价于：

[0051] minw(||Hβ-T||+λβ) (8)

[0052] 利用岭回归的方法求解，隐藏层和输出层的权值矩阵β表示为：

[0053] β＝(HTH+λI)-1HTT (9)；

[0054] 其中，I为单位矩阵；

[0055] 3)选取若干个公开多标签数据集，利用每个多标签数据集的训练数据集训练RBF网络，寻找RBF网络多标签分类器在每一个数据集上的最优正则化参数λ，优化得到连接隐藏层和输出层的权值矩阵β。

[0056] 步骤2所述的训练RBF网络的公开多标签数据集为流行的公开多标签数据集，为：Yeast数据集、Scene数据集、Genbase数据集、Emotions数据集、Enron数据集或TMC2007数据集。

[0057] 步骤3所述利用RBF网络预测标签，RBF网络多标签分类器预测的标签为标签集h(xi)：

[0058]

[0059] 其中，xi为多标签数据集的第i个样本，是一个n维的特征向量，为标签空间中的一个标签，为网络的一个输出结点的输出值，t(xi)为阈值函数，设为常量0；比较和0的大小，若大于0，则标签为xi的潜在的一个标签。

[0060] 与现有技术相比，本发明具有以下有益的技术效果：

[0061] 本发明首先构造RBF网络结构，RBF网络具有结构简单、全局最优、训练速度快的优点，很适合解决分类问题；其次，为了提高分类方法的速度，RBF网络的隐藏层结点使用SOM(Self Organization Map)聚类方法得到；然后，在训练RBF网络过程中，采用正则化技术在训练出网络参数，通过参数值进一步计算出多标签分类方法的函数输出值，最后将输出值与阈值函数比较，根据比较结果预测出标签，从而完成多标签分类任务。本发明改用聚类速度更快的SOM聚类方法，并且加入正则化技术，增强了RBF神经网络的泛化性能。

附图说明

[0062] 图1为多标签RBF网络结构；

[0063] 图2为SOM结构图；

[0064] 图3为训练RBF网络流程图；

[0065] 图4为预测Yeast测试数据集标签流程图。

具体实施方式

[0066] 下面结合具体的实施例对本发明做进一步的详细说明，所述是对本发明的解释而不是限定。

[0067] 本发明公开了一种正则化RBF网络多标签分类方法(Regularized RBF Neural Network Multi-label Classification Algorithm,R-RBF-ML)，包括以下步骤：

[0068] 步骤1：构建RBF网络，包括构造网络输入层结点、隐藏层结点、输出层结点；

[0069] 输入层：网络的输入层由n个结点组成，每个结点对应输入样本向量的一个特征。

[0070] 隐藏层：在隐含层，依次对数据集对应的标签集中的每一个标签的正样本集进行聚类，聚类之后得到个聚类中心，α为常量参数，表示正样本集的大小。所有的标签聚类形成的聚类中心构成了径向基函数RBF的隐藏层结点。

[0071] 输出层：输出层结点由q个结点组成，每一个输出结点都是一个可能的输出标签。

[0072] 步骤2：用训练数据训练RBF网络；

[0073] 建立带正则项的RBF网络多标签分类模型，选取公开多标签数据集，选择一部分作为训练数据集，对RBF网络多标签分类器进行正则参数寻优，同时优化连接隐藏层和输出层的权值矩阵。

[0074] 步骤3：利用RBF网络预测标签。

[0075] 对于RBF网络的输出结点，设定常量0为阈值，比较网络的每个结点输出值与0的大小关系，大于0的作为样本可能的标签。

[0076] 步骤1所述RBF网络构建包括：

[0077] (1 )设表示维度为n的实数空间或者复数空间表示具有q个可能的类标签的标签空间，多标签训练集为
包含m 个样本数据，是一个 n维的特征向量，
是与xi相对应的标签集；网络的输入层由n个结点组成，用于将
n维的样本xi输入网络。

[0078] (2)对标签空间中的每一个标签的正样本集进行聚类，具体步骤为：

[0079] ●标签集合中的每一个标签找出正样本集合

[0080]

[0081] 其中，(xj,Yj)为多标签训练集中的一个样本，是一个n维的特征向量，是与xj相对应的标签集，是集合Yj的一个元素。

[0082] ●利用SOM对正样本集合聚类，聚类之后得到个聚类中心，α为常量参数，表示正样本集的大小，聚类之后形成聚类中心为向量

[0083] 参见图2，是SOM结构图，SOM自组织特征映射模型是一个两层结构。一层为输入层，另一层为输出层。输出层为二维的格形，输出层神经元与输入层的每个结点都有连接。

[0084] ●重复以上两个步骤，直到标签集中的每一个标签对应的正样本集合都聚类产生聚类中心，合并这些聚类中心。

[0085] 经过以上三步操作，找出网络隐藏层结点为向量c，网络的隐藏层结点数量为L，

[0086] (3)标签空间的维度为q，所以网络的输出层结点由q个结点组成，一个输出结点对应标签空间中的一个标签，网络输出为向量f＝[f1,f2,…,fq]，向量f的每一个分量值对应网络的一个输出结点的输出值。

[0087] 步骤2所述训练RBF网络，包括以下步骤：

[0088] 训练RBF网络包括：

[0089] (1)RBF网络输出层的每一个结点的输出值可以形式化的定义如下：

[0090]

[0091] 若设

[0092] β为连接隐藏层和输出层的权值矩阵，为矩阵β的第i行第列元素，L为网络的隐藏层结点数量，m为多标签训练集的总训练样本数量。φi(xj,ci)为RBF网络的隐藏层结点ci在网络输入样本为xj时，隐藏层结点ci的输出函数值，RBF网络的隐藏层函数采用高斯函数作为径向基函数，则φi(xj,ci)函数形式化的定义如下：

[0093]

[0094] 其中，ci为径向基函数φi(·)的中心，即RBF网络隐藏层结点，σ称为径向基函数的扩展常数，反应函数图像的宽度，通过计算每对网络隐藏层结点之间的距离来获得，形式化的定义为：

[0095]

[0096] 其中，μ为调节参数，L为网络的隐藏层结点数量，ct和ch为网络隐藏层结点；

[0097] 则RBF网络输出向量f＝[f1,f2,…,fq]可以形式化的定义为：

[0098] f＝Hβ (6)

[0099] 其中H和β的定义如式(2)和式(3)所示。

[0100] (2)最小化网络输出误差值，需要最小化如下公式：

[0101]

[0102] 其中，T为多标签训练集的m个训练样本的目标标签矩阵，f为RBF网络输出向量，λΩ(f)为正则项，λ为正则参数。正则项也被称为权值衰减、惩罚项、函数光滑或平坦、权值修剪、先验概率、和最大间隔等。正则化技术有利于改善神经网络的泛化性能。

[0103] 最小化等价于：

[0104] minw(||Hβ-T||+λβ) (8)

[0105] 其中H和β的定义如式(2)和式(3)所示。

[0106] 利用岭回归的方法求解，隐藏层和输出层的权值矩阵β可以表示为：

[0107] β＝(HTH+λI)-1HTT (9)

[0108] (3)选取6个公开多标签数据集，分别为Yeast数据集、Scene数据集、Genbase数据集、Emotions数据集、Enron数据集和TMC2007数据集，数据集的描述如表1所示，其中标签的基即每一个对象的平均标签数量，若标签的基记为LC，则表达式为标签密度是在标签空间内对标签的基的归一化，计算表达式为：利用数据集对RBF网络进行正则参数λ寻优，同时优化连接隐藏层和输出层的权值矩阵β。

[0109] 表1公开数据集

[0110]

[0111] RBF网络多标签分类器预测的标签为标签集h(xi)，其中xi为多标签数据集的第i个样本，是一个n维的特征向量，为标签空间
中的一个标签，为网络的一个输出结点的输出值，t(xi)为阈值函数，设
为常量0，比较和0的大小，若大于0，则标签为xi的可能的一个标签。

[0112] 实施例

[0113] 本实例以Yeast数据集为例，数据集属于生物学领域，包括1500个训练样本和917个测试样本，训练样本用于训练多标签分类系统，测试样本作为未知标签的样本，用于标签预测。Yeast数据集有103维特征和14个标签，平均标签数量为4.24，标签密度为0.303。

[0114] 正则化RBF网络多标签分类方法，如图1所示，利用包含1500个样本的训练数据集构造RBF网络包括3个步骤，具体流程如下：

[0115] 步骤1：网络输入层包括103个结点；

[0116] 步骤2：对数据集的维度为14的标签空间中的每一个标签在训练数据集中找出正样本集进行聚类，具体步骤为：

[0117] 1)标签集合中的标签y1，在训练数据集中找出正样本集合U1，U1＝{xj|(xj,Yj)∈D,yj1∈Yj,yj1>0}，(xj,Yj)为第j个样本，yj1为标签集Yj的第一个标签，集合U1包含元素个数为|U1|＝476，即有476个正样本；

[0118] 2)利用SOM法对正样本集合U1聚类，聚类中心数量为k，k＝α·|U1|，α为0.01，则k＝5，最终形成包含5个元素的聚类中心向量c1，c1＝{c1，1,…,c1，5}；

[0119] 3)重复以上两个步骤，直到标签集中的14个标签对应的正样本集合都聚类产生聚类中心，合并这些聚类中心。

[0120] 经过以上三步操作，找出网络隐藏层结点为向量c，网络的隐藏层结点数量为L，

[0121] 步骤3：网络的输出层包括14个结点，网络输出向量f＝[f1,f2,…,f14]。

[0122] 如图3所示，利用包含1500个样本的训练数据集作为网络的输入，训练RBF网络具体流程如下：

[0123] 1)根据训练样本解出其中

[0124]

[0125] φi(xj,ci)为RBF网络的隐藏层结点ci在网络输入样本为xj时，隐藏层结点ci的输出函数值，xj为1500个样本中的第j个样本，ci为网络的第i个隐藏层结点，σ为径向基函数的扩展常数，μ为调节参数，且μ＝1，ct和ch为网络隐藏层结点；

[0126] 2)优化连接隐藏层和输出层的权值矩阵β

[0127] (1)隐藏层和输出层的权值矩阵β

[0128] β＝(HTH+λI)-1HTT

[0129] 其中，矩阵T为训练数据集的1500行14列的标签矩阵，I为69行69列的单位矩阵。

[0130] (2)优化权值矩阵β即优化正则项λ。为了获得最优参数λ，λ的

[0131] 值被依次设置为27，26，…,2-3，依次解出相应的权值矩阵β。Average precision是一个流行的多标签评价指标，它被作为调节正则参数λ和β的依据。

[0132] 如图4所示，预测Yeast测试数据集的标签，测试数据集包括917个样本数据，具体流程如下：

[0133] (1)RBF网络输出向量f＝[f1,f2,…,f14]，f＝Htestβ，其中

[0134]

[0135] (x1,c1)为第1个样本在第1个隐藏层结点上的输出值，其余以此类推。β为RBF网络隐藏层和输出层的权值矩阵。

[0136] (2)对向量f＝[f1,f2,…,f14]的每一个分量值fA∈f，RBF网络多标签分类器预测的标签为标签集h(xi)，大于0的分量值对应的标签即为样本xi的预测标签。

[0137] 选择Hamming loss，One-error，Coverage，Ranking loss，Average-precision这5个流行的多标签评价指标，结果参见表2-7所示，评估方法的性能：

[0138] 选择传统的ML-RBF(Multi-label RBF neural network)、Rank-SVM、BP-MLL(Back-Propagation for Multi-label Learning)、ML-KNN(Multi-label k Nearest Neighbor)和MLNB(Multi-label Naive Bayes)多标签分类算法与正则化RBF网络多标签分类算法进行比较。得到结果如表2～7所示：

[0139] 表2在6个数据集上各算法的Hamming loss

[0140]

[0141] Hamming loss作为流行的多标签分类方法评价指标，在评价时，Hamming loss值越小多标签分类方法越好，在表2中，最好的结果被加粗显示，从表2中可以看出，正则化RBF网络多标签分类方法(R-RBF-ML)在所有的数据集上均取得了最好的结果。因此，根据Hamming loss评价指标，正则化RBF网络多标签分类方法是所有多标签分类方法中最好的。其中BP-MLL和MLNB计算复杂度太高，无法对TMC2007数据集进行分类，因此没有相应的Hamming loss值。

[0142] 表3在6个数据集上各算法的Coverage

[0143]

[0144] Coverage作为流行的多标签分类方法评价指标，在评价时，Coverage值越小多标签分类方法越好，在表3中，最好的结果被加粗显示，从表3中可以看出，在6个数据集上，正则化RBF网络多标签分类方法(R-RBF-ML)在其中4个数据集上都取得了最好的结果。因此,根据Coverage评价指标，正则化RBF网络多标签分类方法是所有多标签分类方法中相对最好的。其中BP-MLL和MLNB计算复杂度太高，无法对TMC2007数据集进行分类，因此没有相应的Coverage值。

[0145] 表4在6个数据集上各算法的One error

[0146]

[0147] One error作为流行的多标签分类方法评价指标，在评价时，One error值越小多标签分类方法越好，在表4中，最好的结果被加粗显示，从表4中可以看出，正则化RBF网络多标签分类方法(R-RBF-ML)在所有的数据集上均取得了最好的结果。因此，根据One error评价指标，正则化RBF网络多标签分类方法是所有多标签分类方法中最好的。其中，BP-MLL和MLNB计算复杂度太高，无法对TMC2007数据集进行分类，因此没有相应的One error值。

[0148] 表5在6个数据集上各算法的Average precision

[0149]

[0150]

[0151] Average precision作为流行的多标签分类方法评价指标，在评价时，Average precision值越大多标签分类方法越好，在表5中，最好的结果被加粗显示，从表5中可以看出，正则化RBF网络多标签分类方法(R-RBF-ML)在所有的数据集上均取得了最好的结果，因此,根据Average precision评价指标，正则化RBF网络多标签分类方法是所有多标签分类方法中最好的。其中BP-MLL和MLNB计算复杂度太高，无法对TMC2007数据集进行分类，因此没有相应的Average precision值。

[0152] 表6在6个数据集上各算法的Ranking loss

[0153]

[0154]

[0155] Ranking loss作为流行的多标签分类方法评价指标，在评价时，Ranking loss值越小多标签分类方法越好，在表6中，最好的结果被加粗显示，从表6中可以看出，在6个数据集上，正则化RBF网络多标签分类方法(R-RBF-ML)在其中4个数据集上都取得了最好的结果。因此，根据Ranking loss评价指标，正则化RBF网络多标签分类方法是所有多标签分类方法中相对最好的。其中BP-MLL和MLNB计算复杂度太高，无法对TMC2007数据集进行分类，因此没有相应的Coverage值。

[0156] 表7在6个数据集上各算法的运行时间

[0157]

[0158]

[0159] 从表7中可以看出，在RBF网络多标签分类方法中，正则化RBF网络多标签分类方法(R-RBF-ML)消耗的网络训练时间少于ML-RBF方法，尤其在大型数据集TMC2007上更加明显。与其他多标签分类方法相比，正则化RBF网络多标签分类方法(R-RBF-ML)的时间多于ML-kNN多标签分类方法。

[0160] 综合表2～表7可以总结出，本发明的正则化RBF网络多标签分类方法(R-RBF-ML)在消耗较少时间的条件下取得了最好的分类效果。

一种正则化RBF网络多标签分类方法转让专利

申请号 : CN201510213367.6

文献号 : CN105046323B

文献日 : 2017-03-22

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 孙霞 , 王佳荣 , 冯筠 , 陈勇 , 吴宁海

申请人 : 西北大学 , 西安麦多信息科技有限公司 , 陕西瑞海电力工程有限公司

摘要 :

权利要求 :

说明书 :