一种主动的空间信息个性化分发方法转让专利

申请号 : CN201410544892.1

文献号 : CN104281696B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 夏宇朱欣焰

申请人 : 江西师范大学

摘要 :

本发明公开了一种主动的空间信息个性化分发方法,该方法通过构建空间信息用户模型、建立和过滤分发候选集、求解分发决策集等三个步骤来实现。本发明提供的一种空间信息用户模型的建立方法,通过查询分解、权值求解、分布特征值求解、兴趣度和规则建立等四个步骤来实现;建立和过滤分发候选集通过空间信息用户模型的兴趣度和规则过滤来实现;求解分发决策集通过顾及分布特征值的效用度计算方法来实现。本发明的有益效果是:通过建立一种空间信息用户模型,实现了一种主动的空间信息个性化分发方法。

权利要求 :

1.一种主动的空间信息个性化分发方法,其特征在于它包括下述步骤:

第1步构建空间信息用户模型Mu

构建空间信息用户模型Mu的过程是:

Mu={G,S,P}  (I)

式中,G=(X,W,V,D),X=(x1,x2,…,xeum),W=(w1,w2,…,weum),V=(v1,v2,…,veum),D=(d1,d2,…,deum);xi为元素项,是用来描述空间信息内容和特征的不可再分的元数据项,i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;wi是xi的权值;vi表示反映xi的分布特征的二元组集合,vi={<Ii,g,si,g>|g=1,2,…,vumi},Ii,g为xi的区间变量根据观测样本的上限和下限对样本空间进行非均匀分割的子区间,vumi是xi的子区间的个数,g是xi的子区间的序号,si,g是xi的区间变量在子区间Ii,g上的分布特征值;di是xi的区间变量的区间方差;S={<cm,Im>|m=1,2,…,cum},cm是第m个用户感兴趣的概念,cum是用户感兴趣的概念的个数,Im是用户对cm的兴趣度;P={rt|t=1,2,…,rum},rt:=if<predicate>then<result>,rt表示第t条产生式规则,rum是规则的个数,<predicate>是规则的前件,<result>是规则的后件;

第2步建立和过滤分发候选集

第2.1步将初始空间信息集作为分发候选集,根据P={rt|t=1,2,…,rum},依次判断空间信息是否满足rt的前件<predicate>,如果满足,则执行规则的后件<result>,当规则的后件为,则直接从分发候选集中删除;当规则的后件为,则从分发候选集中删除,并加入分发决策集;

第2.2步在分发候选集中,根据S={<cm,Im>|m=1,2,…,cum},将Im大于给定阈值的空间信息,从分发候选集中删除,并加入分发决策集;

第3步求解分发决策集

第3.1步构造决策矩阵,并求理想解

首先,将分发候选集中空间信息的内容表达为:

Sc={X,T}  (II)

式中,Sc为空间信息内容表达式;X=(x1,x2,…,xeum),xi为元素项,i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;元素项xi是信息分发决策的一个决策属性,{xi|i=1,

2,…,eum}也称为决策属性集;T=(T1,T2,…,Teum),T为Sc对于X的属性值向量,Ti为Sc在决策属性xi下的属性值,是一个区间数[ti-,ti+],ti-为Ti的下限,ti+为Ti的上限;

对于分发候选集中的每条空间信息的内容都可用(II)所述的表达式来描述,则分发候选集记为{Sc(j)|j=1,2,…,sum},sum为分发候选集中元素的个数,j为分发候选集中元素的序号,j=1,2,…,sum,分发候选集的每个元素都是信息分发决策的一个备选方案,每条空间信息的内容的下标组成的下标集记为Sid={(j)|j=1,2,…,sum},Sc(j)表示第j条空间信息的内容,对于 其中X=(x1,x2,…,xeum),T(j)=(T1(j),T2(j),…,Teum(j));其中T(j)表示第j条空间信息的内容对于X的属性值向量,j=1,

2,…,sum;Ti(j)表示第j条空间信息的内容在决策属性xi下的属性值,i=1,2,…,eum;

其次,建立分发候选集{Sc(j)|j=1,2,…,sum}对于决策属性集{xi|i=1,2,…,eum}的决策矩阵F:F=(γji)sum×eum  (III)

式中,γji为Sc(j)在决策属性xi下的属性值,sum为分发候选集中元素的个数,j为分发候选集中元素的序号,j=1,2,…,sum;i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;

最后,建立分发候选集的理想解A*与分发候选集的负理想解A0

A*=(A1*,A2*,…,Aeum*)  (IV)

A0=(A10,A20,…,Aeum0)  (V)

式中,A*为分发候选集的理想解,Ai*为决策属性xi的理想解,A0为分发候选集的负理想0

解,Ai为决策属性xi的负理想解;若用户模型中每个非均匀分割的子区间Ii,g对应的区间数为I′i,g,则式中, 为决策属性xi的非均匀分割子区间Ii,g,g=1,2,…,vumi对应的效用度最大的区间数,vumi为第i个元素项的子区间个数, 和 分别为该区间数的下限和上限,此时子区间记为I*i,g,s*i,g为子区间I*i,g对应的分布特征值;Ai0为决策属性xi的负理想解, 为决策属性xi的效用度最小的区间数, 和 分别为该区间数的下限和上限,此时子区间

0 0 0

为Ii,g,si,g为子区间Ii,g对应的分布特征值;

第3.2步确立分发决策集

第3.2.1步,与分发候选集的理想解和分发候选集的负理想解的特征距离为式中,dj*为Sc(j)与分发候选集的理想解的特征距离,dj0为Sc(j)与分发候选集的负理想解的特征距离,γj为Sc(j)在各个决策属性xi,i=1,2,…,eum下的属性值向量;A*为分发候选集的理想解;wi是决策属性xi的权值,Mea()为求决策属性xi的理想解及负理想解与决策属性xi的属性值的距离函数,Ai*为决策属性xi的理想解,Ti(j)表示第j条空间信息的内容在决策属性xi下的属性值,Ti(j)是一个区间数,Ai0为决策属性xi的负理想解,A为决策属性xi的正理想解和负理想解,B为决策属性xi的属性值,di是xi的区间变量的区间方差,λi是xi的区间变量的区间方差的阈值,si,g为子区间Ii,g对应的分布特征值;Max()为求最大值函数;

第3.2.2步,计算Sc(j)的效用度μj

其中,

式中,μj是Sc(j)的效用度,dj0为Sc(j)与分发候选集的负理想解的特征距离,dj*为Sc(j)与分发候选集的理想解的特征距离,wi是决策属性xi的权值,Ai*是决策属性xi的理想解,Ti(j)是Sc(j)在决策属性xi下的属性值,是一个区间数;di是xi的区间变量的区间方差,λi是xi的区间变量的区间方差的阈值,Mea()为求决策属性xi的理想解及负理想解与决策属性xi的属性值的距离函数,Max()为求最大值函数;

第3.2.3步,根据效用度μj值,将大于或等于给定阈值的备选方案依次加入分发决策集,从而确立分发决策集。

2.根据权利要求1所述的一种主动的空间信息个性化分发方法,其特征在于:第1步中的空间信息用户模型按照下述步骤建立:第1.1步查询分解:

将用户的查询条件分解为仅包含元素项的原子查询条件,元素项是指用来描述空间信息内容和特征的不可再分的元数据项;原子查询条件是指不可再分解为包含元素项的查询条件,将原子查询条件中元素项又称为检索分量;

第1.2步按照下述过程进行权值求解:

(1.2.1)统计元素项的检索频率pi:

pi=numi/num′,i=1,2,…,eum

式中,i表示元素项的序号,numi表示第i个元素项的检索次数,num′表示检索总次数,eum表示元素项的个数,pi表示第i个元素项的检索频率;

(1.2.2)计算归一化检索频率pi′:

式中,pi表示第i个元素项的检索频率,i表示元素项的序号,eum表示元素项的个数,pi′表示第i个元素项的归一化检索频率;

(1.2.3)计算元素项的权值wi:

wi=pi′

式中,pi′表示第i个元素项的归一化检索频率,wi表示第i个元素项的权值;

第1.3步按照下述步骤求解分布特征二元组集合:

(1.3.1)样本空间的非均匀分割:

令Zi为xi对应的区间变量,Zi,k为Zi的第k个样本的观测值,Zi,k=[zi,k-,zi,k+],k∈Ei={1,…,ni},最小样本空间 其中,k为区间变量Zi的观测样本的序号,zi,k-为区间变量Zi的第k个样本的观测值的下限,zi,k+为区间变量Zi的第k个样本的观测值的上限,Ei为区间变量Zi的样本集合,ni为区间变量Zi的观测样本的总数;通过各样本观测值的上限和下限将Ii非均匀分割成子区间,子区间的个数为vumi,记为Ii,g=[ξi,g-1,ξi,g),g=1,2,…,vumi-1且式中,Ii,g表示第i个元素项的第g个子区间,ξi,g-1为Ii,g的下限,ξi,g为Ii,g的上限,vumi为第i个元素项的子区间个数, 为 的下限, 为 的上限;

(1.3.2)计算子区间的出现概率fi,g:

式中,fi,g表示第i个元素项的第g个子区间的出现概率,ni为区间变量Zi的观测样本的总数,Zi,k为区间变量Zi的第k个观测样本值,Ii,g为根据观测样本的上限和下限非均匀分割的第g个子区间,Ik()为示性函数,Zi,k∩Ii,g非空时为1,空集时为0;

(1.3.3)通过子区间出现概率的线性变换,计算子区间的分布特征值si,g:式中,fi,g表示第i个元素项的第g个子区间的出现概率,si,g为xi的区间变量在子区间Ii,g上的分布特征值,min()为取最小值的函数,max()为取最大值的函数;

第1.4步通过人工交互输入确立用户感兴趣的概念与兴趣度以及分发决策的规则,形成S={<cm,Im>|m=1,2,…,cum}和P={rt|t=1,2,…,rum},式中,cm是用户感兴趣的概念,Im是用户对cm的兴趣度;rt:=if<predicate>then<result>,rt表示第t条产生式规则,rum是产生式规则的个数,<predicate>是产生式规则的前件,<result>是产生式规则的后件。

说明书 :

一种主动的空间信息个性化分发方法

技术领域

[0001] 本发明属于信息领域,具体涉及一种主动的空间信息个性化分发方法。

背景技术

[0002] 空间信息分发是将空间信息由数据源传递到用户的过程。
[0003] 目前的空间信息分发主要是由用户提供查询条件,通过查询与下载的方式,完成空间信息的分发过程。
[0004] 这种按照用户提出的查询指令查找符合条件的相关内容,并把检索结果组织起来返回给用户的分发模式,具体存在以下问题:
[0005] 1.不同的空间信息之间不能互联互通和共享;
[0006] 2.使用不方便,用户不能按应用需求一次得到多种类型的信息,需分多次获取不同种类的信息;
[0007] 3.难以准确获取所需信息,往往还需人工从大量查询结果中进行挑选;
[0008] 4.对于不同兴趣的用户,只要提供的查询条件相同,系统都返回相同的结果,不能反映不同用户的个性化需求;
[0009] 5.对于用户的兴趣和需求,不能被系统理解,也就不能向用户提供主动的分发服务。
[0010] 因此,目前的空间信息分发由于其分发模式处于单一、被动的状况。当用户需要相似或相关信息之时,需频繁地通过查询获取,通常还需要二次检索从大量查询结果中进行挑选。这种模式需要消耗大量的重复劳动,难以满足用户对空间信息主动服务和个性化服务的应用需求。为适应主动服务和个性化服务的应用需求,文献(Sung Ho Ha and Jang Lee Lee,“Dynamic Dissemination of Personalized Content on the Web”,Journal of Organizational Computing and Electronic Commerce,Volume 19,Issue 2,pp.96-111,2009)提出动态数字信息分发系统(Dynamic Dissemination of Digital Information system,DDDIs),通过为用户建立一种动态的用户偏好模型,根据用户偏好模型与新待分发信息的内容相关性进行在线内容匹配,从而可以主动的提供个性化的内容分发。DDDIs的用户偏好模型是通过贝叶斯分类器计算待分发信息的各个分类的后验概率组成的向量来表达的,而内容匹配则先通过自组织映射(Self-organizing Map,SOM)进行新信息的聚类,再通过聚类中心与用户偏好向量的欧式距离计算得到。由于空间信息的多维和区间覆盖的特性,这种建立在信息分类基础上的用户偏好模型是难以满足空间信息分发的应用需求的。

发明内容

[0011] 本发明的目的是解决现有空间信息分发技术中存在的不能提供主动的空间信息个性化分发服务的问题。
[0012] 为此,本发明提供一种主动的空间信息个性化分发方法,该方法克服了目前的空间信息分发模式的单一和被动的状况,实现了一种主动的空间信息的个性化分发方法,从而能够满足用户对空间信息的主动服务和个性化服务的应用需求。
[0013] 本发明提供的一种主动的空间信息个性化分发方法,其特征在于它包括下述步骤:
[0014] 第1步构建空间信息用户模型Mu
[0015] 构建空间信息用户模型Mu的过程是:
[0016] Mu={G,S,P}   (I)
[0017] 式中,G=(X,W,V,D),X=(x1,x2,…,xeum),W=(w1,w2,…,weum),V=(v1,v2,…,veum),D=(d1,d2,…,deum),xi为元素项,是用来描述空间信息内容和特征的不可再分的元数据项,i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;wi是xi的权值,vi表示反映xi的分布特征的二元组集合,vi={<Ii,g,si,g>|g=1,2,…,vumi},Ii,g为xi的区间变量根据观测样本的上限和下限对样本空间进行非均匀分割的子区间,vumi是xi的子区间的个数,g是xi的子区间的序号,si,g是xi的区间变量在子区间Ii,g上的分布特征值;di是xi的区间变量的区间方差;S={<cm,Im>|m=1,2,…,cum},cm是第m个用户感兴趣的概念,cum是用户感兴趣的概念的个数,Im是用户对cm的兴趣度;P={rt|t=1,2,…,rum},rt:=if<predicate>then<result>,rt表示第t条产生式规则,rum是规则的个数,<predicate>是规则的前件,<result>是规则的后件;
[0018] 第2步建立和过滤分发候选集
[0019] 第2.1步将初始空间信息集作为分发候选集,根据P={rt|t=1,2,…,rum},依次判断空间信息是否满足rt的前件<predicate>,如果满足,则执行规则的后件<result>,当规则的后件为,则直接从分发候选集中删除;当规则的后件为,则从分发候选集中删除,并加入分发决策集;
[0020] 第2.2步在分发候选集中,根据S={<cm,Im>|m=1,2,…,cum},将Im大于给定阈值的空间信息,从分发候选集中删除,并加入分发决策集;
[0021] 第3步求解分发决策集
[0022] 第3.1步构造决策矩阵,并求理想解
[0023] 首先,将分发候选集中空间信息的内容表达为:
[0024] Sc={X,T}   (II)
[0025] 式中,Sc为空间信息内容表达式;X=(x1,x2,…,xeum),xi为元素项,i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;元素项xi是信息分发决策的一个决策属性,{xi|i=1,2,…,eum}也称为决策属性集;T=(T1,T2,…,Teum),T为Sc对于X的属性值向量,Ti为Sc在决策属性xi下的属性值,是一个区间数[ti-,ti+],ti-为Ti的下限,ti+为Ti的上限;
[0026] 对于分发候选集中的每条空间信息的内容都可用(II)所述的表达式来描述,则分发候选集记为{Sc(j)|j=1,2,…,sum},sum为分发候选集中元素的个数,j为分发候选集中元素的序号,j=1,2,…,sum,分发候选集的每个元素都是信息分发决策的一个备选方案,每条空间信息的内容的下标组成的下标集记为Sid={(j)|j=1,2,…,sum},Sc(j)表示第j条空间信息的内容,对于 其中X=(x1,x2,…,xeum),T(j)=(T1(j),T2(j),…,Teum(j));其中T(j)表示第j条空间信息的内容对于X的属性值向量,j=1,
2,…,sum;Ti(j)表示第j条空间信息的内容在决策属性xi下的属性值,i=1,2,…,eum;
[0027] 其次,建立分发候选集{Sc(j)|j=1,2,…,sum}对于决策属性集{xi|i=1,2,…,eum}的决策矩阵F:
[0028] F=(γji)sum×eum   (III)
[0029] 式中,γji为Sc(j)在决策属性xi下的属性值,sum为分发候选集中元素的个数,j为分发候选集中元素的序号,j=1,2,…,sum;i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;
[0030] 最后,建立分发候选集的理想解A*与分发候选集的负理想解A0
[0031] A*=(A1*,A2*,…,Aeum*)   (IV)
[0032] A0=(A10,A20,…,Aeum0)   (V)
[0033] 式中,Ai*为决策属性xi的理想解,Ai0为决策属性xi的负理想解;若用户模型中每个非均匀分割的子区间Ii,g对应的区间数为I′i,g,则
[0034]
[0035]
[0036] 式中, 为决策属性xi的非均匀分割子区间Ii,g,g=1,2,…,vumi对应的效用度最大的区间数,vumi为第i个元素项的子区间个数, 和 分别为该区间数的下限和上限,此时子区间记为I*i,g,s*i,g为子区间I*i,g对应的分布特征值;Ai0为决策属性xi的负理想解,为决策属性xi的效用度最小的区间数, 和 分别为该区间数的下限和上限,此时子区间为I0i,g,s0i,g为子区间I0i,g对应的分布特征值;
[0037] 第3.2步确立分发决策集
[0038] 第3.2.1步,与分发候选集的理想解和分发候选集的负理想解的特征距离为[0039]
[0040]
[0041]
[0042] 式中,dj*为Sc(j)与分发候选集的理想解的特征距离,dj0为Sc(j)与分发候选集的负理想解的特征距离,γj为Sc(j)在各个决策属性xi,i=1,2,…,eum下的属性值向量;A*为分发候选集的理想解;wi是决策属性xi的权值,Mea()为求决策属性xi的理想解及负理想解与决策属性xi的属性值的距离函数,Ai*为决策属性xi的理想解,Ti(j)表示第j条空间信息的内容在决策属性xi下的属性值,Ti(j)是一个区间数,Ai0为决策属性xi的负理想解,A为决策属性xi的正理想解和负理想解,B为决策属性xi的属性值,di是xi的区间变量的区间方差,λi是xi的区间变量的区间方差的阈值,si,g为子区间Ii,g对应的分布特征值;Max()为求最大值函数;
[0043] 第3.2.2步,计算Sc(j)的效用度μj
[0044]
[0045] 其中,
[0046] 式中,μj是Sc(j)的效用度,dj0为Sc(j)与分发候选集的负理想解的特征距离,dj*为Sc(j)与分发候选集的理想解的特征距离,wi是决策属性xi的权值,Ai*是决策属性xi的理想解,Ti(j)是Sc(j)在决策属性xi下的属性值,是一个区间数;di是xi的区间变量的区间方差,λi是xi的区间变量的区间方差的阈值,Mea()为求决策属性xi的理想解及负理想解与决策属性xi的属性值的距离函数,Max()为求最大值函数;
[0047] 第3.2.3步,根据效用度μj值,将大于或等于给定阈值的备选方案依次加入分发决策集,从而确立分发决策集。
[0048] 本发明以用户注册信息与用户查询信息为基础,用户交互信息为补充建立的用户模型,相对于文献(Sung Ho Ha and Jang Lee Lee,2009)而言,一方面,由于顾及了空间信息的区间覆盖特性,结合权值和分布特征值来表达用户偏好,因而更贴近用户的个性化需求;另一方面,由于结合了用户查询信息和用户交互信息,从而可以通过较少的用户干预,保证用户模型的准确性,从而适应于空间信息主动分发的需求。通过用户模型建立和过滤分发候选集、求解分发决策集,进而建立的一种主动的空间信息个性化分发方法,分发依据不再是独立的检索条件,而是根据用户查询数据的积累建立的空间信息用户模型,因而克服了传统的查询与下载分发模式的单一和被动的分发状况;而且,能够克服文献(Sung Ho Ha and Jang Lee Lee,2009)中用户模型依赖于信息分类的构建方式之不足,从而实现空间信息的主动和个性化分发。

具体实施方式

[0049] 本发明方法首先通过式(1)表达的空间信息用户模型表达方法,以式(1)所述的表达方法为基础的空间信息用户模型的建立方法是通过查询分解、权值求解、分布特征二元组集合求解、确立兴趣度和规则四个步骤来实现的。
[0050] Mu={G,S,P}   (1)
[0051] 式中,G=(X,W,V,D),X=(x1,x2,…,xeum),W=(w1,w2,…,weum),V=(v1,v2,…,veum),D=(d1,d2,…,deum),xi为元素项,是用来描述空间信息内容和特征的不可再分的元数据项,i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;wi是xi的权值,vi表示反映xi的分布特征的二元组集合,vi={<Ii,g,si,g>|g=1,2,…,vumi},Ii,g为xi的区间变量根据观测样本的上限和下限对样本空间进行非均匀分割的子区间,vumi是xi的子区间的个数,g是xi的子区间的序号,si,g是xi的区间变量在子区间Ii,g上的分布特征值;di是xi的区间变量的区间方差;S={<cm,Im>|m=1,2,…,cum},cm是第m个用户感兴趣的概念,cum是用户感兴趣的概念的个数,Im是用户对cm的兴趣度;P={rt|t=1,2,…,rum},rt:=if<predicate>then<result>,rt表示第t条产生式规则,rum是规则的个数,<predicate>是规则的前件,<result>是规则的后件。
[0052] 第一步查询分解:
[0053] 将用户的查询条件分解为仅包含元素项的原子查询条件,元素项是指用来描述空间信息内容和特征的不可再分的元数据项;原子查询条件是指不可再分解为包含元素项的查询条件,将原子查询条件中元素项又称为检索分量;
[0054] 第二步权值求解:
[0055] 通过元素项的检索频率统计、频率归一化和权值计算三个步骤实现。
[0056] (1)元素项的检索频率统计,通过式(2)求解:
[0057] pi=numi/num′,i=1,2,…,eum   (2)
[0058] 式中,i表示元素项的序号,numi表示第i个元素项的检索次数,num′表示检索总次数,eum表示元素项的个数,pi表示第i个元素项的检索频率;
[0059] (2)检索频率的归一化,通过式(3)求解:
[0060]
[0061] 式中,pi表示第i个元素项的检索频率,p′i表示第i个元素项的归一化检索频率。
[0062] (3)权值为归一化检索频率,如式(4):
[0063] wi=p′i   (4)式中,p′i表示第i个元素项的归一化检索频率,wi表示第i个元素项的权值;
[0064] 第三步分布特征二元组集合求解:通过样本空间的非均匀分割、子区间的概率统计、子区间分布特征值计算三个步骤来实现:
[0065] 1)样本空间的非均匀分割
[0066] 区间变量Zi的第k个样本的观测值Zi,k=[zi,k-,zi,k+],k∈Ei={1,…,ni},最小样本空间 其中,k为区间变量Zi的观测样本的序号,zi,k-为区间变量Zi的第k个样本的观测值的下限,zi,k+为区间变量Zi的第k个样本的观测值的上限,Ei为区间变量Zi的样本集合,ni为区间变量Zi的观测样本的总数。通过各样本观测值的上限和下限将Ii非均匀分割为vumi个子区间:
[0067] Ii,g=[ξi,g-1,ξi,g),g=1,2,…,vumi-1且式中,Ii,g表示第i个元素项的第g个子区间,ξi,g-1为Ii,g的下限,ξi,g为Ii,g的上限,vumi为第i个元素项的子区间个数, 为 的下限, 为 的上限;
[0068] 2)子区间的出现概率的计算
[0069] 根据(6)式求子区间的出现概率:
[0070]
[0071] 式中,fi,g表示第i个元素项的第g个子区间的出现概率,ni为区间变量Zi的观测样本的总数,Zi,k为区间变量Zi的第k个观测样本值,Ii,g为根据观测样本的上限和下限非均匀分割的第g个子区间,Ik()为示性函数,Zi,k∩Ii,g非空时为1,空集时为0;
[0072] 3)子区间的分布特征值的计算
[0073] 通过子区间出现概率的线性变换得到,如式(7):
[0074]
[0075] 式中,fi,g表示第i个元素项的第g个子区间的出现概率,si,g为xi的区间变量在子区间Ii,g上的分布特征值,min()为取最小值的函数,max()为取最大值的函数;
[0076] 第四步通过人工交互输入确立用户感兴趣的概念与兴趣度以及分发决策的规则,形成S={<cm,Im>|m=1,2,…,cum}和P={rt|t=1,2,…,rum},式中,cm是用户感兴趣的概念,Im是用户对cm的兴趣度;rm:=if<predicate>then<result>,rm表示第m条产生式规则,rum是规则的个数,<predicate>是规则的前件,<result>是规则的后件。
[0077] 利用上面建立的空间信息用户模型,根据空间信息用户模型表达式的兴趣度和规则过滤,以及与空间信息的相似性匹配结果,实现一种主动的空间信息的个性化分发,通过以下三个步骤实现:
[0078] 第一步根据本发明提供的以上所述的一种空间信息用户模型的建立方法,建立空间信息用户模型,为一个三元组:Mu={G,S,P},其中,G=(X,W,V,D),X=(x1,x2,…,xeum),W=(w1,w2,…,weum),V=(v1,v2,…,veum),D=(d1,d2,…,deum),xi为元素项,是用来描述空间信息内容和特征的不可再分的元数据项,i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;wi是xi的权值,vi表示反映xi的分布特征的二元组集合,vi={<Ii,g,si,g>|g=1,
2,…,vumi},Ii,g为xi的区间变量根据观测样本的上限和下限对样本空间进行非均匀分割的子区间,vumi是xi的子区间的个数,g是xi的子区间的序号,si,g是xi的区间变量在子区间Ii,g上的分布特征值;di是xi的区间变量的区间方差;S={<cm,Im>|m=1,2,…,cum},cm是第m个用户感兴趣的概念,cum是用户感兴趣的概念的个数,Im是用户对cm的兴趣度;P={rt|t=
1,2,…,rum},rt:=if<predicate>then<result>,rt表示第t条产生式规则,rum是规则的个数,<predicate>是规则的前件,<result>是规则的后件;
[0079] 第二步建立和过滤分发候选集
[0080] 1)将初始空间信息集作为分发候选集,根据P={rt|t=1,2,…,rum},依次判断空间信息是否满足rt的前件<predicate>,如果满足,则执行规则的后件<result>,当规则的后件为,则直接从分发候选集中删除;当规则的后件为,则从分发候选集中删除,并加入分发决策集;
[0081] 2)在分发候选集中,根据S={<cm,Im>|m=1,2,…,cum},将Im大于给定阈值的空间信息,从分发候选集中删除,并加入分发决策集;
[0082] 第三步求解分发决策集
[0083] 1)构造决策矩阵,并求理想解
[0084] 首先,将分发候选集中空间信息内容表达为式Sc
[0085] Sc={X,T}   (8)
[0086] 式中,Sc为空间信息内容表达式;X=(x1,x2,…,xeum),xi为元素项,i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;元素项xi是信息分发决策的一个决策属性,{xi|i=1,2,…,eum}也称为决策属性集;T=(T1,T2,…,Teum),T为Sc对于X的属性值向量,Ti为Sc在决策属性xi下的属性值,是一个区间数[ti-,ti+],ti-为Ti的下限,ti+为Ti的上限;
[0087] 其次,建立分发候选集{Sc(j)|j=1,2,…,sum}对于决策属性集{xi|i=1,2…,e,u}m的决策矩阵F:
[0088] F=(γji)sum×eum   (9)
[0089] 式中,γji为Sc(j)在决策属性xi下的属性值,sum为分发候选集中元素的个数,j为分发候选集中元素的序号,j=1,2,…,sum;i是元素项的序号,eum是元素项的个数,i=1,2,…,eum;
[0090] 最后,建立分发候选集的理想解A*与分发候选集的负理想解A0
[0091] A*=(A1*,A2*,…,Aeum*)   (10)
[0092] A0=(A10,A20,…,Aeum0)   (11)
[0093] 式中,Ai*为属性xi的理想解,Ai0为属性xi的负理想解;设用户模型中每个非均匀分割的子区间Ii,g对应的区间数为I′i,g,则
[0094]
[0095]
[0096] 式中, 为属性xi的非均匀分割子区间Ii,g,g=1,2,…,vumi对应的效用度最大的区间数,vumi为第i个元素项的子区间个数, 和 分别为该区间数的下限和上限,此时子区间记为I*i,g,s*i,g为子区间I*i,g对应的分布特征值;Ai0为属性xi的负理想解, 为属性xi的效用度最小的区间数, 和 分别为该区间数的下限和上限,此时子区间为I0i,g,s0i,g为子区间I0i,g对应的分布特征值;
[0097] 2)确立分发决策集
[0098] 首先,与分发候选集的理想解和分发候选集的负理想解的特征距离为[0099]
[0100]
[0101]
[0102] 式中,dj*为Sc(j)与分发候选集的理想解的特征距离,dj0为Sc(j)与分发候选集的负理想解的特征距离,γj为Sc(j)在各个决策属性xi,i=1,2,…,eum下的属性值向量;A*为分发候选集的理想解;wi是决策属性xi的权值,Mea()为求决策属性xi的理想解及负理想解与决策属性xi的属性值的距离函数,Ai*为决策属性xi的理想解,Ti(j)表示第j条空间信息的内0
容在决策属性xi下的属性值,Ti(j)是一个区间数,Ai为决策属性xi的负理想解,A为决策属性xi的正理想解和负理想解,B为决策属性xi的属性值,di是xi的区间变量的区间方差,λi是xi的区间变量的区间方差的阈值,si,g为子区间Ii,g对应的分布特征值;Max()为求最大值函数;
[0103] 其次,计算备选方案Sc(j)的效用度μj
[0104]
[0105] 其中,
[0106] 式中,μj是Sc(j)的效用度,dj0为Sc(j)与分发候选集的负理想解的特征距离,dj*为Sc(j)与分发候选集的理想解的特征距离,wi是决策属性xi的权值,Ai*是决策属性xi的理想解,Ti(j)是Sc(j)在决策属性xi下的属性值,是一个区间数;di是xi的区间变量的区间方差,λi是xi的区间变量的区间方差的阈值,Mea()为求决策属性xi的理想解及负理想解与决策属性xi的属性值的距离函数,Max()为求最大值函数;
[0107] 最后,根据效用度μj值,将大于或等于给定阈值的备选方案依次加入分发决策集,从而确立分发决策集。
[0108] 下面通过借助以下实施例将更加详细说明本发明,且以下实施例仅是说明性的,本发明并不受这些实施例的限制。
[0109] 实施例1
[0110] 一个实验系统的具体执行步骤为:
[0111] (1)空间信息元数据注册
[0112] 空间信息注册中心是空间信息数据提供者和数据使用者的中介,将各数据中心的元数据注册到空间信息注册中心,利用空间信息注册中心管理这些元数据记录,注册中心数据库采用Oracle数据库。
[0113] (2)空间信息用户数据源收集
[0114] 用户注册数据和查询数据,通过XML文件记录,作为空间信息用户建模的数据源,用户在登录使用空间信息分发实验系统前进行注册,注册信息包括用户唯一标识符、姓名、年龄等;在系统使用过程中,进行空间信息的查询。
[0115] (3)空间信息用户建模
[0116] 空间信息用户数据源收集达到系统指定的阈值后,通过查询分解、权值求解、分布特征值求解、兴趣度与规则建立等四个步骤来建立空间信息用户模型,并通过XML方式存入Oracle数据库中,作为一种主动的空间信息个性化分发的数据源。
[0117] (4)主动的空间信息个性化分发
[0118] 空间信息用户代理周期性访问注册中心,以一定的时间间隔查询注册中心元数据表,获取可用的空间信息。通过空间信息用户模型与空间信息的相似性匹配结果,将待分发的空间信息标识存入空间信息个性化分发数据库。空间信息分发代理监控空间信息个性化分发数据库,实现将适当的空间信息主动地分发给适当的用户。
[0119] 1)分发任务分派服务
[0120] 根据数据库中的信息进行任务分派。如果该数据只需分发给一个用户,则调用单播数据分发服务来分发该数据;如果该数据需要分发给多个用户,则根据需要分发数据量的大小和用户的个数等要素来计算是采用多次一对一单播方式传输还是采用应用层组播方式传输,分别调用单播数据分发服务或应用层组播数据分发服务来分发该数据。
[0121] 2)单播数据分发服务:支持断点续传的多线程点到点单播数据传输
[0122] 多线程单播将数据分块并行传输,支持断点续传的多线程点到点单播数据传输流程包括动态数据压缩、多线程传输、多线程断点续传和文件完整性与一致性校验等步骤。
[0123] 3)应用层组播数据分发服务:基于网状拓扑与节点邻近度优先的对等应用层组播数据传输
[0124] 服务器在分发数据时,如果有多个接收方需要此数据,采用组播方式传输会比发送方通过多次一对一单播传输有更高的效率和更少的网络负载。