CN101494566B - 预测对等网络中对等体的继续在线时长的方法及装置 - Google Patents

预测对等网络中对等体的继续在线时长的方法及装置 Download PDF

Info

Publication number
CN101494566B
CN101494566B CN2008100656299A CN200810065629A CN101494566B CN 101494566 B CN101494566 B CN 101494566B CN 2008100656299 A CN2008100656299 A CN 2008100656299A CN 200810065629 A CN200810065629 A CN 200810065629A CN 101494566 B CN101494566 B CN 101494566B
Authority
CN
China
Prior art keywords
peer
life cycle
probability
historical
multidimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008100656299A
Other languages
English (en)
Other versions
CN101494566A (zh
Inventor
施广宇
龚皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2008100656299A priority Critical patent/CN101494566B/zh
Priority to PCT/CN2008/072778 priority patent/WO2009092213A1/zh
Publication of CN101494566A publication Critical patent/CN101494566A/zh
Priority to US12/835,400 priority patent/US8280705B2/en
Application granted granted Critical
Publication of CN101494566B publication Critical patent/CN101494566B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1048Departure or maintenance mechanisms

Abstract

本发明实施例提供一种预测对等网络中对等体的继续在线时长的方法,包括:获取对等体的M个历史生命周期样本数据Si,i=1,...,M;确定待建立的多维高斯混合模型中,高斯成分的个数n,n是大于或等于2的正整数;所述多维高斯混合模型表示所述对等体的继续在线时长的概率分布;利用Si与n,建立所述多维高斯混合模型;利用被建立的多维高斯混合模型,预测所述对等体的继续在线时长。本发明实施例还提供预测对等网络中对等体的继续在线时长的装置。本发明实施例提供的技术方案,基于历史生命周期以及多维高斯混合模型,能够预测出较逼近对等体节点的实际继续在线时长的预测结果。

Description

预测对等网络中对等体的继续在线时长的方法及装置
技术领域
本发明涉及对等网(P2P,Peer-to-Peer)技术领域,尤其涉及一种预测对等网络中对等体的继续在线时长的方法及装置。
背景技术
与传统的客户机/服务器模式不同,P2P网络中不存在中心服务器节点,其中,每个节点既可用作服务器为其他节点提供服务,同时,又可以享受其他节点用作服务器时所提供的服务。因此,P2P网络中,每个Peer节点处于对等地位,称每个节点为一个对等体,或一个Peer。
P2P网络是一种自组织形态的网络系统,该网络中,每个Peer加入网络或从网络中推出的行为均是随机性的。由于P2P网络中,每个Peer均作为一个为其他Peer提供服务的服务器,因此,Peer加入或退出系统的随机性,会对节点间的数据传输的造成扰动,如另一Peer在该Peer下线之前,连接到该Peer,准备从该Peer下载数据,但因该Peer的突然下线,一方面使得该Peer不能够再作为服务器为另一Peer提供服务,另一方面,另一Peer需要重新变更路由,到其他Peer上获取相关数据。Peer上线行为的随机性,会影响网络系统的正常运行,并导致整个系统性能的下降。称因Peer上线行为的随机性给P2P网络系统造成的影响为扰动(Churn)现象。
需要采取相应措施,以尽量避免Churn现象给系统造成的不良影响,以提高P2P网络的抗干扰(Churn Resistant)能力。
发明内容
本发明的实施例提供一种预测对等网络中对等体的继续在线时长的方法及装置,能够预测出的继续在线的时长。
本发明的实施例提供一种预测对等网络中对等体的继续在线时长的方法,包括:
获取对等体的M个历史生命周期样本数据Si,i=1,...,M;
确定待建立的多维高斯混合模型中,高斯成分的个数n,n是大于或等于2的正整数;所述多维高斯混合模型表示所述对等体的继续在线时长的概率分布;
利用Si与n,建立所述多维高斯混合模型;
利用被建立的多维高斯混合模型,预测所述对等体的继续在线时长。
本发明的实施例提供一种预测对等网络中对等体的继续在线时长的装置,包括:
获取单元,获取对等体的M个历史生命周期样本数据Si,i=1,...,Mi
模型建立单元,利用采样单元获取的Si,以及高斯成分的个数n,建立多维高斯混合模型,n是大于或等于2的正整数,所述高斯混合模型表示所述对等体的继续在线时长的概率分布;
预测单元,利用模型建立单元建立的所述多维高斯混合模型,预测所述对等体的继续在线时长。
本发明的实施例提供一种建立对等网络中对等体的生命周期模型的方法,包括:
获取对等体的M个历史生命周期样本数据Si,i=1,...,M;
确定待建立的多维高斯混合模型中,高斯成分的个数n,n是大于或等于2的正整数;所述多维高斯混合模型表示所述对等体的继续在线时长的概率分布;
利用Si与n,建立所述多维高斯混合模型;
将所述高斯混合模型的描述信息发送。
本发明的实施例提供一种建立对等网络中对等体的生命周期模型的装置,包括:
获取单元,获取对等体的M个历史生命周期样本数据Si,i=1,...,Mi
模型建立单元,利用采样单元获取的Si,以及高斯成分的个数n,n是大于或等于2的正整数,建立多维高斯混合模型,所述高斯混合模型表示所述对等体的继续在线时长的概率分布;
发送单元,将模型建立单元建立的所述高斯混合模型的描述信息发送。
本发明实施例提供的预测对等网络中对等体的继续在线时长的方法及装置,利用历史生命周期样本数据,建立能够表示所述对等体的继续在线时长的概率分布的多维高斯混合模型,并基于这样的多维高斯混合模型预测Peer的继续在线时长。
附图说明
图1是一种高斯混合模型的示意图;
图2是一种三维高斯混合模型的示意图;
图3是本发明实施例中预测Peer生命周期的方法流程图;
图4是本发明实施例中多维高斯混合模型的算法示意图;
图5是本发明实施例中多维高斯混合模型计算过程示意图;
图6是本发明实施例中预测对等网络中对等体的继续在线时长的装置。
具体实施例:
下面将结合附图对本发明实施例的技术方案作进一步详细描述。
现有的Peer生命周期预测结果之所以难以体现Peer的实际生命周期,是因为现有技术采用幂率分布模型预测生命周期时,只考虑了Peer在线时的Δtalive和Δtsince对预测结果的影响,即体现Peer当前的在线状态对预测结果的影响,而在线状态未必就是影响Peer生命周期的重要因素。实际上,由于用户上网行为通常呈现出一定的用户习惯,简单举例,如用户通常上午在线时间集中在九点到10点之间,晚上的上网时间通常集中在20点到22点之间,因此,Peer的历史在线时间应可作为影响其生命周期的预测结果的重要影响因素,用于预测Peer的生命周期。
进一步说明,现有技术中通过当前已在线时长这一单一因素所遵循的概率分布,预测Peer的继续在线时长,欠缺对实际影响预测结果的准确率的各种可能因素的综合影响的考虑,因此,预测结果与实际结果偏离较大。由于真实的历史生命周期是在各种可能的因素的影响下所产生的,因此,本发明实施例中,根据历史生命周期的样本的在线数据(例如:上线时刻,在线时长等),从而统计出Peer的生命周期规律,并根据Peer的生命周期规律,预测出当前Peer的生命周期概率,以及可能继续存活的时长。
本发明实施例中,利用多维高斯混合模型,来描述Peer生命周期的概率分布,基于建立的多维高斯混合模型,推算出Peer的继续在线时长,进而结合Peer已在线时长,推算出Peer的生命周期。
先对高斯混合模型作简要说明。高斯混合模型是基于多个遵循高斯分布的高斯成分,以及每个高斯成分对应的权值,对多种高斯分布进行合成的概率分布模型。参见图1,图1是一种高斯混合模型的示意图,该模型中的高斯成分有五个,每个高斯成分遵循对应的高斯分布,每个高斯分布由对应的高斯曲线所标示。高斯曲线对应的高斯分布函数如公式(3):
p ( x ) = 1 2 π σ exp ( - 1 2 ( x - μ σ ) 2 ) 公式(3)
通常,方便起见,用N(μ,σ2)表示一种高斯分布,其中,μ为x的均值,σ2为x与均值的差方,对于一个高斯模型的建立来讲,若μ和σ2已知了,则该高斯模型也就被建立了。图1所示模型中,五个高斯分布分别是N(0,0.1)、N(2,1)、N(3,0.5)、N(3.5,0.1)和N(4,1)。在对五个高斯分布进行合成时,考虑各高斯成分对合成结果的影响所占权重的不同,将五个拟合成图1所示的一条混合高斯曲线Mixture。
二维高斯曲线对应的高斯分布函数如公式(4):
f ( x ) = 1 2 π σ x σ y 1 - r 2 exp { - 1 2 ( 1 - r 2 ) [ ( x - μ x σ x ) 2 - 2 r ( x - μ x σ x ) ( y - μ y σ y ) + ( y - μ y σ y ) 2 ] } 公式(4)
在函数中,由N个多元数组来表示(μx,σx,μy,σy,r),其中(j=1,2,...,N),r表示二维高斯成分之间的相关性系数,|r|<1。在本发明中,令二元高斯分布随机变量ξ、η,其均值为
E ξ η = μ x μ y = μ
协方差矩阵为
B = σ x 2 rσ x σ y rσ x σ y σ y 2
二维高斯分布可以表示为N(μ,B)。
同理,d维高斯分布函数如公式(5)所示:
f ( x ) = 1 ( 2 π ) d / 2 | Σ | 1 / 2 exp { - 1 2 [ ( x - μ ) T Σ - 1 ( x - μ ) ] } 公式(5)
最终由M个节点生命周期历史记录所构造形成的三维高斯混合模型如图2所示,在一定的统计时间内将会出现多个峰值相互叠加的情况。
本发明实施例中,通过建立多维高斯混合模型来预测Peer的继续在线时长。
参加图3,图3是本发明实施例中预测Peer生命周期的方法流程图,该流程可包括以下步骤:
步骤201、获取对等体的M个历史生命周期源数据Pi,i=1,...,M,该历史生命周期样本数据可以包括对等体节点的历史上线的时刻和历史在线的时长。
可以先获取对等体的M个历史生命周期源数据Pi,i=1,...,M。该源数据Pi可以包括对等体节点每次的上线时刻和在线时长(如节点A,1月4号20点整上线,在线时间2小时;1月5日10点20上线,在线时间3小时等)。
本发明实施例中,为保证用户的隐私,历史生命周期样本数据可由Peer自身记录并保存。同时,也可以通过让Peer节点发送历史生命周期样本数据到某一中心服务器的方法来集中获取。
步骤202、根据采样精度对Pi进行采样后得到历史生命周期样本数据Si,该Si可以包括对等体节点的历史在线的时刻和历史在线的时长,其中,对等体节点的历史在线时长数据包括,节点某一次上线时间点到下线时间点所经历的总时间长度。历史在线时长的单位可以为分钟、秒或者小时等,单位越小,数据越精确。
另外,也可以采用步骤20替换步骤201和202,步骤20,直接对Peer节点进行采样,获取对等体的样本数据Si
本发明实施例中,为保证用户的隐私,历史生命周期源数据可由Peer自身记录并保存。也可以通过让Peer节点发送历史生命周期源数据到某一中心服务器的方法来集中获取。
步骤203、确定待建立的多维高斯混合模型中,高斯成分的个数n,n是大于或等于2的正整数;所述多维高斯混合模型表示所述对等体的继续在线时长的概率分布。
实际应用中,可综合考虑所建成的多维高斯混合模型与生命周期实际概率分布的逼近程度,以及建立多维高斯混合模型这一过程的计算量,来确定n的取值。通常,n越大,则建立模型时的运算量相对越大,但建立出来的多维高斯混合模型与实际概率分布较逼近。
所述步骤203与步骤201和202之间没有顺序的先后,可以先做步骤201和202,再做步骤203,也可以先做步骤203,再做步骤201和202。
步骤204、利用Si与n,建立所述多维高斯混合模型。
该步骤中,建立多维高斯混合模型的过程,即计算每个高斯成分对应的高斯分布参数μ、B,以及多维高斯混合模型中,每个高斯成分所占权重的过程。本发明实施例中,取多维高斯分布参数为μ和B。
将多维高斯混合模型建好后,可以发送出去,例如:可以由服务器建立模型,然后将模型发送给Peer应用,或者由Peer建立模型,然后将模型发送给服务器应用。将多维高斯混合模型发送时,可以将所述高斯混合模型的描述信息发出,其中,所谓高斯混合模型的描述信息也即上述混合模型参数,如w,μ,B。
步骤205、利用建立的多维高斯混合模型,计算所述对等体的继续在线时长。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如:ROM/RAM、磁碟、光盘等。
基于算出的Peer的继续在线时长,基于当前该Peer已在线时长,预测出Peer本次存活的生命周期。进一步,P2P网络系统可基于Peer在线时间的预测值,提前做好Peer下线准备,如可提前通知其他关联邻居节点刷新所维护的节点信息,有效避免其他关联邻居节点在搜索、路由过程中指向该节点的时刻刚好该节点离开的现象出现,从而,避免Peer下线随机性给网络系统造成的扰动,提高网络系统的抗扰动能力。系统通知其他关联邻居节点如,chord网络中,指针表中包含该节点的节点标识(ID);pastry网络中路由表中包含该节点的ID;kademlia网络中K桶中包含该节点的ID;等等。
下面主要对上述步骤204中,如何建立高斯混合模型作进一步说明。
参见图4,图4是本发明实施例中高斯混合模型的算法示意图。参见图5,图5是本发明实施例中高斯混合模型计算过程示意图。图4与图5中,S表示历史生命周期样本数据序列,M表示样本数据空间中有M个样本数据,β表示n个高斯分布,w表示高斯成分的权重,Z服从参数为β的高斯分布。其中,
S=(S1,S2,...,Si,...,SM);
βj=N(μj,Bj),j=1,...,n;
zi~Multinomial(w)。
基于采集到的M个Si,可知道每个Si在M中的出现次数,进而能够算出各Si的出现概率si。设si对应的概率分布为p(si|zi,β),该概率分布即表示的是与实际概率分布相对应的需要建立的高斯混合模型。
具体计算时,根据已知量si和n,利用现有贝叶斯推理,计算多维高斯混合模型中,各多维高斯模型的高斯分布参数,即βj=N(μj,Bj),以及对应的w。称要求解的βj=N(μj,Bj)与对应的w为混合模型参数。基于已知的si和n,使用极大似然法估计w和β,过程如下:设w和β的初始值为0,
第一步:建立包括有多维混合模型参数的似然函数(likelihood function)
L ( s ; θ ) , L ( s ; θ ) = Π i = 1 M p ( s i | θ ) , θ = ( w j , μ j , B j ) ;
第二步:根据si求出L(s;θ)达到极值时,混合模型参数的估计值。其中,因为似然函数L(s;θ)与似然函数的对数lnL(s;θ),在同一参数θ处获得最大值,为计算简便,通常对似然函数求对数来进行估计:
ln L ( s ; θ ) = Σ i = 1 M ln ( Σ j = 1 N w ij N s i ( μ j , B j ) ) , 式一
其中wij=p(wi=j|θ),且 Σ j = 1 N p ( w i = j | θ ) = 1 .
对式一采用EM估计:
E步:利用从上一次M步估计获得的估计量θ(k)=(w(k),μ(k),B(k)),可以求出参数w的后验概率。推导如下:
h ij ( k ) = p ( w i = j | s i , θ ( k ) ) = p ( w i = j , s i | θ ( k ) ) p ( s i | θ ( k ) )
因为:p(s|w=j,θ)=N(μj,Bj),所以上式可写为:
h ij ( k ) = p ( s i | w i = j , θ ( k ) ) p ( w i = j | θ ( k ) ) Σ l = 1 N p ( s i | w i = l , θ ( k ) ) p ( w i = l | θ ( k ) ) = w ij ( k ) N s i ( μ j ( k ) , B j ( k ) ) Σ l = 1 N w il ( k ) N s i ( μ l ( k ) , B l ( k ) )
M步:利用期望最大化,写出期望函数,求出使期望函数取得最大值的参数θ。求最大值可以利用对似然函数求导取0,算出θ。即 ∂ L ( θ ) ∂ θ = 0 . 在M步对似然函数求导的过程中,可以通过一次对参数θ=(μ,B,p(w=j))求导。
通过对 ∂ L ( θ ) ∂ μ j = 0 求解,可以得出 μ j ( k + 1 ) = Σ i = 1 M h ij ( k ) s i Σ i = 1 M h ij ( k ) .
通过对 ∂ L ( θ ) ∂ B j = 0 求解,可以得出 B j ( k + 1 ) = Σ i = 1 M h ij ( k ) ( s i - μ j ( k ) ) ( s i - μ j ( k ) ) T Σ i = 1 M h ij ( k ) .
通过对 ∂ L ( θ ) ∂ p ( w i = j | θ ) = 0 求解,可以得出 w ij ( k + 1 ) = 1 M Σ i = 1 M h ij ( k ) .
通过上述计算过程计算出θ参数后,混合模型参数也就确定,相应地,高斯混合模型也就确定下来。上述对混合模型参数的估算基于EM算法进行,实际应用中,也可采用变分法估算混合模型参数。
之后,保存算出的混合模型参数,Peer可以利用建立的高斯混合模型,预测该Peer的继续在线时长,即估计SM+1,过程如下:
a、根据保存的各混合模型参数,可算出Peer的生命周期的出现概率密度为:
p ( s i ) = Σ j = 1 N w ij N ( μ j , B j ) .
b、记Peer的继续存活y时长的概率为Q(y),通过Q(y)=p(s>(t+y)|s>t,δ),则,
Q ( y ) = p ( s > ( t + y ) | s > t , δ ) = p ( s > ( t + y ) | δ ) p ( s > t | δ ) = p ( s > ( t + y ) ∩ δ ) p ( s > t ∩ δ ) = ∫ t + y ∞ p ( s ) ds ∫ t ∞ p ( s ) ds 式二
其中,t=Δtalive为给定值,y=Δtsince为变量,δ为当前的上线时间区间值。分母为某一定值,分子为y的表达式。
c、求Peer的继续在线时长的期望值E[y],则,E(y)=∫yQ(y)dy。
d、基于预测出的继续在线时长,预测出Peer的生命周期T:
T=t+E[y]=t+∫yQ(y)dy。
至此,基于建立的多维高斯混合模型,预测出Peer的生命周期。
在si的内容中可以包括区间信息,区间是表示取样的时间段,区间的长度,可以为一个小时,或者一天,或者半天,或者一周,或者一个月。可以分别以周一,周二,周三,周四,周五,周六,周日作为区间,也可以将周一至周五作为一个区间,将周六至周日作为一个区间等,区间可以分为多种,将属于同一个区间的多个样本数据进行统计,可以得出在该区间上的上线规律,并作为高斯模型的一个输入维度加入到模型参数计算中。
另外,可以针对每种区间分别建立高斯模型。在一个星期内,可以分别以周一,周二,周三,周四...周日,作为一个区间,这样需要建7个高斯模型分别统计每个区间内的上线规律。在一个星期内,也可以以周一至周五作为一个区间,将周六至周日作为一个区间,这样需要建2个高斯模型分别统计每个区间内的上线规律。
每个区间内可以按照采样精度划分刻度,可以每15分钟划分为一个刻度,或者每半个小时划分为一个刻度等等,通过统计在每个刻度上的上线信息(例如:是否上线,上线时长),从而得出在该区间上的上线规律。
Si的内容可以包括:在线时长信息,上线的时刻信息,这样,建立的混合高斯模型,就有三个维度,包括:在线时长,上线的时刻,和概率分布。如果将多个区间的信息汇集在一起,就会多一个维度,就是多个区间形成的维度,这样,Si的内容还可以包括:在线时长信息,上线的时刻信息,上线的区间信息。这样,建立的混合高斯模型,就有四个维度,包括:在线时长,上线的时刻,上线的区间,和概率分布。
对于一周内的概率统计,可以将周一至周日作为一个区间,Si包括在线时长和上线的时刻两个维度。也可以将一周划分为几个区间(例如分别将周一,周二,周三,周四,周五...周日作为一个区间),Si包括在线时长,上线的时刻,以及上线的区间,这样,就有三个维度。
Si的内容举例如下:
{在线时长(min),上线时刻(hour:minute),上线区间(week)}
={120,20:15,5},{240,14:00,6}......{50,21:30,1}
或者
{在线时长(min),上线时刻(hour:minute),上线区间(week)}
={120,20:15,周末},{240,14:00,周末}......{50,21:30,工作日}
或者
{在线时长(min),上线时刻(week:hour:minute)}
={120,5:20:15},{240,6:14:00}......{50,1:21:30}
对应于上述本发明实施例中预测Peer的继续在线时长的方案,本发明实施例还提供一种预测对等网络中对等体的继续在线时长的装置,所述装置基于前面所述的方法实现,参见图6,图6是该装置的结构示意图,该装置可设置于每个Peer上或者服务器上或者其他通信设备上,用于预测该Peer每次上线的继续在线时长,包括:获取单元、接收单元、模型建立单元和预测单元,其中,
获取单元,获取对等体的M个历史生命周期样本数据Si,i=1,...,M;
所述获取单元可以具体包括:
第一单元,获取对等体的M个历史生命周期源数据Pi,i=1,...,M;
第二单元,根据采样精度,对历史生命周期源数据Pi进行采样得到Si
接收单元,接收待建立的多维高斯混合模型中,高斯成分的个数n,n是大于或等于2的正整数;所述多维高斯混合模型表示所述对等体的继续在线时长的概率分布。
模型建立单元,利用采样单元获取的Si,以及高斯成分的个数n,建立多维高斯混合模型,n是大于或等于2的正整数;所述高斯混合模型表示所述对等体的继续在线时长的概率分布;
预测单元,利用模型建立单元建立的所述多维高斯混合模型,预测所述对等体的继续在线时长。
另外,如果高斯成分的个数n保存在模型建立单元中,则不需要接收单元。
模型建立单元包括:
参数计算单元,计算所述多维高斯混合模型的混合模型参数;
所述多维混合模型参数包括:
每个高斯成分对应的高斯分布参数,以及所述多维高斯混合模型中,每个高斯成分所占权重。
参数计算单元包括:
概率计算单元,根据采样得到的M个Si,算出各Si的出现概率si
函数构建单元,建立包括所述多维混合模型参数的似然函数;
估算单元,利用所述概率计算单元算出的si,计算所述函数构建单元构建的所述似然函数取最大值时,各多维混合模型参数的估算值。
预测单元包括:
概率密度计算单元,计算所述对等体生命周期的出现概率密度;
存活概率计算单元,利用概率密度计算单元算出的所述出现概率密度,计算所述对等体继续存活预设变化时长的概率;
时长计算单元,利用所述概率密度计算单元算出的概率,求取所述对等体的继续在线时长。
该装置进一步包括:生命周期预测单元,根据所述预测单元预测出的所述继续在线时长,以及所述对等体已在线时长,算出所述对等体本次存活的生命周期或某一继续在线时长可能出现的概率。
本发明实施例还提供了一种建模装置,该装置可包括上述获取单元,接收单元和模型建立单元,模型建立单元可以是上述参数计算单元,包含上述函数构建单元和估算单元;该建模装置进一步包括:
发送单元,将模型建立单元建立的所述高斯混合模型的描述信息发送。
其中,所谓高斯混合模型的描述信息也即上述混合模型参数,如w,μ,B。
综上所述,本发明实施例提供的预测对等网络中对等体的继续在线时长的方法及装置,利用历史生命周期样本数据,建立能够表示所述对等体的继续在线时长的概率分布的多维高斯混合模型,该多维高斯混合模型中,不是基于受单一条件因素影响下Peer的继续在线时长所遵循的概率分布,预测Peer的继续在线时长,而是基于Peer的继续在线时长受多种条件因素影响,综合考虑多个条件因素影响下继续在线时长分别遵循的概率分布,合成最终的多维高斯混合模型,并基于这样的多维高斯混合模型预测Peer的继续在线时长,使预测结果逼近Peer的实际继续在线时长。

Claims (21)

1.一种预测对等网络中对等体的继续在线时长的方法,其特征在于,包括:
获取对等体的M个历史生命周期样本数据Si,i=1,...,M;
确定待建立的多维高斯混合模型中,高斯成分的个数n,n是大于或等于2的正整数,所述多维高斯混合模型表示所述对等体的继续在线时长的概率分布;
根据已知量si和n,利用贝叶斯定理,计算多维高斯混合模型中各多维高斯成分的高斯分布参数以及每个高斯成分所占的权重,建立所述多维高斯混合模型,其中si表示各Si出现的概率;
利用建立的多维高斯混合模型,计算所述对等体生命周期的出现概率密度,根据所述对等体生命周期的出现概率密度计算所述对等体继续存活预设变化时长的概率,根据所述概率确定所述对等体的继续在线时长。
2.根据权利要求1所述的方法,其特征在于,所述的历史生命周期样本数据Si的内容包括:对等体节点的历史在线时长信息和对等体节点的历史上线的时刻信息。
3.根据权利要求1所述的方法,其特征在于,所述的历史生命周期样本数据Si的内容包括:对等体节点的历史在线时长信息,对等体节点的历史上线的时刻信息,和对等体节点的历史上线的区间信息。
4.根据权利要求1所述的方法,其特征在于,所述获取对等体的M个历史生命周期样本数据Si,包括:
获取对等体的M个历史生命周期源数据Pi,i=1,...,M;
对源数据Pi按采样精度进行采样得到历史生命周期样本数据Si
5.根据权利要求1所述的方法,其特征在于,预测所述对等体的继续在线时长后,该方法进一步包括:
根据确定出的所述继续在线时长,以及所述对等体已在线时长,算出所述对等体本次存活的生命周期或一继续在线时长可能出现的概率。
6.根据权利要求4所述的方法,其特征在于,所述历史生命周期样本数据或历史生命周期源数据由所述对等体自身记录并保存,或者,通过让所述对等体节点发送历史生命周期样本数据或历史生命周期源数据到中心服务器的方法来集中获取。
7.一种预测对等网络中对等体的继续在线时长的装置,其特征在于,包括:
获取单元,获取对等体的M个历史生命周期样本数据Si,i=1,...,M;
模型建立单元,利用获取单元获取的Si,以及高斯成分的个数n,n是大于或等于2的正整数,根据已知量si和n,利用贝叶斯定理,计算多维高斯混合模型中各多维高斯模型的高斯分布参数以及每个高斯成分所占的权重,建立多维高斯混合模型,所述高斯混合模型表示所述对等体的继续在线时长的概率分布,其中si表示各Si出现的概率;
预测单元,利用模型建立单元建立的所述多维高斯混合模型,计算所述对等体生命周期的出现概率密度,根据所述对等体生命周期的出现概率密度计算所述对等体继续存活预设变化时长的概率,根据所述概率确定所述对等体的继续在线时长。
8.根据权利要求7所述的装置,其特征在于,所述获取单元包括:
第一单元,获取对等体的M个历史生命周期源数据Pi,i=1,...,M;
第二单元,根据采样精度,对历史生命周期源数据Pi进行采样得到Si
9.根据权利要求7所述的装置,其特征在于,所述的历史生命周期样本数据Si的内容包括:对等体节点的历史在线时长信息和对等体节点的历史上线的时刻信息。
10.根据权利要求7所述的装置,其特征在于,所述的历史生命周期样本数据Si的内容包括:对等体节点的历史在线时长信息,对等体节点的历史上线的时刻信息,和对等体节点的历史上线的区间信息。
11.根据权利要求7所述的装置,其特征在于,所述模型建立单元包括:
参数计算单元,计算所述多维高斯混合模型的混合模型参数,
所述混合模型参数包括:
每个高斯成分对应的多维高斯分布的分布参数,以及所述多维高斯混合模型中,每个高斯成分所占权重。
12.根据权利要求11所述的装置,其特征在于,所述参数计算单元包括:
概率计算单元,根据采样得到的M个Si,算出各Si的出现概率si
函数构建单元,建立包括所述多维混合模型参数的似然函数;
估算单元,利用所述概率计算单元算出的si,计算所述函数构建单元构建的所述似然函数取最大值时,各多维混合模型参数的估算值。
13.根据权利要求7所述的装置,其特征在于,预测单元包括:
概率密度计算单元,计算所述对等体生命周期的出现概率密度;
存活概率计算单元,利用概率密度计算单元算出的所述出现概率密度,计算所述对等体继续存活预设变化时长的概率;
时长计算单元,利用所述存活概率计算单元算出的概率,求取所述对等体的继续在线时长。
14.根据权利要求7所述的装置,其特征在于,所述装置进一步包括:生命周期预测单元,根据所述预测单元预测出的所述继续在线时长,以及所述对等体已在线时长,算出所述对等体本次存活的生命周期或一继续在线时长可能出现的概率。
15.根据权利要求7所述的装置,其特征在于,所述装置进一步包括:接收单元,接收待建立的多维高斯混合模型中,高斯成分的个数n,n是大于或等于2的正整数。
16.一种建立对等网络中对等体的生命周期模型的方法,其特征在于,包括:
获取对等体的M个历史生命周期样本数据Si,i=1,...,M;
确定待建立的多维高斯混合模型中,高斯成分的个数n,n是大于或等于2的正整数,所述多维高斯混合模型表示所述对等体的继续在线时长的概率分布;
根据已知量si和n,利用贝叶斯定理,计算多维高斯混合模型中各多维高斯模型的高斯分布参数以及每个高斯成分所占的权重,建立所述多维高斯混合模型,其中si表示各Si出现的概率;
将所述高斯混合模型的描述信息发送。
17.根据权利要求16所述的方法,其特征在于,所述的历史生命周期样本数据Si的内容包括:对等体节点的历史在线时长信息和对等体节点的历史上线的时刻信息。
18.根据权利要求16所述的方法,其特征在于,所述的历史生命周期样本数据Si的内容包括:对等体节点的历史在线时长信息,对等体节点的历史上线的时刻信息,和对等体节点的历史上线的区间信息。
19.一种建立对等网络中对等体的生命周期模型的装置,其特征在于,包括:
获取单元,获取对等体的M个历史生命周期样本数据Si,i=1,...,M;
模型建立单元,利用获取单元获取的Si,以及高斯成分的个数n,根据已知量si和n,利用贝叶斯定理,计算多维高斯混合模型中各多维高斯模型的高斯分布参数以及每个高斯成分所占的权重,建立多维高斯混合模型,n是大于或等于2的正整数,所述高斯混合模型表示所述对等体的继续在线时长的概率分布,其中si表示各Si出现的概率;
发送单元,将模型建立单元建立的所述高斯混合模型的描述信息发送。
20.根据权利要求19所述的装置,其特征在于,所述的历史生命周期样本数据Si的内容包括:对等体节点的历史在线时长信息和对等体节点的历史上线的时刻信息。
21.根据权利要求19所述的装置,其特征在于,所述的历史生命周期样本数据Si的内容包括:对等体节点的历史在线时长信息,对等体节点的历史上线的时刻信息,和对等体节点的历史上线的区间信息。
CN2008100656299A 2008-01-23 2008-01-23 预测对等网络中对等体的继续在线时长的方法及装置 Expired - Fee Related CN101494566B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2008100656299A CN101494566B (zh) 2008-01-23 2008-01-23 预测对等网络中对等体的继续在线时长的方法及装置
PCT/CN2008/072778 WO2009092213A1 (zh) 2008-01-23 2008-10-22 预测对等网络中对等体的继续在线时长的方法及装置
US12/835,400 US8280705B2 (en) 2008-01-23 2010-07-13 Method and device for predicting residual online time of peer in peer-to-peer network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100656299A CN101494566B (zh) 2008-01-23 2008-01-23 预测对等网络中对等体的继续在线时长的方法及装置

Publications (2)

Publication Number Publication Date
CN101494566A CN101494566A (zh) 2009-07-29
CN101494566B true CN101494566B (zh) 2011-09-14

Family

ID=40900758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100656299A Expired - Fee Related CN101494566B (zh) 2008-01-23 2008-01-23 预测对等网络中对等体的继续在线时长的方法及装置

Country Status (3)

Country Link
US (1) US8280705B2 (zh)
CN (1) CN101494566B (zh)
WO (1) WO2009092213A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103139272A (zh) * 2011-12-02 2013-06-05 北大方正集团有限公司 一种获取选定时间段内在线时长的方法和装置
EP2973095B1 (en) 2013-03-15 2018-05-09 Animas Corporation Insulin time-action model
CN104462793A (zh) * 2014-11-25 2015-03-25 北京数迅科技有限公司 时间序列实时预测方法及装置
CN107248043B (zh) * 2017-06-21 2020-09-15 上海荷福人工智能科技(集团)有限公司 一种基于指静脉数据的建筑工地舆情监测方法
CN108549955B (zh) * 2018-03-26 2022-01-18 国网冀北电力有限公司电力科学研究院 一种充电桩异常率确定方法及装置
CN109829136B (zh) * 2019-01-22 2022-10-04 中国人民解放军火箭军工程大学 一种带随机跳变的退化设备的剩余寿命预测方法及系统
CN109951540B (zh) * 2019-03-07 2020-04-17 北京邮电大学 一种基于内容时效性的数据获取方法、装置及电子设备
CN111027202B (zh) * 2019-12-04 2023-12-15 北京软通绿城科技有限公司 一种数字城市的预测方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1972206A (zh) * 2006-10-26 2007-05-30 武汉理工大学 基于组合式建造p2p系统的方法
CN101043525A (zh) * 2007-04-26 2007-09-26 北京航空航天大学 在p2p网络环境中实现文件共享的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6847854B2 (en) * 2001-08-10 2005-01-25 Rockwell Automation Technologies, Inc. System and method for dynamic multi-objective optimization of machine selection, integration and utilization
US20060247798A1 (en) * 2005-04-28 2006-11-02 Subbu Rajesh V Method and system for performing multi-objective predictive modeling, monitoring, and update for an asset
US7509235B2 (en) * 2005-08-31 2009-03-24 General Electric Company Method and system for forecasting reliability of assets

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1972206A (zh) * 2006-10-26 2007-05-30 武汉理工大学 基于组合式建造p2p系统的方法
CN101043525A (zh) * 2007-04-26 2007-09-26 北京航空航天大学 在p2p网络环境中实现文件共享的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Daniel Stutzbach et al.Understanding Churn in Peer-to-Peer Networks.《Proceedings of the 6th ACM SIGCOMM conference on Internet measurement》.2006,189-202. *

Also Published As

Publication number Publication date
US8280705B2 (en) 2012-10-02
CN101494566A (zh) 2009-07-29
US20100280804A1 (en) 2010-11-04
WO2009092213A1 (zh) 2009-07-30

Similar Documents

Publication Publication Date Title
CN101494566B (zh) 预测对等网络中对等体的继续在线时长的方法及装置
Chen et al. Sensing data supported traffic flow prediction via denoising schemes and ANN: A comparison
Salinas et al. High-dimensional multivariate forecasting with low-rank gaussian copula processes
Chen et al. Predicting future traffic using hidden markov models
He et al. Sensor scheduling for target tracking in sensor networks
CN109921921B (zh) 一种时变网络中时效稳定社团的检测方法和装置
CN102075352A (zh) 一种网络用户行为预测的方法和装置
Liu et al. Stick-breaking policy learning in Dec-POMDPs
Wang et al. Dynamic pricing for controlling age of information
Kim et al. Communication-efficient federated learning with acceleration of global momentum
CN110807508B (zh) 计及复杂气象影响的母线峰值负荷预测方法
CN114692827A (zh) 面向边缘联邦学习的电动汽车锂电池soh在线预测方法
Aldhyani et al. Intelligent time series model to predict bandwidth utilization
Deng et al. A hybrid model of dynamic time wrapping and hidden Markov model for forecasting and trading in crude oil market
Jiang et al. A viral product diffusion model to forecast the market performance of products
CN102143025B (zh) 一种云下载服务质量的预测方法
CN113203953B (zh) 基于改进型极限学习机的锂电池剩余使用寿命预测方法
CN103595741A (zh) 一种p2p流媒体中的节点及优化节点邻居节点表的方法
Huang et al. Modeling complex spatial patterns with temporal features via heterogenous graph embedding networks
Yan et al. Service caching for meteorological emergency decision-making in cloud-edge computing
Mahootchi et al. Opposition-based reinforcement learning in the management of water resources
CN101494582A (zh) 预测对等网络中对等体的继续在线时长的方法及装置
Robins et al. Non-linear Bayesian CBRN source term estimation
Hayat et al. Modeling of prediction bandwidth density with backpropagation neural network (BPNN) methods
Liu et al. Online task dispatching and pricing for quality-of-service-aware sensing data collection for mobile edge clouds

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110914

Termination date: 20190123

CF01 Termination of patent right due to non-payment of annual fee