WO2009092213A1 - 预测对等网络中对等体的继续在线时长的方法及装置 - Google Patents

预测对等网络中对等体的继续在线时长的方法及装置 Download PDF

Info

Publication number
WO2009092213A1
WO2009092213A1 PCT/CN2008/072778 CN2008072778W WO2009092213A1 WO 2009092213 A1 WO2009092213 A1 WO 2009092213A1 CN 2008072778 W CN2008072778 W CN 2008072778W WO 2009092213 A1 WO2009092213 A1 WO 2009092213A1
Authority
WO
WIPO (PCT)
Prior art keywords
peer
historical
online
unit
model
Prior art date
Application number
PCT/CN2008/072778
Other languages
English (en)
French (fr)
Inventor
Guangyu Shi
Hao Gong
Original Assignee
Huawei Technologies Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd. filed Critical Huawei Technologies Co., Ltd.
Publication of WO2009092213A1 publication Critical patent/WO2009092213A1/zh
Priority to US12/835,400 priority Critical patent/US8280705B2/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1048Departure or maintenance mechanisms

Definitions

  • each node can be used as a server to serve other nodes, and at the same time, it can enjoy the services provided by other nodes as servers. . Therefore, in a P2P network, each Peer node is in a peer-to-peer position, and each node is said to be a peer or a Peer.
  • Embodiments of the present invention provide a method and apparatus for predicting a continuous online duration of a peer in a peer-to-peer network, which can predict the duration of the online connection.
  • An embodiment of the present invention provides a method for predicting a continuous online duration of a peer in a peer-to-peer network, including:
  • the model establishing unit establishes a multidimensional Gaussian mixture model by using S 1 obtained by the sampling unit and the number n of Gaussian components, where n is a positive integer greater than or equal to 2, and the Gaussian mixture model indicates that the peer continues to be online Probability distribution of duration;
  • the embodiment of the invention has the following advantages:
  • Step 204 Establish the multi-dimensional Gaussian mixture model by using Si and n.
  • Step 205 Calculate a continuous online duration of the peer by using the established multi-dimensional Gaussian mixture model.
  • Step E Using the estimator ⁇ ⁇ W ⁇ W) obtained from the previous M-step estimation, the posterior probability of the parameter w can be found. The deduction is as follows:
  • Si includes two dimensions: the online duration and the time of the online. You can also divide the week into several intervals (for example, Monday, Tuesday, Wednesday, Thursday, Friday, and Sunday as a range), Si includes the online time, the time of the online, and the upper line, so that there are three Dimensions.
  • the embodiment of the present invention further provides a device for predicting the duration of the online duration of the peer in the peer-to-peer network, and the device is implemented based on the foregoing method.
  • FIG. 6 is a schematic structural diagram of the device.
  • the device may be configured on each Peer or on a server or other communication device, and is used to predict the duration of the online online operation of the Peer, including: acquiring unit 601. a receiving unit 602, a model establishing unit 603, and a predicting unit 604, where
  • the predicting unit 604 predicts the continuing online duration of the peer by using the multi-dimensional Gaussian mixture model established by the model establishing unit.
  • the probability calculation unit 10 calculates the occurrence probability si of each Si according to the M Si samples obtained by sampling;
  • the device further includes: a life cycle prediction unit 605, and calculating, according to the predicted online duration of the prediction unit 604, and the online duration of the peer, calculating a life cycle or a certain life of the peer The probability that a duration may continue to occur.

Description

预测对等网络中对等体的继续在线时长的方法及装置 技术领域
本发明涉及对等网 (P2P, Peer-to-Peer )技术领域, 尤其涉及一 种预测对等网络中对等体的继续在线时长的方法及装置。 背景技术
与传统的客户机 /服务器模式不同, P2P网络中不存在中心服务器 节点, 其中, 每个节点既可用作服务器为其他节点提供服务, 同时, 又可以享受其他节点用作服务器时所提供的服务。因此, P2P网络中, 每个 Peer节点处于对等地位,称每个节点为一个对等体,或一个 Peer。
在实现本发明的过程中, 发明人发现现有技术至少存在以下问 题: P2P 网络是一种自组织形态的网络系统, 该网络中, 每个 Peer 加入网络或从网络中推出的行为均是随机性的。 由于 P2P网络中,每 个 Peer均作为一个为其他 Peer提供服务的服务器, 因此, Peer加入 或退出系统的随机性, 会对节点间的数据传输的造成扰动, 如另一 Peer在该 Peer下线之前, 连接到该 Peer , 准备从该 Peer下载数据, 但因该 Peer的突然下线, 一方面使得该 Peer不能够再作为服务器为 另一 Peer提供服务, 另一方面, 另一 Peer需要重新变更路由, 到其 他 Peer上获取相关数据。 Peer上线行为的随机性, 会影响网络系统 的正常运行, 并导致整个系统性能的下降。 称因 Peer上线行为的随 机性给 P2P网络系统造成的影响为扰动 ( Churn )现象。
需要釆取相应措施,以尽量避免 Churn现象给系统造成的不良影 响, 以提高 P2P网络的抗干扰(Churn Resistant ) 能力。 发明内容
本发明的实施例提供一种预测对等网络中对等体的继续在线时 长的方法及装置, 能够预测出的继续在线的时长。 本发明的实施例提供一种预测对等网络中对等体的继续在线时 长的方法, 包括:
获取对等体的 M个历史生命周期样本数据 , i=l , ... , Μ; 确定待建立的多维高斯混合模型中, 高斯成分的个数 η, η是大 于或等于 2的正整数;所述多维高斯混合模型表示所述对等体的继续 在线时长的概率分布;
利用 与11, 建立所述多维高斯混合模型;
利用被建立的多维高斯混合模型,预测所述对等体的继续在线时 长。
本发明的实施例提供一种预测对等网络中对等体的继续在线时 长的装置, 包括:
获取单元,获取对等体的 Μ个历史生命周期样本数据 Si, i=l , ... ,
Μ ι;
模型建立单元,利用釆样单元获取的 S1 以及高斯成分的个数 n, 建立多维高斯混合模型, n是大于或等于 2的正整数, 所述高斯混合 模型表示所述对等体的继续在线时长的概率分布;
预测单元, 利用模型建立单元建立的所述多维高斯混合模型, 预 'J所述对等体的继续在线时长。
本发明的实施例提供一种建立对等网络中对等体的生命周期模 型的方法, 包括:
获取对等体的 M个历史生命周期样本数据 , i=l , ... , Μ; 确定待建立的多维高斯混合模型中, 高斯成分的个数 η, η是大 于或等于 2的正整数;所述多维高斯混合模型表示所述对等体的继续 在线时长的概率分布;
利用 与11, 建立所述多维高斯混合模型;
将所述高斯混合模型的描述信息发送。
本发明的实施例提供一种建立对等网络中对等体的生命周期模 型的装置, 包括:
获取单元,获取对等体的 Μ个历史生命周期样本数据 Si, i=l , ... , 模型建立单元,利用釆样单元获取的 Sl 以及高斯成分的个数 n, n是大于或等于 2的正整数, 建立多维高斯混合模型, 所述高斯混合 模型表示所述对等体的继续在线时长的概率分布;
发送单元 ,将模型建立单元建立的所述高斯混合模型的描述信息 发送。
与现有技术相比, 本发明实施例具有以下优点:
本发明实施例提供的预测对等网络中对等体的继续在线时长的 方法及装置, 利用历史生命周期样本数据, 建立能够表示所述对等体 的继续在线时长的概率分布的多维高斯混合模型,并基于这样的多维 高斯混合模型预测 Peer的继续在线时长。 附图说明
图 1是一种高斯混合模型的示意图;
图 2是一种三维高斯混合模型的示意图;
图 3是本发明实施例中预测 Peer生命周期的方法流程图; 图 4是本发明实施例中多维高斯混合模型的算法示意图; 图 5是本发明实施例中多维高斯混合模型计算过程示意图; 图 6 是本发明实施例中预测对等网络中对等体的继续在线时长 的装置。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方 案进行清楚、 完整地描述, 显然, 所描述的实施例仅是本发明一部分 实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通 技术人员在没有作出创造性劳动前提下所获得的所有其他实施例 ,都 属于本发明保护的范围。
下面将结合附图对本发明实施例的技术方案作进一步详细描述。 现有的 Peer生命周期预测结果之所以难以体现 Peer的实际生命 周期, 是因为现有技术釆用幂率分布模型预测生命周期时, 只考虑了
Peer在线时的 。^和 对预测结果的影响, 即体现 peer当前的在 线状态对预测结果的影响, 而在线状态未必就是影响 Peer生命周期 的重要因素。实际上,由于用户上网行为通常呈现出一定的用户习惯, 简单举例, 如用户通常上午在线时间集中在九点到 10点之间, 晚上 的上网时间通常集中在 20点到 22点之间, 因此, Peer的历史在线时 间应可作为影响其生命周期的预测结果的重要影响因素, 用于预测 Peer的生命周期。
进一步说明,现有技术中通过当前已在线时长这一单一因素所遵 循的概率分布, 预测 Peer的继续在线时长, 欠缺对实际影响预测结 果的准确率的各种可能因素的综合影响的考虑, 因此, 预测结果与实 际结果偏离较大。由于真实的历史生命周期是在各种可能的因素的影 响下所产生的, 因此, 本发明实施例中, 根据历史生命周期的样本的 在线数据(例如: 上线时刻, 在线时长等), 从而统计出 Peer的生命 周期规律, 并根据 Peer的生命周期规律, 预测出当前 Peer的生命周 期概率, 以及可能继续存活的时长。
本发明实施例中, 利用多维高斯混合模型, 来描述 Peer生命周 期的概率分布, 基于建立的多维高斯混合模型, 推算出 Peer的继续 在线时长, 进而结合 Peer已在线时长, 推算出 Peer的生命周期。
先对高斯混合模型作简要说明。高斯混合模型是基于多个遵循高 斯分布的高斯成分, 以及每个高斯成分对应的权值, 对多种高斯分布 进行合成的概率分布模型。 参见图 1 , 图 1是一种高斯混合模型的示 意图, 该模型中的高斯成分有五个, 每个高斯成分遵循对应的高斯分 布, 每个高斯分布由对应的高斯曲线所标示。 高斯曲线对应的高斯分 布函数如公式(3 ): -exp 公式( 3 )
2πσ σ 通常, 方便起见, 用^^^, )表示一种高斯分布, 其中, 为 X 的均值, 为 X与均值的差方, 对于一个高斯模型的建立来讲, 若^ / 和 σ2已知了, 则该高斯模型也就被建立了。 图 1所示模型中, 五个高 斯分布分别是 Ν (0, 0.1 )、 Ν (2, 1 )、 Ν (3, 0.5)、 Ν (3.5, 0.1 ) 和 Ν (4, 1)。 在对五个高斯分布进行合成时, 考虑各高斯成分对合 成结果的影响所占权重的不同,将五个拟合成图 1所示的一条混合高 斯曲线 Mixture。
二维高斯曲线对应的高斯分布函数如公式 (4) : fix)-
Figure imgf000007_0001
Figure imgf000007_0003
公式 ( 4 )
在函数中, 由 N个多元数组来表示 (^σ^ ^,σ^Γ ) , 其中 G=1,2,...,N), r表示二维高斯成分之间的相关性系数, |r|<l。 在本 发明中, 令二元高斯分布随机变量^ 其均值为
Figure imgf000007_0004
协方差矩阵为
Figure imgf000007_0002
二维高斯分布可以表示为 Νμ ' )。
同理, ί维高斯分布函数如公式 (5) 所示: -μ)
d/2 [χ Σ"1 (χ- 最终由 M个节点生命周期历史记录所构造形成的三维高斯混 合模型如图 2所示, 在一定的统计时间内将会出现多个峰值相互叠 加的情况。
本发明实施例中, 通过建立多维高斯混合模型来预测 Peer的继 续在线时长。
参加图 3 ,图 3是本发明实施例中预测 Peer生命周期的方法流程 图, 该流程可包括以下步骤:
步骤 201、 获取对等体的 M个历史生命周期源数据 Pi, i=l , ... , Μ,该历史生命周期样本数据可以包括对等体节点的历史上线的时刻 和历史在线的时长。
可以先获取对等体的 Μ个历史生命周期源数据 Pi, i=l , ... , Μ。 该源数据 Pi可以包括对等体节点每次的上线时刻和在线时长(如节 点 A, 1月 4号 20点整上线, 在线时间 2小时; 1月 5日 10点 20上 线, 在线时间 3小时等)。
本发明实施例中, 为保证用户的隐私, 历史生命周期样本数据可 由 Peer自身记录并保存。 同时, 也可以通过让 Peer节点发送历史生 命周期样本数据到某一中心服务器的方法来集中获取。
步骤 202、 根据釆样精度对 Pi进行釆样后得到历史生命周期样本 数据 Si, 该 Si可以包括对等体节点的历史在线的时刻和历史在线的时 长, 其中, 对等体节点的历史在线时长数据包括, 节点某一次上线时 间点到下线时间点所经历的总时间长度。历史在线时长的单位可以为 分钟、 秒或者小时等, 单位越小, 数据越精确。
另外, 也可以釆用步骤 20替换步骤 201和 202 , 步骤 20 , 直接 对 Peer节点进行釆样, 获取对等体的样本数据 S1 D
本发明实施例中, 为保证用户的隐私, 历史生命周期源数据可由 Peer自身记录并保存。 也可以通过让 Peer节点发送历史生命周期源数 据到某一中心服务器的方法来集中获取。 步骤 203、确定待建立的多维高斯混合模型中,高斯成分的个数 n, n是大于或等于 2的正整数;所述多维高斯混合模型表示所述对等体的 继续在线时长的概率分布。
实际应用中,可综合考虑所建成的多维高斯混合模型与生命周期 实际概率分布的逼近程度,以及建立多维高斯混合模型这一过程的计 算量, 来确定 n的取值。 通常, n越大, 则建立模型时的运算量相对越 大, 但建立出来的多维高斯混合模型与实际概率分布较逼近。
所述步骤 203与步骤 201和 202之间没有顺序的先后, 可以先做步 骤 201和 202,再做步骤 203 ,也可以先做步骤 203 ,再做步骤 201和 202。
步骤 204、 利用 Si与 n, 建立所述多维高斯混合模型。
该步骤中, 建立多维高斯混合模型的过程, 即计算每个高斯成分 对应的高斯分布参数 、 B, 以及多维高斯混合模型中, 每个高斯成 分所占权重的过程。 本发明实施例中, 取多维高斯分布参数为^ ^。B。
将多维高斯混合模型建好后, 可以发送出去, 例如: 可以由服务 器建立模型, 然后将模型发送给 Peer应用, 或者由 Peer建立模型, 然 后将模型发送给服务器应用。 将多维高斯混合模型发送时, 可以将所 述高斯混合模型的描述信息发出, 其中, 所谓高斯混合模型的描述信 息也即上述混合模型参数, 如 Λν, μ , Β。
步骤 205、 利用建立的多维高斯混合模型, 计算所述对等体的继 续在线时长。
本领域普通技术人员可以理解实现上述实施例方法中的全部或 部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以 存储于一计算机可读取存储介质中, 所述的存储介质, 如: ROM/RAM, 磁碟、 光盘等。
基于算出的 Peer的继续在线时长, 基于当前该 Peer已在线时长, 预测出 Peer本次存活的生命周期。 进一步, P2P网络系统可基于 Peer 在线时间的预测值, 提前做好 Peer下线准备, 如可提前通知其他关联 邻居节点刷新所维护的节点信息, 有效避免其他关联邻居节点在搜 索、路由过程中指向该节点的时刻刚好该节点离开的现象出现,从而, 避免 Peer下线随机性给网络系统造成的扰动, 提高网络系统的抗扰动 能力。 系统通知其他关联邻居节点如, chord网络中, 指针表中包含 该节点的节点标识 ( ID ); pastry网络中路由表中包含该节点的 ID; kademlia网络中 K桶中包含该节点的 ID; 等等。
下面主要对上述步骤 204中, 如何建立高斯混合模型作进一步说 明。
参见图 4, 图 4是本发明实施例中高斯混合模型的算法示意图。 参 见图 5 , 图 5是本发明实施例中高斯混合模型计算过程示意图。 图 4与 图 5中, S表示历史生命周期样本数据序列, M表示样本数据空间中有 M个样本数据, 表示 n个高斯分布, w表示高斯成分的权重, Z服从 参数为 的高斯分布。 其中,
S= ( SI , S2, Si, ... , SM );
Figure imgf000010_0001
Μ个 Si, 可知道每个 Si在 M中的出现次数, 进 而能够算出各 Si的出现概率 si 。 设 si对应的概率分布为
该概率分布即表示的是与实际概率分布相对应的需要建立的高斯混 合模型。
具体计算时, 根据已知量 si和 n, 利用现有贝叶斯推理, 计算多 维高斯混合模型中, 各多维高斯模型的高斯分布参数, 即 pd A) ,以及对应的 w。 称要求解的 A=N(AA)与对应的 w为 混合模型参数。 基于已知的 si和 n, 使用极大似然法估计 w和 过 程如下: 设 w和 的初始值为 0 ,
第一步: 建立包括有多维混合模型参数的似然函数 (likelihood function)
Figure imgf000011_0001
第二步: 根据 求出 L 达到极值时, 混合模型参数的估计 值。 其中, 因为似然函数 L^; 与似然函数的对数 lnL^ ) , 在同一 参数 0处获得最大值, 为计算简便, 通常对似然函数求对数来进行估 计:
Figure imgf000011_0002
式一 其中
Figure imgf000011_0003
. = 对式一釆用 EM估计:
E步: 利用从上一次 M步估计获得的估计量 ^ ^^ W^W) , 可以求出参数 w的后验概率。 推导如下:
Figure imgf000011_0004
因为: ρ = · ) = Ν , 所以上式可写为:
Figure imgf000011_0005
M步: 利用期望最大化, 写出期望函数, 求出使期望函数取得最 大值的参数^ 求最大值可以利用对似然函数求导取 0, 算出^ 即
=0。 在 M步对似然函数求导的过程中, 可以通过一次对参数
= ( /, ,p(w = ))求导'
Figure imgf000012_0001
通过上述计算过程计算出 ^参数后, 混合模型参数门也就确定, 相 应地, 高斯混合模型也就确定下来。 上述对混合模型参数的估算基于
EM算法进行, 实际应用中, 也可釆用变分法估算混合模型参数。
之后, 保存算出的混合模型参数, Peer可以利用建立的高斯混合 模型, 预测该 Peer的继续在线时长, 即估计 过程如下:
a、 根据保存的各混合模型参数, 可算出 Peer的生命周期的出现
N
概率密度为: .) = i N(A, ) 。 b、 记 Peer的继续存活 y时长的概率为 β ( y ) , 通过 Q{y) = P(S>{t +
Figure imgf000012_0002
) , 则,
(t+ _ ]_ p{s>(t + y)\S) _ p{S>(t + y)f]S) _jyPis)ds
Q{y) = p(s >
P\s> p s)as 其中, t = At。^为给定值, _y = Ats 为变量, 为当前的上线时间 区间值。 分母为某一定值, 分子为 _y的表达式。
c、 求 Peer的继续在线时长的期望值^ y] , 则, E (y) = J*yQ (y) dy。 d、 基于预测出的继续在线时长, 预测出 Peer的生命周期 T:
r = t + £ y] = t + J" ^ ( φ。
至此, 基于建立的多维高斯混合模型, 预测出 Peer的生命周期。 在 的内容中可以包括区间信息, 区间是表示取样的时间段, 区 间的长度, 可以为一个小时, 或者一天, 或者半天, 或者一周, 或者 一个月。 可以分别以周一, 周二, 周三, 周四, 周五, 周六, 周日作 为区间, 也可以将周一至周五作为一个区间, 将周六至周日作为一个 区间等, 区间可以分为多种, 将属于同一个区间的多个样本数据进行 统计, 可以得出在该区间上的上线规律, 并作为高斯模型的一个输入 维度加入到模型参数计算中。
另外, 可以针对每种区间分别建立高斯模型。 在一个星期内, 可 以分别以周一,周二,周三,周四…周日,作为一个区间,这样需要建 7个 高斯模型分别统计每个区间内的上线规律。 在一个星期内, 也可以以 周一至周五作为一个区间, 将周六至周日作为一个区间, 这样需要建 2个高斯模型分别统计每个区间内的上线规律。
每个区间内可以按照釆样精度划分刻度,可以每 15分钟划分为一 个刻度, 或者每半个小时划分为一个刻度等等, 通过统计在每个刻度 上的上线信息 (例如:是否上线,上线时长),从而得出在该区间上的上线 规律。
Si的内容可以包括: 在线时长信息, 上线的时刻信息, 这样, 建 立的混合高斯模型, 就有三个维度, 包括: 在线时长, 上线的时刻, 和概率分布。 如果将多个区间的信息汇集在一起, 就会多一个维度, 就是多个区间形成的维度, 这样, Si的内容还可以包括: 在线时长信 息,上线的时刻信息,上线的区间信息。这样,建立的混合高斯模型, 就有四个维度, 包括: 在线时长, 上线的时刻, 上线的区间, 和概率 分布。
对于一周内的概率统计, 可以将周一至周日作为一个区间, Si 包括在线时长和上线的时刻两个维度。也可以将一周划分为几个区间 (例如分别将周一, 周二, 周三, 周四, 周五…周日作为一个区间), Si包括在线时长, 上线的时刻, 以及上线的区间, 这样, 就有三个维 度。
Si的内容举例如下:
{在线时长 (min) , 上线时刻 (hour:minute) , 上线区间 (week)} ={120,20: 15,5}, {240,14:00,6} ... ... {50,21 :30,1 }
或者
{在线时长 (min) , 上线时刻 (hour:minute) , 上线区间 (week)} ={120,20: 15,周末 }, {240,14:00,周末 } ... ... {50,21 :30,工作曰 } 或者
{在线时长 (min) , 上线时刻 (week:hour:minute)}
={120,5:20:15}, {240,6:14:00} ... ... {50,1 :21 :30}
对应于上述本发明实施例中预测 Peer的继续在线时长的方案, 本 发明实施例还提供一种预测对等网络中对等体的继续在线时长的装 置, 所述装置基于前面所述的方法实现, 参见图 6 , 图 6是该装置的结 构示意图, 该装置可设置于每个 Peer上或者服务器上或者其他通信设 备上,用于预测该 Peer每次上线的继续在线时长,包括:获取单元 601、 接收单元 602、 模型建立单元 603和预测单元 604, 其中,
获取单元 601 , 获取对等体的 M个历史生命周期样本数据 Si , i=l , ... , Μ; 所述获取单元 601可以具体包括:
第一单元, 获取对等体的 M个历史生命周期源数据 Pi, i=l , ... ,
Μ;
第二单元, 根据采样精度, 对历史生命周期源数据 Pi进行采样得 到 Si。
接收单元 602 , 接收待建立的多维高斯混合模型中, 高斯成分的 个数 n, n是大于或等于 2的正整数; 所述多维高斯混合模型表示所述 对等体的继续在线时长的概率分布。
模型建立单元 603 , 利用釆样单元获取的 Si, 以及高斯成分的个 数 n, 建立多维高斯混合模型, n是大于或等于 2的正整数; 所述高斯 混合模型表示所述对等体的继续在线时长的概率分布;
预测单元 604 ,利用模型建立单元建立的所述多维高斯混合模型, 预测所述对等体的继续在线时长。
另外, 如果高斯成分的个数 n保存在模型建立单元中, 则不需要 接收单元。
模型建立单元 603包括:
参数计算单元 6031 , 计算所述多维高斯混合模型的混合模型参 数;
所述多维混合模型参数包括:
每个高斯成分对应的高斯分布参数,以及所述多维高斯混合模型 中, 每个高斯成分所占权重。
参数计算单元 6031包括:
概率计算单元 10 , 根据采样得到的 M个 Si, 算出各 Si的出现概率 si;
函数构建单元 20 , 建立包括所述多维混合模型参数的似然函数; 估算单元 30, 利用所述概率计算单元算出的 Si , 计算所述函数构 建单元构建的所述似然函数取最大值时,各多维混合模型参数的估算 值。
预测单元 604包括:
概率密度计算单元 6041 ,计算所述对等体生命周期的出现概率密 度;
存活概率计算单元 6042,利用概率密度计算单元 6041算出的所述 出现概率密度, 计算所述对等体继续存活预设变化时长的概率; 时长计算单元 6043 , 利用所述概率密度计算单元 6041算出的概 率, 求取所述对等体的继续在线时长。
该装置进一步包括: 生命周期预测单元 605 , 根据所述预测单元 604预测出的所述继续在线时长, 以及所述对等体已在线时长, 算出 所述对等体本次存活的生命周期或某一继续在线时长可能出现的概 率。
本发明实施例还提供了一种建模装置,该装置可包括上述获取单 元 601 ,接收单元 602和模型建立单元 603 ,模型建立单元 603可以是上 述参数计算单元 6031 , 包含上述函数构建单元和估算单元; 该建模装 置进一步包括:
发送单元 ,将模型建立单元建立的所述高斯混合模型的描述信息 发送。
其中, 所谓高斯混合模型的描述信息也即上述混合模型参数, 如 λν,μ, Β。 综上所述,本发明实施例提供的预测对等网络中对等体的继续在 线时长的方法及装置, 利用历史生命周期样本数据, 建立能够表示所 述对等体的继续在线时长的概率分布的多维高斯混合模型,该多维高 斯混合模型中, 不是基于受单一条件因素影响下 Peer的继续在线时长 所遵循的 4既率分布, 预测 Peer的继续在线时长, 而是基于 Peer的继续 在线时长受多种条件因素影响,综合考虑多个条件因素影响下继续在 线时长分别遵循的概率分布, 合成最终的多维高斯混合模型, 并基于 这样的多维高斯混合模型预测 Peer的继续在线时长, 使预测结果逼近 Peer的实际继续在线时长。 通过以上的实施例的描述,本领域的技术人员可以清楚地了解到 本发明, 可以通过硬件实现, 也可以借助软件加必要的通用硬件平台 的方式来实现。基于这样的理解, 本发明的技术方案可以以软件产品 的形式体现出来, 该软件产品可以存储在一个非易失性存储介质(可 以是 CD-ROM, U盘, 移动硬盘等) 中, 包括若干指令用以使得一 台计算机设备(可以是个人计算机, 服务器, 或者网络设备等)执行 本发明各个实施例所述的方法。
总之, 以上所述仅为本发明的较佳实施例而已, 并非用于限定本 发明的保护范围。 凡在本发明的精神和原则之内所作的任何修改、 等 同替换、 改进等, 均应包含在本发明的保护范围之内。

Claims

权利要求
1、 一种预测对等网络中对等体的继续在线时长的方法, 其特征 在于, 包括:
获取对等体的 M个历史生命周期样本数据 S i=l , ... , Μ; 确定待建立的多维高斯混合模型中, 高斯成分的个数 η, η是大 于或等于 2的正整数,所述多维高斯混合模型表示所述对等体的继续 在线时长的概率分布;
利用 与11, 建立所述多维高斯混合模型;
利用所述多维高斯混合模型, 预测所述对等体的继续在线时长。
2、 如权利要求 1所述的方法, 其特征在于, 所述的历史生命周 期样本数据 的内容包括:对等体节点的历史在线时长信息和对等体 节点的历史上线的时刻信息。
3、 如权利要求 1所述的方法, 其特征在于, 所述的历史生命周 期样本数据 的内容包括:对等体节点的历史在线时长信息,对等体 节点的历史上线的时刻信息, 和对等体节点的历史上线的区间信息。
4、 如权利要求 1所述的方法, 其特征在于, 所述获取对等体的 M个历史生命周期样本数据 , 包括:
获取对等体的 M个历史生命周期源数据 i=l , ... , Μ;
对源数据 按釆样精度进行釆样得到历史生命周期样本数据 S10
5、 如权利要求 1所述的方法, 其特征在于, 预测所述对等体的 继续在线时长后, 该方法进一步包括:
根据预测出的所述继续在线时长, 以及所述对等体已在线时长, 算出所述对等体本次存活的生命周期或一继续在线时长可能出现的 概率。
6、 如权利要求 4所述的方法, 其特征在于, 所述历史生命周期 样本数据或历史生命周期源数据由 Peer 自身记录并保存, 或者, 通 过让 Peer节点发送历史生命周期样本数据或历史生命周期源数据到 中心服务器的方法来集中获取。
7、 一种预测对等网络中对等体的继续在线时长的装置, 其特征 在于, 包括:
获取单元,获取对等体的 M个历史生命周期样本数据 Si, i=l , ... ,
Μ ι;
模型建立单元,利用釆样单元获取的 Sl 以及高斯成分的个数 n, n是大于或等于 2的正整数, 建立多维高斯混合模型, 所述高斯混合 模型表示所述对等体的继续在线时长的概率分布;
预测单元, 利用模型建立单元建立的所述多维高斯混合模型, 预 'J所述对等体的继续在线时长。
8、 如权利要求 7所述的装置, 其特征在于, 所述接收单元包括: 第一单元, 获取对等体的 M个历史生命周期源数据 P1 i=l , ... ,
Μ;
第二单元,根据釆样精度,对历史生命周期源数据 进行釆样得 到 S1;
9、 如权利要求 7所述的装置, 其特征在于, 所述的历史生命周 期样本数据 Si的内容包括: 对等体节点的历史在线时长信息和对等 体节点的历史上线的时刻信息。
10、 如权利要求 7所述的装置, 其特征在于, 所述的历史生命周 期样本数据 Si的内容包括: 对等体节点的历史在线时长信息, 对等 体节点的历史上线的时刻信息, 和对等体节点的历史上线的区间信 息。
11、 如权利要求 7所述的装置, 其特征在于, 所述模型建立单元 包括:
参数计算单元, 计算所述多维高斯混合模型的混合模型参数, 所述混合模型参数包括:
每个高斯成分对应的多维高斯分布的分布参数,以及所述多维高 斯混合模型中, 每个高斯成分所占权重。
12、 如权利要求 11所述的装置, 其特征在于, 所述参数计算单 元包括: 概率计算单元, 根据釆样得到的 M个 Si, 算出各 的出现概率
S ,
函数构建单元, 建立包括所述多维混合模型参数的似然函数; 估算单元, 利用所述概率计算单元算出的 计算所述函数构建 单元构建的所述似然函数取最大值时, 各多维混合模型参数的估算 值。
13、 如权利要求 7所述的装置, 其特征在于, 预测单元包括: 概率密度计算单元, 计算所述对等体生命周期的出现概率密度; 存活概率计算单元,利用概率密度计算单元算出的所述出现概率 密度, 计算所述对等体继续存活预设变化时长的概率;
时长计算单元, 利用所述概率密度计算单元算出的概率, 求取所 述对等体的继续在线时长。
14、 如权利要求 7所述的装置, 其特征在于, 所述装置进一步包 括: 生命周期预测单元, 根据所述预测单元预测出的所述继续在线时 长, 以及所述对等体已在线时长, 算出所述对等体本次存活的生命周 期或一继续在线时长可能出现的概率。
15、 如权利要求 7所述的装置, 其特征在于, 所述装置进一步包 括: 接收单元, 接收待建立的多维高斯混合模型中, 高斯成分的个数 n, n是大于或等于 2的正整数。
16、 一种建立对等网络中对等体的生命周期模型的方法, 其特征 在于, 包括:
获取对等体的 M个历史生命周期样本数据 , i=l , . . . , Μ; 确定待建立的多维高斯混合模型中, 高斯成分的个数 η, η是大 于或等于 2的正整数,所述多维高斯混合模型表示所述对等体的继续 在线时长的概率分布;
利用 与11, 建立所述多维高斯混合模型;
将所述高斯混合模型的描述信息发送。
17、 如权利要求 16所述的方法, 其特征在于, 所述的历史生命 周期样本数据 的内容包括:对等体节点的历史在线时长信息和对等 体节点的历史上线的时刻信息。
18、 如权利要求 16所述的方法, 其特征在于, 所述的历史生命 周期样本数据 的内容包括: 对等体节点的历史在线时长信息,对等 体节点的历史上线的时刻信息, 和对等体节点的历史上线的区间信 息。
19、 一种建立对等网络中对等体的生命周期模型的装置, 其特征 在于, 包括:
获取单元,获取对等体的 M个历史生命周期样本数据 Si, i=l , ... ,
Μ ι;
模型建立单元,利用釆样单元获取的 Sl 以及高斯成分的个数 n, 建立多维高斯混合模型, n是大于或等于 2的正整数, 所述高斯混合 模型表示所述对等体的继续在线时长的概率分布;
发送单元 ,将模型建立单元建立的所述高斯混合模型的描述信息 发送。
20、 如权利要求 19所述的装置, 其特征在于, 所述的历史生命 周期样本数据 的内容包括:对等体节点的历史在线时长信息和对等 体节点的历史上线的时刻信息。
21、 如权利要求 19所述的装置, 其特征在于, 所述的历史生命 周期样本数据 的内容包括: 对等体节点的历史在线时长信息,对等 体节点的历史上线的时刻信息, 和对等体节点的历史上线的区间信 息。
PCT/CN2008/072778 2008-01-23 2008-10-22 预测对等网络中对等体的继续在线时长的方法及装置 WO2009092213A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US12/835,400 US8280705B2 (en) 2008-01-23 2010-07-13 Method and device for predicting residual online time of peer in peer-to-peer network

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2008100656299A CN101494566B (zh) 2008-01-23 2008-01-23 预测对等网络中对等体的继续在线时长的方法及装置
CN200810065629.9 2008-01-23

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US12/835,400 Continuation US8280705B2 (en) 2008-01-23 2010-07-13 Method and device for predicting residual online time of peer in peer-to-peer network

Publications (1)

Publication Number Publication Date
WO2009092213A1 true WO2009092213A1 (zh) 2009-07-30

Family

ID=40900758

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2008/072778 WO2009092213A1 (zh) 2008-01-23 2008-10-22 预测对等网络中对等体的继续在线时长的方法及装置

Country Status (3)

Country Link
US (1) US8280705B2 (zh)
CN (1) CN101494566B (zh)
WO (1) WO2009092213A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829136A (zh) * 2019-01-22 2019-05-31 中国人民解放军火箭军工程大学 一种带随机跳变的退化设备的剩余寿命预测方法及系统

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103139272A (zh) * 2011-12-02 2013-06-05 北大方正集团有限公司 一种获取选定时间段内在线时长的方法和装置
WO2014149536A2 (en) 2013-03-15 2014-09-25 Animas Corporation Insulin time-action model
CN104462793A (zh) * 2014-11-25 2015-03-25 北京数迅科技有限公司 时间序列实时预测方法及装置
CN107248043B (zh) * 2017-06-21 2020-09-15 上海荷福人工智能科技(集团)有限公司 一种基于指静脉数据的建筑工地舆情监测方法
CN108549955B (zh) * 2018-03-26 2022-01-18 国网冀北电力有限公司电力科学研究院 一种充电桩异常率确定方法及装置
CN109951540B (zh) * 2019-03-07 2020-04-17 北京邮电大学 一种基于内容时效性的数据获取方法、装置及电子设备
CN111027202B (zh) * 2019-12-04 2023-12-15 北京软通绿城科技有限公司 一种数字城市的预测方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070061232A1 (en) * 2005-08-31 2007-03-15 Bonissone Piero P Method and system for forecasting reliability of assets
CN1972206A (zh) * 2006-10-26 2007-05-30 武汉理工大学 基于组合式建造p2p系统的方法
CN101043525A (zh) * 2007-04-26 2007-09-26 北京航空航天大学 在p2p网络环境中实现文件共享的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6847854B2 (en) * 2001-08-10 2005-01-25 Rockwell Automation Technologies, Inc. System and method for dynamic multi-objective optimization of machine selection, integration and utilization
US20060247798A1 (en) * 2005-04-28 2006-11-02 Subbu Rajesh V Method and system for performing multi-objective predictive modeling, monitoring, and update for an asset

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070061232A1 (en) * 2005-08-31 2007-03-15 Bonissone Piero P Method and system for forecasting reliability of assets
CN1972206A (zh) * 2006-10-26 2007-05-30 武汉理工大学 基于组合式建造p2p系统的方法
CN101043525A (zh) * 2007-04-26 2007-09-26 北京航空航天大学 在p2p网络环境中实现文件共享的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIANG, SHOUXU ET AL.: "Evaluation of Behavior of Peers in Peer-to-Peer File Sharing Systems", JOURNAL OF HARBIN UNIVERSITY OF COMMERCE (NATURAL SCIENCES EDITION), vol. 21, no. 6, December 2005 (2005-12-01), pages 731 - 735 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829136A (zh) * 2019-01-22 2019-05-31 中国人民解放军火箭军工程大学 一种带随机跳变的退化设备的剩余寿命预测方法及系统
CN109829136B (zh) * 2019-01-22 2022-10-04 中国人民解放军火箭军工程大学 一种带随机跳变的退化设备的剩余寿命预测方法及系统

Also Published As

Publication number Publication date
CN101494566A (zh) 2009-07-29
US8280705B2 (en) 2012-10-02
US20100280804A1 (en) 2010-11-04
CN101494566B (zh) 2011-09-14

Similar Documents

Publication Publication Date Title
WO2009092213A1 (zh) 预测对等网络中对等体的继续在线时长的方法及装置
Hoong et al. Bittorrent network traffic forecasting with ARMA
Massoulié et al. Peer counting and sampling in overlay networks: random walk methods
Zhuo et al. Win-Coupon: An incentive framework for 3G traffic offloading
EP2541419A1 (en) Characterizing web workloads for quality of service prediction
Hajek et al. The missing piece syndrome in peer-to-peer communication
CN101682548A (zh) 可用带宽估计
Zhu et al. Stability of a peer-to-peer communication system
EP4248378A2 (en) System and method of federated learning with diversified feedback
Liu et al. Distilling superior peers in large-scale P2P streaming systems
Bartulovic et al. Biases in data-driven networking, and what to do about them
JPWO2008126701A1 (ja) データ伝送システムおよびその方法
JPWO2013008387A1 (ja) パラメータ推定装置、パラメータ推定方法、及び、パラメータ推定プログラム
Min et al. Cooperative multi-agent reinforcement learning: Asynchronous communication and linear function approximation
Braun et al. Increasing data distribution in BitTorrent networks by using network coding techniques
Ferragut et al. Queueing analysis of peer-to-peer swarms: Stationary distributions and their scaling limits
CN117203944A (zh) 算力网络的资源调度方法
CN114866790A (zh) 直播流调度方法及装置
EP4349055A2 (en) Dimensioning of telecommunication infrastructure
EP4189990A1 (fr) Procédé de fourniture de données relatives à au moins un équipement d&#39;un utilisateur d&#39;un réseau, procédé d&#39;obtention de données, et entités mettant en oeuvre ces procédés
JP4606972B2 (ja) トラヒック量予測システムおよびトラヒック量予測方法
US10931537B2 (en) Method and device for updating a predictive model of a variable relating to a mobile terminal
Raja et al. Mode-suppression: a simple, stable and scalable chunk-sharing algorithm for P2P networks
Min et al. Multi-agent reinforcement learning: Asynchronous communication and linear function approximation
Caizzone et al. Analysis of the scalability of the overlay Skype system

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08871227

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08871227

Country of ref document: EP

Kind code of ref document: A1