文档介绍:Kad网络节点资源探测分析*基金项目:本课题得到国家自然科学基金(, No. 60873245);国家高技术研究发展计划(863计划)(2006AA01Z452)的资助。
作者简介:刘祥涛,男,1977年生,博士研究生,研究方向:P2P网络安全,数据挖掘等,Email: ******@.. 龚才春,男,1978年生,博士,研究方向:信息检索,数据挖掘等. 刘悦,女,1971年生,副研究员,研究方向:信息检索,社区挖掘与分析,分布式计算等. 白硕,男,1956年生,博士,研究员,博士生导师,研究方向:自然语言处理,网络安全等.
刘祥涛1, 2,龚才春3,刘悦 1,白硕1
1(中国科学院计算技术研究所北京 100190)
2(中国科学院研究生院北京 100190)
3(北京市计算中心北京 100005)
摘要 Kad网络中存在数以亿计的共享资源,而其中有相当一部分可被评定为敏感资源。首先用我们的Kad网络采集器:Rainbow对节点拥有的文件资源进行探测;然后对节点资源和敏感资源进行相关统计分析。我们发现:1)文件流行度和文件所对应的文件名数量都近似符合Zipf分布;2)利用同一个“文件内容哈希”(即file-content-hash)的多个文件名的共现词可以更准确地进行敏感判别;3)%,%为video文件。
关键词对等网络;Kad网络;探测分析;敏感资源
Peer Resource Measurement and Analysis in work
Liu Xiang-Tao1,2, Gong Cai-Chun3, Liu Yue1, Bai Shuo1
1(Institute puting Technology, Chinese Academy of Sciences, Beijing 100190)
2(Graduate University, Chinese Academy of Sciences, Beijing 100190)
3(puting Center, Beijing 100005)
Abstract In work, there are hundreds of millions of shared resources, among which a considerable part can be rated as sensitive resources. Firstly, the file resources of peers are measured using our work crawler: Rainbow, then, those resources and sensitive resources are statistically analyzed. We find that: 1) both the popularity of files and the number of filenames corresponding to a file approximately fit Zipf distribution; 2) the sensitivity of files can be judge