文档介绍:第 32 卷第 7 期通信学报 Vo l .3 2
2011 年 7 月 Journal munications July 2011
面向云计算平台的层次化性能问题诊断方法
米海波 1,王怀民 1,蔡华 2,尹刚 1,周琦 2,孙廷韬 2,周扬帆 3
(,湖南长沙 410073;
,浙江杭州 310023;,广东深圳 518057)
摘要:提出一种层次式在线性能问题诊断方法——Magnifier,将用户请求执行路径划分为构件层、模块层和方
法层 3 个层次,自顶向下逐层定位问题根源。基于阿里巴巴云计算平台的实验结果表明,Magnifier 能够在调用方
法种类多、执行路径复杂的条件下,快速定位出性能降级的主要原因。
关键词:性能问题;层次化诊断;云计算平台
中图分类号:TP393 文献标识码:A 文章编号:1000-436X(2011)07-0114-11
Hierarchical diagnostic approach for performance
problems in puting platforms
MI Hai-bo1, WANG Huai-min1, CAI Hua2, YIN Gang1, ZHOU Qi2, SUN Ting-tao2, ZHOU Yang-fan3
(1. National Laboratory for Parallel and Distributed Processing, National University of Defense Technology, Changsha, 410073 China;
2. Comupting Platform, Alibaba pany, Hangzhou 310023, China;
3. Shenzhen Research Institute, The Chinese Univ. of Hong Kong, Shenzhen 518057, China)
Abstract: A hierarchical diagnosis approach, namely Magnifier, was proposed, which models the execution path graph of
a user request ponent layer, module layer and function layer, and detects anomalies from higher layer to lower
layer separately. Extensive experiments were conducted on the Alibaba puting platform. The results indicate
that, under the conditions of large volume of data and plexity of execution paths, Magnifier can accurately and
efficiently locate the prime causes of performance degradation.
Key words: performance problem; hierarchical diagnostic; puting platform
多种服务构件才能完成[1]。例如:在阿里巴巴云计
1 引言
算平台中,一次写文件访问需经过调度、通信、索
云计算平台的重要功能之一是对上层应用提引和分布式存储等服务构件,涉及更新索引缓存、
供基础设施级的服务。为支持可扩展性和顽健性, 维护用户元信息、写文件、写访问日志等多种操作。
平台往往采用多层松耦合的体系结构,如图 1 所示。这些服务构件由不同的小组开发,且部署在数以百
在这种环境下,上层应用的用户访问请求需要经过计的服务器上,当平台性能降级导致用户请求的响
收稿日期:2011-02-28;修回日期:2011-06-18
基金项目:国家重点基础研究发展计划(“973”计划)基金资助项目(2011CB302605);国家高技术研究发展计划(“863”
计划)基金资助项目(2007AA010301);国家杰出青年科学基金资助项目(60625203);国家自然科学基金资助项目(90818028,
60903043)
Foundation Items: The National