文档介绍:国防科学技术大学
博士学位论文
面向多核微处理器芯片的高效能I/O体系结构及其实现技术
姓名:郭御风
申请学位级别:博士
专业:计算机科学与技术
指导教师:杨学军
2010-12
国防科学技术大学研究生院博士学位论文
摘要
人类对计算能力的需求、新体系结构和新工艺这三驾马车推动着作为现代高
端计算机系统核心和引擎的高性能微处理器性能的不断提升。并行片上系统 PSoC
(Parallel System on Chip)的多核结构成为当前高性能微处理器的主要形态。随着
计算机技术的不断发展, 高端微处理器已经从追求单一的高性能转向追求综合的
高效能,以求解决当前高性能计算领域所面临的实用性能、可编程性与成本、可
移植性、鲁棒性等方面的问题。
本文着重研究了多核微处理器中高效能 I/O 体系结构及其实现技术,从涵盖
I/O 的存储一致性模型、I/O 性能优化方法、I/O 虚拟化技术、I/O 功耗优化方法和
容错设计方法等方面展开研究,在体系结构一级探索解决多核处理器 I/O 系统的易
编程、高性能、易用性、低功耗和可靠性等问题。
论文的研究工作和创新点主要有以下几点:
1、提出了面向多核结构的扩展 I/O 广义存储一致性模型
本文针对多核结构中 I/O 相关的存储一致性问题展开研究。采用生产者和消费
者模型,从时间和空间角度对多核处理器芯片内 I/O 一致性问题产生的原因进行分
析,并提出了解决策略;针对多个处理器芯片直连构成的 SMP 系统中远程 I/O 访
问带来的一致性问题,分析了其产生的本质原因,并提出了解决策略;把 I/O 一致
性问题纳入多核结构中存储一致性问题的统一框架内,从处理器核、I/O 和存储器
相互关系的角度描述数据一致性问题,提出了面向多核结构的扩展 I/O 广义存储一
致性模型,实验表明该存储一致性模型不仅可以为软件提供一个简单、高效的编
程接口,而且显著提高了 I/O 访问的性能。
2、提出了一种多核处理器 I/O 一致性处理优化方法
本文针对多核处理器 I/O 一致性处理优化方法展开研究。分析了 I/O 数据的访
问特性,对 I/O 数据访问特性进行了多角度刻画,提出了 I/O 访问的八大特性,并
分析了不同的访问特性对 I/O 一致性处理方法的影响,为优化 I/O 一致性处理方法
提供了理论指导;采用 Cache 划分方法对 I/O Cache 进行组织和管理,基于 Cache
划分的组织结构对 I/O 性能进行优化;提出了动态自选择混合 I/O 一致性处理优化
方法对本地 I/O 访问和远程 I/O 访问进行性能优化,实验结果表明该方法对多种复
杂 I/O 应用均能显著提高性能;针对传统工作模式下的 I/O 应用和面向用户级通信
的 I/O 应用两种情况,分别提出了增强同步操作的 I/O 一致性维护方法和边界切割
的 I/O 一致性维护方法,对远程 I/O 访问的一致性处理性能进行优化,实验结果表
明,这些方法显著改善了远程 I/O 访问性能。
3、从两个方面提出了多核处理器中硬件支持的 I/O 虚拟化优化方法
本文针对多核处理器中硬件支持的 I/O 虚拟化优化方法展开研究,研究了硬件
第 i 页
国防科学技术大学研究生院博士学位论文
支持 I/O 虚拟化的两大关键技术—DMA 重映射和中断重定向的优化方法。提出了
基于 Hint 的高效 IOTSB Cache 的管理策略 IOTCMBH 和基于失效队列的失效策略
IMBINQ,对 DMA 重映射方法进行优化;提出了多层可操控的中断处理模型和灵
活可控的中断重定向方法对中断重定向进行优化;实验结果表明这些优化方法为
I/O 虚拟化提供了很好的硬件支持,同时显著降低了硬件支持虚拟化的性能开销和
实现开销,几乎可以获得不支持 I/O 虚拟化情况下的 I/O 性能。
4、从多个层次提出了多核处理器中 I/O 系统功耗优化方法和容错设计方法
本文针对多核处理器中 I/O 系统的功耗问题和可靠性问题展开研究,从多个方
面降低 I/O 功耗、增强 I/O 可靠性。在体系结构级对多核 I/O 系统提出了功耗优化
和容错设计原则,指导功耗优化和容错设计;提出了增强多位纠错的数据驱动刷
新的功耗优化方法,对基于 eDRAM 实现的 I/O Cache 功耗进行优化,实验结果表
明该方法在不影响性能的同时,显著降低了 eDRAM 的刷新功耗;提出了基于 Cache
组织和混合低功耗模式的功耗优化方法,对基于 SRAM 实现的 I/O Cache 功耗进行
优化,实验结果表明该方法显著降低了 I/O Cache 的静