1 / 49
文档名称:

基于多核处理器的数值算法并行优化究.pdf

格式:pdf   大小:1,084KB   页数:49页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于多核处理器的数值算法并行优化究.pdf

上传人:iris028 2021/9/27 文件大小:1.06 MB

下载得到文件列表

基于多核处理器的数值算法并行优化究.pdf

相关文档

文档介绍

文档介绍:摘 要
随着多核计算机的日益普及,大规模科学与工程计算、事务处理与商业计算的需求,
以及数据挖掘应用领域的不断扩大,基于多核平台的线性方程组数值求解算法和大数据
量数值关联规则算法的研究显得非常重要。由于多核技术会增加多线程的创建、通信和
销毁等开销,如何有效发现程序中的可并行性能、优化多核并行程序及发挥多核的最佳
性能,成为高性能计算领域研究的重要课题。
本文给出了 Cholesky 分解算法的详细推导过程,分析了 Cholesky 分解并行按照块
分配的任务分配策略存在负载不均衡,提出了块交叉分配方案,并与卷帘分配方案对比。
对这三种算法均采用了提前发送策略,并在 MPI 集群系统上进行了实验和分析。针对
Cholesky 分解基于 MPI 的并行算法设计复杂、进程负载均衡困难、消息传递和数据移动
开销大问题,以及基于多核采用 OpenMP 并行化的并行性开销增大和线程负载不平衡的
问题,着重考虑多核计算机的优势,提出了一种基于任务划分的 Cholesky 分解多核并
行优化算法。该算法将大循环问题划分成各个相互独立的小任务,并运用递归技术﹑任
务窃取技术和动态负载均衡算法使这些任务能够并行完成。
在分析了关联规则挖掘 Apriori 算法及其并行算法存在的不足的基础上,提出了一
种改进的关联规则挖掘的多核并行优化算法。该算法对Apriori 算法的压缩矩阵进行了
改造,并在多核平台下利用 OpenMP 技术和 TBB 技术,对串行程序进行循环并行化和任
务分配的并行化设计,最大限度地实现并行关联规则挖掘,提高关联规则挖掘效率和多
核 CPU 的利用率。
算法程序设计过程引入了 Intel Parallel Studio 并行套件,对基于多核的并行算
法进行内存﹑线程检查和性能优化,消除采用多核平台并行化所造成的数据泄漏﹑数据
竞争﹑死锁和效率低等问题。实验结果证明基于多核所提出的算法具有较高的并行效率
和较好的加速比。

关键词:并行计算;Cholesky 分解;Apriori 算法;任务窃取技术;多核并行优化;负
载均衡
- I -
The Research of Parallel Optimization of the Multi-core Numerical
Algorithm

Abstract
With the increasing popularity of multi-core computers, large-scale scientific and
engineering computing, the processing of transactions, and the needs of business computing,
and application field of data mining expanding constantly, the research which is based on
numerical solution algorithm of linear equations and the associated rule algorithm of the
numerical value of large data of multi-core platforms is very important. As multi-core
technology will increase the costs of the creation of multi-threaded, communication, and
destruction, that how to find the parallel performance in the program, optimize the parallel
program of multi-core and play the best performance of multi-core,have become the important
is