再谈异构计算CPU+GPU(APU)

news/2024/7/5 23:59:45 标签: 数据结构, cuda, cache, 多线程, 算法, 任务

再谈异构计算CPU+GPU

异构计算的英文名称是Heterogeneous computing,主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。我们常说的并行计算正是异构计算中的重要组成部分异构计算近年来得到更多关注,主要是因为通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能耗瓶颈。而与此同时,GPU等专用计算单元虽然工作频率较低,具有更多的内核数和并行计算能力,总体性能/芯片面积的比和性能/功耗比都很高,却远远没有得到充分利用。

CPU的设计让其比较擅长于处理不规则数据结构和不可预测的存取模式,以及递归算法、分支密集型代码和单线程程序。这类程序任务拥有复杂的指令调度、循环、分支、逻辑判断以及执行等步骤。而GPU擅于处理规则数据结构和可预测存取模式。而APU的设计理念则正是让CPU和GPU完美合作,集合两者的长处,用异构计算来达到整体性能的最佳化。

目前,已经有50款领先的应用能够利用AMD APU进行加速,而后续的应用也将陆续到来——异构计算普及的一刻应该是近在咫尺了。

再谈谈现在正在流行的异构计算CPU+GPU。

CPU和GPU的本质区别

CPU的目标是快速执行单一指令流;

CPU将其用于乱序执行、寄存器重命名、分支预测以及巨大的cache上,这些设计都是为了加速单一线程的执行速度;

CPU利用cache来降低内存访问延迟;

CPU通过大量的cache和分支预测来降低延迟,这些机制消耗了大量的晶体管的电能;

CPU每个核心支持1~2个线程;

CPU切换线程的代价是数百个时钟周期;

CPU通过SIMD(单指令多数据)来处理矢量数据;

Intel的CPU没有集成内存控制器;

GPU的目标是快速执行大量的并行指令流;

GPU将晶体管用于处理器阵列、多线程管理、共享内存、内存控制器;

这些设计并不着眼于提高单一线程的执行速度,而是为了使GPU可以同时执行成千上万的线程;

实现线程间通信,并提供极高的内存带宽;

GPU使用cache来放大内存带宽;

GPU通过同时运行上千个线程来隐藏延迟,等待内存访问的线程会被切换掉,GPU切换线程不耗时间;

对于支持CUDA的GPU,每个流处理器可以同时处理1024个线程;

GPU切换线程的代价是0,事实上GPU通常每个时钟周期都切换线程;

GPU则使用SIMT(单指令多线程),SIMT的好处是无需开发者费力把数据凑成合适的矢量长度,并且SIMT允许每个线程有不同的分支;

支持CUDA的GPU集成有8个内存控制器,GPU的内存带宽通常是CPU的十倍。

CPU的长项是整数计算,GPU的优势则是浮点计算。

对于整机性能而言,CPU和GPU都是性能的保障,合理的搭配才是重中之重,才能给用户带来最强的综合性能。


http://www.niftyadmin.cn/n/1373502.html

相关文章

同济大学28万元——“广西求学网”开出高校录取价目表

发信人: tenten (babybaby), 信区: Educational 标 题: 同济大学28万元——“广西求学网”开出高校录取价目表(zz) 发信站: 同舟共济站 (Thu Jul 22 08:44:25 2004), 站内“高考录取20%靠分数,80%靠关系。”不知何时起,广西的高考…

两款爱不释手的markdown编辑工具

做软件这行呢,Markdown对于大家来说已不是什么陌生的东西了,即使不写文档也能经常看到Markdown形式的文档,因为全球最大的同性交流网站GitHub就兼容了Markdown的语法,那么Markdown究竟是个什么东东呢?Markdown是一种可以使用普通文…

《滚石》评出最伟大100首英文歌

发信人: cnwzls (疑是玉人来), 信区: OldSongs 标 题: 《滚石》评出最伟大100首英文歌 发信站: 一塌糊涂 BBS (Tue Jul 20 00:48:34 2004), 本站(ytht.net) 《滚石》评出最伟大100首英文歌,你听过几首? 流行音乐杂志《滚石》与MTV音乐电视联合评选出了自…

关于高性能计算的知识记录汇总-菜鸟级别?

关于高性能计算的知识记录汇总-菜鸟级别 菜鸟级别 Mpi和openMPI的区别,或者CUDA和OpenCL的区别,这篇文章就是为了总结下高性能计算的相关知识。 目前高性能计算有两大趋势,并行计算集群和CPU处理器和GPU显卡的异构混合计算。 下面做对这些名…

XSS和CSRF详解与防御

开年遇到的第一个问题就是解决XSS攻击>_<,可见要时刻保证网站的安全性至关重要。做好网站安全&#xff0c;不仅维护网站的稳定性&#xff0c;更保证用户数据的一致性。对此&#xff0c;总结一下笔者在工作中遇到的安全问题以及防御方法。前端中常见的两种网站应用安全漏洞…

真正的十大暴利商品 成本曝光

1、化妆品 男士也许该怀疑&#xff0c;大宝是暴利产品吗&#xff1f;NO。这里的化妆品是指进口高端产品。SK&#xff0d;II 著名的神仙水在中国零售价格为560元&#xff0c;而其制造成本仅为人民币6.5元。惊讶么&#xff1f;就算研 发成本都加进去&#xff0c;每单只成本也不…

计算机操作系统--PV操作详细说明

计算机操作系统--PV操作详细说明在计算机操作系统中&#xff0c;PV操作是进程管理中的难点。 首先应弄清PV操作的含义&#xff1a;PV操作由P操作原语和V操作原语组成&#xff08;原语是不可中断的过程&#xff09;&#xff0c;对信号量进行操作&#xff0c;具体定义如下&#x…

111:TemplateView讲解

TemplateView&#xff1a; django.views.generic.base.TemplateView&#xff0c;这个类视图是专门用来返回模版的。在这个类中&#xff0c;有两个属性是经常需要用到的&#xff0c;一个是template_name&#xff0c;这个属性是用来存储模版的路径&#xff0c;TemplateView会自动…