【硬件资讯】「没有永远的朋友,也没有永远的敌人,只有永远的利益」Intel、AMD合力应对AI热潮,直面GPU、NPU挑战!

新 闻1:英特尔和AMD发布ACE白皮书,x86矩阵加速计算提升AI性能

英特尔和AMD在2024年10月15日,宣布组建x86生态系统咨询小组,专注于通过实现跨平台兼容性、简化软件开发以及为开发人员提供一个平台来识别架构需求和功能,从而为未来创建创新和可扩展的解决方案,确定扩展x86生态系统的新方法。去年成立一周年之际,x86生态系统咨询小组介绍了多项关键技术里程碑,其中包括了ACE(Advanced Matrix Extensions for Matrix Multiplication),也就是标准化了矩阵乘法。


据Wccftech报道,英特尔和AMD已发布ACE白皮书,是统一x86战略的一部分,以更快的矩阵加速驱动AI时代的生态系统。

ACE旨在显著提升矩阵乘法性能,同时具备可扩展性和能效性。众所周知,矩阵乘法是AI工作负载中神经网络和大型语言模型的核心模块。当前的SIMD扩展,比如AVX10,可以实现矩阵乘法,但其可扩展性和计算密度可能受到限制,并不是高效的方法。ACE允许复用现有的AVX10优化,并构建一个可扩展的矩阵加速框架,适用于从笔记本电脑到超级计算机的多种场景,将AI计算外包给专用硬件。

英特尔和AMD将ACE称为“x86标准矩阵加速架构”,可支持原生矩阵乘法,支持INT8、OCP FP8、OCP MXFP8、OCP MXINT8、BF16等数据格式,还针对AVX10引入基于外积运算(outer product operation)的矩阵加速机制,设计兼顾灵活性与扩展性。

按照官方的说法,在消耗相同数量输入向量的前提下,ACE外积运算的计算密度比等效的AVX10乘加运算高出了16倍。

原文链接:https://www.expreview.com/105600.html

上次看到AMD与Intel合作是什么时候的事?i7 8809G?这也快十年了啊!而这次在AI热潮的影响下,两家终于又开展了合作,而且是巨大的合作!这次合作推出的ACE架构,旨在提升X86处理器的AI 性能,使X86矩阵计算密度提升16倍,直面GPU、NPU的算力挑战!

这次合作的成果对于整个X86生态都是有深远影响的,而且要知道,在大洋彼岸……AMD和Intel还有一家X86的远房亲戚呢,不知道会不会也受益!

新 闻 2:没用一颗 GPU 加速卡:纯国产 CPU 架构 E 级超算“灵晟”在深圳点亮,持续性能超 2EFlops 剑指世界第一

4 月 29 日消息,国家超级计算深圳中心国产算力应用对接会暨全球样板点发布会 4 月 24 日在深圳举行,宣布国产 E 级超级计算机系统“灵晟”全面点亮并完成全机测试,目前已正式开放应用测试申请渠道。

该系统由中山大学计算机学院教授、国家超级计算深圳中心主任卢宇彤担任总设计师,软硬件全栈自主可控,完全体持续双精度浮点(FP64)运算性能超过 2EFlops(每秒 200 亿亿次)。

若这一性能指标完全兑现,将超越目前全球公开超算榜首 —— 美国劳伦斯利弗莫尔国家实验室的 El Capitan(1.809EFlops),在理论上达到世界第一水平(但理论上来说美国也不可能停止发展)。


据官方介绍,“灵晟”不曾使用任何 GPU 加速卡,完全依托国产通用 CPU 堆叠算力,软硬件全栈自主可控。

深圳市科技创新局党组成员、副局长李肖力在致辞中表示,“灵晟”国产 E 级超算系统全面点亮并完成全机测试,是我国高端计算领域全栈自主可控的标志性成果。

总设计师卢宇彤介绍称,“灵晟”是世界首台持续性能超 2 Exaflops 的超级计算机,依托国产高性能 CPU、片上高带宽内存、高速互连网络、高吞吐存储、三维浮动正交架构及全液冷散热等核心创新,实现架构、性能、能耗、编程、扩展性和可靠性六大技术突破,软硬件全栈自主可控。

该系统采用分阶段建设模式,整个系统将容纳 92 个计算机柜、36 个网络机柜,支持 E 级算力、E 级存储、P 级通信,采用全球最大规模集中式液冷技术,能效国际领先。系统总存储容量达 650PB,集成 SMT 加速器,支持 FP64、FP32、FP16、INT8 等多种混合精度计算,可满足从科学计算到 AI 模型训练的多样化需求。

“灵晟”采用自研片上多精度混合计算加速框架和面向领域的超智融合软件平台,可统一支撑科学计算、工程计算、智能计算“三算合一”,在分子动力学、流体仿真、生命科学、AI 大模型训推等大规模领域应用中均实现国际领先性能。

在成果展示环节,深圳超算联合多家科研机构及企业,公布了在遥感、材料、生物信息、气象、药物、石油勘探、人工智能、生命科学及电磁仿真九大领域的重要应用成果。

  • 在遥感领域,团队依托“灵晟”开展大规模遥感模型训练,实现全球 8 年时序遥感影像的高倍压缩与高效重建,提升了降水预报与灾害预警精度。

  • 材料领域,深圳超算团队研发的 XLSDFT 软件实现了 1 亿原子规模的第一性原理计算,并行扩展性达 81%,可为新能源、半导体材料研发提供跨尺度仿真能力。

  • 在生物信息与药物研发方面,中山大学和中国药科大学团队基于“灵晟”完成十万亿级化合物虚拟筛选,结合 AI 与强化学习效率提升千倍,单日筛选量突破十万亿,支撑了个性化肿瘤疫苗及创新药的研发。

  • 在气象领域,清华大学团队研发的地球系统模式 AP3ESMv2 在“灵晟”上实现了全球 1 公里分辨率模拟,计算成本降低 62%,并首次实现 2 小时内完成 30 天全球公里尺度预报。

  • 在石油勘探领域,中国石油东方地球物理公司的 GeoEast 物探软件完成全栈适配优化,其核心偏移成像模块性能达到主流 GPU 方案 A100 的 1.88 倍。

  • 在 AI 领域,清程极智针对纯 CPU 架构完成了算子开发、计算图调度等全栈优化,降低了访存开销。

  • 在生命科学领域,北京航空航天大学团队优化了 AlphaFold2 推理流程,大幅提升蛋白质结构预测效率。

  • 在电磁仿真领域,西安电子科技大学的 LASPCEM 软件在“灵晟”上实现了千万核级大规模并行,为高端装备研制提供了自主可控的仿真支撑。

本次大会同期发布了国家超级计算深圳中心全球样板点,该样板点集技术展示、成果转化与生态赋能于一体,采用全球最大规模集中式液冷技术,能效国际领先。

原文链接:https://m.ithome.com/html/944839.htm

大洋彼岸的远房亲戚能不能受益还不得而知,但是大洋彼岸的新技术成果确实给CPU在AI时代鼓了一把劲!国产 E 级超级计算机系统“灵晟”全面点亮,持续双精度浮点(FP64)运算性能超过 2EFlops,这已经是世界第一的成绩了!

重点是,这次是真正的纯CPU实现,对于仍在努力面对GPU、NPU挑战的AMD、Intel来说,这绝对是振奋人心的消息,证明了纯CPU无加速的E级超算可能性!虽然远隔重洋,但这次中国企业和两家美国企业竟然有点惺惺相惜的感觉?真是太奇怪了。

新 闻3: 英特尔、AMD和联发科都在提升CPU产量,但价格持续上涨且交货时间延长

随着AI计算需求的持续增长,数据中心基础设施对计算驱动的要求发生改变,GPU与CPU的比例已经从过去的8:1降至4:1,未来甚至达到1:1。CPU在经历GPU崛起被长期压制后,再度重新回到舞台中央,而且来得又快又急,一下子供应变得越来越紧张。数月前英特尔就表示,现在CPU陷入到供不应求的境地,并决定将产能优先提供给服务器产品。


据DigiTimes报道,由于英特尔更倾向于将有限的产能用于生产价格更高的服务器CPU,消费端台式机和笔记本电脑的市场一下子变得开阔,不仅使得AMD在各个细分市场的占有率全线拉升,而且让联发科这样的边缘厂商也找到了机会。得益于长期深耕Chrombook平台,联发科的CPU预计2026年出货量可能迎来40%的提升。

有消息人士透露,市场对Xeon CPU的需求已经达到了历史新高,预计2026年的出货量会有双位数增长,而且会延续到2027年,但是英特尔仍然完全无法满足。同样受益的还有AMD,在服务器领域的市场份额已经接近50%。无论英特尔还是AMD,都在需求飙升下面临相同的产能问题,两者连月来都启动了涨价策略来应对。现在不但CPU价格上涨,交货周期也变得更长。

Chrombook是受英特尔政策调整冲击最大的细分市场之一,由于英特尔的资源全面向高端产品转移,厂商只能转向替代方案。虽然2026年Chrombook的出货量比起2025年有所下滑,预计从1950万台降至1800万台,但是CPU缺货严重,给了联发科很大的空间,供不应求之下,CPU交货周期甚至延长至1年。

原文链接:https://www.expreview.com/105550.html

那当然……没有永远的朋友,也没有永远的敌人,只有永远的利益这一点也体现在了一起提价这一块上……AMD和Intel就不用说了,两家断断续续提了快30%了,联发科这个浓眉大眼的居然也来了?人家X86带你玩吗你就来?如果说交期过长是市场需求决定的天灾,那这个涨价就是纯纯厂商囤积居奇的人祸了,我反正是有些不齿的……

买电脑讨论群:386615430

二手硬件回收微信号:diannaobapingceshi

文章转载自网络(链接如上)。文章出现的任何图片,标志均属于其合法持有人;本文仅作传递信息之用。如有侵权可在本文内留言。

引用文章内容与观点不代表电脑吧评测室观点.