编辑:[db:作者] 时间:2024-08-25 08:54:33
第四代自研Arm做事器CPU
从2018年11月,到今年的11月,Gravition这一亚马逊自研的做事器CPU已经迭代了数个版本,Gravition4作为该系列最新的产品,自然也拥有最强大的性能表现。
Gravition4集成了96个Arm Neoverse V2内核,每个内核配置了2MB的L2缓存,加上12个DDR5-5600通道。比较上一代,Gravition4的核心数多出了50%,打算性能提高了30%,L2缓存变为两倍,内存带宽也提高了75%,可以毫无疑问地说,Gravition4将成为AWS自研硬件做事器矩阵的新王牌。不过AWS打算与网络做事副总裁David Brown表示,跑分与现实运用负载相去甚远,每每不能代表芯片的真实性能表现,以是亚马逊更乐意用实际运用的成绩来展示Gravition4的性能提升。在MySQL这样的数据库运用中,Gravition4展现出了赶过Gravition3 40%的性能。在网页运用上,Gravition4比上一代快30%,在大型Java运用中快45%。
而且绝不夸年夜地说,Gravition4也是目前对 ML硬件支持最为完善的CPU了。除了自研的Inferentia和Trainium系列芯片以外,亚马逊也为Gravition4组合打造了支持英伟达A100、H100、英特尔Habana Gaudi、高通AI100的容器。
演习芯片终于迎来第二代
在去年的AWS re:Invent上,亚马逊公开了全新的Inferentia2芯片,这也是其自研AI芯片矩阵中的推理芯片,但其演习芯片Trainium却没有同步更新,直到今年的AWS re:Invent上Trainium2的发布,才终于为这个3年前开辟的产品线带来了新品。
如今爆发式的天生式AI运用须要利用弘大的数据集进行演习,比如最近兴起的静态图片天生视频运用。这些根本模型或大措辞模型的参数从千亿到万亿不等,须要更高的算力才能支撑起来。
更高的性能也是Trainium2本次升级的重点,根据亚马逊供应的数据,相较于第一代Trainium芯片,Trainium2供应了4倍的演习性能和3倍的内存容量,与此同时还将能效比提高至上一代的两倍。在扩展性上,亚马逊最高可供应 10万颗Trainium2芯片互联,从而实现高达65 exaflops的算力,供应超算级的性能。在这样的规模下,演习一个3000亿参数的LLM只要数周韶光。
不过,与已经进入预先利用阶段且未来几个月就将开放利用的Gravition4不同,Trainium2该当仍在量产过程中,亚马逊表示明年某个韶光才会投入利用。
写在末了
从亚马逊雷打不动的发布频率来看,他们在自研做事器芯片的设计上相称积极,多次首发Arm Neoverse的最新核心。而且从做事器支配情形来看,他们也没有在量产上碰着太多的问题,险些可以推测除了英伟达以外,亚马逊该当便是台积电前辈封装的最大利用者了。此外,亚马逊对待第三方硬件的策略也相称聪明,亚马逊并没有选择去追求极致的性能,而是借助自研芯片打造更具性价比的方案。
本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/rsq/204237.html
上一篇:废弃电子产品收受接收废弃电子产品收受接收批发价格、市场报价、
下一篇:返回列表
Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码
声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com