IBM近日公布了其下一代Telum II处理器和Spyre AI加速器的详细信息,这两款全新芯片专为AI工作负载设计,将为IBM Z主机系统带来前所未有的性能提升。 Telum II处理器拥有8个高性能内核,运行频率高达5.5GHz,每个内核配备36MB的L2缓存,片上缓存容量增加了40%,总计达到360MB。此外,每个处理器抽屉还提供了2.88GB的虚拟4级缓存,比上一代产品增加了40%。这款处理器集成了AI加速器,支持低延迟、高吞吐量的交易内AI推理,例如增强金融交易期间的欺诈检测,并且每个芯片的计算能力比上一代增加了四倍。 除了强大的计算能力,Telum II处理器还集成了全新的I/O加速单元DPU,旨在通过提高50%的I/O密度来改善数据处理。这一进步不仅提高了IBM Z的整体效率和可扩展性,还使其非常适合处理当今企业的大规模AI工作负载和数据密集型应用程序。 与此同时,IBM还展示了Spyre AI加速器,这是一款专门构建的企业级加速器,为复杂的AI模型和生成式AI用例提供可扩展的功能。Spyre加速器具有高达1TB的内存,可在常规IO抽屉的8个卡上协同工作,以支持整个主机的AI模型工作负载,同时每个卡的功耗不超过75W。每个芯片将有32个计算内核,支持int4、int8、fp8和fp16数据类型,适用于低延迟和高吞吐量AI应用程序。 据IBM介绍,Telum II处理器基于三星5HPP节点,在600mm2的芯片尺寸中集成了430亿个晶体管。其CPU采用8核设计,不仅频率高达5.5 GHz,还具备全新的分支预测改进和更大的寄存器大小。这些优化使得Telum II处理器在插槽性能上提升了20%,同时功耗降低了15%。 每个Telum II处理器都带有一个集成的AI加速器,可提供低延迟和高吞吐量的AI推理性能。该加速器每个芯片提供24 TOPS,每个抽屉192 TOPS,每个系统可提供高达768 TOPS的AI性能。此外,集成的I/O加速单元DPU还可以将IO管理的功耗降低70%,进一步提高系统的整体效率。 IBM预计其配备Telum II处理器的Z大型机AI系统将于2025年向客户推出。而Spyre AI加速器目前处于技术预览阶段,预计也将于2025年推出。这两款全新芯片的发布,标志着IBM在AI领域迈出了重要一步,将为企业提供更强大、更高效的AI解决方案。 |
原创栏目
笔记本热点
IT百科
笔记本热词
网友评论
聚超值•精选