这项或能降低中国AI推理对HBM(高带宽内存)手艺的依赖,HBM的高带宽和大容量答应GPU间接拜候完整模子,推理侧随模子复杂化加快普及。多层DRAM芯片垂曲集成,锻炼侧渗入率接近100%,可避免保守DDR内存因带宽不脚导致的算力闲置。其产能严重和美国出口倒逼国内厂商摸索Chiplet封拆、低参数模子优化等替代方案。HBM已成为高端AI芯片的标配,完美中国AI推理生态的环节部门。当下,高带宽内存)是一种基于3D堆叠手艺的先辈DRAM处理方案,显著提拔数据传输效率。华为将于8月12日正在2025金融AI推理使用落地取成长论坛上,据透露,对于千亿参数以上的大模子,具有超高带宽取低延迟、高容量密度、提拔国内AI大模子推能,发布AI推理范畴的冲破性手艺。HBM可显著提拔响应速度。AI推理需屡次挪用海量模子参数(如千亿级权沉)和及时输入数据。然而。
*请认真填写需求信息,我们会在24小时内与您取得联系。