去年11月,AMD发布了Instinct MI250/MI250X计算卡,不但升级6nm工艺、CDNA2计算架构,还首次采用多Die整合封装(MCM),内部集成两个芯片,达成最多220个计算单元、14080个核心、128GB HBM2e内存,成为AMD的第一款ExaScale百亿亿次级别加速卡产品。
按照路线图,下一代产品要升级到CDNA3架构,早先有曝料称将命名为Instinct MI300系列,内部集成多达四个芯片,或者叫四个GCD。
现在,AMD ROCm开发者工具更新中出现了四个MCM封装芯片的设备ID,分别是0x7408、0x740C、0x740F、0x7410,基本坐实了早先传闻。
虽然这份文件里对应的产品代号还是 Alderbaran ,也就是MI250系列,但应该是个占位符,MI300系列的核心代号我们还不知晓。
四芯封装,如果每个还是110个计算单元、每单元64个核心,那么总计有望达到440单元、2.8万个核心。即便每个芯片的规模有所缩减,总体也有望超过2万个核心,相当疯狂。
很显然,狂堆核心已经是不二法门,NVIDIA下代游戏卡Ada Lovelace据说会有1.8万个核心。
也难怪功耗扶摇直上,PCIe 5.0甚至制定了最多600W供电能力的新标准。
与此同时,Linux补丁内出现了 AMD GF940 的名字,显然是新的GPU编号,和目前MIX250系列的 GFX90a 不但命名类似,而且支持的指令集也很接近,不出意外就是下一代CDNA3架构产品。
当然,新架构自然有新特性、新指令,而且还不少: