
谷歌(Google)推出两款第八代张量处理单元(TPU),分别针对大模型训练与云端推理。TPUv8ax“Sunfish”用于训练,TPUv8x“Zebrafish”专注推理,两者形成分工明确的加速平台。
在训练平台方面,Google继续与博通合作,由其团队负责芯片到封装的一体化设计,确保产品可直接部署于数据中心。推理平台则由联发科参与,主要承担封装与支撑芯片设计,Google在核心架构上保持主导。
新系列的具体性能尚未公布,但业内普遍预期其性能将超越TPUv7“Ironwood”。作为参考,TPUv7在FP8精度下提供约4614 TFLOPS算力,并配备192 GB HBM内存。
外部需求正在推动Google扩大布局。Safe Superintelligence Inc.与Anthropic等公司已采用TPUv7进行模型训练与推理。Google预计未来将提供百万级TPU节点,以支持大规模扩展。
Gemini 3模型已完全在TPU平台完成训练与部署,不再依赖英伟达或AMD的GPU。这一转变被视为Google在自研AI基础设施上的重要里程碑。