谷歌发布第八代TPU：训练与推理平台分化

谷歌（Google）推出两款第八代张量处理单元（TPU），分别针对大模型训练与云端推理。TPUv8ax“Sunfish”用于训练，TPUv8x“Zebrafish”专注推理，两者形成分工明确的加速平台。

在训练平台方面，Google继续与博通合作，由其团队负责芯片到封装的一体化设计，确保产品可直接部署于数据中心。推理平台则由联发科参与，主要承担封装与支撑芯片设计，Google在核心架构上保持主导。

新系列的具体性能尚未公布，但业内普遍预期其性能将超越TPUv7“Ironwood”。作为参考，TPUv7在FP8精度下提供约4614 TFLOPS算力，并配备192 GB HBM内存。

外部需求正在推动Google扩大布局。Safe Superintelligence Inc.与Anthropic等公司已采用TPUv7进行模型训练与推理。Google预计未来将提供百万级TPU节点，以支持大规模扩展。

Gemini 3模型已完全在TPU平台完成训练与部署，不再依赖英伟达或AMD的GPU。这一转变被视为Google在自研AI基础设施上的重要里程碑。