上海人工智能实验室发布的DeepLink超大规模跨域混训技术方案具有重大意义,它成功实现了全球首次长距离跨域异构智能算力的高效整合。这一技术将相隔1500公里的两个异构智算中心连接成一个超级节点,并完成了千亿参数的AI大模型训练。这项技术的突破不仅有助于解决全国算力资源分布不均和利用率不高的问题,还能降低AI行业对特定芯片的依赖,为AI产业提供重要的兜底算力支持,避免供应链波动带来的风险。
DeepLink技术方案的核心优势在于其“3D+PS”的高内聚低耦合架构,通过算法创新有效减轻了对网络的压力,使得用户可以使用普通专线网络进行大模型训练。此外,该方案还能确保在跨域训练中,即使某地智算节点发生故障,整体训练也能继续,显著提升了稳定性。
上海AI实验室已经与多家合作伙伴,如中国联通、中国电信、商汤、仪电等智算平台进行了合作,实现了北京、上海、贵州三地智算中心的互联和大模型混训,等效算力依然在90%以上。理论上,DeepLink可通过动态配置支持数千公里的跨域混训,这意味着国内任意两地的智算中心都可借助该方案实现算力整合。
下一步,上海AI实验室将进一步通过DeepLink技术方案组建算力生态,扩大应用范围,推动DeepLink方案能被更多服务商所整合,从而让用户可以在全国自由选择高质量、高性价比的算力供给。同时,他们也会面向多元算力在AI大模型混合推理、分布式强化学习等需求,进一步完善技术方案。这将为全国算力一体化布局注入核心动能。