日前,总部位于北京的国产GPU企业摩尔线程宣布其AI旗舰产品夸娥智算集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡规模。
AI模型训练的主战场,万卡已成为标配。摩尔线程创始人兼CEO张建中说。随着计算量不断攀升,大模型训练亟需超级工厂,也就是一个大且通用的加速计算平台,从而缩短训练时间,实现模型能力的快速迭代。
所谓万卡集群,是指由一万张及以上的计算加速卡组成的高性能计算系统,用以训练基础大模型。据了解,构建万卡集群并非一万张GPU卡的简单堆叠,而是一项高度复杂的超级系统工程。可以把万卡集群想象为一个万人团队,团队需要有非常强的沟通机制,才能协同把一件事情做好。摩尔线程相关负责人说,希望能够建设一个规模超万卡、场景够通用、生态兼容好的加速计算平台,并优先解决大模型训练的难题。
稳定性方面,夸娥万卡集群平均无故障运行时间超过15天,最长可实现大模型稳定训练30天以上,周均训练有效率在99%以上。
日前,总部位于北京的国产GPU企业摩尔线程宣布其AI旗舰产品夸娥智算集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡规模。
AI模型训练的主战场,万卡已成为标配。摩尔线程创始人兼CEO张建中说。随着计算量不断攀升,大模型训练亟需超级工厂,也就是一个大且通用的加速计算平台,从而缩短训练时间,实现模型能力的快速迭代。
所谓万卡集群,是指由一万张及以上的计算加速卡组成的高性能计算系统,用以训练基础大模型。据了解,构建万卡集群并非一万张GPU卡的简单堆叠,而是一项高度复杂的超级系统工程。可以把万卡集群想象为一个万人团队,团队需要有非常强的沟通机制,才能协同把一件事情做好。摩尔线程相关负责人说,希望能够建设一个规模超万卡、场景够通用、生态兼容好的加速计算平台,并优先解决大模型训练的难题。
稳定性方面,夸娥万卡集群平均无故障运行时间超过15天,最长可实现大模型稳定训练30天以上,周均训练有效率在99%以上。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
养老投资基金为什么是FOF
岁月匆匆。在人生长河中,我们常常被时间裹挟着奔跑,往往忽略了对未...
《数字中国发展报告2022年》发布我国数字经济规
国家互联网信息办公室日前发布的《数字中国发展报告》(以下称《报告...
发布“352”服务蓝图中国太保升级大健康战略
竞逐大健康市场,不少机构已经提前布局抢占赛道,打造未来发展第二曲...
iPhone16Pro系列确认6.3/6.9英寸
,此前已经有多方传闻称,iPhone16Pro系列的屏幕将会加大...
中国汽车T10-ICV-CTO研讨会以下简称“C
中国网middot;美丽苏州讯5月27日,中国汽车T10-ICV...
震动金融圈!首只银行理财产品不赚钱不收管理费
招银理财发行的一只类公募基金引发了市场的强烈关注。该产品为招卓价...