首页 > 经济·科技

浪潮信息彭震:加速智算系统创新,切实解决大模型算力难题

2023-11-07 15:41:02

来源:中国新闻网

  中新网北京11月7日电(邱牧子)2023年,生成式人工智能的爆发带来了历史性产业机遇,正在逐步改造重塑社会、经济、文化等各个领域。

  浪潮信息董事长彭震近日在接受中新网采访时称,生成式AI蓬勃发展的背后,算力尤其是AI算力已经成为驱动大模型进化的核心引擎。但大模型时代的算力供给,与云计算时代的算力供给,存在很大的差异性。目前大模型研发已经进入万卡时代,从事大模型研发的公司和团队,普遍面临“买不起、建不了、算不好”的困局。

  如何解决上述困境?彭震认为,需要以算力基建化改善算力供给,促进算力普惠,以算力工程化指导完善算力系统最佳实践,提升算力效率,以模型训练工具化手段,降低模型训练门槛,推动全栈智算系统创新,通过“三化”融合互补,促进产业链条各环节协同配合,加速释放大模型生产力,打造人工智能产业良好发展环境。

  一方面,要实现算力供给基建化,缓解“买不起”困境。彭震表示,大模型对海量算力资源的消耗,急剧抬高了准入门槛。除了通过政策引导、政策补贴等方式降低企业融资成本外,还应大力发展普适普惠的智算中心,通过算力基建化使得智算力成为城市的公共基础资源,供用户按需使用,发挥公共基础设施的普惠价值。用户可以选择自建算力集群,或者是采用智算中心提供的算力服务来完成大模型的开发。

  在他看来,通过大力发展智算中心新基建,中国美国大模型产业的发展已经呈现出完全不同的发展路径。在美国,算力的私有化决定了大模型产业技术只能掌握在少数企业手中,而中国大力推动的算力供给基建化,为大模型创新发展提供了一片沃土,将使得整个产业呈现“百模争秀”的全新格局。

  另一方面,追求算力效率工程化,化解大模型算力系统“建不了”难题。彭震直言,即使解决了算力供应的问题,通用大模型开发仍然是一项极其复杂的系统工程,如同F1赛车的调校一样。F1赛车的性能非常高,但如何调校好这部赛车,让它在比赛中不仅能跑出最快圈速,而且能确保完赛,对整个车队的能力要求是非常高的。

  彭震认为,大模型不应是简单粗暴的“暴力计算”,算力系统构建也不是算力的简单堆积,而是一项复杂的系统工程,需要从多个方面进行系统化的设计架构。包括要解决如何实现算力的高效率、要解决算力系统如何保持线性可扩展以及算力系统长效稳定训练问题等。

  “因此,化解大模型‘建不了’难题,根源在于提升算力效率。但目前业界开源项目主要集中在框架、数据、神经网络乃至模型等软件及算法层面,硬件优化的方法由于集群配置的差异,难以复用而普遍处于封闭状态。这就需要具备大模型实践的公司将集群优化经验予以工程化,以硬件开源项目、技术服务等多种方式,帮助更多公司解决算力效率低下的难题。”彭震说。

  此外,还要通过模型训练工具化,解决“算不好”难题。彭震表示,解决“算不好”难题,根本上要保障大模型训练的长时、高效、稳定训练的问题。例如,大模型训练过程的失效故障,大模型训练会因此中断,不得不从最新的检查点重新载入以继续训练,这个问题在当前是不可避免的。提高算力系统的可持续性,不仅需要更多机制上的设计,更依赖于大量自动化、智能化的模型工具支撑。

  由此,彭震进一步指出,模型训练工具化保障手段,能够有效降低断点续训过程中所耗费的资源,这意味着大大降低训练成本并提升训练任务的成功率,会让更多公司和团队参与到大模型创新之中。(完)

【责任编辑:长风】
  • 相关阅读
  • 浪潮信息彭震:加速智算系统创新,切实解决大模型算力难题

      中新网北京11月7日电(邱牧子)2023年,生成式人工智能的爆发带来了历史性产业机遇,正在逐步改造重塑社会、经济、文化等各个领域。  浪潮信息董事长彭震近日在接受中新网采访时称,生成式AI蓬勃发展的背后,算力尤其是AI算力已经成为驱动大模型进化的核心引擎。但大模型时代的算力供给,与云计算时代的算力供给,存在很大的差异性...

    时间:11-07
  • 浪潮信息彭震:加速智算系统创新,切实解决大模型算力难题

      中新网北京11月7日电(邱牧子)2023年,生成式人工智能的爆发带来了历史性产业机遇,正在逐步改造重塑社会、经济、文化等各个领域。  浪潮信息董事长彭震近日在接受中新网采访时称,生成式AI蓬勃发展的背后,算力尤其是AI算力已经成为驱动大模型进化的核心引擎。但大模型时代的算力供给,与云计算时代的算力供给,存在很大的差异性...

    时间:11-07
  • 浪潮信息彭震:加速智算系统创新,切实解决大模型算力难题

      中新网北京11月7日电(邱牧子)2023年,生成式人工智能的爆发带来了历史性产业机遇,正在逐步改造重塑社会、经济、文化等各个领域。  浪潮信息董事长彭震近日在接受中新网采访时称,生成式AI蓬勃发展的背后,算力尤其是AI算力已经成为驱动大模型进化的核心引擎。但大模型时代的算力供给,与云计算时代的算力供给,存在很大的差异性...

    时间:11-07
  • 华为:企业开发及实施大模型应用过程面临四大挑战

      中新网深圳7月14日电(记者 郑小红 陈文)14日在深圳举行的“大模型时代华为AI存储新品发布会”上,华为公司副总裁、数据存储产品线总裁周跃峰表示,企业在开发及实施大模型应用过程中,面临四大挑战。  首先,数据准备时间长,数据来源分散,归集慢,预处理百TB数据需10天左右;其次,多模态大模型以海量文本、图片为训练集,当前海量小文...

    时间:07-14
  • 媒体+AI,华为云盘古大模型助力媒体释放融媒生产力

      7月11日,以“融合十年笃行致远”为主题的2023中国新媒体大会在长沙拉开序幕。华为云中国区副总裁、CMO张鹏受邀出席技术应用论坛发表主题演讲。当前,全球范围内涌现AI大模型热潮,也为媒体行业发展带来新的变化和影响。张鹏表示,华为云践行“AI for Industries”,将与媒体领域的客户、伙伴,基于华为云盘古大模型共探、共创盘古...

    时间:07-11
  • 大模型让轨道交通更“聪明”

      ◎本报记者 叶 青  基于AI的建筑信息模型(BIM)智能审查平台、时速80公里A型中国标准地铁列车、轨道交通一体化智能电力监控系统……在广州大湾区轨道交通论坛暨展览会上,智能交通“黑科技”集中亮相。论坛上首次发布的佳都知行交通大模型展示出了“高智慧”,无论是服务场景的实时问答,应急指挥场景的统筹处置,还是地铁运维场...

    时间:07-10
  • 帮助大模型提升自身安全性 科研团队发布AI安全平台

      中新网北京7月9日电 (记者 张素)以ChatGPT为代表的生成式人工智能广受关注,大模型亦在加速发展。科研团队近日发布新的AI安全平台,以期为大模型系好“安全带”、把好“方向盘”。  据介绍,人工智能安全平台RealSafe3.0版本由清华大学人工智能研究院孵化企业瑞莱智慧RealAI发布。该平台能够提供端到端的模型安全性测评解决...

    时间:07-09
  • 2023WAIC观察:当大模型如“雨后春笋” 业界改变了什么?

      中新网上海7月8日电 题:当大模型如“雨后春笋”  业界改变了什么?  中新网记者  郑莹莹  在2023年的世界人工智能大会(WAIC)上,大模型“扎堆”。根据大会主办方此前发布的内容,这次大会上有30多个海内外大模型登场,开发团队或是分享大模型路径,或是展示大模型赋能各行各业的多元生态,都争相在大模型发展上有所行动或谋得...

    时间:07-08
  • “爆款”大模型亮相世界人工智能大会 赋能多元化具体场景应用

      中新网上海7月8日电(李秋莹 高畅)2023世界人工智能大会日前在上海拉开帷幕。本届大会的主题是“智联世界生成未来”,“大模型”是本届人工智能大会的亮点之一,记者走进展馆,实地体验了多种“爆款”大模型。  在华为展区,盘古大模型吸引了众多观众驻足。“盘古基础大模型——画出新世界”展位前,一名参展者正在与讲解人互动,...

    时间:07-08
  • 2023世界人工智能大会聚焦前瞻科技 中外企业竞秀“大模型”

      2023世界人工智能大会聚焦前瞻科技——  中外企业竞秀“大模型”  □ 本报记者 李 景   2023世界人工智能大会7月6日至8日在上海举行。5万平方米世博主展览涵盖核心技术、智能终端、应用赋能、前沿技术四大板块,涉及大模型、芯片、机器人、智能驾驶等领域,参展企业超400家,优秀初创企业超50家,首发首展新品30余款,参展...

    时间:07-08
版权声明:内容资源均来自于网友投稿、互联网整理编辑,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件举报,一经查实,本站将立刻删除。