首页 > 经济·科技

百度CTO王海峰做客《中国经济大讲堂》:文心一言,读书破万亿

2023-04-17 14:39:06

来源:中国新闻网

  当下,大语言模型热度空前,诸如文心一言、ChatGPT等已经能够与人对话互动、回答问题、协助创作,逐渐应用于人们的工作和生活,也引发了社会热议。近日,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰再次做客CCTV-2《中国经济大讲堂》,阐释文心一言这类大语言模型的产品能力、技术原理和产业价值。

百度CTO王海峰做客《中国经济大讲堂》

  文心一言读书破万亿,五大能力业内领先

  人工智能时代,IT技术栈可分为“芯片层、框架层、模型层和应用层”,百度是全球为数不多、进行全栈布局的人工智能公司。从昆仑芯片、飞桨深度学习平台、文心大模型到应用,在技术栈的每一层,都有领先的关键自研技术,实现了层与层反馈,端到端优化,大幅提升效率。文心一言是百度人工智能多年技术积累和产业实践的水到渠成,尤其是飞桨深度学习平台和文心大模型的联合优化,为文心一言提供了坚实的技术支撑。

  王海峰强调,文心一言完全是百度自主研发的大语言模型。百度早在2019年就发布文心大模型ERNIE1.0,经过近4年研发和迭代,文心大模型已经形成了产业级知识增强大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算、行业大模型,以及支撑大模型应用的工具平台,蕴含了大量百度自主创新、并且在大规模产业应用中得到验证的技术。其中有些关键技术已申请专利或者发表论文,还有一些相关技术也已开源开放。

  文心一言是大语言模型的典型代表。王海峰以“读书破万卷,下笔如有神”为例,解读了大语言模型从海量数据中学习,就相当于读了万亿卷书籍,吸收了万亿知识,做到了理解,在此基础上,就可以按照用户的需求去生成文案、回答问题、完成总结分析了。

  关于“文心一言”名字由来,王海峰做了具体阐释:“文”是语言文字,“心”是用心理解,“文心”指致力于理解和运用语言文字的自然语言理解模型,同时也呼应了《文心雕龙》,寓意用雕缕龙纹一样精细的功夫去研究语言文字的内涵和魅力;“一言”既有“一言为定、一言九鼎”的寓意,也有对人机之间“你一言我一语”流畅沟通的殷切期盼。文心“一言”既出,即可“一生二、二生三、三生万言”。

  现场还展示了文心一言的文学创作、商业文案创作、推理计算、中文理解和多模态生成等能力。在文学创作方面,文心一言不仅可以撰写《流浪地球2》的影评文案,还可以创作朋友圈配图,并续写《流浪地球3》的后续剧情;在商业文案创作方面,文心一言帮助想开店的创业者做好筹备工作,比如调研北京中关村3公里范围内办公人群口味偏好、设计店名、创作宣传语和藏头诗,以及收集汇总创立餐饮店涉及的政府部门与相关流程手续;在推理计算方面,文心一言可以准确计算复杂的数学问题,先理解问题,再通过思维链推理,最后生成答案;在中文理解方面,文心一言可以准确解答“日照香炉生紫烟,遥看瀑布挂前川”诗句是哪里的自然景象及其背后的物理现象;在多模态生成方面,文心一言可以准确回答中国古诗的相关问题,并制表、作画,用方言朗读。

  六大核心技术加持,文心一言落地水到渠成

  文心一言是文心大模型家族的新成员,在文心知识增强大模型ERNIE及对话大模型PLATO的基础上研发,基于飞桨深度学习平台训练和部署,其关键技术包括,有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,在ERNIE和PLATO模型中已经有应用和积累,文心一言中又进行了进一步强化和打磨,做到了更懂中文、更懂中国文化、更懂中国的使用场景;后三项则是百度已有技术优势的再创新,也是文心一言越来越强大的技术底气。

  王海峰以老师教学生为例,深入浅出地解读了大语言模型背后的技术原理。预训练大模型像博览群书的学生,记住了很多知识,但需要老师来指导如何运用,而有监督精调就是老师在教学生,将提炼出来的知识要点、典型范例等教给模型,让它知道该如何符合人类规范、习惯和价值观,去执行相应动作,生成相应内容。文心一言训练了奖励模型,为每次输出的结果打分并给到反馈,进行强化学习,随着真实用户的反馈越来越多,文心一言的效果会越来越好,能力越来越强,进步“一日千里”。此外,文心一言还融合了不同类型数据和知识,自动构造提示,包括实例、提纲、规范、知识点和思维链等,提供了丰富的参考信息,激发模型相关知识,生成高质量结果。

  对于百度已有技术优势的再创新,王海峰也做了进一步解读。在知识增强方面,知识是人类认识和改造世界的智慧结晶。百度构建了5500亿事实的知识图谱。文心一言基于庞大的知识图谱来做知识增强,从海量数据和大规模知识中融合学习,还可以直接调用知识图谱做知识推理,自动构建提示,高效满足用户需求。在知识的指导下,文心一言如同站在巨人的肩膀上,学得又好又快,模型效率和效果均大幅提升。

  在检索增强方面,百度拥有世界上最大的中文搜索引擎,百度搜索已经发展到基于语义理解和匹配的新一代搜索架构,深入理解用户需求和网页内容,进行语义匹配,得到更精准的搜索结果,进而为大模型提供准确率高、时效性强的参考信息,更好地满足用户需求。

  在对话增强方面,基于对话技术和应用积累,文心一言具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。百度深耕对话技术多年,取得了国际领先的技术成果,荣获中国专利金奖、吴文俊人工智能科技进步特等奖等,为文心一言的成功研发奠定了基础。

  文心一言普惠千行百业,加速产业智能化变革

  大语言模型的飞速发展已经引起社会热议,对于工作岗位替代、教育模式变革、人工智能安全等问题,王海峰也给出了解答。

  他表示,文心一言这样的人工智能技术,本质上是提升生产力的工具,可以替代人类完成一些工作,但同时也会创造更多工作机会,使人类可以去做更具创造力的工作。正如人类历史上任何一次科技革命和产业变革都会带来一些工作被替代,同时创造了更多新的工作机会。在教育模式的转变上,“死记硬背”已经落伍,教育将与时俱进,向激发灵感、培养创造力的方向转变。

  在人工智能安全性方面,百度坚定遵守相关法律法规和伦理规范,专门配备了相应监督机制和管理机制,从各个环节做好安全问题。在文心一言的开发过程中,从最初的数据的采集、处理,模型的训练,到最后的使用过程,构筑了五道安全防线。百度也成立了数据管理委员会,还与社会各界共同合作,不断完善相关政策、规则,强化人工智能安全。关于人工智能是否会控制人类,王海峰强调,就像人造地球卫星永远也不会和月球这样的自然卫星画等号一样,人工智能永远也不会直接跟人类的智能完全画等号,研究人工智能是在研究用技术手段来模拟、延伸和拓展人的智能,最终目的是为人类带来更先进的科技,服务于人类更美好的生活和社会的发展

  当下,人工智能已经成为新一轮科技革命和产业变革的重要驱动力量,而深度学习作为人工智能的核心技术,具备很强的通用性,呈现出标准化、自动化、模块化的工业大生产特征,推动人工智能进入工业大生产阶段。大模型具有效果好、泛化性强、研发流程标准化的特点,正在成为人工智能技术及应用的新基座。但与此同时,大模型研发门槛高、难度大,依赖算法、算力和数据综合支撑,产业化面临挑战:模型体积大,训练难度高;算力规模大,性能要求高;数据规模大,数据质量参差不齐。

  如何实现大模型产业化?王海峰表示,类似芯片代工厂的模式,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。未来,文心一言这类大语言模型会成为一个通用的赋能平台,金融、能源、媒体、政务等各行各业,都可以基于文心一言实现智能化变革,提高效率,创造巨大的商业价值。期待社会各界积极拥抱新技术,共同努力,实现高水平科技自立自强,为经济高质量增长带来更多动能。

【责任编辑:长风】
  • 相关阅读
  • 人工智能浪潮下,AI大模型“推波助澜”

      ◎本报记者 王祝华 实习生 曲怡臻  AIGC(人工智能生成内容)、人工智能大模型、对话机器人……近年来,人工智能领域技术突破不断,创新成果不断融入社会各个领域,深刻改变着人们的日常工作、生活方式。博鳌亚洲论坛2023年年会上,多位专家学者、行业领袖围绕人工智能领...

    时间:04-17
  • 昆仑万维与阿里云战略合作 将新建智算中心支撑大模型创新

      4月11日,2023阿里云峰会上,昆仑万维与阿里云共同发布战略合作,双方将在智算中心建设、大模型训练等领域展开合作。昆仑万维CEO方汉、阿里云智能首席商业官蔡英华等共同出席。昆仑万维与阿里云达成战略合作  据介绍,昆仑万维2015年在深交所创业板挂牌上市,是国内领先的互联网平台出海企业,为全球互联网用户提供信息分发、社交...

    时间:04-12
  • 文心一言演示的这些问题,看看ChatGPT怎么答!我们还加了几道超纲题

      预热许久的百度版聊天机器人终于面世。  3月16日,在OpenAI推出大型多模态模型GPT-4的第二天,百度终于正式发布类ChatGPT产品“文心一言”,百度创始人、董事长兼首席执行官李彦宏在发布会上介绍,文心一言有五大能力——文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。  在16日的发布会上,李彦宏通过提前录...

    时间:03-17
  • 大模型时代如何运用小样本学习?复旦大学团队引入“语言模型即服务”

      中新网上海3月14日电 (记者 陈静)在大模型时代,能否运用小样本学习的方式,即用少量语言数据对大模型进行调优?对此,复旦大学计算机学院教授、博士生导师黄萱菁14日对记者表示,在写指令时,应仔细构造指令,同时学习自动构造指令,尽可能提取出语言模型的知识能力;在上下文学习或者情景学习中,通过少量例子让大模型理解人类意图;此外还...

    时间:03-14
  • (两会声音)中国工程院院士陈晓红:发展应用AIGC大模型要趋利避害

      中新网北京3月3日电 (向一鹏 张雪盈)ChatGPT火爆全网,让人们开始高度关注并热议人工智能生成内容(AIGC)这种全新的生产方式。全国政协委员、中国工程院院士、湖南工商大学党委书记陈晓红近日受访时表示,面向Web3.0时代,需要更加以人为本地发展应用AIGC大模型,打造可信大模型生态。  过去5年,陈晓...

    时间:03-03
  • 复旦MOSS团队:打造具有中国特色中文大型语言模型 研究成果将会开源

      中新网上海3月2日电 (陈静 殷梦昊 许文嫣)由美国OpenAI公司开发的ChatGPT模型在全球点燃了新一轮AI热潮。前不久,复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS,备受关注。  记者2日获悉,邱锡鹏与他的MOSS团队——8位年轻的复旦学生,正紧锣密鼓地开展内测和迭代工作。新模型或将在3...

    时间:03-02
  • 北京智源人工智能研究院发布“飞智”大模型技术开源体系

      中新网北京2月28日电 (记者 孙自法)由北京智源人工智能研究院与多家企业、高校和科研机构共建的FlagOpen(飞智)大模型技术开源体系,2月28日下午在北京正式对外发布,旨在打造全面支撑大模型技术发展的开源算法体系和一站式基础软件平台,支持协同创新和开放竞争,共建共享大模型时代的“新Linux”开源...

    时间:02-28
  • Meta加入AI军备竞赛:发布开源大语言模型,号称优于ChatGPT

      澎湃新闻记者 吴雨欣  继微软、谷歌之后,脸书(Facebook)母公司Meta(Nasdaq:META)也加入AI军备竞赛。  当地时间2月24日,Meta官网公布了一款新的人工智能大型语言模型LLaMA,从参数规模来看,Meta提供有70亿、130亿、330亿和650亿四种参数规模的LLaMA模型,并用20种语言进行训练。  Meta首席执行官马克·扎克伯格表示,LLaMA模...

    时间:02-27
  • 李彦宏:大语言模型改变云计算游戏规则

      2月22日,百度创始人、董事长兼CEO李彦宏日前在百度Q4及全年财报电话会上,宣布百度计划将多项主流业务与文心一言整合,其中,文心一言将通过百度智能云对外提供服务。李彦宏表示:“我们相信它将改变云计算的游戏规则。人工智能正在以一种巨大的方式改变许多行业,我们对即将发生的事情感到非常兴奋。”  日前,百度宣布即将推出大...

    时间:02-24
  • 百度CEO李彦宏:百度多项主流业务将和文心一言整合

      中新网2月22日电 22日,百度发布了截至2022年12月31日的第四季度及全年未经审计的财务报告。2022年,百度实现营收1236.75亿元,非美国通用会计准则下,归属百度的净利润206.8亿元,同比增长10%。  第四季度,百度实现营收330.77亿元,归属百度的净利润53.71亿元,同比增长32%。  在百度2022年财报信中,百度CEO李彦宏重点介绍了百度将...

    时间:02-22
版权声明:内容资源均来自于网友投稿、互联网整理编辑,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件举报,一经查实,本站将立刻删除。