机器之心

大模型修复传世名画,飞桨帮助母羊产羔……这届百度世界大会,科技感与接地气并存

机器之心报道

作者:杜伟

2022 年的百度世界大会上,百度诸多亮眼发布背后的飞桨和文心大模型正在受到越来越多的关注。


在中国古代的水墨山水画中,元代画坛宗师、「元四家」之首黄公望的《富春山居图》称得上巅峰之笔,更被列为「中国十大传世名画之一」。然而,该画作由于遭火焚断为长短两卷。前半卷《剩山图》现藏于浙江省博物馆,后半卷《无用师卷》现藏于台北故宫博物院。

在今天上午举行的 2022 百度世界大会上,我们见证了 AI 让两岸画卷完成「合璧」的智能创作能力。现场,百度首席技术官王海峰博士展示了基于文心大模型补全后的《富春山居图》。文心大模型还按照古人传统作文以记之,生成的画作更是得到黄公望纪念馆负责人毛传镔的高度评价,「补全的富春山居图与现存真迹风格一致。」


不过,《富春山居图》画作的补全只是百度 AI 实力的牛刀小试。会上,百度与中国航天联合推出世界首个航天领域大模型 —— 航天 - 百度・文心大模型;百度第六代量产无人驾驶汽车 Apollo RT6 亮相,车辆成本 25 万,仅为同行业十分之一;百度智能交通帮助人们实现「绿灯自由」,车均延迟率降低近三成;百度智能云开物 2.0 深耕重点行业,让企业低成本享受 AI 红利;智慧大脑让城市会思考;数字人度晓晓在唱歌、画画、写作之余,更在百度 APP 端陪伴亿万用户;全屋智能构建未来生活……

与此同时,百度在会上以实际案例展示自身践行普惠 AI 的行动,让 AI 技术走入田间地头和车间厂房,让牧民、农民和电厂工人亲身体验到 AI 的魅力,助力万物生长。

这所有的一切都离不开百度飞桨、文心大模型等底层 AI 技术能力的支持。作为百度自主研发的中国首个开源开放的产业级深度学习平台,飞桨已经成为 AI 开发应用、赋能千行百业、惠及千家万户的技术支撑。目前,飞桨平台凝聚了 477 万开发者、服务 18 万家企事业单位,创建 56 万个 AI 模型,根据国际权威调研机构报告,位列中国深度学习平台市场综合份额第一


文心则是百度自主研发的产业级知识增强大模型,涵盖基础大模型、任务大模型和行业大模型,并结合丰富的工具与平台支撑企业与开发者开展高效便捷的应用开发。文心大模型已经在百度内外部实现了包括 AI 智能创作在内的多样化能力,各行各业都能找到它的身影。

本次世界大会上,百度借助飞桨平台和文心大模型彰显其长久以来利用 AI 技术惠及人们生产生活的决心,以及不断创新 AI 应用场景的内驱力。

正如王海峰博士在会上所讲的那样,「人工智能现在已经遍地开花,成为新一轮科技革命和产业变革的重要驱动力量。既能够支持人类对星辰大海的探索,也在实实在在改善人们的生产生活,赋能千行百业,惠及千家万户。」


走入牧场、农田和电厂,百度用飞桨促进 AI 技术、产业、生态繁荣

自 2016 年飞桨开源以来,百度就立足于开源开放,与广大企业和个人开发者一起为推动 AI 技术、产业和生态繁荣努力。在这一过程中,飞桨平台以及依托该平台的文心大模型成为了重要的助推力

今天的世界大会上,百度通过三个生动的产业案例阐释了飞桨如何助力牧民、农民和电厂工人用上强大的 AI。

首先谈到了内蒙古草原上重要的生产资料 —— 母羊。内蒙古草原上,为了应对母羊生产时难产、小羊羔被冻死的情况,牧民在寒冬深夜里需要多次往返住所和羊圈,费时费力。内蒙古工业大学教授秦俊平带领团队与内蒙古智慧牧业信息技术集团公司合作,使用飞桨开发母羊分娩预测和预警系统,切实减轻了牧民工作量,提高羊羔成活率

对牧羊的智能化分析。

接着关注农业领域近年来发展迅速的无人驾驶农机,但由于相关技术的作业精度要求极高,且农田中存在的暗沟等对全程自主作业带来很多困难。因此,国家农业智能装备工程技术研究中心王昊博士开展农田地块分割和农田障碍物识别方法研究,利用飞桨克服各种技术难题,成功在相关系统当中完成落地,即使在形状不规则、环境复杂的农田地块里,也能方便快速获取高精度农田场景模型,保障农机精准作业
 

无人驾驶拖拉机。

最后来到关乎国计民生的电力行业。能源安全、电力保供关系国计民生,但传统发电生产依靠人员 “传帮带” 传授业务技能,信息经验分享沟通不够及时高效;面对新技术问题老师傅也会出现研判不准确的问题,可能会给电网安全、居民用电带来不便。浙能集团数字科技有限公司算法工程师朱凌风和团队利用飞桨开发电厂设备智能研判系统,可智能诊断设备故障,自动分析故障原因及可能产生的后果,还能结合业务流程自动推送处置信息和运维策略,帮助生产人员有效提高了设备运维工作质量,提升应急抢险和设备故障抢修效率。
 

电厂设备维护工人在作业中。

从以上三个案例中,百度飞桨的开源开放以及产业级属性表现得淋漓尽致。开发者利用飞桨共享且经过大量产业实践验证的底层技术,从实际情况出发创新 AI 技术或系统,切实解决自身问题,提升生产效益。

这些案例只是飞桨赋能千行百业的一个缩影,百度更在智慧产业、智慧生活、前沿科技、创新与公益等更广阔领域中以多样化的方式造福着不同用户群体。

文心继续探索行业大模型以及 AIGC 全新内容生产方式

近年来,深度学习领域掀起了一波声势浩大的「练大模型」潮流。从 OpenAI 发布 1750 亿参数的 GPT-3 开始,千亿、万亿级大模型不断涌现。大模型具有效果好、泛化能力强等特点,能够进一步促进 AI 的通用性。开发者也能以更低的成本和门槛开发 AI 模型,使 AI 拥有更广泛的应用场景。种种优势之下,大模型已经成为了 AI 技术和应用的新基座。

百度从 2019 年就开始积累预训练和大模型技术,力争在 AI 巨头的竞争中始终保持「头雁」地位,因而于近年做出了一系列重磅动作,并在探索过程中形成了自己的核心竞争力 —— 知识增强。2021 年 12 月,参数量达 2600 亿的全球首个知识增强大模型鹏城 - 百度・文心发布,产业级知识增强大模型文心全景图也在当时首次亮相。

今年 5 月的 Wave Summit 峰会上,全新升级的文心大模型在知识增强和产业级这两方面得到了进一步加强,新增 10 个大模型,在业界首发两个行业大模型 —— 国网 - 百度・文心和浦发 - 百度・文心,融合任务相关知识的 ERNIE 3.0 Zeus 千亿大模型让百度 AI 数字人度晓晓 40 秒完成 40 篇高考作文,拓展了 AI 的内容生产能力。

截至目前,文心大模型已经发布了 20 多个大模型,构建了一套完整的大模型生态体系。在今天的大会上,文心不仅迎来了新的行业大模型成员,它的视觉大模型更是通过《富春山居图》画作的补全进一步拓展了百度 AI 的智能创作实力


航天领域有了自己的大模型

百度与中国探月航天一直保持着密切合作,2021 年 12 月正式成为了中国探月航天工程人工智能全球战略合作伙伴。中国航天对百度 AI 技术的深度认可是双方合作的前提,比如采用 AI 实现即时优化飞行轨道与姿态控制,最大限度规避飞行风险;再比如将 AI 与遥操作结合,更好实现深空探测器自主规划探测路线、自主选择探测目标等。

与此同时,双方也在不断探索新的合作模式和途径,此次行业大模型成为了新的合作契合点。

会上,王海峰博士宣布与航天合作研制出了世界上第一个航天领域的大模型 —— 航天 - 百度・文心大模型,成为了文心行业大模型行列中的新成员
 

王海峰博士与中国探月工程副总指挥、国家航天局探月与航天工程中心主任刘继忠主任现场连线。

就其功能而言,航天 - 百度・文心大模型可以将航天领域的数据和知识融合学习,对航天数据进行智能的采集、分析和理解,助力深空智能感知、规划和控制等技术突破。

正如王海峰博士所说,「人工智能在航天领域有着非常大的应用场景,将推动深空探测的智能化。」

文心视觉大模型补全传世名画《富春山居图》

除了继续研发引入行业特色数据和知识的行业大模型之外,文心大模型在助力智能创作领域有了新的成果 —— 视觉大模型实现了对黄公望《富春山居图》的补全。这也表明,文心大模型的理解和生成能力得到了进一步的增强。

与以往 AI 复原画作最大的不同是,每个人都可以亲身体验《富春山居图》的虚拟修复过程,根据自己的想法补全缺失的部分。只要在百度 APP 搜索「富春山居图」,在中间空白处简单勾勒几笔,不到 1 秒钟即可在文心大模型的支持下自动补全画卷,画出属于自己的传世之作。生成的画作还能左右滑动,非常地神奇。


《富春山居图》的修复需要解决清晰度、还原度和全民参与这三方面的问题,这就要求模型既要足够大,满足分辨率诉求和创意泛化需求,又能充分考虑生成结果与原画作的一致性。该团队基于文心视觉大模型 VIMER,提出了「视觉生成大模型 + 单样本微调」的方案

针对类似画作的样本稀缺问题,百度技术团队搜集大量的山水画样本数据,提出让基于多尺度图像块的生成大模型来学习模拟笔触和画作之间的关系。在过程中,为了生成更加逼真的画作,团队还引入了层次化先验信息编码模块来指导模型完成细腻的高质量笔触生成。

虽然团队没有接触到《富春山居图》的实物画,但争取到了电子扫描版的授权。他们针对这一单幅画对生成大模型进行了单样本微调训练,使补全出来的画作在风格、笔触等细节上与现存真迹保持高度一致。

修复过程中,团队需要解决的最大难点是:如何同时满足不同用户多样化的创作期望。由于不同用户输入的笔触在形态上千变万化,既要保证生成画作风格与原画的一致性,又要充分体现用户的创作意图,因此一方面在模型结构设计上准确提取画作多尺度图像块中的风格特征作为生成依据,另一方面保证生成的画面结构尽可能符合用户笔触。

百度技术团队通过大量调试确定画作风格与用户笔触的对应关系,并收集更多不同用户参与修复过程中绘制笔触的特点,做好修复效果与用户笔触引导结果之间的权衡。同时在部分尺度上引入随机性来让生成结果拥有更多可能性,模型也能通过强大的泛化能力来保证生成结果的稳定。

得益于参数量大、建模能力强的优势,文心视觉大模型在补全《富春山居图》过程中实现了高分辨率的生成结果,这在当前大模型中非常少见。文心视觉大模型还能「以不变应万变」,将不同用户多样化的创意实时转换生成看得见的实物画作。

未来 10 年,AIGC 将颠覆现有内容生产模式

此前,文心大模型支持下的度晓晓就显示出了 AI 写作、AI 绘画、AI 写歌等 AIGC(AI generated content)能力,即运用人工智能技术自主生产内容。此次文心视觉大模型的画作补全是百度探索 AI 智能创作一系列动作的延续,契合了当下这一备受关注的新型内容生产方式。继 UGC、PGC 之后,大模型赋能下的 AIGC 已经成为了近来百度 AI 技术加速落地的着陆点。

可以看到,在不断完善的 AI 大模型技术的加持下,AIGC 这一新型内容生产方式不仅能够提升内容生产的效率和效果,而且带来了新的内容创意和方式。这也意味着 AIGC 的适用性不断扩展,更多内容生产领域势必会被发掘出来。

在会上,百度创始人、董事长兼 CEO 李彦宏对 AIGC 发表了自己的观点。他认为,AIGC 不仅可以提升内容生产的效率,还能创造独有价值和独有视角的内容。

李彦宏将 AIGC 的发展分为了三个阶段。第一阶段是 “助手阶段”,AIGC 辅助人类进行内容生产;第二阶段是 “协作阶段”,AIGC 以虚实并存的虚拟人形态出现,形成人机共生的局面;第三阶段是 “原创阶段”,AIGC 将独立完成内容创作。

未来十年,AIGC 将颠覆现有内容生产模式,实现以十分之一的成本、百倍千倍的生产速度去生成 AI 原创内容。在这一过程中,效率更高、学习能力更高且能够跨语言跨模态学习的百度文心大模型势必发挥重要作用。

但同时,文心大模型带来提升的远不止 AIGC 方向。目前,文心大模型不仅正在搜索、信息流、百度地图等百度内部场景中发挥作用,更在工业、能源、金融、教育、通信、媒体、医疗等外部行业逐渐找到契合的应用场景,在助力这些行业的智能化转型升级中进一步实现自身的应用价值。

在生态和社区层面,百度也专门面向文心大模型推出了创意社区 —— 文心・旸谷社区,将大模型的能力开放给更多普通开发者,让他们通过实操亲身体验文心大模型的能力,并充分发挥开发者群体的智慧探索大模型的更多玩法。目前,文心大模型的个人、企业开发者数量已超过 6 万人。

开源开放、生态繁荣这条路要一直走下去

开源开放、生态繁荣绝不只是空喊的口号,更要落到实处。百度也正是这样做的,近年来不断创新底层技术,在与开发者和社会各界的共同努力下,在各行各业中持续降低 AI 应用门槛。其中,飞桨和文心大模型都发挥了「主力军」作用。

就飞桨而言,该平台集深度学习框架、产业级模型库以及丰富的开发套件和工具组件为一体,持续在技术、场景和生态三大领域进行深化,夯实工业大生产强大底座,推动 AI 规模化落地。开发者依托开源开放的飞桨平台在产业实践中开展技术创新,最终形成更广阔的技术和应用生态。

同时,大模型作为深度学习技术的新突破,已经成为 AI 应用的「基础设施」,不仅进一步增强 AI 技术的通用性,也让广大深度学习开发者以更低成本、低门槛亲身体验。文心大模型在做好基础通用大模型和任务大模型之外,细分出了行业大模型,更精准地匹配真实场景的方方面面。

未来,飞桨和文心大模型将持续降低应用门槛,推动产业智能化升级,让 AI 技术惠及每一个人。王海峰博士表示,希望飞桨能够在促进我国人工智能技术和产业繁荣的同时,助力实现科技自立自强。

参考连接:
https://wenxin.baidu.com/
https://www.sohu.com/a/559610000_129720
https://www.jiqizhixin.com/articles/2021-08-19
https://video.cdn.huierkj.com/PaddlePaddle.pdf
https://www.jiqizhixin.com/articles/2022-05-20-8

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com