智能体加速AI应用爆发
➤文心智能体技术具备理解、规划、反思与进化能力,一定程度上将思考过程白盒化,从而让机器像人一样思考和行动,自主完成复杂任务,并在环境中持续学习自主进化
➤文心智能体的出现,是基于不断增强的文心大模型能力
文 |《瞭望》新闻周刊记者 扈永顺
以大模型为代表的AI技术正在引领科技创新和产业变革浪潮,但大模型只有在应用中才能显现其价值,智能体的出现,正加速AI大模型服务千行百业。
“智能体是AI应用的最主流形态,即将迎来它的爆发点。”近日,在2024百度世界大会上,百度创始人、董事长兼首席执行官李彦宏提到,就像PC时代的网站、移动时代的自媒体账号,在AI原生时代,智能体将成为内容、服务和信息的新载体。
在文心智能体平台上,既有农民院士智能体等角色类,也有工具、行业、职场、情感、娱乐等各类场景的智能体,形式多样的智能体正赋能千行百业。智能体技术上的持续突破以及与实际应用的深度融合,也为其赢得了广泛认可。日前,文心智能体获得2024世界互联网大会领先科技奖,这是继去年知识增强大语言模型关键技术获奖后,百度大模型技术连续两年获得这一奖项。
不断“进化”的文心大模型催生了文心智能体,与此同时,文心智能体技术的突破也为大模型应用带来了积极影响。一方面,智能体技术进一步释放大模型潜力,加速应用爆发;另一方面,智能体技术拓展了大模型能力边界,促进文心大模型能力全面提升。IDC、沙利文、中国软件评测中心等多家权威评测显示,文心大模型位居中国及国际第一梯队。
智能体释放大模型应用潜力
“现阶段的人工智能技术,基于深度学习及大模型平台,已具备了非常强的通用性,而智能体是当前最能激发大模型潜力的应用方向。”国家卓越工程师、百度首席技术官王海峰说。
“如果旱地优质稻持续病虫害怎么办?”“你好,我是农民院士朱有勇的智能体。如果旱地优质稻持续病虫害,可以采取以下措施……”被称为“农民院士”的中国工程院院士朱有勇在云南省普洱市澜沧拉祜族自治县扎根近十年,带领村民脱贫致富。但只靠一个人,时间和精力都有限,如何更高效地传授种植知识技能并随时随地指导实践,一直都是困扰朱有勇的难题。
AI时代的到来,让朱有勇和农民的这一痛点需求有了新解决方案。朱有勇院士团队与百度共同打造了农民院士智能体,相当于“把院士装到手机里”,随时随地为农民答疑解惑。
通过农民院士智能体,村民可以随时提问旱地稻种植条件、培育技术、病虫害防治等实际生产遇到的问题,智能体会以对话的方式模拟朱有勇院士与用户进行问答。
解决的问题看似平常,但却是实实在在的民生所需。这不仅展示了大模型的力量,更为大模型的落地找到了有价值的实际应用场景。
除了上述角色智能体,智能体还有多类场景应用。比如法律智能体“法行宝”,已回答用户1660万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适合的律师。
智能体的商业价值也正逐渐显现,例如在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,大幅提升互动营销的效率。比亚迪的官方智能体上线后,销售线索转化率提升了119%。目前,文心智能体平台已吸引超过15万家企业利用智能体帮助开展自身业务。
让机器像人一样思考和行动
文心智能体技术具备理解、规划、反思与进化能力,一定程度上将思考过程白盒化,从而让机器像人一样思考和行动,自主完成复杂任务,并在环境中持续学习自主进化。
之所以能够实现这些功能,王海峰解释,文心智能体技术受到人脑快思考、慢思考的启发。一本叫《思考,快与慢》的书将人类的认知系统分为系统1和系统2。系统1反应速度快,但有时并不准确;系统2慢,但是更理性精确。
类比大模型,基础大模型能够快速生成内容,但是偶尔会出错,相当于系统1。而系统2,在基础大模型的基础上再做思考增强训练,有了“思考”以后,它会慢一些,但是输出的答案会更精确。
系统2的核心是思考模型,该模型包含了四个关键环节:理解、规划、反思和进化,在这四个环节综合作用下,AI系统便能够可靠地执行任务、持续自我进化。
为了实现真正的智能“思考”,百度在基础大模型之上开展了思考增强训练。首先通过思考过程的监督精调,让模型像人类一样进行任务拆解、自主规划;其次是行为决策的偏好学习,让模型学会运用工具和决策;最后是结果反思的增强学习,让模型学会检查工具的结果,并动态调整行为。
例如在打造农民院士智能体过程中,文心大模型首先将朱有勇院士团队的研究成果、农业生产经验等进行全面整合,形成丰富的知识库。再对整合后的知识进行深度学习和理解。随着新的信息和知识的出现,智能体不断更新自己的数据库,确保回答的时效性。
可以预见,推动智能体进入到各行各业的生产服务中,将可以实际帮助人们解决工作和生活中的多种难题。
解决幻觉问题让大模型更实用
文心智能体的出现,是基于不断增强的文心大模型能力。“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”李彦宏说。
幻觉问题是大模型广泛应用的最大限制之一。此前不少AIGC产品喜欢“一本正经地胡说八道”,导致AI输出可信度不高。RAG(检索增强)技术基本解决了大语言模型文本生成幻觉问题,但基于大语言模型的文生图仍存在较严重的幻觉问题,影响了AI的实用性。
针对上述问题,百度进一步研发了检索增强的文生图技术iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,既可以生成精确的图片,也可以进行泛化生图。大模型的“进化”正不断发生。
王海峰介绍,面向产业需求,百度打造了文心大模型矩阵,包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型,满足不同应用的需要。截至目前,文心一言用户规模达到4.3亿,文心大模型日均调用量已超过15亿。
此外,飞桨深度学习平台为文心大模型提供了强大的技术支持。飞桨文心联合优化,大幅提升模型效果和效率。今年百度发布了飞桨框架3.0,支撑大模型效果更好,性能更优。截至目前,飞桨文心生态已凝聚1808万开发者,服务43万家企事业单位,创建101万个模型。□