统计
  • 建站日期:2016-12-20
  • 运行时间:2285天
  • 文章总数:7535 篇
  • 评论总数:3 条
  • 分类总数:8 个
  • 最后更新:3月24日
文章 精品推荐

最前线 | 百度发布大语言模型“文心一言”:具备多模态生成能力,性能有待市场检验

烈阳
首页 精品推荐 正文

文 | 周鑫雨

编辑 | 苏建勋

一天前发布的GPT-4将OpenAI推上了“AI终结者”的位置,关于百度能否讲好中国大模型的故事的猜测也愈甚。

百度给出了答案。北京时间3月16日14时,百度科技园工区的标志性建筑熊掌会议室中,百度宣布正式推出基于百度新一代大语言模型的生成式AI 产品“文心一言(ERNIE Bot)”。

出席阵容可谓豪华。百度创始人兼CEO李彦宏坐镇会场——这也是继2018年为自动驾驶平台“萝卜快跑”和智能视频音箱“小度在家”后,李彦宏时隔五年亲临发布会现场,为单个产品站台。

同样出席发布会的百度CTO王海峰。此前36氪报道中提及,王海峰也是文心一言项目的总指挥。

从2月7日立下发布大语言模型的“军令状”,到文心一言亮相的短短一个多月,亦是百度在AI领域十多年的积累的试金石。

预期之内的答卷

前有OpenAI公开GPT-4,后有即将接入最新版ChatGPT的微软召开产品发布会,文心一言的发布备受压力。

不可否认的是,由于中文粘连度高等难以被AI处理的特征,文心一言的研发难度并不亚于全球巨头的。百度搜索产品总监张燕蓟曾表示,中文语义的理解难度远大于非中文,因此百度必须研发一个更难、更复杂的大模型。

基于百度自研的ERNIE及PLATO系列模型,文心一言的关键技术包括监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。李彦宏介绍,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

发布会上,李彦宏用文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成5个基础的Prompt(问答提示),对文心一言的能力进行了测试。

从现场演示的结果来看,文心一言具备处理基础问题的能力,回答具有一定的准确性、逻辑性和流畅性,并提供了GPT-4目前并不具备的多模态生成能力。但李彦宏也承认,在部分场景的准确性和理解能力上,文心一言仍无法克服大多语言生成大模型的通病。

此前,外界关于文心一言的产品形态就有诸多讨论。发布会揭示了最终答案。李彦宏表示,大语言模型将给产业带来三大机会,文心一言也将抓住机会:

最前线|百度发布大语言模型“文心一言”:具备多模态生成能力,性能有待市场检验-烈阳家园-第1张图片

大语言模型将给产业带来三大机会。

首先是提供新型云计算服务。文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,李彦宏预告称,百度智能云将于近期举办新闻发布会,主题围绕文心一言的云服务和应用产品,既有公有云服务和也可以做私有化部署。

其次是提供行业模型精调的中间层服务。目前,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。

最后是为应用提供大模型底座服务。李彦宏认为,对与大部分创业者和企业而言,从头开始做基础大模型并不现实。因此基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。

AI,百度寻求的新杠杆

去年12月底的一次内部全员会中,李彦宏正视了百度这几年的颓势。

他说:“百度这几年过得比较苦,财报、业务增长性都不是那么光鲜……有些技术同学做的事离市场很远,纯属自嗨,做了一两年发现东西没人用。”

以2010年“自然语言处理部”成立为起点,百度在AI上发力已经超过十年。但直到去年,百度全年广告营收仍占60.4%,被寄予厚望的AI还在往撑起百度第二增长曲线的目标努力。

ChatGPT爆火后,三个月达到过亿用户,其瞩目程度也让国内科技公司趋之若鹜,同样身披搜索+AI标签的百度,自然不会放过这一机会。2月初,百度CEO李彦宏的OKR曝光:“引领搜索体验的代际变革”。

拥有大量数据、技术沉淀和业务场景的百度,是现有互联网企业中跑通大模型可能性最大、速度最快的一家——芯片有昆仑,学习框架有飞桨,模型有文心,应用则有搜索、智能云、智能驾驶等广阔的落地场景。

文心一言的基座、2019年发布的通用大模型“文心大模型ERNIE”,目前以迭代至千亿级参数的ERNIE 3.0 Zeus,具备智能创作等自然语言理解和生成任务。在李彦宏的期待中,一旦文心一言与百度多项业务结合,数据和模型迭代的飞轮将会快速转动:“目前,ERNIE 3.0每天接受数十亿次用户的搜索请求。这让文心一言能够基于一个庞大的、高效的数据池,快速地学习和改进。”

3月16日起,文心一言官网针对少量用户开启了内测,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。

文心一言能否真能如李彦宏期待的那样,成为撬动业务发展的杠杆,还需要市场的检验。

最前线|百度发布大语言模型“文心一言”:具备多模态生成能力,性能有待市场检验-烈阳家园-第2张图片

36kr制图

文章来源:https://36kr.com/p/2173721804566786

版权说明
文章采用: 《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权。
版权声明:未标注转载均为本站原创,转载时请以链接形式注明文章出处。如有侵权、不妥之处,请联系站长删除。敬请谅解!

-- 展开阅读全文 --
12万的雪铁龙C6,提车要先交29万,捡漏不成反被薅
« 上一篇
香精大米、天价药骗局、毁容针...315上榜名单曝光
下一篇 »
为了防止灌水评论,登录后即可评论!

HI ! 请登录
注册会员,享受下载全站资源特权。
社交账号登录

每日一言

最新文章

标签TAG