“模型”抢跑大模型,AI重构百度

2023-09-08 11:05:31来源:时代财经

今天,很高兴为大家分享来自时代财经的抢跑大模型,AI重构百度,如果您对抢跑大模型,AI重构百度感兴趣,请往下看。

这家在移动互联网时代稍显沉寂的大厂,终于凭借着早年间在AI赛道的技术积累,跑在了时代最前线。

图片来源:Pixabay图片来源:Pixabay

百度终于等到了属于它的机会。

一周前,文心一言位列首批拿到监管部门入场券的大模型名单,并成为12家中动作最快那个——8 月 31 日零点,率先向全社会全面开放。

在开放下载首日,文心一言日活跃用户破 100 万,并登上 App Store 免费应用排行榜首位。而据百度官方平台披露数据显示,8月31日0点至24点,在这短短24小时内,文心一言共计回复网友超3342万个问题。

众所周知,提示词对于大模型内容生成起着关键作用。为提升用户体验,文心一言承担起了科普大模型“prompt”(对话提示词)的角色。开放大模型的同时,百度文心“灵感中心”也开放公测,提供海量AI模板,涵盖AI绘画、创作、娱乐、职场、命理、情感、学习等七大类,帮助用户更顺畅、更高效地使用大模型。

随后,其他一众大模型平台逐渐对外宣布向社会开放。但绝大部分平台只准备好了网页端的入口,并未上线App。抖音豆包、讯飞星火、智谱清言等成功上线的App,其下载量也远逊于文心一言。

据第三方机构七麦数据估算,上述三款App近一周时间内在App Store的日均下载量无一过万。与之相比,文心一言近一周时间内的日均下载量超过18万次。

B端表现也毫不逊色。9月5日的云智大会上,时隔六个月,百度智能云交出大模型服务的成绩单:千帆大模型平台上月活企业数已近万家,覆盖金融、制造、能源、政务、交通等行业的400多个场景。

在即将改变世界的大模型混战中,百度成为有望夺冠的种子选手。这家在移动互联网时代稍显沉寂的大厂,终于凭借着早年间在AI赛道的技术积累,跑在了时代最前线。

机会最终还是留给了有准备的人。

十年苦守,死磕AI

早在2019年,百度就曾率先发布中国首个正式开放的预训练模型文心ERNIE1.0。在ChatGPT引爆生成式AI热潮之后,百度同样迅速响应,于今年3月推出新一代大语言模型文心一言,成为国内大厂中第一个做出对标ChatGPT产品的企业。

产品发布后仍在加速迭代。今年6月,百度推出文心大模型3.5版本。在国内,调研机构IDC发布的《AI大模型技术能力评估报告2023》显示,该版本在算法、生态、服务能力等12项指标中获得7项满分,综合评分、算法模型、行业覆盖均为第一。

在海外,InfoQ研究数据显示,文心一言在大语言模型综合测试上得分达74.89%,仅次于ChatGPT,远超第三名的Claude。

百度今日技术爆发背后,是李彦宏的十年苦守。

作为PC时代的互联网巨头,百度也有过辉煌的时刻。曾几何时,“BAT”这三个字母,代表了中国互联网企业在“搜索、电商、社交”三大领域的最高成就。但随着移动互联网的普及,信息获取的方式变得更加多元,搜索不再是流量的唯一入口,百度不得不另寻他路。

错过移动互联网先发优势,百度只有找到新的增长引擎,才能重回浪潮之巅。押注人工智能,是李彦宏给出的答案。

这一答案一度看起来过于超前。

在2016年的乌镇互联网大会上,李彦宏就曾在演讲中作出判断:“两年前我来乌镇时还在讲我们怎样适应移动互联网的时代,今天我要讲的是移动互联网的时代已经结束了。靠移动互联网的风口已经没有可能再出现独角兽,互联网未来的机会在人工智能。”

次年,百度更是喊出“All in AI”的口号,宣称公司有能力、有决心成为中国乃至世界的AI标杆企业。

雄心壮志背后,百度早已布局AI多年。作为中国企业家群体中不多见的“技术派”,李彦宏始终笃信技术改变世界。他最早在2012年就曾带领百度参与竞拍“深度学习之父”Geoffrey Hinton的创业公司,出价高达数千万美元,最终惜败谷歌。

要知道,正是Geoffrey Hinton推动谷歌成为全球AI技术最出色的公司之一。而当年跟随他一起加入谷歌的Ilya Sutskever,也是如今Open AI的联合创始人兼首席科学家。

彼时,李彦宏就已经展现出惊人的前瞻性。竞标失败的他不仅没有放弃,反而推动百度大力投入AI技术的自主研发,2013年,百度先后在中、美两地设立了人工智能研究中心,从此踏上“死磕”AI的道路。

这绝非一条坦途。面对一项并不成熟的前沿技术,百度必须坚持压强式、马拉松式的研发投入,才能有所进步。

财报数据显示,在2013年到2022年这十年间,百度累计研发投入已超过1400亿元。其中,光2022年百度核心研发费用就达到214.16亿元,占百度核心收入比例达到22.4%。

摆在百度面前的问题是,在过去很长一段时间内,AI都未能找到合适的商业化落点。智能机器人、人脸识别、智能客服、智能音箱等,都未能给成为理想的业绩驱动引擎。

在2022年底的一次内部演讲中,李彦宏坦言道,百度这几年过得比较苦,财报、业务增长性都不是那么光鲜。

好在百度从未轻言放弃。苦守十年之后,李彦宏等来了机会。据其在财报电话会上透露,百度智能云业务在今年Q1已实现盈利,并在Q2持续盈利。

今年第二季度,百度实现营收341亿元,同比增长15%;归属百度的净利润(non-GAAP)达到80亿元,同比增长44%。营收和利润双双实现大幅增长,超市场预期。其中,百度智能云、智能驾驶、用户产品等基本盘业务在二季度持续高速增长,迎来突破性进展,领跑行业。

“生成式AI和大语言模型在许多行业具有巨大变革能力,为我们提供了重大的市场机会。”李彦宏表示。

全栈布局,重构百度

十年的持续投入,让百度掌握了其他竞争对手难以匹敌的优势。

以数据、算法、算力这AI时代的三大要素来看,百度都有着丰厚的储备。搜索业务出身的百度天然就具有优秀的数据能力,无论是在抓取、抽取、清洗、去重、反垃圾等操作上,都可以更快拿到高质量数据集。

算法层面,早在2019年,百度就曾率先发布中国首个正式开放的预训练模型文心ERNIE1.0,该模型一度登顶全球权威数据集GLUE榜单。在随后四年时间内,该模型不断迭代,已经从单一的自然语言理解延伸至多模态,实现视觉、文档、文图、语音“全能”。

支撑文心模型训练的算法框架平台,是百度飞桨。这是中国首个自主研发的产业级深度学习开源开放平台。截至2023年8月,飞桨平台上已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型。位列中国深度学习平台市场综合份额第一。

算力层面,百度自主研发的云端通用AI芯片——昆仑芯1、2代已实现量产,并达到数万片规模部署,昆仑芯第三代预计2024年初量产。此外,百度还已在阳泉、徐水、定兴三地建立起自用云计算中心,庞大的超算集群为大模型的训练奠定了基础。

上述三重优势,使百度能在极短的时间内跟上OpenAI的脚步,成为全球大厂中第一个做出对标ChatGPT产品的企业。

更为重要的是,随着文心大模型跟文心一言的发布,百度成功补上了全栈AI能力的最后一块拼图。现在的百度在“芯片层、框架层、模型层、应用层”等四层IT技术栈上均有布局,成为全球为数不多、进行全栈布局的人工智能公司。

从昆仑芯片、飞桨深度学习平台、文心大模型到文心一言,百度通过这些关键自研技术,实现了层与层反馈,端到端优化,大幅提升效率。

得益于此,百度才能在激烈的国产大模型之战中,始终保持领先霸占C位。

以文心一言为例,这一产品在今年3月发布以来快速成长。截至目前,其熟练掌握的创作体裁超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。

效率方面,通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化,文心大模型训练速度达到原来的3倍,推理速度达到原来的30多倍。

随着技术能力快步升级,以及大模型备案的通过,百度正加快建设生态,推动大模型应用的发展,为下未来的发展做好铺垫。百度集团资深副总裁何俊杰就对外表示,基于基础大模型开发出来的应用,以及这些应用能在多大程度上提升生产效率,才是大模型存在的意义。

“大家比的不应该是你有多少把榔头,而是找到那个钉子,用榔头把钉子给敲进去。这是未来比拼的核心关键。”

目前,在C端,百度旗下各类用户侧产品正在利用大模型进行重构,百度搜索、百家号、百度文库、百度输入法等产品正在研发并陆续推出相关AI功能,未来还将推出NEWAPP等产品;在B端,百度通过飞桨开源开放平台、百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业。

而这正是李彦宏心中百度的长期目标。在今年5月举办的2023中关村论坛上,他明确指出百度要做第一个把全部产品重做一遍的公司。

“不是整合,不是接入,是重做、重构。”

好了,关于抢跑大模型,AI重构百度就讲到这。


返回科技金融网首页 >>

版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。


相关文章