工作动态
您所在位置:主页 > 工作动态 > 行业资讯 > 行业资讯

大厂竞逐AI大模型 虚火过旺还是星辰大海?

2023年04月14日 07:43   来源:南方日报   
 

你方唱罢我登场。

过去一周,国产AI大模型赛道热闹非凡。先是阿里巴巴旗下超大规模语言模型“通义千问”开放内测,后有商汤科技、昆仑万维放出自家打造的大模型成果。与此同时,科大讯飞、腾讯、360、字节跳动等也在“摩拳擦掌”,纷纷将发展人工智能列为未来企业的核心战略……

国内科技企业围绕AI大模型上演“百团大战”背后,谁能凭硬实力拔得头筹?这一新兴技术,究竟是虚火过旺还是星辰大海?

南方日报记者 许隽 叶丹 郜小平

国产大模型“百舸争流”

AI大模型,指的是拥有数百万以上参数规模的深度神经网络模型。这类模型在经过专门的训练后,即可对海量数据进行复杂处理和任务处理。由海外科技公司OpenAI开发的ChatGPT之所以拥有强大的对话交互能力,背靠的正是名为“GPT”的AI预训练模型。

今年以来,随着ChatGPT爆红“出圈”,“大模型热潮”也从国外涌向了国内。

4月7日,阿里巴巴正式发布超大规模语言模型“通义千问”,并定向邀请用户测试体验。与百度于3月中旬上线的“文心一言”大模型工具类似,“通义千问”也具备与用户进行多轮对话的能力,并支持代码编程、文案创作等功能。

虽然没赶上国内大模型产品的“首发”,但是“通义千问”却可能是最早通过各个场景应用融入人们生活的一个。据阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇透露,钉钉、天猫精灵将于不久后正式接入该模型,未来阿里巴巴全系产品都将用上。

4月9日,360宣布,将基于360GPT大模型开发人工智能产品矩阵“360智脑”,未来将其率先落地在“360搜索”场景,后续面向电商、营销、办公等场景深度落地。

4月10日,商汤科技公布“日日新SenseNova”大模型体系雏形,并现场演示了该模型体系下“商量SenseChat”语言工具的超长文本阅读理解、健康咨询等创新能力。同日,游戏起家的昆仑万维也对外预告,不日将发布和奇点智源合作自研的大模型成果——“天工”3.5,并宣称这是“中国第一个真正实现智能涌现的国产大语言模型”。

京东、科大讯飞、腾讯、字节跳动打造的大模型产品也有望在未来一个月集中亮相。

除此之外,由美团联合创始人王慧文、创新工场创始人李开复、搜狗创始人王小川等企业高管领衔的“AI大模型创业军团”,也对AI大模型风口“虎视眈眈”。

“当前AI大模型仍是新兴技术,未来的竞争格局在一定程度上取决于各厂商的举措、战略方向与资本投资方向。”IDC中国助理研究总监卢言霞指出,目前AI大模型处于百花齐放的状态,未来企业要想真正跑赢对手,不能仅靠“一头热”,而是需要培养自身在数据、场景、软硬一体算力等方面的多重能力。

大厂上演AI“军备竞赛”

“每年5000万到1亿美元的花费,是千亿级大模型训练的入场券。”昆仑万维CEO方汉指出,AI大模型高昂的训练成本和研发投入,让众多入局者“望而生畏”。而据公开资料显示,无论是百度、阿里巴巴买还是腾讯、华为每年在研发上投入的资金均在百亿元规模,研发团队人数破万,且在技术研发上实力雄厚,是目前当之无愧的“第一梯队”玩家。

以华为为例,身处“制裁常态化”压力之下,2022年企业研发投入仍高达1615亿元,占总营收的25.1%,现金流表现整体健康。在AI大模型相关的技术积累上,华为拥有芯片、算力、模型、算法等完善的生态链布局。早在2019至2020年间,公司内部就已启动“盘古大模型”立项,该模型在预训练阶段累计学习了40TB大小的文本资料,参数规模达千亿级别,目前在工业、制造、金融、医药等行业场景都已有成熟的应用案例。

百度在人工智能领域布局已有近10年时间,是国内少数在芯片层、框架层、模型层、应用层有全栈布局的科技企业。同样早在2019年,公司就已打造文心大模型ERNIE 1.0。经过多轮迭代,目前模型已经升级到3.0版本。除在模型框架内的基础训练外,ERNIE3.0每天还要接收数十亿用户的搜索请求,这为“文心一言”积累了丰富的语料库。

相较之下,阿里巴巴与腾讯在大模型方面虽然没能抢占“头啖汤”,但是基于原有业务、资源和技术的积累,他们却是最有机会推动模型技术向C端用户普及的两家。在业内人士看来,深厚的算力积累和丰富的应用场景,都是阿里和腾讯的最大“法宝”。

以阿里巴巴为例,张勇曾经指出,大模型是一场“AI云计算”的全方位竞争。超万亿参数的大模型研发,并不仅仅涉及算法问题,更囊括了底层庞大算力、网络、大数据、机器学习等诸多领域的复杂系统性工程,需要有超大规模AI基础设施的支撑。而阿里云从2019年就开始投入大模型研发,算力优势突出,是全球首个完成10万亿参数AI大模型训练的企业。

腾讯方面虽然还没有发布通用的AI大模型工具,但企业自身不乏在网络、存储、软件优化、训练框架和芯片等大模型技术上的积累,距离打造一款成熟产品只有“一步之遥”。

而从各自的特有优势来看,百度拥有“搜索”这一核心流量入口,有利于第一时间抢占用户心智;阿里、腾讯各自拥有钉钉、天猫精灵,微信/QQ等丰富的应用生态,能够推动广泛的场景落地;华为大模型成果在B端已有成熟落地,有望率先在垂直细分领域做出成绩。

“直道冲锋”任重而道远

浙商证券指出,大模型越来越成为当下科技企业核心竞争力的重要体现。与“元宇宙”等概念不同,大模型有着相对清晰的商业模式和应用场景。目前,业内也已基本形成共识:大模型将成为AIGC(即AI生成内容的生产方式)时代的核心支撑。

“中国需要有自己的AI大模型,这是彰显科技创新实力的需要,也是经济和社会发展的需要。”互联网分析师易方寒告诉南方日报记者,以语言大模型为代表的大模型,作为实现通用人工智能的关键路径之一,将成为国内外科技企业竞逐的主赛道。

然而,在推动国产AI大模型发展的过程中,人才储备不足、算法和模型质量不高、算力存在短板等问题,仍然是摆在百度、阿里巴巴等科技企业面前的难题。

以算法和模型质量不高为例。经与ChatGPT对比,百度“文心一言”、阿里巴巴“通义千问”等模型在逻辑思辨、复杂数理计算上仍有不小的提升空间。此外,在中文语料库方面,据深圳数据交易所董事长李红光指出,我国还面临数据分散,导致数据支撑不足的问题。

“数据分散在不同的地方,碎片化比较严重,也比较封闭,同时,没有经过整理的数据,存在字段缺失、信息不准等问题,目前国内数据流通中存在供给不足的问题,尤其是高质量的数据供给不足,限制了国内AI大模型的发展。”李红光分析,数据资源变成数据要素,关键点就是数据治理,原始数据经过治理升级后才会成为人工智能领域的支撑。这也正是数据交易所存在的价值——给国内AI大模型的发展提供数据“养分”。

能耗方面也有挑战。在中兴通讯执行副总裁、首席运营官谢峻石看来,大模型的高速发展,也意味着巨大的能耗——有数据显示,ChatGPT的总算力消耗约为3640PF-days,需要7-8个投资规模30亿元、算力500P的数据中心才能支撑运行。如何降低训练大模型的成本和能耗?能否通过自研AI加速芯片降低推理成本?这同样需要业界共同思考并解决。

此外,生成式AI也带来了一系列隐患,包括国家安全、虚假内容、数据泄露、侵权风险、失业风险、滥用风险等。对此,西南政法大学数字法治政府研究院研究员郑志峰认为,我国需要构建一套涵盖研发、利用全过程、全要素的监管机制,划清技术红线,确保技术向善。

“中国认知智能大模型的发展不仅要‘弯道超车’,还需要‘直道冲锋’。”科大讯飞副总裁、研究院院长刘聪指出,我国丰富的互联网应用生态,为国产AI大模型的落地提供了肥沃的土壤。此外,在垂直类别或多模态的大模型领域,我国也存在“弯道超车”的机会。

尽管如此,要想对标目标并保持差距不断缩小,我国仍然需要在芯片、高质量数据、系统迭代等方面“正面击破”。“我们要正视差距,并且以最先进水平为目标奋起直追。”

阿里等国产GPT“神仙打架”,能超越OpenAI吗?

2023年04月14日 07:39   来源:解放日报   
 

本报记者 查睿

“终于有了一个AI‘嘴替’,它叫‘鸟鸟分鸟’。”4月4日,知名脱口秀演员鸟鸟展示了她的语音助手——搭载在天猫精灵上的类GPT模型,不仅对答如流,还能模仿她的音色、语气与文本风格。4月7日,阿里云悄然开放了大模型“通义千问”的内测入口。4月11日,阿里巴巴集团董事会主席兼CEO张勇宣布“通义千问”将接入阿里系所有产品。

继百度文心一言之后,“阿里版GPT”终于来了。

随着ChatGPT升级为GPT-4,百度、阿里、腾讯、美团、京东、360等国内互联网厂商也紧跟GPT浪潮,不少公司还把其当作“一把手”工程,甚至出现同一天三个官宣的盛况。毕竟,谁都害怕成为“被GPT颠覆的失败者”。

看似“神仙打架”的热闹背后,国产GPT实力究竟如何、短板还有哪些?受访专家普遍表示,ChatGPT的成功验证了NLP(自然语言处理)的发展前景,国内AI企业集中进入GPT赛道有望迎来新机遇,但受限于各家大模型的特点,国产GPT仍需与商业模式相适配,避免红海竞争。

通义千问将成阿里系标配

可以想象的是,通义大模型一旦接入电商数据,或将掀起又一场网购模式的变革

“面向AI时代,所有产品都值得用大模型重新升级。”张勇为“阿里版GPT”通义千问站台时说。这也是他在阿里“一拆六”后首次以阿里云CEO的身份出现在公众视野。

约一个月前,百度率先推出GPT类产品文心一言,随后开放试用时曾遭受不少质疑。不少人测试后觉得,通义千问的AI对话能力初步达到了“可接受”的程度,但是离“令人满意”仍相距甚远。与GPT-4以及文心一言一样,通义千问在整合资料时也会闹笑话,比如将文心一言解释为阿里巴巴达摩院的产品(实为百度的产品),还会坦然承认“文心一言在技术实力和应用场景方面可能更强一些”。

不过,经过对ChatGPT、文心一言等多个GPT类产品的尝鲜,业界对通义千问的内测结果较为冷静,反而更关注“阿里版GPT”的应用场景。

张勇并未现场展示通义千问的能力,但他宣布阿里所有产品都将接入大模型进行全面改造,这一计划被人称为“GPT全家桶”。其中钉钉、天猫精灵率先接入测试,将在评估认证后正式发布新功能。资料显示,在钉钉文档中,通义千问可以创作诗歌小说、撰写邮件、生成营销策划方案等;在钉钉会议中,通义千问可以随时生成会议记录并自动总结会议纪要、生成待办事项,还能自动总结未读群聊信息中的要点。最惊艳的是,钉钉展示了拍照生成小程序场景,上传一张功能草图,不用写一行代码,可立刻生成订餐轻应用。

虽然通义千问姗姗来迟,但阿里巴巴布局大模型并非一朝一夕。早在2019年,达摩院便已启动通义中文大模型研发,目前已申请注册“通义万象”“通义晓语”“通义博研”等商标,可以想象的是,通义大模型一旦接入电商数据,或将掀起又一场网购模式的变革。

隐形头部玩家早已蛰伏

国内各家大模型存在一些差异化,随着技术演进,未来可能会有更多新的特点和区别出现

除了通义千问,国内各大GPT类产品近期如雨后春笋般集中面世。短短一天内,同时有三家厂商宣布了GPT产品的最新消息。

4月10日,商汤科技发布“日日新SenseNova”大模型,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力,还推出自研中文语言大模型应用平台“商量SenseChat”。

同一天,昆仑万维宣布与奇点智源合作自研的国产大语言模型“天工3.5”将于4月17日启动邀请测试。搜狗创始人王小川也宣布“百川智能”创业计划,底座产品将在年底公布。

京东也在前几日高调宣布将在今年发布“ChatJD”,定位为产业版本ChatGPT。目前京东的大模型主要聚焦于文本、语音、对话和数字人生成等4个方面开展工作,比如给商品自动生成长度不等的文案,包括标题、卖点文案和直播文案等。

相较之下,腾讯和华为的大模型显得低调不少,但他们仍是这个赛道的“隐形头部玩家”。

去年,腾讯推出万亿级别中文NLP预训练模型HunYuan—NLP—1T(混元AI大模型),覆盖了NLP、CV(计算机视觉)、多模态等基础模型和众多行业模型,先后在中文语言理解权威评测集合CLUE与VCR等多个权威多模态数据集榜单中登顶。目前,腾讯正在研发类GPT聊天机器人,将集成到QQ、微信上。

去年4月,华为云发布了30亿参数的视觉预训练模型,并与循环智能、鹏城实验室联合开发千亿参数、40TB训练数据的中文语言预训练模型,而华为云盘古大模型还曾获2021世界人工智能大会“SAIL之星”奖。

大模型在学术界也成了“香饽饽”。早在今年2月,复旦大学邱锡鹏教授团队发布国内首个类ChatGPT模型MOSS。3月,中国人民大学卢志武团队自主研发多模态对话大模型并落地了第一款应用“元乘象ChatImg”……

据国研新经济研究院创始院长朱克力介绍,国内各家大模型存在一些差异化,例如文心一言在语言理解、文本生成、问答能力等方面具有优势,通义千问则在机器翻译、图像识别、自然语言生成等方面较为突出,盘古大模型在此基础上更能适应中文语境下的应用场景,MOSS则侧重文本分类、情感分析、知识推理。

上海市人工智能行业协会秘书长钟俊浩表示:“国内各家大模型还在发展初期,尚未定型,随着大模型技术不断演进,未来可能会有更多新的特点和区别出现。”

AIGC国内应用另辟蹊径

国内AI企业在图像视觉领域成就突出,上海不少公司在自然语言处理领域已位于前列

自ChatGPT“出圈”以来,国内类GPT产品在短短3个月内呈现爆发式增长态势,这也引起不少人质疑:既然国内各大互联网厂商在多年前已布局大模型和AIGC(人工智能生成内容),为什么起了大早却赶了晚集?

“无需苛责中国没有出现GPT这种现象级产品,因为GPT的能力涌现是超预期的,只有当基础模型被喂养足够多的数据,有足够大的算力,才能出现如此惊奇的涌现能力。”钟俊浩对此非常坦然,此前主流的自然语言训练模型(如谷歌BERT)更偏向于双向自编码,而GPT作为单向自回归的生成式模型,技术路线较为小众,最初也不为业界看好。

更关键的是,GPT模型需要大量的数据和计算资源进行训练。有专家估算,ChatGPT的训练门槛是一万张高性能GPU芯片,成本约10亿元,模型训练算力可达每秒一千万亿次,需运行3640天。“技术方向的选择、投入资源多少、研究时间的长短都需要体系化考虑。”他认为,ChatGPT的出现证明了技术路线的可行性,国内加快追赶步伐也不算晚。

值得一提的是,上海不少公司在自然语言处理领域已位于前列。乐言科技的文本对话AI在电商领域积累了多年行业经验,构建垂直行业大模型,实现智能客服机器人的大规模应用。达观数据、壹沓科技等专注于专门从事文档自动化审核、写作等系统的开发,达观还推出国产GPT“曹植”系统,面向金融、制造、政务等垂直行业开发专用的大语言模型和类似微软Copilot的“达观助手”。

相比文本对话,国内AI企业在图像视觉领域的成就更为突出,如图像识别、图像分类、图像处理等方面都有不少成功的应用。“深度学习在图像和影像领域最早被市场接受,如人脸识别应用于安防领域,图像识别应用于电商和广告领域,医学影像分析应用于医疗领域等。”钟俊浩认为,AI在图像视觉方面的应用能够带来较大的商业价值和社会效益,因此在国内受到更多关注和投入。

ChatGPT诞生不久,刚在业界打响第一枪之时,中国的AI作画已闯出了一条商业之路。

去年8月,基于文心大模型,百度推出“AI作画”文心一格,只需输入创想文字,选择期望的画作风格,即可一键生成AI画作。几个月后,由文心一格续画的陆小曼未尽稿连同海派画家乐震文补全的同名画作《未完·待续》,以110万元落槌成交,成了全球首个AI山水画作的成功拍卖。

早在2019年,商汤就首次发布10亿参数的视觉大模型,2022年发布320亿参数的视觉大模型,这也是目前世界上最大的视觉模型。在最新发布的“日日新SenseNova”大模型中,商汤科技集成了大量的图像视觉元素,比如“秒画”文生图创作平台,可支持6K高清图生成,还可根据自身需求训练生成模型;“如影”AI数字人视频生成平台仅需一段5分钟的真人视频素材,就可生成声音和动作自然、口型准确、多语种精通的数字人分身。

国内GPT在起步阶段

还需克服三方面差距

“国内互联网平台在大模型方面的布局和投入虽然已经开始,但是还需要克服技术、人才、商业模式等方面的难题,才能够实现ChatGPT这种现象级产品。”国研新经济研究院创始院长朱克力告诉记者。

国内各家大模型与GPT-4主要存在训练数据集、超参数调整和解析能力三方面的差距:GPT-4在训练时使用海量的自然语言数据,需要各种语言和主题的文本库,国内大模型在训练时需要更多的本地化数据来进行训练,以更好地理解本地语言和文化。同时,GPT-4有足量的数据进行超参数微调,以获得更好的性能,国内大模型则需要更多时间来进行超参数调整,以优化模型的性能。出色的解析能力也是GPT-4在理解自然语言上的优势之一,国内大模型需要对自然语言有深入的理解,离不开NLP相关专业人才和技术积累,这也是国内人才市场中较为紧缺的。

上海市人工智能行业协会秘书长钟俊浩也有类似的看法,OpenAI起步早、积累久、投入大,国内GPT在核心能力和全面性方面都存在较大差距,特别是推理能力、问题理解能力、文本生成能力、系统工程能力等方面,“OpenAI在对于大模型涌现能力的把握上拥有更丰富的经验,怎么去发现和利用这样智能的涌现,这种核心能力的差距,我们还需要一段时间来追赶。”

虽然GPT产品目前仍处于发展早期阶段,但是让大家看到了NLP巨大的想象空间。对此,钟俊浩也认同这一观点:从基础大模型到个人端的应用,从垂直领域大模型到商业端的应用,GPT技术可以重新构建互联网和软件。“个人用户从C端感受到了GPT类产品友好的交互体验,而对企业用户而言,GPT不能仅停留在交流界面的优化上,实现效能提升才是作为B端工具的关键要点。”

正如阿里巴巴集团董事会主席兼CEO张勇所说:“一家企业的想象力终归是有限的,释放AI潜力要靠无数人探索。”随着GPT模型层和应用层各自演进,上下游产业链也将连带受益。业内人士普遍认为,百度、阿里等大公司的优势在于有足够的资金和算力去训练大模型,大力出奇迹,而小公司可以扎根垂直领域,通过AI赋能SaaS(软件运营服务),打造竞争壁垒。