为什么中国没有出现 ChatGPT?我们的差距在哪里?要投入多少资金才能与之抗衡?
“本质是专注和决心,是有没有做到 AI First。”小冰 CEO 李笛直言,从技术层面来讲,大模型的技术没有太多的秘密,中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面,中国甚至某些方面领先。
“AIGC背后的大模型是大资本的游戏,长期持续投入真的很贵。”资深人工智能研究专家田涛源告诉《后厂村 7 号》,在 ChatGPT 出现之前,较多企业不会选择把钱烧在一个未知的机会上。“GPT3.5 训练一次需要花费 300-460 万美金,还只是算力的成本,没算人才的成本,Open AI 一共 375 人左右,一年工资开支就要 2 亿美金,AI 算力开支 5 亿美元,需要雄厚的资本支撑。”
但 ChatGPT 的惊艳四座,AIGC 的技术质变,投射到广阔的中国互联网上,引燃了 AI 从业者的光荣与梦想、激情与野望,在喷薄、在跃动。
AI 创业者陈东记得,临近过年的寒夜,在北京的朋友家里,他们吃着开心果、瓜子,彻夜交流,一晚上的话题几乎都与 AIGC 和 ChatGPT 有关,虽然不少人对此还是半懂不懂,却富有热情。
一位投资人告诉记者,去年受大环境影响,大多 AI 创业团队生存堪忧,年底负责 AI 赛道的投资小组还在为如何向 LP 汇报苦恼。三个月而已,AIGC 已成为 2023 年最火爆的投资赛道,没有之一。当下这份带有传染性的热闹气氛,让他一扫 2022 年的垂头丧气。
在被 ChatGPT 惊艳的同时,国内业界也在思考:AIGC 的商业模式是什么?哪些方向存在更多机会?中国版 ChatGPT 的危与机?
最重要的是,哪些企业凭着自己的敏锐嗅觉和拼闯劲头,抓住这波技术红利,寻求命运的蜕变,能够脱颖而出引领下一个时代?
当下,全世界互联网都刮起了一阵 ChatGPT 风。这款由 OpenAI 推出的全新聊天机器人模型,不仅可以回答人类的提问,承认自己的错误,还能作诗、编程甚至帮助大学生完成论文。它让马斯克感叹“好得吓人”,也代表 AIGC 向全世界喊出了“芝麻开门”。
在中国,围绕 AIGC 生长出的市场生态,已崭露头角。
“AIGC 并不是一个多么新鲜的概念。”陈东谈到,大厂很多 2C 应用里,已经有不少内容是 AI 生成的,甚至出现过广告对外宣传已经在大规模使用 AIGC 技术,至少两年前就有这个方向的创业团队出现,并得到了一线美元基金的青睐和投资。
在他看来,AIGC 不只是大厂的机会,也将新起很多创业公司。一类公司偏底层,在新场景中孕育大模型的突破,产研类似 DALL?E、GPT 等产生很多新模型;另外是在应用层中,也会出现很多新公司,包括生成文字、图像、视频、数字人等等。
在赶超 ChatGPT 的巨大诱惑下,大厂率先打响了追平基础大模型差距的“攻坚战”。
2 月 7 日,经百度确认,百度类 ChatGPT 项目名字确定为“文心一言”,英文名 ERNIE Bot,预计 3 月份完成内测,面向公众开放。除百度外,还有腾讯、阿里巴巴、快手、字节跳动、京东、网易、360、商汤、美图等大厂都在 AIGC 领域有所投入,加入到这场全球新一轮 AIGC 技术竞赛。
“好的人工智能大模型是非常费钱的。”在资深人工智能研究专家田涛源看来,这股预训练大模型的风潮之下,其实是一场拼数据、拼算力、拼财力的军备竞赛长跑。
他介绍,基础模型 GPT3.5 训练一次需要花费 300-460 万美金,还只是算力的成本,没算人才的成本,Open AI 一共 375 人左右,一年工资开支就要 2 亿美金,算力开支 5 亿美元。“这真是很贵,而且前面那么多年是没商业回报的,基础模型的参数又是持续优化的过程,随着商业化进展加速要不断进行训练,需要雄厚的资本支撑,确实是小公司用不起来。”
但对于基础大模型、应用大模型未来的商业价值,行业从业者都有共识、有期待。
“AIGC 生态最值得关注的就是大模型的建设能力,这将成为 AIGC 长期价值的重要增长点。”AI 创业者“web3 天空之城城主”激动地说,“这是用短期的投入换 10 年后千倍收益的事情。”
另一面,在细分行业中,AIGC 的造富速度同样让人们睁大眼睛。
去年 10 月 19 日,以文字生成为主的 AIGC 项目 Jasper.Ai 完成了 1.25 亿美元的 A 轮融资。完成融资后,凭借 15 亿美元的估值跻身 AIGC 赛道独角兽俱乐部。就在 Jasper.Ai 宣布融资的前一天,Stability AI 成功融得资金 1.01 亿美元,投后估值达 10 亿美元。
在 AIGC 的垂直技术场景中,按照模态区分,可以分为音频生成、文本生成、图像生成、视频生成等细分领域,均已出现中国企业的探索身影。
文字生成:小冰、Glow、清华九歌、彩云小梦、写作猫、澜舟科技、元语智能等。
图像生成:百度文心一格、盗梦师、TIAMAT、达利 AI、6pen、图宇宙、Artflow 等。
视频生成:抖音的剪映、快手的云剪、影谱科技、蓝标分身、商汤智影、诗云科技的 Movio 等。
音频生成:网易天音、StarX MusicX Lab、DeepMusic 等。
Game AI:rct.Ai、网易伏羲等。
数字人:启元世界、倒映有声等。
从独角兽到大厂,从使用者到投资人,从业界到学术界,AIGC 在应用层的创新引发了广泛的关注。
有数据显示,在用户增长数据方面,TIAMAT 内测的用户为 2 万人,盗梦师日增 5 万,上线两个月已积累 50 万用户。诗云科技合伙人梁望也向记者透露,旗下视频生成产品 Movio 上线不到一年时间,已在海外市场获得了不错的用户增长数字。
资本涌入、互联网巨头纷纷布局的背后是 AIGC 巨大的经济价值和市场规模。
Gartner 预测称,到 2026 年,全球 30% 的企业机构将拥有用于数字人和元宇宙的产品与服务。麦肯锡则预测,到 2030 年全球元宇宙相关支出或达 5 万亿美元。更值得期待是,AIGC 正在逐步探索性地进入真实工业生产链条,应用到营销、游戏、代码、生命科学等多个领域。
尤其是一级市场,投资人的脉搏正在变快。
明势资本合伙人夏令直言,2021 年年底他就和同事在梳理 AIGC 领域的机会,并且做了投资布局。AIGC 让他感到兴奋的有三点:一是,用户在环、端到端数据驱动模型的上限极高,模型迭代 + 高质量反馈能带来持续效果提升;二是,以抖音、小红书为代表的内容制作再分发的逻辑有可能变为用户与 AI 系统共同创造个性化内容的逻辑;三是,新一代的 AI 技术范式将有机会让人类脑力劳动真正商品化。
“下一个时代已经开始。”
去年底,知春资本董事总经理谢梦晖就观察到了这波创业的列车再一次提速。一个侧面反映,“我们之前投资的相关领域被投企业,尤其是基于 ChatGPT 模型进行商业化衍生的公司,开始频繁受邀参加各种技术和投资论坛。”
令他感到惊喜的是,这轮技术的迭代将推动创造商业的新增量。“在新的生产力基础上,现有的生产关系必然重构,对应的经济体系、组织模式必然会发生变革,创造力的估值将会呈指数级提升。”
AIGC 的商业模式是什么?
生于 1988 年的创业者陈东意识到自己正身处历史之中,连续许多天大厂宣布入局 chatGPT 的消息席卷着他的注意力,创业者的朋友圈就像创投世界的温度计,“之前搞元宇宙、web3 甚至 NFT 的都要搞 AIGC”。他和朋友们感叹太疯狂了,“像王慧文这种大佬,在朋友圈发布人工智能入局宣言,说 5000 万美元,带资入组,不在意岗位、薪资和 title,求组队。”
虽然陈东目前还没找到明确的方向,但已经和投资人喝上了咖啡,“他们其实也想更了解这个行业,尤其是如何商业化。”
自 AI 绘画工具 StableDiffusion 开源以来,国内大量主打 AI 绘画的网站和 App 如雨后春笋般涌来。AI 画师张颀作为 AI 绘画工具重度使用者,一些平台内测阶段就会主动找上门,让他提看法,找 Bug。“有的甚至前端的开发人员直接过来问,要如何调整才能提升大家的付费意愿?”
产业圈和投资圈对于 AIGC,仍有一串真正严肃、令人如鲠在喉的问题:AIGC 的商业模式是什么?在中国像 open AI 这样的公司在哪里?如何做成一个产品,既要普惠化,又要足够深,足够广?
借鉴美国的商业化经验,夏令大致将 AIGC 领域分为三类商业模式:一类是 OpenAI 这种专注于做大模型的公司,提供 API,做细分场景应用的公司需要去调用它的 API,按 API 去付费;第二类公司是既做大模型,又直接做垂直一体化应用的公司,比如在 AI 生成图像很火的公司 Midjourney,第三类公司是调用第一类公司的大模型 API,基于对细分场景的深刻理解,重点开发具体场景的 AI 应用,比如 Jasper 这样的公司。
但对于像 OpenAI 这种提供 API 的商业模式,在中国能否真正 work,还是个问号。
田涛源讲,这个方向不仅在研发阶段要承担巨大的人力成本、算力开支压力,即便真的推出效果类似 ChatGPT 的大模型,数据成本、算法调优、AI 伦理优化依然居高不下。“目前 ChatGPT 每回答一个问题,成本至少要一美分,以这样的方式去做商业变现,面临着高昂的成本、海量的行业优化需求、多条科技战略路径决策选择。”
与此同时,在国内真正能做 AI 大模型的公司其实是极少的。
夏令观察,但凡能做底层的模型,不管是去做语言大模型的,还是去做强化学习的,只要以技术见长,以工程化产品化的思维做底层模型的公司,融资都非常不错,过去一两年 VC 都要抢着投进去。“可能资本的溢价没有像美国那么夸张,但一两年时间做到 10 亿美金估值的公司还是有一些的。”
有投资人向记者证实,目前很多创业者正在入局垂直场景,解决细分的需求,尤其是游戏 AI 和数字人生成这两条综合性的 AIGC 场景,已经出现趋于成熟的商业化范式。
王思捷和启元世界团队此刻正在经历创业以来最繁忙的日子:由于入局较早,从算法到工程整个一套的体系积累下来的能力,已经自建出百亿参数的 game AI 和数字人 AI 垂类大模型。风口降临后,有顶级游戏制作人已经主动上门寻求合作。
他引以为傲的是,这套垂类模型的训练和推理成本可以做到比 Open AI 同参数规模的模型低一个量级。在王思捷看来,先构建更小的垂类模型,让数据飞轮和模型训练能够很好结合,垂类模型在某些领域可能比 open AI 的效果更好成本更低。“这种想象能力是在中国更能跑通的。”
小冰 CEO 李笛则直言 AIGC 商业回报赛道最大的是数字人,“它的客单价明显会更高,我们做过终端内容的生成,感觉这是个菜市场般的内容市场,单价非常低,直到我们将 AI 生成能力捆绑到数字人身上,平均客单价迅速从 20 万提高到了 300 万,当然你的成品质量要足够高。”
但对于只懂用 API 调用生成内容的创业团队,参与本次采访的受访者大多表示,“价值有限。”
李笛试图放出一个警惕信号,奉劝想要进入 AIGC 赛道的创业者,要谨慎使用大厂提供的可调用接口,尽可能自建垂类模型。
“API 调用的商业模式挣不到钱,所以即便是为了发展,大厂也一定会跳进去,去做生态链上面其他生态类企业的事情,首当其冲就是直截了当应用他们的技术来提供服务的人。”他判断最终的结果,“你要做起来一定会被吃掉,骨头都不剩。”
中美差距:不在技术,在专注
在被 ChatGPT 惊艳的同时,国内业界也在反思:为什么中国没有出现 ChatGPT?
事实上,此前不乏有国内公司雄心勃勃想登上中文版 ChatGPT 的“王座”。但在可能的未来和确凿的现实面前,在巨额投入和业绩报表的冲突面前,选择了犹豫不前。
“大模型的技术没有太多的秘密。”李笛直言,在 ChatGPT 出现前,小冰从 2017 年就开始做 AIGC 相关的东西,从技术层面来讲,中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面,中国甚至某些方面领先。
文心一格相关负责人也告诉记者,和海外的同类型产品相比,在跨模态生成能力、中文知识与理解,以及绘图效率等方面,其实公司在技术层面均存在着优势。他举例,“中文知识与理解方面,文心一格对中文文本、文化和风格就能有更好的理解与刻画能力。”
事实上,国内,一群最勇敢、怀抱最狂野梦想的年轻创业者,已经带着自己的 AI 生成产品挑战海外市场,与世界一流的上市公司对标产品能力。
“我们现在主要的产品叫 Movio,是一款 AI 视频创作工具,主要面向全球市场,从欧美出发。”诗云科技合伙人梁望向记者介绍选择出海的原因,“一是欧美地区对于 SaaS 的接受度、付费意愿和市场体量高很多,二是他们的期待和标准也会高很多,就像参与 SaaS 领域世界上最顶级的赛事,我们有意选择最高标准的市场,接受最严格的用户的眼光,以此证明中国团队也能做出全球领先的 SaaS 产品。”
“AIGC 这件事要真正落地,门槛不仅仅是技术水平,更重要的是从 AI 到用户到数据,再到产品体验能够循环起来的一个飞轮。”从目前拿到手的海外用户反馈,他判断,“在这个方向上,我们现在技术和产品体验上,都是比较领先的。
对比海内外的团队,梁望最大的感受是大家对于创新的理解和投入度存在差异。例如,面对那些可能短期甚至中期内都看不到回报的创新,团队是否仍然拥有无论如何都要去做出来的精神和决心。
作为企业的一把手,李笛也深刻认知到中国和北美的商业和科技环境的不一样,国内大多企业没有那么多的钱会烧在一个未知的预测上。“要花很多的钱,要花很多时间,短期内难有商业价值,谁也不知道这个是不是可行。”
“本质是专注和决心,是有没有做到 AI First。”李笛直言,好几年前看到 Open AI,他们做到了全情投入,这也是唯一的不同,Open AI 花了足够的时间和精力在赌,敢于相信一个暴力出奇迹的大模型,但他们那个赌小冰确实不敢赌,“创业生死一线间,某种意义上,如果 Open AI 不推出 Chat GPT,他们今天可能很堪忧了。”
田涛源看来,这件事给大家一个启发:我们对人工智能硬件非常重视,但是人工智能的基础软件(例如大模型、训练框架、大数据工具链),是不是长期投入不足、没有足够重视?有没有决心进行长期的基础研发投入?
中国投资与产业界更在乎短期商业回报上的表现,即快钱。“在中国是大家看到哪个技术到了商业价值转化的临界点,所有人一拥而上,对许多大型科技或实体行业龙头企业来说,AI 基础科研重视程度不足,缺乏大模型自研能力和战略定力,大家以快速产出的应用为导向,而技术算法的研发必须要很长时间的积累。”田涛源讲。
但一些极擅长工程化的中国 AI 公司入场,也必将搅动全球 AIGC 市场。
夏令讲中国优秀的 AI 初创公司拥有非常明确的一点优势,就是具备很强的工程化能力,搭建一个相比 openAI 成本更低、迭代效率更高、更满足明确优化目标要求的模型是可以实现的。
同时,中国整个应用场景具备足够的丰富性。“我们这么大的人口基数,产业数字化基础也已经初步具备,中国在高质量反馈数量上有优势,而这对新一代 AI 模型格外重要。我们看重的 AIGC 公司要有比较好的工程化能力,对中国实际的商业场景有自己独到认知,我们认为只有这样的公司最有机会能够跑出来。”夏令讲。
中国版 ChatGPT 的危与机
随着 ChatGPT 爆火,这一旧金山诞生的技术引爆了全球人工智能产业,AI 公司近乎全面入局,经济链条的最上游资本市场也出现了震荡,预示变革的信号弹一枚接一枚地炸响。
“中国一定要有自己的 GPT-4,即基础模型。”
田涛源强调,“中国的科技创业团队应有危机感。”ChatGPT 也好,基础模型也好,越多的开发者、越多样化的高质量数据、使用场景,对基础模型的反馈和优化就是越有价值。“谁先去做强化学习,谁就具备先发优势,这对于我们是一个很大动力和压力。”
蓝驰创投肯定地告诉记者,内容本身是非常区域化、地缘化的,也和用户数据息息相关,所以更高规格的 AIGC,应该要对当地的文化有深度理解,本身中国市场足够大,相信针对中国市场通过 AI 生产内容,将有巨大的机会。
而在机会的另一面,是所有 ChatGPT 面临的最大门槛 ——“安全和合规”。
2016 年,微软就做出了聊天机器人,可以实时地通过用户反馈,并修改自己的回答,但一经发布后,24 小时就被教成了种族主义者,很快就被下架了。“我们的实验室也有自己的对话机器人,过去这个是不敢放出来的。”一位头部 AI 公司创始人告诉《后厂村 7 号》栏目。
谈到具体落地,资深人工智能研究者田涛源提出:“OpenAI 官方在 2020 年 7 月发布的《Language Models are Few-Shot Learners》报告中对提出了 ChatGPT 背后语言大模型的能力边界与挑战提醒:
1、表达问题:语义重复,长篇幅段落中失去连贯性、自相矛盾,偶尔不符合逻辑
2、缺少物理常识:GPT-3 很难回答“如果我把奶酪放进冰箱,它会融化吗?”
3、训练效率差与世界模型:GPT-3 与人类语言训练效率存在显著差距,但 GPT-3 在预训练期间学习的文本规模远大于人类一生中看到的文本,以物理世界中额外信息为基础、算法改进都可能提升效率。
4、不确定性:GPT-3 的少样本学习存在不确定性、模糊性,未来在准确理解少样本学习原理的基础上,能在模型推理时“真正从头开始”学习新任务。
5、大模型适用性不好:不方便进行推理,实用性不好,大模型蒸馏到可管理的大小,GPT-3 等大模型包含广泛的技能,但在特定任务中并不需要,原则上激进的蒸馏“瘦身”是可能的方法,但在对千亿参数的大模型上还没有过尝试,可能会遇到“决策不易解释”、 “输入的预测不易校准”、 “训练数据的偏差”。”
“我看到像 Open AI 的负责人现在也跳出来,主动地说希望被监管。”
在上述 AI 头部企业创始人看来,这种大模型的最终落地,必然要接受非常严格监管。“如果放任发展,过十年它能让美国那一代学生的教育水平大幅度下滑。”
在他看来,ChatGPT 真正在 C 端出圈,离不开想要借此抄作业的学生,背后涉及的是 AI 伦理问题。“在美国,10 个学生有 9 个过去几个月迅速知道了 ChatGPT,并通过它写作业上交,这是它会火爆的一个重要的推手,它解决了实际问题,但是这个解决问题的方法是不正确的。”
他对资本市场所谓的天气预报不感兴趣。这段时间,不乏有投资人找过来,提议去做 ChatGPT 类似的大模型,但他没有接受这根橄榄枝。“不是特别爱抢这种风头,我是不会推出一个让学生抄作业的东西,不管赚再多的钱。”
他希望,选择去做 ChatGPT 类似应用的同行,能够更多考虑 AI 伦理的自律问题,提前预估学生拿到它会做什么?被迅速铺开怎么办?“尽力做好安全和合规吧,让它 last for long,能够持续的存在。”
谈到安全和合规问题,百度文心一格相关负责人向记者表示,希望可以厘清各方合规权责,兼顾内容安全和业务创新发展,建议基于不同的细分应用场景和产品模式特点,分类分级制定可落地规则,未来可以鼓励行业领先企业主动分享创新合规实践经验,推动形成行业标准,打造可借鉴的产业合规实践方案。
业内有共识,对于 ChatGPT 的讨论,未来几年都不会停歇。
但明确的是,ChatGPT 以及其对应的大模型发展,就是未来的一个技术革命,可能还没有到达大家想象的那种令人恐慌的程度,但确实会让未来几年的创新得以释放。
在田涛源看来,大家现在执着于去搞 ChatGPT,放眼整个人工智能未来,只是其向前迈进的一块垫脚石。“再往上走,还有更多巨大的机会。”
在他的想像中,AI 可以推动人类对航天的探索、对新能源的探索、对新材料的重大发现,随着它对物理规律认识的越透彻,对人、对环境、对生命体的认知越来越深刻,能够逼近一些人类认知范围以外的未知知识,甚至具备新知的可能性。
在这场或许比移动互联网更加颠覆的大变革里,对于中国 AI 企业,距离终点仍有漫长的道路要寻找、摸索、攀登。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。