“2023年被称为‘AI元年’。人工智能在当下节点,完成了由量变到质变的科技进化,开启了人人应用、众生皆AI的理想主义历程。一路狂飙后,大众对AI的种种兴奋、焦虑、迷茫交叉渐生。”
作者/玄青
2022年11月30日,一个平淡无奇的日子,大洋彼岸一家名为OpenAI的公司正式发布了一款聊天机器人程序ChatGPT,小程序一上线似乎默默无闻,没有发布会、预热或路演,但在短短两个月内,它的月活用户突破1亿,成为史上用户增长速度最快的消费级应用程序。
实际上,OpenAI在谷歌实验室里诞生,由美国孵化器YC阿尔特曼、PayPal创始人彼得·泰尔、马斯克等背后掌舵的AGI公司,一开始是用来剑指谷歌的DeepMind,与之抗衡。在最初的几年中,它的天价注资与小圈层的产品研发,并未引起外界关注。
直到GPT-3.5免费向公众开放,经历了三次迭代的高科技产品才真正落地。从此,人工智能不再是简单的客户服务、教育、创意写作、知识问答等,是深度学习后的“人机” 神交。
比尔·盖茨公开表示,ChatGPT的诞生有着重大历史意义,不亚于互联网或个人电脑的诞生。AI从逻辑推理、知识学习到机器学习历经了50年沉浮,在本轮科技革命浪潮中,终于实现史诗级颠覆。
百模大战
进入2023年,ChatGPT的涟漪依然在扩散。北密歇根大学哲学教授Antony Aumann在世界宗教课程上发现一篇高质量论文作业,询问学生后,学生承认该论文是由ChatGPT完成。一夜之间,人们仿佛找到了玩转魔力的正确出口,拉着ChatGPT问个不停,从中体验到一阵阵来自未来的震撼感。
大众的智慧把ChatGPT推向了无极的变幻。资本市场也看了众生皆AI中的景象,一个比元宇宙更清晰、更具象的靶向目标,他们纷纷调转车头押注AI赛道,显现“发热”本质。
2月,微软与OpenAI开始暗暗较劲,在OpenAI宣布付费Plus试点订阅计划同一天,微软被爆正努力将更快版本的ChatGPT纳入Bing。谷歌则匆忙迎战,上线AI对话产品Bard。同时,搜索端也开始发力,集成了ChatGPT的新版必应和Microsoft Edge正式上线,用户反馈体验比ChatGPT更棒。
很快,大洋彼岸的战火和野心飞到国内。2月底,复旦大学发布类ChatGPT应用MOSS。3月中旬,百度一马当先地推出AI应用文心一言。且不论效果如何,作为中国互联网企业第一个AI战略意识的落地,文心一言是百度长期在AI技术与大模型领域投入的成果。百度厚积薄发,等待的就是这一时刻。
进入4、5月,AI研发处于白热化,号称“百模大战”。阿里云AI机器人通义千问上线测试;马斯克新的人工智能对话机器人TruthGPT开始预热;Adobe的Adobe Firefly嵌入更多旗下产品;谷歌宣布Bard升级PaLM 2模型并支持100多种语言……
总体来看,这些大模型各有优点。其中,偏向类ChatGPT的通用AI大模型,其流量占比高达68.7%。因为,通用模型不需要进行本地化部署、不用加入Discord频道,直接在网页上使用,可谓是最简单粗暴的“所见即所得”。
此后,华为推出盘古大模型,商汤科技推出商量SenseChat,紧接着360、字节跳动、科大讯飞、京东、腾讯、美图……几乎所有的国内互联网巨头都相继入局。据《中国人工智能大模型地图研究报告》显示,截至2023年5月底,国内10亿级参数规模以上基础大模型至少已发布 79 个,而美国为100个,全球累计发布大模型202个。
虽然国内大模型出现可以对标ChatGPT产品的概率不大,但不难发现,他们很会在垂直领域的细分里寻找端倪,譬如3D大模型、视频大模型、多模态大模型等。
生成式AI风暴
如果说2023年上半年还只是混战的开篇,到了下半年,随着OpenAI GPT-4V的正式发布,生成式AI大模型混战的“下半场”正式进入了“多模态”能力的竞争阶段。
“多模态”不是一对多的关系,而是一对几何级增加。“一个能读懂图像、视频的 AI 用途难以想象,我们只揭开了冰山一角。”业内人士分析,把视频转化为新的训练数据,训练出更聪明的 AI,形成一个加速智能化的闭环。
随后,马斯克官宣成立新公司xAI,推出了首款AI模型——Grōk,它的一大优势就是能绑定马斯克的另一家公司社交媒体X(此前的推特),实时抓取X上的信息,使答案更具时效性。Grōk团队都是来自OpenAI、谷歌、DeepMind、微软等知名科技公司的研究员,因此Grōk在逻辑和技术层面,完全能与top前三大模型比肩。
此时,英伟达横跳而出,发布新一代GH200 Grace Hopper平台,给带来业界极大震荡,被CEO黄仁勋称为“世界上最快的内存”。芯片霸主的入局,又为AI打开了一扇核心技术窗口。
但下半年,国内资本市场的热度和产品端的“平淡”形成对比,随着风投的一笔笔落下,入局者更看重大数据与模型结合下的快速商业化。百度文心一言用户规模现已达到7000万,场景4300个;华为云将与相关企业基于昇腾AI云服务和盘古大模型进行联合创新;百度、腾讯、阿里的大模型通过了标准符合性测试,即拿到了“商业许可证”。
总体来看,国内头部大模型的水平大致相当于OpenAI的GPT-3.5,距离GPT-4仍需要突破三大关口:算力、算法、数据。并且,与国内大模型的通用属性较弱,除了百度之外,目前很多大模型为垂4类模型,仅对特定的用户开放。
大家似乎都“卷”明白了“顶级大模型是巨头才能够参与的赛道”,没有千亿资产的投资,难以产生实质性商业价值。“除了自动生成广告图和有趣但不能完全替代人工的文案外,大模型眼下并没有更好的用武之地。”更有人认为,大模型企业最终99%都会死去。
“颠覆—创新—应用—落地”,这一年,AI在资本的裹挟下,变得越来越“现实”。仿佛人们兜里都装了金子,却换不来一杯速溶咖啡,种种兴奋、焦虑、迷茫交叉渐生。因此,很多初创公司开始转向了“小作坊做小工具”的模式,抓住窗口期,通过运营手段快速推广,先挣到一笔钱再说。
找寻AI价值观
11月,OpenAI上演了一出联合创始人、CEO Sam Altman被董事会闪电解雇,在短暂加入微软后,最终回归的“宫斗”闹剧。这也让外界窥得狂飙之下,行业内部深层的分歧与矛盾。不少人也对OpenAI未来前景产生了担忧。
巨变之下,何为我们?我们最不希望看到的就是AIGC(生成式人工智能)像元宇宙那样走入歧路。AI需要时间,更需要引领。所幸,年末文生视频应用Pika的爆火、谷歌多模态大模型Gemini的推出又让市场峰回路转,这正是科技的魅力。
或许,隐匿于AI瀚海中的某一组数字、某一行代码,正审视着我们,期待我们以理性和关怀找寻下一轮巅峰。
原文链接:https://www.thepaper.cn/newsDetail_forward_25921997