2023 年 AIGC 之年
2022 年是 AlGC(Al-Generated Content,人工智能生成内容)爆火出圈的一年,不仅被消费者追捧,而且备受投资界关注,更是被技术和产业界竞相追逐。9 月 23 日,红杉美国发表文章《生成式Al:一个创造性的新世界》,认为 AIGC 会代表新一轮范式转移的开始。2022 年 10 月,Stability Al 获得约 1 亿美元融资,估值高达 10 亿美元,跻身独角兽行列。Stability Al 发布的开源模型 Stable Diffusion,可以根据用户输入的文字描述(称为提示词, prompts)自动生成图像,即文生图( Text-to-Image,T21 )。Stable Diffusion、DALL-E 2、MidJourney 等可以生成图片的 AIGC 模型引爆了 AI 作画领域,AI 作画风行一时,标志人工智能向艺术领域渗透。
OpenAI 在几个月前推出的 ChatGPT 已在美国网络搜索和软件巨头中引发竞赛。为 OpenAI 提供支持的微软 (Microsoft Corp., MSFT) 周二表示,将把这款 AI 工具整合进自家的搜索引擎必应 (Bing) 和网络浏览器 Edge。搜索市场领头羊谷歌 (Google) 也宣布将推出自己的 AI 聊天机器人 Bard。
在太平洋彼岸的中国公司也跃跃欲试。中国搜索巨头百度 (Baidu Inc, 9888.HK, BIDU) 周二表示,在 3 月份完成内测后将推出自家的AI聊天工具文心一言 (Ernie Bot)。中国电商巨头阿里巴巴集团控股有限公司 (Alibaba Group Holding Limited, 9988.HK, BABA, 简称:阿里巴巴) 周三也宣布,正在测试自己的 ChatGPT 式工具。
百度发布消息后,其香港上市股票周二上涨 15%,虽然之后回吐部分涨幅,但年内仍累计上涨达 36%,跑赢众多中国股票。同期中国内地基准股指沪深 300 指数仅上扬 7%。与此同时,在中国上市的AI相关股票高歌猛进。深圳上市的汉王科技 (Hanwang Technology, 002362.SZ) 今年以来已上涨超过一倍。沪市的北京海天瑞声科技有限公司 (Beijing Haitian Ruisheng Science Technology Ltd., 688787.SH, 简称:海天瑞声) 已上涨两倍。汉王科技拥有字符识别产品。海天瑞声提供AI训练数据。
整个世界的所有一切被按下了加速键,什么上市公司只要一关联 chatGPT 就会上涨,但是说实话这并不是一个好事,这个东西真的有那么大的市值和使用场景吗?我可以很直接告诉你,很显然不是,而且它只是刚开始的第一步。
按照现在的说法,我们应该把从去年到今年的人工智能掀起的热浪称为 AIGC,也被称为
AI-Generated Content,即人工智能生成内容。从深度学习和 Transformer 兴起后开始我们可以大致将深度学习分为理解和生成,而 AIGC 就是生成那一侧。深度学习模型可以通过超大量的数据训练并且根据指令要求创造出新的文本、诗歌、队列、图像、音乐、视频等等。
某种意义上来说 ChatGPT 是真正意义上的“出圈”,以极短的时间席卷了全球,达成了互联网最快的用户增长记录。个人认为 ChatGPT 那么火和意义那么大主要是因为它开始更容易遵循人类指令了。如果我们把去年的图像生成,以人类输入的文本作为基础生成图像作为第一代的遵循人类指令的范本,它只能遵循其中一段指令。而以 ChatGPT 第二代为例,AI 开始可以以交互及多轮对话的方式遵循多个指令并且还能关联上下文进行推理。
得益于 think-by-think、Chain-of-Thought、RLHF 等训练方式和优化方案,我们发现模型可以在人类的帮助下遵循我们的要求一步步得到一个符合人类喜好的生成结果。
所以在我看来,一个能遵循多次指令、能通过沟通方式要求修改、可复现的范式才能算是真正的 AIGC 元年。我们拿去年的图像生成(AI 作画)举例,图像生成想要做出好的图片是非常难的,你甚至还需要找到非常好的 prompt 词语(提示词)才能画出来,这甚至催生出大量专门贩卖相关提示词的公司和个人,这说明图像生成(AI 作画)仍然是一个需要专业知识的人才能使用的工具。
比如想模仿梵高的向日葵画一幅同样风格的玫瑰花,那如果我们希望这幅画有着非常惊艳的水准我们需要这个人首先有着很好的审美,其次对艺术风格有基本了解、知道哪些风格词汇同时经过大量尝试和生成后再选出自己认为好看的画再发出来。
当然上面我们的例子只是一个比较简单的需求,但假设我们生成了一张图,需要对其中某些细节进行修改,似乎就还是得靠自己。AI 作画更像是一种辅助艺术家、设计师的工具。
而 chatGPT 带来一种新的体验,我们似乎只要会说话、会打字我们就能给 AI 提出要求,比如写一段文案、查询自己的问题、不开心时聊聊天。以人类最擅长最常用的表达方式覆盖了很多不需要专业知识场景。
ChatGPT 的“出圈”是一种信号,越来越多普通人、非科技和互联网的从业者发现似乎有那么一种东西可以提升自己的生产力。
当然这种 AI 能力目前影响最大以及受到冲击最大的肯定是搜索引擎和互联网的内容生产者,如果我们可以通过问答式的方式以最快的方式找到答案,那为什么我们要用搜索引擎呢?如果我们不用搜索引擎,它们没法通过广告营收不就没有市值了吗?
当然我个人认为本质上对搜索引擎冲击那么大是因为搜索引擎长期统治了互联网的入口、充斥着大量无关的、广告的、营销的、跟踪你行为的东西,甚至逼得大家都想用隐私搜索引擎(如 DuckDuckGo 的兴起)。甚至在近两年会听到某些问题用知乎或者小红书搜索可能都比百度搜索更快。
其次影响最大的一定是云厂商,ChatGPT 代表是一种成本极高、规模极大的 AI 公有云能力,每个国家肯定只有少数的公司有能力、有资金、有人员去训练一个自己的这样的 AI,那么其它想使用这种能力的公司就必须寻找到一个合适的服务商,那哪有比云厂商更适合承担这样需求的公司呢?
可以预感到也许近几年就会出现一种既有 ChatGPT 能力的,又有能与图像生成、图像理解、视频生成、视频理解、声音生成、声音理解、多任务合一的全新的 AI 范式。姑且称为能以自然语言交互的多模态多任务统一范式。
AIGC 真正的价值
我们这里引用红杉资本的一段话:
生成式 AI 正在变得不仅更快、更便宜,而且在某些情况下比人类创造的更好。从社交媒体到游戏,从广告到建筑,从编程到平面设计,从产品设计到法律,从市场营销到销售,每一个原来需要人类创作的行业都等待着被机器重新创造。某些功能可能完全被生成式 AI 取代,而其他功能则更有可能在人与机器之间紧密迭代的创作周期中蓬勃发展。但生成式 AI 应该在广泛的终端市场上解锁更好、更快、更便宜的创作。人们期待的梦想是:生成式 AI 将创造和知识工作的边际成本降至零,产生巨大的劳动生产率和经济价值,以及相应的市值。
生成式AI可以处理的领域包括了知识工作和创造性工作,而这涉及到数十亿的人工劳动力。生成式AI可以使这些人工的效率和创造力至少提高 10%,它们不仅变得更快和更高效,而且比以前更有能力。因此,生成式 AI 有潜力产生数万亿美元的经济价值。
我们可以概括下,释放重复工作的生产力,将某些生产的成本不断降低到无限接近 0。
AIGC 影响的行业
麦肯锡全球研究所合伙人 Anu Madgavkar 向媒体表示,这是因为人类的判断仍然需要应用于这些技术,以避免错误和偏见:我们必须把这些东西看作提高生产力的工具,而不是完全的替代品。
我个人认为会以下几种类型的工作或者行业比较容易受到影响:
- 文字写作类工作:如文案写作、文档写作、新闻写作等工作。
- 法律类初级工作:律师助理和法律助理等法律行业工作人员也是在进行大量的信息消化后,综合他们所学到的知识,然后通过撰写法律摘要或意见使内容易于理解。
- 研究分析师:市场研究分析师负责收集数据,识别和确定数据中的趋势,然后利用他们的发现设计有效的营销活动或决定在哪里投放广告。人工智能相对来说更加擅长分析数据和预测结果。
- 通过多轮对话处理某件事的工作:比如银行柜员、中介、客服等。准确来说任何可以通过多轮对话、语言交互处理事情的工作。可以想象下你去银行存钱取钱、销卡等常见业务是不是似乎就是一场多轮对话。
- 艺术和设计类工作:通过先将需求给到 AI,生成出来的东西再经过多轮对话反复修改后再进行人工调整可以极大的降低艺术和设计类工作的成本和人力。
- 元宇宙:想要实现元宇宙,每个人都能有自己所喜欢的空间的话,那么我们需要一个可以帮助我们定制这个宇宙的超强 AI,它的生成速度非常快、成本非常低。
- 游戏:其实在游戏行业,只做一款游戏需要的成本是非常大的,如果我们能通过对话的形式让 AI 生成我们所需的艺术资产(地图、角色、模型、背景故事、对话脚本、CG、概念设计图等等)、甚至帮我们写好游戏的一些逻辑,可以极大的提升游戏的生产力。甚至可能我们给每个 NPC 设计一个合适的背景,它可以跟玩家自由对话,仿佛这就是一个真实的世界!
AIGC 的法律与隐私问题
首先我们聊下隐私问题吧,其实对于什么样的信息能够作为 AI 的训练数据,什么信息不应该到目前为止各个国家仍然没有完全的界定。举个例子如果有个 AI 公司利用我们的人脸作为数据训练,然后将训练好的成品卖出去盈利了,那么它既没有征得我们的同意也没有分成给我,那每个人不就是资本的“数字奴隶”了么?甚至我们的聊天记录、写的文章、画的画我们并不希望被拿去训练。
当务之急就是界定合适的法律,规范“数据”能来自于哪、能使用哪些、是否需要征得本人同意等等。还有很多平台使用的“你在这个平台发的任何东西版权归属本平台”这样的霸王条款应该尽快废除。
其次严重的是版权问题,举个例子如果这个 AI 生成的一篇科幻小说可能与《三体》中的情节很像,那么是使用生成 AI 的作者应该负责还是设计这个 AI 的公司/个人应该负责呢?用 AI 生成的画与画家画的话特别像,那么究竟有没有版权问题呢?这些版权问题似乎都还没有办法界定。
第三我们可以预感到将来的生产关系可能发生了改变,裁员危机很难说什么时候会结束,那么是不是应该有更新的劳动模式呢?我们可以预感到如果 AI 不断兴起,将来的社会重复性的工作所需的人将会越来越少,创造性和高精尖的人才的重要性将会越来越大。