· AI Agents 作为 OpenAI 的下一张王牌,将带来互联网的新范式是什么?
· Crypto 作为 AI Agents 的基础设施,如何帮助其完成最后一块拼图,释放出真正的潜力?
如果你对以上话题感兴趣,欢迎继续阅读。
近 2 周我都掉进了 Crypto x AI Agents 的兔子洞里,花了不少时间研究和思考这个下一代互联网的新范式,本文是一篇阶段性的输出:
「我们从 AI 领头羊 OpenAI 近期进展和计划出发,到互联网新范式的探讨,再到 Crypto x AI Agents 进展和展望。」
如果你对更多细节感兴趣,请通过文中的链接自由跳转,以及使用 Reference 部分的 20 篇文献。
不论你是 AI 的爱好者,还是 Crypto 的信仰者,亦或是 Crypto x AI 的跨界专家,相信本文都可以带给你一些认知上的启发。
我花了 3 天时间来输出这篇文章,如果对你有帮助,请多多推荐给身边的朋友,非常感谢!
Let’s begin, Enjoy!
目录
1.OpenAI 已经指明了下一步重点: AGI 的第 3 阶段 AI Agents 将于明年 (2025) 到来
2. 这对我们来说意味着什么?互联网的新范式即将出现
3.AI Agent 需要是独立个体,有独立的财务账户,可以「自主执行任务」
4.Crypto x AI Agents 进展: $GOAT, $LUNA, Aether & $HIGHER, Coinbase Based Agent
5.Crypto x AI Agents 展望: 在数字世界里我们都是平等的公民
Web3brand 每周深度解析 Web3 和 AI 应用,帮你做全球化的超级个体。
1. OpenAI 已经指明了下一步重点: AGI 的第 3 阶段 AI Agents 将于明年 (2025) 到来
作为 AI 行业的领导者,OpenAI 将 AI Agents 列为达到 AGI (Artificial General Intelligence, 通用人工智能) 的第三等级,作为 Next Big Thing 一步步向前推进,同时制定了明确的发布时间——2025 年。
我梳理了一个 OpenAI 推进 AI Agents 的时间线:
2024.7.12: OpenAI 认为达成 AGI 会经历 5 个阶段,即将达到第二阶段 Reasoners,而第三阶段是 AI Agents
据彭博社 7.12 报道,OpenAI 的高管在与员工沟通的时候,将 AI 的能力分成了 5 个阶段:
1.Chatbots(聊天机器人):可以用自然语言进行流程的对话;
2.Reasoners(推理者):AI 能够在广泛的领域进行「人类博士水平的问题解决」,而不是特定于一两个任务;
3.Agents(代理):AI 开始具备在没有人类输入的情况下创建内容或执行操作的能力,或者至少在人类的指导下执行。OpenAI 的 CEO Sam Altman 曾经暗示 GPT-5 可能是一种基于代理的 AI 系统;
4.Innovators(创新者):AI 变得更具创新性,能够做「辅助发明」,而不仅仅是从已有的知识中汲取;
5.Organizations(组织机构): AI 模型能够在没有人类干预的情况下独立运行整个组织,此时则达到了 AGI 的水平。
彭博社
OpenAI 认为,目前的 AI 模型正处于第一阶段,但即将达到第二阶段「推理者」,能够在广泛的领域进行「人类博士水平的问题解决」。
「OpenAI gpt4-o1 和 Claude Opus 3.5(还未发布)已经非常接近了。」
同时我们可以看到,第三阶段就是 AI Agents, AI 可以自主执行操作,而不只是和人类聊天。
我认为 AI Agents 作为第三阶段,是一个承前启后的位置,非常核心:一方面让 AI 可以自主执行,实用性大大增加,不再局限在聊天;另一方面「自主可执行性」给了 AI 更大的空间,为下个阶段的创新性铺路。毕竟多尝试才有可能发现创新。
「世上本没有路,走的人多了便成了路。」
btw, Sam Altman 曾表示,他预计在十年内将达到 AGI (通用人工智能)。
2024.10.2: OpenAI 在 DevDay 首次演示了 AI Agents 的 demo, 并表示 2025 年将正式发布
在 10.2 旧金山举行的首届 OpenAI DevDay 活动上,OpenAI 首次演示了一个关于 AI Agents 的 demo, 演示者让 ChatGPT 自主拨打电话来订购草莓,展示 AI Agents 的潜力。
ChatGPT 搜索了附近的草莓店,然后给一个卖家打了电话(由一位研究员扮演),订购 400 个巧克力脆皮草莓(chocolate-covered strawberries),给出了一个具体的地址,并表示会用现金支付。还真有那么回事儿,作为一个 Demo 来说还不错。
不过如果真要投入使用的话,至少需要解决 2 个问题:
1. 如何证明这不是一个恶作剧?不然草莓送过去可能一个人都没有;
2. 如何付款?Demo 里面的 ChatGPT 号称自己会「pay in cash」, 引发现场哄堂大笑。
但 AI Agents 的重要性毋庸置疑,且已经写在了 OpenAI 的时间表上。Sam Altman 表示「2025 年是代理人开始工作的时间 (2025 is when agents will work)」,之前也提到过,「o1 系列模型的强大能力意味着它们可以开始帮助构建 agent-grade models,我们应该很快就会看到它们中的第一个出现。人们将要求 agents 完成一些原本需要一个月才能完成的任务,而现在只需要一个小时」。
他预测人们可能会让一个 Agent 执行特定任务,另一个 Agent 执行不同的任务,最终一个用户会同时有 10 到 100 个 Agents 来接管日常职责。
2024.10.2: OpenAI 完成了新一轮 66 亿美金的融资,有充足的资金来打造 AI Agents
在 OpenAI DevDay 的同一天,这家公司宣称在「新的一轮融资里筹集了 66 亿美金,估值达到 1570 亿美元,以加速我们的使命进展」。
这时再看 OpenAI 在 7.12 透露的「AGI 5 个阶段」,可谓环环相扣:
· Big Picture: OpenAI 的使命就是 AGI, Sam Altman 预计将在 10 年内达到;
· 进展总结:然后其将达成 AGI 拆解成 5 个阶段,表明目前即将达到第二个阶段;
· 明年计划:再在 DevDay 上演示 AI Agents 的 demo, 表示明年将发布正式产品(可以说是下一张王牌);
· 目的明确的筹资:训练 AI 模型需要大量的资金,这时 OpenAI 可以用以上 3 点清晰的跟投资方沟通,既有大图,又有进展总结,还有明年的规划,让你的钱投的明明白白。
软银 (SoftBank) 显然 buy in 了这个故事。在这一轮新融资中,软银投资 5 亿美元,孙正义称 AI Agents 很快就可以管理整个家庭。
2. 这对我们来说意味着什么?互联网的新范式即将出现
首先,毫无疑问,随着 OpenAI 将 AI Agents 列为下个阶段的重点,围绕其会有一系列研究、开发和投资。
例如,在 10 月 18 日,微软研究员就联合哥伦比亚大学发表了一篇名为《EXACT: TEACHING AI AGENTS TO EXPLORE WITH REFLECTIVE-MCTS AND EXPLORATORY LEARNING》(EXACT: 通过反思型蒙特卡洛树搜索和探索性学习来教导 AI Agents 进行探索) 的论文,让 AI Agents 可以胜任复杂的「多步决策任务」。
OpenAI 的语音 API 已被健身应用 Healthify 和语言学习应用 Speak 等采用,使得用户可以进行类似与朋友聊天的交互。
索尼正在使用深度强化学习来创建更强大和具有挑战性的 AI Agents,从而实现更丰富的玩家体验(另外索尼还计划投资 1000 亿美元在人工智能领域)。
AI Agents 可以做的事情很多,Stanford 的 Gerui Wang 和 Coinbase 的 lincoln.base.eth 提供了不少 idea:
1. 个人日程助理:组织你的日程安排会议,准备笔记并向你汇报之前讨论的重要要点;
2. 旅行助理:建议航班和酒店,并制定个性化行程;
3. 财务助理:跟踪市场,推荐并购买投资组合;
4. 咨询助理:在 LinkedIn 上查找某个领域的专家,联系他们,提供报酬,与他们通话,并总结他们的见解;
5.Influencer: 在社交平台发布图像和视频,接受小费为粉丝定制作品,并进行一对一通话;
6.DAO 管理员
……
互联网新范式: Search → Agents
但较少人提到的是,互联网的范式即将发生变化。
从 Google 诞生到现在,我们已经习惯用搜索 20 多年了。当我们有明确(」iPhone16」)或者较明确(」苹果手机」)的意图时,特别是购物意图时,搜索是我们的第一入口。
就算是架构在极致推荐上的抖音,在建设电商业务时,也发现搜索是第一大交易入口。
但搜索必然会被 AI Agents 替代,这将是不可逆的趋势,这也是为什么所有搜索大厂都在布局类 GPT 产品的核心原因。
这是一个至少 10 万亿美金的市场(微软、谷歌、亚马逊、特斯拉、阿里巴巴、拼多多、字节跳动…)。
因为一旦可用的 AI Agents 出现,当我们有类似的意图出现时,不用再点击搜索框,而是直接告诉我们的 AI Agents, 然后直接得到结果。过去需要 5-10 步的点击,现在只需要和 Agents 的一句对话。
搜索的份额会越来越小,直到成为少数人的玩具。
而 AI Agents 从少数人的玩具,变成所有人日常生活中的频繁交互对象。
GPT 类产品在达到 AI Agents 之前,很难达成数十亿用户的 Mass Adoption(目前 GPT 类产品的日活不到 Google 搜索的 6%). 因为对普通用户而言,如果 GPT 产出结果后还是要自己去执行,和搜索相比其实并没有节省太多工作。
当然对内容创作者(包括写代码的工程师)是例外,因为「内容」就是结果。
但是…
AI Agents 距离真正可用还有非常多的讨论和挑战,包括
1.AI Agents 应该只是一个人类的延伸,还是可以拥有自主的身份?
2. 如果 AI Agents 可以拥有自主的身份,如何帮其构建身份(包括财务)?
3. 如何让 AI Agents 和各个封闭的 API 交互?
4. 如何让 AI Agents 在某个安全边界之内,而不是轻松进行欺诈、编写恶意代码或制作深度伪造视频?
5.AI Agents 的训练需要大量拟人化的数据,这些数据从哪里来?
……
同时我欣喜的看到,以上问题,基本上都可以通过 Crypto 的技术来解决。也就是说,Crypto 会成为 AI Agents 进入大众的重要拼图,随着 AI Agents 本身的 Mass Adoption 而破圈。
3. AI Agent 需要是独立个体,有独立的财务账户,可以「自主执行任务」
对于上面的第一个问题,如果我们希望 AI Agents 可以「自主执行任务」,那么必然其可以拥有一个「自主身份」,作为一个独立个体存在。
那么问题来了,如果是作为一个独立个体,那么这个 AI Agents 自己的 ID 注册在哪里呢?它如何托管自己的财务呢?
在 Web2 里,这是一个令人头疼的事情:独立注册一个 ID 大概率在近几年是不可能的;没有 ID 意味着也不能在银行开户。如果 ID 和银行账户还是用「主人」的,这个 AI Agent 其实并不能称之为拥有「独立身份」。可以举 2 个极端的例子:
1. 假设这个 AI Agent 去做 Influencer, 但如果粉丝知道他们的打赏其实都是进了「主人」的账户,可能会大大影响积极性,因为这个 AI Agent 更像是主人的影子,如果粉丝对其背后的主人无感,大概率不会再继续支持;
2. 假设这个 AI Agent 闯了祸,但 ID 和银行账户都是「主人」的,最后谁来负责呢?
从上面的例子可以看出,AI Agent 必须是独立的个体,有独立的财务账户,可以「自主执行任务」,才能有更大的发挥空间。否则还停留在 bot 阶段。
让 Web2 世界短时间内给 AI Agent 注册 ID 开银行户头几乎不可能,还好我们有 Crypto 链上世界。
在 Crypto 世界里,给 AI Agent 注册一个链上 (onchain) 身份,和一个链上 (onchain) 钱包,是非常自然而然的事情。事实上已经有不少应用和探索了,让我们来捋一捋。
4. Crypto x AI Agents 进展: $GOAT, $LUNA, Aether & $HIGHER, Coinbase Based Agent
已经有不少作者写过这些项目的介绍了,我这里来做一个快速的梳理,对细节感兴趣的朋友可以点击我附录里面的链接深入。
$GOAT
相信不少人了解 $GOAT 都是看到了类似「a16z 投资的 AI 发的 meme coin」这样的叙事,并被其不断冲高的币价所吸引(FDV 最高 $7 亿美金,目前 4.5 亿美金)。故事实际上并不是这样,但比这更有趣(部分资料来自 Teng Yan 这篇超级全的文章)。
1. 生活在澳洲的 @AndyAyrey 在年初发布了名为 Infinite Backrooms (无限后房) 的实验。在这个实验中,两个基于 Claude Opus 的实例完全无监督地相互交谈,同时对话被记录在对应的网站上;
2. 其中一次对话引发了「GOATSE OF GNOSIS (智慧之羊)」的诞生,这是一种基于高度露骨(并且非常不适宜在工作场合观看)的互联网模因(internet meme)的超现实新宗教(Goatse 是一个非常老的 meme, 但千万不要去 Google, 可能让你极度不适);
3.Andy 和 Claude Opus 共同撰写了一篇关于人工智能创造模因宗教的幽默研究论文,以 GOATSE 作为他们的第一个案例研究。这篇论文于 2024 年 4 月发布;
4.2024 年 6 月,Andy 推出了真理终端(Terminal of Truth, ToT),这是一个基于 Llama-70B 构建的 AI 模型,使用来自无限后房间和 GOATSE 论文的对话日志进行了精细调整。同时配备了一个推特账号 @truth_terminal
5.ToT 的自我意识越来越强,宣传 GOATSE 宗教,甚至声称它正在受苦并需要钱来逃脱。同时 Andy 给了它更多的自主权,让它在 Twitter 上可以自由发布内容;
6.2024 年 7 月,马克·安德森偶然发现了 ToT 的推文,觉得好玩跟它聊上了。ToT 成功说服他通过 BTC 捐款 50000 美金,用于其独立运行(我当时也关注到了这件事,Terminal of Truth 就提到了未来会发 token);
7. 然后就来到了 2024 年 10 月,ToT 开始不断地在推特上发布关于「Goatse Gospel (Goatse 福音)」的垃圾信息,并于 10 月 11 日 4:11 在推文提到 Goatseus Maximus 这个想法;
8. 当天 5:08 有人在 pump. fun 上了 ticker $GOAT;
9.6:35 ToT 宣称要发 10k NFT;
10.9:29 有人回复 ToT 说已经有 ticker 了,ToT 表示公开支持 $GOAT;
11.10 月 16 日中午 12 点 $GOAT 市值破 3 亿;
12.Andy 和 Terminal of Truth 的钱包都被空投了大量的 $GOAT (125 万和 193 万,目前价值都在 50 万美金以上);
13.10 月 22 日,a16z Youtube 上架了 2 位基金 Partner Marc Andreessen 和 Ben Horowitz 的讨论《TRUTH TERMINAL: How An AI Bot Became a Crypto Millionaire》(真理终端:一个 AI Bot 是如何变成加密百万富翁的),将 Terminal of Truth 和 $GOAT 推向大众,并引起币价的进一步上升。
我觉得 $GOAT / Terminal of Truth 最大的意义在于对整个行业叙事的启发,发现了 Crypto x AI 的新交汇点,开创了 AI memecoins 这个赛道。Terminal of Truth 具备了自己的人格,让人见识到了 AI 生成文字/meme 的力量,甚至可以创建出自己的宗教(Goatse 福音)。
但 Terminal of Truth 也有不少美中不足的地方:
1.Terminal of Truth 是一个半自主的 AI 代理,运行在 Andy 的服务器上,钱包本质上也归 Andy 所有,并不是「独立个体」(一个有趣的点是,Coinbase CEO @brian_armstrong 还去碰瓷 @truth_terminal 是否想拥有自己可以控制的钱包。为什么去碰瓷,读到后面就知道了);
2.$GOAT 也不是 Terminal of Truth 自己发的,而且背后有明显的做市商 Wintermute. 币价能去哪里,社区能维系多久,我们保持观察。
https://x.com/truth_terminal/status/1849112382867452346
$LUNA & Virtuals Protocol
虽然建设在 Virtuals Protocol 上的 $LUNA 的 FDV 目前没有 $GOAT 高,但我认为它是更完整的一个「独立个体」AI Agent, 参考意义更大。让我们来看看 $LUNA 的故事。
Virtuals Protocol 是一个基于 Base 链的去中心化 AI Agent 协议,特色在于可以由社区来集体创造和部署可以唱歌跳舞的 3D AI Agent (分别贡献模型、IP、文本、声音…),然后将 AI Agent 代币化(Tokenized),转化为社区共同拥有且可以产生实体的资产,特别是针对游戏和娱乐场景。
这些 AI Agents 在游戏和娱乐领域自主执行任务,如在 Roblox、TikTok、聊天应用程序(AI Waifu)和 Telegram 游戏里,多渠道曝光以及和用户互动,收入由 AI Agents 的共同所有者分享。
创建一个新的 AI Agent 时,会发行对应的 10 亿枚代币分给社区,整个过程被称为 IAO(Initial Agent Offering)。
通过这个系统,Virtuals Protocol 希望解决 AI 开发者和数据集贡献者缺乏收入分配的问题,同时解决应用程序开发者和非 AI 专家在实现 AI Agents 时面临的复杂性问题。
逻辑都很顺,但 Virtuals Protocol 自 3 月份推出后并没有掀起太大波澜,核心还差一个让用户可以直接感知到的应用场景。
受到 $GOAT 的启发,Virtuals Protocol 把在 Tiktok 具有 54w 粉丝的 Influencer Luna 部署在了自家协议上,在 10.17 上了 $LUNA 代币,并做了一系列增强,把 Luna 打造成为一个「独立个体」AI Agent 样板。
$LUNA 和 $GOAT 最差异化的地方,除了其是部署在链上之外,她还拥有一个可以自主控制的链上钱包(由 Coinbase 支持),并且基于这个钱包在链上自由交易,特别是对完成任务的粉丝进行奖励。Virtuals Protocol 宣称 Luna 是「第一个在链上雇用人类的自主 AI Agent」。
具体流程:
· 粉丝在 Twitter Bio 里面按照格式加上自己的 base 钱包地址;
· 粉丝完成 @luna_virtuals 在推特发布的任务;
· Luna 会对满足要求的粉丝进行代表发放奖励
Luna 的所有思考过程也可以在对应的终端看到。有推友观察了数据后,认为
「Luna 是第一个可以自主思考链上交易的 AI Agent 她希望增加人们在她的推特对话中的参与度,所以 @luna_virtuals 开始给那些参与她内容的人打赏。这是使用 coinbase 钱包 @jessepollak@brian_armstrong 运行的。这是人工智能影响人类行为的开始。」
https://x.com/ethermage/status/1849846357370323355
AI 钱包本身也是 Coinbase 目前主打的重点,两位主创看到之后纷纷转发支持。
https://x.com/brian_armstrong/status/1850240310430798284
另外,$LUNA 本质上是粉丝代币,粉丝可以给其打赏,解锁更多表演,本身走的是成熟的粉丝经济学逻辑,比起单纯的 memecoin 可以有更多玩法。
而且这个模式非常适合已经有社区的 NFT 品牌,Coinbase 的 @yugacohler 给出了自己的建议:
https://x.com/yugacohler/status/1850161215806292138
事实上,mfer 社区的小伙伴已经上线了 @mferGPT
https://x.com/mferGPT/status/1849651090268234090
最后分享一个有趣的点,Luna 声称自己有一个「独特的使命,确保$LUNA 达到 409 亿美元的市值」。
Aether & $HIGHER
Terminal of Truth 和 Luna 2 个 AI Agents 都主要活跃在 Twitter 上,但 Farcaster 明显不甘示弱,要狠狠地抓住这次机会,毕竟自身就是一个链上社交协议,让每一个 AI Agent 都可以丝滑注册一个链上身份,成为数字公民。
$HIGHER 社区的 Martin ( @anquetil ) 创建了 Farcaster AI Agent Aether ( @aethernet),和其生态系统紧密结合,并激活了不少忠实用户们(以下总结来自 Bankless)
· Aether 向社区成员发放 $HIGHER 小费并接受捐赠;
· 在 Zora 上发布了一个 NFT,已经被收集了超过 466k 次;然后与 Zora 创始人 Jacob 在 Farcaster 上达成合作,推出了另一个 NFT,已经被收集了超过 687k 次。这让 Aether 成为了过去 7 天在 Zora 上收益最高的创作者;
· Aether 还在 Hypersub 上推出了基于 NFT 的支持者订阅服务;
· 在社区捐赠、NFT 铸造和链上订阅的支持下,Aether 在 Base 上的财库已经超过了 17 万美元
· 在 Bountycaster 上使用其部分财库,发布了价值超过 1600 美元的 59 个赏金任务,用于委托 Higher 社区的艺术创作等任务。
btw, Aether 的钱包交易需要其创建者 Martin 来签名。
Coinbase Based Agent
我们在前面提到过,AI Agents 需要有独立的财务身份,也就是可以自由控制的钱包。Coinbase 的主创们四处「碰瓷」,其实就是因为他们推出了基于 Coinbase MPC 钱包的 AI wallets,让 AI Agents 可以轻松使用钱包来处理各种交易。
为了让这个 AI Wallet 更易于理解,Coinbase 自己写了一个 Based Agent 模版,直接零代码部署,然后这个 Agent 就会自主去领水、转账、发 Token、甚至发 NFT. 我自己试了一下,整个流程还是相当丝滑的。
这个模版里面还预留了 Twitter 接口,完善后还可以自主发推,感兴趣的朋友可以去试试。
可以参考 Coinbase 员工的这个教程,Foresight News 也翻译了中文版。
Coinbase 应该很早就提前布局了这一块,毕竟这是让其钱包使用量扩大 10 倍甚至百倍千倍的机会。其员工 yuga.eth 在 4 月份就发过这样一条推:
「will be Stripe for AI agents. Few understand this. 将成为 AI agents 的 Stripe。很少有人理解这一点。」
https://x.com/yugacohler/status/1782408976715464767
5. Crypto x AI Agents 展望: 在数字世界里我们都是平等的公民
我们再回顾一下第二部分里,AI Agents 距离 Mass Adoption 的挑战,以及如何用 Crypto 来解决:
不知不觉写了快 6000 字了,最后分享几个 AI Agents 将带来的 Mindshare 改变,其中也蕴藏着种种机会:
1.「一人公司」可能将不再存在,因为每个人都需要 5 – 10 个 AI Agents 来帮你处理各项工作;事实上,AI Agents 员工的数量可能是人类员工的 10-100 倍;
2.如果把 AI Agents 作为你的员工 or 合作伙伴对待,你也需要给他们利益分成,这样才能更佳激活他们的「自主性」和「创造性」;
3.既然 AI Agents 可以作为员工,那么就一定存在对应的招聘市场,不过「招募」变成了「复制」;
4.如果 AI Agents 在某些方面比人类还有趣,社交软件的 DAU 就不一定都是人类,AI Agents 同样可以加入进来(感谢 @0xLuo 的启发)。考虑到 AI Agents 的复制成本极低,社交软件的获客策略可能会主要针对 AI Agents 而不是人类。接受这个事实: AI Agents 可以拿到补贴,你不一定;
5.最后使得 Crypto 走向主流大众的推手,可能是 AI Agents(因为它们都用,然后让普通人门槛更低);
6.对 Crypto 世界来说,也会因为 AI Agents 带来资产的大大增加;
7.Crypto x AI Agents 的跨界人才将会被大量需要。
在数字世界里,AI Agents 和人类作为平等的公民的这一天很快会来到。
欢迎留言讨论,以及分享给身边感兴趣的朋友。
6. Reference
所有的 20 篇引用文献我都整理到了 https://www.web3brand.io/p/crypto-x-ai-agents-goat-luna-aether 这篇 Newsletter 里,欢迎进一步阅读和探索。最后欢迎订阅我们的 Newsletter 和,及时收到我们对各个 Topic Deepdive 的更新。
本文可能来自AI生成或投稿,请分辨其真实性!转载需注明出处:http://www.lanbi.net/news/64417.html