此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM。本文为原创作者|Stone Jin微信公众号|ipozaozhidao据消息,智谱深夜开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。AutoGLM的开源将大幅降低AI手机的技术门槛,推动AI手机生态从封闭走向开放共创。同时,项目支持本地与云端部署,确保数据与隐私控制权始终掌握在使用者手中。

值得注意的是,智谱开源的是一整套可以「拿来就用」的能力,具体包括:训练好的核心模型;Phone Use能力框架与工具链;可直接跑通的Demo,覆盖50+高频中文App;针对Android的适配层与示例工程;文档、快速上手指南。
在智谱看来,Agent的爆发,需要所有人一起参与。其更乐见的是:有团队基于AutoGLM,做出真正意义上的AI原生手机;有研究者把其中的某个模块拆出来,变成一篇论文、一套新算法;有个人开发者把一个Demo改成自己的项目,在某个小众场景里真正跑起来。
当然,AutoGLM会以这样的产品形态出现,源于智谱对AGI早期形态的理解。智谱认为,从Agent到AGI,还需要满足3A原则:Around - the - clock(全时):24小时运行,即使用户离线,Agent依然在执行任务;Autonomy without interference(自主零干扰):独立运行,不占用用户屏幕与算力,平行世界的搭子;Affinity(全域连接):跳出浏览器对话框,跨越手机、电脑、手表、眼镜、家电等设备,操作物理世界。
接下来,AutoGLM团队会继续努力,一起推动Agent开源和研究,那个梦想中的“贾维斯”,才会真的在人人身边出现。
风险提示:文章涉及的观点和判断仅代表投稿人的看法,基于市场环境的不确定性和多变性,所涉观点和判断后续可能发生调整或变化。本文仅用于沟通交流之目的,不构成任何投资建议。投资有风险,入市须谨慎。
