被爆炒的“AI智能体”Manus:有体验者称性能强但不稳定
··
国内最新AI(人工智能)智能体产品在走红的同时也备受质疑。
3月5日晚间,成立于2023年的中国AI初创公司Butterfly Effect(蝴蝶效应)发布AI Agent(智能体)Manus的早期预览版,将其称为“全球首款通用智能体产品”。从介绍来看,使用者只需要给Manus一个简单的指令,它就能自动完成复杂的任务。Manus的出现推动A股相关概念在6日大涨。
目前,Manus只放出了官网和介绍视频,若想体验Manus就需要获得内测邀请码。介绍视频中展示了Manus执行三个任务的过程,分别是筛选简历、挑选房产和分析股票。从介绍来看,使用者只需要给Manus一个简单的指令,它就能自动完成复杂的任务。
“挺强的,但还是不够稳定。”一位Manus的体验者告诉澎湃新闻记者。
因强大自主性而走红,质疑声随之而来
Manus将自己定义为“通用智能体”。从团队提供的案例来看,似乎用户只需给出一个指令,它就能自动完成复杂的任务。例如,用户可以要求Manus为自己提供日本的旅游攻略,配上对旅程的细节要求和对攻略最终表现形式的要求,Manus就会像专业的旅行社员工一样搜集资料并整理好反馈给用户。
北京邮电大学智能交互设计专业副教授谭剑向澎湃新闻记者表示,结合目前已有的官方资料和测试直播来看,Manus能够接收自然语言指令,融合语言、图像、语音等多种模态数据,贯穿浏览器、云平台、个人终端等数字平台,精准捕捉用户的深层需求,独立完成任务。这种从“思考”到“行动”的闭环能力,展示了其强大的自主性。
谭剑指出,另一边,Manus存在的缺陷也很明显,“不是任何任务都听得懂干得了”,“尽管Manus展示了强大的自主执行能力,但在复杂任务或未知环境中,也会出现宕机的状态,原因在于其推理链路的缺失或知识的不完备。可以预知,还有大量的特殊性任务需要进一步优化和训练。”
其实,自从发布以来,Manus受到了不少质疑。有网友指出,Manus只放出了一个英文的官方网站和英文的宣传片,看起来更像是个出海产品,但在海外社交平台上的讨论度并不高,而Manus在国内也没有社群和服务方面的支持。也有海外研究者在社交平台上发文称,Manus是一款好产品,但并非是技术突破。
而在3月7日午间,一个在X平台名为@ManusAI_HQ账号显示被冻结,该账号冻结前并未获得任何认证,仅发布了数条有关Manus的视频和文字介绍,但Manus官网的X平台链接均指向于此。7日下午,疑似为Manus联合创始人兼首席科学家季逸超的X平台账号(@peakji)发布声明称:“我们的官方X帐户昨天意外被冻结。我们正积极与X团队合作解决此事。初步观察表明,此次冻结可能与第三方提及加密货币诈骗有关。澄清一下:Manus 从未参与过加密货币项目、代币发行或区块链计划,任何声称与我们有关联的类似名称的加密货币企业都是具有欺诈性的。”
此外,由于邀请码机制,只有极少数开发者能够实际体验到产品,又与Manus在国内社交媒体上的“火爆”形成了鲜明对比。6日当天,有网友关注到Manus的邀请码在二手电商平台一度被炒至数万元之高,不过成交量为零。到了3月7日,在二手电商平台已经看不到高价的Manus邀请码,而是出现了许多的代申请服务。
3月6日,Manus的合伙人张涛在微信朋友圈发文回应称“完全低估了大家的热情”,公司“从未开设任何付费获取邀请码的渠道”,并且“从未投入任何市场推广预算”,内测期间系统容量有限,将优先保障现有用户的核心体验,并逐步有序释放邀请。
多位国内AI从业者对记者表示,自己和身边的朋友都没能够获得邀请码,无以一睹该产品的“真面目”。有相关研究者表示,Manus的宣传可能有些过热,在这种情况下,大众对产品产生质疑也很正常。
与国内社交平台和网络热烈讨论形成鲜明对比的是,目前海外讨论声音并不算多,或许是因为多数人并未能上手体验。
猎豹移动董事长兼CEO傅盛6日在“傅盛讲AI”的视频号中也提到,从目前公开的资料来看,Manus的功能“确实很像钢铁侠里的贾维斯(AI系统)了,但是具体能力很难评估,因为这个受基座模型的影响也很大,但目前相关信息并没有公开。套了好几家的壳是一定的,就不知道都套了哪些。”
3月7日,全球最大代码托管平台GitHub上还开始出现Manus的开源复刻项目。例如,一个名为OpenManus的项目打出了“无需邀请码即可实现任何想法”的旗号,在不到一天的时间内,该项目的Star量(星标)已经超过了四千。开发者只需创建环境,克隆项目并修改相应信息,即可在本地搭建一个近似于Manus的AI智能体。
体验者评价:性能强但不稳定
“挺强的,但还是不够稳定。”一位Manus的体验者告诉澎湃新闻记者,他让Manus设计了一份跨度长达半年的多国旅行攻略,单靠人力需要花费十几天才能完成的工作,Manus几十分钟就搞定了,而且这份攻略“全到令我震惊,比之前的大模型输出的路线规划明显更合理”。
不过,他也指出,“速度很关键,如果是普通的任务,用户可能没耐心等待几十分钟”。同时,在处理更为复杂的任务时,也会因算力不足的原因出现报错和任务中断的情况。
澎湃新闻记者在观察其他体验者使用的过程中也发现,Manus目前在处理任务时等待时间都较长,同时也需要进行一些人为干预,来纠正例如对自然语言指令理解出现偏差的情况。
对于大家都“催”着Manus尽快开放,多名AI业内人士对记者表示,Manus选择内测的形式可能是因为“太贵”、“太烧算力”。
至于agent的使用价格,外媒近日曝出了OpenAI对AI agent的收费计划,“博士”级别的agent每月收费可能高达2万美元,主要面向希望补充软件工程师或医学研究人员的用户,尤其是愿意为大规模自动化支付高价的企业客户;可用于软件开发的agent每月收费1万美元;面向“高收入知识工作者”的agent每月收费2000美元。
前述业内人士对记者表示,如果agent确实效果好且有实际需求,付费模式应该不成问题,但考虑到较高的价格,可能给用户提供几次试用机会会更具可行性。
谭剑表示,虽然2025年被广泛视为AI智能体规模化落地的关键年份,但在处理复杂任务、理解上下文和人机交互等方面,智能体仍需进一步提升:“不过,我看好AI智能体的未来。可以设想,结合了AI智能体的机器人将具有自然语言沟通、团队协作和复杂流程自动化作业的能力,这是非常有前景的生产力发展方向。”(澎湃新闻)


