|
发表于 2025-3-6 23:25:09
来自手机
|
显示全部楼层
Manus是Monica团队开发的一款AI Agent产品,自发布以来备受关注。以下从不同方面对它进行评价: • 创新性与优势: ◦ 任务执行自主性高: Manus能将用户需求自动拆解,在虚拟环境中调用各类工具,比如编写执行代码、浏览网页、操作网页应用等 ,实现从思考、规划到执行复杂任务的全流程自主完成,给用户带来类似“真人干活”的直观感受。例如在制作PPT时,只需简单提示,它就能自主收集信息并生成PPT。 ◦ 多模型多智能体协作:它整合调用了多个模型和智能体协同工作,在工具组合应用方面有创新。不仅能处理文字、编程等传统任务,还能生成声音、提供详细的歌曲创作指南和视频制作文档,涉及市场调研、文件处理、旅行规划等多种场景都能给出结果 ,甚至在自身无法直接处理任务时也能为专业人士提供详细指导建议。 ◦ 交互模式有价值:采用的UI交互范式符合交互设计原理,展示AI打开浏览器刷网页等操作过程,让用户有掌控感并能实时介入,这种交互变化有助于AI完成仅靠后端调用、解析难以完成的任务 。 ◦ 基准测试成绩突出:在权威的GAIA基准测试中取得SOTA的成绩,大幅超过OpenAI,这表明其在解决现实世界问题的能力在测试中表现优秀。 • 当前存在的不足: ◦ 速度较慢:处理每个案例往往需要等待十几分钟,面对复杂任务耗时更久,还可能出现错误,影响使用效率和体验。 ◦ 存在功能限制:执行特定问题时,会卡在原地,推测是无法完成针对某些网站的浏览任务,这限制了其在一些场景下的应用。 ◦ 使用门槛较高:处于内测阶段,需要邀请码才能使用 ,且有每日最大配额限制,导致很多人无法体验,阻碍了产品的快速推广和广泛应用。 • 技术争议: ◦ 被质疑技术缺乏突破:有开发者质疑Manus可能是海外技术的“本土化套壳”,其核心架构与Anthropic的“ComputerUse”高度相似,“自主规划”能力基于现有大语言模型(如GPT - 4)调用,未展示底层技术突破 ,本质是工具链的拼接。 ◦ 宣传存在夸大嫌疑:自媒体宣传时将其关联到“国家科技实力象征”等,表述过于夸张,且测评大多基于官方案例,引发质疑。此外,产品发布用英文,但海外AI社区关注度低,邀请码机制也被质疑是“饥饿营销”。 总体而言,Manus在多模型整合调用、任务自动化执行和UI交互设计上有亮点,为智能工具应用提供了实践参考 ,但其技术是否具有真正的创新性和领先性还需进一步观察。随着后续的优化和完善,如果能解决当前存在的速度、功能和使用门槛等问题,或许能在AI市场中占据一席之地。 |
|