changwu 发表于 2025-3-6 23:35:54

我手里的人工智能ETF(512930)昨天涨了4%,不过我感觉跟manus无关。人工智能是正在召开的今年两会的重要议题,昨天全国人大新闻发布会上也有些支持AI的具体政策措施出台,这才是支持AI股票上涨的基本面。

fengzz1899 发表于 2025-3-6 23:37:27

Manus在GAIA基准测试的数据可信性存在显著争议,其技术实现与测试方法的关键信息未充分披露,引发业内多方质疑。结合技术架构、测试透明度及用户反馈分析如下:   一、技术实现层面的可信性漏洞 1. 架构缝合质疑      Manus宣称的"全流程任务处理"架构被开发者指出与Anthropic的Constitutional AI存在高度相似性^1^2。GitHub泄露代码显示,其任务规划模块直接调用Operator框架的Workflow Engine,类似"用特斯拉电机组装国产新能源车却宣称电池技术领先"^1。这种技术组装模式难以支撑其宣称的"性能超越OpenAI"。2. 中文场景数据魔术      技术社区逆向分析发现,Manus在中文财务报告解析、政策解读等任务中,实质是调用深度优化的DeepSeek模型进行二次包装^1。这种"进口发动机刷国产漆"的操作,使得其在特定场景测试表现异常突出,但未披露模型适配的边界条件。   二、测试方法透明度缺陷 1. 选择性披露测试特征      官方虽宣称GAIA测试准确率达91.2%,但刻意回避关键信息:    - 未说明是否包含需动态验证的35%网络数据源问题^1    - 未公布测试使用的工具链(如是否预置特定API密钥)^2    - 对多模态任务(如图像解析)的处理流程语焉不详^32. 与真实场景的性能落差      用户实测显示,Manus处理企业级任务(如股票分析报告生成)时:    - 80%内容直接抓取券商研报模板^1    - 平均耗时长达90分钟,远超宣传的"实时响应"^1    - 金融数据分析依赖单一数据源,缺乏交叉验证机制^3   三、测试环境与商业闭环矛盾 1. 虚拟机环境真实性存疑      Manus展示的"自主执行"能力,实质是通过预设工作流调用雅虎金融API等工具链完成,其虚拟机环境被指与Anthropic的Computer Use方案雷同^2^3。这种"技术演示"与Operator等已落地200+企业案例的系统存在本质差异^1。2. 生态闭环验证缺失      对比LeetTools等开源框架的技术透明度:    - Manus未开放核心模块扩展接口^2    - 缺乏动态架构演进能力(如Claude 3的72小时持续学习)^1    - 测试结果无法通过第三方工具链复现^3   四、行业对比视角的可信度评估 从AI Agent技术发展维度看,Manus的测试数据存在三大硬伤:

拼多多葛红军 发表于 2025-3-6 23:44:58

壮哉我大华科!!!!!!!!!!!!!!!!!

academic818 发表于 2025-3-7 08:42:03

从目前自媒体宣传的功能来看,原始创新确实谈不上,但应该是从应用角度一款不错的产品,它主要解决了deepseek不是多模态,有些结果输出需要+其他应用配合的问题,这款应用可以直接调用其他app的api接口生成结果,简化了操作步骤,如果输出效果不打折扣,对使用者来说体验应该不错[灵光一闪]

Andy8888 发表于 2025-3-7 08:53:09

本帖最后由 Andy8888 于 2025-3-7 08:55 编辑

基于目前的各种介绍情况,很看好其后续广阔的市场应用前景…

胖妞 发表于 2025-3-7 09:21:04

相当于一个代理集成平台,把其他AI通过接口链接给用户使用,方便用户在一个平台中能使用多个ai的功能

董老师 发表于 2025-3-7 09:33:20

deepseek成了背景板

Andy8888 发表于 2025-3-7 10:17:13

"从Manus目前的表现来看,它具有与DeepSeek竞争的潜力。DeepSeek的成功,源自于其强大的大模型能力,而Manus的亮点则在于它不仅能提供答案,还能自动完成任务,并输出最终成果。Manus采用了多代理架构,通过并行计算和工具调用,大大提升了任务执行效率,这一特点使得它在实际应用中展现出了超强的竞争力。而且,Manus在执行过程中会自动学习并优化自己的工作流程,逐步适应用户的需求,成为一个真正可以长期依赖的AI伙伴。

多名业内专家向《通信产业报》全媒体表示,要超越DeepSeek,Manus还面临一些挑战。DeepSeek之所以能够迅速成为行业的领导者,是因为其底层模型的强大和创新,而Manus虽然在执行力上具有优势,但仍然依赖于多个大模型的整合,这使得它在技术上并不完全独立。

也有观点认为,Manus的GAIA测试优势可能源于针对性优化,其通用性仍需长期验证,DeepSeek的开源生态与Manus的闭源服务可能形成“技术普惠vs商业壁垒”的行业张力。

尽管如此,Manus的出现无疑为AI领域带来了巨大的震动。部分业内人士预测,凭借其超强的执行力和灵活的适应性,Manus将成为未来AI Agent的重要代表。随着技术的不断迭代和市场需求的不断变化,Manus的潜力将会更加凸显,成为AI技术发展中不可忽视的一股力量。

在业内看来,Manus成功展示了一个全新的AI Agent形态。它不仅打破了传统AI助手的局限,更为未来的工作流带来了全新的思考方式和解决方案。虽然Manus距离成为像DeepSeek那样的行业领袖还需要时间,但它的崛起无疑为AI行业带来了新的希望和方向。"

云中白鹤 发表于 2025-3-7 10:19:50

这下AI国内全面爆发了,很好的前景。就是有点担心以后工作都被AI做了,人力在各行业的优势越来越少了

Andy8888 发表于 2025-3-9 08:38:24

本帖最后由 Andy8888 于 2025-3-9 09:27 编辑

Manus 官方账号恢复:

Andy8888 发表于 2025-3-9 08:47:06

“【新智元导读】Manus居然成功火到国外了,内销转出口了?今天开始,在X和Reddit上的外国网友中,Manus的讨论声量开始变大了!拿到邀请码的歪果网友实测后赞叹:Manus太好用了。而各种开源复现项目也如雨后春笋一般冒出,人气持续爆棚。

非常意外的,Manus本尊和它的开源复现在国外开始火了!

首先,越来越多的外国网友开始注意到了Manus,并且大赞它是「全球首个类似AGI的全自主AI智能体」,已经快要摘下人工智能的圣杯AGI了。”

ctim 发表于 2025-3-9 09:06:11

Andy8888 发表于 2025-3-9 08:47
“【新智元导读】Manus居然成功火到国外了,内销转出口了?今天开始,在X和Reddit上的外国网友中,Manus的 ...

新智元没有任何可信度的,在外网Manus就没有讨论度。

Andy8888 发表于 2025-3-9 09:20:38

ctim 发表于 2025-3-9 09:06
新智元没有任何可信度的,在外网Manus就没有讨论度。

https://m.toutiao.com/is/KBqDVZAMBwg/ Manus
新智元的文章通常都是比较专业、翔实的。

Andy8888 发表于 2025-3-9 09:23:40

“ Manus有了中文版网页3月8日一早记者刷新Manus官网时发现其已从纯英文版改为中文版并支持包括英、德、意、法、葡在内的多国语言Manus官网有了中文版。 有评论指出,Manus官网以中文版呈现,是对近日全球关注中国团队再次点燃人工智能行情的关键回应。值得注意的是,Manus官网明确了这款产品的中文定义:Manus,源自拉丁语中“手”的意思,是一款能够将你的想法转化为行动的通用型AI助手。官网信息指出,Manus能将想法转化为行动:不止于思考,更注重成果。它擅长处理工作与生活中的各类任务,在你安心休息的同时,一切都能妥善完成。3月6日凌晨,国产大模型团队ManusAI宣布推出全球首款通用型AI智能体产品Manus,在全球范围内引发广泛关注。新闻多一点3月8日上午,ManusAI在海外社交平台“X”的官方账号已经复原。“我们回归了,提醒下,这是我们唯一官方账号,接下来我们会继续分享炫酷的用例,敬请期待。”“解冻”后,ManusAI官方账号发布的第一条消息说。Manus首席科学家和联合创始人季逸超也在第一时间公布了这一消息,并重申:“Manus从未参与任何加密货币项目、代币发行、区块链首发等。任何有相近名称的虚拟货币,其声称与我们有关的提法都是虚假的。”

Andy8888 发表于 2025-3-9 09:24:30

“ 3月7日,ManusAI官方账号被冻结。有消息指出,这或许是因为有人假借Manus的名义实施虚拟货币诈骗。“初步观察,冻结可能与第三方提到的虚拟货币指控相关——而这一领域完全不被我们所涉及。”季逸超说,针对恶意行为,Manus将使用法律手段维护自身合法权益。“人红是非多。”一位不愿具名的人工智能业内人士指出,诈骗团体盯上Manus,侧面证明Manus受关注程度高,这对企业的发展来说不见得是坏事,但是要有完善的应急预案,把负面影响降至最低。该人士同时指出,账号被冻结后迅速解冻,也说明Manus涉及虚拟货币诈骗的投诉不符合事实,“X”平台的做法从某种程度上是对Manus的背书,有利于企业把精力集中到研发上,尽快让更多人用上Manus,展示更多能力。”

雁塔晨钟 发表于 2025-3-9 09:29:32

AI智能体和devin类似,只是应用层面的,所欲在欧美激不起什么讨论,找了rowan cheung做推广,才有一点讨论,但是没有任何大佬关注

Andy8888 发表于 2025-3-9 09:36:18

本帖最后由 Andy8888 于 2025-3-9 09:57 编辑

任何基础研究、理论创新最终目的就是要落地到应用层面才能发挥作用、产出成果,真正造福社会和大众。否则就如同镜中花、水中月,有啥用?应用层面很重要。

ctim 发表于 2025-3-9 09:47:10

Andy8888 发表于 2025-3-9 09:20
https://m.toutiao.com/is/KBqDVZAMBwg/ Manus
新智元的文章通常都是比较专业、翔实的。 ...

这就是胡扯了。新智元、机器之心、量子位都是臭名远扬的营销号,对外行来说看起来专业而已。

fengzz1899 发表于 2025-3-9 09:47:59

看到了3位真实测试过的评论,第一位执行10个案例满意的一个,第二位也是直播演示的,评论是对专业人员是鸡肋,对非专业人士有点帮助,第三位评论是流畅很酷,结果很拉胯,出的内容比较水。

fengzz1899 发表于 2025-3-9 09:48:48

写错是流程不是流畅

fengzz1899 发表于 2025-3-9 09:54:43

网上太多营销号了,现在很多业内人士出来说话,以及实测过的人员直播演示以及实际测试的视频结果出来了,反馈基本是工程创新,像周宏伟的评价是和deepseek差了好几个数量级.傅盛测试后的的评价是偏负面的,他认为虽然有些工程创新,但在技术创新的跨度并不大,过度的营销会透支行业的信任,

fengzz1899 发表于 2025-3-9 09:57:12

傅盛对Manus的评价总体上是较为负面的。他认为Manus虽然展示了一些创新功能,但在技术实现上存在局限性,与真正的通用AI还有距离。 具体评价如下: 技术实现路径:傅盛指出,Manus是通过工程代码实现的智能体,而非基于底层技术突破。他强调,真正的通用AI需要更深入的技术创新,而不仅仅是现有技术的组合。 产品体验:在试用过程中,傅盛遇到了访问受阻和任务失败的问题,这表明Manus在产品体验上还有待优化。他认为Manus的功能虽然有创新,但技术创新的跨度并不大。 市场炒作:傅盛批评了Manus的市场炒作现象,指出过度营销可能会透支行业信任。他呼吁行业要更加脚踏实地,注重技术创新。 总的来说,傅盛对Manus的评价主要集中在其技术实现的局限性和市场炒作的担忧上。

Andy8888 发表于 2025-3-9 09:59:34

ctim 发表于 2025-3-9 09:47
这就是胡扯了。新智元、机器之心、量子位都是臭名远扬的营销号,对外行来说看起来专业而已。 ...
你能写出这三个公众号那样专业、翔实的文章吗?把你的专业大作拿出来让大家拜读、品评下?无知无畏…

ctim 发表于 2025-3-9 10:20:00

Andy8888 发表于 2025-3-9 09:59
你能写出这三个公众号那样专业、翔实的文章吗?把你的专业大作拿出来让大家拜读、品评下?无知无畏… ...

能觉得这三震惊体营销号的文章专业详实就说明你压根不懂计算机了,你知道这三公众号文章都可以买的么?

myworld 发表于 2025-3-9 12:12:46

乔布斯做苹果靠的不就是系统集成、用户体验吗

myworld 发表于 2025-3-9 12:15:59

东西确实是真东西、好东西,社会大众需求的东西。再给manus团队3~6个月时间,

fengzz1899 发表于 2025-3-9 19:33:06

myworld 发表于 2025-3-9 12:15
东西确实是真东西、好东西,社会大众需求的东西。再给manus团队3~6个月时间, ...

manus最大的作用是增加ai的易用性,但是营销做的过头了,一开始就说又是一个国运级的产品,比deepseek这些通用大模型更智能,还有什么令硅谷震动,非常令人反感,但是这个易用性方向肯定是对的

myworld 发表于 2025-3-9 19:36:09

那话是媒体说的

shitaitai 发表于 2025-3-10 10:59:15

只可惜快一周了还是没有邀请码,不能用的AI不知怎么评价

大义钟馗 发表于 2025-3-10 11:53:09

shitaitai 发表于 2025-3-10 10:59
只可惜快一周了还是没有邀请码,不能用的AI不知怎么评价

现在正关门修改打磨,中间不排除再进行内部测试。
页: 1 [2]
查看完整版本: 中国AI产品Manus一夜刷屏!或成DeepSeek 后最大惊喜?