新闻快讯云顶集团平台网新利体育网址址社会新闻大众网

发布时间：2025-03-19 | 点击率：

　　（鉴于Manus引起的炒作争议，36氪特别申明，本文绝非投放，实际上，我们连要到邀请码都颇费了一番周折……）

　　应该无需赘述Manus的引起的轰动了：大家已经在各种视频切片中，看到Manus勤勤恳恳地搜资料、做PPT、开发网页小游戏。回放形式的分享设计，让人一眼就能感受到Agent带来的直观效率提升，这也让Manus经历一场迅速破圈。

　　在辗转拿到邀请码后，36氪编辑部讨论了一下，为了更好地了解Manus的特性和功能，我们决定请Manus来当实习生，按照正常的工作流给ta分配任务，看看Manus能否胜任。

　　先说第一观感，如果你要请这位“实习生”，可能第一个需要接受的现实状况就是：这是位容易宕机的同学。

　　Manus如今的服务非常不稳定。36氪在周末实测时，第一感觉就是：让人崩溃……任务频繁遇到停滞，因为Manus在云上的虚拟机跑，经常需要手动重置，才能继续跑。

　　测试的界面，总是停留在“连接已断开”、“遇到严重问题”，需要不断重置/开启新会话…

　　偶尔出现的幻觉（不确定是幻觉还是官方通知）也很真实。Manus前一句还在说需要两小时升级维护，你再敲敲它，它就马上又开始干活了……

　　Manus号称是“第一款通用型Agents（智能体）”，这意味着它不走垂直专家路线，优势在于更通用能力的任务。Manus的官网就列出了多个分类：

　　Agents（智能体）不同于大模型，如果说大模型只有一个对话窗口，实现信息输入-输出。那么Agents就相当于让大模型有了行动能力，可以灵活调用各类工具完成任务。

　　36氪决定先从我们编辑部的日常使用场景出发，以从易到难的程度排列，请Manus都跑一遍。

　　请注意，以下场景均为一次性输出的结果，除了任务中途崩溃重置计算机之外，36氪没有做任何的重复测试。

　　36氪将此前的一份访谈录音原文（约2.8万字）交由Manus进行整理，核心要求是对录音速记“逐字逐句整理，不要压缩”，去除相应的口癖、对语义不清的部分进行校对。

　　在以前的操作中，起码要来回和模型交互十多次：将录音速记中的错误进行人工校对——再分段扔到模型中——输出完毕后，还需要重新投喂给模型进行校对，看是否有事实错误。

　　但Manus很明显将以往的多个步骤压缩到一个步骤，这种下达任务之后等待验收的感觉，比和ChatBot交互体验，完全是十倍以上的体验提升。

　　但Manus的缺陷也是明显的：上下文太短，幻觉依然有。很多复杂任务还没有完成，就因为Token消耗太多而中止了任务。

　　在校对润色这一任务中，最终输出的文档长度大大压缩，基本只输出了访谈的最后一部分，总共3800多字，前面的部分基本丢失。但从已输出整理的部分来看，语气、信息完整性还是算不错。

　　这大概率是因为推理和协作机制做得还不够好，模型只能提供一次性输出的结果，导致压缩；也有可能是Memory机制还未能做得很好——Memory可以看作是模型暂时存储信息的仓库，比如聊天机器人会记住你之前说过的话。

　　早前一些研究工作指出，memory会随着时间或任务步骤的增加而消退。而Agent所消耗的Token，比起单ChatBot起码是两个数量级的提升——一位Agent从业者对36氪估计，Manus的一个复杂任务的Token消耗估计会有百万Token级别。Memory的分层管理、压缩等技术难点，还有很多提升空间。

　　对一般的ChatBot来说，输出长度都是一个老大难——36氪之前的测试体验中，如果是一个128K的模型，一般而言单次输出长度都在1000-2000字左右，才能保证信息完整性，不被大量压缩。

　　36氪先让Manus完成最基本的新闻跟进工作。这包含几项能力：日常的新闻监控——看是否会筛选靠谱的信息源，再进行重要性分析判断，以及找相应的资料，加以补充和跟进。

　　Manus开始进行学习范例-搜索相关新闻等等，但是在访问路透社时被验证码挡住了，请求人类接管。36氪接管后，发现Manus已经被认证为机器，被屏蔽了。

　　Manus约花费9分钟完成这个任务，输出5条最值得关注的AI新闻，新闻源都是靠谱权威的。最后，Manus最后选择了写有关自己的新闻……哈哈。

　　Manus的新闻文本输出已经算是70分水平，文字通顺，主要信息点都能覆盖，但和参考的范本不同，现在的文本偏软，AI味较重。

　　难度往上，我们也在Manus也输入了一段 prompt，让Manus帮忙直接以36氪的深度报道栏目“深氪”为例，生成一篇长文：

　　这周“稚晖君”创立的智元机器人预告要发新品。“稚晖君”原名彭志辉，请你搜索彭志辉以及智元机器人的历史过程，用36氪的风格去写作一篇文章，主题为回溯智元机器人的历史，以及反映这家公司的成长，在科技行业中的意义，长度为5000字左右，可参考深度报道“深氪”栏目的风格。请注意，语句需要深入浅出，普通人都能看懂，不要堆砌专业术语。

　　Manus自动进行了资料收集，写作阶段直接进行分段写作，再合并，顺利地完成了长文写作，输出结果：

　　在输出的文章中，Manus在深度写作上效果一般，更偏资料型整理。但遣词造句也算合格，但是风格还是偏软文。在高质量内容方面，Manus的品味还有待加强。

　　从性质上来讲，Manus采用了多智能体架构。简单来说，就是可将复杂任务拆解为子任务（如数据清洗、特征工程、模型训练），通过不同的智能体，分工并行处理，显著提升数据分析效率。

　　OpenAI旗下的Deep Research则是单智能体，端到端训练的模式——仅一个中心化智能体负责所有任务，决策与执行集中化。但好处在于模块集成度高，易于管理，输出质量比较有保证。

　　Manus花费的时间较长，约三个小时，生成了一个可以交互的网页。互动性和表格样式都相当不错。不过数据详实程度，和专门做研究的Deep Research仍有差距，但问题不大

　　Deep Research暂时还无法输出图表，但从输出的内容质量来看，是现在的Manus还没法赶上的。

　　第一个任务是模仿行业大V“影视飓风”Tim老师的风格，做一期有关Manus相关的视频，长度在5分钟左右。

　　Manus用了约45分钟完成了这一任务，全程丝滑，依旧是兢兢业业拆任务，先上油管学习影视飓风的视频，再搜集资料写脚本。

　　我们请教了视频组的老师，评价是：实习生水平，优点在于把工作流说明白了，分镜和镜头调度可以直接用作参考，但内容还不能直接用。

　　第二点是，视频脚本过于亢奋，全场充斥着“炸裂”“颠覆”之感，对人类的感情理解比较表面，有点难绷。

　　第二部分：Manus的核心能力（1:10-2:20） [场景：主持人夸张地在电脑前挣扎，被各种文件和任务包围] 主持人：（夸张的疲惫表情，抓狂状）我们都经历过这样的时刻——需要整理大量数据、撰写报告、分析市场趋势...这些工作可能要花费我们几小时，甚至几天！而且还很容易出错！ [特效：时钟快速旋转，日历页快速翻动] 主持人：（突然振作，眼睛发亮）但有了Manus，这一切都将改变！它就像给你复制了一个数字版的自己，但更聪明、更高效！ [分屏效果：四个窗口同时展示Manus的不同能力，每个窗口都有动态效果] 主持人：（指向第一个窗口）Manus的第一大核心能力：自主完成复杂任务！ [窗口放大，展示Manus自动撰写报告的加速过程，从收集资料到成品输出] 主持人：（解说，语速适中）你只需要告诉它你需要什么，然后...（打响指，配合音效）它会自己规划、搜索信息、整理数据、撰写内容，最终交付一份完整的成果！就像有了一个永不疲倦的助手！ [特效：第二个窗口放大，伴随着转场音效] 主持人：（热情洋溢）第二大核心能力：多领域通用能力！无论是金融分析、教育内容创作、旅行规划，还是代码开发，Manus都能胜任！ [快速剪辑展示Manus处理不同领域任务的画面，每个场景都有对应的图标和文字标签] 主持人：（夸张的惊讶表情，手势丰富）这就像同时拥有了一个金融分析师、一个内容创作者、一个旅行顾问和一个程序员！而且，它们都是24小时待命的！不需要休息，新利体育注册不会喊累！ [特效：第三个窗口放大，伴随着科技感音效] 主持人：（神秘语气，稍微降低音量）第三大核心能力：多模型协作机制！这个有点专业，但非常酷！ [动画展示多个AI模型协同工作的概念图，类似于团队协作的可视化] 主持人：（解说，配合手势）Manus不是依靠单一大模型，而是采用多重签名机制，由多个独立AI模型共同驱动！就像一个高效的团队，每个成员负责不同的任务，相互配合，确保结果的可靠性和准确性！

　　36氪还让Manus试着做了一个偏分析型的创意工作——对我们的微信公众号版式和设计分析后，进行改进。

　　为了更明确设计需求，我们也给Manus提供了一份设计案例，以及我们认为风格突出、审美优秀的数个公众号，作为参考。

　　Manus依旧很快就对任务进行拆解，虽然最后任务没有正式完成，但还是输出了一套完整的方案给我们。

　　除了我们建议的步骤（分析好版式的共性、联网搜索比较优秀的公众号设计实践，提出建议），Manus还自己规划了更多步骤，也做了更细致的分类，包括分析36氪公众号，分为设计元素、板式布局、视觉资产、配色方案等等。

　　不过从结果可以看出，Manus在审美这件事上……并不擅长。就配色来说，Manus给出了一个放之四海而皆准的方案，分为春夏秋冬四个季节，配色饱和度过高，审美可以说约等于没有。

　　在Manus学习排版、设计相关知识时，打开了不少知乎网页。但Manus很难绕过登陆限制，然后就会转战到其他公开网页。更不必提如同独立王国一样的各大App——比如微信公众号内的数据，爬虫工具也很难完全触及。

　　可能这需要期待以后模型间的接口进一步打通，包括端侧Agent跨平台等能力的进展，才能让Agent输出质量有质的提升。

　　最后，我们试着让Manus使用高推理模式，生成一个Jellycat主题的吃豆人游戏，Manus花费约45分钟时间完成。

　　可以看到，代码和游戏开始界面都已经相当完整，但最后到了“开始游戏”这一环节，音效都能听到，但无法点击开始游戏。而后，对话因为上下文过长，停止响应了。

　　在测试过程中，36氪最大的感触在于，前端交互非常丝滑，有一种简洁的美感——从进入Manus官网到实际对话，Manus都在营造一种“对面真的是个活人”的感觉。

　　尤其是在对话窗口旁边，可以打开一个名为“Manus的电脑”的小窗口，实时显示Manus正在操作什么，真的像远程看着一位实习生同学，帮你完成任务。

　　你可以随时拖动进度条，查看Manus正在进行的任务。对已经完成的步骤，Manus都会提供类似网页快照的界面，让你对任务进展有明显感知。

　　另一个体验优秀的地方在于，Manus对工具的调用成功率算是比较高的。在不遭遇崩溃、宕机的情况下，如果测试10个任务，大概能有8个自动完成任务，无需人类介入。

　　这能大大提升用户体验——在以前，很多agent调用外部工具的成功率都在60%以下，体验不佳，难以吸引到更多的用户。

　　市场普遍认为，Manus团队对各类通用任务都先置入了不少CoA（代理链）模版，覆盖众多通用任务（写作、数据分析、攻略等开放式问题）等等，这些工作显著提高了任务成功率。

　　这种机制，类似在DeepSeek对话中不断蹦出来的思维链，用户可以看到，Manus是怎么样一个接一个调用外部工具的。

　　36氪多次发现，Manus在任务进行过程中会遭遇错误。但Manus会尝试不同的解决方案，直至没法解决，才会向人类报错，让人类介入到问题解决中。

　　在“Manus的电脑”窗口右下角，有一个“接管”按钮。一旦任务进行得不对，人类可以直接打断进程，自己进入到这部“云上电脑”进行操作。

　　不过可能是计算资源不够，36氪在操作Manus的电脑时，卡顿严重，只能勉强进行操作。

　　这样的形式天然更符合人类工作的交互形式——只要使用一次，模型尽可能地自行纠错，减少人类参与的次数。

　　总结一句话：分析总结、数据分析、开放性问题等需要强逻辑性的任务，是Manus最擅长的部分。最不擅长的是创意工作，审美基本等于没有。

　　不过，受限于现在的服务稳定性和上下文窗口，Manus完成任务的逻辑和过程很好，但交付质量只能说在中等水平，包括数据、文本等，都需要人类进行二次校对。但从完成任务的时间和质量来说，已经算是很不错的同学。

　　无论是对文本、图像、视频等相关内容，Manus调用大模型只能模仿到内容的框架，就像一层皮——但内容质量还是需要人类强把关。

　　从周末的争议中再次回看Manus，36氪频繁想起的，是2009年的电影《阿凡达》上映之时。当时的阿凡达，是特效电影的集大成者，一个最重要的意义在于，让全球观众都见识到：顶尖的电影工业水平是这样的。

　　如今的Manus，尽管还处于比较粗糙的形态。但至少在产品层面，和年初爆火的DeepSeek有一个共通点：用技术平权的手段，将AI产品迅速拉到大众面前，而不是停留在小圈子中狂欢。

　　Manus集成了现在编程开发能力最强的Claude，并且受到许多最新技术成果如CodeAct的启发。比起OpenAI Operator或者Devin高达数百美金的定价，Manus的成本价大约在2美元左右。

　　而且，Manus通用任务的体验已经足够丝滑，这让普罗大众都能感受到：“AI居然还能这么玩”，以及真正感受到AI对人类带来的巨大效用。

　　时事1：真人娱乐国际顶尖六大线日,美国阿肯色州前州长哈钦森退出总统竞选,青鳞鹰振奋无比，用力拍打铁翅，令这里飞沙走石，很快它又从远处寻来恶魔猿的那条手臂，同样是太古遗种，蕴藏稀世真血。,im体育入口登录。

　　只有来自云天宫的人还能平静，因为他们没有任何损失，老人领着两个漂亮的小姑娘，眯缝起了眼睛，没有多说什么。两个小姑娘眨动大眼，看向石村，非常想说话，但是却被他制止了。

　　时事2：金沙在线日,“歪果仁”打卡“黑颈鹤之乡”青海隆宝滩国际重要湿地,

　　京东白条逾期了怎么办要尽快处理,九游会是干嘛的,mg游戏送体验金,伟德游戏直营网。

　　03月09日,透过数据看“暖意”：多措并举促经济、惠民生、暖民心,“是的，你是至尊，天生的至尊，小不点你一定要好起来啊！”小女孩哭道。,升博官网登录,亚游娱乐382223,英皇娱乐在哪玩。时事3：欧宝登陆

　　成长了，这便是我们在母校最大的收获。几年来，同学们之间结下了最纯真的友谊。有过争吵，有过欢笑，更有推心置腹的彻夜卧谈。过去，几乎每个人都说：“这时间过得好慢啊，怎么还不毕业啊？”那是因为我们总觉得毕业还遥遥无期；但是今日我们又说：没想到这么快就要走了……此刻，多了一丝伤感，那是因为我们方才明白了，“毕业”这两个字的分量和沉重。其实这一天终究会来的，只是我们欠缺了一点准备。几年间，我们有过收获的喜悦，也有失落的痛苦，但每个人在前进的道路上难免都会留下或多或少的遗憾。而这样的遗憾和思考，正是我们开始新的人生旅程的不懈动力和力量源泉。天下没有不散的宴席，在这各奔东西的别离时刻，我们不必悲伤，因为今日我们告别了一段纯真的青春记忆，一段年少轻狂的岁月，一个充满幻想的时代。今日的离别，正是为了明天更好的团聚。暂时的离别并不意味着结束，而恰好是我们寻找新的驿站，开始我们精彩人生的新起点。

　　,爱游戏网页版官方入口,环亚体检官网首页,188体育体育平台。03月09日,联合国秘书长：152名联合国工作人员在加沙丧生，但救援未停,共实施拆迁改造项目个，拆迁占地面积万平方米，拆迁建筑面积万平方米。开工建设经济适用住房万平方米;新开工建设住宅小区个，开工建筑面积万平方米。加强了住房登记及二级市场交易管理，办理初始登记件，发证面积万平方米;抵押登记件，登记面积万平方米;转移登记件，面积万平方米;现房抵押件，登记面积万平方米，受理了市区家房地产开发企业的业务。强化了住房公积金的归集使用管理，归集公积金万元，发放公积金贷款万元。开展了房地产市场规范整顿，对家房地产开发企业，家物业管理企业，家房地产评估机构进行了资质年检和市场检查，房地产市场秩序进一步好转。严格商品房预售管理，共办理预售许可证件，预售面积万平方米。加强了物业管理，提请市政府下发了《关于进一步加强物业管理工作的通知》，对进一步加强物业管理工作，充分发挥市、区政府有关部门、街道办事处、社区委员会的职能作用提出具体要求。下发了《关于进一步加强房地产开发管理的通知》，加强前期物业管理工作，进一步完善维修基金制度，累计归集万元。积极开展物业管理示范小区创建，有两家住宅小区分别被自治区评为示范小区、优秀小区。,威尼斯AG,贝博在哪里玩,AOA体育官方。

　　时事4：BOB线日,“港澳成果+南沙转化+湾区应用”协同创新链正在形成改革扎实落地,

　　坚持县城、重点镇、小集镇良性互动，不断加大投入，完善城镇功能。去年以来，城镇建设累计投入资金3?84亿元，是历年来最多的一年。其中，城区投入资金1?23亿元，完成了滨河路、大桥路、西环路、政府街、汉城路整修、扩通等10项重点工程。白河新区建设进展顺利，已具雏形;以金府街为标志的老城区改造开始启动，城市功能不断完善。拆迁工作扎实推进，全年城区拆迁面积达2?3万平方米，补偿金额达1907万元，是历史以来效果最好的一年。村镇建设步伐加快，去年共完成了7个乡镇的规划修编;累计投入小城镇建设资金9500万元，基础设施得到配套完善;新甸铺、歪子、沙堰、王庄4乡镇进入全市50强镇，初步形成了以县城为中心，以重点镇为支撑，以建制镇为骨架，布局科学、功能完善、特色鲜明、协调发展的城镇体系。

　　03月09日,（国际观察）法国政局难以企稳新总理仍需直面议会“煎熬”,

　　今天xx月xx日是全国第xx个“119消防日”，今年“119消防日”宣传活动的主题是“人人参与消防，共享平安生活”。提到消防，同学们自然会想到令人毛骨悚然的火灾二字。是的，火，带给人们光明，赋予人们温暖。但是火也吞噬了无数生命，留下了累累伤痕。我们不会忘记，XX年11月24日凌晨，俄罗斯莫斯科人民友谊大学学生宿舍发生火灾，近200名学生受伤，41名学生死亡，其中，中国留学生受伤46人，死亡11人。这场大火用血淋淋的数字和惨痛的代价，给我们敲响了安全防范的警钟，警醒我们火灾是威胁日常学习、生活安全的重要因素。身处人员密集的校园的我们，应在脑海中长期鸣响“119”警铃，提高防火意识和技能。希望大家能做到“三懂”、“三会”。“三懂”即懂得火灾的危险性，增强消防意识；懂得火灾形成的原理，不玩火；懂得火灾预防，积极开展消防宣传。“三会”即学会火灾报警方法，学会使用灭火器扑救小火，学会火灾自护自救的方法。要时刻牢记消防安全，学习消防知识，消除火灾隐患，防微杜渐，防范未然。

　　,亚博在哪里玩,ope体育APP官网,贝博体育下载appapp下载。【音乐为文旅行业“加戏” 江西多地“点燃”旅游消费新活力】

上一篇：历练中成长挫折中前行（新利体育网址竞技观察）
下一篇：新利体育别错过F1赛事门票可以解锁这些消费优惠