Manus在GAIA基准测性能超越Open AI的同层次大模型
Manus 在 GAIA 基准测试中取得了 SOTA(State-of-the-Art)的成绩,显示其性能超越 Open AI 的同层次大模型。换句话说,它能够独立完成复杂任务,例如跨国商业谈判,这其中涉及到合同条款分解、策略预判、方案生成,甚至还能协调法务和财务团队。与传统系统相比,Manus 的优势在于其动态目标拆解能力、跨模态推理能力以及记忆增强学习能力。它能将大型任务分解成数百个可执行子任务,同时处理多种类型的数据,并利用强化学习不断提升自身决策效率,降低错误率。
惊叹科技发展之快之余,Manus 也再次引发了圈内对 AI 演化路径的分歧:未来究竟是 AGI 一统天下,还是 MAS 协同主导?
这要从 Manus 的设计理念说起,它暗含两种可能性:
一种是 AGI 路径。通过持续提升单体智能水平,使其逼近人类综合决策能力。
还有一种是 MAS 路径。作为超级协调者,指挥数千个垂直领域 Agent 协同作战。
表面上,我们在讨论不同的路径分歧,实际上我们讨论的是 AI 发展的底层矛盾:效率与安全应该如何平衡?当单体智能越接近 AGI,其决策黑箱化风险越高;而多 Agent 协同虽能分散风险,却可能因通信延迟错失关键决策窗口。
Manus 的进化,无形中放大了 AI 发展的固有风险。比如数据隐私黑洞:在医疗场景中,Manus 需要实时访问患者基因组数据;金融谈判时,可能触及企业未公开财报信息;比如算法偏见陷阱,在**谈判中,Manus 对特定族裔候选人给出低于平均水平的薪资建议;法律合同审核时,对新兴行业条款的误判率将近一半。再比如对抗攻击漏洞,黑客通过植入特定语音频率,使 Manus 在谈判中误判对手报价区间。
我们不得不面对 AI 系统的一个可怕的痛点:越智能的系统,攻击面也越广。
然而,安全是一直在 web3 中被不断提到的词汇,在 V 神的不可能三角(区块链网络无法同时实现安全性、去中心化和可扩展性)框架下也衍生出了多种加密方式:
零信任安全模型(Zero Trust Security Model): 零信任安全模型的核心理念是「不信任任何人,总是进行验证」,即无论设备是否位于内部网络,都不应被默认信任。该模型强调对每个访问请求进行严格的身份验证和授权,以确保系统安全。
去中心化身份(Decentralized Identity,DID): DID 是一套标识符标准,使实体能够在无需集中式注册表的情况下,以可验证和持久的方式获得识别。这实现了一种新的去中心化数字身份模式,常与自我**身份相提并论,是 Web3 的重要组成部分。
全同态加密(Fully Homomorphic Encryption,FHE) 是一种先进的加密技术,允许在不解密数据的情况下,对加密数据执行任意计算。这意味着,第三方可以对密文进行操作,得到的结果在解密后与对明文进行相同操作的结果一致。这一特性对于需要在不暴露原始数据的情况下进行计算的场景,如云计算和数据外包,具有重要意义。
零信任安全模型和 DID 在多轮牛市中都有一定数量的项目进行攻坚,他们或有所成,或淹没在加密浪潮中,而作为最年轻的加密方式:全同态加密(Fully Homomorphic Encryption,FHE)也是解决 AI 时代安全问题的大杀器。全同态加密(FHE)是一种允许在加密数据上进行计算的技术。
如何解决?
首先,数据层面。用户输入的所有信息(包括生物特征、语音语调)在加密状态下被处理,连 Manus 自身也无法解密原始数据。举个例子,在医疗诊断案例中,患者基因组数据全程以密文形式参与分析,避免生物信息泄露。
算法层面。通过 FHE 实现的「加密模型训练」,连开发者都无法窥探 AI 的决策路径。
在协同层面。多个 Agent 通信采用门限加密,单个节点被攻破不会导致全局数据泄露。即使是在供应链攻防演练中,攻击者渗透多个 Agent 后,也无法获取完整业务视图。
而由于技术限制,web3 安全可能与大部分用户并没有直接联系,但却有着千丝万缕的间接利益相关,在这片黑暗森林里,若不尽力武装,将永无逃脱「韭菜」身份之日。
uPort 于 2017 年在以太坊主网上发布,可能是最早在主网上发布的去中心化身份(DID)项目。
而在零信任安全模型方面, NKN 于 2019 年发布了其主网。
Mind Network 则是**主网上线的 FHE 项目,并率先通过了与 ZAMA,Google,DeepSeek 等合作。
uPort 和 NKN 已经是小编从未听闻的项目,似乎安全项目真的不被投机者们所关注,Mind network 是否能逃离这个诅咒,成为安全领域的龙头,让我们拭目以待。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。