性趣🔞直播麦迪：甜瓜应该拿年度最佳新秀由于他带队进入了季后赛

2025-07-22 07:35:32 泉源：王多军

字号：默认大超大 | 打印 |

性趣🔞直播

性趣🔞直播

性趣🔞直播?王诗龄整体算是中等身材，不胖不瘦，衣服有点像家居服，非常舒适，穿着坐飞机刚合适，松弛感十足。她的审美和16岁的年纪不沾边，个人品位还是偏老气了一些。麦迪：甜瓜应该拿年度最佳新秀由于他带队进入了季后赛

人生就是博·(中国区)官方网站

性趣🔞直播?王莆中认为，外卖模式确实存在利薄的特点，每一单的利润额仅仅一元多点儿，这使得外卖网络上的商户、骑手、平台、用户这四方，需要找到一个巧妙的平衡点，大家才能互相满意。因此，“这种商业模式不能用太理想化或者太简单粗暴的方式来干”。王恩记者毕鹏摄

性趣🔞直播?面向AI代理的上下文工程：构建 Manus 的经验教训 2025 年 7 月 18 日季逸超在Manus 项目伊始，我和团队面临一个关键抉择：是使用开源基础模型训练一个端到端的代理模型，还是基于前沿模型的上下文学习能力构建代理？回想我在自然语言处理领域的最初十年，我们没有这样的选择余地。在BERT 的远古时代（是的，已经七年了），模型必须经过微调并评估后才能迁移到新任务。即使当时的模型远小于如今的 LLMs，这一过程每次迭代往往也需数周。对于快速发展的应用，尤其是产品市场匹配前期，这样缓慢的反馈周期是致命的。这是我上一家创业公司的惨痛教训，当时我从零开始训练模型用于开放信息抽取和语义搜索。随后 GPT-3 和 Flan-T5 的出现，让我自研的模型一夜之间变得无关紧要。讽刺的是，正是这些模型开启了上下文学习的新纪元——也为我们开辟了一条全新的前进道路。这个来之不易的教训让选择变得清晰：Manus 将押注于上下文工程。这使我们能够在数小时内发布改进，而不是数周，同时保持我们的产品与底层模型正交：如果模型进步是涨潮，我们希望 Manus 是船，而不是固定在海床上的柱子。然而，上下文工程远非简单。这是一门实验科学——我们已经重建了四次代理框架，每次都是在发现了更好的上下文塑造方法之后。我们亲切地称这种手动的架构搜索、提示调整和经验猜测过程为“随机梯度下降”。它不优雅，但有效。这篇文章分享了我们通过自己的“SGD”达到的局部最优解。如果你正在构建自己的 AI 代理，希望这些原则能帮助你更快收敛。围绕KV缓存设计如果只能选择一个指标，我认为KV 缓存命中率是生产阶段 AI 代理最重要的指标。它直接影响延迟和成本。要理解原因，我们先看看典型代理的工作方式：在接收到用户输入后，代理通过一系列工具调用来完成任务。在每次迭代中，模型根据当前上下文从预定义的动作空间中选择一个动作。然后在环境中执行该动作（例如Manus 的虚拟机沙箱），以产生观察结果。动作和观察结果被追加到上下文中，形成下一次迭代的输入。这个循环持续进行，直到任务完成。正如你所想象的，上下文随着每一步增长，而输出——通常是结构化的函数调用——则相对较短。这使得预填充与解码之间的比例在代理中远远偏高，区别于聊天机器人。例如，在 Manus 中，平均输入与输出的Token比约为100:1。幸运的是，具有相同前缀的上下文可以利用KV 缓存，这大大减少了首次生成标记时间（TTFT）和推理成本——无论你是使用自托管模型还是调用推理 API。这里的节省可不是小数目：以 Claude Sonnet 为例，缓存的输入标记费用为 0.30 美元/千标记，而未缓存的则为 3 美元/千标记——相差 10 倍。从上下文工程的角度来看，提高KV 缓存命中率涉及几个关键做法：保持提示前缀稳定。由于LLMs 的自回归特性，即使是单个标记的差异也会使该标记及其之后的缓存失效。一个常见错误是在系统提示开头包含时间戳——尤其是精确到秒的时间戳。虽然这样可以让模型告诉你当前时间，但也会大幅降低缓存命中率。使你的上下文仅追加。避免修改之前的操作或观察。确保你的序列化是确定性的。许多编程语言和库在序列化JSON 对象时不保证键的顺序稳定，这可能会悄无声息地破坏缓存。在需要时明确标记缓存断点。一些模型提供商或推理框架不支持自动增量前缀缓存，而是需要在上下文中手动插入缓存断点。设置这些断点时，应考虑缓存可能过期的情况，至少确保断点包含系统提示的结尾部分。此外，如果你使用像vLLM 这样的框架自托管模型，确保启用了前缀/提示缓存，并且使用会话 ID 等技术在分布式工作节点间一致地路由请求。遮蔽，而非移除随着你的智能体功能不断增强，其动作空间自然变得更加复杂——简单来说，就是工具数量激增。最近 MCP 的流行更是火上浇油。如果允许用户自定义工具，相信我：总会有人将数百个神秘工具接入你精心策划的动作空间。结果，模型更可能选择错误的动作或走低效路径。简而言之，你的重装智能体反而变得更笨。一种自然的反应是设计动态动作空间——或许使用类似 RAG 的方式按需加载工具。我们在 Manus 中也尝试过。但实验表明一个明确的规则：除非绝对必要，避免在迭代过程中动态添加或移除工具。主要有两个原因： 1. 在大多数LLMs 中，工具定义在序列化后通常位于上下文的前部，通常在系统提示之前或之后。因此，任何更改都会使所有后续操作和观察的 KV 缓存失效。 2. 当之前的操作和观察仍然引用当前上下文中不再定义的工具时，模型会感到困惑。如果没有受限解码，这通常会导致模式违规或幻觉操作。为了解决这一问题，同时提升动作选择的效果，Manus 使用了一个上下文感知的状态机来管理工具的可用性。它不是移除工具，而是在解码过程中屏蔽Token的对数概率，以根据当前上下文防止（或强制）选择某些动作。在实际操作中，大多数模型提供商和推理框架都支持某种形式的响应预填充，这使你可以在不修改工具定义的情况下限制动作空间。函数调用通常有三种模式（我们以NousResearch 的 Hermes 格式为例）：自动——模型可以选择是否调用函数。通过仅预填回复前缀实现：<|im_start|>assistant 必需——模型必须调用一个函数，但选择不受限制。通过预填充到工具调用标记实现：<|im_start|>assistant 指定——模型必须从特定子集中调用函数。通过预填充到函数名开头实现：<|im_start|>assistant {"name": “browser_ 利用此方法，我们通过直接屏蔽标记的对数概率来限制动作选择。例如，当用户提供新输入时，Manus 必须立即回复，而不是执行动作。我们还特意设计了具有一致前缀的动作名称——例如，所有与浏览器相关的工具都以 browser_开头，命令行工具以 shell_开头。这使我们能够轻松确保代理在特定状态下仅从某一组工具中选择，而无需使用有状态的对数概率处理器。这些设计有助于确保Manus 代理循环保持稳定——即使在模型驱动架构下也是如此。将文件系统用作上下文现代前沿的LLMs 现在提供 128K Token或更多的上下文窗口。但在现实世界的智能代理场景中，这通常不够，有时甚至成为负担。有三个常见的痛点： 1. 观察内容可能非常庞大，尤其是当代理与网页或PDF 等非结构化数据交互时。很容易超出上下文限制。 2. 即使窗口技术上支持，模型性能在超过某个上下文长度后往往会下降。 3. 长输入代价高昂，即使使用前缀缓存也是如此。你仍然需要为传输和预填充每个标记付费。为了解决这个问题，许多智能体系统实施了上下文截断或压缩策略。但过度压缩不可避免地导致信息丢失。问题是根本性的：智能体本质上必须基于所有先前状态来预测下一步动作——而你无法可靠地预测哪条观察在十步之后可能变得关键。从逻辑角度看，任何不可逆的压缩都存在风险。这就是为什么我们将文件系统视为Manus 中的终极上下文：大小无限，天生持久，并且可以由智能体自身直接操作。模型学会按需写入和读取文件——不仅将文件系统用作存储，更作为结构化的外部记忆。我们的压缩策略始终设计为可恢复的。例如，只要保留网址，网页内容就可以从上下文中删除；只要沙盒中仍有文档路径，文档内容也可以省略。这使得 Manus 能够缩短上下文长度而不永久丢失信息。在开发此功能时，我不禁想象，状态空间模型（SSM）要在具代理性的环境中有效工作需要什么条件。与 Transformer 不同，SSM 缺乏完全的注意力机制，难以处理长距离的向后依赖。但如果它们能掌握基于文件的记忆——将长期状态外部化而非保存在上下文中——那么它们的速度和效率可能会开启新一代代理。具代理性的 SSM 或许才是神经图灵机的真正继任者。通过背诵操控注意力如果你使用过Manus，可能会注意到一个有趣的现象：在处理复杂任务时，它倾向于创建一个 todo.md 文件，并随着任务的推进逐步更新，勾选已完成的事项。这不仅仅是可爱的行为——这是一种有意操控注意力的机制。 Manus 中的一个典型任务平均需要大约 50 次工具调用。这是一个较长的循环——由于 Manus 依赖 LLMs 进行决策，因此在长上下文或复杂任务中，容易偏离主题或忘记之前的目标。通过不断重写待办事项清单，Manus 将其目标反复写入上下文末尾。这将全局计划推入模型的近期注意力范围，避免了“中途丢失”问题，减少了目标不一致的情况。实际上，它利用自然语言来引导自身关注任务目标——无需特殊的架构改动。保留错误信息智能体会犯错。这不是漏洞——这是现实。语言模型会产生幻觉，环境会返回错误，外部工具会出现异常，意外的边缘情况时常发生。在多步骤任务中，失败不是例外；它是循环的一部分。然而，一个常见的冲动是隐藏这些错误：清理痕迹，重试操作，或重置模型状态，寄希望于神奇的“温度”参数。这看起来更安全、更可控。但这付出了代价：抹去失败就抹去了证据。没有证据，模型就无法适应。根据我们的经验，改善智能体行为的最有效方法之一看似简单：在上下文中保留错误的路径。当模型看到失败的操作及其产生的观察结果或堆栈跟踪时，它会隐式地更新内部信念。这会使其先验偏离类似的操作，从而减少重复同样错误的可能性。事实上，我们认为错误恢复是衡量真正智能体行为的最明确指标之一。然而，在大多数学术研究和公开基准测试中，这一指标仍然被忽视，这些研究和测试通常侧重于理想条件下的任务成功率。避免被少量示例限制少量示例提示是提升LLM 输出的常用技巧。但在智能体系统中，它可能以微妙的方式适得其反。语言模型擅长模仿；它们会复制上下文中的行为模式。如果你的上下文充满了类似的过去动作-观察对，模型往往会遵循这种模式，即使这已不再是最优选择。在涉及重复决策或操作的任务中，这可能会带来危险。例如，在使用Manus 帮助审查一批 20 份简历时，代理经常陷入一种节奏——仅仅因为上下文中出现了类似内容，就重复执行相似的操作。这会导致偏离、过度泛化，甚至有时产生幻觉。解决方法是增加多样性。Manus 在动作和观察中引入少量结构化的变化——不同的序列化模板、替代表达、顺序或格式上的细微噪声。这种受控的随机性有助于打破模式，调整模型的注意力。换句话说，不要让少量示例把自己限制在固定模式中。上下文越统一，代理就越脆弱。结论上下文工程仍是一门新兴科学——但对于代理系统来说，它已经至关重要。模型可能变得更强大、更快速、更廉价，但再强的原始能力也无法替代记忆、环境和反馈的需求。你如何塑造上下文，最终决定了代理的行为：运行速度、恢复能力以及扩展范围。在Manus，我们通过反复重写、走过死胡同以及在数百万用户中的实际测试，学到了这些经验。我们在这里分享的内容并非普遍真理，但这些是对我们有效的模式。如果它们能帮助你避免哪怕一次痛苦的迭代，那么这篇文章就达到了它的目的。智能代理的未来将由一个个情境逐步构建。精心设计每一个情境。

性趣🔞直播?明明去年参加大选期间声称，他一旦再次入主白宫，就要将“爱泼斯坦案”相关文件公之于众，达成普瑞斯卡法官所希望达成的目标，可如今怎么又呼吁美国人别关心这起案件了？

人生就是博·(中国区)官方网站

性趣🔞直播?考虑到第一部《罗小黑战记》票房仅为3.15亿，而且还经历了去年的风波，影片依然能被猫淘一致看好总票房能达到4.5亿左右，影片续集无疑取得了成功。霍春名记者杨孝良摄

人生就是博·(中国区)官方网站

性趣🔞直播?该文书显示，早在2024年12月，宗继昌、宗婕莉、宗继盛三人就已经向香港高院申请针对宗馥莉的临时禁令，以阻止她处置、处理或减少在汇丰银行以建昊企业有限公司名义开立账户的资产价值。栾志亮记者杨润利摄

性趣🔞直播?通过与济娜的交易成为首位"寒门钻石六人组"成员的惠仁，权力带来的快感逐渐盖过罪恶感，名牌与升学特权彻底改变了她。

人生就是博·(中国区)官方网站

性趣🔞直播?阮文孝今年还不满50岁，长期在胡志明市任职，2022年6月晋升胡志明市委副书记，2023年5月出任芹苴市委书记，成为省级政区党委书记，2025年1月刚刚调回中央，三个月后即黯然辞职。阮文孝被指在芹苴市委书记任内严重违纪，在他被处分前后，芹苴市委多名领导干部同遭问责。李增凯记者苏春林摄

人生就是博·(中国区)官方网站

性趣🔞直播?宗庆后的海外布局早于上世纪90年代。1992年，娃哈哈向内部职工募资2.36亿元组建杭州娃哈哈美食城并计划上市之际，宗庆后却在加州注册Wahaha (USA) Group Corp，亲自担任总裁。这家公司无实际业务，更像为申请绿卡量身定制的"壳公司"——1996年，宗庆后妻女获得美国社会福利号99年全家获批绿卡，2005年长女宗馥莉更换发美国护照。买云涛记者周贤洪摄

性趣🔞直播?不过，有不少网友质疑FX Super One外观设计抄袭了长城魏牌MPV车型高山，甚至有网友发现在Super One的介绍页面出现了“高山9”字样。目前，FF官网已删除“高山9”字样。

人生就是博·(中国区)官方网站

性趣🔞直播?这条在建铁路不仅为经济发展带来希望，更为当地居民提供了就业机会和成长平台。近日,在铁路建设配套的阿尔及利亚首个现代化智能轨枕厂内，在30余名中阿员工的共同见证下，26岁的当地青年德贝卡·穆罕默德郑重地从轨枕厂项目经理手中接过一顶管理人员佩戴的蓝色安全帽。伴随着热烈的掌声，这个从普通工人转变为管理骨干的小伙子眼眶微微发红。陈峰记者卢新建摄

性趣🔞直播?有消息称，最新成立的专班将协调国资、宗馥莉与非婚生子女三方利益，核查1999年股改协议中未收取的国有股权转让款，并可能启动重新评估程序。国资方已向国家知识产权局提出异议，要求终止商标转让。针对18亿美元离岸信托，专班正联合税务、外汇管理部门调查资金流向，评估是否存在偷逃税款或违规转移资产行为。

性趣🔞直播?王祉怡同安洗莹在此前总共交手过16次，16场比赛王祉怡仅仅取得了4场胜利。双方上次交手是在上个月的印尼公开赛决赛，当时王祉怡激战3局遭到了对手逆转。

性趣🔞直播?在7月18日举行的2025上半年北京市工业和信息软件业经济运行新闻发布会上，北京市经信局数字产业处副处长张金瑞对该行动方案进行了解读。

性趣🔞直播?6月5日，宝山村双子成交，中建壹品以27.78亿元摘得0016地块，规划建面5万平米，楼面价5.5万元/平米，溢价率1.8%；金隅地产以33.64亿元拿下0017地块，规划建面6万平米，楼面价5.6万元，溢价率1.5%。

性趣🔞直播?“大家都以为我们小朋友英语好，作文也好，其实不是这样的，我们（这些都）不要求。可能10年后，这些对他有用，至于有多大用，我们不在乎，也不关心。”李瑞解释，“我不需要赋予这场旅行有多大的意义，我们就想带小朋友去看看这个世界的美好。”

性趣🔞直播?报道说，鸟击事件发生时，这架战机正在进行特技飞行表演。事情发生后，这架战机离开航展，前往附近的圣哈维尔空军基地。西班牙空军维修部队的专家小组已前往该基地评估飞机受损情况。

性趣🔞直播?飞行区航务管理部导航运行部导航技术室巡查员李远望戴好安全帽、绑好保险带，对装备检查完毕后，熟练地爬上15米高的下滑天线，对下滑台天线电缆、室外密封件进行检查及加固，确保设备正常运行。

人生就是博·(中国区)官方网站

性趣🔞直播?每个客户都需要在临时设置的工作区登记确认信息，然后去售楼处取号等待谈价，现场工作人员抱着一沓号码贴纸，会发给再次确认过信息的客户，另有人负责大声叫号。傅春华记者姜翠平摄

性趣🔞直播?她讲的不止是自己的故事，那是千千万万个“她”的故事：被命运捆绑，被规训成“听话的女人”，被家暴却不能离，被伤害还要被骂“作”。

人生就是博·(中国区)官方网站

性趣🔞直播?7月2日，极目新闻报道了山东27岁女子认识河北男子13天闪婚，4个月后突遭车祸去世。今日，新闻当事人丈夫王康平告诉极目新闻记者，这两天他看到网上有许多阴谋论，指责他骗保。事实是妻子根本就没有购买保险，而且他是在知道妻子患癌的情况下，仍决定领证结婚。叶辉记者高双林摄

性趣🔞直播?岛内军事专家告诉谭主，去年开始“汉光”实兵演习就标榜“无剧本、不间断”演练，生怕被贴上“演戏”的标签。但今年一系列脱离实际、匪夷所思的桥段，还是让岛内网友坐不住了，纷纷发帖留言嘲讽。比如，因下大雨就将户外训练改成在室内让媒体摆拍，遭批“烂成这样”；刻意通过网络直播坦克炮射击，“作秀意味十足”；士兵搭地铁“支援作战”，瞬间引爆网络：“拍电影？”“战争时地铁还有办法开吗？”“天马行空也要有个限度吧！”；公路上布满“防御工事”，被吐槽“难道不能从旁边的草坪绕道吗？”……一顿操作下来，台军“演习如演戏”的帽子是摘不掉了。

性趣🔞直播?AI生态蓬勃发展，离不开算力资源高效盘活。作为国际级人工智能新型科研机构，上海AI实验室采取有组织的科研范式，发挥原创算法及AI软硬件深度互联技术优势，在全国算力互联互通探索中抢先布局、不断突破。

性趣🔞直播?即便是当下接近实时性能的最快系统，通常也只能分块生成视频，这会引入不可避免的延迟，从而无法满足交互式使用的需求。，更多推荐：小米影视

【我要推荐】更多推荐：桃花视频

扫一扫在手机翻开目今页

人生就是博(中国区)官方网站

性趣🔞直播 麦迪：甜瓜应该拿年度最佳新秀 由于他带队进入了季后赛

性趣🔞直播麦迪：甜瓜应该拿年度最佳新秀由于他带队进入了季后赛