一个浏览器插件,如何让 DeepSeek 网页版从“单轮对话界面”蜕变为“自主智能体”?本文从代码层面拆解 MCP、记忆与 Skill 三大组件协同工作的内在逻辑。

一、背景:网页版的能力缺口与社区补全

1.1 免费入口,受限体验

2026 年 4 月,深度求索发布 DeepSeek-V4 系列并全面开源,其中 deepseek-v4-pro 与 deepseek-v4-flash 均原生支持百万级 token 上下文,在智能体、世界知识和复杂推理方面达到同期领先水准。Flash 版本采用 MoE 架构,总参数量 284B、激活仅 13B,配合 DSA2 稀疏注意力,计算开销与 KV 缓存占用大幅降低。

然而,官方网页版仅保留基础对话功能,缺乏长期记忆、工具调度、技能预设和自动化运行等能力。用户每次新建会话都需重新描述自身背景,无法对接外部工具,更无法执行定时任务,模型潜力远未释放。

1.2 插件登场:DeepSeek++ 的定位

2026 年 5 月 24 日,配合 DeepSeek V4 网页版对公众开放,开发者社区推出浏览器扩展 DeepSeek++。其设计目标十分明确:在不修改官方网页任何后端代码的前提下,通过浏览器扩展的开放接口补齐缺失的智能体能力。

该扩展注入六项核心增强:

2026 年 6 月初发布的 0.5.1 版本标志着项目从单一记忆插件演进为完整的 AI 工具平台。接下来,我们将从源码角度重点剖析 MCP 工具系统、Agentic 记忆与 Skill 调度这三者的衔接方式。

二、架构全景:作为浏览器中间件的扩展

2.1 零后端依赖

DeepSeek++ 的精要之处在于全程运行在浏览器沙箱内,不部署任何后台服务。它扮演“请求-响应”路径上的中间拦截者角色,在进出浏览器的网络流量中植入工具执行逻辑,将结果无缝拼合进对话流。

2.2 源码目录轮廓

项目结构大致如下(据公开分析):

deepseek-pp/
├── src/
│   ├── content_scripts/
│   │   ├── main.ts          # 主世界:DOM 交互、/ 面板
│   │   └── isolated.ts      # 隔离世界:网络拦截
│   ├── skill-registry.ts    # 技能注册表
│   ├── memory/
│   │   └── memory-manager.ts # 记忆治理
│   ├── mcp/
│   │   └── mcp-client.ts    # MCP 客户端
│   └── automation/
│       └── cron-scheduler.ts # 定时任务调度

2.3 双世界内容脚本

扩展注入两套内容脚本,利用 Chrome 扩展的不同执行环境:

两者均在 document_start 时机注册,即 HTML 下载完毕、页面脚本运行之前插入。这种隔离设计确保即使网页被注入恶意代码,请求拦截和本地密钥存储仍处于保护之中。

三、MCP 工具系统:让模型拥有可执行“外设”

3.1 MCP 协议简释

MCP(Model Context Protocol)是 Anthropic 提出的开放标准,采用 JSON-RPC 架构与 schema 定义,将外部工具抽象为 MCP 服务器,供语言模型动态发现和调用。它统一了工具的描述、参数和调用接口,避免每个工具独立适配。

3.2 DeepSeek++ 的 MCP 实现

扩展在侧栏中提供 MCP 服务的可视化管控,支持多种传输方式:

0.5.1 版集成了 Shell MCP 和 OfficeCLI,使模型能够操作本地命令行及处理办公文档格式。同时内置 web_searchweb_fetch 工具,提升实时检索准确性。

3.3 调用流程拆解

MCP 工具调用遵循四个阶段:

  1. 工具发现:扩展启动时,通过 MCP 客户端向各 MCP 服务器请求 tools/list,获取工具 schema。
  2. 请求拦截与识别:用户消息被隔离世界截获,目标 URL 指向 https://chat.deepseek.com/api/v0/chat/completion 的请求进入处理流程。
  3. 提示增强:拦截器将工具描述注入请求体,使模型获知可用工具列表和参数格式,形成“工具感知层”。
  4. 响应拦截与执行:模型返回的 XML 格式工具调用指令被解析,扩展驱动 MCP 工具执行,并将结果作为新消息追加回对话,推动模型继续决策。

这一闭环正是 ReAct 模式(思考-行动-观察)在浏览器内的复现。

3.4 前端注入的价值

DeepSeek++ 展现了一种“前端注入”方式——在不依赖服务端改造或官方 API 开放的条件下,借由浏览器扩展为 AI 界面赋予高级功能。这降低了个人用户使用智能体工具的门槛,同时保持了数据的本地属性。

四、Agentic 记忆:跨会话的持久认知

4.1 记忆的动机

原网页版的对话缺乏持续性,每次新会话都对用户一无所知。Agentic 记忆的目标是让 AI 自动留存并理解用户信息,免去反复交代。

4.2 记忆的结构化分类

记忆系统将信息划分为四类管理:

AI 主动识别对话中的关键内容并分类存储,用户可在侧栏编辑、固定或导出这些记忆,完全掌控数据。

4.3 存储与检索

记忆数据只存于浏览器本地(LocalStorage/IndexedDB),不传送到任何外部服务器。新对话启动时,系统根据话题相关度、时效性和标记优先级,自动匹配并注入相关记忆。

4.4 记忆与 MCP 的协同效应

记忆系统与工具系统相互配合,构成了个性化智能体的基础。例如,用户曾提及“我习惯用 Rust 编写命令行工具”。当用户说“帮我写个解析日志的小工具”时:

这种“记忆提供个性化上下文,工具提供执行能力”的联动,是扩展智能化的关键。

五、Skill 调度模块:可插拔的专业模式

5.1 Skill 的概念

Skill 是一套面向场景的专家模式切换机制。用户输入 / 触发补全面板,选取某个技能后,对应 system prompt 被注入,使模型以特定专业角色工作。

扩展内置九类技能,涵盖深度推理、前端设计、幻灯片生成、算法编程、Shell 命令、网页搜索、办公文档处理、翻译和代码审查等场景。

5.2 技能实现

技能注册表 skill-registry.ts 维护所有技能定义。调用流程:

Skill 可与记忆联动,例如“前端设计”技能结合记忆中的“偏爱 Material Design”,自动产出贴合用户审美的界面代码。同时,用户能在侧栏自行编写新技能,也可从社区导入他人分享的技能包。

5.3 执行示例

/shell ls 为例,完整链路:

  1. 捕获输入,匹配 shell 技能;
  2. 隔离世界拦截 API 请求;
  3. /shell ls 转为带系统提示词的完整 prompt,指导模型生成工具调用指令;
  4. MCP 通过 stdio bridge 执行本地 ls 命令;
  5. 结果回传,模型整理后呈现给用户。

整个过程对用户而言仅为一次输入,背后完成了识别、匹配、拦截、增强、推理、调用、回传七步。

六、三模块协同:一个完整的自动化场景

6.1 场景示例:每日生成行业简报

假设用户希望每日 9 点自动收到 AI 生成的行业资讯摘要。

6.2 协同机制

各模块分工明确:

四者叠加,构成观察、思考、行动的完整智能体循环。

七、同类方案对比

维度 DeepSeek++ Claude Code Codex
运行环境 浏览器扩展 桌面客户端 云端服务
基础模型 DeepSeek-V4 Claude GPT 系列
工具调用 标准化 MCP 原生工具 函数调用
记忆系统 跨会话 Agentic 记忆 会话内记忆 有限记忆
自动化 Cron 定时任务 有限支持 风格化编排
部署方式 浏览器本地 需安装客户端 API 集成
成本 依赖网页版免费 订阅制 按用量计费

DeepSeek++ 的独特优势在于零门槛部署和“前端注入”思路。安装仅需加载解压后的扩展目录,无需构建后端服务。这种模式让用户侧的 AI 能力增强不再强依赖官方接口开放,同时所有记忆和密钥存储于本地,符合数据最小化原则。此外,通过集成 MCP 标准,它还能吸附不断丰富的第三方工具生态。

八、安全考量

8.1 积极设计

8.2 潜在风险

8.3 安全建议

九、上手与接入

9.1 安装与启用

下载扩展包解压后,在 Chrome 的 chrome://extensions/ 页面开启开发者模式,加载 dist/chrome-mv3/ 目录即可。打开 DeepSeek 网页版,侧边栏图标即出现。

9.2 推荐配置顺序

  1. 在 Memory 面板中手动添加或让 AI 自动提炼个人偏好。
  2. 输入 / 浏览内置技能,尝试激活一两个。
  3. 若有本地工具需求,在 MCP 面板添加 stdio 类型服务。
  4. 设置一个简单定时任务,体会无人值守自动化。

9.3 通过 4SAPI 接入 DeepSeek V4 Pro

除通过网页版增强外,如果开发者希望在自身服务中直接调用 DeepSeek V4 Pro 的推理能力,可以借助 4SAPI 平台。4SAPI 封装了模型鉴权、速率控制和参数配置,提供标准的对话补全接口。用户只需在 4SAPI 控制台创建凭证,选择 deepseek-v4-pro 模型,按照 API 文档发送请求即可获得回复。这种方式便于集成到持续集成流水线、自动报告生成等需要高并发或后台调用的场景,与前端扩展形成互补。

9.4 自定义 Skill

在 Skills 面板可编写新技能,本质是定义一套 system prompt 与可选工具清单。例如:

{
  "name": "code-reviewer",
  "description": "代码审查专家",
  "systemPrompt": "你是一位资深代码审查者,请指出潜在问题并给出改进建议…",
  "tools": ["file_read"],
  "triggers": ["/review"]
}

保存后即可通过 /review 激活。

十、总结与演进方向

10.1 核心结论

DeepSeek++ 重新定义了网页版 AI 的使用形态。MCP 工具系统扩展了执行边界,Agentic 记忆保存了个性化认知,Skill 调度提供了多模态的角色切换,三者耦合形成“记忆+思考+行动”的自动化智能体基座。缺失任何一环,用户获得的只能是单次问答;三者协同,才能让对话界面进化为持续服务于个人工作流的数字助理。

10.2 对开发者的启示

这种基于浏览器扩展的增强策略,为在官方能力暂时受限时快速验证产品想法提供了范本。它无需等待后端 API 迭代,以较低工程成本实现“对话即操作”的体验,同时天然支持数据本地化。

10.3 未来趋势

如果你日常依赖 DeepSeek 网页版,将 DeepSeek++ 纳入工作流能够明显拓展其能力边界。对技术探索者而言,该扩展的源码也是一份深入理解浏览器智能体架构的样本。