字节开源的 DeerFlow:搭建你自己的 AI 打工人

前言

你有没有这样的幻想:

  • 丢给它一个课题,让它自己去搜索、阅读、整理、写报告
  • 给一份 PPT 需求,它自动做出一份像模像样的幻灯片
  • 让它分析一组数据,生成可视化看板
  • 甚至让它自己写代码、跑代码、调试代码,完整处理一个复杂工程任务
你也许会想到 ChatGPT 或者 Claude,但它们本质上还是"一问一答"的助手。要让 AI 像员工一样自主执行长任务——有独立工作区、会用工具、会调用其他 AI 子代理、跨会话记住你的偏好——你需要的是一个Agent 框架

今天要介绍的 DeerFlow(小鹿流),就是这样一个框架。它是字节跳动在 2026 年初开源的 SuperAgent Harness(超级代理外壳),目前在 GitHub 上已经拥有 61.7k Stars,并在 2026 年 2 月登上 Trending 榜首。

这是一篇从零到跑起来的完整部署 + 使用教程。


一、DeerFlow 是什么?

用一句话总结:它是一个能让大语言模型长时间独立工作的"外壳"

传统的 LLM 对话是这样的——你问一句,它回一句,上下文一满就得重开。DeerFlow 解决的是另一类问题:

我给 AI 一个"研究 2026 年全球半导体格局并输出 50 页报告"的任务,它能:
1. 自己拆分成 20 个子任务
2. 为每个子任务派生一个子代理(subagent),并行执行
3. 各自拥有独立文件系统、独立上下文窗口
4. 调用网页搜索、下载文档、阅读内容、写代码、生成图表
5. 完成后汇总、写出最终报告
6. 跨会话记住你的偏好(比如"你喜欢 Markdown 格式的表格")

这就是 SuperAgent 框架的价值。


二、核心特性

1. 多代理编排

  • 主代理可以动态派生子代理
  • 每个子代理有独立上下文、工具、终止条件
  • 子代理可以并行执行,显著缩短总耗时

2. 沙箱执行环境

每个任务有独立文件系统:
  • uploads/ — 上传的输入文件
  • workspace/ — 工作目录
  • output/ — 最终产物
所有 bash 命令、文件操作都在沙箱内,可配置安全级别。

3. 长期记忆

跨会话持久化保存:
  • 用户偏好
  • 已学到的知识
  • 常用的上下文信息

4. 技能系统

内置多种任务模板:
  • 研究(research)
  • 报告生成
  • 幻灯片制作
  • 网页生成
  • 图像 / 视频生成

5. IM 集成

可以直接在聊天软件里指挥它干活:
  • Telegram
  • Slack
  • 飞书 / Lark
  • WeChat / WeCom

6. MCP 协议支持

可以接入任意外部工具(通过 Model Context Protocol),例如数据库、API、私有服务。

7. 多执行模式

  • flash — 快速模式(简单任务)
  • standard — 标准模式
  • pro — 规划模式(先规划后执行)
  • ultra — 子代理模式(最强,长任务)

三、它适合谁?

适合:

  • 有长任务需求的开发者 / 研究者(写报告、做调研、整理资料)
  • 想把 AI 接入工作流的团队(通过 IM 或 API)
  • 想自建私有 Agent 平台的小企业(数据不出本地)
  • 折腾 AI Agent 的 Geek
不适合:
  • 只是想"聊天"的用户(用 ChatGPT/Claude 就够了)
  • 轻度使用者(部署成本不低,跑起来至少要 8GB 内存)
  • 没有 LLM API 预算的个人(每次任务都会烧 token)

四、系统要求

| 场景 | 最低配置 | 推荐配置 |
|------|---------|---------|
| 本地评估 | 4 核 / 8 GB / 20 GB SSD | 8 核 / 16 GB |
| Docker 开发 | 4 核 / 8 GB / 25 GB SSD | 8 核 / 16 GB |
| 长期服务 | 8 核 / 16 GB / 40 GB SSD | 16 核 / 32 GB |

软件依赖:

  • Python 3.12+
  • Node.js 22+
  • pnpm
  • Docker(强烈推荐)
  • nginx(生产部署)

你还需要至少一个 LLM 的 API Key:
  • 官方推荐 Doubao-Seed-2.0-Code / DeepSeek v3.2 / Kimi 2.5
  • 也支持任何 OpenAI 兼容接口(GPT-4o / Gemini / Qwen 等)
  • 模型要求:100k+ 上下文、工具调用能力、最好有推理能力



五、部署教程

以下步骤全程在 Ubuntu 22.04 / Debian 12 / macOS 上验证。

1. 准备环境

# 检查 Python 和 Node 版本
python3 --version   # 需要 3.12+
node --version      # 需要 22+

# 如果版本不够,先装
# Ubuntu 装 Python 3.12
sudo apt install python3.12 python3.12-venv

# 装 Node.js 22
curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -
sudo apt install -y nodejs

# 装 pnpm
npm install -g pnpm

# Docker(如果还没装)
curl -fsSL https://get.docker.com | sh

2. 克隆仓库

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

3. 运行配置向导

make setup

这是一个交互式向导,会问你:

  • 选择 LLM 提供商(OpenAI / DeepSeek / Doubao / Anthropic / 自定义…)
  • 填入 API Key
  • 是否启用网页搜索
  • 沙箱模式级别(推荐 strict
  • 是否允许 bash 访问
  • 是否允许文件写入
完成后会生成 config.yaml.env 文件。

4. 启动服务

方式 A:Docker 开发部署(推荐新手)

make docker-init     # 拉取沙箱镜像
make docker-start    # 启动所有服务

方式 B:本地开发部署

make check           # 检查依赖
make install         # 安装 Python 和 Node 依赖
make dev             # 启动

方式 C:Docker 生产部署

make up              # 构建镜像并启动全部服务
# 停止
make down

5. 验证安装

make doctor

这个命令会检查:

  • 所有服务是否正常运行
  • LLM 连接是否成功
  • 沙箱是否可用
  • 数据库是否就绪

全部 ✅ 就算成功。

6. 访问 Web UI

打开浏览器,访问:

http://localhost:2026

会看到 DeerFlow 的操作界面。


六、基本使用

通过 Web UI

界面上选择执行模式(flash / standard / pro / ultra),然后输入任务描述。例如:

"帮我研究 2026 年全球电动汽车市场格局,输出一份 10 页的中文 Markdown 报告,包含主要厂商对比表格和趋势分析"

按回车,然后看着它:
1. 规划任务拆解
2. 派生子代理
3. 调用网页搜索
4. 阅读抓取的资料
5. 写代码生成图表
6. 汇总成最终报告

产物会出现在 output/ 目录下,你可以直接下载。

通过 IM 聊天

以 Telegram 为例:

1. 在 BotFather 创建一个 Bot,获取 token
2. 在 DeerFlow 配置里填入 token
3. 重启服务

然后直接在 Telegram 里对 Bot 说话:

/new 研究 AI Agent 领域最近 3 个月的融资情况
/status      查看当前任务进度
/models      切换使用的模型
/memory      查看长期记忆

非常适合 "随时随地给 AI 打工人派活" 的场景。

通过 Python 客户端

from deerflow.client import DeerFlowClient

client = DeerFlowClient()
response = client.chat(
    "分析这篇论文,总结三个要点",
    thread_id="paper-review",
    upload=["paper.pdf"]
)
print(response)

适合嵌入到自己的 Python 项目里。

和 Claude Code 集成

装上 claude-to-deerflow skill 后,在 Claude Code 里直接:

/claude-to-deerflow 帮我做一份 PPT
/claude-to-deerflow status
/claude-to-deerflow upload ./data.csv

一个有意思的玩法是——用 Claude Code 调度 DeerFlow,让 DeerFlow 跑长任务,Claude Code 只负责"指挥"。


七、实战场景

场景 1:自动整理技术调研

任务:调研 2026 年主流向量数据库产品,对比 Pinecone、Weaviate、
Qdrant、Milvus、Chroma 的性能、定价、生态,输出 Markdown 报告
并附上 benchmark 图表。

DeerFlow 会自动搜索、下载文档、运行基准测试、生成图表并汇总。

场景 2:批量处理数据

任务:读取 /uploads/logs/ 目录下所有 .log 文件,提取错误信息,
按类型聚合,输出 CSV 和柱状图。

沙箱里跑 Python 脚本,十几秒搞定。

场景 3:生成网页 / 幻灯片

任务:给我做一份 10 页的产品介绍 PPT,主题是"量子计算科普",
要有动画和图示,风格参考苹果发布会。

支持直接导出 .pptx 或 HTML 网页。

场景 4:代码工程任务

任务:我有一个 Node.js 项目(见上传),请阅读代码,找出性能瓶颈,
提出 3 个优化方案并实现第一个。

由于有沙箱环境,它能真的跑测试看效果。


八、注意事项

1. 安全风险

DeerFlow 默认设计为在本地可信环境部署。

如果要暴露到公网,一定要做

  • IP 白名单
  • 身份认证网关(如 Cloudflare Zero Trust / Nginx Basic Auth)
  • 网络隔离(DMZ)
  • 不要用 root 跑沙箱

2. Token 成本


长任务一次可能消耗几万到几十万 token。用前算好预算,或者:
  • 先用 flash 模式测试
  • 在 config 里设 token 上限
  • 接入本地模型(Ollama / vLLM)降低成本

3. 沙箱逃逸


开启 bash 访问权限时要谨慎,建议:
  • 用 Docker 沙箱而非本地直接执行
  • 严格限制文件系统权限
  • 不要给它任何生产数据库的凭证

4. 版本迭代


DeerFlow 2.0 是完全重写的版本,与 v1 不兼容。如果你从老版本升级,不能直接迁移,需要重新部署。


九、常见问题

Q1:启动后访问 localhost:2026 显示 502

检查 make doctor 输出,通常是 LLM 连接失败或沙箱镜像没拉下来。

Q2:子代理派生太多,token 爆炸

config.yaml 里限制 max_subagentsmax_tokens_per_task

Q3:中文模型支持

豆包 / DeepSeek / Kimi 都支持,且在国内访问更快。推荐用 DeepSeek v3.2(性价比高)。

Q4:能连本地 Ollama 吗?

可以。选择"OpenAI 兼容"提供商,填入 Ollama 的 http://localhost:11434/v1。注意本地模型上下文窗口要足够大。

Q5:和 LangChain 的 Agent 有什么区别?

LangChain 更像一个"库",DeerFlow 是一个完整的产品,包括 Web UI、沙箱、IM 集成、长期记忆、多代理编排——开箱即用。底层其实也用了 LangGraph。

十、结语

DeerFlow 的核心价值是"让 AI 真正能干活",而不只是聊天。

如果你只是偶尔问问问题,DeerFlow 是大炮打蚊子。但如果你有长任务自动化的需求——调研、报告、代码工程、数据处理——那它几乎是目前开源世界里最完整的方案之一。

字节把这种内部生产力工具开源出来,无论是出于技术展示还是社区扩张,对我们普通开发者而言都是大好事。花一个下午部署一下,你会对"AI 打工人"这个词有新的体会。

仓库地址:https://github.com/bytedance/deer-flow
官方文档:见仓库 README 和 docs/ 目录
推荐配置:8 核 16G 服务器 + DeepSeek v3.2 API

有任何部署报错或使用疑问,欢迎评论区交流。


本文首发于「小丸子博客」。转载请注明出处。

评论 (0)

暂无评论