前言
你有没有这样的幻想:
- 丢给它一个课题,让它自己去搜索、阅读、整理、写报告
- 给一份 PPT 需求,它自动做出一份像模像样的幻灯片
- 让它分析一组数据,生成可视化看板
- 甚至让它自己写代码、跑代码、调试代码,完整处理一个复杂工程任务
今天要介绍的 DeerFlow(小鹿流),就是这样一个框架。它是字节跳动在 2026 年初开源的 SuperAgent Harness(超级代理外壳),目前在 GitHub 上已经拥有 61.7k Stars,并在 2026 年 2 月登上 Trending 榜首。
这是一篇从零到跑起来的完整部署 + 使用教程。
一、DeerFlow 是什么?
用一句话总结:它是一个能让大语言模型长时间独立工作的"外壳"。
传统的 LLM 对话是这样的——你问一句,它回一句,上下文一满就得重开。DeerFlow 解决的是另一类问题:
我给 AI 一个"研究 2026 年全球半导体格局并输出 50 页报告"的任务,它能:
1. 自己拆分成 20 个子任务
2. 为每个子任务派生一个子代理(subagent),并行执行
3. 各自拥有独立文件系统、独立上下文窗口
4. 调用网页搜索、下载文档、阅读内容、写代码、生成图表
5. 完成后汇总、写出最终报告
6. 跨会话记住你的偏好(比如"你喜欢 Markdown 格式的表格")
这就是 SuperAgent 框架的价值。
二、核心特性
1. 多代理编排
- 主代理可以动态派生子代理
- 每个子代理有独立上下文、工具、终止条件
- 子代理可以并行执行,显著缩短总耗时
2. 沙箱执行环境
每个任务有独立文件系统:uploads/— 上传的输入文件workspace/— 工作目录output/— 最终产物
3. 长期记忆
跨会话持久化保存:- 用户偏好
- 已学到的知识
- 常用的上下文信息
4. 技能系统
内置多种任务模板:- 研究(research)
- 报告生成
- 幻灯片制作
- 网页生成
- 图像 / 视频生成
5. IM 集成
可以直接在聊天软件里指挥它干活:- Telegram
- Slack
- 飞书 / Lark
- WeChat / WeCom
6. MCP 协议支持
可以接入任意外部工具(通过 Model Context Protocol),例如数据库、API、私有服务。7. 多执行模式
flash— 快速模式(简单任务)standard— 标准模式pro— 规划模式(先规划后执行)ultra— 子代理模式(最强,长任务)
三、它适合谁?
适合:
- 有长任务需求的开发者 / 研究者(写报告、做调研、整理资料)
- 想把 AI 接入工作流的团队(通过 IM 或 API)
- 想自建私有 Agent 平台的小企业(数据不出本地)
- 折腾 AI Agent 的 Geek
- 只是想"聊天"的用户(用 ChatGPT/Claude 就够了)
- 轻度使用者(部署成本不低,跑起来至少要 8GB 内存)
- 没有 LLM API 预算的个人(每次任务都会烧 token)
四、系统要求
| 场景 | 最低配置 | 推荐配置 |
|------|---------|---------|
| 本地评估 | 4 核 / 8 GB / 20 GB SSD | 8 核 / 16 GB |
| Docker 开发 | 4 核 / 8 GB / 25 GB SSD | 8 核 / 16 GB |
| 长期服务 | 8 核 / 16 GB / 40 GB SSD | 16 核 / 32 GB |
软件依赖:
- Python 3.12+
- Node.js 22+
- pnpm
- Docker(强烈推荐)
- nginx(生产部署)
你还需要至少一个 LLM 的 API Key:
- 官方推荐 Doubao-Seed-2.0-Code / DeepSeek v3.2 / Kimi 2.5
- 也支持任何 OpenAI 兼容接口(GPT-4o / Gemini / Qwen 等)
- 模型要求:100k+ 上下文、工具调用能力、最好有推理能力
五、部署教程
以下步骤全程在 Ubuntu 22.04 / Debian 12 / macOS 上验证。
1. 准备环境
# 检查 Python 和 Node 版本
python3 --version # 需要 3.12+
node --version # 需要 22+
# 如果版本不够,先装
# Ubuntu 装 Python 3.12
sudo apt install python3.12 python3.12-venv
# 装 Node.js 22
curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -
sudo apt install -y nodejs
# 装 pnpm
npm install -g pnpm
# Docker(如果还没装)
curl -fsSL https://get.docker.com | sh
2. 克隆仓库
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
3. 运行配置向导
make setup
这是一个交互式向导,会问你:
- 选择 LLM 提供商(OpenAI / DeepSeek / Doubao / Anthropic / 自定义…)
- 填入 API Key
- 是否启用网页搜索
- 沙箱模式级别(推荐
strict) - 是否允许 bash 访问
- 是否允许文件写入
config.yaml 和 .env 文件。
4. 启动服务
方式 A:Docker 开发部署(推荐新手)
make docker-init # 拉取沙箱镜像
make docker-start # 启动所有服务
方式 B:本地开发部署
make check # 检查依赖
make install # 安装 Python 和 Node 依赖
make dev # 启动
方式 C:Docker 生产部署
make up # 构建镜像并启动全部服务
# 停止
make down
5. 验证安装
make doctor
这个命令会检查:
- 所有服务是否正常运行
- LLM 连接是否成功
- 沙箱是否可用
- 数据库是否就绪
全部 ✅ 就算成功。
6. 访问 Web UI
打开浏览器,访问:
http://localhost:2026
会看到 DeerFlow 的操作界面。
六、基本使用
通过 Web UI
界面上选择执行模式(flash / standard / pro / ultra),然后输入任务描述。例如:
"帮我研究 2026 年全球电动汽车市场格局,输出一份 10 页的中文 Markdown 报告,包含主要厂商对比表格和趋势分析"
按回车,然后看着它:
1. 规划任务拆解
2. 派生子代理
3. 调用网页搜索
4. 阅读抓取的资料
5. 写代码生成图表
6. 汇总成最终报告
产物会出现在 output/ 目录下,你可以直接下载。
通过 IM 聊天
以 Telegram 为例:
1. 在 BotFather 创建一个 Bot,获取 token
2. 在 DeerFlow 配置里填入 token
3. 重启服务
然后直接在 Telegram 里对 Bot 说话:
/new 研究 AI Agent 领域最近 3 个月的融资情况
/status 查看当前任务进度
/models 切换使用的模型
/memory 查看长期记忆
非常适合 "随时随地给 AI 打工人派活" 的场景。
通过 Python 客户端
from deerflow.client import DeerFlowClient
client = DeerFlowClient()
response = client.chat(
"分析这篇论文,总结三个要点",
thread_id="paper-review",
upload=["paper.pdf"]
)
print(response)
适合嵌入到自己的 Python 项目里。
和 Claude Code 集成
装上 claude-to-deerflow skill 后,在 Claude Code 里直接:
/claude-to-deerflow 帮我做一份 PPT
/claude-to-deerflow status
/claude-to-deerflow upload ./data.csv
一个有意思的玩法是——用 Claude Code 调度 DeerFlow,让 DeerFlow 跑长任务,Claude Code 只负责"指挥"。
七、实战场景
场景 1:自动整理技术调研
任务:调研 2026 年主流向量数据库产品,对比 Pinecone、Weaviate、
Qdrant、Milvus、Chroma 的性能、定价、生态,输出 Markdown 报告
并附上 benchmark 图表。
DeerFlow 会自动搜索、下载文档、运行基准测试、生成图表并汇总。
场景 2:批量处理数据
任务:读取 /uploads/logs/ 目录下所有 .log 文件,提取错误信息,
按类型聚合,输出 CSV 和柱状图。
沙箱里跑 Python 脚本,十几秒搞定。
场景 3:生成网页 / 幻灯片
任务:给我做一份 10 页的产品介绍 PPT,主题是"量子计算科普",
要有动画和图示,风格参考苹果发布会。
支持直接导出 .pptx 或 HTML 网页。
场景 4:代码工程任务
任务:我有一个 Node.js 项目(见上传),请阅读代码,找出性能瓶颈,
提出 3 个优化方案并实现第一个。
由于有沙箱环境,它能真的跑测试看效果。
八、注意事项
1. 安全风险
DeerFlow 默认设计为在本地可信环境部署。
如果要暴露到公网,一定要做:
- IP 白名单
- 身份认证网关(如 Cloudflare Zero Trust / Nginx Basic Auth)
- 网络隔离(DMZ)
- 不要用 root 跑沙箱
2. Token 成本
长任务一次可能消耗几万到几十万 token。用前算好预算,或者:
- 先用
flash模式测试 - 在 config 里设 token 上限
- 接入本地模型(Ollama / vLLM)降低成本
3. 沙箱逃逸
开启 bash 访问权限时要谨慎,建议:
- 用 Docker 沙箱而非本地直接执行
- 严格限制文件系统权限
- 不要给它任何生产数据库的凭证
4. 版本迭代
DeerFlow 2.0 是完全重写的版本,与 v1 不兼容。如果你从老版本升级,不能直接迁移,需要重新部署。
九、常见问题
Q1:启动后访问 localhost:2026 显示 502
检查make doctor 输出,通常是 LLM 连接失败或沙箱镜像没拉下来。
Q2:子代理派生太多,token 爆炸
在config.yaml 里限制 max_subagents 和 max_tokens_per_task。
Q3:中文模型支持
豆包 / DeepSeek / Kimi 都支持,且在国内访问更快。推荐用 DeepSeek v3.2(性价比高)。Q4:能连本地 Ollama 吗?
可以。选择"OpenAI 兼容"提供商,填入 Ollama 的http://localhost:11434/v1。注意本地模型上下文窗口要足够大。
Q5:和 LangChain 的 Agent 有什么区别?
LangChain 更像一个"库",DeerFlow 是一个完整的产品,包括 Web UI、沙箱、IM 集成、长期记忆、多代理编排——开箱即用。底层其实也用了 LangGraph。十、结语
DeerFlow 的核心价值是"让 AI 真正能干活",而不只是聊天。
如果你只是偶尔问问问题,DeerFlow 是大炮打蚊子。但如果你有长任务自动化的需求——调研、报告、代码工程、数据处理——那它几乎是目前开源世界里最完整的方案之一。
字节把这种内部生产力工具开源出来,无论是出于技术展示还是社区扩张,对我们普通开发者而言都是大好事。花一个下午部署一下,你会对"AI 打工人"这个词有新的体会。
仓库地址:https://github.com/bytedance/deer-flow
官方文档:见仓库 README 和 docs/ 目录
推荐配置:8 核 16G 服务器 + DeepSeek v3.2 API
有任何部署报错或使用疑问,欢迎评论区交流。
本文首发于「小丸子博客」。转载请注明出处。
评论 (0)
暂无评论