今天翻到一篇不错的技术分享,看完之后自己也琢磨了一下,把思路梳理记录下来。
🎬 个人主页:艾莉丝努力练剑
❄专栏传送门:《C语言》《数据结构与算法》《C/C++干货分享&学习过程记录》
《Linux操作系统编程详解》《笔试/面试常见算法:从基础到进阶》《Python干货分享》
⭐️为天地立心,为生民立命,为往圣继绝学,为万世开太平
🎬 艾莉丝的简介:
文章目录
1 ~> 宏观认识 LangChain 1.3 原生 API 调用模式:趟水过溪 1.4 LangChain 框架模式:走桥过溪1.5 核心概念区分1.6 本节总结:LangChain 的定义 2 ~> 宏观认识大模型 3 ~> 大模型篇章的要点阐述4 ~> 补充说明总结 结尾一、 框架引入
整体学习框架导入语
这篇文章为 LangChain 体系化学习的前言与宏观认知章节,核心目标是建立 “大模型 - LangChain-AI 应用” 三层架构的完整认知链路,厘清原生 API 调用与框架封装调用的本质差异,明确 LangChain 作为 AI 应用开发桥梁的核心价值,同时建立对大模型能力边界与缺陷的基础认知,为后续深入学习 LangChain 组件、智能体开发打下严谨的底层逻辑基础。本章从实际 AI 应用案例切入,通过类比方法拆解技术路径,最终落脚于 “如何将大模型转化为可融入业务流程的智能体” 这一核心命题,是整个 LangChain 知识体系的认知起点。
思维导图
+ 前言:LangChain宏观认知与学习框架
|- 宏观认识LangChain
| |- 课程定位:零基础可上手
| |- 核心定位:连接AI模型与AI应用的桥梁
| |- AI应用调用模型的两类路径
| | |- 原生API调用:趟水过溪
| | `- 框架封装调用:走桥过溪
| |- 典型案例
| | |- 豆包:生成类AI应用
| | `- DeepSeek:客户端应用与开放API
| |- 概念区分:AI应用 ≠ 原生AI模型
| `- LangChain核心价值:封装流程、简化调用、扩展能力
|- 宏观认识大模型
| |- 宏观类比:数字巨人、人类大脑、超级学霸
| |- 核心能力:泛化能力、逻辑推理能力
| `- 核心痛点:缺乏感知、行动与记忆能力,无法直接融入业务流程
|- 大模型篇章学习要点
| |- 理解工作原理与能力边界
| |- 认知固有缺陷(如幻觉问题)
| `- 建立问题翻译的思维框架
`- 补充说明:原生大模型正在逐步完善自身缺陷
1 ~> 宏观认识 LangChain
1.1 课程定位与核心命题
本课程面向零基础学习者,核心围绕 “如何基于 LangChain 开发实际 AI 应用” 展开。AI 应用的落地本质是解决 “AI 模型能力如何与业务场景结合” 的问题,而 LangChain 是衔接 AI 模型底层能力与上层 AI 应用的核心开发框架之一。
1.2 LangChain 与 AI 应用、AI 模型的关系
1.2.1 实际 AI 应用的典型形态
实际 AI 应用是面向终端用户、具备完整交互逻辑与场景功能的产品,主要分为两类典型形态:
1. 聊天类应用:如智能人工客服,核心能力是多轮对话交互与问题解答。
2. 生成类应用:如豆包、DeepSeek 客户端,覆盖文本生成、图像生成、多模态创作等能力。
以图像生成为例,终端用户只需输入自然语言描述、选择风格与比例参数,即可获得生成结果;产品层封装了参考图融合、多图拼接、模板匹配等复杂逻辑,用户无需感知底层模型的调用细节。
1.2.2 AI 应用调用模型的路径类比
AI 应用调用底层 AI 模型的过程可类比为 “过河”:AI 模型位于河的对岸,AI 应用需要抵达对岸才能调用模型能力,存在两种通行方法:
- 趟水过河:直接通过原生 API 调用 AI 模型,存在开发成本高、能力扩展难、流程封装复杂等问题,类比为 “打湿鞋子”。
- 过桥过河:通过 LangChain 等开发框架间接调用模型,框架封装了底层调用逻辑、提供了丰富的扩展组件,类比为平稳通行的桥梁。
1.3 原生 API 调用模式:趟水过溪
1.3.1 DeepSeek 案例:应用与模型的分层
DeepSeek 客户端属于面向用户的 AI 应用,而非模型本身。客户端提供了对话交互、深度思考、联网搜索等产品化功能,其底层调用的是 DeepSeek 官方提供的大模型 API。开发者可直接通过 HTTP 接口原生调用模型能力,无需依赖第三方框架。
DeepSeek 开放 API 具备以下基础特性:
- 接口格式与 OpenAI API 兼容,支持通过修改 base_url 适配现有 OpenAI 生态工具。
- 官方主接口地址为
https://api.deepseek.com,兼容格式地址为https://api.deepseek.com/v1,其中v1为接口版本标识,与模型版本无关。 - 支持流式输出与非流式输出两种模式,通过
stream参数控制。 - 提供模型版本迭代、Token 用量统计、密钥管理、账单结算等配套能力。
1.3.2 原生 API 调用实现方式
原生调用基于 HTTP POST 请求实现,接口路径为/chat/completions,核心配置包含请求头与请求体两部分:
1. 请求头(Headers)
Content-Type: application/json:指定请求体格式为 JSON。
2. Authorization: Bearer {api_key}:携带身份校验密钥,用于接口鉴权与用量统计。
请求体(Body)核心参数
1. model:指定调用的模型名称,如deepseek-chat。
2. messages:对话消息列表,每条消息包含role(角色,如 user、assistant)与content(消息内容)字段。
以下为标准请求体示例:
{
"model": "deepseek-chat",
"messages": [
{
"role": "user",
"content": "你好,你是谁?"
}
]
}
1.3.3 原生 API 返回结果结构
接口成功调用后返回 JSON 格式响应,核心字段包含:
id:本次请求的唯一标识。object:返回对象类型,固定为chat.completion。created:请求时间戳。model:实际响应的模型名称。choices:模型生成结果列表,包含消息内容、做好原因等信息。usage:Token 用量统计,包含提示词 Token 数、补全 Token 数与总 Token 数,同时支持缓存命中明细统计。
{
"id": "3360d43b-7e38-4d02-b8b0-b1a5e345778f",
"object": "chat.completion",
"created": 1759984349,
"model": "deepseek-chat",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "我是DeepSeek,由深度求索公司研发的人工智能助手。\n-支持联网搜索功能(需要手动开启)\n-没有语音功能,主要通过文字交流\n\n我很乐意为你解答问题、提供帮助,或者和你聊天!有什么我可以帮你的吗?"
},
"finish_reason": "stop",
"logprobs": null
}
],
"usage": {
"prompt_tokens": 8,
"completion_tokens": 137,
"total_tokens": 145,
"prompt_tokens_details": {
"cached_tokens": 0,
"prompt_cache_hit_tokens": 0,
"prompt_cache_miss_tokens": 8
}
}
}
[批注]
原笔记中存在多处拼写疏漏,如模型名写为残缺形式、接口域名拼写错误、字段名截断等,此处已按照 DeepSeek 官方 API 规范进行完整修正。原生 API 调用是直接与模型服务端交互的最底层方式,所有参数校验、结果解析、错误处理、多轮对话上下文维护均需开发者自行实现,这正是 “趟水过溪” 模式的核心成本来源。
1.3.4 原生 API 调用的核心问题
原生直接调用模型接口虽然最直接,但存在显著的局限性,对应 “打湿鞋子” 的问题:
1. 开发效率低:需要手动处理请求封装、结果解析、异常重试、鉴权管理等大量重复逻辑。
2. 能力扩展难:若要接入联网搜索、数据库查询、工具调用等能力,需开发者从零实现。
3. 上下文管理复杂:多轮对话的记忆维护、长文本截断、Token 计数优化等干活无统一封装。
4. 模型切换成本高:不同厂商 API 格式存在差异,切换模型时需要大幅修改调用逻辑。
1.4 LangChain 框架模式:走桥过溪
LangChain 是专门面向大模型应用开发的编程框架,其核心定位是替代原生 API 的裸调用方式,通过封装底层调用流程、提供标准化组件,降低 AI 应用的开发门槛与维护成本。
LangChain 的核心价值体现在三个层面:
1. 底层封装:统一封装不同大模型厂商的 API 调用逻辑,提供一致的开发接口,大幅降低模型切换成本。
2. 组件生态:内置记忆模块、检索模块、工具调用、链式流程编排等大量预制组件,开发者可直接复用,无需从零实现。
3. 流程编排:支持通过链式结构、代理模式组织复杂的业务逻辑,实现多步骤、多工具协同的复杂 AI 任务。
简言之,LangChain 作为连接 AI 模型与实际 AI 应用的桥梁,让开发者无需关注底层调用细节,聚焦于业务逻辑本身的实现。
1.5 核心概念区分
一定要明确区分 “AI 应用” 与 “原生 AI 模型” 两个概念:
- 用户日常接触的豆包、DeepSeek 客户端等产品均属于AI 应用,而非模型本身。
- AI 应用在底层模型的基础上,额外封装了大量产品逻辑(如界面交互、上下文管理、功能入口、业务规则等),并非对原生模型的简单透传。
- 原生 AI 模型仅具备基础的文本理解与生成能力,不包含任何面向终端用户的产品化逻辑。
1.6 本节总结:LangChain 的定义
LangChain 本质是一座连接 AI 模型与 AI 应用的 “桥梁”:它以编程方式指挥和协调大模型,能够对接数据库、搜索引擎、第三方 API 等整个软件生态,将大模型的基础能力转化为可解决复杂业务问题的实际应用。
2 ~> 宏观认识大模型
2.1 大模型的宏观理解
从宏观视角理解,大模型是通过训练海量互联网数据形成的人工智能模型,核心能力是理解并生成人类自然语言。可通过三个类比建立直观认知:
1. 数字巨人:大模型训练阶段阅读了互联网中近乎全域的知识数据,具备极广的知识覆盖面,如同掌握海量信息的数字形态巨人。
2. 人类大脑:大模型具备信息收集、语义理解、逻辑处理的能力,能够基于输入信息做好推理、创作、解答等复杂任务,承担着 AI 系统的 “大脑” 角色。
3. 超级学霸:大模型能够整合海量知识资源,对各类概念进行归纳解释,对未知问题给出符合逻辑的解答,具备强大的知识整合与泛化能力。
2.2 大模型的核心能力
大模型的核心价值来源于两类基础能力:
1. 泛化能力:无需针对特定任务单独训练,即可通过自然语言指令做好不同领域的任务,适配问答、写作、翻译、代码生成等多种场景。
2. 逻辑推理能力:能够基于已知信息进行推导、分析与判断,处理具备因果关系、步骤依赖的复杂问题。
2.3 核心问题
大模型虽然具备强大的知识与推理能力,但存在天然的能力边界,这也是整个 AI 应用开发领域的核心命题:如何让大模型从一个 “知识百科全书”,升级为能够行动、能够思考、能够深度融入业务流程的智能伙伴(Agent)。
原生大模型存在三类核心短板:
1. 缺乏 “眼睛”:无法实时获取外部世界的最新信息,知识存在时效性边界,也无法直接读取业务系统数据。
2. 缺乏 “手脚”:无法主动执行操作、调用外部工具,只能输出文本结果,不能直接作用于现实系统。
3. 缺乏 “长效记忆”:单轮对话上下文长度有限,无法持久化存储业务信息与历史交互逻辑。
而 LangChain 的核心作用,正是为大模型补充上述能力:通过编程框架对接外部数据源、工具接口与记忆存储,让大模型具备感知世界、执行操作、沉淀记忆的能力,最终成为可融入业务流程的智能体。
3 ~> 大模型篇章的要点阐述
在正式学习 LangChain 之前,一定要先建立扎实的大模型基础认知,核心包含三个学习目标:
1. 深入理解大模型的干活原理与核心能力边界 掌握大模型的底层运行逻辑,明确其能做什么、不能做什么,避免对模型能力产生错误预期,是合理运用 LangChain 组件的前提。
2. 清醒认识大模型的固有缺陷 重点掌握幻觉、知识时效性、逻辑严谨性边界等固有问题,了解缺陷产生的底层原因,才能在 LangChain 开发中通过合理设计规避或缓解缺陷。
3. 建立问题翻译的思维框架 掌握将复杂业务问题拆解、转化为大模型能够理解与处理的语言的方法,这是后续设计 Prompt、编排 Chain 流程、开发 Agent 的核心基础能力。
LangChain 体系包含大量组件概念与设计模式,只有打好大模型底层认知基础,才能真正理解各组件的设计逻辑与适用场景,而非死记硬背 API 用法。
4 ~> 补充说明
大模型本身的能力也在持续演进,例如部分主流大模型产品已经逐步内置 Agent 能力、工具调用能力,原生大模型正在不断完善自身的固有缺陷。但 LangChain 等开发框架依然具备不可替代的价值:框架提供了更灵活的定制能力、更丰富的生态对接、更深度的业务流程控制力,是开发复杂企业级 AI 应用的主流选择。
总结
核心考点深度总结
本章作为 LangChain 学习的开篇,核心考点与易错点集中在认知概念、模式对比、边界定位三个维度,是后续技术学习的逻辑根基,需重点掌握以下内容:
1. 核心概念辨析(高频易错点) 一定要严格区分 AI 模型、开发框架、AI 应用三者的层级关系:AI 模型是底层能力底座,LangChain 是中间开发框架,AI 应用是面向用户的最终产品。常见误区是将客户端应用等同于模型本身 —— 豆包、DeepSeek 客户端均属于 AI 应用,其底层调用了对应的大模型,且封装了大量产品层逻辑,并非模型本身。同时必须明确:LangChain 的本质是开发框架而非模型,它不生产模型能力,而是通过封装与编排放大模型的落地价值。
2. 两种调用模式的对比(核心考点) 原生 API 调用(趟水过溪)与 LangChain 框架调用(走桥过溪)的差异是本章核心考点:
- 原生 API 调用:优势是最底层、最灵活,无额外框架依赖;劣势是开发成本高、扩展能力弱、维护成本高,仅适合极简场景或底层性能优化场景。
- LangChain 框架调用:优势是开发效率高、组件生态丰富、模型切换成本低、天然支持复杂流程编排;劣势是存在框架学习成本,底层调用逻辑被封装。 复习时需能够基于业务需求判断技术选型,明确两种模式的适用边界。
v1是接口版本,与模型版本无关,属于常见认知误区。原生 API 调用中,Authorization 字段的 Bearer 前缀、Content-Type 的指定、messages 数组的角色格式,都是实际开发中的高频出错点,需精准掌握。同时 Token 用量统计包含缓存命中明细,这一特性是成本优化的重要依据,也是易被忽略的细节考点。
结尾
uu们,这篇文章的内容到这里就全部完成了,艾莉丝在这里再次
艾莉丝努力练剑
C/C++ & Linux 底层探索者 | 一个正在努力练剑的技术博主
👀 【关注】 跟随我一起深耕技术领域,见证每一次成长。
❤️
【点赞】 让优质内容被更多人看见,让知识传递更有力量。
⭐
【收藏】 把核心知识点存好,在需要时随时查、随时用。
💬
【评论】 分享你的经验或疑问,评论区一起交流避坑!
不要忘记给博主“一键四连”哦!
“今日练剑达成!”
“技术之路难免有困惑,但同行的人会让前进更有方向。”
结语:希望对学习Linux相关内容的uu有所帮助,不要忘记给博主“一键四连”哦!
🗡博主在这里放了一只小狗,大家看完了摸摸小狗放松一下吧!🗡
>
૮₍ ˶ ˊ ᴥ ˋ˶₎ა
今天的内容大概就这些,实际开发中大家还会遇到更多细节,欢迎留言分享自己的经验。
评论 (0)
暂无评论