Blog / AI
AI

检索–增强生成与微调:2025 年指南

了解如何以及何时使用 RAG 或微调来优化人工智能模型。
1 分钟阅读
RAG 与微调(Fine-Tuning)的对比

检索增强生成(RAG)和微调是人工智能中两个截然不同的概念,它们的目的也截然不同。RAG 允许 LLM 在运行时获取外部信息。微调则允许 LLM 调整其内部知识,以进行更深入、永久的学习。

在本指南结束时,您将能够回答以下问题。

  • 什么是微调?
  • 什么是 RAG?
  • 何时使用微调?
  • 何时使用 RAG?
  • RAG 和微调如何相辅相成?

什么是微调?

人工智能微调工作流程图

微调通常被认为是实际模型训练过程的一部分。您可以在此了解有关模型训练的更多信息。模型首先要经历一个称为 “预训练 “的阶段。简单来说,这就是模型学习接收输入和生成输出的过程。一旦完成预训练,模型就包含了大量的知识,但还没有达到应用这些知识的最佳状态。

我们通常使用 “人反馈强化学习”(RLHF)对模型进行微调。在微调时,你实际上是在与模型对话,测试它的输出结果。例如,如果一个模型说 “天空是绿色的”,那么就需要将其修正为 “天空是蓝色的”。微调时,您要判断机器的输出,并强化预期行为–就像对表现良好的狗狗说 “好孩子!”或对表现不好的狗狗卷起报纸一样。

当你对 LLM 进行微调时,你是在为其实际任务做准备。微调主要有两种类型。

  • 领域适应性:想象一下,你想用 DeepSeek 这样的基础模型创建一个编程专家。你已经有了一个基础扎实的强大模型,但它还不是真正的专家。当然,它能理解 shell 命令和大部分 Python 代码,但它还需要专业知识。这时,你可以利用StackOverflowLeetCode 等工具向它传授计算机科学和编码的精髓。一旦完成微调,你就能得到一个比人类更快更好地编写代码的模型。
  • 任务适应:任务适应是指适应手头的任务。在当今的 LLM 中,我们在实际聊天中最常见到这一点。2025 年初,ChatGPT-4o 接受了一些非常严格的微调,以便与聊天者的情绪相匹配。在这种情况下,RLHF 被用来激励机器人反映用户的情绪。如果用户谈论技术,GPT 也会这样做。如果用户谈论法律,GPT 也会用法律术语说话。如果用户听起来很虔诚,GPT 就会用虔诚的语气说话(是的,真的)。

微调用于影响模型的实际决策和推断。

什么是 RAG?

RAG 工作流程图

在 RAG 中,没有真正的学习。人工智能会根据上下文相关性检索额外的数据并生成输出。一旦生成输出,模型就会回到检索前的状态。这是一种零点学习。模型以零先验上下文参考信息。然后,它利用预训练进行推断并生成输出。

当你问双子座 “今天天气如何?”时,它会查找(检索)天气(增强其知识),然后告诉你(生成)输出结果。

RAG 有两种主要类型:被动型和主动型。这一点在最新一代带有存储记忆的聊天模型中得到了最好的体现。

  • 被动 RAG:”记忆 “存储在矢量数据库中,日后可根据上下文进行引用。当 LLM 知道你的名字或喜好时,这就是被动 RAG。所引用的信息是静态和永久的。删除 “记忆 “的唯一方法是手动删除。
  • 积极的 RAG:回想一下之前的天气例子。天气每天都在变化。模型会对天气进行主动搜索(可能是通过 API)。一旦它确信自己了解天气情况,就会以自己的自定义 “个性 “将其反馈给您。

RAG 管道完全遵循这一工作流程:检索数据 -> 增强推理 -> 生成输出。

何时进行微调?

当你想确定你的模型究竟是如何思考的时候,最好使用微调。当你希望知识和推理是永久性的,你就应该进行微调。如果你的 LLM 需要真正理解数据,你就应该对它进行微调。

如果你的模型产生的输出结果不完全正确,如果它的思考过程让人感觉稍有偏差–你就需要进行微调。

  • 音调和个性:如果您已经为您的模型设定了特定的态度或语调,请进行微调。这在定制聊天机器人中尤其有用。当 Grok 3 凭借用户自定义的个性震惊世界时,部分原因就在于微调。
  • 边缘案例和准确性:当您的模型遇到边缘案例问题或无法正确表示训练数据时,就需要进行微调。对于用于医疗诊断的模型来说尤其如此。模型对法律产生幻觉可能会导致法庭诉讼。如果模型对医疗状况产生幻觉,则会对患者造成危险。
  • 缩小模型尺寸,降低成本:微调可以大大降低模型的大小和运行成本。例如,Llama 团队能够将 GPT-4 的输出提炼为 GPT-3.5。您可以他们的微调文档中阅读更多相关信息。
  • 新任务和能力:如果您希望增加预训练模型中不存在的实际能力,您需要对其进行微调。想象一下,您已经训练了一个只能使用英语的模型,但您需要西班牙语的输出–再多的提示工程或 RAG 也无法解决这个问题,您需要对其进行微调。

何时使用 RAG?

RAG 最适合用于已经正确思考的模型。如果您的模型在微调后产生了正确的输出,那么很可能是时候为外部数据访问添加 RAG 了。如果没有适当的上下文,无论模型多么智能,在很多任务中都会变得毫无用处。

回想一下之前的天气例子。你可以拥有地球上最智能的模型,但如果无法访问实时数据,你的模型就无法为你提供天气信息,或者任何实时信息。RAG 可以满足以下数据需求。

  • 实时数据:我们已经介绍过天气。这包括新闻、财务预测、系统监控和其他快速移动的数据流。
  • 研究或图书馆助理:有时,人们只需要找到正确的资源。当你使用 Gemini 或 Brave Search 提出问题时,你会得到直接的答案。该模式可以浏览文档,并为您指出相关资源。
  • 客户支持:当您需要一名法律硕士在服务台值班并回答一般问题时,RAG 可以快速有效地提供帮助。人工智能模型已经知道如何回答问题和阅读文档,它们只需要访问正确的内容。
  • 自定义输出:还记得我们前面提到的 GPT 的用户反映音调吗?这可不是中世纪的巫术。模型参考的是数据库中存储的事实。如果 OpenAI 必须为每个用户重新训练模型,那它就不存在了。

如何取舍

如果您的模型需要更好的思考,您应该进行微调。如果您的模型需要外部信息,请使用 RAG。实际上,我们正朝着混合系统的方向发展。一旦您将其发布到野外,您的模型就需要清晰地思考并访问正确的数据。下表将帮助您决定何时在项目中使用上述每种方法。

情况 最佳选择 为什么?
输出声音错误或不对齐 微调 您正在修正推理、语气或行为
输出准确,但缺乏细节 RAG 您缺少外部或特定域的事实
您需要最新的事实或实时数据 RAG 静态模型在训练后无法学习
您希望在新领域获得强劲性能 微调 您正在增加深层次的、内化的专业知识
既要准确,又要新鲜 两者 微调逻辑,RAG 外部知识

用于 RAG 和微调的明亮数据工具

在 Bright Data,我们提供强大的工具集来满足您的微调和 RAG 需求。无论您需要训练数据集还是实时管道,我们的系统都能满足您的需求。

微调

  • 数据集:从互联网上获取历史数据–每日更新。无论您是在寻找社交媒体、产品列表,还是维基百科,我们都能为您提供–为培训做好准备。
  • 存档 API:通过每天新增的 PB 级数据,对多模态数据和其他数据源进行培训。
  • 注释:利用灵活的注释服务加快培训速度,您可以选择人工智能辅助或人工监督标注。

RAG

  • 搜索 API:使用任何带有自定义参数(如图片或购物)的主要搜索引擎实时执行网络搜索。
  • Unlocker API:使用我们的托管代理服务,几乎可以搜刮网络上的任何网站。
  • 代理浏览器:为您的人工智能代理提供全面的浏览器自动化。
  • MCP 服务器:将您的人工智能代理与我们的工具无缝集成。

结论

微调教会你的模型如何思考。RAG 可让您的模型访问外部数据,而无需重新训练或臃肿模型。实际上,您应该同时使用这两种方法–只是在开发的不同阶段。

通过了解何时以及为何要使用微调和 RAG,您可以利用自己的人工智能模型做出明智的决策。无论您是要创建一个特定领域的专家,还是要让它访问实时数据,我们的工具都将为您提供帮助,我们也是如此。

注册免费试用,立即开始使用!

支持支付宝等多种支付方式