当前位置: 首页 > news >正文

RAG简介

  1. 概述
    RAG(Retrieval Augmented Generation)检索增强生成技术,解决了LLM(Large Language Model)的知识局限性、in-context learning(上下文学习)的token限制、重新进行模型微调成本高以及数据安全考虑等痛点,以已有知识库作为背景知识,让AI模型从基于记忆和理解进行答案编造考试,转换成基于垂直领域知识库的开卷考试。
  2. 架构
    分为在线和离线两部分。
    • 离线
      离线部分主要是实现知识库的向量化存储和索引构建。大致包含了文档解析、拆分、入库以及构建索引等步骤。
    • 在线
      在线部分主要是实现Query的意图识别和结果生成。大致包含了Query的解析、基于相似度的查询匹配、构造prompt以及通过LLM输出结果等步骤。
  1. 为什么用向量数据库
    一方面查询场景不能简单通过文本的精确匹配来得到结果,而是通过语义匹配来得到结果。向量Embedding能充分包含语义信息;
    另一方面向量数据库在向量的存储和查询上有特有的优势。
  2. 文档解析拆分
    文档解析拆分包含了数据清洗、文本/图片/表格的识别、数据分段等过程。目前已有对应的机器学习和深度学习模型,如RagFlow。
  3. Query解析
    由于用户提问往往具有模糊性和复杂性,需要对问题进行改写、增强、分解
  4. 查询路由
    理解用户query后,在查询路由步骤,通过定义查询路由器以及各个查询数据插件,将用户查询情况传给LLM,通过LLM决策,决定接下来要调用哪个查询插件,然后调用执行路由选择的插件,最后将各个插件预定义格式返回的结果汇总
http://www.cnnetsun.cn/news/50982.html

相关文章:

  • 快速验证:基于CentOS 7.6的测试环境搭建
  • AI定价实战指南:快速构建电商智能定价系统
  • VGGT三维重建终极指南:从零开始构建你的3D世界
  • 电商网站秒开秘籍:快马AI加载优化案例
  • 15分钟快速验证:谷歌服务离线包生成器原型开发
  • 1小时搞定ElementUI原型:快马平台实战
  • 从天喵装机案例看中小企业IT设备采购新范式
  • Flink面试题实战:从问题到解决方案
  • 5分钟用C# Socket搭建文件传输原型
  • 论文查重不花一分钱?宏智树AI开启学术诚信新“净”界!
  • 最强安卓投屏神器QtScrcpy
  • 开题报告“自造机”VS“人工苦力”:宏智树AI凭何成为学术起航新引擎?
  • 还在为SPSS代码头疼?5款AI数据分析工具实测:有的只能画图,有的却能直接嵌入论文全流程
  • 单环PID控制Buck电路实现方案
  • 零基础必学:CSS div居中完全指南(图文详解)
  • COCO数据集工具库完整使用指南:从入门到实战应用
  • c盘红了怎么清理c盘空间?
  • 传统排错vsAI诊断:503错误处理效率提升300%
  • 清理后空间为什么很快又满了?
  • 企业级应用中的SSL证书故障排查实战
  • GPT-OSS-Safeguard-20B:开源AI安全推理模型重构内容审核范式
  • LogicFlow自定义节点:5步打造个性化流程图组件
  • ESP8266引脚实战:从零搭建智能温湿度监测系统
  • 1小时快速构建IDM集成模块原型
  • Ubuntu中文输入法在企业办公环境中的实战部署
  • 快速原型设计:用AI即时生成带省略号的UI组件
  • 零基础入门:用Cursor免费版写出你的第一行代码
  • 零基础入门:用大模型开启AI学习之旅
  • 零基础图解MinGW安装:小学生都能看懂
  • 对比评测:5种Ubuntu中文输入法的输入效率差异