当前位置：首页 > news >正文

Langchain-Chatchat能否实现问答结果RTF导出？

news 2026/6/28 13:19:00

Langchain-Chatchat 能否实现问答结果 RTF 导出？

在企业知识管理日益依赖智能化工具的今天，如何将 AI 生成的内容以专业、可编辑的形式留存和流转，已成为一个不可忽视的实际需求。许多用户在使用基于大语言模型（LLM）的本地知识库系统时，都会提出类似的问题：“我能不能把这次问答的结果导出成 Word 那样的格式？最好还能保留加粗、列表这些排版。”这背后反映的，正是对输出可控性与知识沉淀效率的双重诉求。

Langchain-Chatchat 作为当前主流的开源本地知识库问答框架之一，凭借其“私有文档 + 向量检索 + 大模型生成”的 RAG 架构，在金融、法律、医疗等数据敏感领域广受青睐。它解决了传统聊天机器人容易“胡说八道”、答案无法溯源的问题，也避免了将内部资料上传至云端的风险。但与此同时，它的默认输出通常停留在 Web 界面展示或纯文本复制阶段——而这显然不足以满足正式汇报、合规归档或跨部门协作的需求。

那么问题来了：我们能否让 Langchain-Chatchat 把每一次高质量的问答结果，一键导出为带有格式的富文本文件？比如 RTF（Rich Text Format）？

答案是肯定的。虽然官方版本并未内置该功能，但由于其高度模块化的设计和清晰的接口结构，实现 RTF 导出不仅技术上完全可行，而且开发成本极低。

要理解为什么这件事可以做，首先要明白 Langchain-Chatchat 的工作流程本质上是一条“数据管道”：

用户上传 PDF、Word 等文档；
系统通过解析器提取文本，切分成块，并用嵌入模型转为向量存入数据库；
当提问发生时，问题被向量化后从库中检索最相关的片段；
这些片段作为上下文拼接到 prompt 中，送入本地部署的大模型（如 ChatGLM、Qwen）进行推理；
模型返回的回答通常是结构化的 Markdown 文本（包含标题、列表、代码块等）；
前端渲染并呈现给用户。

关键点在于第 5 步：输出已经是带语义标记的结构化文本。这意味着我们不需要从零开始设计格式逻辑，只需将已有的 Markdown 内容转换为另一种支持样式的文档格式即可。

而 RTF，恰好是一个理想的目标格式。

RTF（Rich Text Format）由微软制定，是一种成熟、开放且跨平台兼容的富文本交换格式。它不像 DOCX 那样依赖复杂的 XML 结构和 Office 组件，也不像 HTML 那样需要浏览器环境来正确渲染。相反，RTF 文件可以用记事本打开、能被 WPS 和 LibreOffice 完美支持，甚至在没有安装 Office 的服务器上也能程序化生成。更重要的是，它支持字体、字号、颜色、段落缩进、项目符号等基础样式——这些正是问答内容排版所需的核心能力。

因此，只要我们在现有系统中增加一个“后处理模块”，捕获问答对，将其按预设模板转化为 RTF 流，并提供下载入口，就能轻松补齐这一功能短板。

具体怎么做？下面是一个可以直接集成到 Langchain-Chatchat 后端服务中的实现方案。

我们可以使用 Python 的PyRTF库来构建 RTF 文档。尽管该项目已不再活跃维护，但在生成简单富文本方面依然稳定可靠。对于生产环境，也可考虑结合python-docx先生成.docx再转为 RTF（需注意转换兼容性），或采用更现代的替代方案如docxtpl+mammoth配合处理。

from PyRTF import Document, Section, Paragraph, ParagraphStyle, Renderer, Color, ControlWord def create_qa_rtf(question: str, answer: str, output_path: str): """ 将单次问答记录导出为 RTF 文件 :param question: 用户提出的问题 :param answer: 模型返回的回答（支持换行与简单 Markdown 列表） :param output_path: 输出路径 """ doc = Document() section = Section() doc.Sections.append(section) # 标题样式 title_style = ParagraphStyle( font_name='微软雅黑', size=24, bold=True, text_color=Color(0, 0, 0), space_before=240, space_after=120 ) section.append(Paragraph("问答记录", title_style)) # 分隔线 section.append(ControlWord('brdrt', 'brdrhair', 'brdrw10')) # 问题样式（蓝色加粗） q_style = ParagraphStyle( font_name='微软雅黑', size=16, bold=True, text_color=Color(0, 0, 255), space_after=60 ) section.append(Paragraph(f"问题：{question}", q_style)) # 答案样式（常规黑色） a_style = ParagraphStyle( font_name='微软雅黑', size=14, italic=False, text_color=Color(0, 0, 0), first_line_indent=0, space_after=120 ) # 支持多行与简单列表识别 answer_lines = answer.strip().split('\n') for line in answer_lines: stripped = line.strip() if not stripped: continue # 简单识别以 - 或 * 开头的列表项 if stripped.startswith(('-', '*')): p = Paragraph(stripped, a_style) p.SetProperties(bullet=True) # 设置为项目符号 section.append(p) else: section.append(Paragraph(stripped, a_style)) # 渲染写入 DR = Renderer() with open(output_path, 'wb') as f: DR.Write(doc, f) # 使用示例 if __name__ == "__main__": create_qa_rtf( question="公司年假政策是如何规定的？", answer=""" 根据《员工手册》第三章第五条： - 正式员工满一年后享有5天带薪年假； - 满十年以上增加至10天； - 年假需提前两周申请并经主管审批。 """, output_path="./qa_output.rtf" ) print("RTF 文件已成功生成：qa_output.rtf")

这段代码展示了如何将一次问答内容封装成一份具备基本排版的专业文档。运行后生成的.rtf文件可在任意文字处理器中打开，显示效果接近 Word 文档。你可以进一步扩展功能，例如添加时间戳、会话 ID、公司 Logo 占位符、页眉页脚等，形成统一的企业级输出模板。

更重要的是，这个函数完全可以作为一个独立的服务模块接入 Langchain-Chatchat 的后端 API。例如新增一个/api/export/rtf接口，接收session_id或直接传入question和answer字段，动态生成并返回文件流：

from flask import Flask, request, send_file import os app = Flask(__name__) @app.route('/export/rtf', methods=['POST']) def export_rtf(): data = request.json question = data.get('question') answer = data.get('answer') temp_path = "/tmp/qa_export.rtf" create_qa_rtf(question, answer, temp_path) return send_file( temp_path, as_attachment=True, download_name="问答记录.rtf", mimetype="application/rtf" )

前端只需在 UI 上增加一个“导出为 RTF”按钮，触发请求即可完成下载。整个过程无需刷新页面，用户体验流畅自然。

当然，在实际落地过程中还需考虑一些工程细节：