July 22, 2025 学习 RAGFlow 的 DeepDoc 技术之视觉处理 我们之前已经学过,DeepDoc 由 解析器(parser) 和 视觉处理(vision) 两个部分组成。解析器提供了不同格式文档的通用解析方法,我们花了两天时间,对这 10 个解析器的源码做了深入分析;今天我们将学习 DeepD...- 阅读剩余部分 -
July 21, 2025 学习 RAGFlow 的 DeepDoc 技术之解析器(二) 在上一篇文章中,我们学习了 RAGFlow 的 DeepDoc 技术,并对 DeepDoc 的 10 大解析器做了个概览,目前我们已经学习了其中的 3 种解析器,包括:DOCX 解析器、Excel 解析器 和 PPT 解析器。...- 阅读剩余部分 -
July 18, 2025 学习 RAGFlow 的 DeepDoc 技术之解析器 我们昨天将任务执行器中的 do_handle_task() 函数从头到尾梳理了一遍,详细学习了 RAGFlow 的文件解析和分块逻辑。其中还遗漏了一些关键技术点,包括 DeepDoc 深度解析文档、RAPTOR 分块策略、Grap...- 阅读剩余部分 -
July 17, 2025 再学 RAGFlow 的文件解析逻辑 经过几天的学习,我们了解了 RAGFlow 的文件上传和解析流程,了解了解析任务是如何触发并放入 Redis Stream 消息队列中,等待任务执行器消费和处理的。今天我们将继续学习任务执行器中最重要的函数 do_handle_task...- 阅读剩余部分 -
July 16, 2025 学习 RAGFlow 的知识库配置 书接上回,昨天我们深入学习了如何触发解析任务,如何通过 Redis Stream 作为消息队列投递任务,以及任务执行器如何利用 trio 异步框架和消费者组机制,消费和处理这些任务。我们可以用 Redis 客户端连接到 Redi...- 阅读剩余部分 -
July 15, 2025 学习 RAGFlow 的文件解析逻辑 昨天我们已经学习了 RAGFlow 文件上传的相关逻辑,今天继续学习文件解析的逻辑。触发文件解析文件上传后,在文件列表中会有一个 “解析” 按钮,点击后会触发文件解析:调用接口为 /v1/document/run,其实现逻辑位于 api/a...- 阅读剩余部分 -
July 14, 2025 学习 RAGFlow 的文件上传逻辑 在上一篇中,我们学习了 RAGFlow 的系统架构和启动流程,了解了 RAGFlow 的 API 服务器(API Server) 和 任务执行器(Task Executor) 两大核心组件,一个负责提供外部接口和平台基本功能,另一个则负责...- 阅读剩余部分 -
July 11, 2025 学习 RAGFlow 的系统架构 昨天,我们学习了 RAGFlow 的安装配置和基本使用,通过创建一个知识库并上传文档,完整地体验了 RAGFlow 从数据处理到智能问答的基本工作流程。作为一个 RAG 系统,这套流程也是 RAGFlow 的核心流程,下面...- 阅读剩余部分 -
July 10, 2025 RAGFlow 快速入门 在构建高级 AI 应用时,检索增强生成(RAG)已成为一项关键技术,它能让大语言模型(LLM)利用外部知识库,提供更准确、更具上下文的回答。然而,如何高效地处理和理解格式各异的复杂文档(如 PDF、Word、PPT 等),并从中提取高质量信...- 阅读剩余部分 -
July 9, 2025 Gemini CLI vs. Claude Code 功能对比 经过两周多的深度学习和体验,我们对 Claude Code 的基本功能和特性已经有了基本了解。而正在我们学习 Claude Code 的期间,Google 开源了另一款终端 AI 助手 ———— Gemini CLI,作为 C...- 阅读剩余部分 -