我用 2000 篇文档蒸馏了自己,结果只得到了一个低质 RAG

5/17/2026, 2:06:00 AM

📌 一句话摘要

作者用 2000 多篇工作文档构建数字分身,最终发现它只是一个能检索显性知识、却无法复刻隐性判断的低质 RAG 系统。

📝 详细摘要

本文作者在离职交接期间,尝试用 Codex 调用飞书 CLI,将自己过去几年积累的 2000 多篇飞书文档和 Axure 原型全部拉取下来,构建多层索引,试图打造一个能替代自己进行业务决策的「数字分身」。然而实际使用后发现,这个系统本质上只是一个低质 RAG:它能检索文档中的结论,但无法理解背后的判断逻辑;能模仿人的口吻,但分不清责任边界;能索引显性知识,却无法触及那些未写入文档的隐性知识。作者以游戏行业产品经理的视角,通过具体案例(如活动功能为什么没做、海外 SDK 的能力边界等)生动展示了 RAG 在复刻人类判断力上的根本局限。文章最后指出,真正的挑战不在于优化检索技术,而在于如何将人脑中那些说不清、写不全却真正决定判断的隐性知识,一层层拆解出来并交给 AI 学习。

💡 主要观点

  1. 基于文档构建的数字分身本质上是低质 RAG,只能检索结论,无法理解判断。 RAG 能根据问题找到相关文档,但不知道功能为什么这么设计,因为文档只记录了最终方案,而人脑记住的是「当时为什么暂不支持」这一层判断逻辑。
  2. RAG 能模仿人的口吻,但分不清责任边界,容易产生错误归因。 当业务询问某个项目功能时,数字分身可能回答「这个功能我当时没有考虑到位」,但实际上该项目并非作者负责,说明系统没有理解清楚责任归属。
  3. 隐性知识是 RAG 系统难以复刻的核心障碍,显性知识索引无法替代人类判断。 文档记录了「当时怎么做」,但没有完整记录「为什么这么做」「为什么不那么做」「谁能为这个判断负责」,这些未言明的背景信息才是真正决定判断的关键。

💬 文章金句

📊 文章信息

AI 初评:86
来源:人人都是产品经理
作者:人人都是产品经理
分类:人工智能
语言:中文
阅读时间:11 分钟
字数:2573
标签: RAG, 隐性知识, 数字分身, 知识管理, AI应用
阅读完整文章

阅读原文 QR Code 返回目录