我用 2000 篇文档蒸馏了自己，结果只得到了一个低质 RAG

📌 一句话摘要

作者用 2000 多篇工作文档构建数字分身，最终发现它只是一个能检索显性知识、却无法复刻隐性判断的低质 RAG 系统。

📝 详细摘要

本文作者在离职交接期间，尝试用 Codex 调用飞书 CLI，将自己过去几年积累的 2000 多篇飞书文档和 Axure 原型全部拉取下来，构建多层索引，试图打造一个能替代自己进行业务决策的「数字分身」。然而实际使用后发现，这个系统本质上只是一个低质 RAG：它能检索文档中的结论，但无法理解背后的判断逻辑；能模仿人的口吻，但分不清责任边界；能索引显性知识，却无法触及那些未写入文档的隐性知识。作者以游戏行业产品经理的视角，通过具体案例（如活动功能为什么没做、海外 SDK 的能力边界等）生动展示了 RAG 在复刻人类判断力上的根本局限。文章最后指出，真正的挑战不在于优化检索技术，而在于如何将人脑中那些说不清、写不全却真正决定判断的隐性知识，一层层拆解出来并交给 AI 学习。

💡 主要观点

基于文档构建的数字分身本质上是低质 RAG，只能检索结论，无法理解判断。 RAG 能根据问题找到相关文档，但不知道功能为什么这么设计，因为文档只记录了最终方案，而人脑记住的是「当时为什么暂不支持」这一层判断逻辑。
RAG 能模仿人的口吻，但分不清责任边界，容易产生错误归因。 当业务询问某个项目功能时，数字分身可能回答「这个功能我当时没有考虑到位」，但实际上该项目并非作者负责，说明系统没有理解清楚责任归属。
隐性知识是 RAG 系统难以复刻的核心障碍，显性知识索引无法替代人类判断。 文档记录了「当时怎么做」，但没有完整记录「为什么这么做」「为什么不那么做」「谁能为这个判断负责」，这些未言明的背景信息才是真正决定判断的关键。

💬 文章金句

文档里可能只写了最终方案：'本期暂不支持 XX 功能。'但人脑里记住的往往是另一层内容：'当时为什么暂不支持。'前者是结论，后者才是判断。
人知道的东西，往往比能说出来的更多。
今天的低质 RAG 只是开始。它离真正的'我'还很远，但它已经把下一步该往哪走，露出来了。

📊 文章信息

AI 初评：86

来源：人人都是产品经理

作者：人人都是产品经理

分类：人工智能

语言：中文

阅读时间：11 分钟

字数：2573

标签： RAG, 隐性知识, 数字分身, 知识管理, AI应用

阅读完整文章