📚 本地知识库 — 你的文字只属于你
很多 AI 工具要求你把文件上传到云端才能使用"知识库"功能。 GPT AI Flow 不一样:你的笔记从不离开你的电脑。
本地知识库是 GPT AI Flow 所有智能功能的基石——无论是语义搜索、相关笔记发现,还是 AI 对话中的知识检索,背后都依赖它。而它最核心的承诺是:数据完全存储在你的电脑本地。
在 LLM-wiki 体系里,这一层就是 Raw sources 的摄入基础设施: 先把原始资料稳定索引,后续问答与整理才有可靠依据。
为什么要先建立知识库?
你在 Obsidian 里积累的笔记,就像藏在书架上的宝藏。但如果没有目录,需要的时候根本找不到。本地知识库做的事,就是帮你把每一篇笔记都"读懂"、整理好——这样当你用自然语言搜索、或者和 AI 对话时,系统才能真正"知道"你写过什么,给你精准的答案。
它为你做了什么?
你不需要理解"向量数据库"或"文本嵌入"这些技术名词。你只需要知道:
开启本地知识库后,你的笔记就会变"聪明"。
| 之前 | 之后 |
|---|---|
| 搜笔记只能靠关键词 | 用自然语言描述就能找到 |
| AI 对话只有通用知识 | AI 能参考你自己写的内容来回答 |
| 笔记越多越难管理 | 笔记越多,AI 越能帮你发现关联 |
| 上传到云端才能分析 | 一切都在你电脑上,不需要联网 |
支持什么文件?
| 文件类型 | 支持程度 |
|---|---|
| Markdown 文件 | ✅ 完整支持,智能分段(按标题层级切分) |
| PDF 文件 | ✅ 自动提取文字内容 |
| 图片文件 | ✅ OCR 识别图片中的文字(支持中英文) |
智能分段
不是把一整篇文章作为一个整体来索引——那样搜索精度太低。GPT AI Flow 会按照你的 Markdown 标题结构自动分段:
# 我的文章 ← 段落 1
正文内容...
## 第一章 ← 段落 2
第一章的内容...
### 1.1 小节 ← 段落 3
小节内容...
## 第二章 ← 段落 4
第二章的内容...
每个段落独立索引,搜索时能精准定位到具体的段落,而不是只告诉你"在某篇文章里"。
补充说明:
- 分段会尽量保留标题上下文,避免“只命中一句话却看不懂出处”
- 长段落会自动切成更小片段,减少召回时的噪声
- 常见向量维度配置为 1024 或 1536,用户无需手动干预,保持默认即可
隐私与安全
这是本地知识库最重要的特性:
你的数据,你掌控
- 📍 数据存储位置:你的电脑本地,在 Obsidian Vault 目录内
- 🚫 不上传云端:索引文件不会被发送到任何服务器
- 🔒 不依赖外部服务:索引和搜索过程完全在本地完成
- 🗑️ 随时可删:你可以随时删除索引文件,不影响原始笔记
很多 AI 工具的"知识库"功能需要把你的文件上传到第三方服务器——你不知道数据会被如何使用、是否会被用于模型训练。GPT AI Flow 从设计之初就选择了本地优先的方案。
索引过程
首次索引
第一次开启本地知识库时,系统会扫描你的 Obsidian Vault,对所有支持的文件建立索引。
- 索引在后台进行,不会阻塞你的正常使用
- 索引速度取决于你的笔记数量和电脑性能
- 你可以随时查看索引进度
增量更新
首次索引完成后,系统会自动检测文件变化:
- 新增笔记 → 自动索引
- 修改笔记 → 自动重新索引该笔记
- 删除笔记 → 自动从索引中移除
你不需要手动触发任何操作。