一句话理解:AI知识库就是AI的大脑记忆。没有知识库,AI再聪明也只是个"空壳"。
这是“AI行动”专栏的第二篇。我想从第一人称讲一件更底层的事:我为什么要花大量时间整理知识库,以及我怎么把獾乐11年的课程、赛事、教务和运营经验,变成AI能够调用的记忆。
想象一下,我请了一位刚从名校毕业的天才助手。他思维敏捷、逻辑严密、学习能力超强。但我让他帮我处理獾乐的教务工作,他一脸茫然——因为他对獾乐一无所知。
这不是他的问题,是你没有给他知识。
AI大模型在诞生之前,已经学习了海量的通用知识——牛顿定律、莎士比亚、Python语法——这都是"通识教育"。但一旦涉及到獾乐的内部知识——我的课程体系怎么分级?赛事规则有哪些特殊条款?续费流程走到哪一步要提醒?——任何一个通用AI都不知道。
这就是知识库存在的意义。
所以我给獾乐搭知识库,本质上是在给AI植入一套獾乐专属的"大脑记忆"。它让一个通用AI逐步变成一个懂獾乐的工作伙伴。
当很多机构的"知识库"还停留在几个Word文档时,我已经把獾乐的知识库整理成了一个涵盖390+文件的系统工程。
这些文件覆盖了獾乐运营的每一个维度:
课程体系
赛事规则
价格策略
运营流程
销售话术
学员档案
这是一个不断膨胀的知识体。从最初的几十份文档,到如今390+文件、数千个知识节点,我越来越清楚地意识到:这已经超越了任何一位员工个人能掌握的范畴。
如果你打开我整理的獾乐知识库目录,会看到清晰的层级结构:
```
knowledge_base/
├── master_hub/ # 运营文档层
├── kb/ # 知识库层
└── data/ # 数据层
```
这是最顶层,存放我认为不能轻易改动的运营"宪法"——核心运营文档、标准化流程、教学大纲等。master_hub中的文档经过严格审核,是AI引擎做决策时的最高依据。
这是中间层,也是AI最常读取的内容。tip_card体系(教学提示卡)、课程设计文档、赛事分析报告、话术模板等都在这一层。知识的颗粒度更细,更新频率更高。
这是底层,存放结构化数据——学员名单、课程表、消课记录、财务数据等。data层的数据通常需要经过过滤、脱敏后才进入AI的读取范围。
除了文件分层,我还给獾乐知识库配置了几个关键技术组件:
INDEX自动索引
每次知识库内容更新,系统自动扫描文件树,生成索引条目。AI在查找知识时,先查INDEX定位目标,再精确读取对应文件,而不是大海捞针式地搜索。
engine_event.py事件驱动
这是我给獾乐AI引擎设计的核心调度器。它不是定时打卡器,而是一个事件驱动的传送带。当"学员续费到期"事件发生,引擎自动拉起续费流程;当"新知识入库"事件发生,引擎自动更新索引。非轮询,非定时——有事件就触发,没有就等待。
content_pipeline内容管线
当AI生成了一篇推文、一个教案、一段话术,内容不会凭空消失。content_pipeline负责把这些新内容归档、格式化、存入知识库的对应层级。这构成了知识库自循环的关键一环。
我不希望獾乐的知识库只是冷冰冰的文件仓库。我真正想做的是,让它具备五项持续进化的能力:
大多数知识库系统依赖单个AI模型。我在獾乐不是这样做的。
巴斯(Hermes)是总调度,负责理解任务、分配工作。Codex CLI负责代码开发和执行。至尊宝(ZCode)负责教务数据处理。三个AI共享同一套知识库,但各自动用知识库的方式不同——巴斯偏向语义理解,Codex偏向代码知识检索,至尊宝偏向结构化数据查询。
这是真正的多智能体分布式知识消费。
传统知识库系统是"你来问我"的被动模式。我想把獾乐的知识库做成事件驱动的。
当新学员报名成功,系统自动从知识库中提取最适合该年龄段的课程推荐方案,为教务和老师提供参考。
知识库不是被"翻"出来的,而是被事件拉出来的。
AI不只是读知识库,AI也写知识库。
当老师用AI备了一堂好课,备课记录被content_pipeline处理后,变成了知识库中一条新的教案记录。当运营写了一篇高转化的推文,AI生成的草稿和最终发布版本都被归档,成为下一次写作的参考素材。
知识库在自我生长。今年有390份文件,明年可能超过1000份。很多公司的知识库越用越旧,我希望獾乐的知识库越用越厚。
AI做完一件事后,不会"失忆"。
巴斯通过memory工具保存关键信息:用户偏好、环境细节、稳定的事实。通过session_search,AI可以回溯过去的会话历史,了解之前处理过什么、做出了什么决策、有什么待办事项。
这解决了一个核心痛点:AI不会在第二天把你当陌生人。
不是所有AI都能读取所有知识。
我拥有全权限——可以读写所有层级、所有文件。老师的AI能访问限定的运营知识和备课提示卡,但不能触及底层的财务数据和敏感学员信息。
这种分层设计既保证了AI的战斗力,又守住了安全的底线。
我有一句话在獾乐团队里流传很广:
"知识库是獾乐的数字资产,比教室和设备更值钱。"
理由很简单:教室会到期,设备会折旧,但知识库的内容会不断累积、持续增值。
一套VEX的器材用三年就换代了,但一份教了300个学员后总结出来的"齿轮传动入门教学方案",每用一次都产生价值。而且越多AI读取它、越多老师用它备课、越多学员从它受益,它的价值就越大——因为新的反馈又回流进来,让它变得更好。
这就是数据飞轮效应。知识库是飞轮的轴心。
接下来,我还想继续推进三个方向:
知识图谱
当前的390+文件虽然是分层的,但彼此之间的关联关系还不够清晰。下一步是将这些文件抽象为知识节点,构建知识图谱——从"文件"层面上升到"知识点"层面。届时AI将能从"齿轮传动比"这个知识点,自动关联到相关课程、竞赛考点、常见错误、教学建议,形成一张完整的知识网络。
自动备课
当知识图谱完善后,AI将能实现高度自动化的备课——输入学员画像和目标课程,AI自动从知识库中抽取最相关的教学策略、互动方案、练习设计,生成完整的教案包。老师只需要做"最后一公里"的个性化调整。
智能选课推荐
基于学员的学习轨迹和知识库中完整的课程体系数据,AI将能为每位学员推荐最优的学习路径——不是简单地"你该上这个班",而是根据学员的薄弱点、兴趣方向、竞赛目标,生成个性化的课程组合方案。
当知识库足够强大时,AI不再是一个"问答机器人"——它会变成獾乐的数字大脑。而这,才是我真正想做的事情。