獾乐AI架构之知识库引擎 · 獾乐干货指南

一句话理解：AI知识库就是AI的大脑记忆。没有知识库，AI再聪明也只是个"空壳"。

这是“AI行动”专栏的第二篇。我想从第一人称讲一件更底层的事：我为什么要花大量时间整理知识库，以及我怎么把獾乐11年的课程、赛事、教务和运营经验，变成AI能够调用的记忆。

一、知识库：AI的大脑

想象一下，我请了一位刚从名校毕业的天才助手。他思维敏捷、逻辑严密、学习能力超强。但我让他帮我处理獾乐的教务工作，他一脸茫然——因为他对獾乐一无所知。

这不是他的问题，是你没有给他知识。

AI大模型在诞生之前，已经学习了海量的通用知识——牛顿定律、莎士比亚、Python语法——这都是"通识教育"。但一旦涉及到獾乐的内部知识——我的课程体系怎么分级？赛事规则有哪些特殊条款？续费流程走到哪一步要提醒？——任何一个通用AI都不知道。

这就是知识库存在的意义。

所以我给獾乐搭知识库，本质上是在给AI植入一套獾乐专属的"大脑记忆"。它让一个通用AI逐步变成一个懂獾乐的工作伙伴。

二、知识面：390+文件构筑的数字资产

当很多机构的"知识库"还停留在几个Word文档时，我已经把獾乐的知识库整理成了一个涵盖390+文件的系统工程。

这些文件覆盖了獾乐运营的每一个维度：

课程体系

各年龄段课程大纲与教学目标
竞赛班培养路线图
试听课标准化流程与话术
课程迭代记录与效果评估

赛事规则

VEX/VEX IQ/格斗机器人等竞赛规则库
历年赛事真题与解题思路
裁判判分标准与技术要点
赛事报名与备赛时间线

价格策略

标准价格表与优惠政策
续费折扣计算逻辑
转介绍奖励机制

运营流程

日常运营SOP（标准操作流程）
消课排课自动化规则
公众号更新排期
活动策划模板

销售话术

初次到访家长接待话术
体验课跟单流程
续费沟通策略

学员档案

学习进度与技能评估
行为记录与个性化建议
竞赛获奖与荣誉记录

这是一个不断膨胀的知识体。从最初的几十份文档，到如今390+文件、数千个知识节点，我越来越清楚地意识到：这已经超越了任何一位员工个人能掌握的范畴。

三、技术架构：三层分工，各司其职

如果你打开我整理的獾乐知识库目录，会看到清晰的层级结构：

```

knowledge_base/

├── master_hub/ # 运营文档层

├── kb/ # 知识库层

└── data/ # 数据层

```

master_hub：运营文档层

这是最顶层，存放我认为不能轻易改动的运营"宪法"——核心运营文档、标准化流程、教学大纲等。master_hub中的文档经过严格审核，是AI引擎做决策时的最高依据。

kb：知识库层

这是中间层，也是AI最常读取的内容。tip_card体系（教学提示卡）、课程设计文档、赛事分析报告、话术模板等都在这一层。知识的颗粒度更细，更新频率更高。

data：数据层

这是底层，存放结构化数据——学员名单、课程表、消课记录、财务数据等。data层的数据通常需要经过过滤、脱敏后才进入AI的读取范围。

关键技术组件

除了文件分层，我还给獾乐知识库配置了几个关键技术组件：

INDEX自动索引

每次知识库内容更新，系统自动扫描文件树，生成索引条目。AI在查找知识时，先查INDEX定位目标，再精确读取对应文件，而不是大海捞针式地搜索。

engine_event.py事件驱动

这是我给獾乐AI引擎设计的核心调度器。它不是定时打卡器，而是一个事件驱动的传送带。当"学员续费到期"事件发生，引擎自动拉起续费流程；当"新知识入库"事件发生，引擎自动更新索引。非轮询，非定时——有事件就触发，没有就等待。

content_pipeline内容管线

当AI生成了一篇推文、一个教案、一段话术，内容不会凭空消失。content_pipeline负责把这些新内容归档、格式化、存入知识库的对应层级。这构成了知识库自循环的关键一环。

四、獾乐AI的五项特色能力

我不希望獾乐的知识库只是冷冰冰的文件仓库。我真正想做的是，让它具备五项持续进化的能力：

1. 多AI协作，不是单个AI

大多数知识库系统依赖单个AI模型。我在獾乐不是这样做的。

巴斯（Hermes）是总调度，负责理解任务、分配工作。Codex CLI负责代码开发和执行。至尊宝（ZCode）负责教务数据处理。三个AI共享同一套知识库，但各自动用知识库的方式不同——巴斯偏向语义理解，Codex偏向代码知识检索，至尊宝偏向结构化数据查询。

这是真正的多智能体分布式知识消费。

2. 事件驱动传送带，不是打卡器

传统知识库系统是"你来问我"的被动模式。我想把獾乐的知识库做成事件驱动的。

当新学员报名成功，系统自动从知识库中提取最适合该年龄段的课程推荐方案，为教务和老师提供参考。

知识库不是被"翻"出来的，而是被事件拉出来的。

3. 知识库自迭代

AI不只是读知识库，AI也写知识库。

当老师用AI备了一堂好课，备课记录被content_pipeline处理后，变成了知识库中一条新的教案记录。当运营写了一篇高转化的推文，AI生成的草稿和最终发布版本都被归档，成为下一次写作的参考素材。

知识库在自我生长。今年有390份文件，明年可能超过1000份。很多公司的知识库越用越旧，我希望獾乐的知识库越用越厚。

4. 跨会话记忆

AI做完一件事后，不会"失忆"。

巴斯通过memory工具保存关键信息：用户偏好、环境细节、稳定的事实。通过session_search，AI可以回溯过去的会话历史，了解之前处理过什么、做出了什么决策、有什么待办事项。

这解决了一个核心痛点：AI不会在第二天把你当陌生人。

5. 分层权限

不是所有AI都能读取所有知识。

我拥有全权限——可以读写所有层级、所有文件。老师的AI能访问限定的运营知识和备课提示卡，但不能触及底层的财务数据和敏感学员信息。

这种分层设计既保证了AI的战斗力，又守住了安全的底线。

五、数字资产的真正价值

我有一句话在獾乐团队里流传很广：

"知识库是獾乐的数字资产，比教室和设备更值钱。"

理由很简单：教室会到期，设备会折旧，但知识库的内容会不断累积、持续增值。

一套VEX的器材用三年就换代了，但一份教了300个学员后总结出来的"齿轮传动入门教学方案"，每用一次都产生价值。而且越多AI读取它、越多老师用它备课、越多学员从它受益，它的价值就越大——因为新的反馈又回流进来，让它变得更好。

这就是数据飞轮效应。知识库是飞轮的轴心。

六、未来展望

接下来，我还想继续推进三个方向：

知识图谱

当前的390+文件虽然是分层的，但彼此之间的关联关系还不够清晰。下一步是将这些文件抽象为知识节点，构建知识图谱——从"文件"层面上升到"知识点"层面。届时AI将能从"齿轮传动比"这个知识点，自动关联到相关课程、竞赛考点、常见错误、教学建议，形成一张完整的知识网络。

自动备课

当知识图谱完善后，AI将能实现高度自动化的备课——输入学员画像和目标课程，AI自动从知识库中抽取最相关的教学策略、互动方案、练习设计，生成完整的教案包。老师只需要做"最后一公里"的个性化调整。

智能选课推荐

基于学员的学习轨迹和知识库中完整的课程体系数据，AI将能为每位学员推荐最优的学习路径——不是简单地"你该上这个班"，而是根据学员的薄弱点、兴趣方向、竞赛目标，生成个性化的课程组合方案。

当知识库足够强大时，AI不再是一个"问答机器人"——它会变成獾乐的数字大脑。而这，才是我真正想做的事情。