← 返回博客
龙虾是怎么学会的?聊聊AI训练的原理
你在飞书上跟龙虾说"我们的招牌奶茶是芋泥波波,大杯18元",下次客户问"你们有什么推荐的",龙虾就能回答"推荐我们的招牌芋泥波波,大杯18元"。
这是怎么做到的?
龙虾的"大脑"结构
每只龙虾有四个核心组件:
- 灵魂设定:它是谁、什么性格、怎么说话(你在控制台设置的)
- 记忆:最近的对话历史(短期记忆)
- 知识库:你教它的所有知识(长期记忆)
- 大语言模型:理解问题、组织回答的"思考引擎"
知识是怎么存储的?
当你教龙虾一条知识,比如"芋泥波波大杯18元",系统会做两件事:
1. 保存原文:把这条知识存到数据库里。
2. 生成"向量":把这句话转换成一串数字(1536个浮点数),这串数字代表了这句话的"含义"。
这个过程叫Embedding(嵌入)。你可以理解为:把一句话变成一个"坐标点",含义相近的话,坐标点也相近。
客户提问时发生了什么?
当客户问"有什么好喝的推荐吗",系统的处理流程是:
第一步:把客户的问题也转换成向量(坐标点)。
第二步:在知识库里找到跟这个坐标点最近的几条知识。"芋泥波波大杯18元"的含义跟"好喝的推荐"很接近,所以会被找到。
第三步:把找到的知识、灵魂设定、对话历史一起交给大语言模型。
第四步:大语言模型根据这些信息,生成一个自然、得体的回答。
这个技术叫RAG(Retrieval-Augmented Generation,检索增强生成),是2020年Meta AI提出的,现在已经是行业标配。
自我进化是什么?
普通的AI客服只能回答你预设的知识。ClawCuber的龙虾更聪明——它会从每次对话中自动学习。
比如客户问了一个龙虾不会的问题,你接管后回答了。龙虾会自动把你的回答提取为新知识,下次遇到类似问题就能自己回答了。
这些自动提取的知识会先进入"草稿"状态,你可以在控制台审核、修改或删除。
为什么不直接用ChatGPT?
ChatGPT是通用AI,什么都知道一点,但不了解你的业务。
龙虾是专属AI——它只知道你教它的东西,回答更准确、更专业、更符合你的品牌调性。而且它不会胡说八道(我们有内容安全过滤)。
技术很复杂,但使用很简单。你不需要理解向量和RAG,只需要跟龙虾聊天就行。就像你不需要理解发动机原理也能开车一样。