前言
在网上看到一个有趣的项目叫做 Talk To Your Ex,目标是支持导入你和前任的聊天记录,然后制作一个AI来模拟你的前任聊天。可惜这个项目现在还没有实现,不然我反手转发给我为情所伤的好兄弟(
于是我在想,现在LLM技术已经很成熟了,有没有人已经实现了用微信聊天记录训练LLM,或者是使用RAG技术,来模仿聊天的呢?
我找到了下面这些项目,记录在这里,大家感兴趣可以玩玩。
WeChat-LLM: 根据微信聊天记录定制私人聊天机器人
基于 LlamaIndex 实现,使用 Sentence Window Retrieval,通过从历史聊天记录中检索相关的句子,作为 few-shot 的输入,通过 prompt 让模型学习语言风格,从而实现模仿聊天风格的目的。
简单来说,采用的是 RAG 的技术来模拟说话习惯。
Chat4U
解密了微信聊天记录的数据,使用微信聊天记录微调 LLAMA-7B,训练完成后支持前端体验,也可以支持接入微信。
基于ChatGLM2-INT4 + LoRA训练一个属于自己的微信聊天机器人(Kaggle + Colab)
和上一个项目类似,但是这个教程应该更详细一点,并且可以用 Colab 进行训练,没有显卡也可以。
结语
希望你只是了解一下上面的技术,永远也用不到 希望你想聊天的人一直都在你身边
By the way,珍惜眼前人