博客

KwaiAgents：基于大型语言模型的通用信息检索代理系统

人类的好奇心驱使着我们不断探索和理解周围的世界，这也导致了各种工具的发明，以满足我们的求知欲。尽管人类的大脑无法处理和记忆大量信息，但人类在批判性思维、规划、反思以及利用现有工具与世界互动和解释方面表现出色，从而能够高效地找到答案

最近大型语言模型（LLMs）的进步表明，机器也可能具备上述类似于人类的能力，即使参数数量受限，也能展现出强大的能力。

在这篇论文中，我们介绍了KwaiAgents，一种基于LLMs的通用信息检索代理系统。在KwaiAgents中，我们提出了一个代理系统，它以LLMs作为认知核心，能够理解用户的查询、行为指南和外部文档的引用。该代理还可以从内部存储器中更新和检索信息，使用基于时间的搜索浏览工具包进行规划和执行操作，并最终提供全面的响应。我们进一步研究了系统在由GPT-4更低级别的LLMs提供支持时的性能，并引入了Meta-Agent Tuning（MAT）框架，旨在确保开源的7B或13B模型在许多代理系统中表现良好。我们利用基准和人工评估系统的能力进行系统验证。广泛的实验显示了我们代理系统相对于其他自主代理的优势，并凸显了我们经过精调的LLMs的增强的通用代理能力。

我们在https://github.com/KwaiKEG/KwaiAgents上发布了系统代码、模型、训练数据和基准的lite版本，供公众使用。

伯特兰·罗素（Bertrand Russell）曾深刻地说过，追求知识是他一生中简单但无比强烈的激情之一。历代人们致力于探索世界的复杂性，创造出精巧的组织和检索工具，以满足无尽的好奇心。

然而，认知科学的研究表明，人类平均在一小时内会遗忘约50%的新获得信息，这种现象被称为遗忘曲线。当个体试图在没有定期强化的情况下内化知识时，这一观察尤其成立。例如，虽然许多人轻松记得珠穆朗玛峰是“世界上最高的山”，但是“第五高的山”的身份常常会被遗忘。

然而，人类的优势在于批判性思维、规划、反思和灵活运用外部资源。面对知识空白，人们可以咨询谷歌等搜索引擎，或者求助于维基百科或书籍等知识库。这种认知和足智多谋的独特结合使人类区别于其他物种，常常使我们比最先进的计算机更有洞察力。

2023 年 12 月 27 日

KwaiAgents: 快手Agent系列

KwaiAgents是快手快知团队开源的一整套Agent系列工作。这个开源项目包括以下内容：

动态

KwaiAgents是由快手快知团队开源的一整套Agent系列工作。这个开源项目包括以下内容：

KAgentSys-Lite：这是论文中KAgentSys的轻量版系统，保留了一部分原系统的功能。相比功能齐全的系统，KAgentSys-Lite有一些差异：（1）缺少部分工具；（2）缺乏记忆机制；（3）性能略有降低；（4）使用不同的代码库，Lite版本基于开源项目如BabyAGI和Auto-GPT。尽管有这些变更，KAgentSys-Lite在众多开源Agent系统中仍然具有较好的性能。
KAgentLMs：这是经过论文中提出的Meta-agent tuning之后的系列大模型，具备了规划、反思、工具使用等能力。
KAgentInstruct：这是一个包含超过20万条经过人工编辑的Agent相关指令微调数据集。
KAgentBench：这是一个包含超过3000条经过人工编辑的自动化评测Agent能力数据集，评测维度包括规划、工具使用、反思、总结、人设指令等。

评测表现

KwaiAgents提供了一系列模型和数据集来评测Agent的能力。以下是一些关键的模型和数据集：

模型	训练数据	Benchmark
Qwen-7B-MAT	KAgentInstruct (即将发布)	KAgentBench
Baichuan2-13B-MAT	KAgentInstruct (即将发布)	KAgentBench

使用指南

如果你想使用KwaiAgents，以下是一些快速入门指南：

AgentLMs 系列模型使用

AgentLMs系列模型是具备规划、反思和工具使用等能力的大模型。你可以按照以下步骤使用这些模型：

安装依赖：在项目根目录下执行以下命令安装所需的依赖：

pip install -r requirements.txt

加载模型：使用Hugging Face Transformers库加载所需的模型，例如：

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "kwaikeg/kagentlms_qwen_7b_mat"
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

生成文本：使用加载的模型生成文本，例如：

input_text = "今天天气不错，"
input_ids = tokenizer.encode(input_text, return_tensors="pt")
output = model.generate(input_ids, max_length=50,# 📚 KwaiAgents: 快手Agent系列工作

<p align="center">
    <a href="/KwaiKEG/KwaiAgents/blob/main/blob/logo.png"><img src="/KwaiKEG/KwaiAgents/raw/main/blob/logo.png" width="400" style="max-width: 100%;"></a>
</p>

<p align="left">
    <a href="/KwaiKEG/KwaiAgents/blob/main/README.md">English</a> ｜ 中文
</p>

KwaiAgents是快手快知团队开源的一整套Agent系列工作。这个开源项目包括以下内容：

### 动态

KwaiAgents是由快手快知团队开源的一整套Agent系列工作。这个开源项目包括以下内容：

- **KAgentSys-Lite**：这是论文中KAgentSys的轻量版系统，保留了一部分原系统的功能。相比功能齐全的系统，KAgentSys-Lite有一些差异：（1）缺少部分工具；（2）缺乏记忆机制；（3）性能略有降低；（4）使用不同的代码库，Lite版本基于开源项目如BabyAGI和Auto-GPT。尽管有这些变更，KAgentSys-Lite在众多开源Agent系统中仍然具有较好的性能。

- **KAgentLMs**：这是经过论文中提出的Meta-agent tuning之后的系列大模型，具备了规划、反思、工具使用等能力。

- **KAgentInstruct**：这是一个包含超过20万条经过人工编辑的Agent相关指令微调数据集。

- **KAgentBench**：这是一个包含超过3000条经过人工编辑的自动化评测Agent能力数据集，评测维度包括规划、工具使用、反思、总结、人设指令等。

### 评测表现

KwaiAgents提供了一系列模型和数据集来评测Agent的能力。以下是一些关键的模型和数据集：

| 模型                           | 训练数据                                     | Benchmark                                      |
|-------------------------------|--------------------------------------------|-----------------------------------------------|
| [Qwen-7B-MAT](https://huggingface.co/kwaikeg/kagentlms_qwen_7b_mat)       | [KAgentInstruct](https://huggingface.co/datasets/kwaikeg/KAgentInstruct) (即将发布) | [KAgentBench](https://huggingface.co/datasets/kwaikeg/KAgentBench)            |
| [Baichuan2-13B-MAT](https://huggingface.co/kwaikeg/kagentlms_baichuan2_13b_mat) | [KAgentInstruct](https://huggingface.co/datasets/kwaikeg/KAgentInstruct) (即将发布) | [KAgentBench](https://huggingface.co/datasets/kwaikeg/KAgentBench)            |

### 使用指南

如果你想使用KwaiAgents，以下是一些快速入门指南：

#### AgentLMs 系列模型使用

AgentLMs系列模型是具备规划、反思和工具使用等能力的大模型。你可以按照以下步骤使用这些模型：

1. 安装依赖：在项目根目录下执行以下命令安装所需的依赖：

pip install -r requirements.txt

2. 加载模型：使用Hugging Face Transformers库加载所需的模型，例如：

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = “kwaikeg/kagentlms_qwen_7b_mat”
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

3. 生成文本：使用加载的模型生成文本，例如：

input_text = “今天天气不错，”
input_ids = tokenizer.encode(input_text, return_tensors=”pt”)
output = model.generate(input_ids, max_length=50,

2023 年 12 月 27 日

博客

KwaiAgents：基于大型语言模型的通用信息检索代理系统

KwaiAgents: 快手Agent系列

动态

评测表现

使用指南

AgentLMs 系列模型使用