博客

  • KwaiAgents:基于大型语言模型的通用信息检索代理系统

    人类的好奇心驱使着我们不断探索和理解周围的世界,这也导致了各种工具的发明,以满足我们的求知欲。尽管人类的大脑无法处理和记忆大量信息,但人类在批判性思维、规划、反思以及利用现有工具与世界互动和解释方面表现出色,从而能够高效地找到答案

    最近大型语言模型(LLMs)的进步表明,机器也可能具备上述类似于人类的能力,即使参数数量受限,也能展现出强大的能力。

    在这篇论文中,我们介绍了KwaiAgents,一种基于LLMs的通用信息检索代理系统。在KwaiAgents中,我们提出了一个代理系统,它以LLMs作为认知核心,能够理解用户的查询、行为指南和外部文档的引用。该代理还可以从内部存储器中更新和检索信息,使用基于时间的搜索浏览工具包进行规划和执行操作,并最终提供全面的响应。我们进一步研究了系统在由GPT-4更低级别的LLMs提供支持时的性能,并引入了Meta-Agent Tuning(MAT)框架,旨在确保开源的7B或13B模型在许多代理系统中表现良好。我们利用基准和人工评估系统的能力进行系统验证。广泛的实验显示了我们代理系统相对于其他自主代理的优势,并凸显了我们经过精调的LLMs的增强的通用代理能力。

    我们在https://github.com/KwaiKEG/KwaiAgents上发布了系统代码、模型、训练数据和基准的lite版本,供公众使用。


    伯特兰·罗素(Bertrand Russell)曾深刻地说过,追求知识是他一生中简单但无比强烈的激情之一。历代人们致力于探索世界的复杂性,创造出精巧的组织和检索工具,以满足无尽的好奇心。

    然而,认知科学的研究表明,人类平均在一小时内会遗忘约50%的新获得信息,这种现象被称为遗忘曲线。当个体试图在没有定期强化的情况下内化知识时,这一观察尤其成立。例如,虽然许多人轻松记得珠穆朗玛峰是“世界上最高的山”,但是“第五高的山”的身份常常会被遗忘。

    然而,人类的优势在于批判性思维、规划、反思和灵活运用外部资源。面对知识空白,人们可以咨询谷歌等搜索引擎,或者求助于维基百科或书籍等知识库。这种认知和足智多谋的独特结合使人类区别于其他物种,常常使我们比最先进的计算机更有洞察力。

  • KwaiAgents: 快手Agent系列

    KwaiAgents是快手快知团队开源的一整套Agent系列工作。这个开源项目包括以下内容:

    动态

    KwaiAgents是由快手快知团队开源的一整套Agent系列工作。这个开源项目包括以下内容:

    • KAgentSys-Lite:这是论文中KAgentSys的轻量版系统,保留了一部分原系统的功能。相比功能齐全的系统,KAgentSys-Lite有一些差异:(1)缺少部分工具;(2)缺乏记忆机制;(3)性能略有降低;(4)使用不同的代码库,Lite版本基于开源项目如BabyAGI和Auto-GPT。尽管有这些变更,KAgentSys-Lite在众多开源Agent系统中仍然具有较好的性能。
    • KAgentLMs:这是经过论文中提出的Meta-agent tuning之后的系列大模型,具备了规划、反思、工具使用等能力。
    • KAgentInstruct:这是一个包含超过20万条经过人工编辑的Agent相关指令微调数据集。
    • KAgentBench:这是一个包含超过3000条经过人工编辑的自动化评测Agent能力数据集,评测维度包括规划、工具使用、反思、总结、人设指令等。

    评测表现

    KwaiAgents提供了一系列模型和数据集来评测Agent的能力。以下是一些关键的模型和数据集:

    模型训练数据Benchmark
    Qwen-7B-MATKAgentInstruct (即将发布)KAgentBench
    Baichuan2-13B-MATKAgentInstruct (即将发布)KAgentBench

    使用指南

    如果你想使用KwaiAgents,以下是一些快速入门指南:

    AgentLMs 系列模型使用

    AgentLMs系列模型是具备规划、反思和工具使用等能力的大模型。你可以按照以下步骤使用这些模型:

    1. 安装依赖:在项目根目录下执行以下命令安装所需的依赖:
    pip install -r requirements.txt
    1. 加载模型:使用Hugging Face Transformers库加载所需的模型,例如:
    from transformers import AutoModelForCausalLM, AutoTokenizer
    
    model_name = "kwaikeg/kagentlms_qwen_7b_mat"
    model = AutoModelForCausalLM.from_pretrained(model_name)
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    1. 生成文本:使用加载的模型生成文本,例如:
    input_text = "今天天气不错,"
    input_ids = tokenizer.encode(input_text, return_tensors="pt")
    output = model.generate(input_ids, max_length=50,# 📚 KwaiAgents: 快手Agent系列工作
    
    <p align="center">
        <a href="/KwaiKEG/KwaiAgents/blob/main/blob/logo.png"><img src="/KwaiKEG/KwaiAgents/raw/main/blob/logo.png" width="400" style="max-width: 100%;"></a>
    </p>
    
    <p align="left">
        <a href="/KwaiKEG/KwaiAgents/blob/main/README.md">English</a> | 中文
    </p>
    
    KwaiAgents是快手快知团队开源的一整套Agent系列工作。这个开源项目包括以下内容:
    
    ### 动态
    
    KwaiAgents是由快手快知团队开源的一整套Agent系列工作。这个开源项目包括以下内容:
    
    - **KAgentSys-Lite**:这是论文中KAgentSys的轻量版系统,保留了一部分原系统的功能。相比功能齐全的系统,KAgentSys-Lite有一些差异:(1)缺少部分工具;(2)缺乏记忆机制;(3)性能略有降低;(4)使用不同的代码库,Lite版本基于开源项目如BabyAGI和Auto-GPT。尽管有这些变更,KAgentSys-Lite在众多开源Agent系统中仍然具有较好的性能。
    
    - **KAgentLMs**:这是经过论文中提出的Meta-agent tuning之后的系列大模型,具备了规划、反思、工具使用等能力。
    
    - **KAgentInstruct**:这是一个包含超过20万条经过人工编辑的Agent相关指令微调数据集。
    
    - **KAgentBench**:这是一个包含超过3000条经过人工编辑的自动化评测Agent能力数据集,评测维度包括规划、工具使用、反思、总结、人设指令等。
    
    ### 评测表现
    
    KwaiAgents提供了一系列模型和数据集来评测Agent的能力。以下是一些关键的模型和数据集:
    
    | 模型                           | 训练数据                                     | Benchmark                                      |
    |-------------------------------|--------------------------------------------|-----------------------------------------------|
    | [Qwen-7B-MAT](https://huggingface.co/kwaikeg/kagentlms_qwen_7b_mat)       | [KAgentInstruct](https://huggingface.co/datasets/kwaikeg/KAgentInstruct) (即将发布) | [KAgentBench](https://huggingface.co/datasets/kwaikeg/KAgentBench)            |
    | [Baichuan2-13B-MAT](https://huggingface.co/kwaikeg/kagentlms_baichuan2_13b_mat) | [KAgentInstruct](https://huggingface.co/datasets/kwaikeg/KAgentInstruct) (即将发布) | [KAgentBench](https://huggingface.co/datasets/kwaikeg/KAgentBench)            |
    
    ### 使用指南
    
    如果你想使用KwaiAgents,以下是一些快速入门指南:
    
    #### AgentLMs 系列模型使用
    
    AgentLMs系列模型是具备规划、反思和工具使用等能力的大模型。你可以按照以下步骤使用这些模型:
    
    1. 安装依赖:在项目根目录下执行以下命令安装所需的依赖:

    pip install -r requirements.txt

    2. 加载模型:使用Hugging Face Transformers库加载所需的模型,例如:


    from transformers import AutoModelForCausalLM, AutoTokenizer

    model_name = “kwaikeg/kagentlms_qwen_7b_mat”
    model = AutoModelForCausalLM.from_pretrained(model_name)
    tokenizer = AutoTokenizer.from_pretrained(model_name)

    3. 生成文本:使用加载的模型生成文本,例如:

    input_text = “今天天气不错,”
    input_ids = tokenizer.encode(input_text, return_tensors=”pt”)
    output = model.generate(input_ids, max_length=50,

人生梦想 - 关注前沿的计算机技术 acejoy.com 🐾 步子哥の博客 🐾 背多分论坛 🐾 借一步网
Page Stats: PV: 1 | UV: 1
Last updated: 2025-05-20 19:28:37
沪ICP备2024052574号-1