分类： AGI

LMDeploy: 你的AI模型部署和服务的全方位解决方案

欢迎来到LMDeploy的世界！LMDeploy是由MMDeploy和MMRazor团队联合打造的一款全面的工具箱，旨在帮助你轻松、高效地实现LLM任务的轻量化、部署和服务。

高效推理引擎 TurboMind

首先，让我为你介绍一下我们的高效推理引擎TurboMind。它是基于FasterTransformer构建的，能以极其高效的方式执行 InternLM、LLaMA、vicuna 等模型在NVIDIA GPU上的推理。想象一下，一个强大且高效的工具正在为你处理复杂的AI计算，这就是TurboMind为你提供的！

交互推理方式

我们知道，在多轮对话中，如果每次都处理整个对话历史，会消耗大量的计算资源。因此，LMDeploy引入了一种交互推理方式。它通过缓存对话过程中attention的k/v值，记住对话历史，避免了重复处理历史会话，提升了推理效率。

多GPU部署和量化

LMDeploy还提供了全面的模型部署和量化支持。无论你的AI模型规模大小，我们都已经完成了验证。这意味着，你可以更自由地选择硬件资源，无需担心模型的部署和量化问题。

persistent batch推理

最后，我们还有一个优化模型执行效率的神秘武器，那就是persistent batch推理。这个功能可以进一步优化你的模型，让你的AI应用运行得更快、更流畅。

LMDeploy就像一个多功能的瑞士军刀，为你的AI模型提供全方位的支持。从高效推理引擎到灵活的模型部署，再到持续优化的推理方式，我们始终在努力为你提供最佳的AI部署和服务解决方案。让我们一起，开启AI的未来！

2023 年 10 月 4 日
打开数学大门的神奇模型——阿贝尔

大家好，今天我想和大家分享一项最新的研究成果。这是由上海交通大学生成式人工智能研究组（GAIR）提出的一款名为“阿贝尔”的大型语言模型，专门用于解决数学问题。

首先，让我们来看看为什么我们需要这样的模型。在当前的大数据时代，人工智能已经成为了我们生活中不可或缺的一部分。然而，尽管人工智能在文本理解和知识理解等任务上表现出色，但在复杂数学推理计算、物理建模、科学发现等领域，人工智能的研究却远未达到我们的期望。这就是为什么GAIR团队决定研发阿贝尔模型，以帮助我们更好地理解和解决数学问题。

那么，阿贝尔模型是如何工作的呢？在阿贝尔模型中，研究者们结合了两种先前的数学解决方法，即CoT（思维链）和PoT（思维程序）。CoT方法通过一步步的自然语言描述来解决问题，但在处理复杂的数学或算法推理过程时，可能会遇到困难。而PoT方法则是通过编程的方式来解决问题，尽管这种方法在处理更抽象的推理场景时可能会遇到困难，但它利用Python解释器来大幅简化数学求解过程。

为了充分利用这两种方法的优点，研究团队创建了一个新的数学混合指令微调数据集MathInstruct，它广泛覆盖了不同的数学领域和复杂程度，并将CoT和PoT原理结合到一起。然后，他们使用这个数据集对模型进行训练，得到了一系列不同大小的阿贝尔模型。

研究者们使用了一系列的数据集来对阿贝尔模型进行评估，结果显示，相比于之前的方法，阿贝尔模型能更好地处理领域外的数据集，并能大幅提升开源LLM的数学推理能力。

阿贝尔模型的出现，无疑为我们解决数学问题提供了一种新的可能。无论你是在日常生活中遇到的购物预算问题，还是在工作中遇到的复杂金融投资问题，阿贝尔模型都能为你提供有效的解决方案。这个新的数学模型，不仅能够应对各种类型的数学问题，还能够在不同的数据集中都取得很好的效果，表现出了强大的泛化能力。这对于我们在日常生活中解决各种数学问题，甚至在更高层次的金融投资、科学研究等领域，都有着巨大的潜力和价值。

你可能会问，我能在哪里找到这个神奇的模型呢？别担心，阿贝尔模型的代码已经在GitHub上开源，研究团队也在Hugging Face发布了训练好的不同大小的模型，供大家免费使用。

参考链接：
论文链接
 代码链接
 数据集与模型链接

2023 年 10 月 2 日

分类： AGI

LMDeploy: 你的AI模型部署和服务的全方位解决方案

高效推理引擎 TurboMind

交互推理方式

多GPU部署和量化

persistent batch推理

打开数学大门的神奇模型——阿贝尔