月度归档： 2024 年 8 月

量化最优答案集的研究
引言：扩展回答集编程的边界

在过去的几十年里，回答集编程（ASP）作为一种强大的逻辑编程范式，已经被广泛应用于解决各种搜索和优化问题。尽管ASP在解决多种实际问题方面表现出色，但其原始形式的表达能力仍然受到限制，特别是在处理更高复杂度的问题时。随着对复杂问题需求的增加，研究者们提出了ASP的扩展版本，尤其是加入量化的版本——带量化的回答集编程（ASP(Q)）。然而，尽管这一扩展能够自然地表示多项式层次中的问题，但在处理需要多次调用Σp_n类的oracle（即Δp_{n+1}类问题）时，仍显得力不从心。

本篇文章将介绍一种新的ASP(Q)扩展形式，称为ASPω(Q)，该形式允许在量化的子程序中使用弱约束。这种弱约束使得在量化子程序内部可以表达局部优化，同时也能为全局优化标准建模。通过多个应用场景的实例，我们将展示这一新形式的建模能力及其计算性质。

理论基础：回答集编程

ASP的基本语法

在ASP中，程序由一组规则构成，每条规则的形式为：

$h \leftarrow b_1, \ldots, b_k, \sim b_{k+1}, \ldots, \sim b_m$

其中， $h$ 为规则的头， $b_i$ 为规则的身体， $\sim$ 表示否定。除了标准规则外，ASP中还引入了弱约束的概念，其形式为：

$\leftarrow_w b_1, \ldots, b_k, \sim b_{k+1}, \ldots, \sim b_m [w@l, T]$

这种弱约束被引入以便对答案集进行偏好排序，提供了一种在答案集之间进行比较的方法。

ASP(Q)的引入

ASP(Q)的引入为逻辑编程提供了一个自然的声明式手段，能够涵盖整个多项式层次中的问题。这种形式使得我们可以通过引入量化符号来扩展ASP的表达能力，例如，通过存在量化符号 $\exists$ 和全称量化符号 $\forall$ 来描述更加复杂的问题。

ASPω(Q)的提出

弱约束的双重功能

在ASPω(Q)中，弱约束的引入具有双重功能：一方面，它可以表达量化子程序内部的局部优化；另一方面，它也可以用于全局优化标准的建模。这一特性大大增强了语言的建模效率，使得ASP能够更有效地应对复杂的优化问题。

在此，我们将通过几个具体的案例来展示ASPω(Q)的建模能力和计算特性。

案例分析：最小最大团问题

最小最大团问题是一个著名的优化问题，涉及到在给定图中找到最小的最大团。我们可以通过以下程序来建模该问题：
```
P1 =
{
    v(i, j, a) ← ∀i ∈ I, j ∈ J, a ∈ A_{i,j}
    inI(i) ← ∀i ∈ I
    inJ(j) ← ∀j ∈ J
    e(x, y) ← ∀(x, y) ∈ E
    {f(i, j) : inJ(j)} = 1 ← inI(i)
    {valK(1); ...; valK(|V|)} = 1
}
```
在上述程序中， $P1$ 负责建模图的节点和边， $P2$ 则计算最大团的大小。通过使用弱约束，我们可以确保选出的团的大小尽可能小。

复杂性分析

在对ASPω(Q)程序的复杂性进行分析时，我们发现其一致性问题的复杂度在于：存在量化程序的复杂度为 $\Sigma^P_{n+1}$ ，而全称量化程序的复杂度则为 $\Pi^P_{n+1}$ 。这一发现提供了对ASPω(Q)的深刻理解，使我们能够在实际应用中进行合理的复杂性预期。

结论

本文提出的ASPω(Q)为回答集编程提供了新的扩展，能够有效地处理复杂的优化问题。通过引入弱约束，我们不仅增强了语言的表达能力，还开辟了新的研究方向。未来的工作将集中在进一步加强复杂性的界限、扩展ASPω(Q)以支持子集最小性以及基于ASPω(Q)的复杂性感知实现等方面。

参考文献
1. Amendola, R., Fandinno, J., & Ricca, F. (2019). Answer Set Programming with Quantifiers.
2. Brewka, G., Eiter, T., & McGuinness, D. L. (2011). Knowledge Representation.
3. Buccafurri, F., & Faber, W. (2000). Weak Constraints in Logic Programming.
4. Schaefer, M., & Umans, C. (2002). Completeness in the Polynomial-Time Hierarchy.
5. Wagner, K. W. (1990). Bounded Query Classes.
2024 年 8 月 16 日
用先进的大型语言模型提升小型语言模型的可解释知识蒸馏方法
引言

近年来，随着大型语言模型（LLMs）如GPT-4和LlaMa 3的不断进步，它们在复杂的人类交互中展现出了卓越的性能。然而，这些先进模型往往体积庞大且成本高昂，不适合在智能手机等边缘设备上部署，并且在自我托管时可能引发安全和隐私问题。因此，越来越多的企业开始关注如何提升小型、经济实惠的LLMs的性能，使其能够在实际应用中达到更高的客户满意度。

本论文提出了一种新的可解释知识蒸馏方法，旨在通过更强大的“教师”模型来增强小型“学生”模型的性能。与传统的知识蒸馏方法不同，我们的“策略”教学方法让教师模型提供策略，以帮助学生模型在不同场景中提升表现。这种方法在“场景生成”和“改善策略”两个步骤之间交替进行，从而创建一个定制的场景库和优化的策略，用于自动提示。

知识蒸馏的背景

知识蒸馏是一个广泛应用于多种上下文的概念，它的核心在于通过更强大的模型来增强性能较弱的模型。在传统的知识蒸馏中，教师模型通过生成训练数据来训练学生模型，这通常涉及到对模型参数的微调。然而，这种方法存在一些局限性，例如需要对模型参数进行访问和更新，这在许多情况下并不可行，尤其是在仅允许API访问的LLMs中。此外，蒸馏后的“知识”往往被封装在模型参数中，使其对人类不可理解，这极大地增加了调试的难度并引发安全隐患。

我们提出的可解释知识蒸馏方法，通过构建一个知识库，让学生模型在不改变自身参数的情况下进行查询。这一知识库包括在部署过程中学生可能遇到的代表性场景及其对应的策略。每个场景通过教师与客户之间的对话进行表示，而相应的策略则指导学生如何在对话中做出回应。

场景生成与策略教学

在我们的迭代过程中，首先进行场景生成，教师模型与客户进行交互，生成多样化的对话。为了克服分布迁移的问题，我们确保在场景生成中，学生模型逐渐增加参与的概率，从而使学生在整个过程中占据主导地位。在策略学习阶段，教师模型会评估自己的和学生的回答，并为学生提供针对性的策略建议。这些策略会被纳入后续的提示中，通过反复精炼来提升学生模型的表现。

实验与结果

我们在多个学生模型上评估了该方法的有效性，包括LlaMa-2 7b、LlaMa-2 13b、LlaMa-2 70b 和GPT-3.5。实验结果显示，策略教学比简单的响应教学更有效，尤其是在多轮对话生成的任务中。具体来说，定制化的策略比通用策略更加有效，因为前者可以为不同场景提供更有针对性的指导。此外，尽管库是针对特定学生和情境学习的，但它也包含可以在不同模型和上下文中转移的共同知识。

结论

本研究的结果表明，通过我们的可解释知识蒸馏方法，小型LLMs能够在客户服务的具体任务上达到与大型LLMs相近的表现。这一方法不仅在客户满意度上超越了传统的微调方法，还增强了模型的可解释性。这种透明性大大提高了AI的安全性，便于专家对模型决策过程进行审核。

随着LLMs在市场营销等多个领域的广泛应用，我们希望我们的研究能够推动小型模型的更大普及，使其在各种挑战性任务中发挥更大作用。

参考文献
1. Hinton, G., Vinyals, O., & Dean, J. (2015). Distilling the Knowledge in a Neural Network.
2. Sanh, V., et al. (2019). DistilBERT, a distilled version of BERT: smaller, faster, cheaper, and lighter.
3. Lewis, M., et al. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks.
4. Ham, J. et al. (2020). Goal-oriented Dialogue Systems.
5. Wang, T., et al. (2024). Using Advanced LLMs to Enhance Smaller LLMs.
2024 年 8 月 16 日