博客

联邦学习：保护隐私，共同进步
近年来，人工智能技术飞速发展，机器学习模型在各个领域都取得了显著成果。然而，传统的机器学习方法通常需要将所有数据集中到一个中央服务器进行训练，这可能会引发数据隐私和安全问题。为了解决这一问题，联邦学习应运而生。

联邦学习：数据不共享，模型共训练

通俗来说，联邦学习就像一群人共同学习一项技能，每个人都拥有自己的学习资料，但他们可以互相交流学习方法，最终共同提高技能水平。在联邦学习中，多个设备或数据源在不共享原始数据的情况下，共同训练模型以提高预测性能。

联邦学习的工作原理

联邦学习的工作方式可以概括为以下几个步骤：
1. 初始化阶段： 中央服务器或云端会初始化一个全局模型。
2. 本地训练： 参与方（本地设备）使用自己的本地数据集对全局模型进行训练，这个训练过程只在本地设备上进行，不会共享原始数据。
3. 模型聚合： 参与方将训练得到的模型参数更新发送回中央服务器，中央服务器对这些参数进行聚合，得到一个新的全局模型。
4. 迭代更新： 重复进行本地训练和模型聚合的过程，直到全局模型收敛到一个满意的状态。
联邦学习的优势

联邦学习的优势主要体现在以下几个方面：
- 数据隐私保护： 原始数据保留在本地，不需要共享，因此可以更好地保护数据隐私。
- 降低数据传输需求： 仅传输模型参数更新，而不是原始数据，从而减少了数据传输的需求。
- 适用于分布式数据： 适用于数据分布在不同地点或设备上的情况，如移动设备上的个人数据。
异构联邦学习：应对现实世界中的差异

联邦学习的核心理念是将模型训练分布在多个参与方之间，保护数据隐私的同时提高模型的整体性能。然而，现实世界中的数据分布、模型结构、通信网络和系统边缘设备存在很大差异，这些差异被称为异构性。

异构联邦学习的主要特点

异构联邦学习面临着以下几个方面的挑战：
- 异构数据： 参与方的数据可能来自不同的领域、行业或地区，具有不同的特征分布和属性。
- 异构计算能力： 不同参与方的计算能力可能不同，有些设备可能更强大，而其他设备可能计算资源有限。
- 异构通信环境： 不同参与方之间的通信环境也可能不同，有些设备可能具有较快的网络连接，而其他设备可能连接较慢。
- 异构模型： 不同参与方所希望用到的模型更加的本地化，因此不同参与方用到的模型有所差异。
异构联邦学习的分类

为了应对这些异构性，异构联邦学习采取了一些策略，并被分为以下三个层次：
- 数据层： 在客户端之间对数据进行操作，以减少局部数据的统计异质性或提高数据隐私。
- 模型层： 在模型层面设计的操作，例如共享部分模型结构和模型优化。
- 服务器层： 服务器级方法需要服务器的参与，例如参与客户端选择或客户端聚类。
数据层方法

数据层方法主要包括数据准备和数据隐私保护。数据准备包括数据收集、过滤、清洗、增强等操作，可以缓解统计异质性。数据隐私保护则通过数据加密、扰动和匿名化等技术来保护客户端数据的隐私。

模型层方法

模型层方法主要包括联邦优化、跨模型的知识转移和架构共享。联邦优化通过正则化、元学习和多任务学习等技术来提高模型的适应性。跨模型的知识转移则通过知识蒸馏和迁移学习等技术来实现模型之间的协作。架构共享则通过共享部分模型结构来提高模型的效率。

服务器层方法

服务器层方法主要包括客户端选择和客户端聚类。客户端选择是指选择合适的客户端参与训练，以提高模型的性能。客户端聚类则是将具有相似特征的客户端进行分组，以提高训练效率。

未来方向

异构联邦学习仍然面临着许多挑战，未来研究方向包括：
- 提高通信效率： 探索更有效的通信策略，减少通信开销。
- 联邦公平性： 保证不同参与方在联邦学习过程中的公平性。
- 隐私保护： 设计更强大的隐私保护机制，防止数据泄露。
- 攻击鲁棒性： 提高联邦学习系统对攻击的抵抗能力。
- 统一基准： 建立统一的基准数据集和测试框架，方便不同方法的比较和评估。
总结

联邦学习是一种新兴的机器学习技术，它能够在保护数据隐私的前提下，实现分布式模型训练。异构联邦学习则进一步考虑了现实世界中数据和计算环境的差异，为联邦学习在实际应用中提供了更强大的支持。随着研究的不断深入，联邦学习将为人工智能技术的发展带来新的机遇。

参考文献

[1] Heterogeneous Federated Learning: State-of-the-art and Research Challenges. https://arxiv.org/abs/2112.10542
2024 年 6 月 7 日
SiLu：深度学习中的“平滑”激活函数
近年来，深度学习领域取得了飞速发展，各种新技术层出不穷。其中，激活函数作为神经网络中不可或缺的一部分，也得到了广泛的研究和应用。SiLu 激活函数，也称为 Swish 激活函数，便是近年来备受关注的激活函数之一。它由 Google Brain 在 2017 年首次提出，并逐渐在深度学习模型中崭露头角。

SiLu：Sigmoid 和 ReLU 的“完美结合”

SiLu 激活函数的数学表达式为：f(x) = x * sigmoid(x)，其中 sigmoid(x) 是标准的 Sigmoid 函数。简单来说，SiLu 函数将 Sigmoid 函数与线性函数相结合，既保留了 Sigmoid 函数的平滑特性，又具备 ReLU 函数的线性特性。

那么，SiLu 究竟有哪些优势呢？
- 无上界有下界: 与 ReLU 函数不同，SiLu 函数在负数部分仍然有输出，避免了 ReLU 函数在负数部分梯度为零的问题，有效缓解了梯度消失问题。
- 平滑: SiLu 函数在整个定义域内都具有导数，这使得它在训练过程中更加平滑，更容易进行优化。
- 非单调: 与 ReLU 函数相比，SiLu 函数是非单调的，这使得它能够更好地拟合非线性数据。
SiLu 的应用：从 YOLOv5 到更广阔的未来

SiLu 激活函数在深度学习领域已经展现出了强大的应用潜力。例如，在 YOLOv5 等目标检测模型中，SiLu 激活函数被广泛应用，并取得了优异的效果。

为什么 SiLu 能够在深度学习模型中取得成功呢？
- 缓解梯度消失问题: SiLu 函数在负数部分仍然有输出，避免了梯度消失问题，使得模型能够更有效地学习深层特征。
- 提升模型性能: SiLu 函数的平滑特性和非单调特性，使得模型能够更好地拟合复杂的数据分布，从而提升模型的性能。
结语

SiLu 激活函数作为一种新型的激活函数，展现出了其独特的优势，并逐渐成为深度学习领域的重要工具。未来，随着深度学习技术的不断发展，SiLu 激活函数有望在更多领域发挥重要作用，推动深度学习技术的进一步发展。

参考文献

[1] SiLu 激活函数解释_silu 函数 -CSDN 博客
[2] [CV – Image Classification] 图像分类之激活函数 SiLU – YOLOv7 使用的激活函数 – 知乎
[3] [杂记] 激活函数 SiLU 和 Swish 的区别 -CSDN 博客
2024 年 6 月 7 日

博客

联邦学习：保护隐私，共同进步

SiLu：深度学习中的“平滑”激活函数

SiLu：Sigmoid 和 ReLU 的“完美结合”

SiLu 的应用：从 YOLOv5 到更广阔的未来

结语