博客

Redis的BLPOP、BRPOPLPUSH 系列指令
Redis 是一个高性能的键值对存储系统，它支持多种数据结构，包括字符串、列表、哈希、集合、有序集合等。这里我们来介绍一下 Redis 的 BLPOP 和 BRPOPLPUSH 系列命令。

BLPOP (Blocking Left POP)

BLPOP 是一个阻塞的列表弹出操作。它是 LPOP 的阻塞版本，可以从列表的最左侧（头部）移除并获取一个元素。如果列表为空或不存在，BLPOP 命令将阻塞连接，直到等待的列表中有可弹出的元素或达到超时时间。其基本用法如下：
```
BLPOP key1 key2 ... keyN timeout
```
在这里，key1，key2 到 keyN 是你想要弹出元素的列表，timeout 是阻塞超时时间（单位是秒）。命令返回的是一个两元素的数组，第一个元素是被弹出元素所在的列表名，第二个元素是被弹出的元素。如果达到超时时间，命令将返回 nil。

BRPOPLPUSH (Blocking Right POP Left PUSH)

BRPOPLPUSH 命令是 BRPOP 和 LPUSH 的组合。它从一个列表的最右侧（尾部）移除元素，并将该元素添加到另一个列表的最左侧（头部）。如果源列表为空，该命令将阻塞连接，直到源列表中有可弹出的元素或达到超时时间。其基本用法如下：
```
BRPOPLPUSH source destination timeout
```
在这里，source 是源列表，destination 是目标列表，timeout 是阻塞超时时间（单位是秒）。命令返回的是被弹出并推入目标列表的元素。如果达到超时时间，命令将返回 nil。

BRPOPLPUSH 命令是原子性的，这意味着即便是在多个客户端并发执行这个命令的情况下，也不会有竞态条件（race condition）的发生。这使得 BRPOPLPUSH 非常适合实现可靠的队列——即使在处理过程中发生了错误或者服务器崩溃，你也可以通过目标列表恢复数据。
2023 年 11 月 2 日
Würstchen：引领图像生成的速度革新
大家好，今天我要给大家介绍一款名为 Würstchen 的新型图像生成模型。这款模型由 Hugging Face 公司开发，它是一种扩散模型，能够在高度压缩的图像潜在空间中进行文本条件操作。这项技术的优势在于能大大降低训练和推理的计算成本。以前我们在处理 1024×1024 的图像时，需要花费大量的计算资源，而现在，通过 Würstchen，我们可以用相当于 32×32 图像的资源来完成这项工作，这无疑是一个巨大的突破。

Würstchen 的设计新颖，实现了 42 倍的空间压缩，这在之前是无法想象的。它采用了两阶段压缩，我们称之为A阶段和B阶段。A阶段是一个 VQGAN，B阶段是一个扩散自编码器。A阶段和B阶段共同被称为解码器，因为它们将压缩后的图像解码回像素空间。还有一个第三阶段模型，称为 Prior，它在高度压缩的潜在空间中进行学习，这种训练需要的计算资源只是当前顶级模型的一小部分，同时也让推理变得更便宜、更快。

那么，为什么我们需要另一个文本到图像的模型呢？原因很简单，因为 Würstchen 非常快且高效。比起像 Stable Diffusion XL 这样的模型，Würstchen 可以更快地生成图像，同时使用的内存也更少。此外，Würstchen 的训练成本也大大降低，Würstchen v1 只需要 9,000 GPU 训练小时，而 Stable Diffusion 1.4 需要 150,000 GPU 训练小时。这意味着更多的组织可以训练这样的模型。

使用 Würstchen 也非常简单。您可以通过 Diffusers 库来使用它，下面是一个使用 AutoPipeline 进行推理的例子：
```
import torch
from diffusers import AutoPipelineForText2Image
from diffusers.pipelines.wuerstchen import DEFAULT_STAGE_C_TIMESTEPS

pipeline = AutoPipelineForText2Image.from_pretrained("warp-ai/wuerstchen", torch_dtype=torch.float16).to("cuda")

caption = "Anthropomorphic cat dressed as a firefighter"
images = pipeline(
    caption,
    height=1024,
    width=1536,
    prior_timesteps=DEFAULT_STAGE_C_TIMESTEPS,
    prior_guidance_scale=4.0,
    num_images_per_prompt=4,
).images
```
Würstchen 在 1024×1024 到 1536×1536 之间的图像分辨率上进行训练，同时我们也注意到，在 1024×2048 这样的分辨率上，Würstchen 也能产生很好的结果。我们还发现，Prior（第三阶段模型）能够非常快速地适应新的分辨率，因此在 2048×2048 的分辨率上进行微调应该是计算成本非常低的。

此外，Würstchen 还提供了一些优化技术，包括使用 PyTorch 2 SDPA 加速注意力机制，为 Apple Silicon Mac 提供的 mps 设备支持，以及使用生成器进行可复现性优化等。

在此，我们要感谢 Stability AI 提供的计算资源，使得我们能够训练出这样的模型，我们希望这项研究能够对更多的研究者和开发者带来帮助，提升他们在图像生成领域的工作效率。

Würstchen 的所有检查点都可以在 Huggingface Hub 上查看。在那里，您可以找到多个检查点，以及未来的演示和模型权重。目前，Prior有三个检查点，Decoder有一个检查点。请在文档中查看检查点的解释，以及不同的 Prior 模型的用途。

因为 Würstchen 完全集成在 Diffusers 中，所以它自带各种好处和优化。其中包括：
- 自动使用 PyTorch 2 SDPA 加速的注意力机制。
- 支持 xFormers 的 flash 注意力实现，如果你需要使用 PyTorch 1.x 而不是 2.x。
- 模型卸载，将未使用的组件在不使用时移动到 CPU，这可以节省内存，而对性能影响微乎其微。
- 顺序 CPU 卸载，适用于内存非常宝贵的情况。内存使用将被最小化，代价是推理速度较慢。
- 使用 Comp 进行提示权重。
在这里，我们的介绍就要结束了，但 Würstchen 的旅程才刚刚开始。这个新模型将在图片生成领域带来革命性影响，无论是在计算成本、效率还是在图像质量上，都有显著的提升。我们期待它在未来能够带给更多研究人员和开发者便利和启发。感谢大家的阅读，我们下次再见！
2023 年 11 月 2 日

博客

Redis的BLPOP、BRPOPLPUSH 系列指令

Würstchen：引领图像生成的速度革新