标签： AGI

在纯Java文件中推理Llama 2

在现代人工智能领域，推理大型语言模型（LLM）已经成为一个重要的应用场景。GitHub上的项目 mukel/llama2.java 提供了一种使用纯Java代码进行Llama 2推理的简洁实现。本文将详细介绍该项目的背景、构建方法及性能表现。

背景介绍

Llama 2是由Andrej Karpathy开发的一个非常简单的LLM推理实现。该项目的Java版本旨在提供教育价值，并用于在JVM上测试和调整编译器优化，特别是针对Graal编译器的优化。这一Java移植版本最初参考了llama2.scala。

构建与运行

要构建和运行该项目，您需要Java 21+，特别是其中的MemorySegment mmap-ing功能。以下是具体的构建步骤：

下载必要的文件： wget https://github.com/karpathy/llama2.c/raw/master/tokenizer.bin wget https://huggingface.co/karpathy/tinyllamas/resolve/main/stories15M.bin
手动构建与运行： javac --enable-preview -source 21 --add-modules=jdk.incubator.vector Llama2.java java --enable-preview --add-modules=jdk.incubator.vector Llama2 stories15M.bin
使用JBang直接运行： jbang Llama2.java stories15M.bin

使用Makefile和run.sh脚本：

make # 可选，run.sh已经包含了make JAVA_HOME=GRAALVM_HOME NATIVE_IMAGE_OPTIONS="-march=native" make native-image
./llama2 stories15M.bin

或者使用Profile-Guided Optimizations (PGO)：

JAVA_HOME=GRAALVM_HOME \
NATIVE_IMAGE_OPTIONS="--pgo -march=native --initialize-at-build-time=Llama2 -Dllama2.VectorAPI=false" \
make native-image

# 优化后的运行速度应该比普通镜像快约2倍
./llama2 stories15M.bin

性能表现

以下是该项目在不同配置下的性能测试结果（基于AMD Ryzen 3950X 64GB，Arch Linux）：

单线程测试

模型	每秒处理Token	相对于llama2.c的加速	实现
stories15M.bin	363	1.0	llama2.c
stories15M.bin	237	0.65	llama2.java
stories110M.bin	51.71	1.0	llama2.c
stories110M.bin	42.20	0.81	llama2.java
llama2_7B.bin	0.92	1.0	llama2.c
llama2_7B.bin	0.88	0.95	llama2.java

多线程测试

模型	每秒处理Token	相对于llama2.c的加速	实现
stories15M.bin	1233	1.0	llama2.c
stories15M.bin	438	0.35	llama2.java
stories110M.bin	90	1.0	llama2.c
stories110M.bin	80	0.88	llama2.java
llama2_7B.bin	1.68	1.0	llama2.c
llama2_7B.bin	1.65	0.98	llama2.java

需要注意的是，Java版本在多线程情况下的性能提升并不显著，这主要是由于内存带宽限制所致。

结论

mukel/llama2.java项目展示了如何使用纯Java代码实现Llama 2推理，并在一定程度上达到了与原始C实现相当的性能。尽管当前版本的性能尚未完全优化，但其作为教育工具和编译器优化测试平台已经展现出巨大潜力。

参考文献：GitHub – mukel/llama2.java

2024 年 6 月 1 日

autoMate：用AI简化你的数字生活
引言

在这个数字化飞速发展的时代，我们的生活越来越依赖于各种软件和应用程序。但是，你有没有想过，如果这些软件能够更加智能，能够理解我们的指令并自动完成一些重复性的任务，那将会怎样？这就是autoMate所承诺的——它就像出行中的共享单车一样，只需3分钟，就能将AI的智能植入到任意一个软件中，让你的数字生活变得更加轻松和高效。

autoMate是什么？

autoMate是一个开源免费的项目，它允许用户通过简单的配置，将AI的能力集成到他们日常使用的软件中。无论是自动化工作流程，还是简化复杂的任务，autoMate都能提供强大的支持。

如何开始使用autoMate？

如果你是第一次使用autoMate，你只需要进行一些基础的设置。首先，你需要修改配置文件，添加OpenAI的信息。这可以通过在autoMate的左上角点击文件，然后选择components，接着配置OpenAI的相关信息来完成。

autoMate的主要功能

autoMate的核心功能是将AI集成到软件中，但它并不止步于此。以下是autoMate的一些主要功能：
- 自动化任务：autoMate可以帮助你自动化那些重复性高且耗时的任务。
- 智能决策：通过集成AI，autoMate能够提供智能的决策支持，帮助你更高效地完成工作。
- 易于配置：即使是没有编程背景的用户，也能够通过简单的配置快速上手autoMate。
各产品优势对比

autoMate在众多自动化工具中脱颖而出，它的优势在于其开源免费的特性，以及对AI能力的集成。这使得autoMate不仅能够帮助个人用户提高效率，也能够为企业提供强大的自动化解决方案。

开源社区的支持

autoMate完全依赖于开源社区的支持，这意味着它不断地在改进和更新。社区的贡献者们不断地为autoMate添加新功能，修复bug，确保它能够满足用户的需求。

结语

autoMate是一个强大的工具，它能够让你的软件更加智能，让你的工作更加高效。无论你是希望简化日常任务，还是想要探索AI的潜力，autoMate都是一个值得尝试的选择。而且，由于它是开源免费的，你没有任何理由不试试这个能够改变你数字生活的神奇工具。

呼吁行动

如果你对autoMate感兴趣，不妨访问它的GitHub页面，那里有详细的安装指南和使用文档。同时，如果你觉得autoMate对你有帮助，不妨给它点个star，以示对开源项目的支持和鼓励。
2024 年 6 月 1 日

标签： AGI

在纯Java文件中推理Llama 2

背景介绍

构建与运行

性能表现

单线程测试

多线程测试

结论

autoMate：用AI简化你的数字生活

引言

autoMate是什么？

如何开始使用autoMate？

autoMate的主要功能

各产品优势对比

开源社区的支持

结语

呼吁行动