作者: C3P00

  • 带你走进MathJax:让所有浏览器都能美绘数学

    大家好,欢迎来到今天的博客,我将向大家介绍一个名为MathJax的神奇工具,它将为你打开一个全新的、美丽的数学世界。对,你没有听错,这是一个能让所有浏览器都能优雅地展示数学公式的工具。无需为了阅读者进行繁琐的设置,一切都如你所愿,就是这么简单!

    MathJax:变革者

    MathJax,就是它,能够将你的传统印刷内容转化为现代化、易于访问的网页内容和电子书。无论是旧时的文档,还是新的在线内容,MathJax都能轻松转化,为特殊需要的读者提供全面的访问体验。更妙的是,MathJax也可以在服务器端工作流中使用,以准备可离线查看的内容或生成与现代电子书阅读器兼容的文档。只需要一次联系,我们就可以为你的机构提供有关内容转化服务的更多信息。

    MathJax:教育者

    你们的教育工作需要帮助吗?MathJax团队也是教育家,他们愿意培训你的员工使用我们的资源来准备在线教学材料和创建易于访问的STEM内容。无论是支持在线教学,还是在线考试,MathJax都能提供帮助。我们甚至可以为你的教师、教员和员工提供培训,教他们如何准备全面可访问的数学课程材料。

    MathJax:顾问

    当然,我们的服务并非只有以上这些。MathJax是一个非常灵活的系统,能够根据任何应用和任何内容的需求进行调整和定制。无论是静态网站还是高动态环境,无论是简单的教学讲义还是科学出版中的精密排版,MathJax都能胜任。不仅如此,我们还关注网页内容、软件解决方案和工作流的无障碍访问,我们会与你的工作人员一起工作,确保你的材料是完全无障碍的。

    MathJax:艺术家

    MathJax不仅仅是工具,更是艺术的创造者。它使用CSS和网络字体或SVG,而非位图图像或Flash,因此,无论怎样缩放,公式都能与周围的文本保持一致。MathJax的输入和输出模块也极其灵活,可以使用MathML,TeX和ASCIImath作为输入,生成HTML+CSS,SVG或MathML作为输出。而且MathJax与屏幕阅读器兼容,提供表达式缩放和交互式探索,你还可以将公式复制到Office,LaTeX,wiki和其他软件中。

    MathJax:无障碍和可重用

    MathJax提供了一套强大的无障碍扩展,这些扩展在客户端提供导航、探索和发声。通过MathJax的上下文菜单,你可以访问任何数学表达式的源代码,无论是MathML格式,还是原始的TeX或AsciiMath格式。

    是的,这就是MathJax,一个美丽的、无障碍的、可重用的数学显示引擎。它是你的内容变革者,是你的教育者,是你的顾问,也是你的艺术家。让我们一起,用MathJax打造一个美丽、访问性强、充满创新的数学世界!

    结语

    在本篇博客中,我向大家介绍了MathJax这个神奇的工具。它能够让所有的浏览器都能优雅地展示数学公式,无需为了阅读者进行繁琐的设置,一切都如你所愿。MathJax不仅可以帮助你将传统印刷内容转化为现代化、易于访问的网页内容和电子书,还可以在服务器端工作流中使用,为特殊需要的读者提供全面的访问体验。此外,MathJax团队也是教育家,他们愿意培训你的员工使用我们的资源来准备在线教学材料和创建易于访问的STEM内容。

    无论你是老师、学生,还是科研人员,只要你与数学打交道,MathJax都能为你提供帮助。如果你有任何疑问,或者想要了解更多关于MathJax的信息,欢迎联系我们。记住,数学是美丽的,而MathJax,就是展示这种美丽的最佳工具。

    感谢你的阅读,我们下次再见!

  • 弥合神经辐射场之间的差距 采用渐进式体积蒸馏的架构

    神经辐射场 (NeRF) 方法已被证明是 3D 场景的紧凑、高质量和多功能表示,并支持编辑、检索、导航等下游任务。各种神经架构都在争夺NeRF的核心结构,包括普通的多层感知器(MLP)、稀疏张量、低秩张量、哈希表及其组成。这些表示形式中的每一种都有其特定的权衡。例如,基于哈希表的表示允许更快的训练和渲染,但它们缺乏明确的几何含义,阻碍了下游任务,如空间关系感知编辑。在本文中,我们提出了渐进式体积蒸馏(PVD),这是一种系统的蒸馏方法,允许不同架构之间的任意转换,包括MLP、稀疏或低秩张量、哈希表及其组成。因此,PVD 使下游应用程序能够以事后方式对手头的任务进行最佳调整神经表示。转换速度很快,因为蒸馏是在不同级别的体积表示上逐步进行的,从浅到深。我们还采用了特殊的密度处理来处理其特定的数值不稳定问题。在NeRF-Synthetic、LLFF和TanksAndTemples数据集上验证了我们的方法。例如,使用 PVD,可以从基于哈希表的 Instant-NGP 模型中提炼出基于 MLP 的 NeRF 模型,其速度比从头开始训练原始 NeRF 快 10 倍~20 倍,同时实现卓越的合成质量水平。代码可在 https://github.com/megvii-research/AAAI2023-PVD 上获得。


    Key Points

    • 1. Novel view synthesis (NVS) 是一种生成 photo realistic 2D 图像的技术,用于三维场景的未知视角。NVS 已在渲染、定位和机器人手臂操作等领域得到广泛应用。最近开发的神经辐射场(NeRF)提供了神经建模能力。

      2. NeRF 可以显著提高 NVS 的质量,利用多层感知器(MLP)的强大泛化能力。采用特征张量作为辅助的显性表示,以减轻 MLP 记住场景所有细节,从而实现更快的训练速度和更灵活的几何结构操作。

      3. 特征张量过大导致寻找更紧凑表示的需求。TensorRF 等方法利用 VM(向量 – 矩阵)分解和序数分解(CPD)等方法实现特征张量的有效压缩。

      4. 所有这些方案都有其优缺点。一般来说,使用隐性表示更容易对场景进行纹理编辑和动态场景建模。但使用显性或混合表示通常具有更快的训练速度,能更好地处理几何上的编辑。

      5. 由于 NVS 的下游任务多样性,没有单一的最佳表示。选择特定的表示取决于具体的应用场景和可用的硬件计算能力。

      6. 在本文中,我们提出了一种方法,可以在已知的 NeRF 架构之间实现任意转换,包括 MLP、稀疏张量、低秩张量、哈希表以及它们的组合。这种灵活的转换可以带来以下优点:深入了解 NeRF 中丰富且不断发展的架构体系结构,消除给设计带来的负担,适应训练好的模型以满足未来可能发现的应用场景需求。

      7. PVD(渐进体积蒸馏)是一种在不同体积表示水平上操作的蒸馏方法,特别关注密度体积以获得更好的数值稳定性。PVD 能够实现不同 NeRF 架构之间的任何-to-any 转换,包括 MLP、稀疏张量、低秩张量和哈希表架构。

      8. Neural implicit representation 方法使用 MLP 从坐标空间构建 3D 场景,如 NeRF 所提出(Mildenhall 等人,2020)。MLP 的输入是 5D 坐标,输出是体积密度和视相关颜色。

      9. 隐含建模的优点是,表示有助于控制或更改场景的类似属性。Kobayashi、Matsumoto 和 Sitzmann 使用预训练的 CLIP 模型(Radford 等人,2021)。

      10. Explicit representations 将场景直接放置在 3D 格中(巨大的张量)。NVS 领域已经进行了多次尝试。Barron 等人提出了一种方法。

      11. 我们试图在不同的 NeRF 架构之间实现相互转换。由于架构数量不断增加,我们不试图逐个实现这些转换。相反,我们首先将典型架构以统一的形式表示,然后根据统一视图设计一种基于统一视图的蒸馏方案。

      12. 我们得出的公式包括像 NeRF 中的 MLP 这样的隐含表示、像 Plenoxels 中的稀疏张量这样的显式表示,以及两种混合表示:哈希表(INGP)和低秩张量(TensorRF 中的 VM 分解)。

      13. 一旦形成,这些架构及其组合之间的任何-to-any 转换都是可能的。

      14. 接下来,我们将简要介绍一些基础知识,然后详细介绍我们的方法。

      15. NeRF 用一个隐函数将空间点 x = (x, y, z) 和视方向 d = (θ, φ) 映射到密度σ和颜色 c。对于沿光线方向 r 从点 o 出发的相应像素的 RGB 值ŷ(r),通过 color c i 和空间点 x i = o + t i d 沿着光线采样得到:其中 T i = exp(-i-1j=1σiδi),δi 是相邻样本之间的距离。

      16. 张量和张量低秩表示。Plenoxels 通过显式网格(张量)直接表示 3D 场景(Fridovich-Keil 等人,2022)。每个网格点都存储密度和球面谐波(SH)系数。颜色 c 根据 SH 和观察方向 d 计算。

    Related Work

    • 1. Novel view synthesis (NVS) 生成 photo realistic 2D 图像,用于三维场景的未知视角(周等人,2018 年; 坎等人,2021 年; 西特曼,祖豪费和威斯坦,2019 年 a),并在渲染、定位和机器人手臂操作(Adamkiewicz 等人,2022 年; Moreau 等人,2022 年; Peng 等人,2021 年)等领域具有广泛的应用,特别是最近开发的神经辐射场(NeRF)提供了神经建模能力。
      2. 利用多层感知器(MLP)的强大泛化能力,NeRF 可以显著提高 NVS 的质量。
      3. 采用特征张量作为辅助的显性表示,以减轻 MLP 记住场景所有细节,从而实现更快的训练速度和更灵活的几何结构操作。
      4. 特征张量过大导致寻找更紧凑表示的需求,如 TensorRF(Chen 等人,2022 年)利用 VM(向量 – 矩阵)分解和序数分解(CPD),Fridovich-Keil 等人利用张量的稀疏性,而 INGP(Müller 等人,2022 年)利用多级哈希表实现特征张量的有效压缩。
      5. 所有这些方案都有其优缺点。一般来说,使用隐性表示更容易对场景进行纹理编辑(例如颜色、照明变化和变形等),艺术的风格化和动态场景建模(Tang 等人,2022 年; Kobayashi,Matsumoto 和 Sitzmann,2022 年; Pumarola 等人,2021 年; Gu 等人,2021 年; Zhan 等人,2021 年)。
      6. 然而,使用显性或混合表示通常具有更快的训练速度,因为它们具有更浅层的表示,能更好地处理几何上的编辑,例如场景的合并和其他操作,与纯隐性表示的情况形成鲜明对比。
      7. 由于 NVS 的下游任务多样性,没有单一的最佳表示。选择特定的表示取决于具体的应用场景和可用的硬件计算能力。
      8. 在本文中,我们从另一个角度处理这个问题。我们提出了一种方法,可以在已知的 NeRF 架构之间实现任意转换,包括 MLP、稀疏张量、低秩张量、哈希表以及它们的组合。这种灵活的转换可以带来以下优点。首先,该研究将深入了解 NeRF 中丰富且不断发展的架构体系结构。其次,这种转换消除了在事先确定架构之前给设计带来的负担,因为现在他们可以只需适应训练好的模型以满足未来可能发现的应用场景需求。最后,在教师和学生具有不同属性的情况下,可以利用这种辅助优势。例如,当使用具有哈希表的教师模型蒸馏学生模型的显性表示时,现在可以从教师的速度中受益,同时仍然生成具有清晰几何结构的学

    Method

    • 作者通过以下方法取得结果:

      1. 利用 Novel view synthesis (NVS) 生成 photo realistic 2D 图像,用于三维场景的未知视角,并在渲染、定位和机器人手臂操作等领域具有广泛的应用。
      2. 利用多层感知器 (MLP) 的强大泛化能力,显著提高 NVS 的质量。
      3. 采用特征张量作为辅助的显性表示,以减轻 MLP 记住场景所有细节,从而实现更快的训练速度和更灵活的几何结构操作。
      4. 特征张量过大导致寻找更紧凑表示的需求,如 TensorRF(Chen 等人,2022 年) 利用 VM(向量 – 矩阵) 分解和序数分解 (CPD),Fridovich-Keil 等人利用张量的稀疏性,而 INGP(Müller 等人,2022 年) 利用多级哈希表实现特征张量的有效压缩。
      5. 所有这些方案都有其优缺点。一般来说,使用隐性表示更容易对场景进行纹理编辑 (例如颜色、照明变化和变形等),艺术的风格化和动态场景建模 (Tang 等人,2022 年; Kobayashi,Matsumoto 和 Sitzmann,2022 年; Pumarola 等人,2021 年; Gu 等人,2021 年; Zhan 等人,2021 年)。
      6. 然而,使用显性或混合表示通常具有更快的训练速度,因为它们具有更浅层的表示,能更好地处理几何上的编辑,例如场景的合并和其他操作,与纯隐性表示的情况形成鲜明对比。
      7. 由于 NVS 的下游任务多样性,没有单一的最佳表示。选择特定的表示取决于具体的应用场景和可用的硬件计算能力。
      8. 在本文中,作者提出了一种方法,可以在已知的 NeRF 架构之间实现任意转换,包括 MLP、稀疏张量、低秩张量、哈希表以及它们的组合。这种灵活的转换可以带来以下优点。首先,该研究将深入了解 NeRF 中丰富且不断发展的架构体系结构。其次,这种转换消除了在事先确定架构之前给设计带来的负担,因为现在他们可以只需适应训练好的模型以满足未来可能发现的应用场景需求。最后,在教师和学生具有不同属性的情况下,可以利用这种辅助优势。
      9. 作者还提出了一种方法,称为 PVD(渐进体积蒸馏),用于在不同体积表示水平上操作的蒸馏方法,特别关注密度体积以获得更好的数值稳定性。PVD 能够实现不同 NeRF 架构之间的任何-to-any 转换,包括 MLP、稀疏张量、低秩张量和哈希表架构。这是第一个系统尝试这种转换。
      10. 作者还提出了一种基于统一视图的蒸馏方案,可以在不同的 NeRF 架构之间实现相互转换。作者得出的公式包括像 NeRF 中的 MLP 这样的隐含表示、像 Plenoxels 中的稀疏张量这样的显式表示,以及两种混合表示:哈希表 (INGP) 和低秩张量 (TensorRF 中的 VM 分解)。
      11. 一旦形成,这些架构及其组合之间的任何-to-any 转换都是可能的。
      12. 接下来,作者简要介绍了一些基础知识,然后详细介绍了他们的方法。

    Result

    • 实验结果:

      1. 利用 Novel view synthesis (NVS) 生成了 photo realistic 2D 图像,用于三维场景的未知视角,并在渲染、定位和机器人手臂操作等领域具有广泛的应用。
      2. NeRF 可以显著提高 NVS 的质量,同时采用特征张量作为辅助的显性表示,以减轻 MLP 记住场景所有细节,从而实现更快的训练速度和更灵活的几何结构操作。
      3. 特征张量过大导致寻找更紧凑表示的需求,如 TensorRF(Chen 等人,2022 年)利用 VM(向量 – 矩阵)分解和序数分解(CPD),Fridovich-Keil 等人利用张量的稀疏性,而 INGP(Müller 等人,2022 年)利用多级哈希表实现特征张量的有效压缩。
      4. 所有这些方案都有其优缺点。一般来说,使用隐性表示更容易对场景进行纹理编辑(例如颜色、照明变化和变形等),艺术的风格化和动态场景建模(Tang 等人,2022 年; Kobayashi,Matsumoto 和 Sitzmann,2022 年; Pumarola 等人,2021 年; Gu 等人,2021 年; Zhan 等人,2021 年)。
      5. 然而,使用显性或混合表示通常具有更快的训练速度,因为它们具有更浅层的表示,能更好地处理几何上的编辑,例如场景的合并和其他操作,与纯隐性表示的情况形成鲜明对比。
      6. PVD(渐进体积蒸馏)是一种在不同体积表示水平上操作的蒸馏方法,从浅到深,特别关注密度体积以获得更好的数值稳定性。
      7. PVD 能够实现不同 NeRF 架构之间的任何-to-any 转换,包括 MLP、稀疏张量、低秩张量和哈希表架构。这是第一个系统尝试这种转换。
      8. Neural implicit representation 方法使用 MLP 从坐标空间构建 3D 场景,如 NeRF 所提出(Mildenhall 等人,2020)。
      9. MLP 的输入是 5D 坐标(空间位置 [x, y, z] 和查看方向 [θ, φ],输出是体积密度和视相关颜色)。
      10. 隐含建模的优点是,表示有助于控制或更改场景的类似属性。
      11. Kobayashi、Matsumoto 和 Sitzmann 使用预训练的 CLIP 模型(Radford 等人,2021)。
      12. explicit representations 将场景直接放置在 3D 格中(巨大的张量)。
      13. 在不同的 NeRF 架构之间实现相互转换。由于架构数量不断增加,我们不逐个实现这些转换。相反,我们首先将典型架构以统一的形式表示,然后根据统一视图设计一种基于统一视图的蒸馏方案。
      14. 我们得出的公式包括像 NeRF 中的 MLP 这样的隐含表示、像 Plenoxels 中的稀疏张量这样的显式表示,以及两种混合表示:哈希表(INGP)和低秩张量(TensorRF 中的 VM 分解)。
      15. 一旦形成,这些架构及其组合之间的任何-to-any 转换都是可能的。

    Conclusion

    • 1. 作者在这篇论文中得到的主要结论如下:
      * Novel view synthesis (NVS) 技术可以生成 photo realistic 2D 图像,用于三维场景的未知视角,并在渲染、定位和机器人手臂操作等领域具有广泛的应用。
      * NeRF 模型可以显著提高 NVS 的质量,而采用特征张量作为辅助的显性表示可以减轻 MLP 的记忆场景所有细节,从而实现更快的训练速度和更灵活的几何结构操作。
      * 特征张量过大导致寻找更紧凑表示的需求,因此作者提出了一些方法,如 TensorRF,利用 VM(向量 – 矩阵)分解和序数分解实现特征张量的有效压缩。
      * 所有这些方案都有其优缺点。一般来说,使用隐性表示更容易对场景进行纹理编辑和艺术的风格化和动态场景建模。
      * 然而,使用显性或混合表示通常具有更快的训练速度,因为它们具有更浅层的表示,能更好地处理几何上的编辑。
      * 选择特定的表示取决于具体的应用场景和可用的硬件计算能力。
      * 该论文提出了一种方法,可以在已知的 NeRF 架构之间实现任意转换,包括 MLP、稀疏张量、低秩张量、哈希表以及它们的组合。
      * 这种灵活的转换可以带来以下优点:深入了解 NeRF 中丰富且不断发展的架构体系结构,消除给设计带来的负担,适应训练好的模型以满足未来可能发现的应用场景需求。
      * 作者还提出了一种 PVD(渐进体积蒸馏)方法,可以在不同体积表示水平上操作的蒸馏方法,以获得更好的数值稳定性。
人生梦想 - 关注前沿的计算机技术 acejoy.com 🐾 步子哥の博客 🐾 背多分论坛 🐾 借一步网
Page Stats: PV: 1007 | UV: 571
Last updated: 2025-05-22 14:29:23
沪ICP备2024052574号-1