体渲染

#CG 2024-03-15

体渲染

体渲染属于整个渲染技术的分支，它的目的主要是为了解决云、烟、果冻这类非刚性物体的渲染建模，可以简单理解为是为了处理密度较小的非固体的渲染。

为了建模这种非刚性物体的渲染，体渲染把气体等物质抽象成一团飘忽不定的粒子群。光线在穿过这类物体时，其实就是光子在跟粒子发生碰撞的过程。

下图是体渲染建模的示意图。光沿直线方向穿过一堆粒子 (粉色部分)，如果能计算出每根光线从最开始发射，到最终打到成像平面上的辐射强度，我们就可以渲染出投影图像。而体渲染要做的，就是对这个过程进行建模。为了简化计算，我们就假设光子只跟它附近的粒子发生作用，这个范围就是图中圆柱体大小的区间。

体渲染把光子与粒子发生作用的过程，进一步细化为四种类型：

吸收 (absorption)：光子被粒子吸收，会导致入射光的辐射强度减弱；
放射 (emission)：粒子本身可能发光，比如气体加热到一定程度就会离子化，变成发光的「火焰」。这会进一步增大辐射强度；
外散射 (out-scattering)：光子在撞击到粒子后，可能会发生弹射，导致方向发生偏移，会减弱入射光强度；
内散射 (in-scattering)：其他方向的光子在撞到粒子后，可能和当前方向上的光子重合，从而增强当前光路上的辐射强度。

下图是这四种情况的示意图，\(L_i\) 表示入射光，\(L_o\) 表示出射光。

出射光与入射光之间的变化量，可以表示为这四个过程的叠加：

\[ dL(x,w)=\text{emission}+\text{inscattering}-\text{outscattering}-\text{absorption} \]

其中 \(x\) 表示光线上某个位置点，\(w\) 表示光线发射方向。

吸收 (absorbing)

假设粒子都是半径为 \(r\) 的球体，那么每个粒子的投影面积是 \(A=\pi r^2\) (也就是每个粒子对光线的遮挡面积)。假设圆柱体中粒子的密度是 \(\rho\)，圆柱体的底面积是 \(E\)。

当圆柱体足够薄 (薄到跟粒子一样厚) 的时候，可以认为粒子之间不会互相重叠 (也就是粒子都平铺在圆柱体一个横截面上)。

假定这个厚度是 \(\Delta s\)，那么在这个厚度内，圆柱体体积为 \(E\Delta s\)，粒子总数为 \(\rho E\Delta s\)。这些粒子遮挡的面积为 \(\rho E\Delta sA\)，占整个底面积的比例为 \(\rho E\Delta sA/E=\rho A\Delta s\)。也就是说，当一束光通过这个圆柱体的时候，有 \(\rho A\Delta s\) 的概率会被遮挡。

换句话说，如果我们在圆柱体的一端发射无数光线 (假设都朝相同的方向)，在另一端接收，会发现有些光线安然通过，有些则被粒子遮挡 (吸收)。整体上，这些接受到的光线总强度，相比入射光线总强度而言，会有 \(\rho A\Delta s\) 比例的衰减，即出射光的强度均值是入射光的 \(\rho A\Delta s\) 倍。

\[ \begin{align} I_o-I_i=\Delta I=-\rho(s)AI(s)\Delta s\notag \\ \implies dI=-\rho(s)AI(s)ds \end{align} \]

粒子密度 \(\rho\) 是一个关于 \(s\) 的函数，因为每个区域的密度都是不同的。

式可以转换为常微分方程：

\[ \begin{equation} \frac{dI}{ds}=-\rho(s)AI(s)=-\tau_a(s)I(s) \end{equation} \]

解这个方程可以得到：

\[ \begin{equation} I(s)=I_0\exp(-\int_0^s\tau_a(t)dt) \end{equation} \]

公式里面的 \(I_0\) (注意区分 \(I_o\)) 是常微分方程中的常数项，物理意义上表示光线的起始点。而 \(I_o\) 应为 \(I_o=I_i\exp(-\int_i^o\tau_a(t)dt)\)

如果介质 (粒子群) 是均匀的，即 \(\tau_a(t)\) 处处相等，那么入射光在经过介质 (粒子群) 后，辐射强度会呈指数衰减。这被称为比尔-朗伯吸收定律 (Beer-Lambert Law)：

可以由此定义透射比 (transmittance)：

\[ \begin{equation} T(s)=\frac{I_o}{I_i}=\exp(-\int_i^o\tau_a(t)dt) \end{equation} \]

它表示粒子群某一点的透明度，数值越大，说明粒子群越透明，光线衰减的幅度就越小。

而透明度本身是关于 \(\tau_a(t)\) 的方程，\(\tau_a(t)\) 越大，\(T(s)\) 就越小。由公式 (2) 可知，\(\tau_a(t)=\rho(t)A\)，它是由粒子密度和投影面积决定的。这在直觉上也很好理解，如果粒子密度大，粒子本身也比较大，那么遮住光线的概率也会相应提升，自然透明度也就下降了。

\(\tau_a(t)\) 也被称为光学厚度 (optical depth)。

放射 (emission)

除了吸收之外，粒子本身也可能发光。

假设单个粒子发射一束光的辐射强度为 \(I_e\)，那么按照前文的描述，在圆柱体足够薄的情况下，粒子总数是 \(\rho AE\Delta s\)，则总的发光强度为 \(I_e\rho AE\Delta s\)。

如果我们在圆柱体一端去接收粒子们放射的光线，会发现有时候能接收到，有时候刚好接收点所在的光路上没有粒子，就接收不到。能接收到光线的概率为 \(\rho AE\Delta s/E=\rho A\Delta s\)，那么接收到的光线的平均强度为 \(I_e\rho A\Delta s\)。

同样地，可以得到放射光强的常微分方程：

\[ \begin{equation} \frac{dI}{ds}=I_e(s)\rho(s)A=I_e(s)\tau_a(s) \end{equation} \]

\(I_e\) 是一个关于 \(s\) 的函数，因为圆柱体不同位置的粒子，所放射的光强都是有差异的。这里我们也看到，类似吸收，粒子放射的光强同样和 \(\tau_a(s)\) 有关，这在直觉上也是合理的，如果粒子能发光，那粒子密度和粒子颗粒越大，放射的辐射均值也就越大。

外散射 (out-scattering)

粒子除了吸收光子，也可能会弹射光子，这个过程称为外散射，即光子被弹射出原本的光路，导致光线强度减弱。

同吸收一样，外散射对光线的「削弱」程度，也跟光学厚度相关，不过过程相对吸收来说又复杂一些，因此我们用 \(\tau_s\) 来表示外散射对光线的削弱比例，以区别于 \(\tau_a\)。

同样地，这一过程可以表示为：

\[ \begin{equation} \frac{dI}{ds}=-\tau_s(s)I(s) \end{equation} \]

内散射 (in-scattering)

光子可以被弹射走，自然就有其他光路的光子被弹射到当前光路，这一过程就是内散射。

内散射的过程比外散射又更加复杂，因为弹射到当前光路的光子可能来自多条不同的光路，因此需要综合考虑其他光路的辐射强度以及各种弹射角度。

不过本文不打算深入探究这一点，我们就认为其他光路的辐射强度为 \(I_s\)，而弹射到当前光路的能量损失比为 \(\tau_s\) (注意这里和外散射使用的是相同的系数，既然都是散射，那有些性质上自然是共通的)。

内散射的过程可以表示为：

\[ \begin{equation} \frac{dI}{ds}=\tau_s(s)I_s(s) \end{equation} \]

体渲染方程

我们把以上四个过程都综合到一个公式中：

\[ \begin{equation} \frac{dI}{ds}=-\tau_a(s)I(s)-\tau_s(s)I(s)+\tau_a(s)I_e(s)+\tau_s(s)I_s(s) \end{equation} \]

其中，吸收和外散射都会削弱光线的辐射强度，并且由于它们都和入射光有关，因此它们共同构成了体渲染中的衰减项 (attenuation item)，而粒子发光和内散射都来自独立的光源，因此被称为源项 (source item)。

为了求解方便，定义 \(\tau_t=\tau_a+\tau_s\)，公式 (8) 就简化为：

\[ \begin{equation} \frac{dI}{ds}=-\tau_t(s)I(s)+\tau_a(s)I_e(s)+\tau_s(s)I_s(s) \end{equation} \]

求解这个微分方程，得到：

\[ \begin{equation} I(s)=\int_0^s\exp(-\int_0^t\tau_t(u)du)[\tau_a(s)I_e(s)+\tau_s(s)I_s(s)]dt+I_0\exp(-\int_0^s\tau_t(t)dt) \end{equation} \]

公式 (10) 就是体渲染的渲染方程了，其中 \(I_0\) 就是入射光最开始的强度，在 NeRF 中把它当作是背景光。

这个公式告诉我们，出射光的强度主要由入射光 (背景光) 和源项 (粒子发光以及内散射) 等构成的，而这两者在传递过程中都伴随着相同的衰减 (\(\tau_t\))。同时由于从 \(I_0\) 到 \(I_s\) 的整个光路上，处处都可能存在粒子发光和内散射现象，因此源项是需要从 \(0\) 开始相加一直到 \(s\) 的，对应到公式中就是积分 \(\int_0^s\)。

有了这个公式，我们就可以建模出每一条光线在传播介质中，辐射强度的变化，并最终渲染出图像 (当然前提要知道介质中每一点的 \(\tau_t\)、\(I_e\) 等信息)。

注意，虽然我们在讨论这个模型的时候一直是用辐射强度这个概念，但直接把 \(I(s)\) 替换成颜色也是可以的。

现在，我们做一个大胆的假设，假设 \(\tau_t\)、\(\tau_a\)、\(\tau_s\) 这些都相等，统一用 \(\sigma\) 表示，同时令 \(C=I_e+I_s\)，那么公式 (10) 可以进一步简化成：

\[ \begin{align} I(s)&=\int_0^s\exp(-\int_0^t\sigma(u)du)\sigma(t)C(t)dt+I_0\exp(-\int_0^s\sigma(t)dt)\notag \\ &=\int_0^sT(t)\sigma(t)C(t)dt+I_0T(s) \end{align} \]

其中 \(T(t)=\exp(-\int_0^t\sigma(u)du)\)

计算机的体渲染

公式 (11) 在计算机中是无法表达的，需要进一步离散化。

我们将整个光路 \([0, s]\) 划分为 \(N\) 个相等间距的区间：\([t_n,t_{n+1}]\)。那么，只要能算出每个 \([t_n,t_{n+1}]\) 区间内的辐射强度 \(I(t_n\rightarrow t_{n+1})\)，最后把 \(N\) 个区间的辐射加起来，就可以得到最终的光线强度了。\(N\) 越大，则越接近理论数值 (公式 (11))。

为了方便运算，我们假设在每个区间内，\(\sigma(t)\) 处处等于 \(\sigma_n\) ，\(C(t)\) 处处等于 \(C_n\)。那么可以得到：

\[ \begin{align} I(t_n\rightarrow t_{n+1})&=\int_{t_n}^{t_{n+1}}T(t)\sigma_nC_ndt \notag\\ &=\sigma_nC_n\int_{t_n}^{t_{n+1}}T(t)dt \end{align} \]

注意 \(T(t)=\exp(-\int_0^t\sigma(u)du)\)，是需要从光线起点处开始积分的。不过，好在 \(T(t)\) 可以拆分为两段的乘积：

\[ \begin{align} T(t)&=\exp(-\int_0^t\sigma(u)du) \notag\\ &=\exp(-[\int_0^{t_n}\sigma(u)du+\int_{t_n}^t\sigma(u)du]) \notag\\ &=\exp(-\int_0^{t_n}\sigma(u)du)\exp(-\int_{t_n}^t\sigma(u)du) \notag\\ &=T(0\rightarrow t_n)T(t_n\rightarrow t) \end{align} \]

这样公式 (12) 就变成：

\[ \begin{align} I(t_n\rightarrow t_{n+1})&=\sigma_nC_n\int_{t_n}^{t_{n+1}}T(0\rightarrow t_n)T(t_n\rightarrow t)dt \notag\\ &=\sigma_nC_nT(0\rightarrow t_n)\int_{t_n}^{t_{n+1}}T(t_n\rightarrow t)dt \notag\\ &=\sigma_nC_nT(0\rightarrow t_n)\int_{t_n}^{t_{n+1}}\exp(-\int_{t_n}^t\sigma_ndu)dt \notag\\ &=\sigma_nC_nT(0\rightarrow t_n)\int_{t_n}^{t_{n+1}}\exp(-\sigma_nu|_{t_n}^t)dt \notag\\ &=\sigma_nC_nT(0\rightarrow t_n)\int_{t_n}^{t_{n+1}}\exp(-\sigma_n(t-t_n))dt \notag\\ &=\sigma_nC_nT(0\rightarrow t_n)\frac{\exp(-\sigma_n(t-t_n))}{-\sigma_n}|_{t_n}^{t_{n+1}} \notag\\ &=C_nT(0\rightarrow t_n)(1-\exp(-\sigma_n(t_{n+1}-t_n))) \end{align} \]

现在我们得到了 \(I(t_n\rightarrow t_{n+1})\)，接下来就是把每一段得累加起来了：

\[ \begin{align} I(s)&=\int_0^sT(t)\sigma(t)C(t)dt+I_0T(s) \notag\\ &\approx\sum_{n=1}^NI(t_n\rightarrow t_{n+1})+I_0T(s) \notag\\ &=\sum_{n=1}^NC_nT(0\rightarrow t_n)(1-\exp(-\sigma_n(t_{n+1}-t_n)))+I_0T(s) \end{align} \]

假设 \(\delta_n=t_{n+1}-t_n\)，那么 \(\delta_n\) 表示的就是每个小区间的长度，我们令 \(T_n=T(0\rightarrow t_n)\)，则 \(T_n\) 也可以离散化为：

\[ \begin{align} T_n&=\exp(-\int_0^{t_n}\sigma(u)du) \notag\\ &\approx\exp(\sum_{k=1}^{n-1}-\sigma_k\delta_k) \end{align} \]

将公式 (16) 代入 (15) 后，可以得到最终计算机使用的体渲染公式：

\[ \begin{equation} I(s)=\sum_{n=1}^NT_n(1-\exp(-\sigma_k\delta_k))C_n+I_0T(s) \end{equation} \]

这个公式就是 NeRF 论文中公式 (3) 的出处，只不过加了背景光：

体渲染