AI驱动的太赫兹图像重建与增强:从源头提升质量与效率


太赫兹(THz)成像技术是当前人们在太赫兹领域研究的重点之一,包括了太赫兹时域光谱成像、连续波太赫兹成像、层析成像等,在生物医学诊断、无损检测、安全检查和材料分析等领域展现出巨大潜力。然而,其发展受到了一些因其本身性质所带来的阻碍:分辨率受衍射极限约束、原始数据信噪比低、易受系统伪影干扰。
太赫兹受所处频段和现有硬件的影响,成像分辨率受到限制。采用逐点扫查方式进行成像的图像分辨率在0.5mm到3mm之间,科学家们在不断升级硬件能力以达到良好的分辨率的同时,借助AI快速增长加强软件处理,可以大幅度地提升图像质量。这是当今太赫兹成像技术发展的一个重要趋势,也是快速提升图像质量切实有效的手段。经过人们不懈地探索后发现,不论是对原始数据进行降噪处理,还是在生成的图像上进行更进一步的重建、去噪等,都可以显著提升图像质量和获取效率,这为太赫兹成像带来了革命性的突破。下面从超分辨率成像、去噪与伪影抑制、稀疏采样重建、图像的增强等及几方面分别介绍AI辅助太赫兹成像增强方面的取得的成果。
01
超分辨率成像
光的衍射指当光波遇到障碍物或小孔时,偏离直线传播的现象,该现象直接导致成像变得模糊不清。而衍射极限是指由于波的衍射特性,传统成像、聚焦以及传输等方法的最高分辨力、焦斑大小和最小空间尺寸受到波长和孔径的限制。经过物理研究发现,如果要使图像更加清晰,现在能做到的就是使用更短的波长或采用更大的数值孔径,而太赫兹成像技术受衍射极限约束的本质,就是因为相对于光波和红外而言其波长较长,受衍射影响较大,于是在成像这一方面太赫兹波做的不如可见光等好。
除去在硬件方面需要再有所精进,科学家们还可以在图像本身上做研究,于是在AI的帮助下,诞生了许多超分辨率重建图像的方法来帮助太赫兹成像解决分辨率问题:
首先需要清楚的是,图像的本质是在计算机中的一堆按顺序排列的数字,所有的颜色都是由红绿蓝三种颜色按比例叠加生成,极多的小色块拼在一起就形成了一张有色图片,所以每张图片就都可以被分解成一堆矩阵,而有了矩阵,处理相关问题就会变得简单许多。比如卷积神经网络(CNN),通过将图片分解出来矩阵进行预处理操作以后,一部分一部分地进行卷积操作,提取高维特征向量,然后将这些特征向量非线性地映射到另一组高维向量,这些高维向量就是高分辨率图像的一组特征向量,将这些向量聚合就变成了高分辨率图像,而这也是超分辨率成像中比较常用到的SRCNN、VDSR、EDSR等模型的基本原理,这些AI模型做到了可以直接学习低分辨率到高分辨率图像之间端到端的映射,并且形成图像速度快,效果好,被人们广泛认可接收。
还有另一种思路,就是将太赫兹波的传播模型、散射特性等物理知识融入网络的设计之中,比如可以让一些特性作为约束项、设计特定网络模块或模拟数据生成,引导网络学习更符合物理规律的超分辨率重建,这样也可以提升输出结果的可靠性。

图1. 卷积提取图像特征示意图[3]

图2. 低分辨率到高分辨率图像示意

图3.各种超分辨率算法的结果
02
去噪与伪影抑制
太赫兹波的光子能量处于一个不上不下的位置,低频段难以像可见光那样利用电子在能带间的跃迁高效产生能量,高频段又不足以像中红外那样利用分子振动能级高效产生能量。除此之外,太赫兹波在传播过程中极易被各种气体、粉尘、常见材料等吸收,致使其信号衰减严重。这些原因导致其信号较弱,原始数据极易受系统噪声、环境干扰以及系统本身缺陷产生的条纹、环状等伪影污染,严重影响图像质量和后续分析。
去噪这一步骤可以在第一手数据中进行,也可以在生成的图像上进行。以逐点扫描为例,扫描到的每个点都会有一张太赫兹时域光谱图,但是由于硬件与环境的干扰,或多或少会对曲线有影响,这时就可以利用AI来进行降噪,先假设噪声是符合特定分布的,然后用数据让AI模型去拟合符合曲线的数学表达式,最终求得无噪声干扰的曲线,其中还可以用CNN等去提取部分特征以加强模型的准确度。
而所谓含噪声的图像,就是理想中的无噪声图像加上每个像素的一个噪声偏移量,合并之后得到的图像,而去噪的目的就是把拥有的噪声图像恢复出干净图像。很显然,每取一种偏移值都会有一张复原图像,解是有无穷多的,所以也只能尽可能选择好的结果保留。上面已经说明过,以卷积为基础的神经网络模型具有提取图像特征的能力,以此为基础衍生出来的DnCNN、NAFNet等高效卷积网络专门学习噪声和伪影的统计特性与空间分布模式,通过学习大量噪声和伪影图像到目标图像之间的噪声偏移,直接在图像域进行精准的噪声建模与分离滤除,是如今非常流行的AI去噪方法。
除此之外,生成对抗网络(GAN)作为当下最热门的模型之一,也可以被广泛运用在太赫兹图像去噪和除伪影领域。GAN由生成模型和判别模型组成,生成模型的作用是先学习一系列“真”的图片,然后接收一个随机的噪声,通过这个噪声生成一张“假”的图片;判别网络的作用是接收一张图片,判断这张图片为“真”的可能性。GAN模型训练的过程就是两个模型互相迭代的过程,生成模型尽可能“欺骗”判别模型,而判别模型要保证自己不被生成模型“骗到”,经过不断地优化后,最终生成模型就可以输出难以区分“真假”的图片。

图4. GAN原理示意图[5]
03
稀疏采样重建
传统的逐点扫描式的太赫兹时域光谱成像速度较慢,并且采集的样本数量过于庞大,严重制约其实际应用,给需要快速成像的一些工作还有存储硬件带来了不少麻烦。既然逐点扫描太费时间又太费内存,那是否可以扫描部分特征,再从这些稀疏的部分将原本应该成像的完整图片生成出来呢?AI的引入给出了一份相当有效的答卷。
首先要知道,根据奈奎斯特采样定理,要无失真地重建一个最高频率为 f 的信号,采样频率必须至少是2f,这意味着需要采集大量数据点,然后对采集到的完整信号进行某种变换(如傅里叶变换),发现它在某个域是稀疏的,换句话说就是大部分系数为0或很小,这时保留这些较大系数的部分才能实现压缩信息。而压缩感知理论提出,既然信号在某个变换域是稀疏的,为什么不能绕过奈奎斯特采样,直接采集能反映其稀疏本质的少量“信息”呢?于是就可以提前设计一个测量矩阵去观测信号,即将测量矩阵与观测信号做内积得到观测值,这个观测值已经包含了全局的信息,最后只需要利用已知的数据还有最小二乘法、l1-范数最小化等方法求解一个方程组就可以还原原信号了。
在上述思想下,将压缩感知优化算法(如ISTA、ADMM等)的迭代步骤“展开”成具有可学习参数的深度网络层,网络在训练中自动学习最优的迭代参数、阈值规则和变换基,就可以大幅加速重建过程并提升重建质量,帮助太赫兹成像解决不少麻烦。当然,也可以利用GAN强大的图像处理能力,学习稀疏采样数据到完整、合理、清晰的图像的过程,让其直接输出想要的结果。

图5. 稀疏采样与重建图像[7]
04
图像的增强与总结
从上述三个方面来看,太赫兹成像技术是可以利用AI得到显著改善的,当得到便于观看与分析的图像之后,如何更准确、有效、全面地分析其中带来的信息也就成为了不可或缺的一个步骤。鉴于太赫兹成像可获取多种信息:强度(反映吸收/反射)、相位(反映折射/厚度)、以及丰富的光谱数据(反映物质“指纹”),并且不同频段的太赫兹波穿透能力和分辨率也各异,单一图像往往无法提供全面信息,这时就需要将图像融合起来看了。AI能做到的不仅仅是将每张图片挨个拼接起来,比如利用CNN等模型自动提取其中的要素并学习,可以做到融合同一区域的强度图、相位图以及关键频点或特征光谱信息,生成一张信息更丰富、对比度更优、更利于目标识别或定量分析的融合图像;也可以融合不同中心频率或带宽获取的图像,结合低频穿透性好和高频分辨率高的优势,生成兼具深层结构信息和表面精细特征的合成图像。

图6. 图像融合[8]
AI驱动的太赫兹图像重建与增强技术,正将太赫兹成像从一种受限于诸多瓶颈的“潜力技术”,加速转变为一种强大、高效、实用的分析和检测工具,为其在科学研究与工业应用领域的爆发式增长铺平了道路。未来或许可以看到,AI模型的超分辨率技术超越硬件极限,在无损检测中展现更强大的作用;AI加速图像生成速度实现毫秒级处理,满足安检的实时性需求;AI强大的模式识别能力甚至有望从海量数据中挖掘新物理现象或材料特性,推动基础科学发现;AI降噪能有效抑制复杂环境干扰,显著提升图像信噪比,让成像与真实看到的相差无几;AI图像分割和重建则突破物理限制,从低质原始数据中精准还原高分辨率结构与细节;AI三维空间定位可精确解析目标在空间中的深度与几何关系,还原物体实际的样子;AI特征识别能自动提取并分析物质的独特光谱或形态特征,不再需要人工进行比对;AI缺陷识别大模型通过海量数据训练,实现对工业产品内部缺陷的智能化、通用化检测,大大加快生产速度;AI多模态融合整合太赫兹与其他传感数据,提供更全面的信息解译,开创更新的科学领域。随着算法持续创新、计算硬件发展和高质量数据集的积累,这一融合领域必将释放出更大的潜能。
参考文献
[1]卢贺洋, 苏胜君, 袁明辉, 等. 太赫兹图像的超分辨率重建[J]. 红外技术, 2019, 41(1): 59-63.
[2]常亮, 邓小明, 周明全, 等. 图像理解中的卷积神经网络[J]. 自动化学报, 2016, 42(9): 1300-1312.
[3]https://blog.csdn.net/AI_dataloads/article/details/133250229
[4]Li F, Guo Z, Guo X, et al. Super-Resolution Enhancement of Terahertz Liver Cancer Images Based on KernelGAN[C]//China National Conference on Terahertz Biophysics. Singapore: Springer Nature Singapore, 2024: 467-478.
[5]Aggarwal A, Mittal M, Battineni G. Generative adversarial network: An overview of theory and applications[J]. International Journal of Information Management Data Insights, 2021, 1(1): 100004.
[6]Li F, Guo Z, Guo X, et al. A Novel Single-Image Denoising Approach for Terahertz Liver Cancer Images[C]//China National Conference on Terahertz Biophysics. Singapore: Springer Nature Singapore, 2024: 496-506.
[7]谢德华, 陈平. 基于稀疏采样的 CT 快速成像方法研究[J]. 中国体视学与图像分析, 2017, 22(4): 443-449.
[8]唐霖峰, 张浩, 徐涵, 等. 基于深度学习的图像融合方法综述[J]. 中国图象图形学报, 2024, 28(1): 3-36.
