作者简介:彭 阳(1991-),男,博士,副教授,硕士生导师,主要从事生物质能利用及能源大数据技术等研究。
微藻培养的生物量产率直接决定了其能源利用效率。传统的生物量测定需要依靠离线人工检测分析手段,不可避免地产生巨大的人力浪费和时间成本。基于ResNet、MobileNet以及EfficientNet三种深度卷积神经网络模型,将图像分析与微藻培养相结合,提出了一种能够识别藻种类别,同时直接通过图像信息拟合微藻图像-浓度的非线性映射关系并精确预测微藻生物量的检测方法。研究表明,三种模型对三种实验藻种(小球藻、红藻以及螺旋藻)的分类识别准确率均超过99%。其中,红藻得益于其颜色特征,具有最佳的预测表现。而ResNet对藻生物量预测性能最优,三种藻生物量在该模型下的预测决定系数 R2分别为0.766 4、0.962 8和0.921 5。该方法基本满足了微藻培养过程中藻生物量的监测需求,为微藻能源化的工业过程监测提供了一种具有潜力的技术方案。
The biomass yield of microalgae culture directly determines its energy utilization efficiency. Traditional biomass measurement relies on offline manual detection and analysis, inevitably resulting in significant labor wastage and time costs. A detection method that combines image analysis with microalgae cultivation is introduced. Utilizing three deep convolutional neural network models—ResNet, MobileNet, and EfficientNet—the method enables the online identification of algae species and directly fits a nonlinear mapping between microalgae images and concentration to predict microalgal biomass accurately. The study demonstrates that the classification accuracy of these three models for three experimental algae species ( Chlorella, Rhodophyta, and Spirulina) exceeds 99%. Rhodophyta, owing to its color characteristics, exhibits the best predictive performance. ResNet showed the optimal performance in predicting algal biomass, with the determination coefficients ( R2) for the biomass of the three algae being 0.766 4, 0.962 8, and 0.921 5, respectively. This method essentially meets the monitoring requirements for algal biomass during microalgae cultivation and provides a highly promising technical solution for the industrial process monitoring of algae energy conversion.
微藻因其生长速率快、培养占地面积少以及能源转化效率高等优势而备受关注[1]。微藻能够通过化学转化方式提取藻油[2], 再通过化学合成制备高品质的航空级柴油, 这种燃料已被广泛应用。同时, 微藻还能够跟电厂烟气排放控制耦合, 有效实现碳减排[3]。工业利用后的废弃藻渣也可通过改性合成水系吸附剂, 用于去除工业废水中的重金属及其他污染物[4, 5]。因此, 微藻在未来的能源化和资源化过程中具有巨大的利用潜力[6]。
微藻的培养在微藻能源资源化利用体系中至关重要, 实时掌握微藻的生长培养状况意义重大[7]。在众多生长指标中, 微藻生物量是最核心的指标之一, 其直接决定了微藻的有效能源转化率。THIVIYANATHAN等[8]综述了现有的传统藻种生物量测定方法, 包括人工细胞计数[9]、干重法[10]、光密度计数法[10]、二维荧光和化学计量法[11]、双波长荧光法[12]、流式细胞技术[13]、拉曼显微技术[14]等离线研究方法。这些方法尽管检测精度高, 但分析过程主要以离线方式进行, 耗时较长且每次采样量较小, 无法准确反映大容量样品的统计学特征。
近年来, 随着人工智能的快速发展, 研究者逐渐开始尝试使用图像技术和机器学习[15, 16, 17]等技术对微藻生物特性进行分析。TANG等[18]利用线性回归和多层感知机对两种微藻的叶绿素的RGB图像进行了定量分析, 发现利用多层感知机的检测精度(R2= 0.66)高于线性回归模型(R2= 0.58)。SALGUEIRO等[19]基于藻液的RGB图像颜色进行了定量分析, 研究了不同浓度图像的RGB三色相与浓度之间的线性回归关系, 获得了较高的浓度预测精度(R2= 0.97)。SUNOJ等[20]利用图像分析方法对8种不同的微藻品系进行了定量分析, 并开发了一个由用户编写的图像分析插件。该方法可以区分均匀溶解和非均匀溶解的藻类种类, 同时根据培养体积和不同植被指数建立估算干细胞质量的线性模型。JIANG等[16]基于色调-饱和度-强度(hue-saturation-intensity, HSI)颜色模型对藻液图像进行了定量研究, 并将结果与分光光度法检测的结果进行对比, 得到了较好的拟合关系。BENAVIDES等[15]开发了一种浸入式低成本RGB浓度检测探头, 用于光生物反应器中的微藻生物量在线监测。实验表明, 该探头获得的浓度信息与商用离线监测设备的测量精度相当。
通过对国内外文献进行分析不难看出:一方面, 目前主流微藻生物量定量方法仍然以离线方式为主导; 另一方面, 现有的图像技术主要集中于藻种的分类和识别。近年来逐渐有研究开始关注基于藻液图像的生物特征在线监测, 但相关研究仍处于起步阶段, 对于研究过程中的环境干扰、模型的优化及选择(线性模型与非线性模型)等问题仍亟需深入探讨。因此, 本文结合现有研究, 探究一种基于深度卷积神经网络的微藻识别及藻生物量在线检测方法。结合图像分析技术, 深入研究深度卷积神经网络对藻种的分类识别能力及藻生物量的非线性预测能力, 以完成微藻培养过程的精确在线定性分析及定量检测, 为微藻工业化的过程控制提供一种快捷高效且经济可行的技术思路。
实验研究流程如图1所示。为了模拟实际工业培养过程的光生物培养系统, 搭建了一套光源可控的微藻培养光生物培养系统。培养池采用方形透明亚克力板制成, 池体尺寸为150 mm × 150 mm × 100 mm。实验对象选取了三种微藻, 分别为小球藻、红藻和螺旋藻, 所用微藻样品为自购的干藻粉。测试样品为利用失活藻粉提前配制好浓度的微藻藻液。样品通过称取一定质量的失活藻粉后, 利用去离子水溶解搅拌均匀获得。微藻藻液浓度范围设置为0.02 ~ 10 g/L, 共计44个浓度梯度。为控制环境因素干扰, 整个培养系统被置于一个光照可控的黑箱中, 黑箱尺寸为400 mm × 400 mm × 600 mm, 光源为LED环形灯带, 光照强度设定为恒定值350 Fc(误差 ± 10 Fc), 以确保排除光照变化带来的干扰。黑箱一侧设有开口, 便于安装工业摄像机。通过摄像头自动采集照片后, 将其传入模型进行训练。
图像数据通过工业彩色照相机及其自带软件采集, 拍照条件设置为对比度50%, 饱和度49%。数据集的构建遵循严格的分类标准, 三种微藻样品的44个浓度梯度, 每个浓度梯度包含12组独特的图片, 包含藻池边缘、气泡和阴影等因素, 以增加图片特征, 从而提高模型的泛化能力和鲁棒性。图像的像素密度统一为1 280 × 720。其中34组为模型调参与优化的模型优化数据集, 这些图片按7∶3的比例划分为训练集和测试集。其余10组浓度图像为验证模型泛化识别性能的独立验证数据集, 不参与模型训练。图像采集后需要经过缩放、裁切并标准归一化以减小采样误差, 颜色采样区域为图像中心的256 × 256正方形像素区域。
采用ResNet、MobileNet和EfficientNet三种不同架构的深度卷积神经网络进行基于图像信息的浓度预测研究。
1.3.1 ResNet
ResNet网络架构设计的核心是引入了残差学习技术[21]。该技术旨在解决训练更深网络时遇到的梯度消失问题, 采用了包含跳跃连接的残差块, 这些连接跳过一个或多个层, 执行恒等映射, 将其输出添加到堆叠层的输出中。这种方法有助于梯度的反向传播, 允许训练更深的网络而不会降低性能。本研究采用的模型版号是ResNet-18。
1.3.2 MobileNet
MobileNet是一种专为移动和嵌入式设备设计的轻量级深度学习架构, 其在维持高效性能的同时显著降低了模型的复杂度和计算需求[22]。在MobileNet中, 线性可分离卷积结构是其核心特性之一, 为构建高效且轻量级的深度学习模型提供了基础。这种结构包括深度卷积和逐点卷积两个主要部分。深度卷积通过对每个输入通道独立应用卷积核来提取空间特征, 显著减少了卷积操作的参数数量和计算复杂度。紧接着的逐点卷积则采用1 × 1卷积核对深度卷积的输出进行跨通道的特征组合, 进一步优化了网络的特征表示。本文采用的模型版号为MobileNet-V2。
1.3.3 EfficientNet
EfficientNet是一种为效率优化而设计的先进深度学习架构, 特别适用于计算资源有限的环境[23]。该模型通过创新的方式平衡了网络的深度、宽度和分辨率, 从而在提高性能的同时显著降低了计算需求和模型复杂度, 其核心特点是基于复合扩展原则的结构设计。该设计方法不是简单地增加网络的深度或宽度, 而是同时考虑网络深度(层数)、网络宽度(通道数)以及输入图像的分辨率这三个维度。通过神经架构搜索技术, 使用自动机器学习的方法优化上述三个维度的组合, 从而找到最佳的网络结构。本文采用的模型版号为EfficientNet-B0。
为了同时满足分类和回归需求, 在模型输出层设置分类和回归双通道模块, 在全连接层末端设置三分类输出节点和单一连续预测输出节点两个旁路。为便于后续研究讨论, 本文所采用的三种模型及其版号均直接以ResNet、MobileNet和EfficientNet概述, 版号后缀不再单独提及。
在模型训练中, 两种网络结构将基于训练图像的RGB值进行图像分割和特征提取。在彩色图像中, 图像像素信息会以红、绿、蓝三通道的强度值记录。通过卷积核与图像的三通道参量进行卷积运算, 并通过池化等方式提取并保留图像关键特征, 完成梯度下降学习过程。在这项工作中, 模型的训练和测试均在Python环境下实现, 训练轮次为100次; 采用随机梯度下降优化器, 学习率设置为0.001, 动量值为0.9; 分类通道损失函数用交叉熵损失函数, 回归通道损失函数用均方根误差(root mean squared error, RMSE)。学习率调度器采用余弦退火学习率调度器, 每完成10个训练批次为一个周期, 并使用测试集的准确性来验证模型的性能。模型验证过程采用10组浓度梯度的独立验证数据集进行独立验证评价, 通过对独立验证集的浓度预测评估模型的泛化能力及鲁棒性。
为评价模型在预测微藻生物量浓度方面的表型性能, 采用决定系数R2进行模型预测精度的评价, 如式(1)所示。决定系数用于量化误差的变异性, 其值介于0 ~ 1之间。更高的R2值表示较小的误差变异[24], 表明模型预测的准确性越高。
${{R}^{2}}=1-{{{S}_{\text{res}}}}/{{{S}_{\text{tot}}}}\; $ (1)
式中:Sres为残差平方和; Stot为总平方和。
此外, 通过均方误差(mean squared error, MSE)EMS和均方根误差SRME评价预测值和观测值之间的误差程度, 其表达式见式(2)和式(3)。
${{E}_{\text{MS}}}={1}/{n}\; \sum\nolimits_{i=1}^{n}{{{\left( {{y}_{i}}-{{{\hat{y}}}_{i}} \right)}^{2}}}$ (2)
${{S}_{\text{RME}}}=\sqrt{{\sum\nolimits_{i=1}^{n}{{{\left( {{y}_{i}}-{{{\hat{y}}}_{i}} \right)}^{2}}}}/{n}\; }$ (3)
式中:${{y}_{i}}$为第i个真实值; ${{\hat{y}}_{i}}$为第i个模型预测值; n为待评估的数据样本量。EMS的值总是非负的, 值越小表示模型的预测准确度越高。但是, 由于EMS计算的是误差的平方, 因此对离群值特别敏感。SRME和EMS一样, 值越小表示模型预测的准确度越高。SRME的一个优点是其单位和原始数据的单位相同, 这使得解释和理解模型的误差更为直观。
为了同时满足藻类藻种识别与定量预测任务需求, ResNet、MobileNet和EfficientNet三种模型均采用分类-回归双通道输出架构。三种模型对藻种分类识别训练过程的测试精度及损失曲线如图2所示。由图可知, 在经过迭代训练100次后, 三种模型的藻类识别精度均趋近于1, 说明三种模型经过训练均能够较好地完成藻种图像分类任务。同时, 根据训练测试精度和损失曲线的波动可以看出, MobileNet和EfficientNet两种模型均出现了较大的损失波动, 这表明模型在训练过程中可能存在一定的过拟合问题, 当然学习率与模型训练的不适配也可能是造成损失波动的一个潜在原因。而ResNet模型的损失曲线更加平滑, 且终值更低, 说明该模型在识别过程中有效减少了过拟合问题, 并且表现出更好的收敛性和更高的分类精度。
模型的另一个训练任务是对藻生物量的回归预测。三种模型定量预测训练过程的评价指标SRME和R2曲线如图3所示。相较于分类任务, 三种模型在进行回归预测训练时, 相关指标均出现了显著衰减。具体来看, 三种模型的损失SRME均出现了明显的波动, 这说明针对回归预测任务时, 模型的泛化能力受到了一定的影响。而R2的波动更为明显, 说明模型的预测精度相较于分类任务出现了显著下降。相比之下, ResNet在训练后期基本收敛, 比其他两种模型表现出更强的抗干扰能力。
对于分类任务, 通过对独立验证集中10个浓度下的陌生图像数据进行分类, 将其分类预测的标签结果与实际标签进行对照, 形成评价三种模型分类性能的混淆矩阵, 如图4所示。图中各个数值代表模型预测的样本个数, 其中对角线上的数值代表正确预测的样本数, 其他位置为预测错误的样本数。由图可知, ResNet、MobileNet和EfficientNet分别对三种藻类的预测准确率(即矩阵对角线样本数占所有预测样本数量的比例)分别为100%、99.33%和99%, 其中ResNet实现了完全识别, 而MobileNet和EfficientNet对螺旋藻的识别均出现了一定的识别错误, 两种模型均出现了将部分螺旋藻样本识别成小球藻的情况。
三种模型对小球藻、红藻和螺旋藻的生物量预测如图5所示。纵坐标和横坐标分别对应预测浓度和实际浓度。对角线上的点代表预测值和实际值完全相同, 即模型预测完全准确, 但在实际过程中模型的预测受多种因素干扰而会出现一定的偏移, 偏移距离越小代表模型精度越高。从图中可知, 在低浓度下, 三种模型对三种微藻的浓度预测值距离对角线的距离非常小, 说明低浓度下三种模型的识别准确率较高; 而随着浓度增加, 各个藻类的预测值均出现了较大偏移, 此时预测结果误差显著增大。相比之下, ResNet在高浓度下的预测值比其他两种模型更接近对角线, 说明ResNet的泛化能力相较于其他两种模型更出色[25]。
![]() | 图5 ResNet(a、d、g)、MobileNet(b、e、h)和EfficientNet(c、f、i)对三种藻类的生物量预测Fig. 5 Biomass prediction for three types of algae using ResNet (a, d, g), MobileNet (b, e, h), and EfficientNet (c, f, i) |
另一方面, 三种模型对红藻的拟合预测值相较于其他两种藻更准确。同时, 高浓度下红藻预测值的分布范围更窄, 且更接近对角线位置。调取独立验证数据集的图像数据进行研究分析, 如表1所示。通过对比不难看出, 在藻类浓度 ≤ 0.5 g/L时, 三种藻类的图像随浓度的变化趋势明显, 此时图像颜色与藻液浓度存在显著的正相关性; 当藻类浓度 > 0.5 g/L时, 小球藻和螺旋藻的图像颜色显著变暗, 且随浓度变化趋势均不显著, 此时图像与藻浓度的正相关性减弱, 从而导致模型预测能力显著下降。而红藻则在高浓度下仍然呈现了较强的颜色-浓度正相关性, 从而极大地提高了图像的可识别性。这种同浓度下红绿颜色变化梯度不一样的原因目前没有文献报道。可能由多方面原因造成, 如红绿藻细胞的个体差异、不同藻种对光散射的影响差异以及两种颜色的波长对动态可视范围的影响等[26]。
![]() | 表1 独立验证集中三种微藻在不同浓度下的图像 Table 1 Images of three types of microalgae at various concentrations in an independent validation set |
三种模型的藻生物量预测性能评价指标如表2所示。从藻种角度分析, 三种藻中, 红藻的预测效果最好, ResNet、MobileNet和EfficientNet的预测精度分别为0.962 8、0.931 8、0.938 0, 均高于另外两种藻类的预测精度。同时, 三种模型预测红藻生物量的误差指标SRME分别为0.206 9、0.280 0和0.267 0, 同样小于其他两种藻类, 说明三种网络模型在红藻生物量预测中的泛化能力最好。从模型角度看, ResNet取得了红藻和螺旋藻两种藻类的最佳预测成绩, EfficientNet取得了小球藻的最佳预测成绩, MobileNet表现最差, 三种藻类成绩均未表现出最优预测精度。综上所述, ResNet在藻生物量的定量预测中表现最佳。
![]() | 表2 三种模型的藻生物量预测性能评价指标 Table 2 Evaluation metrics for algal biomass prediction performance of three models |
微藻培养过程的在线检测对微藻能源化意义重大。提出了一种基于深度卷积网络算法的微藻识别及生物量预测在线监测方法。选取了ResNet、MobileNet以及EfficientNet三种模型, 对三种藻类的藻液图像同时进行分类识别及藻浓度回归预测, 通过提取图像的RGB值构建微藻图像-藻种-浓度之间的映射关系。研究结果表明, 在藻类识别方面, 三种模型的识别准确率均达到了99%以上, 能基本满足大规模微藻工业培养过程中的识别要求。在藻生物量预测方面, ResNet的预测精度最高, 同时红藻得益于其高浓度下更显著的颜色-浓度相关性, 相较于其他两种藻类具有更高的识别准确率(0.938 0 ~ 0.962 8)。这项研究能有效弥补传统的离线检测方法精度高但效率低下、成本高的实时性和经济性短板, 为微藻能源工业化的过程控制提供一种更加廉价高效的在线解决方案。同时, 研究中发现部分高浓度预测准确率受环境因素及溶液光饱和效应干扰明显。后续研究将进一步优化实验系统及模型架构, 以提高模型对复杂环境的泛化能力以及高浓度下的识别准确性。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|