Rapid Quantitative Detection of Bound and Free Phenolic Contents in Rice Bran by Using Fourier Transform Near Infrared Spectroscopy
-
摘要: 针对新鲜米糠酚类含量检测的时效性不足的问题,本文建立了一种基于傅里叶转化近红外光谱技术(FT-NIR)的米糠酚类组分快速无损检测方法。以多批次的新鲜米糠作为实验原料,定量分析了其游离态酚类、结合态酚类以及总酚含量,构建了基于全波段和特征波段的偏最小二乘回归(PLSR)、支持向量机(SVM)、BP人工神经网络(BPNN)的预测模型。结果表明:在全波段数据建模中,基于PLSR模型的预测结果(结合态、游离态以及总酚)相对最佳,对应的
为0.944、0.943和0.937,RPD为3.031、2.779和2.863;采用竞争适应性重加权采样法(CARS)和连续投影算法(SPA)分别提取了4~8个特征波段,其中基于CARS-PLSR(结合态、游离态以及总酚)预测效果相对最佳,对应的 为0.953、0.932和0.944,RPD为3.301、2.759和3.031,建模的运行时间缩短2倍,仅需2 s,符合米糠中酚类物质检测的时效性需求。本研究结果证实了基于FT-NIR技术可以实现米糠中酚类含量组分的快速定量检测。Abstract: In order to solve the insufficient timeliness in the detection of phenolic contents in fresh rice bran, a rapid nondestructive detection method by using Fourier transform near infrared spectroscopy (FT-NIR) was constructed in this work. Multiple batches of fresh rice bran were utilized as experimental samples. Contents of free, bound and total phenolic compounds in fresh rice bran were quantitatively detected, and the prediction models of partial least squares regression (PLSR), support vector machine (SVM) and back propagation neural network (BPNN) were established based on full and characteristic wavelengths of FT-NIR. The results showed that the models based on PLSR algorithm obtained the best predicted performance based on full-wavelength datasets, the reached 0.944, 0.943 and 0.937, and RPD reached 3.031, 2.779 and 2.863 for free, bound and total phenolic compounds, respectively. Two variable selection methods, named competitive adaptive reweighted sampling (CARS) and continuous projection (SPA) algorithms, were used in this work, and several key wavelengths from 4 to 8 numbers were selected. Best predicted models using key-wavelength datasets were constructed by CARS-PLSR, with of 0.953, 0.932 and 0.944 for bound, free and total contents, respectively. The RPD could obtain with 3.301, 2.759 and 3.031, respectively. Meanwhile, the running time of modeling was shortened by 2 times and only needed 2.0 s, which could meet the timeliness requirement of detection of phenolic compounds in rice bran. The results of this study confirmed that FT-NIR technique could be used for rapid and quantitative determination of phenolic components in rice bran. -
稻谷是我国主要粮食作物之一,根据国家粮食局的公告显示,我国2021年的稻谷产量超过20000万吨[1]。米糠是稻谷加工过程中的副产物,我国米糠年产量约为1200万吨,位居世界第一。稻米中约64%的营养物质聚集于米糠之中,是淀粉、蛋白质、脂质以及纤维素、多酚等一系列营养物质的重要来源[2]。酚类物质是植物的一种重要次级代谢产物,其中包括生育酚、生育三烯酚和谷维素等,在稻谷中主要以两种形态存在:可溶性形式,包括游离态和可溶共价结合态,可溶性酚类具有典型的抗氧化特性,可直接用甲醇水溶液、乙醇和丙酮等溶剂提取。该类成分可以在胃和小肠中被迅速吸收,并扩散到全身,它能抑制低密度脂蛋白(LDL)胆固醇和脂质体的氧化,能对人体起到保健防病的作用[3];不溶性形式,又称为结合酚,该类物质主要以醚键、酯键和碳碳共价键等形式,与结构蛋白、纤维素和果胶等大分子物质结合,相对可溶性形态更加稳定,不溶于水溶液中。结合态酚类不能直接被人体内酶系统消化,可以在结肠中微生物菌群酶解促进下释放,对预防结肠癌以及抗炎作用可发挥重要作用[4]。研究文献表明,酚类物质是公认的预防和治疗慢性疾病的最具生物活性的天然成分之一,具有广阔的应用前景[5]。米糠中含有许多重要多酚类物质,主要有阿魏酸、对香豆酸、原儿茶酸、香草酸等[6]。作为稻谷籽粒的重要组成部分,虽然米糠仅占据籽粒总体质量10%,却包含了整粒稻米中超过了50%的酚类物质,具有丰富的加工利用价值[7]。通常,米糠中酚类物质本身含有较多羟基,在碱性、光照、热等条件下不稳定,且容易受到环境条件的影响。现在的理化检测分析中极容易氧化酸败,造成检测结果出现严重误差[8]。另一方面,米糠中酚类又常以结合态和游离态等形式共存,需要采用繁杂的预处理手段进行分离并定量分析,检测周期漫长,相关研究较少[9]。因此,开发快速无损的米糠酚类组分含量检测是推动米糠高值化利用的重要手段之一。
当前,在食品组分无损检测领域中,以计算机视觉、太赫兹、拉曼光谱等技术构建的无损检测方法研究成为热点。与现有的理化检测技术相比,基于光学特征的无损检测技术能在保持样品原有物化特性基础下,实现食品组分的快速评价与定量分析。然而受自身特性限制,该类技术在实际应用中存在进一步提高空间,如计算机视觉成像包含的光学信息不足,无法满足基于光学信息的化学物质含量定量分析;太赫兹技术相对应用成本偏高,装置灵活程度与便携程度有待进一步提高;拉曼光谱及成像等技术,受到拉曼信号强度及背景基质影响,信噪比有待加强[10]。傅里叶近红外光谱(Fourier transform near infrared spectra,FT-NIR)分析技术,作为一种高精度近红外检测技术,其光谱分辨率可达0.1~0.005 cm−1,波长范围覆盖770~2500 nm,采用的傅里叶变换对光信号的处理,避免了电机驱动光栅时造成的误差,具有良好的信噪比和重现性,广泛用于化学组分的定性与定量分析[11]。目前,FT-NIR技术在粮食组分快速检测领域中已经得到了具体应用,如王涛等[12]成功开发出具有化学计量学的近红外光谱模型,实现对来自不同地域的米糠样品的蛋白(模型决定系数
=0.93)、粗脂肪(预测模型决定系数 =0.94)以及粗纤维(预测模型决定系数 =0.93)含量的预测。姜红等[13]通过近红外光谱技术建立了米糠粕中水(R2=0.959)、灰分(R2=0.917)和粗蛋白(R2=0.963)的预测模型。路辉等[14]利用近红外光谱技术实现了对大米中直链淀粉( =0.8030)、蛋白质( =0.943)、脂肪( =0.833)、水分( =0.942)含量同时快速无损的检测。上述研究证实了FT-NIR在粮食作物及其副产物组分检测方面具备较强的应用价值。然而,在米糠酚类物质检测方面缺乏进一步研究,特别是对结合态和游离态酚类的组分快速检测方面,缺乏可行性论证。同时现有研究主要集中于模型的精度上面,对于不同算法建模时效性以及不同特征波段提取方式对其的影响的相关研究较为少见,对于米糠这种容易劣变的农副产品,选取时效性强的建模方式具备较强的实际应用价值。综上,为进一步推动FT-NIR技术在粮食副产物加工领域的应用和发展,本次研究以多批次新鲜米糠为实验对象,获取1000~2500 nm波段下傅里叶转换的近红外光谱信息,结合化学计量学,分析样本中结合态、游离态以及总酚含量与光谱间关联特性,尝试构建线性和非线性的无损预测数学模型,探讨检测过程中的时效性,以实现对米糠中酚类物质含量的快速无损检测。
1. 材料与方法
1.1 材料与仪器
新鲜米糠 由2020年11月新收获的京优1号粳稻谷(初始水分含量:19.0%±0.5%)制备而成。正已烷、乙醇 广东光华科技股份有限公司;氢氧化钠 国药集团化学试剂有限公司;盐酸 南京化学试剂股份有限公司;福林酚、没食子酸 上海源叶生物科技有限公司;甲醇 广东光华科技股份有限公司。
砻谷碾米一体机 广州市邦民机械设备厂;ZHWY-1102双层恒温摇床 上海智城分析仪器制造有限公司;Antaris傅里叶变换光谱仪 美国赛默飞世尔科技公司;磁力搅拌器 南京莱福瑞斯有限公司;TG16WS高速离心机 长沙湘智离心机仪器有限公司;旋转蒸发仪 南京莱福瑞斯有限公司;NV-8G氮吹干仪天津博纳艾杰尔科技有限公司;U-3900紫外-可见分光光度计 日本日立高新技术公司。
1.2 实验方法
1.2.1 光谱测定
将新鲜米糠采用40目筛(0.425 mm孔径)进行筛分,每6 g存放PE塑封袋中,挤出袋内空气立即存放在−20 ℃冰箱中备用。为保证建模数据多样性,共计开展10批次样本获取,每批次获取15组样本用于分析,8个批次用于建立模型及内部验证,2个批次用于外部验证。采用Antaris傅里叶变换光谱仪采集样品的漫反射光谱,根据预实验结果,设备参数设为光谱范围1000~2500 nm全波段扫描,扫描分辨率为8 cm−1。扫描次数64次,背景光谱每隔1 h采集一次。为了得到稳定的信号,开机预热后30 min后再进行检测分析,每个样本重复扫描3次,取平均值用于后续统计分析。
1.2.2 游离态酚的提取
游离酚的提取参考Adom等[15]的方法。取3.00 g样品,分别用20 mL 80%乙醇提取两次,每次磁力搅拌10 min,然后4500 r/min离心5 min,合并上清液,在45 ℃下旋蒸至干,用80%乙醇定容于25 mL容量瓶中,在4 ℃下保存。
1.2.3 结合态酚的提取
米糠结合态酚类物质提取参照Adom等[15]的方法。向经过提取游离态酚类物质后的沉淀物中加入40 mL 2 mol·L−1 NaOH溶液,充入氮气密封后在室温下振荡1 h。所得水解液用6 mol·L−1 HCl 溶液调节pH至1后,用100 mL正己烷萃取脱脂,再用100 mL乙酸乙酯萃取5次,合并乙酸乙酯萃取相,在45 ℃条件下旋转蒸发至干,残余物用甲醇定容至10 mL,得结合态酚类物质提取液,分装后冻存于−20 ℃冰箱,重复3次。
1.2.4 总酚含量的测定
总酚含量的测定参照李青等[16]的方法并稍有改动。移取0.125 mL游离酚/结合酚提取液,加入0.5 mL蒸馏水和0.125 mL的福林酚试剂,混匀后25 ℃下静置反应6 min后,再加入1.25 mL 7%(m/v)Na2CO3溶液和1 mL蒸馏水,混匀后在25 ℃下避光静置90 min,于760 nm波长下测其吸光值。同时以0.125 mL甲醇代替提取液作空白对照,配制不同溶度梯度没食子酸标准品制作标准曲线。总酚含量为游离酚含量与结合酚含量之和,以每100 g米糠干基中所含没食子酸当量(mg GE/100 g DW)表示,测定重复3次。
1.2.5 光谱数据预处理
采集的原始光谱信息经FT-NIR配套软件矫正后,仍存在光散射、设备噪声以及基线漂移等现象,考虑到自动配置调优(Autoscale)算法在消除近红外光谱背景干扰,降低光谱噪声,提高光谱质量和信号差异方面优势[17],本次实验采用该预处理算法对FT-NIR光谱进行初步处理,用以提高后期预测模型的鲁棒性。
1.3 数据处理
由于近红外光谱中包含有丰富的样品信息,不同的官能团存在不同的峰值,同时不同组分的峰可能发生重叠并彼此之间相互干扰,对于结果的分析造成一定的偏差。CARS算法可以优选出模型中回归系数绝对值大的关键变量,提升处理后的模型准确度和预测能力。SPA 算法通过对原有光谱信息的投影变换,基于矫正模型和投影向量大小,选择出含有冗余信息最少和共线性最小的变量组合[18]。因此,分别采用竞争适应性重加权采样法(CARS)和连续投影算法(SPA)进行特征波段筛选。
随后结合PLSR、SVM和BPNN进行模型构建[19]。其中,PLSR作为典型的线性数学模型,可以通过投影分别将预测变量和观测变量投影到一个新空间,实现通过少数几个特征变量来充分预测因变量[20]。SVM可以实现无损信号与理化指标之间的非线性关联性构建,能够解决小样本、非线性及高维模式识别分类等问题,可以有效的进行分类和回归[21]。BPNN是目前应用最广泛的神经网络之一,其非线性映射能力突出,在数据集预测及分类问题方面表现突出[22]。根据K-S(Kennard-Ston)法,按照3:1比例对于样品进行划分,90个样品作为建模集,30个样本作为验证集[23]。选择1000~2502.37 nm波段作为建模的全光谱,共779个波长。预测集数据基本涵盖于建模集数据之内,可以用于米糠样本的建模与验证分析。
分别采用建模集和验证集的决定系数(R2),均方根误差(RMSE)和相对预测偏差(RPD)进行计算,如式(1)~式(3)所示。式中,n代表样本数量,i代表第i号样本,ym表示实际值,yi表示预测值。通常好的定量分析模型应具有较低的RMSE,较高的R2和RPD值。若RPD≥3,说明该模型检测精确度非常好,可满足精细化检测;若2.0≤RPD<3,说明所建立的近红外模型检测效果可以满足一般定量分析;若RPD<2.0,则说明使用该近红外模型精度有待提高[24]。
(1) (2) (3) 2. 结果与分析
2.1 FT-NIR光谱分析
图1为120份米糠样品的原始光谱信息,每条光谱由779个变量组成。由图1可知,不同样本的平均光谱总体相似性较高,光谱曲线重现性较好。光谱曲线在1190、1450、1750、1950、2125和2270 nm附近具有明显吸收峰。这些光谱吸收峰主要对应组织中C-C单键、C=C双键、C-H键和O-H键的周期性伸缩振动相关,也是组成酚类物质的主要成分[25]。由于米糠多酚成分复杂,对应的不同基团(如-CH3、-CH2-等)或同一基团在不同化学环境中近红外吸收波长与强度都有明显差别,同时酚类酯键、糖苷键、醚苷键等形式与其他物质(包括蛋白质、单糖、有机酸等)相结合,所以不同波段光谱吸收强度不同[10]。光谱曲线趋势一致但是并不重合,且不同样品的吸收光谱存在差异,这说明光谱数据可用于近红外定量分析[26]。考虑到FT-NIR光谱信息中相邻波长下信息存在严重的数据重叠,部分检测曲线存在极限平移等现象,无法通过简单的二元多次方程进行直接描述,需要采用化学计量学方案构建FT-NIR光谱预测模型[27]。
2.2 米糠多酚含量测定结果
此次实验中120份米糠样本酚类含量如图2所示。游离酚含量在213.78~318.67 mg GAE/100 g之间,平均值为281.655 mg GAE/100 g;结合酚含量在211.95~392.74 mg GAE/100 g之间,平均值为236.639 mg GAE/100 g;总酚含量在431.91~665.14 mg GAE/100 g之间,平均值为518.294 mg GAE/100 g。实验结果表明米糠中以游离态的形式存在的酚类物质含量略高于结合酚形态,该实验结果与陈彩薇等[28]研究结果一致。根据王雪梅等[29]对于稻谷中酚类物质含量的研究,游离酚含量在9.45~17.45 mg GAE/100 g,结合酚酸的含量在13.03~33.38 mg GAE/100 g,总酚酸含量则在30.69 mg GAE/100 g左右,进一步证实了此次米糠样本具有代表性。米糠中的酚类物质含量是等质量稻谷平均含量的十倍以上,远高于稻米的平均酚类物质含量,具有较强的营养价值。这可能是因为酚酸在稻谷中主要与膳食纤维发生共轭结合,如纤维素,半纤维素,果胶等,而麸皮中富含膳食纤维[30]。酚含量范围整体较宽,适合建立近红外预测模型[31]。
2.3 全波段下的建模预测结果
如表1所示,为验证酚类物质含量与光学性质的关系,基于米糠的近红外吸收系数建立FT-NIR模型。在光谱采集过程中由于仪器噪音、暗电流等及米糠样品等产生的光谱曲线不重复、基线漂移,光谱信息重叠、散射等干扰现象影响到建模的精度[32],采用Autoscale预处理联合三种建模方法(PLSR、SVM、BPNN)进行建模并比较性能差异。建立的15个综合模型中,建模集决定系数RC整体高于预测集决定系数RP,但整体之间差异不大,表明没有过度拟合。建立的模型整体预测效果较为良好,R2均大于0.9,RPD范围在2.613~3.031之间,RMSEP在2.747~3.955 mg GAE/100 g之间,可以满足实际需求。游离酚和总酚的精度最高的预测模型建模方式为PLSR,结合酚模型精度最高的方式为BPNN算法[33]。
表 1 米糠酚类物质含量预测模型(mg GAE/100 g)Table 1. Prediction model of free phenolic content in rice bran (mg GAE/100 g)酚类物质 建模方式 建模集 交互集 预测集 RPD RMSEC RMSECV RMSEP 游离酚结合酚 PLSR 0.972 3.617 0.965 3.019 0.944 3.048 3.031 SVM 0.982 3.095 0.975 3.510 0.944 3.077 3.031 BPNN 0.971 3.615 0.960 3.292 0.934 3.188 2.799 PLSR 0.950 3.386 0.929 3.772 0.933 3.932 2.779 SVM 0.993 2.770 0.991 3.291 0.923 3.434 2.599 BPNN 0.972 3.679 0.958 2.969 0.943 3.197 3.005 总 酚 PLSR 0.998 1.603 0.967 2.798 0.937 3.439 2.863 SVM 0.998 2.651 0.991 2.938 0.924 3.955 2.615 BPNN 0.993 3.468 0.971 3.307 0.934 2.747 2.799 2.4 近红外光谱特征波段提取
分别采用CARS和SPA进行了FT-NIR光谱数据特征波长的提取,结合特征算法构建的数学矩阵中,对含有最低限度的冗余信息变量组的筛选,寻找最佳特征波长组合,本次实验特征波长提取结果如表2所示。游离态酚类分别提取了7和6个特征波长;结合态酚类共计提取了4和5个特征波长;总酚含量对应的特征波长数量最多,共计8和6个。其中,1120、1520和1950 nm是SPA和CARS特征筛选中共有的光谱波长,代表性较强。对比分析发现,原有建模过程中使用到的近红外波段数达到779个,存在较多的冗余波长和干扰变量,难以满足现代工业进行高通量快捷检测的需求[34]。经过特征数据挑选后,单个样品光谱数据量降低至4~8个,缩减倍数超过97倍,其中1520和1950 nm特征波长多次出现,表现出了较强的相关性,显著提高了建模时效性,可以有效减少计算过程所需要的成本[35]。
表 2 特征波长提取Table 2. Extraction of characteristic wavelengths酚类物质 提取
方式特征
波长数提取波段(nm) 游离酚 SPA 7 1055、1083、1132、1164、1313、1450、2500 CARS 6 1004、1015、1110、1120、1520、1950 结合酚 SPA 4 1033、1120、1520、1950 CARS 5 1019、1132、1164、1301、2190 总酚 SPA 8 1022、1110、1120、1520、1950、2135 CARS 6 1019、1084、1160、1520、1950、2135 2.5 特征波段下的建模预测结果
如表3,与全波段建模相比,特征波段建模后的预测均方根误差(RMSEP)与(RMSEC)以及(RMSEV)未发生明显改变,建模集与预测集R2基本上大于0.9。经SPA算法提取的特征波长建模后,三种算法所建立的模型RPD有一定程度的下降,而通过CARS提取后的PLSR模型RPD值则即在有限范围内波动,减少建模波段数仅对建模R2精度影响不超过0.1。随着建模选取波段数的减少,基于关键波段数所建立的模型精度会呈现一定的下降趋势[36]。但合适的特征波段,可以有效保证新模型精度不低于甚至高于全波段模型,比如韩亚芬等[18]分别采取UVE、SPA以及CARS进行特征波段提取后,建立的CARS-SPA优化模型优于原模型,RMSEP由1.52%降低至1.04%,Rp、RPD分别由0.88和2.28%提高至0.93和3.64%。本次特征波段选取的结果表明模型整体适用性较强,选用CARS算法进行特征波段提取效果总体优于SPA算法,采取PLSR进行建模综合效果优于其它建模方式。
表 3 特征波段提取后游离酚、结合酚以及总酚含量预测模型Table 3. Prediction model of free, bound and total phenolic contents after feature wavelengths extraction酚类物质 特征波段提取方式 建模方式 建模集 交互集 预测集 RPD RMSEC RMSECV RMSEP 游离酚 PLSR 0.969 2.793 0.965 3.053 0.953 2.901 3.301 CARS SVM 0.991 2.092 0.986 2.566 0.887 3.815 2.166 BPNN 0.992 1.911 0.982 2.863 0.934 2.902 2.799 PLSR 0.932 2.607 0.927 2.791 0.939 3.419 2.908 SPA SVM 0.997 1.251 0.975 3.456 0.910 3.523 2.412 BPNN 0.972 2.679 0.968 2.846 0.934 3.197 2.799 结合酚 PLSR 0.949 3.381 0.943 2.839 0.932 3.046 2.759 CARS SVM 0.996 1.978 0.991 3.143 0.924 3.318 2.615 BPNN 0.991 3.079 0.976 3.197 0.886 3.215 2.157 PLSR 0.899 3.428 0.888 2.988 0.897 2.919 2.262 SPA SVM 0.999 1.141 0.994 2.684 0.870 3.110 2.028 BPNN 0.988 3.586 0.961 2.587 0.903 2.686 2.328 总酚 PLSR 0.976 3.313 0.973 2.835 0.944 3.243 3.031 CARS SVM 0.996 3.556 0.993 3.439 0.910 2.935 2.412 BPNN 0.992 2.771 0.978 2.044 0.915 2.617 2.479 PLSR 0.926 3.652 0.920 3.220 0.928 2.934 2.684 SPA SVM 0.997 2.862 0.991 3.079 0.889 3.340 2.184 BPNN 0.991 3.172 0.981 2.601 0.934 2.578 2.799 2.6 时效性分析
如表4所示,进一步对比了不同的建模方式之间时效性差异。结果表明,采取BPNN算法建模耗时在9900 s以上,而SVM算法建模平均耗时720 s左右。采取PLSR建模时长最短,仅需6 s左右。PLSR时效性明显优于其它两种算法。经过特征波段提取优化后,建模时效性得到了进一步优化,采取PLSR建模所需时间从原有的6 s降至1 s左右,减少了87.7%;SVM算法的建模所需时间从平均900 s降到180~240 s之间,减少了80%;BPNN算法建模所需时间相对下降幅度最为明显,从平均9900 s下降到120 s左右,减少了98%。对于时效性而言,波段数影响程度较大的依次是BPNN和SVM。选取少量关键波段数据建立的模型与原始模型相差无几,建模效率得到了明显的提升。
表 4 不同建模方式时效性Table 4. Timeliness of different modeling methods酚类物质 建模方式 数据处理方式 无处理(s) CARS特征提取(s) SPA特征提取(s) 游离酚 PLSR 6.56 1 1 SVM 765 180 180 BPNN 9932 120 120 结合酚 PLSR 5.86 1 1 SVM 827 252 240 BPNN 9562 132 150 总酚 PLSR 7.23 1 1 SVM 903 246 222 BPNN 792 132 144 不同算法之间巨大的差异性可能是由于对于噪声和高维数据的处理能力不同[37]。采取PLSR可以在保证模型精度的前提下提升时效性,其它两种的方法所需时间过长,难以满足实际检测需求。综合时效性以及精度进行筛选后可以得出CARS-PLSR建模性能最佳,可以在保持本身精确性的情况下以最快的速度建立模型。
2.7 外部试验验证
结合上述研究成果,采用外部独立模型进行验证,以相同方法制取了30个样本后收集它们的光谱信息以及相关多酚含量信息,采取CARS-PLSR建立模型。结果如表5所示,建模集与预测集R2基本上大于0.9,RPD范围在2.654~3.108之间,RMSEP范围在2.993~3.443 mg GAE/100 g之间。对比建模集与内部验证效果来看,外部验证模型虽然有一定程度下降,但范围有限,整体效果良好,结果进一步证实了FT-NIR技术可用于米糠中多酚组分的含量预测。
表 5 米糠游离酚、结合酚以及总酚含量外部验证实验结果Table 5. Experimental results of external validation of free, bound and total phenolic content of rice bran酚类物质 建模集 交互集 预测集 RPD RMSEC RMSECV RMSEP 游离酚 0.955 2.883 0.945 3.153 0.931 2.993 3.108 结合酚 0.932 3.421 0.913 2.935 0.915 3.129 2.654 总酚 0.956 3.389 0.951 2.915 0.934 3.443 2.922 3. 结论
本文采用了傅里叶转化近红外光谱技术建立了米糠中游离酚、结合酚以及总酚物质含量的无损预测模型,结合多种数据建模方案和特征波长提取方案,实现了建模时效性的提高。研究结果表明,采用PLSR、SVM和BPNN的建模方式均能取得较好的酚类物质预测效果,对应的R2大于0.9,RPD大于3,且各方法之间精度差异不大,但PLSR建模时效性明显优于另外两种算法。分别采用SPA与CARS进行特征波段提取后获得与米糠FT-NIR光谱最为相关的几个光谱波段,其中1520和1950 nm为共有的特征波长。基于特征波长信息下建立的米糠酚类组分预测化学计量学模型,可以大幅提高预测时效性。尤其是BPNN算法的时效性得到了较大的提升,其中CARS-PLSR为最优的建模方式,建立模型预测R2超过0.90,建模仅需2 s,可以满足对于米糠中多酚物质的快速无损检测需求。
本研究为研究米糠中的多酚物质含量与其光学性质之间的关系提供了一定的参考,在后续的相关研究中,可以针对不同品质的米糠样品开展进一步的研究。
-
表 1 米糠酚类物质含量预测模型(mg GAE/100 g)
Table 1 Prediction model of free phenolic content in rice bran (mg GAE/100 g)
酚类物质 建模方式 建模集 交互集 预测集 RPD RMSEC RMSECV RMSEP 游离酚结合酚 PLSR 0.972 3.617 0.965 3.019 0.944 3.048 3.031 SVM 0.982 3.095 0.975 3.510 0.944 3.077 3.031 BPNN 0.971 3.615 0.960 3.292 0.934 3.188 2.799 PLSR 0.950 3.386 0.929 3.772 0.933 3.932 2.779 SVM 0.993 2.770 0.991 3.291 0.923 3.434 2.599 BPNN 0.972 3.679 0.958 2.969 0.943 3.197 3.005 总 酚 PLSR 0.998 1.603 0.967 2.798 0.937 3.439 2.863 SVM 0.998 2.651 0.991 2.938 0.924 3.955 2.615 BPNN 0.993 3.468 0.971 3.307 0.934 2.747 2.799 表 2 特征波长提取
Table 2 Extraction of characteristic wavelengths
酚类物质 提取
方式特征
波长数提取波段(nm) 游离酚 SPA 7 1055、1083、1132、1164、1313、1450、2500 CARS 6 1004、1015、1110、1120、1520、1950 结合酚 SPA 4 1033、1120、1520、1950 CARS 5 1019、1132、1164、1301、2190 总酚 SPA 8 1022、1110、1120、1520、1950、2135 CARS 6 1019、1084、1160、1520、1950、2135 表 3 特征波段提取后游离酚、结合酚以及总酚含量预测模型
Table 3 Prediction model of free, bound and total phenolic contents after feature wavelengths extraction
酚类物质 特征波段提取方式 建模方式 建模集 交互集 预测集 RPD RMSEC RMSECV RMSEP 游离酚 PLSR 0.969 2.793 0.965 3.053 0.953 2.901 3.301 CARS SVM 0.991 2.092 0.986 2.566 0.887 3.815 2.166 BPNN 0.992 1.911 0.982 2.863 0.934 2.902 2.799 PLSR 0.932 2.607 0.927 2.791 0.939 3.419 2.908 SPA SVM 0.997 1.251 0.975 3.456 0.910 3.523 2.412 BPNN 0.972 2.679 0.968 2.846 0.934 3.197 2.799 结合酚 PLSR 0.949 3.381 0.943 2.839 0.932 3.046 2.759 CARS SVM 0.996 1.978 0.991 3.143 0.924 3.318 2.615 BPNN 0.991 3.079 0.976 3.197 0.886 3.215 2.157 PLSR 0.899 3.428 0.888 2.988 0.897 2.919 2.262 SPA SVM 0.999 1.141 0.994 2.684 0.870 3.110 2.028 BPNN 0.988 3.586 0.961 2.587 0.903 2.686 2.328 总酚 PLSR 0.976 3.313 0.973 2.835 0.944 3.243 3.031 CARS SVM 0.996 3.556 0.993 3.439 0.910 2.935 2.412 BPNN 0.992 2.771 0.978 2.044 0.915 2.617 2.479 PLSR 0.926 3.652 0.920 3.220 0.928 2.934 2.684 SPA SVM 0.997 2.862 0.991 3.079 0.889 3.340 2.184 BPNN 0.991 3.172 0.981 2.601 0.934 2.578 2.799 表 4 不同建模方式时效性
Table 4 Timeliness of different modeling methods
酚类物质 建模方式 数据处理方式 无处理(s) CARS特征提取(s) SPA特征提取(s) 游离酚 PLSR 6.56 1 1 SVM 765 180 180 BPNN 9932 120 120 结合酚 PLSR 5.86 1 1 SVM 827 252 240 BPNN 9562 132 150 总酚 PLSR 7.23 1 1 SVM 903 246 222 BPNN 792 132 144 表 5 米糠游离酚、结合酚以及总酚含量外部验证实验结果
Table 5 Experimental results of external validation of free, bound and total phenolic content of rice bran
酚类物质 建模集 交互集 预测集 RPD RMSEC RMSECV RMSEP 游离酚 0.955 2.883 0.945 3.153 0.931 2.993 3.108 结合酚 0.932 3.421 0.913 2.935 0.915 3.129 2.654 总酚 0.956 3.389 0.951 2.915 0.934 3.443 2.922 -
[1] 周显青, 杨继红, 张玉荣. 国内外米糠资源利用现状与发展[J]. 粮食加工,2014,39(5):24−29. [ZHOU Xianqin, YANG Jihong, ZHANG Yurong. Utilization status and development of rice bran resources at home and abroad[J]. Food Processing,2014,39(5):24−29. [2] 李向菲, 沈丹, 黄俊凯, 等. 米糠功能活性成分及其功效的研究进展[J]. 食品工业科技,2022,43(13):466−474. [LI Xiangfei, SHEN Dan, HUANG Junkai, et al. Research progress on functional active components and efficacy of rice bran[J]. Science and Technology of Food Industry,2022,43(13):466−474. doi: 10.13386/j.issn1002-0306.2021070310 [3] CHANDRASEKARA A, SHAHIDI F. Bioactivities and antiradical properties of millet grains and hulls[J]. Journal of Agricultural and Food Chemistry,2011,59(17):9563−9571. doi: 10.1021/jf201849d
[4] DIPTI S S, BERGMAN C, INDRASARI S D, et al. The potential of rice to offer solutions for malnutrition and chronic diseases[J]. Rice,2012,16(5):1−18.
[5] 郭轩宇, 侯恒亮, 路建强, 等. 米糠热稳定化技术的研究进展[J]. 现代面粉工业,2020,34(3):26−29. [GUO Xuanyu, HOU Hengliang, LU Jianqiang, et al. Research progress of rice bran thermal stabilization technology[J]. Modern Flour Industry,2020,34(3):26−29. doi: 10.3969/j.issn.1674-5280.2020.03.008 [6] LIU Y Q, STRAPPE P, ZHOU Z K, et al. Impact on the nutritional attributes of rice bran following various stabilization procedures[J]. Critical Reviews in Food Science and Nutrition,2018:1−55.
[7] ALEKSANDAR Ž K, DANIJEL D M, UROŠ M G, et al. Polyphenolic profile and antioxidant properties of bee-collected pollen from sunflower (Helianthus annuus L.) plant[J]. LWT-Food Science and Technology,2019:112.
[8] PRABHU, ASHISH A, JAYADEEP, et al. Optimization of enzyme-assisted improvement of polyphenols and free radical scavenging activity in red rice bran: A statistical and neural network-based approach[J]. Preparative Biochemistry & Biotechnology: An International Journal for Rapid Communication,2017,47(4):397−405.
[9] 徐彩红, 马丽鑫, 李桂杰, 等. 响应面法优化米糠多酚的醇提工艺[J]. 食品工业科技,2017,38(16):194−198. [XU Caihong, MA Lixin, LI Guijie, et al. Optimization of ethanol extraction process of polyphenols from rice bran by response surface methodology[J]. Science and Technology of Food Industry,2017,38(16):194−198. doi: 10.13386/j.issn1002-0306.2017.16.036 [10] DANIEL C. The ability of near infrared (NIR) spectroscopy to predict functional properties in foods: Challenges and opportunities[J]. Molecules,2021,26(22):6981. doi: 10.3390/molecules26226981
[11] 赵丽华, 巩元勇, 张洁, 等. 近红外光谱法快速测定藜麦籽粒粗蛋白含量[J]. 食品工业科技,2020,41(15):233−236, 243. [ZHAO Lihua, GONG Yuanyong, ZHANG Jie, et al. Rapid determination of crude protein content in quinoa grains by near infrared spectroscopy[J]. Science and Technology of Food Industry,2020,41(15):233−236, 243. doi: 10.13386/j.issn1002-0306.2020.15.036 [12] 王涛, 翟晨, 白术群, 等. 米糠粗蛋白、粗脂肪以及粗纤维含量的近红外预测模型的建立[J]. 中国粮油学报,2022,37(2):1−6. [WANG Tao, LIAO Chen, BAI Shuqun, et al. Establishment of near infrared prediction model for crude protein, crude fat and crude fiber content in rice bran[J]. Chinese Journal of Cereals and Oils,2022,37(2):1−6. doi: 10.3969/j.issn.1003-0174.2022.02.002 [13] 姜红, 赵志行, 李小定, 等. 基于近红外光谱技术的米糠粕主要成分分析[J]. 食品工业科技,2015,36(16):86−90, 172. [JIANG Hong, ZHAO Zhixing, LI Xiaoding, et al. Analysis of main components of rice bran meal based on near infrared spectroscopy[J]. Science and Technology of Food Industry,2015,36(16):86−90, 172. [14] 路辉, 彭彬倩, 冯晓宇, 等. 大米直链淀粉、蛋白质、脂肪、水分含量的近红外光谱检测模型优化[J]. 中国稻米,2020,26(6):55−59, 63. [LU Hui, PENG Linqian, FENG Xiaoyu, et al. Optimization of near infrared spectroscopy model for determination of amylose, protein, fat and water content in rice[J]. The Chinese Rice,2020,26(6):55−59, 63. doi: 10.3969/j.issn.1006-8082.2020.06.011 [15] ADOM K K, LIU R H. Antioxidant activity of grains[J]. Journal of Agricultural and Food Chemistry,2002,50:6182−6187. doi: 10.1021/jf0205099
[16] 李青, 张名位, 张瑞芬, 等. 5种籼稻品种谷壳中游离态和结合态酚类物质含量及其抗氧化活性比较[J]. 中国农业科学,2012,45(6):1150−1158. [LI Qin, ZHANG Mingwei, ZHANG Ruifang, et al. Comparison of content and antioxidant activity of free and combined phenolic compounds in rice husk of five indica rice varieties[J]. Agricultural Sciences in China,2012,45(6):1150−1158. doi: 10.3864/j.issn.0578-1752.2012.06.013 [17] 陈少霞. 基于电子鼻和近红外光谱技术无损检测娃娃菜新鲜度的研究[D]. 南京: 南京农业大学, 2020 CHEN Shaoxia. Research on nondestructive detection of freshness of baby cabbage based on electronic nose and near infrared spectroscopy [D]. Nanjing: Nanjing Agricultural College, 2020.
[18] 韩亚芬, 赵庆亮, 吕程序, 等. 基于CARS-SPA-PLS优化模型的马铃薯干物质、淀粉可见近红外透射光谱检测[C]// 榆林: 第二十三届中国马铃薯大会, 2021: 384−385 HAN Yafen, ZHAO Qingliang, LÜ Chengxu, et al. Detection of potato dry matter and starch by visible near infrared transmission spectroscopy based on CARS-SPA-PLS optimization model [C]//Yulin: The 23rd Chinese Potato Congress, 2021: 384−385.
[19] 孙通, 魏小梅, 胡田, 等. 可见/近红外结合MIA变量优选和支持向量机判别山茶油的制取方式[J]. 食品工业科技,2014,35(20):62−65. [SUN Tong, WEI Xiaomei, HU Tian, et al. Visible/near infrared combined with MIA variable optimization and support vector machine discrimination of camellia oil preparation method[J]. Science and Technology of Food Industry,2014,35(20):62−65. doi: 10.13386/j.issn1002-0306.2014.20.004 [20] WOLD S. PLS-regression: A basic tool for chemometrics[J]. Chemometrics & Intelligent Laboratory Systems,2001,58(2):109−130.
[21] RUMELHART D E, HINTON G E, WILLIAMS R J. Learning representations by back-propagating errors[J]. Nature,1986,323(6088):533−536. doi: 10.1038/323533a0
[22] 张晓. 基于高光谱成像技术小麦新陈度的快速检测方法研究[D]. 郑州: 河南工业大学, 2021 ZHANG Xiao. Research on rapid detection method of wheat freshness based on hyperspectral imaging technology [D]. Zhengzhou: Henan University of Technology, 2021.
[23] 乔春艳, 张雪茹, 郑卫民, 等. 基于近红外光谱技术对市售羊奶粉品质指标独立模型与通用模型探究[J]. 食品工业科技,2021,42(22):297−305. [QIAO Chunyan, ZHANG Xueru, ZHENG Weimin, et al. Research on independent model and general model of quality index of commercially sold sheep milk powder based on near infrared spectroscopy[J]. Science and Technology of Food Industry,2021,42(22):297−305. doi: 10.13386/j.issn1002-0306.2021030153 [24] 魏康丽, 刘畅, 丁海臻, 等. 苹果果肉可溶性固形物、可溶性糖与光学性质的关联[J]. 食品科学,2019,40(18):1−7. [WEI Kangli, LIU Chang, DING Haizhen, et al. Association of soluble solids, soluble sugar and optical properties in apple flesh[J]. Food Science,2019,40(18):1−7. [25] WANG L J, LIU S C, ME Y, et al. The development of near-infrared spectroscopy (NIRS) prediction model for the quality components of flour and intact seed in mungbean[J]. Journal of Plant Genetic Resources,2013,14(5):833−838.
[26] 王赋腾, 孙晓荣, 刘翠玲, 等. 光谱预处理对便携式近红外光谱仪快速检测小麦粉灰分含量的影响[J]. 食品工业科技,2017,38(10):58−61, 66. [WANG Futeng, SUN Xiaorong, LIU Cuiling, et al. Effect of spectral pretreatment on rapid determination of ash content of wheat flour by portable near infrared spectrometer[J]. Science and Technology of Food Industry,2017,38(10):58−61, 66. [27] 覃统佳, 刘冬, 从彦丽, 等. 近红外光谱法测定面粉的水分、脂肪、碳水化合物和蛋白质含量[J]. 食品工业科技,2020,41(12):256−263. [TAN Tongjia, LIU Dong, CONG Yanli, et al. The water, fat, carbohydrate and protein contents of flour were determined by near infrared spectroscopy[J]. Science and Technology of Food Industry,2020,41(12):256−263. [28] 陈彩薇, 吴晖, 赖富饶, 等. 米糠中不同存在形态酚类物质的抗氧化活性研究[J]. 现代食品科技,2015,31(2):42−46,13. [CHEN Caiwei, WU Hui, LAI Furao, et al. Study on antioxidant activity of different phenolic compounds in rice bran[J]. Modern Food Technology,2015,31(2):42−46,13. doi: 10.13982/j.mfst.1673-9078.2015.2.008 [29] 王雪梅, 谭军, 李刚炎. 储藏条件对稻谷酚类物质的影响[J]. 农业机械,2011(11):115−119. [WANG Xuemei, TAN Jun, LI Gangyan. Effects of storage conditions on phenols in rice[J]. Agricultural Machinery,2011(11):115−119. doi: 10.16167/j.cnki.1000-9868.2011.11.024 [30] ACOSTA-ESTRADA B A, GUTIERREZ-URIBE J A, SERNA-SALDIVAR S O. Bound phenolics in foods, a review[J]. Food Chemistry,2014,152:46−55. doi: 10.1016/j.foodchem.2013.11.093
[31] AMANDA T B, FERNANDA L M, AMANDA R F, et al. Identification of fiber added to semolina by near infrared (NIR) spectral techniques[J]. Food Chemistry,2019,289:195−203. doi: 10.1016/j.foodchem.2019.03.057
[32] 陈蓓, 郑恩让, 郭拓. 多种光谱变量筛选算法在红参提取近红外建模中的应用[J]. 光谱学与光谱分析,2021,41(8):2443−2449. [CHEN Bei, ZHENG Enrang, GUO Tuo. Application of multiple spectral variable selection algorithms in near-infrared modeling of red ginseng extraction[J]. Spectroscopy and Spectral Analysis,2021,41(8):2443−2449. [33] ARIAN A, NASTARAN N, MARYAM A, et al. Comparison of near-infrared (NIR) and mid-infrared (MIR) spectroscopy based on chemometrics for saffron authentication and adulteration detection[J]. Food Chemistry,2020:128647.
[34] 杨伟伟, 肖鑫龙, 郭中原, 等. 米糠粕加工生产过程中的品质快速分析技术[J]. 粮食与饲料工业,2018(8):53−57. [YANG Weiwei, XIAO Xinlong, GUO Zhongyuan, et al. Rapid quality analysis technique for rice bran meal processing[J]. Grain and Feed Industry,2018(8):53−57. [35] 王冬, 吴静珠, 韩平, 等. 光谱关键变量筛选在农产品及食品品质无损检测中的应用进展[J]. 光谱学与光谱分析,2021,41(5):1593−1601. [WANG Dong, WU Jingzhu, HAN Ping, et al. Application progress of spectral key variable screening in nondestructive testing of agricultural products and food quality[J]. Spectroscopy and Spectral Analysis,2021,41(5):1593−1601. [36] SHARON N, RUSSELL K G, ALISON K, et al. A data-driven near infrared calibration process including near infrared spectral thumbprints[J]. Journal of Near Infrared Spectroscopy, 2018, 26: 096703351878276.
[37] SILLERO A M, FERNÁNDEZ P, GEORGE S, et al. Quantification of protein in wheat using near infrared hyperspectral imaging: Performance comparison with conventional near infrared spectroscopy[J]. Journal of Near Infrared Spectroscopy, 2018: 096703351878050.
-
期刊类型引用(1)
1. 陈冠怡,许陈彩,李佳玲,李鑫,张伟坚,陈春蓓,王泽富,刘书成. 亚油酸介导氧化的金鲳鱼肌原纤维蛋白结构和凝胶特性变化. 现代食品科技. 2024(09): 248-256 . 百度学术
其他类型引用(0)