Identification of Geographical Origin for Hawthorn Based on Hyperspectral Imaging Technology
-
摘要: 产地是影响山楂品质的重要因素之一,为实现对山楂产地的快速无损鉴别,本文基于高光谱成像技术对不同产地的山楂样品进行产地溯源。以五个不同省级产区的山楂样品作为样本,利用近红外高光谱成像系统,获得每个样品果梗朝上(G)、侧面朝上(C)和底面朝上(D)的可见-短波红外(410~2500 nm)波段高光谱数据。采用多元散射校正(multivariate scattering correction,MSC)、一阶导数(first derivative,D1)、SG平滑(Savitzky-Golay,SG)和标准正态变换(standard normal variate transformation,SNV)四种预处理方法,分别建立了偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA)、支持向量机(support vector machine,SVM)和随机森林(random forests,RF)三种分类模型。结果表明,D-D1-SVM模型分类效果最优,训练集和预测集的准确率均为100%。为进一步简化模型,分别采用连续投影算法(successive projections algorithm,SPA)和竞争性自适应重加权算法(competitive adaptive reweighted sampling algorithm,CARS)进行特征波长筛选。通过多变量数据分析发现,D-SPA-SVM模型效果最佳,训练集和预测集准确率分别为95.2%和93%。本研究为山楂产地的快速、无损识别提供技术支持。Abstract: The geographical origin was one of the important factors affecting the quality of hawthorn. To discriminate the geographical origin of hawthorn rapidly and nondestructively, hawthorns from five different provincial production areas were used as samples, and visible-shortwave infrared (410~2500 nm) band hyperspectral data were obtained for the pedicel face (G), side (C), and bottom (D) of each sample by using a near-infrared hyperspectral imaging system. Partial least squares discriminant analysis (PLS-DA), support vector machine (SVM), and random forests (RF) classification models were built by multivariate scattering correction (MSC), first derivative (D1), SG smoothing (Savitzky-Golay, SG), and standard normal transform (SNV) four preprocessing methods. The results showed that the D-D1-SVM model discriminated optimally, with 100% accuracy in both the training and prediction sets. To simplify the model, successive projections algorithm (SPA) and competitive adaptive reweighted sampling algorithm (CARS) were applied to select feature wavelength. The multivariate data analysis revealed that the D-SPA-SVM model had the best performance, with an accuracy of 95.2% and 93% for the training and prediction sets, respectively. This study could provide technical support for rapid and non-destructive identification of hawthorn origin.
-
山楂(Crataegus pinnatifida)是蔷薇科山楂属植物,是典型的“药食同源”植物[1−3],在我国广泛分布于吉林、辽宁、河北、河南、山东、山西等地区。我国山楂年产量超过150万吨,市场前景广阔,但由于不同产地山楂的各类营养成分含量存在差异[4−5],因此在价格上也有所区分,而当今山楂市场上产地混用、以次充好等现象屡见不鲜,使许多消费者上当受骗,这些现象严重破坏了市场秩序。因此,目前市场亟需一种能够快速准确对山楂进行产地溯源的方法。
目前对于各类农产品产地的溯源主要是依靠化学分析技术,如高效液相色谱技术(High Performance Liquid Chromatography,HPLC)[6]、气相-质谱联用技术(Gas Chromatography-Mass Spectrometry,GC-MS)[7]、超高效液相色谱(Ultra Performance Liquid Chromatography,UPLC)[8]等,这些方法通常在测量前需要对样本进行粉碎或匀浆处理,并使用有机溶剂对样本中的化学成分进行萃取,这一过程不但会损坏样本,同时有机溶剂还可能会对环境造成污染。与之相比,高光谱成像技术是一种基于非常多窄波段的影像数据技术,可以在样本完好的情况下对其进行定性或定量分析[9−10],具有快速、无损、无污染检测的特点。目前,基于高光谱成像技术对各类水果进行产地识别的研究已有很多:张立欣等[11]基于高光谱成像技术,结合多种机器学习算法实现对不同产地的苹果进行区分,其最佳识别模型为MSC-CARS-SVM,预测集准确率达到100%;Sun等[12]采集了不同产地水蜜桃的高光谱数据,并利用HPLC分析解释样本的“高光谱指纹”,最终建立的分类器准确率达到99.3%。以上研究表明,高光谱成像技术在水果产地识别领域具有广阔的应用前景。然而,目前使用高光谱成像技术对山楂进行产地溯源却鲜有报道。
基于上述背景,为满足市场需求,本文旨在探究高光谱成像技术在山楂产地识别中的应用及不同采样方向对于模型分类性能的影响,利用高光谱成像系统(410~2500 nm),分别采集山楂样本果梗面、侧面及底面的光谱数据,结合多种机器学习算法分别建立产地识别模型,最终实现基于高光谱成像技术对山楂进行产地溯源的目的。
1. 材料与方法
1.1 材料与仪器
山楂样品 山楂样品均采自2022年10月至12月,其中山东省2批、山西省3批、辽宁省2批、河北省3批、河南省1批。每个批次随机选择80~100粒品相完好、大小相近的山楂,最终共采集900粒样品。使用干布擦拭样品表面残留泥土,然后于4 ℃环境中冷藏保存,便于后续图像采集。
高光谱成像系统 高光谱成像系统由成像模块、卤钨灯、水平移动平台和Teflon白板组成。其中成像模块包含两个镜头,分别为SN0605 VNIR、N3124 SWIR;卤钨灯 挪威Norsk Elektro Optikk公司;水平移动平台 立陶宛Standa translation stage公司;Teflon白板 中国双利合谱公司。
1.2 实验方法
1.2.1 高光谱数据采集
样本图像采集前,关闭环境灯光,打开卤钨灯并对高光谱成像系统进行预热。为探究摆放方式对山楂产地识别模型的影响,将山楂样本以果梗朝上(G)、侧面朝上(C)和底面朝上(D)三种方式摆放(图1),分别拍摄图像。采集图像时,将15~20粒样本放置在水平移动平台上,在样本排列末端放置Teflon白板,分别采集三个方向的图像数据,光谱仪镜头与样品的距离为25 cm,平台移动速度为1.5 mm/s,SN0605 VNIR镜头的积分时间为3500 μs,帧时间为18000,光谱范围410~990 nm,共108个波段;N3124 SWIR镜头积分时间为4500 μs,帧时间46928,光谱范围950~2500 nm,共288个波段,两个镜头的光谱分辨率均为6 nm。
为减小环境以及仪器对图像数据的影响,在图像采集完成后使用软件(HySpex RAD,Norsk Elektro Optikk,挪威)对原始光谱数据进行RAD校正。随后进行黑白板校正以消除空气等外界因素对图像的影响并得到相对反射率,相对反射率计算公式如下:
R=Rraw−RdRw−Rd (1) 式中:R表示相对反射率;Rraw表示原始反射率;Rw表示白板反射率,即Teflon白板反射率(反射率接近1);Rd表示黑板反射率(反射率接近0)。
校正完成后,使用软件ENVI 5.3在图像中手动选取感兴趣区域(ROI),对于不同拍摄方向的样本图像,分别取其相应部位(即果梗面、侧面和底面)作为ROI,以ROI平均反射率作为样本的光谱值。手动合并两个镜头得到的光谱数据,最终得到包含396个波段反射率的数据集。将样本按照7:3的比例随机划分为训练集和预测集,用于后续分类建模。
1.2.2 主成分分析
主成分分析(Principal Components Analysis,PCA)是一种常用的聚类分析方法[13],其基本原理是通过线性变换的方式,将原始数据转换成一组线性无关的“特征”,而每个“特征”称为“主成分”,是一种通用的统计方法。本研究在得到样本光谱原始数据后,首先利用PCA方法,对样本数据进行初步的可视化分析。
1.2.3 光谱数据预处理方法
受仪器和光散射等因素的影响,样本的原始光谱数据中存在很多噪声[14],会影响后续的建模分析,因此对原始光谱数据进行预处理可以有效提高后续建模的准确率[15]。本研究为消除噪声的影响,分别采用多元散射校正(Multiplicative Scatter Correction,MSC)、一阶导数(Derivative,D1)、SG平滑(Savitzky-Golay,SG)和标准正态变量变换(Standard Normal Variate Transformation,SNV)四种方式对原始光谱数据进行预处理,再使用预处理后的数据进行分类建模。
1.2.4 特征波长提取方法
由于高光谱图像包含波段多,数据维度高,在分类建模时经常会面临Hughes现象和维数灾难问题[16],而特征波长提取是一种常见的降维方式,可以有效降低模型复杂度,从而提升模型运算速度[17]。本研究在建立全波段分类模型后,为降低模型复杂度,分别采用连续投影算法(Successive Projections Algorithm,SPA)和竞争性自适应重加权采样算法(Competitive Adaptive Reweighted Sampling Algorithm,CARS)对原始光谱数据进行特征波长提取,然后基于特征波长数据建立分类模型,为山楂专属小型高光谱设备的开发提供参考。
1.2.5 分类模型的建立
对原始数据进行预处理或特征波长提取后,基于处理得到的数据,分别采用以下方法建立分类模型,并综合对比各项评估指标以筛选出最优模型。偏最小二乘判别分析(Partial Least Squares Discriminant Analysis,PLS-DA)是一种常见的线性判别模型。偏最小二乘法的原理是通过协方差极大化准则,分解自变量数据和因变量数据,建立相互对应的回归关系方程[18]。而PLS-DA则是基于偏最小二乘法建立自变量和分类变量之间的回归模型,提取出与分类相关的特征变量,实现样本的类别预测[19]。本研究将特征变量的个数控制在10~15个,以防止模型过拟合。
支持向量机(Support Vector Machine,SVM)的基本思想是将样本特征数据映射到n维空间中,n的大小取决于核函数和样本特征维数,然后在空间中构造最优的分类超平面[20]。SVM在样本数量较少的情况下也能取得较好结果,具有优秀的泛化能力。核函数是支持向量机映射数据的重要手段[21],本研究使用径向基核函数的支持向量机进行分类建模,并通过网格搜索筛选最优模型参数(惩罚系数和核宽度)。
随机森林(Random Forests,RF)由预先设定数量的分类决策树组成。决策树可以表示样本属性与其特征值之间的映射关系,树中每一个节点表示对象属性的判断条件[22],随机森林通过对所有决策树的预测值进行平均或投票得到最终结果[23]。本研究通过网格搜索找出最佳的决策树数量和深度。
1.2.6 模型评估标准
模型建立完成后,分别通过以下指标筛选出最优模型:准确率(Accuracy)是分类问题最常用的评价指标;精确率(Precision)和召回率(Recall)则反映了模型对于正例的敏感程度,三个指标计算公式如下:
Accuracy=TP+TNTP+TN+FP+FN (2) Precision=TPTP+FP (3) Recall=TPTP+FN (4) 式中:TP表示真阳性样本个数;FP表示假阳性样本个数;TN表示真阴性样本个数;FN表示假阴性样本个数。
混淆矩阵可以直观呈现模型预测结果,通常由m行m列组成(m取决于样本类别总数),每一列代表模型预测值,每一行则代表真实值。本研究通过建立混淆矩阵,综合对比模型指标,筛选出最优分类模型。
1.3 数据处理
高光谱图像的采集和校正分别使用仪器自带软件HySpex GROUND和HySpex RAD实现;样本反射率数据使用软件ENVI5.3进行提取;PCA分析、原始数据预处理、特征波长提取及分类模型的建立均基于Pycharm(Python 3.10)软件实现;光谱曲线绘图基于Origin 2023b软件完成。
2. 结果与分析
2.1 原始光谱曲线分析
在进行分类建模前,首先对各产区样本的光谱特征进行分析并探究部分特征峰的成因,不同产区样本的平均光谱曲线如图2所示。对比发现不同产区山楂样品的平均反射率总体趋势相似;但是同产区山楂平均反射率在不同数据集(C、G和D)上有所不同,这可以归因于样品表面信息的差异。另外,不同产区山楂样品的反射率数值存在一定差异,这些差异主要与样品的表面信息(如果皮、果斑颜色)和品质特性有关,其中山东产区的山楂在400~800 nm波段下的反射率明显高于其他产区,区域特征较为明显,根据杨晓宁等[4]的研究报道:相比于其他产区,山东产区山楂的有机酸含量较高,这与上述现象相吻合。不同产区山楂在600~700 nm处的吸收峰略有不同,但总体趋势相似;对于短波红外波段(short wave infrared,SWIR),各产地反射率曲线趋势相近,但在1000~1200 nm处的吸收峰有所区分。对不同波段下的吸收峰进行分析,700~800 nm处的吸收峰可归因于样本中的叶绿素[24];970 nm附近的吸收峰可能是水中O-H键的伸缩振动造成[25−26];1200 nm附近的吸收峰可能与C-H的第二拉伸泛音有关,可归因于碳水化合物和脂肪[27],总体而言,各产地样本所含化学成分种类相似,但具体含量存在差异,这与张悦等[28]报道的不同产地陈皮光谱曲线规律一致。
对比各数据集的平均反射率曲线(图2),发现G数据集在700~1000 nm处反射率略高于其他数据集,而此波段反射率与样品水分及叶绿素含量密切相关,因此推测山楂样本不同部位所含成分略有不同。山东与辽宁产区样品的平均反射率在三个数据集上都表现出了较大差异(山东产区样品反射率较高,而辽宁产区样品则偏低),说明两组样品差异明显。光谱平均反射率曲线虽然展现出样本的部分差异,但是仅凭这些特征很难对样本进行产地溯源。综上所述,有必要建立分类模型以挖掘样品光谱数据的潜在特征。
2.2 样本数据PCA分析
使用主成分分析(PCA)对三个数据集进行初步的可视化分析,绘制的PCA得分图见图3,保留了前两个主成分。初步分析发现,无监督模型分类效果并不好,三个数据集前两个主成分能解释的方差占比之和在75%左右。山东与辽宁产地的样本区分相对较好,这与原始光谱分析时得出的结论相符。对于大部分样本,使用无监督算法进行分类的效果并不理想,因此后续还需要采用PLS-DA、SVM和RF方法进行有监督分类建模。
2.3 基于全波段的建模分析
2.3.1 预处理及分类建模方法筛选
为筛选出最佳预处理和分类建模方法,分别采用4种预处理方法和3种分类建模方法建立模型,以样本底面数据为代表,各模型分类准确率见表1。对比四种预处理数据分类模型准确率可以发现,引入预处理方法之后,大部分模型的分类精度得到了提高,而D1对于三种分类模型(PLS-DA、SVM和RF)均为最优预处理方式。对比三种不同模型(PLS-DA、SVM和RF)分类准确率,发现无论采用哪种预处理方式,采用RF建立的分类模型虽然有较高的训练集准确率,但是预测集准确率一般;采用PLS-DA和SVM建立的分类模型训练集和预测集准确率良好,其中以SVM模型分类准确率最高。综上所述,对于底面数据,D1为最佳预处理方式,采用SVM建立的分类模型分类准确率高,且具有优秀的稳定性和泛化能力。为进一步验证结论,分别使用C和G数据集进行建模对比,均呈现相同的规律,故判断D1为最优预处理方式,SVM为最佳分类建模算法,后续均采用D1-SVM(经D1预处理后建立的SVM模型)方式进行分类建模。
表 1 不同预处理分类模型准确率Table 1. Accuracy of different preprocessing classification models预处理方式 分类建模算法 训练集准确率(%) 预测集准确率(%) 原始数据 PLS-DA 94.8 93.3 SVM 97.6 93.7 RF 99.8 84.1 MSC PLS-DA 92.1 91.1 SVM 96 93 RF 100 85.9 SG PLS-DA 93.5 92.2 SVM 97.8 94.1 RF 100 83.7 D1 PLS-DA 100 99.6 SVM 100 100 RF 100 97.4 SNV PLS-DA 96.7 96.7 SVM 100 96.3 RF 100 84.4 注:表格以底面朝上数据为例。 2.3.2 不同采样方式分类建模分析
本研究为探究不同采样方向对模型分类结果的影响,分别收集了样本侧面朝上(C)、果梗面朝上(G)和底面朝上(D)的高光谱图像。同时为模拟实际应用时随机拍摄到的高光谱数据,将三个数据集进行等比混合建立一个新数据集(R),使用四个数据集分别进行分类建模,建模方法均采用D1-SVM,综合对比各项指标筛选出最优模型。各模型分类准确率结果见表2。
表 2 不同方向数据分类模型准确率Table 2. Accuracy rate of data classification model in different directions拍摄方向 训练集准确率(%) 预测集准确率(%) 侧面(C) 100 98.1 果梗面(G) 100 99.3 底面(D) 100 100 等比混合(R) 100 96.7 对于使用R数据集建立的分类模型,其准确率较高(100%,96.7%),根据图4并由公式(3)和公式(4)计算得出,不同产区的精确率和召回率均超过90%。对比四个数据集模型的准确率可以发现,三种单面数据集(C、D和G)模型准确率均高于使用R数据集建立的模型,这说明对于山楂样本,在高光谱数据采集时保持样品方向一致可以有效提高分类模型准确率,这一规律与Mansuri等[29]在玉米真菌感染检测中的发现一致。横向对比C、G和D三个模型,其中使用D数据集建立的分类模型准确率最高,训练集和预测集准确率均达到100%,各产区样本全部预测正确。为避免过拟合现象,对D-D1-SVM模型进行十折交叉验证,其平均准确率为98.8%。综上所述,D-D1-SVM模型对于不同产区山楂的分类效果最优。
2.4 基于特征波长的建模分析
2.4.1 特征波长的选择
为筛选出最佳特征提取方法,分别使用2种提取方式提取4个数据集的特征波长,最终得到的波长见表3及图5。对比两种方法提取得到的特征波长数量发现,使用SPA提取出的特征波长数量明显少于CARS,进一步观察特征波长分布(图5),发现使用SPA提取出的特征波长分布均匀,各个波段均有涉及;而CARS提取的特征波长分布较为集中,主要分布于750、2000及2250 nm处的三个特征峰。观察各组特征波长重合的部分,发现750、1700和2200 nm附近的重合波长较多,说明这三处吸收峰可能包含不同产区样本的差异信息。对这些特征峰进行深入分析,700~800 nm处的吸收峰来自于样品内部的叶绿素,也受样品的外部颜色特征影响;1700 nm附近的吸收峰可归因于酰胺基团[30];2200 nm处的吸收峰为C-H和C-O的联合吸收峰[31]。
表 3 不同方法提取特征波长数量Table 3. Number of feature bands extracted by different methods图像方向 特征提取方式 特征波长数量 C SPA 29 CARS 63 G SPA 27 CARS 57 D SPA 24 CARS 51 R SPA 31 CARS 51 2.4.2 特征波长建模分析
使用4个数据集的特征波长分别建立SVM模型,其准确率见表4。观察发现使用SPA筛选特征波长建立的模型分类准确率优于CARS,这一现象在G和D数据集上尤为明显。综合考虑波长数量和模型准确率,SPA筛选的波长数量更少,模型复杂度较低,且准确率更高。与本研究得到的结果不同,李涛等[32]在基于特征波段建立红景天分类模型时,发现CARS为最佳特征波段提取方法,这说明对于不同的检测对象,应当选用不同的特征提取方法,而对于山楂样本,SPA相比于CARS特征波长提取效果更好。
表 4 特征波长建模准确率Table 4. Accuracy of feature band model图像方向 特征提取方式 训练集准确率(%) 预测集准确率(%) C SPA 98.6 90.3 CARS 92.2 83.3 G SPA 99.5 91.5 CARS 92.7 85.9 D SPA 95.2 93.0 CARS 93.8 89.6 R SPA 92.9 87.8 CARS 93.5 85.6 采用SPA提取特征波长的分类模型预测集混淆矩阵见图6,对比四个数据集的准确率(表4)看出,R-SPA模型预测集准确率为87.8%,根据其混淆矩阵(图6d)并由公式(3)和公式(4)计算得出,模型对于河北产区的精确率和召回率仅为79.2%和82.4%,分类能力一般。而C-SPA、G-SPA和D-SPA三个模型准确率均超过90%(分别为90.3%、91.5%和93%),这一现象再次证明在高光谱数据采集时,保持样品方向一致可以有效提高分类模型准确率。综合对比所有模型,D-SPA模型拥有最高的分类准确率,训练集和预测集准确率分别为95.2%和93%,根据其混淆矩阵(图6c)并由公式(3)和公式(4)计算得出,模型对于各产区的精确率和召回率均超过90%(其中山东产区精确率和召回率最低,分别为91.6%和90%);且这一模型涉及的特征波长数量最少,在保证分类准确率的情况下拥有较低的模型复杂度。
综上所述,采集高光谱数据时保持样品摆放方式一致有助于提高模型分类准确率。采用SPA提取特征波长建立的产地分类模型复杂度较低且准确率良好。可以在波长数量有限的情况下对山楂产地进行判别,为后续山楂专属小型化高光谱设备的开发提供了方法参考。
综合考虑全波段模型和特征波长模型的分类结果,发现采集样本光谱数据时,样本的摆放方式会影响后续分类建模准确率。无论全波段还是特征波长模型,使用D数据集建模分类效果都明显优于R数据集(提高了约5%),相对于C和G数据集也有所提高。观察山楂样品的外部特征,发现样品底面存在萼片部位,结合宁素云等[33]的研究报道:山楂不同部位的化学成分含量存在差异,推测不同产地山楂其萼片部位各成分含量的差异相比于其他部位更大,进而导致分类特征更加明显。
3. 结论
本研究基于高光谱成像技术建立了山楂产地识别模型。为探究样本拍摄方向对分类结果的影响,采集了山楂样本三个不同方向(C、G和D)的光谱数据,分别使用偏最小二乘判别分析(PLS-DA)、支持向量机(SVM)和随机森林(RF)三种方法建立模型,通过对比模型分类准确率得到最优建模方法,最终成功区分了5个不同省级产区的山楂,为山楂无损检测设备的开发提供了参考。经过对比筛选发现,一阶导数(D1)为最优预处理方式,SVM为最优建模算法;使用连续投影算法(SPA)提取特征波长数量少且分类模型准确率高。全波段最优建模方法为D-D1-SVM,训练集和预测集准确率均达到100%;特征波长最优建模方法为D-SPA-SVM,训练集和预测集准确率分别为95.2%和93%。本研究证明基于高光谱成像技术对山楂产地进行溯源是可行的,为维护山楂市场秩序提供一种新的识别方式;同时验证高光谱图像采集方向会对检测结果产生影响,为后续开发山楂专属高光谱检测设备提供理论依据和参考。
-
表 1 不同预处理分类模型准确率
Table 1 Accuracy of different preprocessing classification models
预处理方式 分类建模算法 训练集准确率(%) 预测集准确率(%) 原始数据 PLS-DA 94.8 93.3 SVM 97.6 93.7 RF 99.8 84.1 MSC PLS-DA 92.1 91.1 SVM 96 93 RF 100 85.9 SG PLS-DA 93.5 92.2 SVM 97.8 94.1 RF 100 83.7 D1 PLS-DA 100 99.6 SVM 100 100 RF 100 97.4 SNV PLS-DA 96.7 96.7 SVM 100 96.3 RF 100 84.4 注:表格以底面朝上数据为例。 表 2 不同方向数据分类模型准确率
Table 2 Accuracy rate of data classification model in different directions
拍摄方向 训练集准确率(%) 预测集准确率(%) 侧面(C) 100 98.1 果梗面(G) 100 99.3 底面(D) 100 100 等比混合(R) 100 96.7 表 3 不同方法提取特征波长数量
Table 3 Number of feature bands extracted by different methods
图像方向 特征提取方式 特征波长数量 C SPA 29 CARS 63 G SPA 27 CARS 57 D SPA 24 CARS 51 R SPA 31 CARS 51 表 4 特征波长建模准确率
Table 4 Accuracy of feature band model
图像方向 特征提取方式 训练集准确率(%) 预测集准确率(%) C SPA 98.6 90.3 CARS 92.2 83.3 G SPA 99.5 91.5 CARS 92.7 85.9 D SPA 95.2 93.0 CARS 93.8 89.6 R SPA 92.9 87.8 CARS 93.5 85.6 -
[1] 国家药典委员会. 中华人民共和国药典(2020年版)一部[M]. 北京:中国医药科技出版社, 2020:1902. [Chinese Pharmacopoeia Commission. Pharmacopoeia of the people's republic of China 2020[M]. Beijing:China Medical Science Press, 2020:1902.] Chinese Pharmacopoeia Commission. Pharmacopoeia of the people's republic of China 2020[M]. Beijing: China Medical Science Press, 2020: 1902.
[2] WU J Q, PENG W, QIN R X, et al. Crataegus pinnatifida:Chemical constituents, pharmacology, and potential applications[J]. Molecules,2014,19(2):1685−1712. doi: 10.3390/molecules19021685
[3] 楼陆军, 罗洁霞, 高云. 山楂的化学成分和药理作用研究概述[J]. 中国药业,2014,23(3):92−94. [LOU L J, LUO J X, GAO Y. Overview of chemical compositions and pharmacological action of Crataegus pinnatifida Bunge[J]. China Pharmaceuticals,2014,23(3):92−94.] LOU L J, LUO J X, GAO Y. Overview of chemical compositions and pharmacological action of Crataegus pinnatifida Bunge[J]. China Pharmaceuticals, 2014, 23(3): 92−94.
[4] 杨晓宁, 孙欣光, 周丽娟, 等. 不同产地山楂及其炮制品质量研究[J]. 中国中医药信息杂志,2022,29(7):105−110. [YANG X N, SUN X G, ZHOU L J, et al. Quality study of Crataegus fructus from different producing areas and its processed products[J]. Chinese Journal of Information on Traditional Chinese Medicine,2022,29(7):105−110.] YANG X N, SUN X G, ZHOU L J, et al. Quality study of Crataegus fructus from different producing areas and its processed products[J]. Chinese Journal of Information on Traditional Chinese Medicine, 2022, 29(7): 105−110.
[5] 崔洁, 刘心悦, 常冠华, 等. 基于HPLC和AHP对不同产地山楂的比较研究[J]. 时珍国医国药,2021,32(9):2254−2257. [CUI J, LIU X Y, CHANG G H, et al. Comparative study on contents of four chemical components of dajinxing Crataegus pinnatifida Bge. var. major N. E. Br. fruits from different habitats[J]. Lishizhen Medicine and Materia Medica Research,2021,32(9):2254−2257.] CUI J, LIU X Y, CHANG G H, et al. Comparative study on contents of four chemical components of dajinxing Crataegus pinnatifida Bge. var. major N. E. Br. fruits from different habitats[J]. Lishizhen Medicine and Materia Medica Research, 2021, 32(9): 2254−2257.
[6] 王夏茵, 岳宝森, 张炜华, 等. 不同产地天麻HPLC指纹图谱、含量测定及化学模式识别研究[J]. 中南药学,2023,21(5):1358−1362. [WANG X Y, YUE B S, ZHANG W H, et al. HPLC fingerprint, content determination and pattern recognition of Gastrodia elata Bl. from different regions[J]. Central South Pharmacy,2023,21(5):1358−1362.] WANG X Y, YUE B S, ZHANG W H, et al. HPLC fingerprint, content determination and pattern recognition of Gastrodia elata Bl. from different regions[J]. Central South Pharmacy, 2023, 21(5): 1358−1362.
[7] 范胜莲, 何清春, 吴诗慧. 气相色谱-质谱联用技术对不同产地冬虫夏草的鉴别研究[J]. 四川中医,2021,39(5):48−51. [FAN S L, HE Q C, WU S H. Study on the identification of chinese caterpillar fungus in different producing areas by gas chromatography-mass spectrometry[J]. Journal of Sichuan of Traditional Chinese Medicine,2021,39(5):48−51.] FAN S L, HE Q C, WU S H. Study on the identification of chinese caterpillar fungus in different producing areas by gas chromatography-mass spectrometry[J]. Journal of Sichuan of Traditional Chinese Medicine, 2021, 39(5): 48−51.
[8] 贺光云, 侯雪, 闫志农, 等. 基于超高效液相色谱-四极杆串联飞行时间质谱的绿茶产地溯源研究[J]. 农产品质量与安全,2021,5(5):63−68. [HE G Y, HOU X, YAN Z N, et al. The geographical origin traceability of green tea by ultra high performance liquid chromatography-quadrupole time-offlight mass spectrometry[J]. Quality and Safety of Agro-Products,2021,5(5):63−68.] HE G Y, HOU X, YAN Z N, et al. The geographical origin traceability of green tea by ultra high performance liquid chromatography-quadrupole time-offlight mass spectrometry[J]. Quality and Safety of Agro-Products, 2021, 5(5): 63−68.
[9] 张海芳, 纳日, 韩育梅, 等. 光谱无损检测技术在农产品产地溯源中的研究进展[J]. 食品工业科技,2023,44(8):17−25. [ZHANG H F, NA R, HAN Y M, et al. Research progress of spectral nondestructive testing technology in traceability of agricultural products[J]. Science and Technology of Food Industry,2023,44(8):17−25.] ZHANG H F, NA R, HAN Y M, et al. Research progress of spectral nondestructive testing technology in traceability of agricultural products[J]. Science and Technology of Food Industry, 2023, 44(8): 17−25.
[10] ZAREEF M, ARSLAN M, HASSAN M M, et al. Recent advances in assessing qualitative and quantitative aspects of cereals using nondestructive techniques:A review[J]. Trends in Food Science & Technology,2021,116:815−828.
[11] 张立欣, 张楠楠, 张晓. 基于机器学习算法对苹果产地的判别分析[J]. 激光与光电子学进展,2022,59(4):451−457. [ZHANG L X, ZHANG N N, ZHANG X. Discriminant analysis of apple origin based on machine learning algorithm[J]. Laser & Optoelectronics Progress,2022,59(4):451−457.] ZHANG L X, ZHANG N N, ZHANG X. Discriminant analysis of apple origin based on machine learning algorithm[J]. Laser & Optoelectronics Progress, 2022, 59(4): 451−457.
[12] SUN Y, LI Y H, PAN L Q, et al. Authentication of the geographic origin of Yangshan region peaches based on hyperspectral imaging[J]. Postharvest Biology and Technology,2021,171:111320. doi: 10.1016/j.postharvbio.2020.111320
[13] SMALLMAN L, ARTEMIOU A, MORGAN J. Sparse generalised principal component analysis[J]. Pattern Recognition,2018,83:443−455. doi: 10.1016/j.patcog.2018.06.014
[14] LI J B, HUANG W Q, CHEN L P, et al. Variable selection in visible and near-infrared spectral analysis for noninvasive determination of soluble solids content of ‘Ya’ pear[J]. Food Analytical Methods,2014,7(9):1891−1902. doi: 10.1007/s12161-014-9832-8
[15] 第五鹏瑶, 卞希慧, 王姿方, 等. 光谱预处理方法选择研究[J]. 光谱学与光谱分析,2019,39(9):2800−2806. [DIWU P Y, BIAN X H, WANG Z F, et al. Study on the selection of spectral preprocessing methods[J]. Spectroscopy and Spectral Analysis,2019,39(9):2800−2806.] DIWU P Y, BIAN X H, WANG Z F, et al. Study on the selection of spectral preprocessing methods[J]. Spectroscopy and Spectral Analysis, 2019, 39(9): 2800−2806.
[16] 吴静珠, 李晓琪, 林珑, 等. 基于AlexNet卷积神经网络的大米产地高光谱快速判别[J]. 中国食品学报,2022,22(1):282−288. [WU J Z, LI X Q, LIN L, et al. Fast hyperspectral discrimination of rice origin based on AlexNet convolutional neural network[J]. Journal of Chinese Institute of Food Science and Technology,2022,22(1):282−288.] WU J Z, LI X Q, LIN L, et al. Fast hyperspectral discrimination of rice origin based on AlexNet convolutional neural network[J]. Journal of Chinese Institute of Food Science and Technology, 2022, 22(1): 282−288.
[17] LI X L, WEI Y Z, XU J, et al. SSC and pH for sweet assessment and maturity classification of harvested cherry fruit based on NIR hyperspectral imaging technology[J]. Postharvest Biology and Technology,2018,143:112−118. doi: 10.1016/j.postharvbio.2018.05.003
[18] 陈书媛, 张友超, 杨杰, 等. 基于高光谱成像技术的白茶储藏年份判别[J]. 食品工业科技,2021,42(18):276−283. [CHEN S Y, ZHANG Y C, YANG J, et al. Discrimination of storage time of white tea using hyperspectral imaging[J]. Science and Technology of Food Industry,2021,42(18):276−283.] CHEN S Y, ZHANG Y C, YANG J, et al. Discrimination of storage time of white tea using hyperspectral imaging[J]. Science and Technology of Food Industry, 2021, 42(18): 276−283.
[19] 朱潘雨, 方雯昕, 黄敏, 等. 基于高光谱图像的小麦种子纯度/含水量检测系统[J]. 计算机测量与控制,2023,31(4):76−82. [ZHU P Y, FANG W X, HUANG M, et al. Wheat seed purity or moisture content detection system based on hyperspectral images[J]. Computer Measurement & Control,2023,31(4):76−82.] ZHU P Y, FANG W X, HUANG M, et al. Wheat seed purity or moisture content detection system based on hyperspectral images[J]. Computer Measurement & Control, 2023, 31(4): 76−82.
[20] ZHOU J, HUANG S, WANG M Z, et al. Performance evaluation of hybrid GA–SVM and GWO–SVM models to predict earthquake-induced liquefaction potential of soil:A multi-dataset investigation[J]. Engineering with Computers,2021,38:4197−4215.
[21] MATLAB中文论坛. MATLAB神经网络30个案例分析[M]. 北京:北京航空航天大学出版社, 2010:289. [MATLAB Chinese Forum. Matlab neural network analysis of 30 cases[M]. Beijing:Beihang University Press, 2010:289.] MATLAB Chinese Forum. Matlab neural network analysis of 30 cases[M]. Beijing: Beihang University Press, 2010: 289.
[22] 周元哲. 机器学习入门[M]. 北京:清华大学出版社, 2022:268. [ZHOU Y Z. Introduction to machine learning[M]. Beijing:Tsinghua University Press, 2022:268.] ZHOU Y Z. Introduction to machine learning[M]. Beijing: Tsinghua University Press, 2022: 268.
[23] PAUL A, MUKHERJEE D P, DAS P, et al. Improved random forest for classification[J]. IEEE Transactions on Image Processing,2018,27(8):4012−4024. doi: 10.1109/TIP.2018.2834830
[24] ZHANG J, HUANG W J, ZHOU Q F. Reflectance variation within the in-chlorophyll centre waveband for robust retrieval of leaf chlorophyll content[J]. PLoS One,2014,9(11):e110812. doi: 10.1371/journal.pone.0110812
[25] YU K Q, ZHAO Y R, LIU Z Y, et al. Application of visible and near-infrared hyperspectral imaging for detection of defective features in loquat[J]. Food and Bioprocess Technology,2014,7(11):3077−3087. doi: 10.1007/s11947-014-1357-z
[26] JIANG S Q, HE H J, MA H J, et al. Quick assessment of chicken spoilage based on hyperspectral NIR spectra combined with partial least squares regression[J]. International Journal of Agricultural and Biological Engineering,2021,14:243−250. doi: 10.25165/j.ijabe.20211401.5726
[27] YANG L, GAO H Q, MENG L W, et al. Nondestructive measurement of pectin polysaccharides using hyperspectral imaging in mulberry fruit[J]. Food Chemistry,2021,334:127614. doi: 10.1016/j.foodchem.2020.127614
[28] 张悦, 王游游, 张婷, 等. 高光谱结合图分割算法快速鉴别不同尺度产地陈皮[J]. 化学试剂,2023,45(1):136−143. [ZHANG Y, WANG Y Y, ZHANG T, et al. Identification of Citri reticulatae pericarpium form different scales geographical origin by hyperspectral imaging combined with image segmentation algorithm[J]. Chemical Reagents,2023,45(1):136−143.] ZHANG Y, WANG Y Y, ZHANG T, et al. Identification of Citri reticulatae pericarpium form different scales geographical origin by hyperspectral imaging combined with image segmentation algorithm[J]. Chemical Reagents, 2023, 45(1): 136−143.
[29] MANSURI S M, CHAKRABORTY S K, MAHANTI N K, et al. Effect of germ orientation during Vis-NIR hyperspectral imaging for the detection of fungal contamination in maize kernel using PLS-DA, ANN and 1D-CNN modelling[J]. Food Control,2022,139:109077. doi: 10.1016/j.foodcont.2022.109077
[30] LI X, FENG F, GAO R Z, et al. Application of near infrared reflectance (NIR) spectroscopy to identify potential PSE meat[J]. Journal of the Science of Food and Agriculture,2016,96(9):3148−3156. doi: 10.1002/jsfa.7493
[31] MA C Y, REN Z S, ZHANG Z H, et al. Development of simplified models for nondestructive testing of rice (with husk) protein content using hyperspectral imaging technology[J]. Vibrational Spectroscopy,2021,114:103230. doi: 10.1016/j.vibspec.2021.103230
[32] 李涛, 钟玉琴, 曲明亮. 高光谱成像技术鉴别红景天的品种[J]. 华西药学杂志,2021,36(5):526−530. [LI T, ZHONG Y Q, QU M L. Identification of Rhodiola varieties by hyperspectral imaging technology[J]. West China Journal of Pharmaceutical Sciences,2021,36(5):526−530.] LI T, ZHONG Y Q, QU M L. Identification of Rhodiola varieties by hyperspectral imaging technology[J]. West China Journal of Pharmaceutical Sciences, 2021, 36(5): 526−530.
[33] 宁素云, 孟美黛, 王鹏, 等. 基于UHPLC-Q ExactiveOrbitrap-MS法的山楂不同部位化学成分分析[J]. 广州化工,2021,49(13):97−101. [NING S Y, MENG M D, WANG P, et al. Analysis of chemical constituents in different parts of hawthorn by UHPLC-Q ExactiveOrbitrap-MS[J]. Guangzhou Chemical Industry,2021,49(13):97−101.] NING S Y, MENG M D, WANG P, et al. Analysis of chemical constituents in different parts of hawthorn by UHPLC-Q ExactiveOrbitrap-MS[J]. Guangzhou Chemical Industry, 2021, 49(13): 97−101.
-
期刊类型引用(4)
1. 韩路生,王昱丹,李宇航,李根悦,宋欣宏,杨凯丽,谭鑫,王恩鹏. 高光谱结合机器学习鉴别林下参参龄. 应用化学. 2025(01): 69-77 . 百度学术
2. 李晓龙,殷勇,于慧春,袁云霞. 留兰香高光谱特征波长稳健提取及产地鉴别模型构建. 食品科学. 2024(22): 262-268 . 百度学术
3. 郭雪,白瑞斌,王慧,李卫文,董玲,孙嘉慧,张小波,杨健. 基于高光谱技术的不同地理尺度贡菊产地鉴别研究. 中国中药杂志. 2024(22): 6073-6081 . 百度学术
4. 王昳昀,马芸芸,杨冕清,赵庆典,陈国良,刘大洋. 基于高光谱成像技术和自适应增强网络的水蜜桃产地溯源. 食品安全质量检测学报. 2024(23): 77-87 . 百度学术
其他类型引用(1)