專業(yè)的光譜解決方案提供商
質(zhì)量保障服務(wù)完善創(chuàng)新高效背景
煙葉成熟度分為田間成熟度和烘烤成熟度。田間成熟度是煙葉在田間的生長情況。烘烤成熟度是烤制后煙葉成熟的情況。合適的田間成熟度是獲得高品質(zhì)煙葉的基礎(chǔ)。
煙葉田間成熟度影響著烤后質(zhì)量的好壞,包括色澤、香氣、油分等。目前,鑒別煙葉田間成熟度的方法是通過煙農(nóng)肉眼鑒別,鑒別質(zhì)量參差不齊、效率低且可靠性差。因此,建立一種能直接在田間鑒別煙葉成熟度的方法很有必要。
田間煙葉圖
研究方法
本實驗采用近紅外光譜技術(shù)和圖像識別技術(shù)結(jié)合機器學(xué)習(xí)算法,建立相應(yīng)的煙葉成熟度鑒別模型,最后通過分析對比各個模型的分類效果,尋找最合適的煙葉成熟度檢測方法。
實驗主要于2019年在大理兩不同烘烤工場進行,選擇烤煙品種K326,上、中和下部位各采集鮮煙葉樣本2431、2401和2400個,共采集7232個樣本,每個樣本都進行了近紅外光譜的采集。
圖1. 光譜采集位置分布示意圖
實驗用海洋光學(xué)NIRQuest近紅外光譜儀采集樣本光譜,配件包含標準探頭和漫反射白板,積分時間為5 ms,光譜范圍為900-2500 nm,開機預(yù)熱30 min,優(yōu)化光譜儀掃描條件后進行近紅外光譜掃描,掃描時每個樣本在視線范圍內(nèi)避開主脈在左右兩側(cè)各取3個點掃描(見圖1),所有點的平均值作為該煙葉的代表光譜。
數(shù)據(jù)采集及處理
近紅外光譜含大量噪聲,預(yù)處理有助于提取和分析有用信息。不同預(yù)處理方法導(dǎo)致不同的預(yù)測結(jié)果。因此,為探索不同預(yù)處理方法對模型構(gòu)建的影響,試算了一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、標準正態(tài)變換(SNV)四種經(jīng)典預(yù)處理方法、多元散射校正(MSC)結(jié)合Savitz-Golay平滑和歸一化進行對比分析。
圖2. 煙葉近紅外光譜圖(a)原始光譜,(b)預(yù)處理后光譜
從上部煙葉樣本訓(xùn)練集中隨機抽取450個樣本,按2:1比例分組,選擇合適的預(yù)處理方法。實驗隨機重復(fù)五次,取平均值作為結(jié)果。發(fā)現(xiàn)與原始光譜比,預(yù)處理后的光譜鑒別準確度有所提高。
經(jīng)對比發(fā)現(xiàn)一階導(dǎo)數(shù)處理的光譜數(shù)據(jù)可獲得更好的分類結(jié)果。因此,在隨后的分類實驗中,選擇其作為上、中、下煙葉光譜的預(yù)處理方法。預(yù)處理前后的光譜如圖2所示。
值得注意的是,不同的預(yù)處理方法對CNN模型的分類結(jié)果影響較小。這表明,與其他方法相比,用于開發(fā)NIR模型的CNN方法對預(yù)處理的依賴性較小。
表1. 不同預(yù)處理方法的判別準確率(%)
模型對比及結(jié)論
作者隨后采用主成分分析法(PCA)對煙葉各成熟度水平的光譜數(shù)據(jù)進行聚類分析,發(fā)現(xiàn)樣本數(shù)據(jù)顯著重疊,無法分離。因此,有必要開發(fā)一種更強大的多分類方法來區(qū)分不同成熟度的煙葉??紤]到CNN強大的特征提取和學(xué)習(xí)能力,它可能是一個不錯的選擇。
圖3. 上部煙葉五個成熟度水平NIR光譜方差的PCA得分圖
為對比CNN模型的性能,建立了KNN、BPNN、SVM和ELM模型進行比較分析。證實了CNN模型在區(qū)分煙葉成熟度方面的出色分類能力。表2. CNN和其他四種方法的預(yù)測結(jié)果(%)
結(jié)論
本實驗研究了近紅外光譜結(jié)合深度學(xué)習(xí)方法對新鮮煙葉成熟度水平進行分類的潛力。近紅外光譜技術(shù)是一種非常有用的工具,可準確、無損地測定煙葉的內(nèi)部和外部品質(zhì)。實驗表明,CNN方法具有很強的特征提取和學(xué)習(xí)能力,對分類精度有著有利的影響。為進一步準確識別煙葉成熟度、研制煙葉采收機奠定基礎(chǔ),從而提高煙葉的生產(chǎn)效益。
特別鳴謝
特別感謝云南煙草農(nóng)業(yè)研究院陳頤老師及貴州大學(xué)煙草學(xué)院老師及其實驗室其他成員的工作及對海洋光學(xué)的支持和信任。