前言:尋找寫作靈感?中文期刊網用心挑選的近紅外分類在醬油糟水分的應用,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
摘要:文章旨在利用近紅外分類建模法定量分析醬油糟中水分、粗蛋白和脂肪含量。首先采集來自國內共200個醬油糟樣品,并進行濕化學檢測;其次通過SPSS軟件對數據集進行聚類分析,并結合鏡檢與光譜分析,將醬油糟分為大豆型和豆粕型兩類;最后,根據分類結果分別建模、擴充數據,并比較分類建模和混合建模的數據差異。結果顯示:大豆型醬油糟和豆粕型醬油糟模型各預測指標的交叉檢驗標準誤差(SECV)和扣除系統偏差的驗證標準偏差(SEPC)均低于混合醬油糟模型,驗證集決定系數(RSQ)值均高于混合醬油糟模型。分類建模后的兩種醬油糟模型SECV均低于0.5,SEPC均低于0.5,RSQ值均高于0.9。說明醬油糟分類建模的預測效果優于混合建模,且準確度高。此研究為工藝復雜型原料及配方飼料的精準建模提供了借鑒。
關鍵詞:近紅外;醬油糟;分類建模;水分;粗蛋白;粗脂肪
近紅外預測結果的重現性明顯優于傳統濕化學方法,已經很大程度上替代了傳統濕化學方法。隨著飼料行業的發展,玉米、豆粕、魚粉等常規飼料原料資源日益緊張,迫使飼料企業不斷地去開發新的替代原料,飼料原料的種類和復雜性也不斷增加。這些復雜的飼料原料如果按照傳統的建模技術,往往應用效果不佳,對于這些復雜體系樣本的近紅外模型優化研究也鮮有報道。醬油糟是制作醬油后的殘渣經干燥制成。釀造醬油常用的原料主要有大豆、豆粕、麩皮、小麥等[8]。醬油糟中仍含有20%~30%的粗蛋白、7%~18%的粗脂肪[9]。由于醬油糟蛋白質營養價值相對較高,所以具有很大的再利用價值[10]。當前,受國際大環境影響,飼料原料資源日益緊張,醬油糟為生產醬油后的廢棄品,價格低廉,使用醬油糟替代部分蛋白質原料可為飼料企業縮減成本。由于原料種類、生產工藝的不同,醬油糟的成分組成差異較大。過去,一般將所有醬油糟收集到同一個數據集直接建模,預測效果不理想??赡苡捎谏a工藝的復雜性,導致醬油糟組分差異大,直接建模會影響其預測效果。而目前對近紅外光譜法的研究多集中于計量方法,忽略了對數據集的前處理。本試驗先將醬油糟數據集進行統計學分析,依據統計學規律調研實際規律,再針對不同類別的醬油糟進行單獨建模,并比對混合建模和分類建模兩種方式的預測效果,以期為工藝復雜型原料和配方飼料的精準建模提供新思路。
1材料與方法
1.1試驗設計
1.2樣品的采集與制備
樣品為國內采集的200個醬油糟樣品,主要集中在華中和華南區域。將樣品粉碎至90%以上過40目樣品篩,供采集近紅外光譜用,并按水分、粗蛋白、粗脂肪含量測定的國家標準要求處理后進行實驗室化學分析。
1.3樣品實驗室化學分析
醬油糟樣品水分、粗蛋白、粗脂肪含量測定方法參考GB/T6435—2014、GB/T6432—2018和GB/T6433—2006,每個樣品測兩次平行,取“平均值”作為定量分析模型的參考值。
1.4光譜采集方法
采用DS-2500F光柵型近紅外光譜儀(nearinfra?redspectrometer,NIRS,丹麥福斯)在實驗室靜態條件下采集樣品光譜,光譜采集參數設置為:光譜范圍850~2500nm,光譜分辨率0.5nm,每個樣品掃描7個子樣本,每個子樣本掃描4次,取平均光譜作為樣品的光譜。
1.5模型的建立與評價
光譜預處理方法:全波段(850~2500nm)進行標準正?;腿ド⑸湟浑A導數(SNVandDetrend)處理,求導間隔點為4,一次平滑處理間隔點為4。近紅外定量分析模型的建立使用改進偏最小二乘(modifiedPLS)算法,使用WINISI4.0定標軟件(美國Infrasoft公司)進行運算,并通過內部驗證剔除異常值。模型評價參數主要有預測標準偏差和決定系數。對于內部交叉驗證,通過交叉檢驗決定系數(1-VR)和交叉檢驗標準誤差(SECV)來評價定標模型的優越性;外部檢驗是驗證集樣品對于定標模型預測性能的評價,通過驗證集決定系數(RSQ)和扣除系統偏差的驗證標準偏差(SEPC)來判定定標模型的預測性能。在驗證集濃度范圍相同的前提下,1-VR和RSQ越接近1,回歸或預測效果越好;SECV和SEPC越小,預測結果越準確[11-13]。1.6數據集前處理使用IBMSPSSStatistics23軟件進行聚類分析。
2結果與分析
2.1SPSS聚類分析尋找統計學規律
使用IBMSPSSStatistics23數據處理軟件,對1.3中測得的所有醬油糟化學檢測數據進行分析,采用平方歐式距離、組間平均距離連接法進行系統聚類(Hi?erarchicalCluster),結果如圖2所示,當組間距為5~25時,200個樣品共分為兩大類,對兩類醬油糟的數據進行分析(見表1),發現第一類醬油糟粗蛋白含量為10.35%~21.53%,粗脂肪含量為20.14%~31.68%,第二類醬油糟粗蛋白含量為21.17%~40.82%,粗脂肪含量為6.82%~21.5%。兩類醬油糟的粗蛋白和粗脂肪含量差異較大,可總結為第一類為高脂肪低蛋白型,第二類為低脂肪高蛋白型。
2.2調研分析尋找實際規律
2.2.1鏡檢分析(見圖3)借助Stemi-305型體視顯微鏡(德國蔡司)。將兩類樣品進行成分組成分析,圖3為樣品放大10倍后圖像。圖3a為第一類醬油糟,所屬華南地區,主要以大量豆仁為主,少量豆皮、麥皮;圖3b為第二類醬油糟,所屬華中地區,主要以大量麥皮、豆皮為主,少量豆仁。目前國內醬油生產工藝主要分為高鹽稀態發酵和低鹽固態發酵,其中高鹽稀態發酵主要以大豆、面粉或小麥為原料,大多分布于華南地區,因主要原料為全粒大豆,糟渣脂肪含量較高,蛋白質含量較低;低鹽固態發酵主要以豆粕、麩皮為原料,分布于華中華北地區,因主要原料為脫脂大豆,糟渣脂肪含量較低,蛋白質含量較高[14]。由此可認為醬油生產工藝的差異導致了醬油糟最終成分組成不同,結合此規律,將聚類分析中的第一類醬油糟稱為大豆型醬油糟,將第二類稱之為豆粕型醬油糟。2.2.2近紅外光譜分析(見圖4和圖5)根據2.1和2.2.1中的分類結論。將200個醬油糟近紅外光譜圖經數學處理后如圖4、圖5所示,可以看出,在波長范圍1680~1710nm和2330~2348、2465~2490nm處,兩類不同的醬油糟光譜差異明顯,說明醬油糟成分組成差異大,從而影響樣品的吸收系數、散射系數,體現在其近紅外光譜上的差異[15-16]。在波長范圍1680~1690nm處存在芳香族和甲基中C-H伸縮振動一級倍頻;2329~2336nm處存在C-H、-CH2伸縮和彎曲振動合頻,這類甲基和次甲基來源于淀粉和纖維素;2336~2340nm存在纖維素的C-H伸縮和彎曲振動;2344~2348nm存在油脂C=O伸縮振動;2465~2490nm存在C-N-C伸縮振動一級倍頻、C-H與-CH2伸縮振動合頻,這類碳氮基和碳氫基來源于蛋白質。綜上,造成兩類醬油糟光譜差異的因素可能來源于蛋白質、脂肪、纖維素、淀粉的含量差異,這些差異是由生產工藝不同造成的。近紅外光譜分析誤差大致有一半來自于建模數據,校正集中樣品的變異范圍越寬,則建模過程中所遇到的非線性或異質性問題越嚴重,干擾因素也越多,對某些樣品而言其預測能力會下降[17]。有學者指出,若不同類型的樣品成分組成差異大,很難通過線性的校正算法(如偏最小二乘法)得到光譜與性質間精確的數學關系,須對同類樣本單獨建立校正模型[13],嘗試將兩類醬油糟單獨建模。
2.3模型建立與驗證
將數據分為大豆型和豆粕型單獨建模,并與混合醬油糟模型進行比較。對于內部驗證,由軟件依次選取樣本進行交叉檢驗;對于外部驗證,分別從大豆型和豆粕型數據各隨機選取20%作為驗證集,各自剩余80%及兩種模型剩余80%的合集分別作為大豆型、豆粕型和混合醬油糟模型的校正集。采用改進偏最小二乘法(modifiedPLS)建立模型,模型參數如表2所示。從內部交叉驗證來看,大豆型和豆粕型模型水分、粗蛋白和粗脂肪的SECV分別與混合醬油糟模型對比,共6組數據中,有5組數據的SECV值明顯降低。而1-VR值卻普遍低于混合醬油糟模型,分析原因,由于在內部驗證時,混合醬油糟模型驗證集的濃度范圍涵蓋大豆型和豆粕型的濃度范圍,與大豆型和豆粕型的驗證集濃度范圍不一致,因此比較單獨模型和混合模型的1-VR沒有意義。從外部驗證來看,大豆型和豆粕型模型水分、粗蛋白和粗脂肪的SEPC分別與混合醬油糟模型對比,共6組數據中,有3組數據的SEPC值有所降低;對應RSQ的6組對比數據中,有5組數據的RSQ值較混合醬油糟模型明顯提升。綜合分析,與混合醬油糟模型相比,單獨建模的大豆型醬油糟模型和豆粕型醬油糟模型有更好的預測效果。對于部分參數,例如豆粕型的粗蛋白的SEVC,水分和粗蛋白的SEPC等較混合醬油糟模型有所增加的情況。從圖6和圖7可以看出,可能與單獨建模的醬油糟模型校正集濃度分布均勻度欠佳有關。
2.4擴充模型數據庫
單獨建模后的大豆型和豆粕型醬油糟校正集僅80份左右,還不足以覆蓋更廣泛的營養特性。為了提高模型的穩定性和適用性[18],收集了近2年內市面上的醬油糟樣品檢測數據,擴充模型數據庫,擴充后的模型各指標評價值如表3。擴充后,模型各指標濃度分布更加均勻,RSQ均在0.9以上,說明模型的穩定性得到了提升。將擴充后的大豆型、豆粕型模型分別與混合醬油糟模型進行比較,從內部驗證數據來看:大豆型和豆粕型模型水分、粗蛋白和粗脂肪的SECV分別與混合醬油糟模型對比,共6組數據的SECV值均低于混合醬油糟模型;從外部驗證來看,大豆型和豆粕型模型水分、粗蛋白和粗脂肪的SEPC分別與混合醬油糟模型對比,共6組數據的SEPC值均低于混合醬油糟模型,對應6組數據的RSQ值均高于混合醬油糟模型。由此可看出,擴充醬油糟模型數據后,分類建模的優勢體現得更加明顯。王濤等[19]也發現將米糠分為粳米米糠、秈米米糠單獨建立模型的效果優于混合模型。分類建模后的兩種醬油糟模型SECV均低于0.5,SEPC均低于0.5,RSQ均高于0.9,說明模型預測效果較好,可用于實際檢測。
3結論
本研究首先借助SPSS數據分析軟件,將醬油糟數據集進行聚類分析;其次結合鏡檢分析確認分類依據;最后根據光譜差異尋找對應關系,將醬油糟分為大豆型和豆粕型兩類。將兩類醬油糟單獨建模,并擴充數據,使用SECV、SEPC和RSQ評估模型的預測準確性。結果表明,從總體來看,大豆型和豆粕型醬油糟模型各指標的SEPC值和SECV值優于混合醬油糟模型,預測效果要優于混合醬油糟模型;特別是模型擴充后,大豆型和豆粕型醬油糟模型水分、粗蛋白、粗脂肪的SEPC值和SECV值均明顯低于混合醬油槽模型,RSQ值均高于混合醬油糟模型,分類建模的優勢體現得更明顯。分類建模后的兩種醬油糟模型SECV均低于0.5,SEPC均低于0.5,RSQ均高于0.9,模型準確度高,可用于實際檢測,即先進行顯微鏡檢測后再采用相應模型進行掃描分析。在實際生產應用中,對于某些工藝復雜型原料及配方飼料,并非數據庫越大、成分含量變化幅度越大越好,若數據集中樣品組成成分不統一,則可能出現預測效果不理想的情況,此時可考慮借助分析軟件,結合鏡檢,在先驗知識的指導下對模型進行細分,能取得更好的預測效果。本研究為工藝復雜型原料及配方飼料的精準建模提供了借鑒。
作者:孫涵 邱代飛 廖淑娜 吳仕輝 江春 單位:廣東海大集團股份有限公司 農業農村部微生態資源養殖利用重點實驗室