
作為紅外光譜QC人員,在日常工作中最常用的一項任務就是確認所采集的樣本紅外光譜是否和標準樣本一致,或者在對未知物進行確認時,需要從海量的標準光譜庫中尋找到最佳匹配的樣本,這個時候往往就需要一個方法來評判。
這個方法我們通常使用光譜“相關(guān)系數(shù)”或者“匹配系數(shù)”,也有稱之為“HQI”(相似度指標)來衡量。這里有兩個核心問題:(1)兩張光譜“相關(guān)性”怎么計算?(2)“相關(guān)性”達到多少算好?
圖1是熒颯光學公司S-IR軟件中未知樣本光譜在光譜庫中進行檢索的示例,根據(jù) “相關(guān)系數(shù)”計算,軟件給出了最為匹配的可能物質(zhì)是聚苯乙烯,其相關(guān)系數(shù)達到88.98%。

圖1 譜庫檢索
下面我們簡單聊聊這個過程,看看有沒有豁然開朗的感覺。
如圖2,有一個未知樣本光譜和兩張標準樣本光譜,假設(shè)每張光譜只由三個波長點組成,分別是未知樣本[1, 2, 3],標樣1[1.2, 2.1, 2.8]和標樣2[2, 2.5, 1.8],將其繪制在3D坐標系中,肉眼可見,未知樣本和標樣1靠的很近,和標樣2相隔很遠。我們就可以輕而易舉地給出判斷和結(jié)論。但當光譜從3個波長點擴展到N個點(比如4000-400cm-1)時,這時候人腦和肉眼就根本不夠用了,只能借助算法來計算,并給出判斷結(jié)果。

圖2
兩張光譜之間的相關(guān)系數(shù)用于衡量它們之間的相關(guān)程度,常用的方法是皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient),在光譜分析中,即兩張光譜對應波長處的強度值之間的線性關(guān)系。通常其取值范圍在[-1,1]之間:
值為 1 表示完全正相關(guān),即兩張光譜的變化趨勢完全一致。
值為 -1 表示完全負相關(guān),即兩張光譜的變化趨勢完全相反。
值為 0 表示不存在線性相關(guān)關(guān)系。
為了便于理解,我們通常取絕對值來表達其相關(guān)性強度。
假設(shè)有兩張光譜,分別為 X=[x1,x2,...,xn] 和 Y=[y1,y2,...,yn],它們的皮爾遜相關(guān)系數(shù)的計算公式為:

是不是有點眼熟?妥妥的就是平常使用的最小二乘法嘛。恭喜你答對了!
我們將圖2中的未知樣本和兩個標樣計算一下,相關(guān)系數(shù)分別0.99和0.27,所以也驗證了我們?nèi)庋鄣臏蚀_性。除了皮爾遜相關(guān)系數(shù)之外,還有其他很多類似的算法,比如歐式距離法、馬氏距離法、夾角余弦距離法等等,匹配值在有些軟件中也就會變成最大到999。不一而論,主要思想都差不多。
下面關(guān)于第二個問題,則比較主觀了,需要根據(jù)自己實驗室要求來做確定。小編在此給一個參考,在制藥領(lǐng)域中,通常將最小HQI設(shè)置為0.95,以此來判定未知樣品與標準圖譜是否匹配。
?
全國統(tǒng)一服務電話
021-59130260
電子郵箱:yuanyuan.liu@insaoptics.com
公司地址:上海市嘉定區(qū)滬宜公路1101號越界產(chǎn)業(yè)園區(qū)
關(guān)注公眾號