⑴ 數據處理及建立模型
9.2.2.1 統計量的選取
基於對金剛石/鑽石中E型石榴子石包裹體元素含量統計分析來對其產地來源識別,需要預先搜集世界各地已知的前人研究測試的數據,來建立數學模型,以得出產地來源與包裹體元素含量之間的某些聯系。表9.1是參與此次統計分析的數據來源及樣本數。
參與本文統計分析和繪圖等所用的數據,全部來源於該表中對應的文獻(附表6)。因此,若下文中無再註明出處或其他特殊說明,其數據均默認來自於該表對應產地的文獻,其數字序號也對應相應產地。
表9.1 各產地金剛石石榴子石包裹體電子探針測試數據條數歸納(單位:條)Table 9.1 Statistics of EPMA test data of garnet inclusions in diamonds from different origins (unit: piece of data)
由於判別分析需要從中篩選出能提供較多信息的變數方能使錯判概率變小,因此統計變數的選取尤為重要。包裹體的測試數據包含了數十種元素及其對應氧化物的含量,倘若一一研究,不僅計算量大,計算復雜,而且容易出現重復統計造成較大誤差等。在此,作者選定了其中的FeO、MgO、CaO三種組分參數作變數,這樣選變數基於如下理由(黃進初,1990):
(1)Si組分作為石榴子石硅酸鹽礦物的主常量組分,不參與此次的統計研究;
(2)Ti、Ni、K、Na、Cr等組分在石榴子石中的含量較低(測試誤差大),且測試數據不全(只有某些產地的測試數據,部分產地的測試數據缺失),因此其數值代入統計研究中會引起較大的誤差;
(3)FeO、MgO、CaO三個組分是石榴子石中對其種類成分產生主要制約的組分,也是和地幔性質有明顯關聯性的組分。對歸納的167條E型石榴子石測試數據的預處理顯示,各產地FeO、MgO、CaO三個統計變數的數據全,且其組間方差與組內方差比值較大,是各產地間差異性比較大的三種組分參數(其中,Mn2+含量算入Fe2+含量中)。
9.2.2.2 產地歸類
對於金剛石/鑽石來說,由於其形成環境和條件較為「苛刻」,且世界各產地間由於「歷史上」地理位置靠近、幔源性質相近等原因,某些產地間相關包裹體性質具有很大的相似性,僅僅靠一條信息(石榴子石包裹體元素含量統計分析)也許不能區分到具體的每一個產地。為此,本文將先對相似的產地進行歸類,研究石榴子石元素含量差異顯著的幾個代表產地(石榴子石含量差異不顯著的產地間將用其他信息來補充區分,本文不詳細討論)。
在此,作者使用主成分綜合評價法(陳述雲,張崇甫,1995;葉宗裕,2006;閻慈琳,1998),通過將相關統計變數進行主成分分析得到的若干個主成分按線性加權得到一個綜合性評價指標,來觀察不同產地間的E型石榴子石包裹體地球化學異同。由此,對搜集的各產地E型石榴子石包裹體數據,通過將統計變數FeO、MgO、CaO進行主成分分析,用將所得到的n(1≤n≤3)個主成分按公式9.1提取一個綜合主成分:
聯合國金伯利進程框架下的鑽石原產地研究
其中,Fi為第i(1≤i≤n)個主成分,λi為主成分Fi對應的特徵值,λ總為n個主成分的特徵值之和。這里取n=2時,其方差累積百分比達99.711%,說明這兩個主成分可以很好地綜合FeO、MgO、CaO這三個統計變數的信息,且綜合主成分值反應產地間的地球化學異同應該具有一定的可靠性。因此,將不同產地綜合主成分的平均值作圖得到如圖9.8。
根據圖9.8,將主成分均值相近的產地分為以下四大組,每組內部對應產地E型石榴子石包裹體元素差異較小,而不同組之間差異較明顯,可以獲得較好的區分度(表9.2)。
圖9.8 各產地金剛石E型石榴子石包裹體統計量綜合主成分均值圖
Figure 9.8 Mean value of comprehensive principle components of garnets inclusions in eclogitic diamonds all over the world
表9.2 產地分組表*Table 9.2 Groups of diamond origins
表格中的數字序號對應表9.1中的相應產地
9.2.2.3 判別模型的建立
通過判別分析找出各組間的差異性,並建立一個判別模型,作為識別未知產地來源的依據之一。這里使用Fisher判別法,通過坐標變換的方式將數據點投影到另一個坐標系,再用一元方差分析的檢驗手段將新坐標系中水平差異顯著的不同組區分開來,將待判別樣本歸入離新坐標系中質心最近的組。本文的判別分析過程在統計軟體SPSS中進行。
由此,將這4組的FeO、MgO和CaO含量作為統計量,根據表9.2的分組進行判別分析。分析結果部分顯示如表9.3所示。
從以上3個表中得到的有用信息如下:
表9.3顯示,判別的總判別正確率為67.1%,其中組Ⅰ和組Ⅳ的判別正確率都在80%以上,區分效果較好;但組Ⅱ的正確率僅為50%左右,顯示第二組歸類樣品FeO、MgO和CaO含量的信息與其他幾個組之間相關信息的區分度不夠明顯。
表9.4顯示,非標准化的判別方程系數,可以得到一個判別方程組如下:
聯合國金伯利進程框架下的鑽石原產地研究
其中Ex為判別得分,C為對應物含量。
從表9.5顯示,依判別方程,將各組統計量的均值代入可得相應組的質心。若將某個未知來源產地的金剛石E型石榴子石相應FeO、MgO和CaO含量分別代入判別方程9.2組得到的結果E1、E2、E3離哪組的質心距離最近,則認為該金剛石/鑽石來源於該產地。圖9.9顯示,各組質心在同一平面直角坐標系中的位置有顯著距離,且各組樣本共167條數據作相應轉換後的投點歸屬基本正確,正確率應為67%左右。
圖9.10更為直觀地顯示出不同產地的特徵差異:通過四個大組的統計量求氧化物對應的陽離子含量,投Fe-Mg-Ca三元原子百分比圖。由於不同組樣本數不均,且同組不同產地間仍存在不可避免的部分差異,在以組為單位投點後,為作圖的美觀性和結果的直觀性,每組又再取了一個代表產地的統計量參與對比作圖(圖9.10)
如圖9.10所示,相同產地金剛石/鑽石E型石榴子石包裹體Fe、Mg、Ca成分有較好的集聚,而不同產地間又有一定分散的分布,因此具有好的區別性,其中:
表9.3 分組結果Table 9.3 Regrouping results
*總的判別正確率為67.1%
表9.4 典則判別式函數系數Table 9.4 Coefficients of Canonical discriminant function
表9.5 組質心處的函數Table 9.5 Functions at Group Centroids
圖9.9 E型石榴子石包裹體產地來源典則判別函數圖
Figure 9.9 Canonical discriminant function of garnet inclusion sourcing of eclogitic diamonds
圖9.10 金剛石E型石榴子石包裹體Fe-Mg-Ca 原子百分比圖
Figure 9.10 Percentage diagram of Fe-Mg-Ca atoms of garnet inclusions in eclogitic diamonds
(1)第一組,加拿大Jericho產地,其平均Mg含量較高,但平均Ca含量較低,Fe含量則分布較散(這里的Fe含量是指Fe2+含量,下同)。
(2)第二組,相應產地的投點則相對分散(圖9.9左),這與判別分組結果(表9.2):組Ⅱ的判別正確率較低相吻合;但其中南非Venetia產地,以其最低的平均Fe含量和最高的平均Ca含量與其他產地有著明顯區別(圖9.9右);造成此結果的可能原因將在下文中分析。
(3)第三組,相應產地的投點雖然也有部分分散,但大部分集中在與委內瑞拉Guaniamo產地相近的區域:其特徵是各端元含量都居於三個產地之間,這和該組的綜合主成分均值也居於所有產地之間結果相吻合。
(4)第四組南非Finsch產地,其特徵是平均Fe含量最高,而Ca和Mg含量都相對偏低,與其他組區別明顯。
由此可見,不同產地來源的金剛石/鑽石E型石榴子石包裹體地球化學性質確存在有較明顯的差異性,應該可作為判斷未知產地來源的依據之一。