一、總體標準偏差、實(shí)驗標準偏差和合并樣本標準偏差
總體標準偏差(population standard deviation)規范化的符號為σ,定義為:
式中:μ——總體均值,N次測量結果分布的期望;N——測量次數,N接近無(wú)窮大;xi——N個(gè)測量結果中的第i個(gè)值。
在xi的不確定度評定中,由于N不可能接近無(wú)窮大而只用實(shí)驗標準偏差s作為其估計,但s只是σ的一個(gè)偏小的估計,也就是說(shuō)有以下情況:
s可能大于或小于σ,即s>σ或s<σ。
但它們的概率不等,即s>σ的概率小于50%,而s<σ的概率大于50%。這種情況在重復觀(guān)測次數n較小時(shí)尤為明顯。不過(guò),當n≥4的情況下,這種偏小的情況在不確定度評定中就可不予考慮。
σ又稱(chēng)之為真標準偏差(true standard deviation)。含義是準確的值、理想或理論上的值,而s由于是按有限次數n所評定,只是一個(gè)近似值或估計值。
實(shí)驗標準偏差(experimental standard deviation)s定義為:
式中:s(xi)——任意一個(gè)測量結果xi的實(shí)驗標準偏差;xi——第i個(gè)測量結果;n——對同一被測量在規定條件下(既可以是重復性條件,也可以是某給定的復現性條件)的獨立重復觀(guān)測次數;個(gè)xi的算術(shù)平均值,它是μ的無(wú)偏估計。
由于式(2)所表示的是測量結果xi分散性的一個(gè)量,表達的是一個(gè)區間大小,因而在式子右邊開(kāi)方后不取正負號而只取正值(一般不再冠以符號)。式(2)與xi的分布狀態(tài)無(wú)關(guān)。盡管xi的殘差是xi的隨機誤差估計值(任何一個(gè)測量結果中所包含的隨機誤差只可能有估計值而不可能有真值),但s(xi)不能作為測量結果xi的隨機誤差的估計。所有這些重復的測量結果,沒(méi)有一個(gè)共同的隨機誤差之估計,而s(xi)只是這些測量結果分布的標準偏差或誤差分布的標準偏差。
當重復觀(guān)測是在重復性條件下進(jìn)行的情況下,式(2)給出的s(xi)為重復性標準偏差s,即方法所確認的重復性標準差,有的規范用rep作為其符號。如是在復現性條件下所得到則稱(chēng)之為復現性標準差sR。
通過(guò)式(2)所得出的s(xi)的不可靠程度達到。因此,n越大所得s越可靠。例如,如果要求其不可靠的程度小于1/10,則n應大于50。在不確定度評定中,比較理想的是n≥30,一般能達到n≥20就很好了。
合并樣本標準偏差或組合樣本偏差(pooled experimental standard deviation;pooled estimate of standard deviation)sp在ISO等7個(gè)國際組織公布的《測量不確定度表示指南》(Guide to the Expression of Uncertainty in Measurement)(1993)的正文與附錄中均未提及。
sp是通過(guò)多個(gè)被測量的重復觀(guān)測結果,按統計方法所獲得的任意一次結果xi的實(shí)驗標準偏差,更為確切地表示為sp(xi)。在計量技術(shù)規范JJF1059-1999《測量不確定度評定與表示》的4.2和4.3節中給出了幾種sp(xi)的評定方法。采用sp是個(gè)簡(jiǎn)單、方便而且能夠可靠地得到標準偏差的方法。它與實(shí)驗標準偏差s沒(méi)有本質(zhì)上的區別而只是評定計算的方法不同。
二、采用合并樣本標準偏差的必要前提
在JJF1059的4.3節中強調了規范化的常規測量。這是個(gè)必要前提,但并非充分前提。這一前提應理解為整個(gè)測量過(guò)程,包括從取樣、樣品的預處理、測量?jì)x器的等級或技術(shù)要求、數據的處理一直到最后所得到的被測量最佳估計值這一全過(guò)程,也包括各影響量的取值及其測量均應是規范化的。
除此之外,還有一個(gè)必要前提是,這些被測量之值雖然大小各異,但其差別對單次測量結果qk的sr并不帶來(lái)明顯影響。如果被測量之值的大小與sr有明顯的相關(guān)性,例如sr隨被測量之值的增大而相應地增大,那么,應該對被測量之值限定某個(gè)范圍,也可以把被測量之值按不同的sr劃分為若干檔次進(jìn)行分別評定,也可以通過(guò)歷次所測量的不同大小的被測量所得到的不同大小的sr(盡管其自由度不大),擬合成一條曲線(xiàn)。而通過(guò)被測量數量的增加,可以使這一曲線(xiàn)充分可靠。
例如:按ZBG12019-1989測量銻的質(zhì)量分數、氧化鈉的質(zhì)量分數,其重復性標準差均可不分檔次給出;按GB6549-1996氯化鉀產(chǎn)品中的水分質(zhì)量分數w(H2O),按小于和等于4%與大于4%分兩個(gè)檔次給出;按SH/T0253-1992的方法輕質(zhì)石油產(chǎn)品中總硫含量測量結果的重復性標準差則應按總含量(質(zhì)量分數)的變化給出一個(gè)擬合直線(xiàn)。按GB/T6600-1986的方法,則應按對工業(yè)用裂解碳四中組分平均質(zhì)量分數的大小,用曲線(xiàn)給出其測量結果的重復性標準差。
三、通過(guò)過(guò)去對若干被測量Q的重復條件下觀(guān)測結果評定
sp(qk)的方法與實(shí)例
為了方便計算,應挑選過(guò)去對Q重復觀(guān)測次數n相同的記錄。對于n并不要求很大,例如n=3、4或6均可,甚至只重復了兩次(n=2)。設共有m張過(guò)去的檢測記錄,各為一個(gè)Q的測量,因此包括m個(gè)被測量,在每張記錄中均有n個(gè)平行測量結果的平均值而可算出n個(gè)殘差v。m張記錄共可得m·n個(gè)殘差,全部殘差的平方和除以m(n-1)即單次測量結果的合并樣本方差sp2(qk),其自由度達到m(n-1)。
例:歷次對每個(gè)Q的重復觀(guān)測次數n=6的記錄共10張(m=10個(gè)被測量),其觀(guān)測結果與各張上的平均值如表1。
表1 10個(gè)被測量Q的檢測結果
表2 按表1所得出的60個(gè)殘差
表3中的m=10個(gè)∑vi2之和,即m·n=60個(gè)殘差之和為43265×10-6,所以m(n-1)=10×(6-1)=50得
表3 m·n個(gè)殘差二次方及m個(gè)之和
sp2(qk)=43265×10-6/50=865×10-6
sp(qk)=29.5×10-3
即任意一次qk的合并樣本標準偏差,自由度為m(n-1)=50,即總測量次數減被測量個(gè)數。
四、通過(guò)過(guò)去對若干被測量
Q的兩次重復條件下測量結果之差Δi評定sp(qk)的方法與實(shí)例
兩次結果之差Δi的標準偏差與s(Qk)之間存在:
因此,按統計方法評定出s(Δi)后即可計算出,而s(Δi)可通過(guò)若干被測量Q的兩次重復觀(guān)測結果計算出Δi,代入貝塞爾公式得出,即:
式中:m——參與評定的Q的個(gè)數;——所得m個(gè)Δi的算術(shù)平均值。
例:設對m=20個(gè)被測量Q各進(jìn)行兩次平行試驗的歷次檢驗記錄中分別得出的q1與q2列入表4,并計算出其差值Δi和,表中給出了差值殘差的
以及vi2。
表4 通過(guò)兩次之差Δ計算的實(shí)例
而其兩次結果平均值的重復性標準偏差為
自由度為20-1=19
五、通過(guò)若干被測量
Q的平均方差計算sp(qk)
如果能按JJF1059的4.4節采用極差法對重復次數n不多的結果簡(jiǎn)單地評定出s(qk),雖然它們每個(gè)s(qk)的自由度不大,但采用平均方差計算也能得到自由度充分大的sp(qk)。例如,以本文上述表1的數值為例,這m=10個(gè)被測量在各6次重復觀(guān)測中的極差R分別依次為:0.07、0.04、0.08、0.06、0.08、0.08、0.09、0.07、0.10、0.07。按JJF1059表1極差系數在n=6時(shí)為C=2.53。這樣,分別得si(qk)為:0.0277、0.0158、0.0316、0.0233、0.0316、0.0316、0.0356、0.0277、0.0395、0.0277。其自由度均為4.5(按同一表)。按式
與該例所得29.5×10-3比較,大了約1%。按極差法取平均方差進(jìn)行評定的結果,按JJF1059表1,s(qk)的自由度為4.5,因而這里的sp(qk)自由度為4.5×10=45,應該說(shuō)也夠大的了。這里應注意到采用極差法時(shí),有個(gè)必要前提是qk可能值的分布接近正態(tài)。而表1中的各個(gè)單次結果,根據n=6不能作出是否正態(tài)分布的結論,只有按中心極限定律來(lái)判斷。當不接近正態(tài)分布的情況下,使用了極差法,則據此評定的s(qk)會(huì )有所偏大。實(shí)際的分布偏離正態(tài)越遠,則所得s(qk)偏得越大。本例中出現了1%的偏大應認為正常。
六、sp(qk)中所包含的不確定度分量
合并樣本標準偏差sp(qk)與實(shí)驗標準偏差s(qk)一樣,包含了在重復觀(guān)測過(guò)程中全部隨機效應導致的不確定度分量。由于在計算sp時(shí),往往采用了過(guò)去的檢驗記錄中的平行試驗結果,而且又是若干被測量的結果,其中不免包含了某些在試驗過(guò)程中更換了的測量?jì)x器,例如:滴定管、溫度計等,這類(lèi)在實(shí)驗室中往往數量較多而且在平行試驗時(shí)是隨機取用的儀器的系統效應導致的分量。即它們的最大允許誤差(MPE)所帶來(lái)的不確定度分量。
作者單位【原國家計量局】