化學誤差及分析數(shù)據(jù)的統(tǒng)計處理
三水錳礦 / 2021-09-27
誤差及分析數(shù)據(jù)的統(tǒng)計處理
當對物質(zhì)組分含量測定時“準確”兩個字是相當重要的,但是絕對準確的測定結(jié)果是不存在的,所謂“準確”是指測定的誤差小,因此測定結(jié)果的誤差愈小就愈“準確”,所以這一章的重點與難點就表現(xiàn)在與“準確”二字相關的誤差和分析數(shù)據(jù)的統(tǒng)計處理上。
2.1要點與難點
要點
誤差、偏差;誤差與準確度、偏差與精悟度,誤差與偏差的聯(lián)系、準確度與精密度的關系,分析中誤為產(chǎn)生的原因、出現(xiàn)的規(guī)律和減少的措施,重點理解和掌握系統(tǒng)誤差和隨機誤差,要深人掌握這兩種誤差產(chǎn)生的原因、誤差的性質(zhì)和校正的辦法;隨機誤差分布服從正態(tài)分布,有限次測定中隨機誤差服從1分石;置信變與置信區(qū)間:分析結(jié)果的數(shù)據(jù)處理方面,可疑數(shù)據(jù)的取舍,平均值與標準值的比較和兩個平均值的比較;其中可疑數(shù)據(jù)的取合包括Grubbs檢驗法和Q檢驗法(Q-test)兩個方法;有效數(shù)字及其運算規(guī)則;標準曲線的回歸分析。
難點
絕對誤差與絕對偏差的概念;精密度與準確度的關系;系統(tǒng)誤差和隨機誤差產(chǎn)生的原因、誤差的性質(zhì)和校正的辦法;有效數(shù)字及其運算。
2.2絕對誤差與相對誤差
絕對誤差表示測定值與真實值之差,誤差的概念與絕對誤差的概念是一致的,絕對誤差并不意味著誤差的絕對值,而是既有正值,又有負值,也就是說當測定結(jié)果大于真實值時,絕對誤差為正值,表示測定結(jié)果偏高:反之絕對誤差為負值,表示測定結(jié)果偏低。這一點學生經(jīng)常出錯,主要原因是簡單地把絕對誤差中的“絕對”二字誤認為是絕對值.
相對誤差是指誤差在真實值中所占的比例(%),因此相對誤差也有正負。因為相對誤差能反映誤差在真實結(jié)果中所占的比例,因此用相對誤差來表示各種情況下測定結(jié)果的準確度更為確切些。
2.3絕對偏差與相對偏差
誤差反映的是測定結(jié)果與真值接近的程度,而偏差反映的是與多次平行測定分析結(jié)果的算術平均值接近的程度,也就是偏差表示測定結(jié)果與平均結(jié)果之間的差值.
絕對偏差與絕對誤差的區(qū)別是,前者反映的是測定結(jié)果與多次平行測定分析結(jié)果的算術平均值接近的程度,后者反映的是測定結(jié)果與真實值接近的程度,絕對偏差和絕對誤差其中的“絕對”二字都沒有絕對值的意思,所以其結(jié)果既有正值、又有負值,還有一些可能為零,也就是說絕對偏差表示測定結(jié)果與多次平行測定分析結(jié)果的算術平均值之差,而不是測定結(jié)果與多次平行測定分析結(jié)果的算術平均值之差的絕對值,以上這一概念學生經(jīng)常出錯,應倍加注意。
相對偏差是指偏差在多次平行測定分析結(jié)果的算術平均值中所占的比例(%)
2.4 準確度與精密度的關系
一般對于準確度與精密度的關系理解起來有些困難,但是實際上這個問題很簡單,要想把它們之間的關系分析清楚,需要從兩個方面透徹理解,其一是準確度與精密度的基本概念,其二是反映準確度與精密度之向的關系的兩句話。
準確度是指多次平行測定分析結(jié)果的平均值與真值接近的程度,準確度的高低用誤差表示,即誤差小,則準確度高,精密度是指各次分析結(jié)果相互接近的程度,也就是在確定條件下,將測試方法實施多次,求出所得結(jié)果之間的一致程度。精密度的好壞用偏差表示,即偏差小,則精密度好。
精密度的高低還常用重復性和再現(xiàn)性表示。
重復性:同一操作者,在相同條件下,獲得一系列結(jié)果之間的一致程度。
再現(xiàn)性:不同的操作者,在不同條件下,用相同方法獲得的單個結(jié)果之間的一致程度。
反映準確度與精密度之間的關系,有兩句話必須記住,一是精密度高不一定準確度高,二是準確度高一定需要精密度高,把這兩句話理解透徹了,就會認識清楚準確度與精密度之間的關系。為什么精密度離不一定準確度高呢?原因是存在系統(tǒng)誤差,當系統(tǒng)誤差消除以后精密度高的測定結(jié)果準確度才能高。
對實驗結(jié)果的數(shù)據(jù)處理偏差的表示中,用標準偏差更合理,原因是將單次測定值的偏差平方后,能將軟大的偏差顯著地表現(xiàn)出來。
2.5 系統(tǒng)誤差與隨機誤差
關于系統(tǒng)誤差與隨機誤差的問題,首先應該理解它們產(chǎn)生的原因、性質(zhì)和校正方法。在這一節(jié)中,學生認識不清和理解不夠深入的地方往往是其產(chǎn)生的原因和隨機誤差的分布規(guī)律,隨機誤差的分布規(guī)律將在下一節(jié)中介紹,本節(jié)主要分析系統(tǒng)誤差和隨機誤差產(chǎn)生的原因。
2.5.1 系統(tǒng)誤差及其產(chǎn)生的原因
系統(tǒng)誤差是由某種固定的原因所造成的,具有重復性和單向性,系統(tǒng)誤差的大小、正負,在理論上是可以測定的,所以又稱可測誤差。
根據(jù)系統(tǒng)誤差的性質(zhì)和產(chǎn)生的原因,可從以下幾方面加以鑒別。
(1)方法誤差 這種誤差是由方法本身造成的。例如,在重量分析中沉淀的溶解、共沉淀、沉淀的洗滌,灼燒時沉淀的分解或揮發(fā)等;在滴定分析中,反應不完全、干擾成分的影響、指示劑選擇不當、化學計量點和滴定終點不符合以及發(fā)生副反應等,使分析結(jié)果系統(tǒng)地偏高或偏低。
(2)儀器誤差 由于儀器本身的缺陷或者儀器本身不夠精確引起的,如砝碼的質(zhì)量、容量器皿刻度和儀表刻度不準確等,電子儀器“噪聲”過大等
(3)試劑誤差 試劑誤差來源于試劑不純或蒸餾水純度不夠,例如試劑或蒸餾水中含有被測物質(zhì)或干擾物質(zhì),使分析結(jié)果系統(tǒng)偏高或偏低。
(4)操作誤差操作誤差是由于分析人員所掌握的分析操作與正確的分析操作有差異所引起的或是操作者存在操作偏見造成的人為誤差。例如在讀測定數(shù)據(jù)時,有的人第二次讀數(shù)總是想與第一次重復造成的誤差。
總之,系統(tǒng)誤差是可測的,原因是固定的,至少從理論上是可以找出其原因加以克服的。
校正系統(tǒng)誤差的辦法包括選擇標準方法、進行試劑提純、進行儀器校正,通過對照試驗、空白試驗以及回收試驗加以檢驗和校正,為此需要學會以上幾項方法和技術,同時搞清其概念和原理。
2.5.2隨機誤差及其產(chǎn)生的原因
隨機誤差又稱偶然誤差,它是由一些隨機的偶然的原因造成的,這些因素是無法控制和不確定的,例如環(huán)境溫度、濕度和氣壓的微小波動,儀器不可控的微小變化,分析人員在實驗過程中不確定操作上的或是式樣處理上的微小差別,以及其他一些不確定的因素,不可避免的偶然原因,都將使分析結(jié)果在一定范圍內(nèi)波動,引起隨機誤差,這類誤差值有時大、有時小,有時正、有時負,所以隨機誤差又稱不定誤差,這種誤差難以找到具體原因,更無法測量它的值,隨機誤差在測量中是無法避免的。一個很有經(jīng)驗的分析工作者完全規(guī)范的操作,對同一試驗進行數(shù)次分析,其分析結(jié)果卻不能完全一致,但是繼續(xù)進行很多次就會發(fā)現(xiàn),仍然符合一定規(guī)律,這種規(guī)律是“概率統(tǒng)計學”中研究的重要的統(tǒng)計規(guī)律。
2.6隨機誤差的正態(tài)分布
在分析化學中,隨機誤差是由一些偶然因索造成的誤差,它的大小和正負有隨機性,但如果用統(tǒng)計學方法處理,就會發(fā)現(xiàn),如果測定次數(shù)較多,在系統(tǒng)誤差已經(jīng)排除的情況下隨機誤鑒也有一定的規(guī)律性,即隨機誤差分布服從正態(tài)分布。正態(tài)分布就是通常所說的高斯外布,其數(shù)學表達式為:
式中,σ為標準偏差, υ為總體平均值,χ為測量值.
若將橫坐標用υ為單位表示,則可將分布曲線標準化,標準正態(tài)分布以N(O,1)表示,υ定義為,代人式(2-1)得
由表2-1可得以下幾個典型隨機誤差出現(xiàn)的區(qū)間(以σ為單位)與出現(xiàn)的概率的關系。
隨機誤差出現(xiàn)的區(qū)間(以σ為單位) 測量值出現(xiàn)的區(qū)間 概率
u=±1 χ=μ±1σ 68.3%
u=±1.96 χ=μ±1.96σ 95.0%
u=±2 χ=μ±2σ 95.5%
u=±2.58 χ=μ±2.58σ 99.0%
u=±3 χ=μ±3σ 99.7%
隨機誤差分布具有以下性質(zhì)。
(1)對稱性 大小相近的正誤差和負誤差出現(xiàn)的概率相等,誤差分布曲線是對稱的。
(2)單峰性 小誤差出現(xiàn)的概率大,大誤差出現(xiàn)的概率小,很大誤差出現(xiàn)的概率非常小。誤差分布曲線只有一個峰值。誤差有明顯的集中趨勢。
(3)有界性 僅僅由于偶然誤差造成的誤差不可能很大,即大誤差出現(xiàn)的概率很小。誤差很大的測定值,往往是過失誤差造成的。對這種數(shù)據(jù)應作適當?shù)奶幚?
(4)抵償性 隨機誤差的算術平均值的極限為零。
2.7 t分布與平均值的置信區(qū)間
測定值或隨機誤差出現(xiàn)的概率稱為置信度或置信水平, 68.3%、 95.0%, 95.5%、 99.0%、99.7%即為置信度,其意義可以理解為某一定范圍的測定值或隨機誤差值出現(xiàn)的概率。μ±1σ、μ±1.96σ、μ±2σ、μ±2.58σ、μ±3σ等稱為置信區(qū)間,其意義為真實值在指定概率下,包括在某一區(qū)間。顯然置信度選得高,置信區(qū)間就寬。
有限次測定的隨機誤差并不完全服從正態(tài)分布,而是服從英國統(tǒng)計學家和化學家W.S.Gosset 提出的分布,其縱坐標仍為概率密度,但橫坐標則為統(tǒng)計量t。t的定義為:
χ-μ
t=-------
S-
x
t分布曲線與正態(tài)分布曲線相似, t分布曲線隨自由度∫(∫=n-1)而改變,當∫→/∞時, t分布趨于正態(tài)分布,當∫≥20時, t值與u值很接近.
已知置信度和測定值的次數(shù),可從,值表中查到相應的t值.
由t的定義式(2-6)可得
- - ts
μ=х±ts- =х±-----
х √n
式(2-7)示在一定置信度下,以平均值х為中心,包括總體平均值μ的范圍。稱為平均值的置信區(qū)間。對于置信區(qū)間的概念必須正確理解。
置信區(qū)間的寬窄與置信度,測定值的精密度和測定次數(shù)有關,當測定值精密度愈高(s值愈小),測定次數(shù)愈多(n值愈大)時,置信區(qū)間愈窄,即平均值愈接近真值,平均值愈可靠。當測定值精密度愈低,測定次數(shù)愈少時會怎樣?請讀者思考。
2.8 有效數(shù)字及其運算規(guī)則
對有效數(shù)字的理解、辨認和計算經(jīng)常出現(xiàn)錯誤,這些錯誤主要有兩點,一是對有效數(shù)字的基本概念理解不清楚,二是經(jīng)常把小數(shù)點的位數(shù)和有效數(shù)字的位數(shù)混淆。
什么是有效數(shù)字呢?有效數(shù)字是最高數(shù)字不為零的而且通常保留的最后一位數(shù)字是不確定的,也就是說其他各位都是確定的,而最后一位不確定的數(shù)字稱為可疑數(shù)字。一個有效數(shù)字只有最后一位數(shù)字是可疑的,因而有效數(shù)字位數(shù)的多少,反映的是測量的精確度。
例如稱量某物質(zhì)為0.0875g, 0.0875為三位有效數(shù)字,保留到小數(shù)點后面第四位,并不是四位有效數(shù)字,這一點不能混淆。由此也可以將有效數(shù)字理解為最高數(shù)字不為零的實際能測量的數(shù)字。
2.8.1有效數(shù)字的運算規(guī)則
(1)加減法 運算結(jié)果的有效數(shù)字位數(shù)取決于這些數(shù)據(jù)中絕對誤差最大者
(2)乘除法 運算結(jié)果的有效數(shù)字位數(shù)取決于這些數(shù)據(jù)中相對誤差最大者。
在學習有效數(shù)字及其運算規(guī)則時還應特別注意以下幾點:
1.一般有效數(shù)字的最后一位數(shù)字有士1個單位的誤差。
2.運算中,首位數(shù)字≥8時,有效數(shù)字可多記一位。
3.改換單位不能改變有效數(shù)字的位數(shù)。例如2.0g是兩位有效數(shù)字,不能改寫為2000mg,應寫成2.0х103mg,仍然為兩位有效數(shù)字。
4.pH, pM. lgK等有效數(shù)字位數(shù),按照“對數(shù)的位數(shù)與真數(shù)的有效數(shù)字位數(shù)相等,對數(shù)的首數(shù)相當于真數(shù)的指數(shù)”的原則來定,例如[H+]=6.3×10-11,兩位有效數(shù)字,所以pH=10.20,不能寫成pH=10.2或者寫成pH=10,所以pH的小數(shù)部分才為有效數(shù)字。pM.lgK也是如此。
5.在表示分析結(jié)果時,組分含量≥10%時,用四位有效數(shù)字,含量為1%~10%時用三位有效數(shù)字,表示誤差大小時有效數(shù)字常取一位,最多取兩位。
2.8.2 數(shù)字修約規(guī)則
按照“四舍六入五留雙”規(guī)則,當測量值中被修約的那個數(shù)<4時舍去尼數(shù), ≥6時進位;當測量值中被修約的那個數(shù)=5時,若5后數(shù)字不為0,一律進位, 5后無數(shù)或為0, 5前是奇數(shù)則將5進位, 5前是側(cè)數(shù)則將5含去,簡稱“奇進偶舍”。例如將下列有效數(shù)字修約為三位有效數(shù)字時,結(jié)果為:
13.148→13.1
17.3976→ 17.4
0.2736→0.274
175.5 → 176
176.5 →176
22.451→ 22. 5
183. 5→184