66
Analitik Verilerin Değerlendirilmesi Yrd. Doç. Dr. İbrahim BULDUK

Analiz sonuçlarının istatistiksel değerlendirilmesi

Embed Size (px)

Citation preview

Page 1: Analiz sonuçlarının istatistiksel değerlendirilmesi

Analitik Verilerin Değerlendirilmesi

Yrd. Doç. Dr. İbrahim BULDUK

Page 2: Analiz sonuçlarının istatistiksel değerlendirilmesi

Analitik kimyacıların laboratuarlarda elde ettikleri sonuçların ne oranda doğru olabileceği bazı yöntemlerle tahmin edilebilir.

Analizcinin elde ettiği sonuç rakamla ifade edilmeli, bu sonucun elde edilmesi sırasında mümkün hata kaynakları ve bu hataların sonuç üzerindeki etkisi belirtilmelidir.

Page 3: Analiz sonuçlarının istatistiksel değerlendirilmesi

Sağlıklı bir analiz sonucu elde edebilmek için analiz en az üç kez değişik örneklerle tekrarlanmalıdır. Her bir örnek için en az beş analiz yapılmalıdır.

Bir veya iki analiz ile elde edilen sonucun gerçeği ne derecede yansıttığını tahmin etmek oldukça güç hatta olanaksızdır.

Page 4: Analiz sonuçlarının istatistiksel değerlendirilmesi

Doğruluk (Accuracy), Duyarlılık(Precision)

Doğruluk (Accuracy) analiz sonucunun gerçek değere ne kadar yakın olduğunun ifadesidir.Duyarlılık(Precision) ise yapılan ölçümlerin birbirine ne ölçüde yakın olduğunun ifadesidir.

Precise, not accurate Accurate, not precise Accurate and precise

Page 5: Analiz sonuçlarının istatistiksel değerlendirilmesi
Page 6: Analiz sonuçlarının istatistiksel değerlendirilmesi

Doğruluk ve Duyarlılık Arasındaki Fark

Page 7: Analiz sonuçlarının istatistiksel değerlendirilmesi

Bir analizde ölçümlerin duyarlılığı gerçeğe en yakın bir şekilde her zaman hesaplanabilir. Ancak gerçek değer tam olarak bilinmezse sonucun doğruluğu ancak tahmin edilebilir.

Bir ölçümde, duyarlılığın çok iyi olması onun doğruluğunun da çok iyi olduğunu göstermez, ancak gerçeğe yakınlığı konusunda bir fikir verebilir.

Örneğin, içinde tam %20 demir bulunan bir karışımın analizi sonunda bulunan yüzde demir miktarı sonucun doğruluk derecesi hakkında bir fikir verir.

Page 8: Analiz sonuçlarının istatistiksel değerlendirilmesi

Öte yandan içindeki gerçek demir miktarı bilinmeyen bir filizin analizi sonunda bulunan yüzde demir, o değerin doğruluğu konusunda bir şey söylemez.

Bu sonucun elde edilmesi sırasındaki ölçümlerin birbirine yakınlığı yani ölçümün duyarlılığıise bulunan sonucun doğruluğu konusunda bir fikir verir.

Page 9: Analiz sonuçlarının istatistiksel değerlendirilmesi

Doğruluk: Bir sonucun gerçek değere yakınlığını belirtir.

( mutlak hata ve bağıl hata ) terimleri ile ifade edilir.

Kesinlik: Bir analizde tamamen aynı yolla elde edilen sonuçların birbirine yakınlığına kesinlik denir. (dağılım, sapma, ortama sapma, bağıl ortalama sapma, varyans, standart sapma, bağıl standart sapma) terimleri ile ifade edilir.

Kesinlik yada duyarlılık, aynı değeri yeniden elde etme becerisi olarak da tanımlanır.

Page 10: Analiz sonuçlarının istatistiksel değerlendirilmesi

İyi bir duyarlılık çoğunlukla iyi bir doğruluk derecesinin göstergesidir. Ancak bu her zaman geçerli değildir.

Çok iyi bir duyarlılığı olduğu halde zayıf doğruluk dereceli ölçümler de olabilir.

Page 11: Analiz sonuçlarının istatistiksel değerlendirilmesi

Bağıl Hata: Mutlak hatanın gerçek değere oranıdır.

Mutlak Hata: Ölçülen değerle gerçek değer arasındaki farktır. E = xi - xt

Page 12: Analiz sonuçlarının istatistiksel değerlendirilmesi

Ölçümlerin duyarlılığının bir ifadesidir ve çeşitli şekillerde tanımlanır. Bir kimyasal analizde yapılan ölçümlerin ölçüm sayısına bölünmesi sonunda bulunan sayıya ortalama değer denir.

Bir Nüfusun Ortalaması:

Bir Numunenin Ortalaması:

Ortalama Değer

Page 13: Analiz sonuçlarının istatistiksel değerlendirilmesi

Analiz sonuçları en küçükten en büyüğe doğru sıraya konduğunda sıranın ortasına düşen sonuç orta değerdir.

Ortanca Değer

Page 14: Analiz sonuçlarının istatistiksel değerlendirilmesi

Bir analizde elde edilen sonuçların en büyüğü ile en küçüğü arasındaki farka dağılım denir.

Dağılım

Page 15: Analiz sonuçlarının istatistiksel değerlendirilmesi

Ortalama değer ile her bir ölçüm arasındaki farka ise mutlak sapma denir.

Örneğin ikinci ölçümün mutlak sapması:

X2 nin Mutlak Sapması =

Olarak yazılabilir.

Genel olarak:

Sapma

Page 16: Analiz sonuçlarının istatistiksel değerlendirilmesi

Standart sapma verilerin dağılımını gösterir.Numunenin standart sapması (sınırlı bir data serisi için) s ile verilir.

Relatif standard sapma (RSD) (%)

Standart Sapma

Page 17: Analiz sonuçlarının istatistiksel değerlendirilmesi

Soru: 20.00 mg etken madde içerdiği bilinen bir ilaçta yapılan etken madde analizlerinde şu sonuçlar alınmıştır.

19,80mg 20,30mg 20,60mg 19,20mg 19,70mg

Ortalama değer, ortanca değer, aralık, eğer gerçek değer 20.00 ise mutlak hata, bağıl hata, ve binde bağıl hatayı hesaplayınız.

Örnek

Page 18: Analiz sonuçlarının istatistiksel değerlendirilmesi
Page 19: Analiz sonuçlarının istatistiksel değerlendirilmesi

Büyük Hata: Çok az rastlanan, analizciden veya beklenmedik olaylardan kaynaklanan büyük hatalardır.

- Aritmetik işlem hatası yapılması- Rakamların yerlerinin değişik yazılması- (+) yerine (-) yazılması

Hata Tipleri

Page 20: Analiz sonuçlarının istatistiksel değerlendirilmesi

Sistematik Hata: Kaynakları belirlenebilen ve düzeltilebilen hatalardır. Sonuçların doğruluğuna etki eder.

- Alet Hataları- Metot hatalar- Kişisel Hatalar

Page 21: Analiz sonuçlarının istatistiksel değerlendirilmesi

Rastgele Hata: Bilinmeyen ve kontrol edilemeyen hata tipidir. Ölçümün kesinliğine etki eden hatadır.

İki ölçüm arasında deney şartlarının az veya çok değişmesidir.

Page 22: Analiz sonuçlarının istatistiksel değerlendirilmesi

Sistematik Belirli Hata

1- Sabit hatalar : analiz edilen numune miktarından bağımsızdır.2- Orantılı hatalar : numunenin miktarı ile orantılı olarak azalır veya artar

Sistematik Hataların Tespiti ve Düzeltme Metotları

• Şahit Deney• Standart Numunenin Analizi• Standart Ekleme• Bağımsız Analizler• Numune Büyüklüğünde Değişme

Page 23: Analiz sonuçlarının istatistiksel değerlendirilmesi

Analitik değerlendirmelerde her bir ölçümden çok ortalama değerlerle ilgilenilir. Bunun için ortalama sapma, standart sapma ve ölçüm aralığının hesaplanması gerekir.

Ortalama sapma: Her bir ölçümün mutlak sapmalarının toplamının ölçüm sayısına bölümüne denir.

Ortalama Sapma(OS)

Page 24: Analiz sonuçlarının istatistiksel değerlendirilmesi

Aşağıdaki ölçümlerin standart sapmasını hesaplayınız.

10.5, 9.9, 10.4, 9.5, 9.6, 11.5, 9.0, 10.0, 10.5, 9.0, 10.1

Örnek

Page 25: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çözüm

Page 26: Analiz sonuçlarının istatistiksel değerlendirilmesi

Aşağıdaki ölçümlerin ortalama sapmasını hesaplayınız.

12.0, 10.6, 11.2, 10.8, 11.4

Örnek

Page 27: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çözüm için önce verilerin ortalamasının bulunması gerekir.

Eğer hesaplama yapılırsa 11.2 olarak bulunur.

Bu değer ile her bir ölçüm arasındaki fark alınır ve işlem yapılırsa ortalama sapma 0.4 olarak bulunur.

Çözüm

Page 28: Analiz sonuçlarının istatistiksel değerlendirilmesi

Xi Xi-Xort

12,0 0,8

10,6 0,6

11,2 0,0

10,8 0,4

11,4 0,2

Xort = 11,2

= (0,8+0,6+0,0+0,4+0,2) / 5= (2,0/5) = 0,4

Page 29: Analiz sonuçlarının istatistiksel değerlendirilmesi

(Relatif) Ortalama Sapma

Ortalama sapmanın ortalama değere bölünmesiyle bulunur. Relatif Ortalama

Sapma(ROS) = Sort / XOrt

Relatifortalama sapmanın 100 veya 1000 katına yüzde veya binde relatif ortalama sapma denir.

Page 30: Analiz sonuçlarının istatistiksel değerlendirilmesi

ÖrnekAşağıdaki ölçümlerin relatif ortalama sapmasını

hesaplayınız.

60.44, 60.30, 60.72, 60.54

Ortalama Sapma = 0.52 / 4

% Relatif Ort. Sapma = (OS / X) 100 (0.13/60.50) 100 = 2. 15

Page 31: Analiz sonuçlarının istatistiksel değerlendirilmesi

Temel İstatistik

Bir nüfusun Ortalaması:

Ortalama Değer:

Page 32: Analiz sonuçlarının istatistiksel değerlendirilmesi

Standart Sapma

Standart Sapma dataların yayılımını gösterir. Sınırlı boyutta bir data dizisi için Standart sapma

aşağıdaki formülle ifade edilir.

Relatif Standart Sapma (RSD) (%)

Page 33: Analiz sonuçlarının istatistiksel değerlendirilmesi

Cu analizi sonuçları aşağıda verilmiştir: 5.23, 5.79, 6.21, 5.88, 6.02 nM

= 5.82 nM

s = 0.36 nM

Cevap: 5.82 ± 0.36 nM

x

Örnek

Page 34: Analiz sonuçlarının istatistiksel değerlendirilmesi

Gaussian Olasılık Dağılımı

See pg. 971-972 of Skoog et al., Principles of Instrumental Analysis, Thomson Brooks/Cole, New York, 2007.

100

200

300

400

500

600

Res

pons

e

Measurement (e.g. spectral frequency)

Bir analizde pek çok ölçüm alırsan, bu değerler ortalama değerin veya beklenen değerin etrafında dağılım gösterirler.

Dağılan bir sonuç ortalama sonuçtan daha düşük veya daha uzak olacaktır.

Analitik Kimya da çalışılan pek çok fiziksel olay Gassian dağılımı olarak modellenebilen ölçümlerle sonuçlanır.

Page 35: Analiz sonuçlarının istatistiksel değerlendirilmesi

Aşağıdaki sekiz sonucu göz önüne alalım:

Ortalama = 2.35 ve Std Sapma = 0.635

Rastgele bir Gaussian dağılımı varsayarak en büyük değerin 3.8 olması şansı nedir?

Dağılım Olasılıkları ve Ölçüm Güven Aralığı

2.1 2.3 2.6 2.1 1.9 2.2 1.8 3.8

Page 36: Analiz sonuçlarının istatistiksel değerlendirilmesi

Güven Aralığı– Örnek

• N = 8, Ortalama = 2.35, ve Std Sapma = 0.635

• Bu örnek için, 95% güven düzeyi seç.

• Skoog Tablo A1-5 (95% CI, dof =7)

2.35 ± (2.36*0.635)/Sqrt[8]

2.35 ± 0.53

• Sonuç: 3.8 (2.35 ± 0.53) aralığının dışındadır. 3.8 değerinin sistemden farklı olduğu noktasında 95% güvende olabiliriz.

Page 37: Analiz sonuçlarının istatistiksel değerlendirilmesi

Standart deniz suyunda çözünmüş Ti ölçüm sonuçları şu

şekilde elde edilmiştir:1.34, 1.15, 1.28, 1.18, 1.33, 1.65, 1.48 nM

DF = n – 1 = 7 – 1 = 6

= 1.34 nM

s = 0.17

95% Güven Aralığı

t(df=6,95%) = 2.447

CI95 = 1.3 ± 0.16

50% Güven Aralığı

t(df=6,50%) = 0.718

CI50 = 1.3 ± 0.05 nM

Örnek

n

tsx

x

Page 38: Analiz sonuçlarının istatistiksel değerlendirilmesi

Güven Aralığının Yorumlanması

• % 95 Güven Aralığı için, Doğru Değerler() % 95 olasılıkla 1.3 ± 0.2 nM aralığı arasındadır, veya 1.1 ve 1.5 nM arasındadır.

• % 50 Güven Aralığı için, Doğru değerler % 50 olasılıkla 1.3 ± 0.05 aralığındadır nM, veya 1.25 ve 1.35 nM arasındadır.

• n artıyorken CI artacaktır.

• Kalite Güvence ve Kalite Kontrol tarafından düzenli olarak elde edilen dataları karakterize etmek için kullanışlıdır.

Page 39: Analiz sonuçlarının istatistiksel değerlendirilmesi

Standart sapmanın hesaplanması analiz sonucunun doğrululuğu hakkında bir tahmin yapmayı sağlarsa da bulunan ortalama değer gerçek değere ne kadar yakın olduğunu bilinmez.

Bu nedenle sonucun doğruluğu hakkında deneysel ve matematiksel olmak üzere iki yolla daha tahminde bulunulabilir.

BİR ANALİZİN DOĞRULUĞU GÜVENİRLİK DERECESİ

Page 40: Analiz sonuçlarının istatistiksel değerlendirilmesi

Matematiksel yöntemde ise, gerçek değerin ortalama değere yakın bir aralıkta olduğu kabul edilir.

Ortalama değere yakın bu aralığa güven aralığıdenir.

Bu aralık ne kadar genişise, gerçek değerin bu aralığa düşme olasılığıo kadar fazladır.

BİR ANALİZİN DOĞRULUĞU GÜVENİRLİK DERECESİ

Page 41: Analiz sonuçlarının istatistiksel değerlendirilmesi

Bu aralığın sınırlarına güvenlik sınırları denir.

Gerçek değerin yüzde olarak bu aralıkta olma olasılığına ise güvenirlik derecesi denir.

Güvenirlik derecesi ile gerçek değer arasındaki ilişki şu şekilde verilebilir.

BİR ANALİZİN DOĞRULUĞU GÜVENİRLİK DERECESİ

Page 42: Analiz sonuçlarının istatistiksel değerlendirilmesi

Deneysel yöntemde, analizi yapılan maddenin, içindeki madde miktarıbilinen saf örneği, aynıkoşullarda analiz edilir.

Buradan bulunana hatanın diğer analizlerde de yapıldığıkabul edilir.

Bu yöntemin olumsuz yönlerinden biri örnekteki safsızlık maddelerinin beklenenden daha fazla sonucu etkileyebileceğidir.

BİR ANALİZİN DOĞRULUĞU GÜVENİRLİK DERECESİ

Page 43: Analiz sonuçlarının istatistiksel değerlendirilmesi

BİR ANALİZİN DOĞRULUĞU GÜVENİRLİK DERECESİ

Page 44: Analiz sonuçlarının istatistiksel değerlendirilmesi

BİR ANALİZİN DOĞRULUĞU GÜVENİRLİK DERECESİ

Burada T gerçek değeri, X ortalama değeri, S standart sapmayı, N ölçüm sayısını belirtir, t ise seçilen güvenirlik derecesine ve ölçüm sayısına bağlı bir sabittir. Çizelge 1 de değişik güvenirlik dereceleri için t değerleri verilmiştir.

Page 45: Analiz sonuçlarının istatistiksel değerlendirilmesi

BİR ANALİZİN DOĞRULUĞU GÜVENİRLİK DERECESİ

Bir çinko filizin analiz sonuçlarıyüzde çinko olarak şöyledir. 42.62, 43.12, 42.20, 43.22, 42.56, 42.86. Bu analizin ortalama değerini, standart sapmasınıve %95 ve %99 güven aralığını bulunuz.

Page 46: Analiz sonuçlarının istatistiksel değerlendirilmesi

BİR ANALİZİN DOĞRULUĞU GÜVENİRLİK DERECESİ

Page 47: Analiz sonuçlarının istatistiksel değerlendirilmesi

BİR ANALİZİN DOĞRULUĞU GÜVENİRLİK DERECESİ

Page 48: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çeşitli güven aralıkları için t değeri

Page 49: Analiz sonuçlarının istatistiksel değerlendirilmesi

UÇ DEĞERLERİN ATILMASI

Bir ölçümde ortalama değere uzak olan değerlerin ne yapılacağı, çoğu kez sorun gibi görülür.

Uç değerleri atarak daha güvenli bir sonucun alınacağı düşünülebilir. Hangi değerlerin hesaplama dışında bırakılacağı konusunda basit birkaç kuralı uygulamak yeterlidir.

Page 50: Analiz sonuçlarının istatistiksel değerlendirilmesi

UÇ DEĞERLERİN ATILMASI

Uç değerlerin atılabilmesi için belli nedenlerin olmasıgerekir.

Örneğin; ölçüm sırasında bürettebulunan kirlilik, büretin akıtması, çözeltinin sıçraması gibi nedenler uçdeğerlerin atılması için yeterli nedenlerdir.

Eğer belli bir neden yoksa yeni ölçümlerin yapılması gerekir. Eğer yeni ölçümler için yeterli örnek kalmamış ise, uç değerlerin atılıp atılmayacağı konusunda bazı testleri uygulamak gerekir.

Page 51: Analiz sonuçlarının istatistiksel değerlendirilmesi

UÇ DEĞERLERİN ATILMASI

Uç değerlerin atılıp atılmayacağı konusunda bir çok istatistik testler varsa da özellikle ölçüm sayısı az olan analizlerde en iyi sonucu Q testi verir.

Q, uç değer ile ona yakın olan değerler arasındaki farkın ölçüm aralığına bölümüdür.

Eğer bir ölçümün sonuçlarıbüyüklük sırasına göre dizilir ve son terime n denirse olarak yazılabilir. Burada Xn en büyük değeri, X1en küçük değeri, Xm atılmak istenen değeri, Xm-1 ise atılmak istenen değere en yakın değeri tanımlamaktadır.

Bulunan değer çizelge 2’deki Q değerlerinden büyük ise o ölçüm atılabilir.

Page 52: Analiz sonuçlarının istatistiksel değerlendirilmesi

UÇ DEĞERLERİN ATILMASI

Page 53: Analiz sonuçlarının istatistiksel değerlendirilmesi

Örnek

Bir demir filizi analizi sonuçlarıyüzde demir olarak 32.42, 32.58, 32.36, 32.60, 32.00 ve 32.52 bulunmuştur.

Buradaki 32.00 değerinin atılıp atılamayacağım araştırınız.

Page 54: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çözüm

Bir demir filizi analizi sonuçlarıyüzde demir olarak 32.42, 32.58, 32.36, 32.60, 32.00 ve 32.52 bulunmuştur.

Buradaki 32.00 değerinin atılıp atılamayacağım araştırınız.

Page 55: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çizelge 2’ye bakılırsa 6 ölçüm için Q değerinin 0.56 olduğu görülür.

Bulunan Q değeri 0.56 dan büyük olduğundan 32.00 değeri %90 güvenlik için atılabilir.

Çözüm

Page 56: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çeşitli Güvenlik Dereceleri İçin Q Değerleri

Page 57: Analiz sonuçlarının istatistiksel değerlendirilmesi

Örnek

Bir analizin sonuçları şu şekilde bulunmuştur:

15.12, 16.82, 16.32, 16.22, 16.32, 16.02

Bu ölçümlerden herhangi birinin atılıp atılamayacağını araştırınız.

Page 58: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çözüm

Yukarıdaki analiz sonuçları büyüklük sırasına göre dizilirse, 15.12, 16.02, 16.12, 16.22, 16.32, 16.32, 16.82 dizisi elde edilir.

Page 59: Analiz sonuçlarının istatistiksel değerlendirilmesi

Bu değer çizelgedeki 0.51 değerinden büyük olduğundan 15.12 ölçümü atılabilir.

Çözüm

Page 60: Analiz sonuçlarının istatistiksel değerlendirilmesi

Bu değer çizelgedeki altı ölçüm için verilen 0.56 değerinden büyük olduğu için 16.82 ölçümü atılabilir.

Çözüm

Page 61: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çözüm

Bulunan değer çizelgede beş ölçüm için verilen 0.64 değerinden küçük olduğu için atılmamalıdır.

Page 62: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çözüm

atılmamalıdır.

Page 63: Analiz sonuçlarının istatistiksel değerlendirilmesi

F TESTİ (STANDART SAPMALARIN KARŞILAŞTIRILMASI)

İki farklı kişinin yaptığı analizlerin veya iki farklı metotla elde edilen sonuçların standart sapmalarının karşılaştırılmasında kullanılır. Farklı sonuçların standart sapmalarının karesi birbirine bölünür ve sonuç tablodaki F değeri ile karşılaştırılır.

Page 64: Analiz sonuçlarının istatistiksel değerlendirilmesi

F TESTİ (STANDART SAPMALARIN KARŞILAŞTIRILMASI)

Page 65: Analiz sonuçlarının istatistiksel değerlendirilmesi

Örnek

Bir maddenin organik asit içeriği analizinde şu veriler elde edilmiştir.

% asit: 36,7 32,6 31,1 30,3 28,9

buna göre 36,7 değeri %90 güven sınırı içinde atılmalımıdır?

Page 66: Analiz sonuçlarının istatistiksel değerlendirilmesi

Çözüm

Bir maddenin organik asit içeriği analizinde şu veriler elde edilmiştir.

% asit: 36,7 32,6 31,1 30,3 28,9

buna göre 36,7 değeri %90 güven sınırı içinde atılmalımıdır?