Story Transcript
James ttl [Jliller Jane
I Uliller
L
La calidad de las medidas analiticas
4.1. Introducci6n La quimica analitica, como se vio en el Capftulo 1, es una ciencia de la medida aplicada, en la que predominan 1os estudios cuantitativos, siendo esenciales, por tanto, las estimaciones de errores inevitables. En casi todas las aplicaciones del anälisis los resultados obtenidos se suministran a un cliente
o usuario, Y os necesario que estos usuarios se encuentren satisfechos tanto como sea posible con la calidad (adecuaciln a1 objetivo) de las medidas. Esto tiene muchas implicaciones importantes para \a präctica analitica. En primer lugar, cualquier evaluaciln de los errores de medida debe tener en cuenta el proceso analitico global: incluyendo las etapas de muestreo, que a menudo contribuyen al error global muy significativamente. En segundo lu$ar, las caracteristicas de los anälisis acometidos en cada laboratoiio deben ser comprobados internamente de forma reSular, normalmente aplicändolos a materiales de referencia o eständar. En tercer 7uSar, en muchas äreas de aplicaciln se deben comparar los resultados de diferentes laboratorios entre si, de marTeta que los usuarios puedan estar satisfechos de que el funcionamiento de los laboratorios cumple con normativas, regulaciänes y offos requerimientos. Finalmente, los resultados analfticos se däben sumunistrar con una estimaciön realista de su incertidumbre, es decir, el intervalo dentro del cual estä ubicado el verdadero valor de la cantidad que es medida. Estos son los temas principales que se analizan en este capitulo. Los mdtodos estadfsticos utiTizados en dichas äreas son, en principio, muy simples, basändose muchos de e1los en tlcnicas descritas en los Capitulos 2 y 5. Sin embargo, uno de los principales desarrollos en las ciencias analiticas de los riltirnos aflos ha sido su aplicaciln cada vez mäs frecuente y mejorada, propiciando una gral;l mejora enla calidad y aceptabilidad de muchos resultados analiticos. Ademäs, algunos de los mdtodos analizados tienen amplias aplicaciones. Por ejemplo, los principios empleados para controlar el funcionamiento de un rinico anälisis en un rinico laboratorio durante un periodo de tiempo se pueden aplicar tambidn al seguimiento de un proceso industrial.
3
78 4.2. rF,
a o) o(t,
o oJ
.o
o o
B Cl)
rü o) F5 gJ
o g) g)
)
0)
o o
Muestreo
quimicas para proporcionarnos inforMuchos anälisis dependen de muestras gtotut Por tanto, si no se cönsideran con cuidado maciön sobre ;;ij;d puede sel que los mdtodos estadisticos 1as etapas d,e muesträo de un unilirir, ya que las muestras estudiadas considerados en este libro no sean ,räidot, objeto de estudio' Por puede que no 1eplesenten apropiadamente al-con-junto de un rio para analizat un conejemplo, no es posible analizat todo el a$ua cisternä de un camiön llena taminant t6*rii,;;. es posibl e a,,aliz-ar una esteroide prohibida' En otros ca" de leche pararr.r'ri contiene una hormona de muestra debido a que el sos tiene que utili zarse rrnu p.q.r, ia cantidad material restante' Asi pues' m6todo ., a.rtrtälitä y ,t qtti.ie conserv at eI manera que ase$ure en en cad.a caso la -.tettä estudiada debe tomarse de del objeto total' 1o posible que sea verdad,eramente r€pfesentativa para aclarar algunos aspectos de1 muestreo considdrese la situaciön en la se desee obtener una estique se disponga ää rr' graÄlote de pastillas Y {ue p,nväz ät ptt"t todas las pastillas' se maci;ndel peso medio d. trru puttlitu. En este ejemplo el pesa toman unas pocas (supongamoi äi.r) y se "uduuna' pastillas pesadas constituye una lote de tabletas i;;"iu pänurii,ny las diez (rr6ur. 1ä Seccidn2'Z)' Si ü muestra se va a utilimuestra a. .rtu iäffu "ii" entonces se denomina eszar patad.ao.ir'd, ft"pl9ä"des de 1a poblaciön, muestra tomada de ta1 motadisticamente muestra aleatoria, es d^ecir, ü{Ia 1a misma posibilidad de do que todos fo, *|.-fros d.e la poblaciön tienen välidas las ecuaciones como la estar incluidos en ella. Sö1o enionlces serän Debe considerar(2.g),que proporciona los limites de confi. a3:Iza de la media' estad.istico, un significado dise que e1 tdrmino oaleatorio" tiene, en sentido pudiera diseminar las ferente de ,.casualu. Aunque en la ptäcticaun analista de diez de una manepastillas sobre una mesa ä intentar tomar una muestra El mejor modo ra casual, dicho mdtodo podriaocultar un ses$o inconsciente' el uso de una tabla de nümeros de obtener una muestra äleatoriaes mediante 1e asigna un nümero de tal aleatorios. A cada elemento de 1a poblaciön se nümero de digitos' por ejemmarteraque todos los nrimeros tienän el mismo se leen de tnatabla plo 001, 002, 003 , etc.Entonces los nümeros aleatorios A.8), partiendo de un punto arbitrario d,e mimeros aleatorios (v6ase 1a tabla g64,773, etc.;y 1os nrimeros coffespondientes que propor.lorr., fo, .,.-p1o, Un procedimiento alternativo (y mude la poblaci6n .Ärdtli rätnlamuestra. el de seleccionar 1os elemencho mäs simple) que se utllizaalgunas-veces es pol ejemplo, tomar una de cada tos de una pobla Ä61_ uintervaloJregulares' no es completamente cien pastillas d.e una linea de producciön..E:!. mdtodo coincidente en el peso de satisfactorio ya que podriu."iiiit "na periodicid.ad de la muestra es evidente' De 1as pastillas: la importancia de la aleatäriedad una disminuciön nuevo, si las riltimas pastillas tomud", hubieran sufrido producci1t del lote, entonces esta muestra proSraü,,a! de peso durarrie la lote rruio, complietamente erröneo para e1 peso medio d"el porciona nu "i completo. elementos discreEn el ejemplo anterior la poblaciön estä constituida de 1as pastillas' E1 muestreo tos obvior, qrrä nominalmente son el mismo, o sea, rocas, polvo, gases y 1ide materiales para los que esto no es cierto, como a gtanel fuera perquidos, se den-omina muestreo a $ranel. Si un material LLrra parte pequefla o fectamente homogöneo entonces 161o r. necesitaria
incremento de muestra o porcidn de ensayo para determinar las propiedades del conjunto. En lapräctica los materiales a granel no son homog6neos por multitud de razortes. Materiales como aleaciones y sedimentos estän formados por particulas macroscöpicas con diferente composiciön y puede que no estdn uniformemente distribuidas en el conjunto. Los fluidos puede que no sean homogdneos a escala molecular, debido a los gradientes de concentraci6n. Tal falta de homogeneidad se detecta s61o tomando una muestra de prueba de diferentes partes del conjunto. Si fueraposible, esto deberiahacerse aleatoriamente considerando el conjunto como una colecciön de celdas de
y seleccionando una muestra de celdas utlTizando nümeros aleatorios como se describiö anteriormente. De 1a muestra aleatoria, puede calcularse la media, i, y la variarrza, s2. Existen dos contribuciones al valor de s2: la varianza muestral, ol, debid,a a las diferencias entre 1os elementos de 1a muestra,por ejemplo, pastillas que tienen diferentes pesos, y la vari arrzl,a de la medida, o2o, por ejemplo, errores aleatorios en la pesada de cada pastilla. En la secci6n siguiente se describe cömo pueden separarse y estimarse estas dos contribuciones utilizando el ANOVA. Para materiales a granella vananza muestral depende de1 tamaflo de los incrementos de muestra relativos a la escala de las no homogeneidades. Cuando el tamaflo del incremento de muestra aumenta, las no homogeneidades tiendert a ser promediadas, disminuyendo de esta mattera \a varianza muestral. igual tamafro
4.3.
Estimaciön y sefraraciön de varianzas utilizando ANOVA
En la Secciön 3.8 se describid el uso de ANOVA de unfactor para contrastar las diferencias entre medias cuando existe una posible variaciön debida aull factor de efecto fijo. En esta secciön se considera la situacidn en donde existe un factor de efecto aleatorio, o sea, variaciön muestral. El ANOVA de un factor se utiliza entonces pata separar y estimar 1as diferentes fuentes de variaci6n, en vez de contrastar si varias medias muestrales difieren significativamente. LaTabla 4.1 muestra los resultados del ensayo de pureza de un barril de cloruro sddico. Se tomaron cinco incrementos de muestra, A-E, de diferentes partes del barriT elegidos al azar, y se realizatorT cuatro anälisis repetidos sobre cada muestra. Como se explicö anteriormente, hay dos posibles fuentes de variaciön: 1a debida al error aleatorio en la medida de la pureza, dada por la varianza en la medida, oB , y la debida a las variaciones reales en la pureza del cloruro sddico en diferentes puntos de1 barril, dada Tabla
4.1. Ensayo de pureza de cloruro södico. Pureza (%)
A B
c D E
98.8, 98.7, 99.3, 99.7, 98.3, 98.5, 98.0, 97.7, 99.3, 99.4,
98.9, 98.8 98.8, 99.2 98.8, 98.8 94.4, 97.3 99.9, 99.4
98.8 99.0 98.6 97.6 99.5
79
t-
o o 8r oo aoo o a Fl
o aoo a g)
:J EL C)
o Q
ti BO
rrl a o)
o(n
o 9)
J3
o 5 o)
E
o) FJ 9)
'o F-l
dentro d'e muespor 1a varianzamuestral ,, o!. Puesto que- eI ctadtado medio 3'9) se puede usar tras no depende de 1a media muesträ1 (vdase 1a Secci6n medio entre muestras n0 se pued.e utilizar pata ä;;;Ä;, ie. El cuadrado muestrales es callestimar directam ente ol, ya que la variaciön entre medias por las posibles variaciosada tanto por el error äiäatorio en la medida como medio entte muestras nes en Ia pireza. Se puede demoslrar qlre,elr cuadrado de medidas proporcio',aufraestimaciön de ofi+ nil (donde n es eL nümero de o21' se dehefia repetidas). Sin embarso, antes dä realizar una estimaciön de 0' Esto se fearealizar un contr aste f,ara ver si difi.ere significativamente si no liza comparando los cuadrados medios:entre y dentro de muestras: medios estidifieren significativamente entonces o2r 0 y ambos cuadrad'os man o'0. para este La salida de1 ANOVA de un factor proporcionada por Excel que e1 cuadrado ejemplo se muestr a a continuaciön. Los täsultados muestran muestras' medio entre muestras es mayol que e1 cuadrado medio dentro de sigy e1 resultado del contraste F muästra que esta diferencia es sumamente medio nificativa, ., a".ir, qi ,ldifiere significativ amente de 0' El cuadrado que de manera entre muestras d,a elvalor 0.0653 .ä*o una estim aci6n de ofr, se pued.e estimar o2, atiTizando:
o g) o)
o!:
9)
: :
o o
(caadrado medio entre muestras muestras)/ru (1.96 - 0.0653)/4
-
cuadrado medio dentro
d'e
0.47
Muestra A
Muestra
qR
qq ?
R
B
98.1 98.8
98.1 98.9 98. B
99 .2
Anova de un
Muestra 98.3 98. qR
B R
C
Muestra o? q't a1
D
Muestra
E
qq L oo o 99 .4
'7
4 ?
factor
RESUMEN
Grupos
Frecuencza
Muestra A
4
Mrra 3 son inaceptables. Desde luego, incluso los laboratorios con puntuaciones satisfactorias se esforzarän por mejorar sus valores en las rondas posteriores del ES. En la präcttca, no es infrecuente encontrar distribuciones de ocolas acusadasr, es decir, mäs resultados de 1os esperados con lzl > 2. Algunos valores se han adjuntado a los mdtodos de combinar las puntuaciones z. Por ejemplo, los resultados de un laboratorio en un esquema ES rinico a 1o largo de un afr.o se podrfan combinar (aunque esto enmascararta cualquier mejora o deterioro en e1 funcionamiento sobre el aflo). Si el mismo m6todo analitico se aplica a diferentes concentraciones del mismo analito en cada ronda del mismo esquema ES, nuevamente una puntuacidn compuesta podrtatener un valor limitado. Paraeste propösito se utilizan dos funciones, 1" ru-" de puntuaciones z rescaladas (Spn),J 1" suma de puntuaciones z csadradas (spC), dadas por SPR :Lrr,lt/n y SPC : I, z!, tespectivamente. Cada una de estas funciones tiene desventajas, no recomendändose el uso de las puntuaciones z combinadas.
Figura
4.9.
Resumen de resultados de una ünica ronda ES.
OJ
:J
gL c)
o a
(z
e6 4.1 1. rfl a '-lo oa c) 0J
'o
= ;J
o o FF kl
g)
Eo FJ
o
,.o
i
c) oJ
s,
T
o)
o o
Ensayos de colaboraciön
Como se ha visto, los esquemas de prueba de habilidad permiten que sea controlada, comparada y qtizä mejorada la cornpetencia de Los Laboratorios. En contraste, un ensayo de colaboracidn (EC) pretende evaluar la precisiön de un mötodo analttico, y a veces su capacidad para proporcionar resultados libres de sesgo. Consiste norrnalmente en un rinico experimento implicando alaboratorios expertos y competitivos, los cuales usan por definicidn la misma töcnica. Los ensayos de colaboraciln quizä se describen mejor como es-
tudios de funcionamiento de m6todos. Un experimento preliminar crucial es el ensayo de nentereza, resistencia o robustezrr. Como se vio en el Capitulo 1, incluso 1os experimentos analiticos muy sencillos suponen varios pasos individuales y, quizä, e1 uso de un cierto
nimero de reactivos. Asi, muchos factores experimentales (por ejemplo,
temperatura, composiciön del disolvente, pH, humedad, pureza de reactivos y concentraciln, etc.) afectardn a los resultados, y es esencial que dichos factores se identifiquen y estudien antes de que se emprenda cualquier ensayo de colaboraci6n. En algunos casos un mdtodo resulta ser tan sensible a pequefr.os cambios en un factor, que en \a präctica es dificilfsimo de controlar (por ejemplo, reactivos de altapureza) de modo que el mdtodo se rechaza por ser impracticable antes de que se efectrie el EC. En otros casos el ensayo continuarä, pero se prevendrä alos colaboradores de aquellos factores que deben ser controlados con mäs cuidado. Aunque en el Capitulo 7 se expone una discusidn mäs completa del diseflo experimental, es importante indicar aqti que puede obtenerse mucha informaciön de un nümero relativamente pequeflo de experimentos. Supdngase que se cree que siete factores experimentales (A-G) podrian afectar a los resultados de un anälisis. Estos factores tienen que ser probados con (a1 menos) dos valores, denominados niveles, para ver si son realmente significativos. Asi, si se pensd que la temperatura afectaba al resultado, se deben realizar experimentos preliminares a dos temperaturas (niveles) y comparar los resultados. De rnartera similar, si la pureza de los reactivos puede ser importattte, se deben realizar experimentos con lotes de reactivos de alta y baja prreza. Entonces podrfa pensarse que serän necesarios 27 experimentos preliminares para cubrir todas las combinaciones posibles de siete factores a dos niveles. Sin embargo, en Ia präcttca sölo ocho experimentos propotctonarän informaciönimportante. Los dos niveles de los factores se denominan + y - , y \a Tabla 4.4 muestra cdmo estos niveles estän situados en los ocho experimentos, cuyos resultados se denominan y1, Uz, ..., Ue.El efecto de alterar cada uno de los factores d.e su nivel alto a su nivel bajo se calcula fäcilmente. Asi, el efecto de cambiar B de -f a - viene dado pot (Ut * Uz * Us * U)la - (U, -r U+ i Ur t Us)la. Cuando las siete diferencias de los factores (A-G) se hayan calculado en su totalidad de este modo, es fäci1 identificar cualquier factor que tenga un efecto preocupante en los resultados. Se puede demostrar que cualquier diferencia que sea mäs de dos veces la desviaciön eständar de medidas repetidas es significativa y debe estudiarse posteriormente. Este simple conjunto de experimentos, töcnicamente conocido como diseflo factorial incompleto, tiene la desventaja que no se pueden detectar las interacciones entre los factores. Este aspecto se analizarä en el Capit.ulo 7.
Tabla
4.4. Ensayo de entereza, resistencia o robustez para siete factores.
Expenmento
Resu/tado
97
t-
o o
ei-
oo ooo
)/t
lz )/s )/q
o a
)/s
T
J/a
lt
)/a
En los riltimos afr.os corporaciones internacionales se han movilizado con vistas a un acuerdo acerca de cömo deben reaLizarse los EC. '{1 menos B laboratorios (k> 8) deben estar involucrados. Ya que 1a precisiön de un m6todo depende normalmente de la concentraciln de analito, deberia aplicarse con al menos 5 niveles diferentes de analito en la misma matriz de la muestra con medidas duplicadas para cada nivel (n : 2). Un requerimiento decisivo de un EC es que se debefia distinguir ettre la repetibilidad de la desviacidn eständar, s,,yla reproducibilidad de la desviaciön eständar, sR.A cada nivel de analito 6stas estän relacionadas por la ecuacidn:
si:
s?
+
s?
(+.rs)
donde sf es lavartanza dehidaa 1as diferencias interlaboratorios, eü€ rcflejan diferentes grados de sesgo en diferentes laboratorios. Tdngase en cuenta que en este contexto particular,la reptoducibilidad se refiere a errores que surgen en diferentes laboratorios y equipamientos, pero uttlizando el mismo m6todo analftico: 6sta es una definiciön mäs restringida de reproducibilidad que Ia utilizada en otros casos. Como se vio en la Seccidn 4.3, ANOVA de un factor puede utilizarse (con cälculos distintos a cada nivel de concenffaciön
uttlizada en e1 EC) para separar las fuentes de variaciln de la ectaciln (+.tg). Sin embargo, el uso adecuado de la ecuaciln involucra dos supuesros: (1) que a cada nivel de concentracilnlamedia obtenida en diferentes laboratorios est6 distribuida normalmente; y (2) que a cada concentraciön sea igual la repetitividad de la varianza entre laboratorios. Ambos supuestos son probados utiTizando m6todos eständar antes de comenzat cotT los cälculos ANOVA. Bn la präctica el segundo supuesto, el de la homogeneidad de la varianza, se pruebaprimero uttlizando el mdtodo de Cochran. Estrictamente hablando, este contraste se disefla para detectar varianzas andmal as er:- vez de probar la homogeneidad de la varianza como un conjunto, sin embargo otros mdtodos mäs rigurosos para el riltimo propösito son mäs complejos. El contraste de Cochran calcula C comparatdo e1 rango mayor (es decir, la diferencia entre los dos resultados de un mismo laboratorio) con la suma de dichos rangos. (Si n > 2 se comparan varianzas ett yez de rangos), pero aqui
o ooo a 9J
5
qJ
() oJ a
ü 9B
se supone que cada laboratorio participante hace sölo dos medidas
a
cada
nivel):
rrl U) g)
oa
C-
()
w?o,u*
L*? j
(+.r+)
Cu
'.o I
o o 5 o)
Eo Hl
g)
p
C ;J
o o o T
EL
()
g)
j
toma valores de 7 ak, elnimero de laboratorios participantes. E1 valor de C obtenido se compara con los valores criticos de 1a Tabla A.15, y la hipötesis nula, es decir, se rechaza que la varianza mäs Srande no sea un valor anömalo, si el valor critico es mayor que el valor adecuado de k. Cuando se rechaza 1a hipötesis nula, se descartan los resultados procedentes del laboratorio en cuestidn. Se contrasta entonces el primer supuesto utllizando el contraste de Grubbs (Secciön 3.7) el cual se aplica en primer lugar como un contraste simple de valores anömalos, y entonces (puesto que cada laboratorio tealiza rnedidas por duplicado) en forma modificada como un contraste por parejas de valores anömalos. En ambos casos todos los resultados de los laboratorios que producen resultados anömalos son de nuevo excluidos de1 ensayo, a no ser que esto dd lugar a pördtdas de demasiados datos. Cuando se completan estos test de valores anömalos, se puede proceder con los cälculos ANOVA como enla Seccidn 4.3. En muchas circunstancias no es posible llevar a cabo un EC completo donde
como se describiö anteriormente, por ejemplo, cuando los materiales de prueha no est6n disponibles en el rango de concentraciones adecuado. En iales casos se pued.e ,r.ut un sistem a mäs simple. Bste es e1 mdtodo de Youden de pares de parejas o de las dos muestras, en el que a cada laboratorio participante se Le envian dos materiales de composicifn simil.ar, X e Y, y se les solicita que realicen una determinaciön de cada üno. Los resultados se representan como se muestra erL 1a Figura 4.10, representando cada punto como un par de resultados de un rinico laboratorio. Tambidn se determinan los valorei medios para 1os dos materiales, X e y, y tt dibujan lineas hori-
(s
o o
-
Muestra X
Figura
4.10.
Una representaciön gräfica de Youden para dos muestras.
zontales y verticales a travds de1 punto (X, Y), este punto divide e1 diagrarna en cuatro cuadrantes. Este diagrama permite evaluar la existencia en .1 .rrsayo de errores aleatorios y sesgo. Si sölo existen errores aleatorios, las determinaciones de X e Y pueden dar resultados que son a 7a vez demasiado altos, alavez demasiado bajos, X alto e Ybajo, o X bajo e y alto. Estos cuatro resultados podrian ser aproximadamente iguales, y el nrimero de puntos en cada uno de los cuadrantes seria aproximadamente igual. Sin embargo, si existen errores sistemäticos en el laboratorio, es probable que sus resultados para X e Y sean altos, o bajos. Asi, si los errores sistemäticos predominan, muchos de los puntos estarän en los cuadrantes del diagrama superior derecho e inferior izquierdo. Este es de hecho el resultado obtenido en muchos casos. En el caso imposible de ausenciade errores aleatorios, todos los puntos deherian caer sobre la diagonal de 45o con los ejes de1 diagrama, de marTeta que cuando en 7a präctica tales errores estän presentes, la distancia de la perpendicular de un punto desde esa linea proporciona una medida del error aleatorio de1 laboratorio. Ademäs, la distancia de 1a intersecci6n de la perpendicular con 1a linea de 45o al punto (X, l) mide el error sistemätico del laboratorio. Esta sencilla aproximaciön a los ensayos de colaboraciin es por tanto aapaz de proporcionar de forma sencilla una buena cantidad de informaciön. La aproximacidn de Youden tiene la ventaj a adicional de que los laboratorios participantes no tienden a suprimir una o mäs determinaciones repetidas, pudidndose estudiar muchos materiales sin considerar un gran nümero de experimentos. Los diagramas de Youden proporcionan una buena cantidad de inforrnaci6n accesible de manera inmediatapero todavia se necesitanmötodos de cälculo de varianzas sä y sl. nt siguiente ejemplo muestra cömo se puede hacer esto de forma sencilla.
ffi.r *s.s
äl.n as"f
.äs.$ ffi.$
,ä1"S' 2S.S.
3$,4
..96.*.'
gg
r
o)
o 91-
oCt) ooo o a o oog) a o T
EL E!: o
s) (n
r1 100
rfl a 9) o(t
o
gi$tsm*tirü. El mwp errsr Buede incruir ur' errff en aquet r*surtada de *äbsratsris püra ta m{}esl'a sistsmatisa se i*durrä pres*mibfemente
p*r cada rabaratorin para
tra
ryuptrr
.f
XLaditer*nc}a#i:x*y}tendrdpcrtantoeHmlnadngsleerrcg,dgmgnefaqn*dhterme s$timaslön de los srr$r€s aleatffie o de vat* dB tos valeres do # pmiprcisnäfä* Enä prcpmcicna una asuwrularse para {*r f; Try* vsftabllid*d dida_ $imitarments, La variama w+stim* pol: estimacian m h variacion'gton* de los re$ulta$'
Ä-rdfu*
frf x{ü,i
o)
&.- 2{n* 1}
'o o o
{4.r$i
F7
se e*tima por: y le vadanza globcl, S* *+Ul*a a tcdas I*s tu*ntes de enor,
:l
2i
Fl
o rJ CD
>l
0)
o !] o 9J o 9)
o 9)
2{P-
t4.tsi 1}
un.ä en el denemlsr*s*r- rss aö lustlfi0n Nöte*e qu* "by ceda una de +släs ecuasiorrcs incluye resutrt*{M'q$e $e fffitä;l Tüa*tae"e*tlrnaclc*es de la* enorei e* #s *erle$ & pbtqu* 6H sna y;uh;* ri pV fr**pe**osmente. Los re*ult*dos de ese äns4p Preds €xp{Psarss tabla como s$uo:
I
2*.7 $5.r *s.ü 23,8 gs'$ 2*"t 22" 24"1 *3$ ee-o **-A t:5 S-1
X Y
1,S 2-1 6,*,1 4$.* 4fi,1 4$J 41'#
fr T ,
*1'S 2fi'1
2S$
'**'1
2fi
44"1
44,ü
s1.s
*6,5 '
25.6
ü-s s2,t
21"4
*5$
.*s.s 4S,4
para d*mosrar $J* F'* 0'ä44 } tercer* y cufirta $tas de la tabla pr1+cur r$i{irersc de gl*bulv Ia Tfwlä* F* 4s.ss. t-u* *cu*oro-r'** t+r*iy i4jsi nrr€$tran rye lg v*rianua Pueden qer ccnp.*ra&s cor** & m* ' las rnedides mn qg.säliäy ti.ggän äm**tio**r*. 0-SS}' *tfu* tlva{or ü.g?. ä*,OUU{"= dan& €t*ofttrastä 4 utithando tusrbre *r pou* ser d*his* *i srrarw aleatorio*, EI ds rs*sra qu* ra *J,ia*m*-*ntr* hnsatoqtss *mp**U &bid* # sess*, ,ts, vje'ne aq*f dadc por:
t*
F-
#n:2#t+
a2,
se esfi"d]f,n' dcs ]rlrsdfras' [i*te,$e de nuevo la apriciön del ä en la Ecusciön t444,por$]€ es ie'f]n}ä. !9 .T**h de adae'h* r**did*s'*e **i}*o'Sn de -geeviuqtrm'Sändar Es {äcil calcular qu* x 'es
*
ä
4
re'l*llva '{tSS $"?$S}1 24.6S5, ge r**rrera qu* la pen 9fi relacio*r de la *$rfipda.@ rkitry.tu 21.4Vqk.F*te prece eüf rffi o*loi *uog#" a e*t* *tvs* & ffine*11ryeifu1 Me4a prcdepirfa $n vätür ingüso mäs ahs ds üä. err el g**esm!+ntc #e hmm* cwr$t*r rym ta* p*siHes var*r*s *r*rn*rou rro.*e eüilä'ü*€ran del l#r4tario't n* youden, de manera ä-Jli"p-ia'***** de rephazs de l0€. rmultadoe
4$,ffi1ä g4.sE5
*
procpeia
4.12. Incertidumbre se encontraCapitulo 1 se aprendiö que 1os procedimientos analiticos los riltimos rän afectados tanto pol effoles aleatärios como pol se-s$o.'-En analiticos ha ido reconociendo afr.os un nrimero cada vez rnayor de quimicos
En
e1
la importancia de proporcionar para cada anälisis un rinico nümero que des- 1O1 qlba su efecto combinado. La incertidumbre de un resultado es un pafimetro que describe un intervalo dentro del cual se espera que se encuentre t: la cantidad medida, teniendo en cuenta todas las fuentäs de ärror. El concepto se encuentra rrruy asentado en las medidas fisicas. Su valor en 1a quimica 3 g analitica resulta tambiln innegable, aunque ciertas preguntas y controversias + permanecen acerca de la facilidad de su interpretaciln por parte de organis- ä mos priblicos, asociaciones profesionales y el priblico profano, asf como sobre * los mejores m6todos para calcularlo . Para expresar la incertidumbre se em- : plean dos sfmbolos. La incertidumbre eständar (w) expresa el concepto co- E mo una desviacidn eständar. La incertidumbre expandida (ff) define un 3 intervalo que abarca una fracciln grande de valores dentro de 1os cuales cae- & räla cantidad que se estä midiendo y se obtiene multiplicando u por un fac- E tor de cobertur a, l fs. Este valor critico es mayor eüa lto, asegurando de este modo que el fabricante se expone sö1o a un riesgo pequeflo de rechazar un lote satisfactorio.
A1 mismo tiempo el cliente desea minimizar el riesgo de aceptar un lote 105 con un nivel medio de impureza superior a pre. Esto se puede lograr fijando un nivel de calidad de tolerancia (XCf) acordado, Fr, que tengaunape- f quefla probabilidad de aceptaciln. El objetivo del muestreo de aceptaciön es ; que el valor critico is minimice el riesgo tanto para el cliente como para e7 g fabricante. ,.'A.1 mismo tiempo se desea asegurar que n no sea mäs grande de ß 1o necesario. Esto se puede conseguir uttlizando las propiedades de 1a distri- obuciön en el muestreo de la media, dado qrte o es conocida. & Sup6ngase que el fabricante acepta un riesgo de1 5 o/o de rechazar un lote öi del producto quimico que de hecho sea satisfactorio, es decir, un lote para el ? cual i ) io, incluso aunque lt: l;o. Entonces se puede escribir: i
o
o-
a o 5 o Cl)
: trco - Ltd llo lJ n) /-
\ tl
,
f-.l
a
^a I.b+
(+.rs)
H.
o
El valor 1.64 se puede encontrar en 1a tabla A.2 (ver tambiönla Secciön 2.2). a Supdngase tambidn que el cliente estä preparado para aceptar un riesgo del 10 7o de aceptar un lote con la impureza en e1 NCT. Entonces se puede escribir de manera similar:
(4.1e)
Puesto que enlaprictica1os valores de lro y Fr se habrän acordado d.e antemano, las ecuaciones (+.tS) V (+.f g) proporciorTar: ecttaciones simultäneas que se pueden resolver pata obtener n y io.
ri 106
rn a o)
R a. ö' TD
'o C :1
o o FJ
Bibliografia in Lawrt, R. E., Thompsofl, M. and Walker, R. F- 1997. Proficiencg, Testing Analytical Cheäisffy, Royal Society of Chemistry, London' (Un claro y actuilizado tratado de esquemas ES') Massart, D. L., Vande$inste, B. G. M., Buydens, L. M. C., de Jong, s., Lewi, p. J. and Smeyers-Verbeke, J. 1997. Hand.bool (R cn"drado ajustado), usualmenle abreviado pero a riltimos estadisticos son proporcionados por Excel como decimales' sigue: como menudo se expres a1l eflsu |u$ar como porcentajes' Se definen
i
rl
:l l
Rz
:
SC debid
a alaregresiön/SC total -
;il dili; äilL: *1f r
[iti gixi
R'2
:1 -
1
-
(SC residualiSC
(CM residual/CM total)
total)
(5'25)
(s.26)
F En caso del grafico de una linea recta, R2 es igual a rz, er cuadrado ^el de1 coeficiente de correlaciön, es decir el cuadrado de *mwltipie R,. Las aplica_ ciones de R2 y R'2 a problemas de ajuste de curvas serän analizad,as mäs ade-
143
lante.
(!r
o
5.13.
o-
Los mötodos de regresi6n no lineal.
a o
Introducci6n
En muchos mdtodos de anälisis instrumental la respuesta del instrumento es proporcional a la concentraciln de analito en intervalos de concentraciön sustanciales. Los cälculos simplificados estimulan a los analistas a tomar precauciones experimentales para lograr tal linealidad. Ejemplos de tales precauciones incluyen tanto el control de Ia anchurade 1as Hnäas de emisiöi de una lämpara de cätodo hueco en espectrometria de absorciön atömica, como el tamaflo y posicidn del portamuestras pata minimizar 1os efectos de fi1tro interno en espectrofluorimetria molecular. Sin embar{o, muchos m6todos analiticos (por ejemplo, inmunoensayos y ensayos similares de uni6n competitiva competitive binding) producen gräfr,cas de caTlbrado que son intrinsecamente curvas. Es particularmente habitual la situaciön en que 1a gräfica de calibrado es lineal (o aproximadamente lineal) a baja, .onä.rrtraciones de analito, cutvändose a niveles de analito mäs grandes. Cuando se obtienen gräficas de calibrado curvas, se necesitan respuestas a las preguntas formuladas en la Seccidn 5.2, si bien las preguntas plantearänptäftäus estadisticos mucho mäs interesantes que en e1 caso de experimentos de callbraciön iineal. La primera pre$unta a examen es: lcömo se detectala cuwatura en un $täfico de caTlbrado? Esto es, ;cömo se distingue entre un gräfico que se ajusta mejor a unalinea recta y otro que se ajusta mejor u uÄ^ cur a poco pronunciada? Puesto que el grado de cuwatura puede ser pequeflo, y/o suced" sölo en parte del gräfico, 6sta no es una preSunta direcia.^Ade-äs, a pesar del amplio uso de1 coeficiente de correliciOn momento-producto '(r)'paia contrastar la bondad del ajuste de gräficas lineales ad,ecuaäas, es de po.d rulor al contrastar la curvatura: se ha visto (Secciön 5.3) que las lineas con una curvatura obvia pueden incluso dar valores de r muy elevados. Naturalmente un analista esperaria que algin contraste de curvatura se pudiera aplicar con bastante facilidad en el trabajo cotidiano sin cälculos exiensos. Aigunos de tales contrastes existen y estän basados en la utllizaciön de los resiJuos de y de los gräficos de calibrado. como se ha visto (secci6n 5.5) un residuo d" u, ui - ui, representa la di_ fercncia entre un valor experimental de U y el rruloi"catiulad,ä y apartir d,e Ia tecta de regresiln para el mismo valor-dÄ x. Si es apropiado än gtäfico de calibrado lineal, y si los errores aleatorios en los valores äe y estän distribuidos normalmente, 1os residuos en si mismos deberian estaräistribuidos normalmente en torno al valor cero. Si esto no es cierto en la präctica, entonces se debe sospechar que 7a recta de regresiön ajustada no es la corcecta. En el ejemplo resuelto en 1a Secciön 5.5, los residuos y obtenid.os fueron + 0.5g, -0.38, -0.24, -0.50, +0.s4, +0.18 y +0.02. Estos valores suman cero (teniendo en cuenta los posibles errores de redondeo, esto debe ser siempre
c) OJ
oFl o o
o.
o 5 o t!r (t a (t) r-+
!1
o o 5
o (c hl o a
O\
T \<
o 5
o
F-
c)
Qr
f
t6 144
rn a
o o0
o o)
'O
o o
B g)
'iJ o) Fl g)
'.o
o gJ o) E
9l
o g)
en torno a 0' cierto), y aproxim adamente estän distribuidos simdtricamente un nümero pequeflo Aunque ,, i*posible que sea cierto, especialmente con d'istribuidos, ciertamente no de puntos, que .ro, ,.Jid.ros estdn normalmente hay evidencia pata existe evidencia en contr a et7 este caso, es decif' no ha comentad'o antemantener un grflfi.co de calibrado no lineal. Como se amplia inforriormente Minitab y otros paquetes estadisticos ploporcio-nan. y distribuciön de los macifin,incluyendo salidas $räficas, sobre los tamafros residuos. de los signos de los resiSe sugiere una segunda prueba de 1a inspecciön lar$o del gri.flco de duos anteriormente äxpurrtor. Si nos traslädamos a 1o residuos pocalibrado, es d.ecir, ..rurrdo aumenta Jc' Se espetarä que existan ajustados a u11^a sitivos y negativos en orden aleatorio si los datos estän bien serie de linearecta. Si, al contrario, se intenta ajustar unalinearecta aurta de los resipuntos que caen realmente sobre una curva, entonces los signos cirän swcesiones de duos ya no tendrän un ord.en aleatorio, sino que se produ expuestos valoräs positivos y ne$at'os. Examinando d,e nuevo los residuos * - +++' anteriormente se encuentr a que e1 orden de los signos es la necesidad Paracontrastar si estas sucesiones de residuos * y - indican la probabilidad de de una lineade re$resiön no lineal, es necesario conocer se desque ta1 ordenamieäto pudiera ocunir por casualidad. Tales cälculos nümero de criben en el pröximo capitulo. Desafoitunad'amettte el pequeflo puntos hace muy probable que 6stas y otras secuencias pudieran realmente extrai$a ocurrir po, .uroälidad, de Äaneru q* cualquier conclusiön que se de re$resiön lidebe ser tratada con precatciln. Lä elecciön entre mdtodos las tdcneales y no lineales ,. 11rrru a cabo probablemente mejor uttlizando nicas dL ajuste de curvas esbozadas en la pröxima secciön. parte En la situacifn en que un gräftco de calibrado sea lineal sobre una en ot u, resulta de Sran importancia tratat de esde su intervalo y "u*ido Aproximaciotablecer el intervalo sobre e1 que se pued,e asumir linealidad. nes posibles a este problema sä esbozan en el siguiente ejemplo'
&
fluoresmreia Ir*ensldäd tonceirruaclsn; pg
g
ar*g$ä* ds fir*
üü;;,rH
ü.1
rnl*t, !
eta*
8-0 2
19.7
4
2e# sI.s
6S
$3.8
.1*
mils$tra $Ie.!a parte deFgr#rco eercg dsi ori$*t1 ssAd*pt4 b*$tfintp '
pend€'de' sriwn.p1oxlfüu iit* toä'*n un$'ot#*dn. en, .p*r$u 3;fftl-3,_una öri s'ttsJ}tä t0 mlTT
terf*ndc dt F$ nrcxirna a filraso' r* fir*orssee*dü de'la s$luc**p p$nAndad de q$e S dssy *r*rämernf* üntsrüor d la **perad*- €ü{isB.älg*na ;;.rr;haft- hrnbt&r *t bs**ü#nr de s pg mt*'. Fdrn*q*ner*e w.Firtic*n lw m& rirlgd.1116 pcm*rrrd*) 4 tsdf$ lofi dfttss. ü* laaBlbnci&t de ;e-,6;'U
bd;.ä äffiäü;]id;fi#d j*d}i$*
y kdm.de hs.$*sdcfie$ 5.i y'5,a. *u'*ümtrer.' k$ fssttltffi€;*1.!.*nf' 0* S"4ä .$d sn *uär*a que ef .try flo.d* f $ed* str'eng4fr#Fs- ärnr hg.^lfgttt..l*r re+lsutx*g{f.i-s *-P Sls.s u$* #f fuid{ian*ry"*yo {tguq +B.ff14y *,3.rt4htsft . *tlmaae16*sufisre' $sri;1,ä5?, -s-$14,;$iäg,;+'i,grt, que
äö.ffi**#"d-
t*ti*d
*rt rwusrpt*s d* rm ffi+ldupqeugfere ;üI$hi'g* ls* msidtlss dos Eneff*:.-.; ,',:"''...." . d 6fti*m v*oi Ce d täbh estt,prpMbbrmütg.t$erg e[
#
ä*l
iffiffi
.
.
.
..
F"
bs sc*pechas
ap*icanda }an eclachnes de regresn#t linonl ssfamente a S,SS$ y Ü,S$ü" La pen*,1Sü" los c$rmo pim+ras p{Iilt*$- Esta proparciona y valores esperados p*rä Ia dsilte la +rdmda en el origen estdn rnusfn mäs cerqa a lm parte del gnäfico mäs proxim* al *rigen, y el valor de res meycr $K *n el prir*er$*lstl$, L** rmiduos de I$$ primero* c*nco puntas de e*ta segr*nda esuscidrr de r*Ee*ldn *an S, *s* de la ncgundq e*1s.0.ä4. ü, *0.e, +S.4 y *A2, üorl una surna.de euadrado* ecuacldn de reEesidn mlleetra que Ia fiuorescencia esperada de un patrfu de 10 frg ffil*' es 39.6, es de*[r, el resid*a es *S"0" El us* def *ontrasle f{üapftt$* S} mostrari* que eete *ltimo residuo ec significatiuamente rn$s grande gue etr prcme$o d* las otras resld!, s:'elternatFvenrente se podrüa eplicer un eontra*e {$eccidn $-7} para dqn*astr*r q$e e$ üil *dats andmalo" entre los residrlos {vdase 1*r*bl6n la $ecci#t 5,15 rns$ ad*knie}. f;n e*b eiemplc, dicFrcs cälculcs son tedio$ss: *f en*rm+ rsriduo dol uttimQ pünts, unid* a lcs re6'&lo$ muy h*i*s de tcs *tros pincc puntos y a lft muy raducfda surfla de Ios ruadra*ap, *orltrtrrfia que el intcrualo tlnes{ del m€todo no llega mäu allä ds 1S trg r#*r. t{ah{ends esffiloqids que el ültimo puntc puede exctuirse del irrtervato de linsalldad, se puede repetir el poeeco pdra estudiar el punto tS, 31,$1. $e puede reafizar pdo sslcülands [* repta de regrwi&i solo para los cuatro primeros puntos de la tabla, co*t los resultädü$ fi, S.* 4,ffi, $,909S, Elval*r delcs*ficisnle de corpläcirirr *ugier* quc $$tä }fn@ se aju*ta'ba*tanls bien.ä Iss Frrrtü$ dg la lfnea ant+risr, en la qu+ *e usabffi *irrco puntoo. Ls* rF$d$*s psra ests lersffi Se cn*tirmah
ä*
**
145
r*
&
tl
€*
r*
cälcula son +0.1, $, *0,S, y *S,ä, rofi unft *r.tma d+ cu*drados de S.14" 0orr sg* lf*s* I de +alibrado el residuo,yparä la soluciün de I pg ml* ee - S.5; e$s v*ls# +s nra* grar$e qua los otroe residuos pero probnhlern€n{s nü s* *na castldad signikativa- De esb modo se puede co*cluir que €s razo*abtemente segurc lnclüir el punta {S, St,S} dsfiF* &l intervalo llneel del mdtodo, Al t*mar una decisi&r mar$nal de este .tp'.el quftxlcc andltico tendrä *n cuent* [a ex*+titud requerida de sus resulkdos, y el.valor r€dt;e$do de w rn$tsds pare el qtle el intervalo ds sälibraciÖn es rnuy co*to. Los cdlc#e* decsrit*$ ant*dEry*e*tp ss
re$uftsn *n Ia FFgura 5"14.
(Sr
o oo a ao o EL
d o o o\ 5 o 5 0)
f
Q)r
a a D
V)
r+ hl
I o T
+ o o V)
(CI Frl
o\
5
\<
o o o F' o o\ r-l
.q
cq) C)
a q)
o
tr
15 10
0r 0
Concentraciön, pg ml-l
Figura 5.14. Regresiön no lineal: identificaciön del intervalo de linealidad. Se usan los datos del Ejemplo 5.13,1; se muestran las lineas de regresiön lineal no ponderadas a trav6s de todos los puntos a travös de sölo los cinco primeros puntos (- - - - -), y a travÖs de sölo los cuatro primeros puntos (.. .'.).
(-),
3T 146 rrJ
a o o(n
*
o g) '.o g
:I
o r-F Cl)
E0) F{
o ,.o
C
T
o D o 5
gL
IJnavez que se ha tomado la decisiön de que una serie de puntos de calibrado no se ajustan satisfactoriamente avrtalinearecta, e1 analista puede jugat otra carta antes de resignarse a 1os complejos cälculos de regresidn no lineal. Se pueden transformar 1os datos de manera que una reLacidn no lineal carnbie a otra lineal. Tales transformaciones se aplican regularmente a los resultados de ciertos mdtodos analfticos. Por ejemplo, 1os paquetes informäticos modernos para la interpretaciln de datos de inmunoensayos ofrecen frecuentemente una opciön de transformaciones: mdtodos comünmente utt'lizados incluyen representar Io8 U ylolog x efi vez de U y x, o el uso de funciones logit (1ogit x:7nlxl(t - x)]). Es importante sefralar que las transformaciones pueden afectar tambiln ala naturaleza de 1os errores en diferentes puntos de las representaciones del calibrado. Supön$ase, por ejemplo, que en un conjunto de datos de la forma U : pxq,las magnitudes de los errores aleatorios en U sor- independientes de x. Cualquier transformaciln de los datos en forma lineal al tomar logaritmos generarä datos cuyos errores en 1o$ U n0 sorr independientes de 1og x. En este y en cualquier otro caso donde sea conocida la forma esperada de 1a ecuaciön a partfu de consideraciones teöricas o de experiencia de mucho tiempo, es posible aplicat ecuaciones de re{resiin pondei"adas (Secciön 5.10) a los datos transformados. Se puede demostrar que, si los datos de 1a forma general U : f (x) se transformatT en la ecuaciön lineal Y : BX + A, el factor de ponderaci6n, w,utlTizado en las Ecuaciones (5.14)(5.17) se obtiene de la relaciln
o
L:
1'l). "-
9)
| 1 l'
<
(s.27)
ld.Y;ld.y1)
Des$raciadamente, no existen muchos casos en quimica analitica en que se conozca con certeza \a forma matemätica exacta de una ectaciön de regresi6n no lineal (v6ase mas adelante), de modo que esta aproximaci6n es de
valor restringido. Tambidn deberfa considerarse que, a diferencia de la situaciön descrita en el pärrafo anterior, los resultados se pueden transformar pata {enerar datos que pueden ser tratados por mdtodos no ponderad.os. Datos de la forma U : bx, con errores en la direcciln U claramente dependientes de x a veces estän sujetos a transformaciones log-1og: los errores en lo$ U tienen entonces ll;navariaciön sensiblemente menor con log x, de mattera que los datos transformados pueden ser estudiados por ecuaciones de regresiön no ponderadas.
5.!4.
El ajuste de curvas
A la vista de las dificultades que surgen
transfotrnar los datos,
y
de La creciente facilidad con que pueden calcularse las curvas para ajustar una serie de puntos de calibraci6n,los mdtodos de regresiön curvilinea son en la actaalidad relativamente comunes enla quimica analitica. Es muy importante sefr.alar que 1as curvas de calibrado encontradas en la präctica resultan a menudo de la superposiciön de dos o mäs fenlmenos fisicos o quimicos. Asi, en espectrometria de fluorescencia molecular, representaciones de la sefral vs. concentraciön pueden ser aproximadamente lineales en disoluciones muy diluidas, pero a altas concentraciones exhibirän curvatura creciente (negatia1
F
tipo de öptica utllizada (efectos de fi1tro interno), (b) interacciones moleculares (por ejemplo, atenuaciln, formacidn de escimeros), y (c) ala carencia de supuestos algebraicos sobre los que se pronostique va) debida a: (a)
e1
una representaciön lineal. Los efectos (a)-(c) son independientes entre si, de mafiera que en la präctica pueden apatecer curvas de diferente forma. Este ejemplo muestra porqu6 1as curvas de calibrado con forma conocida y pronostiäable se encuentran raravez en el trabajo analitico (v6ase 1o anterior). Asi pues, el analista a priori tiene escasa nocidn sobre cuäl de 1os muchos tipos de ecuaciones que generanrepresentaciones en forma de curva deberia utilizarse para ajustar en un caso particular los datos de calibracifn. En 1a 'präctica, mucha de la estrategia mäs comrin consiste^en ajustar una curva ir. r." un polinomio ertx) es decir, U: &*bx+ cxz + dx3 *... Entonces los problemas matemäticos a resolver son: (i) ;cuäntos tdrminos deben incluirse en e1 polinomi o?, y (ii) aqud valores deben asignarse a los coeficientes a, b, etc.? Los paquetes de software informätico que abordan estos problemas son normalmente iterativos: en primer lugar ajustan una lfnea recta a los datos, luego una curv a atadrätica, despuds una crtwa oübica, y asi sucesivamente, presentando al usuario la informactln necesaria para decidir cual de estas ecuaciones es 1a mäs adecuada. En 1a präctica,las ecuaciones ctadtäti' cas o cübicas se ajustan a menudo satisfactoriamente a los datos: polinomios con muchos tdrminos carecen casi siempre de significado fisico y no mejoran significativamente los resultados analiticos. En cualquier caso, si una representaciön tiene n puntos de calibrado, el polinomio mayor permitido es el de orden n - I. Para decidir si (por ejemplo) una cuwa cuadrättca o cribica es la que mejor se ajusta a:urr conjunto de puntos de calibracifn, se pueden utilizar los mdtodos ANOVA, introducidos en 1a Secciön 5.72. Los pro$ramas de ANOVA Seneranvalores de R2, el coeficiente de determinacidn. La Ecuaci6n (5.25) muestra que, cuando se mejora el ajuste de minimos cuadrados (o linea r ecta) a los puntos de los datos, el valor de R2 se aprod.e una "oiuu ximarä a 1 (o el 100o/o). Podriaparecer que bastarta con solo calcular los valores de R2 para ecuaciones lineales, cuadräticas, cribicas, etc., finalizando 1a brisqueda cuando no se aumente el valor de R2. Desgraciadamente, la incorporaciön de otro tdrmino al polinomio hace que aumente siempre el valor de R2, aunque sölo sea en cantida{ pequefla. Entonces los pro$ramas de ANOVA proporcionan valores de R'2 (.,R2 ajustadou) (Ecuaci6n 5.26) la cual utlliza.uädtädos medios (CM) en lugar de sumas de cuadrados. El uso de R'2 tiene en cuenta que el nrimero de grados de libertad de los residuos en la regresiön polinömica (dado por ln - k - 1] donde le es el nümero de t6tminoi de la ecuaciön de regresiön que contiene una funciön de x) cambia cuando cambia el orden de1 polinömio. Como se muestra en el siguiente ejemplo, R'2 es siempre mäs pequeflo que R2.
147
? F>
($r
o oo a oo C)
g)
o I g)
o o\ 5 o
f
0)
T pr
a a p a Fl
I
ä o T
+ FJ
o (o o @ o\ D
c)
o ht FJ o 0) o Qr 5
so \^
E #€ä$ E gäH
$F H,ä#$ $ ff$qü s s-s ä"$$$# ,NS tr' süS
ä
iF* {}} Ct
tu
:ESEss fiTtr$$H $q
F:$ss# "t
#ä$ EHq d$
äe*cäH E*€8tr; gFä
ä*'E ü 3:tr H R * 'äg
ä o (s lr'(I} c.) $ {
$; *
00
$ r
t]r
ö
gräaääsreHä#gä g f;3$ t'äeä äffis .+ öi t'j Sr öJ
sss.gHü
$üääe$ $ äl Eg'E t .SE ä Q to \ S
ägtäffiä$gäg äg $ p'HeFsstrEf*h*#ä ö c F'(} FF H ei "r?|
ääääH$ q
gsqgäHägääfritä '{ ässfrfäeF$*3ggC \ gägg;*$xeffisH;€ ä ä äfl $=I ä$ frü),b j rr ä,ää ESr +s H H c"tjd;lla
$
\l
I
q
ü? rq ü? rq rq rq ü? rq r *tl" 'dl F* CF (Y) {0 A-r öd {{} 'q TFFF(\I$I€\ltYJ O0 r
$ $#ää$ $ s g s# E EE {E ff s* iE *6eltE.s -
s,äHB€
:#tr
pü*
ä,ä$
ü5
fi'ä$g$
gä€HäHää#$eäg#
€# &* s fr"
,g
ääääcäH$€äägä
gt
H €Tä.F
ö*r1r o ö'gl
(\lqf,tf,)u)Öö!d.r\ö'(ö(\l ci r"i F- rtsts(}.l*I(\l*I['J -'rfi t* ci öi r{i r"l ci
g$;$xe ä$ äe$*
* fr'fi s ffi (aI s ff) ör ö Ct) tä tft
€
g
&
äägäEt ,rH SF H
ü
rif
g
fiH* sHs
Ndtese que el mlmero de gradoc de libertad para iaa fuente* de vartae*ün d+ Ia regrwk#t y residual ha* cambiado ahora de acusrdo con las reglas desffit*c antertorrrentq, ryrE+te ee ia va*aei6n total es naturalment* la misffia cotrno ffi l* primera tebtä AhlsvA, fißIi gs"87geÄgiranmä* Eata cilra ee considerasemer*te 0.99s72, es decir, üs2.2$/993.509 gg.044% y elvalcr #s e* Hrßhi6n mäs linpal, delgräfic* que obtsnido elvalsr de 0,$S8S$* *s dsCIir, 99.8*SoÄ Guando s* cdculan fos r+siduw ,g en (i t0,tü0/S$.$51iJ} *.+ + + + +. No hay nfu' sus signos {en orden oreciente de valores,,r} oon + guna ienderrcia nbvia aqui, asi qu$ por encinra de cualqLlier con*ideraci6n se debe preterk
ff
:
#
-
gr@
:
*
*
*
*
el ajust* cuadrätico a] lineal. Por üttirna se repiten lo* cäloutas parä qn *juste oubico. Aqui ta ecuacicn que meiar se *AO+O + 4.I7tx O.ISO/ + 0.Sü$5,f. El cneti0ient€ ülhiso es ffiIy p+ afusta s$ quefto, dsmaner* que resull* cuestlmabte siegta ecuaclön g$ ürt alu$tä *ignffimtivamente mejor que el $redrätics" El valor.* e$, inevitahlsmsnte, ligeram*nte mqs gpqque cl.de h purvä cuadrätiua {$$.S?9ol* en s*mparasi6n con 99.8?3"/o}, Fer$ el valor de frz es ligsra" rncnts inferi*rque el valor cuadrätka sn 99.S2?s6. El orden de lcs signor de los rs$iduot es el misrno gCIrn4 en el ajuste cuadr*tico, Ya que no hay nlngHna venkia efi in*luir t6rmlnqs inne*esarios, se puede aceptar que un eiuste cundrätico as satisfactorio en este caso' Cuando lgs scr,fficiane$ snterlcres se rfü|iegn pars sstirnär las csfii*r*trädffies eoneryon" diefiles a sefr*tes del instrurrrffrtc de S, 'lS y ä? unidadss, lo* resdta&* {v*lor*s're*
*
y:
unidades arbitrariasi som
o o (n oo o
gL
d Fl g)
C)
o\ 5
o 5 9)
EI
a (t,
Lfneäl
ü{.ffi*6{iüü
Ctibizü
j/-5
1.15
t"z8
127
o
!:
1fi
4.$$
4.51
4"SS
f=27
sst
8-81
LSä
Se senalö al comenzar estasecciön que las representaciones de calibrado no lineales son a menudo el resultado de 1a existencia de un nümero de fen6menos fisico-quimicos yf o matemäticos, de manera que es sensato suponer
que no pueden ..p.r"ir. funciones matemäticas sencillas que describan 1a iu*u de calibrado de forma satisfactoria. Parece por tanto lögico intentar ajustar los puntos a una cula,con varias secciones unidas cuya forma matämäUca pueda ser diferente. Esta es la aproximacidn utilizada con notable frecuenci-a et Ia actualida d a travls de 1a aplicaciön de funciones a trozos ..splines,,. Las *splines' cribicas son las mäs usadas en Ia präctica, es decir, 1a curva fina1 se construye con un conjunto de secciones unidas. Estas secciones deben format claramente una curva continua en sus uniones (,,nudos,), de manera que las dos primeras derivadas de cualquier curva en cualquier nudo deben ser iguales. Se han utilizado varios mdtodos para estiestas a11ar el nümero de nudos y 1as ecuaciones de 1as curvas que los unen: tdcnicas son demasiado avanzadas para considerarse detalladamente en este momento, pero muchos paquetes estadisticos comerciales pueden actualmente proporcionar tales opciones. La aproximaciön de las funciones de splin rr trä aplicado con 6xito a u.na variedad de m6todos analfticos tales .o*o la cromatografia, gas-lfquido, los inmunoensayos de competencia de
!
(Qr
fa x
Cor*o se esp+raha, las difere*cia* entre lfi$ csns€ntra$isnes ealc*fades de las s*ua$i$}e$ c*adrdthas y cubhn* aon ineignilicant€s, de manera qüe $6 utili:a la ecuncidn sil*drätiffi por *impticidad.
:
149
fFl-
ir
o)
o o a
co
o\ T
o o o g) o Qr 5
31
150 rrj a oJ oQ
o Cl)
,o F{
o o ;+ ct)
ligando y mdtodos similares basados en receptores, y la espectrometria de emisiön at6mica. Es legitimo preguntar, ert e1 caso de un Sräfico de calibrado cuya curyatura no sea demasiado severa, si se podria aceptar Ia idea de splin en su mäs simple acepciln, y dibujar \a cuwa como una serie de lfneas rectas uniendo puntos sucesivos. E1 mdtodo, por supuesto, no es totalmente riguroso, y no proporcionaria informaciön sobre 1a precisidn con que pueden determinarse los valores de x. Sin embargo, su valor como m6todo sencillo de anälisis inicial de datos (am) (v6ase el Capitulo 6) es adecuado para aplicarlo a los datos de1 ejemplo anterior. Este m6todo de interpolaciön lineal entre puntos sucesivos , pata valores de g de 5, 16 y 27, proporciona valores de x de 1.36, 4.50 y 8.65 unidades, respectivamente. La comparaciln de estos resultados, especialmente los dos riltimos, con los de Iatabla anterior muestra que serian completamente aceptables para muchos propösitos.
'ru Cu
o -o
C
o 9)
gJ
o C) 0J
5.15.
Datos an6malos en la regresiön
En esta secci6n se retoma un problerna ya arralizado en el Capitulo 3,\a apariciön de datos anömalos entre nuestras observaciones. Este tipo de resultados surgen inevitablemente en los experimentos de callbracifn, exactamente como aparecen en las medidas replicadas, pero resulta mäs complicado tratar con ellos en la estadisticadela regresiön. Una dificultad es que, aunque en un experimento de calibraciön se supone que los valores giindividuales son independientes unos de otros, 1os residuos (Ui - U) no son independientes unos de otros ya que su. suma es siempre cero. Por tanto, no resulta habitualmente aceptable tomar los residuos como si fueran un conjunto convencional de medidas repetidäs, y aplicar (por ejemplo) un contraste Q paru identificar cualquier observaciln anömala. (Si el nrimero de valores de Ui es grande, luna condiciön que no se encuentra por 1o general en el trabajo analftico, esta prohibiciön se puede fl.extbiTizar .) Bntonces, le6mo se identifican las observaciones anömalas en un experimento de calibraciln tipico? En primer fugar, se observa que, en los casos donde haya ocurrido un error obvio como un error de transcripciön o un funcionamiento deficiente de1 instrumento, resulta natural y permitido rechazar 1a medida resultante (y, si es posible, repetirla). Si hay medidas sospechosas pata 1as que no hay ninguna fuente de error obvia, se debe volver a un estudio de los residuos. Muchos programas de computadora que manejan datos de regresiön proporcionan rutinas de diagnöstico de los residuos (vdase 1o anterior). Algunas de 6stas son simples, incluyendo gräficos de los residuos frente a los valores yiindividuales (Figura 5.15). Dichos gräfi.cos se esperaria que mostraratT que, si se utilizase el modelo correcto de catibraciön, los residuos permanecerian aproximadamente uniformes en e1 tamaflo atrLedida que ctece yi, distnbuy6ndose normalmente alrededor de cero. La frgura tambiön ilustra casos donde los errores en la direcciön de U ctecerr corr Ui (Secciön 5.10), y donde se ha utiTizadola ecuaciön de regresiön equivocada (secciones 5.11 y 5.12). De marTera similar, se pueden representar 1os residuos de y frente al tiempo si se sospecha una deriva de1 instrumento o cual-
F 151
o\
o oo a o-
o o g)
C' Ft gJ
o o\
r
o J 9)
p
o)\
a (t)
Figura 5.15. Gräficos de residuos en el diagnöstico de la regresiön: (a) distribuciön satisfactoria de los residuos; (b) los residuos tienden a crecer a medida que crece 4 sugiriendo que seria adecuado un gräfico de regresiön ponderado; (c) los residuos muestran una tendencia, primero resultan ser negativos, luego pasan a travds de cero y, por ültimo, se hacen cada vez mäs positivos a medida que crece 4 sugiriendo que se deberfa representar una curva (diferente); y (d) un gräfico satisfactorio, excepto que podria ser un dato anömalo.
a C
o T -F o :i ht
quier otro efecto dependiente del tiempo. Estos gräficos revelan de manera muy claravalores sospechosos, pero no proporcionan criterios que se puedan utrlizar inmediatamente pata rechazarlos o aceptarlos. Ademäs, resultan de un valor limitado en muchos experimentos de quimica analitica, donde e1 nümero de puntos de calibrado es a menudo pequeflo. Para identificar posibles datos andmalos mediante programas de computadora se han utiTizado algunos criterios num6ricos simples. Algunos paquetes "resaltan, los puntos de calibrado donde el residuo de y es mäs de dos veces (o algrin otro mriltiplo) el valor de sr1*. Se han desarrollado varios mdtodos mäs avanzados, de los cuales el mejor conocido es la estimaciön para cada punto de la distancia de Cook, que se propuso por primera vez ert 7977. Este estadfstico se proporciona en diferentes programas estadisticos avanzados, aunque una comprensiön completa de su significado exige un conocimiento del älgebra matricial. La distancia de Cook es un ejemplo de una funci1n de influencia, es decir, mide el efecto que tendria sobre 1os coeficientes de regresiön a y b eI rechazar el citado punto de calibraciön. Por riltimo, se observa que, exactamente como ocurria en el tratamiento de los datos andmalos en las medidas replicadas, los mdtodos robustos y no paramltricos pueden resultar rnl;y efectivos al manejar datos anömalos en la regresiön: los m6todos robustos de regresiön se han hecho muy populares en los riltimos afr.os. Estos tdpicos se abordarän en e1 pröximo capitulo.
o (o o a
o. D
o o o o o
o\
f
\.to
152 Bibliografia rfl a o) oa r+ o o
Draper, N. R. and Smith, H. 1998 . Applied. Regression Analysls. 3rd Edn. Wiley, New York. (Un trabajo cläsico con extensa cobertura de muchos u.p.ätot de los problemas de la re$resiön y coneTaciön.)
c
Edwards. A. L. 1984. An Introdwction to Linear Regression and Correlation. Znd.Edn W. H. Freeman, New York. (Tratado escrito con claridad, con una buena introducci6n a\ 6l'gebra matricial.)
o o
Kleinbauffi, D. G., Kupper,L.L. and Muller, K. E. 1988. Applied' Regression Analysis and Other Mwltivariate Methods.2nd Edn. PSW-Kent, Boston. (Otro cläsico en su campo con un buen tratamiento de la diagnosis de 1a regresiön.)
Fl Cl)
E0)
FJ
Mark, H. 1991. Principles and Practice of Spectroscopic Calibration. Wiley, New York. (Una explicacidn clara de los principios. El fuerte dnfasis so-
o)
bre datos espectroscöpicos tiva.)
,.o
J c)
Noggle,
o o
IR-cercano no es una desventaja significa-
J. H. 1993. Practical. Cwrve-Fitting and Data Analysis. E1lis Hor-
wood-PTR Prentice Hal1, New Jersey. (Se proporcionan con este libro progtarnas y ficheros de datos, y todos los ejemplos son de quimica.)
o) o) r-t
o
de1
Orvis, Vf. J. 1996. Excel for Scientists and Engineers. Znd Edfr. Sybex, Alameda, California. (Uno de los numerosos libros que dan guias claras sobre el uso de Excel en cäIcu\os estadisticos.) 'W. and Cochran, W. G. 1989. Statistical Method.s. 8th Edn. Snedecor, G. Iowa State University, USA. (Aporta una excelente cantidad de procedimientos de regresiön y correlaciön.)
Ejercicios
1.
En un laboratorio provisto de equipamiento polaro$räfi,co se tomaron seis muestras de polvo a varias distancias del polarlgrafo y se determind e1 contenido de mercurio de cada muestra. Se obtuvieron los siguientes resultados.
7.4 3.8 7.5 10.2 77.7 15.0 Distancia al polardgrafo, m Concentraciln de mercurio, ng g-1 2.4 2.5 1.3 1.3 0.7 1.2 Examinar la posibilidad de que 1a contaminaciln por mercurio proceda del polar6grafo.
2.
La respuesta de un ensayo colorimdtrico para glucosa se controlö con 1a ayuda de soluciones patrln de glucosa. Determinar el coeficiente de corre\aciln a parttr de 1os siguientes datos, comentando el resultado. 10 B 6 4 2 Glucosa,mM 0 Absorbancia 0.002 0.150 0.294 0.434 0.570 0.704
F
3.
Se obtuvieron los siguientes resultados
al analizar un conjunto de solu- 153
ciones patrön de plata por espectrometria de absorciön at6mica.
Concentraciön,
ngml-l
o
<
5
Absorbancia 0.003 0.727
10 15 zo
zs
(!r 30
0.25t 0.390 0.498 0.62s 0.76s
Determin ar \a pendiente y orden ada en el origen de la linea de calibrado, y sus limites de conftanza. 4.
rJtlTizand,o los datäs d,el ejercicio 3, estimar los limites de confi anzapara las concentraciones de plat a er7: (a) una muestra que proporciona una
absorbancia de 0.456 en una ünica determin aciön, y (b) una muestra dando valores de absorbancia de 0.308, 0.314, o.JLz y 0.312 en cuatro anälisis distintos.
o oo a o o g) 6 Fl o g)
o.
o Fl o
t. 6.
Estimar el limite de detecciön del anälisis de plata de los datos del ejercicio 3. Se determin6 e1 contenido de oro de una muestra concentr ada
de mar por
de agua
ctrometria de absorciön atömica con el mdtodo de las adiciones eständar. Los resultados obtenidos fueron los siguientes: espe
Oro afladido, ng por ml de muestra
concentrada 0 10 20 30 40 50 60 Absorbancia 0.257 0.314 0.364 0.413 0.468 0.528 0.574
70 0.635
La fluorescencia de un conjunto de soluciones äcidas de quinin a fue d,eterminada cinco veces. Los resultados se exponen a continuaciön:
Concentraciln, ng ml-r Intensidad de fluorescencia (unidades arbitarias)
0 4 3 4 s 4
10 Z0 30 40 50 22 44 60 T5 I04 ZO 4G 63 81 109 21 45 60 79 707 22 44 63 78 101 21, 44 63 77 105
Determinar las pendientes y ordenadas en el origen de las rectas de re$resiön no ponderada y ponderada. Calcular, utrlizando ambas rectas de re$resiön, los limites de confianza para la concentraciln de las disoluciones con intensidades de fluorescencia de 15 y g0 unidades.
8.
a a r-|o
+
Estimar 1a concentraciln del oro en el agua de mar concentraday determinar los limites de confianzapata esta concentraciön.
7.
er @
Una determinacidn de sulfuro procedente de sulfato reducido por bacterias con un electrodo selectivo de iones (ESI) fue comp arada con una determinaciln gravimötrica. Los resultados obtenidos se expresaron en miligramos de sulfuro.
o (o FJ o a
Qr Fl
\<
o o o o c) Qr Fl
ql Muestra: Sulfuro (vtdtodo ESI): Sulfuro (Gravimetna):
154
rrl a o)
72 108 105
72 16
34 5 6 r52 3 106 11 113 0 108 11
78910
12 160 r2B 747 11 782 118 1.28
Comentar 1a conveniencia del mdtodo ESI pata esta d,eterminaciön de sulfuro. (Al-Hitti, I. K., Moody, G. J. and Thomas, J. D. R. 1983. Analyst 108:43)
ö' C)
o)
,o
C
5 ö' 3 o
9.
FJ
En 1a determinaciön de plomo en soluciön acuosa por espectrometria de absorciln atlmica con atomizaciön en cämara de grafito, se obtuvieron los siguientes resultados. Concentraci6n de plomo, ng ml-
9)
Absorbancia
rJ
x
1 10 25 50 100 200 300 0.05 0.77 0.32 0.60 7.07
7.40
Cu
o
Examinar el intervalo de caTlbraciön lineal de este experimento. (Basado en Giri, S. K., Shields, C. K., Littlejohn D. and Ottaway, J. M. 1983. Analyst I0B:244)
au 'I
C)
0) g)
5
O)
o = D
10.
En un estudio del complejo formado entre los iones del europio (III) y e1 äcido pädin-2.6-dicarboxflico (APDC), se determinaron los valores de absorb ancia de disoluciones conteniendo diferentes concentraciones de APDC-Eu, con los resultados siguientes:
Absorbancia 0.008 0.014 0.024 0.034 0.042 0.050 0.055 APDC:
Eu 0.2 0.4 0.6 0.8 1.0 7.2 1.4
0.065 1.6
Absorbancia 0.068 0.076 0.077 0.073 0.066 0.063 0.058 APDC:
Bu 1.8 2.0 2.4 2.8 3.2 3.6
4.0
Utllizar estos datos para determinar las pendientes y ordenadas en el origen de dos rectas diferentes. Estimar su punto de intersecciön y su desviaciön eständar, determinando entonces la composiciön del complejo DPA-Eu formado. (Basado en Arnaud, N., Vaquer, E. and Georges, J. 1998. Analyst 123:267)
11. En un experimento
para determinar taninos hidrolizables en plantas mediante espectroscopfa de absorciln se obtuvieron los datos siguientes:
Absorbancia
0.084 0.183 0.326 0.464 0.643
Concentr aci6n, mg ml- 1 0.123 0.288 0.562 0.921 7.420
Uttlizar un programa de hoja de cä7ctt7o o de estadistica para calcular una reLaciön cuadrätica entre la absorbancia y la concentraciln Utilizando valores de Rz y R'2, comentar si los datos podrian describirse mejor mediante utta ecuaciön cubica. (Basado en W'illis, R. B. and Allen, P. R. 1998. Analgst 723:435)
F 12. Se obtuvieron
los resultados siguientes en un experimento para determinar espermina mediante cromatografia de capa fina de alta resoluciön de uno de sus derivados fluorescentes. Intensidad de fluorescencia Espermina, ng
36 69 1,84 235 269 301 327 6 18 30 45 60 70 90
Determinar 7a mejor cvla de calibraciön polinomal a travds de estos puntos. (Basado enLinares, R. M., Ayala,J.H., Afonso, A. M. and Gonzalez, V. 1998. Analyst 123:725)
155
l-
(!r
o oo a oo
o
el-
d Fl o o Qr 5 o T
0)
IJ
sa v,
a C
o 5 r+
+ o FJ o Q
(CI
o\
T \<
c)
o 5 o o o
o\
F
E