Story Transcript
El análisis discriminante Joaquín Aldás Manzano1 Universitat de València Dpto. de Dirección de Empresas “Juan José Renau Piqueras”
1
Estas notas son una selección de aquellos textos que, bajo mi punto de vista, mejor abordan el tema analizado. Sus autores aparecen citados al principio de cada epígrafe, y a ellos hay que referirse cuando se citen los contenidos de estas notas. Mi única tarea ha sido la de seleccionar, ordenar y, en algunos casos traducir los textos originales.
2
Análisis discriminante Joaquín Aldás Manzano
El análisis discriminante 1. ¿Qué es el análisis discriminante? (Uriel, 1997)
El análisis discriminante se utiliza para clasificar a distintos individuos en grupos o poblaciones alternativos a partir de los valores de un conjunto de variables sobre los individuos a los que se pretende clasificar. Imaginemos, a modo de ejemplo, que un director de una sucursal bancaria necesita establecer algún criterio que para conceder o no los préstamos que le son solicitados. Su misión es detectar si el solicitante pertenecerá en el futuro al grupo de los que devuelven los préstamos o si, por el contrario, será de aquellos que no lo hacen. Supongamos que ese director tiene el historial de todos aquellos individuos que, en el pasado, solicitaron préstamos. En ese historial figura, evidentemente, si finalmente el préstamo fue devuelto o no, es decir, el director tiene clasificados a los individuos en solventes e insolventes. Lo que se plantea ahora es si se puede obtener algún tipo de función que le permita, ante una nueva solicitud, predecir a cuál de los dos grupos va a pertenecer el solicitante. Para esto sirve el análisis discriminante. Dada una población, que tenemos dividida en grupos, el análisis discriminante encuentra una función que permite, con un determinado grado de acierto, explicar esa división en grupos (visión explicativa). Una vez obtenida, puede utilizarse para clasificar a nuevos individuos en alguno de los grupos en que está dividida la población (visión predictiva).
2. Visión geométrica del análisis discriminante (Uriel, 1997)
Intentaremos ofrecer una intuición geométrica del análisis discriminante que nos servirá, además, para introducir algunos conceptos necesarios. Supongamos que tenemos una población que puede dividirse en dos grupos. Siguiendo con el ejemplo inicial del director de banco: clientes solventes e insolventes. Supongamos, también, que queremos ser capaces de explicar esa clasificación atendiendo a una única variable, por ejemplo, el nivel de ingresos del cliente. Como el director del banco tiene el historial de los créditos pasados que conce-
3
Análisis discriminante Joaquín Aldás Manzano
dió, sabe qué nivel de ingresos tenían los solventes y los insolventes. De esta información podría obtenerse fácilmente la figura 1.
Distribución de frecuencias
Figura 1. Funciones de distribución hipotéticas de dos grupos Grupo I
Grupo II
Insolventes
XI
Solventes
C
X II
Nivel de ingresos
Miembros del grupo II
Miembros del grupo I
como del grupo I
como del grupo II
incorrectamente clasificados
X
incorrectamente clasificados
Un criterio que podría adoptar el director de banco para conceder o no un préstamo, podría ser calcular la media de ingresos de los dos grupos. La media de ambas medias (C) sería un buen punto de corte como se ilustra en la figura 1. Si el nuevo solicitante tiene unos ingresos (X) superiores a C, se le concede el préstamo y si los tiene inferiores no se le concede: C =
XI + XII 2
es decir, si X>C al individuo se le clasifica en el grupo de los solventes y si X