Una Introducción a la Calidad de los Datos y de la Información en Sistemas de Información

10 de Mayo de 2010 “Una Introducción a la Calidad de los Datos y de la Información en Sistemas de Información” Ismael Caballero Ismael.Caballero@ucl
Author:  Marcos Paz Aguirre

28 downloads 28 Views 633KB Size

Recommend Stories


Introducción a los Sistemas de Calidad
Introducción a los Sistemas de Calidad Dpto. Calidad y Medio Ambiente Autor: Raúl González Índice 1. Evaluación de la implantación de los sistemas

Gestión de los datos en una base de datos
Institución educativa JOSE HOLGUIN GARCES. Especialidad en Sistemas. Herramientas de Programación 1 Gestión de los datos en una base de datos. Una v

CALIDAD TOTAL Aplicada a los sistemas de manufactura
CALIDAD TOTAL Aplicada a los sistemas de manufactura Aportado por: Alain Pederneras Orellana Empresa Aguas Andinas Santiago de Chile apederneras@latin

Sistemas de Gestión Empresarial Tema 1. Introducción a los Sistemas de Información en la Empresa
Sistemas de Gestión Empresarial Tema 1. Introducción a los Sistemas de Información en  la Empresa Marcos Colebrook Santamaría POP en Informática ‐ ET

sistemas de gestión de calidad y seguridad en centrales hortofrutícolas
sistemas de gestión de calidad y seguridad en centrales hortofrutícolas Calidad Certificada Consultores, S.L.U. Equipo de Trabajo: Ana Belén González

ALTA CALIDAD EN SISTEMAS DE PISO ELEVADO
ALTA CALIDAD EN SISTEMAS DE PISO ELEVADO El piso elevado Verley (i.e. piso técnico/piso falso) es un elemento fundamental para la optimización de las

Story Transcript

10 de Mayo de 2010

“Una Introducción a la Calidad de los Datos y de la Información en Sistemas de Información”

Ismael Caballero [email protected]

Grupo Alarcos- Escuela Superior de Informática Universidad de Castilla La Mancha

Índice de Contenidos

1. Importancia de la Calidad de los Datos en las Organizaciones. 2. Definiciones Básicas 3. Procesos técnicos relacionados con los datos. 4. Tipos de Datos 5. Tipos de Sistemas 6. Definición del Concepto de Calidad de Datos y de Información (DIQ) 7. Dimensiones de Calidad de Datos . 8. Bibliografía y Referencias 2

Índice de Contenidos

1. Importancia de la Calidad de los Datos en las Organizaciones. 2. Definiciones Básicas 3. Procesos técnicos relacionados con los datos. 4. Tipos de Datos 5. Tipos de Sistemas 6. Definición del Concepto de Calidad de Datos y de Información (DIQ) 7. Dimensiones de Calidad de Datos . 8. Bibliografía y Referencias 3

¿Qué problemas de Calidad de Datos se observan en la tabla? No existe esta película, sino “El Club de los Poetas Muertos”

Curtiz es el director de Casablanca y Weir el de “El club de los Poetas Muertos”

Un remake no puede haberse hecho antes que la primera versión de la película

Id

Título

Director

Año

Nro_ Remakes

AñoUltimo Remake

1

Casablanca

Weir

1942

3

1940

2

El Club de los Poetas

Curtiz

1989

0

NULL

3

Vacaciones en Roma

Wylder

1953

0

NULL

4

Sabrina

NULL

1964

0

1985

Falta el nombre del Director: o no exite (hecho imposible o no se sabía)

Si el número de remakes es 0, no tiene sentido que haya una fecha para el último remake: o realmente se han hecho remakes o no debería aparecer una fecha

(Ejemplo en Batini y Scannapieco, 2006))

4

Importancia de la Calidad de los Datos

• Situación Actual:  Los datos se han convertido en uno de los activos más importantes de las organizaciones, ya que son clave en la toma de decisiones estratégicas u operativas (Ballou y Tayi, 1999; Bobrowski et al., 1999; Bovee et al., 2003; Redman, 1996; Strong et al., 1997b).  Por eso se recopilan datos para ser más competitivos (Eppler, 2001b; Gertz et al., 2004; Batini y Scannapieco, 2006).  Tal cantidad de datos puede llevar a una situación caótica: • Datos inútiles e innecesarios. • Redundancia incontrolada de datos • Gran cantidad de datos históricos caducados.

5

Importancia de la Calidad de los Datos (II)

• Consecuencias de esa posible Situación:  Los datos se convierten en fuentes de problemas (Strong et al., 1997b): • Datos no usados, • Barreras en la accesibilidad de los datos, • Dificultades en la utilización de los datos y de la información

 Y estos problemas afectan negativamente al rendimiento de los procesos de negocio de la organización (Levin et al., 2007): • A un nivel técnico: e.g. Implementación de almacenes de datos. • A un nivel organizacional: – Pérdida de clientes al estar insatisfechos. – Pérdidas financieras debido a desperdicios de recursos en términos de tiempo y de dinero y a una baja o escasa productividad. – Trabajadores descontentos y desmotivados.

• A un nivel legal: Dependiendo de ciertas leyes, como la LOPD. 6

Importancia de la Calidad de los Datos (III)

• Solución:  Mejorar la calidad de los datos y de la información a través de la gestión de la calidad de los datos y de la información (Ballou y Tayi, 1996; Liu y Chi, 2002; Wang, 1998; Caballero et al. 2004) implementando las correspondientes estrategias organizacionales.  Una de estas estrategias deben ser las actividades de evaluación y mejora (Eppler, 2003) a nivel de productos de datos y a nivel organizacional.

7

Índice de Contenidos

1. Importancia de la Calidad de los Datos en las Organizaciones. 2. Definiciones Básicas 3. Procesos técnicos relacionados con los datos. 4. Tipos de Datos 5. Tipos de Sistemas 6. Definición del Concepto de Calidad de Datos y de Información (DIQ) 7. Dimensiones de Calidad de Datos . 8. Bibliografía y Referencias 8

Definiciones Básicas

• Entidad:  Personas, cosas, lugares, conceptos, sucesos, reales o abstractos, de interés para la semántica del problema, (De Miguel y Piattini, 1999)

• Población:  Conjunto de entidades del mundo real

• Atributo:  Cualquier hecho observable de una entidad

• Dato:  Valor observado o medido para un determinado atributo de una entidad recolectado del mundo real. 9

Definiciones Básicas (II)

• Instancia:  Conjunto de todos los valores que toman los atributos de una determinada entidad

Atributo1

Atributo6

Atributo5

Atributo2

Atributo3

Atributo4

Valor1

Valor2

VAlor6

Valor3

Valor5

Valor4

Instancia

10

Definiciones Básicas (III)

• Base de Datos:  Colección de valores para un conjunto de atributos elegidos de entidades del mundo real  Definición (De Miguel y Piattini, 1999) • Colección o depósito de datos integrados, almacenados en soporte secundario (no volátil) y con redundancia controlada. • Los datos, que han de ser compartidos por diferentes usuarios y aplicaciones, deben mantenerse independientes de ellos, y • su definición (estructura de la base de datos) única y almacenada junto con los datos, se ha de apoyar en un modelo de datos, el cual ha de permitir captar las interrelaciones y las restricciones existentes en el mundo real. • Los procedimientos de actualización y recuperación, comunes y bien determinados, facilitarán la seguridad del conjunto de datos. 11

Definiciones Básicas (IV)

Valor1

Valor2

VAlor6

Valor1

Valor3

Valor4

Valor5

Valor2

Valor1

Valor2

Valor3

VAlor6

Valor4

Valor4 Valor2

VAlor6

Valor5

Valor3

Valor3

Valor4 Valor1

Valor2

VAlor6

Valor5

VAlor6

Valor5

Valor1

Valor1

Valor3

Valor4

Valor2

VAlor6

Valor5

Valor3

Valor4

12

Definiciones Básicas (V)

• Modelo de Datos:  Conjunto de conceptos, reglas y convenciones que nos permiten describir y manipular (consultar y actualizar) los datos de un cierto mundo real que deseamos almacenar en la base de datos

• Esquema del Modelo de Datos:  Gráfico que representa un Modelo de Datos, una estructura de la base de datos.

• Sistema Gestor de Bases de Datos (SGBD):  Conjunto coordinado de programas, procedimientos, lenguajes, ... que suministra a los distintos tipos de usuarios los medios necesarios para describir y manipular los datos almacenados en las bases de dato, garantizando su seguridad. 13

Definiciones Básicas (VI)

• Producto de Datos o de Información (PI)  Producto obtenido tras un proceso de fabricación a partir de datos almacenados en una base de datos y que pueden ser considerados como materias primas. • Ejemplo: El resultado de una simple consulta select.

• Información  Valor añadido del producto de datos obtenido por su Interpretación. (English, 1999)  Datos útiles en un contexto (Eppler, 2001)  Conjunto de Datos proporcionados a través de un producto de datos que son útiles en un contexto.

• Usuario  Cualquier persona o proceso que puede interactuar con una base de datos a través de una interfaz (de texto, gráfica o de SOA) para desarrollar algunas funciones relacionadas con la misma base de datos o con su trabajo específico.

• Conocimiento  Información útil en un contexto (English, 1999)

14

Definiciones Básicas (VII)

• Calidad de Datos  Aquellas características que deben tener los datos como materias primas para que, utilizando un proceso de producción adecuado se pueda generar un producto de información.

• Calidad de Información  Aquellas características que debería tener un Producto de Información (PI) para que su utilización sea adecuada, esto es que cumpla, con los requisitos de usuario

• Dimensiones de Calidad de datos  Son criterios que permiten juzgar la calidad de los datos desde un determinado punto de vista. Se pueden entender como las características del Software propuestas en ISO 9126. 15

Índice de Contenidos

1. Importancia de la Calidad de los Datos en las Organizaciones. 2. Definiciones Básicas 3. Procesos técnicos relacionados con los datos. 4. Tipos de Datos 5. Tipos de Sistemas 6. Definición del Concepto de Calidad de Datos y de Información (DIQ) 7. Dimensiones de Calidad de Datos . 8. Bibliografía y Referencias 16

Procesos Técnicos Relacionados con los Datos

• Procesos Técnicos Relacionados (Redman, 1996)  Diseño e Implementación del Esquema de la Base de datos • Consiste en la definición de la estructura de un continente (o esquema) para los datos. Esta estructura puede estar distribuida en varias localizaciones para mejorar el rendimiento de la organización.

 Recolección de Datos • Es el hecho de captar valores de la realidad para los atributos de las entidades modeladas en la base de datos a través de distintos mecanismos/herramientas como formularios, encuestas,…

 Almacenamiento de los Datos • Consiste en guardar los valores captados en la fase de recolección en el continente definido anteriormente. Es preciso tener en cuenta que puede ser necesario repartir los valores entre las distintas particiones del esquema realizadas durante la distribución (integrar los datos) 17

Procesos Técnicos Relacionados con los Datos (II)

 Extracción de los Datos • Consiste en la selección y recuperación de los valores almacenados en el continente o base de datos. Al igual que con el almacenamiento habría que tener en cuenta que los datos pueden venir de distintas localizaciones o fuentes. Teóricamente, el SGBD debería hacer este proceso de forma transparente al usuario. • La extracción de datos, no implica que se agoten..

 Elaboración del Producto de Datos • Siguiendo los Procesos de Negocio, esta fase consiste en obtener un producto de datos a partir de los datos (materia prima) que satisfaga las necesidades de un consumidor.

 Entrega del Producto de Datos • Es el proceso por el cual se hace llegar al destinatario del producto de información dicho producto para que pueda utilizarlo para desarrollar el trabajo para el que lo ha solicitado. 18

Procesos Técnicos Relacionados con los Datos (III)

 Generación de Información • Consiste en interpretar el producto de datos para poder realizar un trabajo, típicamente tomar una decisión relacionada con el ámbito de trabajo del usuario

 Generación del Conocimiento (Organizacional). • A partir de la información generada anteriormente, este proceso consiste en establecer una serie de políticas que puedan ser aplicadas en cualquiera de los procesos anteriores para mejorar los existentes y evitar posibles defectos.

19

Relación Ontológica de los Conceptos Presentados

Mundo Real

Recolección

Visión del Usuario del Mundo Real para almacenar en el Sistema

Posible Deficiencias de los Datos

Representación de la semántica del Mundo Real

Almacenamiento Percepción del Mundo Real capturada por el Desarrollador

Visión del Usuario del Mundo real Inferida del Sistema de Información

Diseño de la Base de Datos

Sistema de Información

Extracción y Elaboración del Producto de Información

20

Índice de Contenidos

1. Importancia de la Calidad de los Datos en las Organizaciones. 2. Definiciones Básicas 3. Procesos técnicos relacionados con los datos. 4. Tipos de Datos 5. Tipos de Sistemas 6. Definición del Concepto de Calidad de Datos y de Información (DIQ) 7. Dimensiones de Calidad de Datos . 8. Bibliografía y Referencias 21

Tipos de Datos

• Atendiendo a su estructuración:  Estructurados • Siguen un esquema predefinido • Ejemplo: Datos organizados según Modelo Relacional

 Semiestructurados • Los datos tienen una estructura flexible, e incluso carecer de ella. • Ejemplo: XML

 No estructurados • No siguen ningún criterio para ser estructurados. • Ejemplo: ficheros de texto en lenguaje natural

22

Tipos de Datos (II)

• Atendiendo a la naturaleza Scannapieco, 2006):

del

producto

(Batini

y

 Ítems de Datos como materias primas. • Son considerados las unidades más pequeñas de datos. • Son utilizados para construir el resto de los componentes.

 Ítems de Datos como componentes. • Son los datos utilizados para generar un producto de Información. • Se obtienen como una consulta de recuperación select.

 Ítems de Datos como productos de datos o información. • Son el resultado de un proceso de producción y provienen de uno o varios Ítems de Datos como componentes.

• Atendiendo a su composición (granularidad)  Datos Elementales • Son datos gestionados en las organizaciones por procesos organizacionales y representan a valores individuales del mundo real.

 Datos Agregados. • Son un conjunto de datos elementales obtenidos mediante una determinada función de agregación

23

Tipos de Datos (III)

• Otros tipos de datos  Datos Federados • Son aquellos que vienen de fuentes de datos heterogéneas y necesitan de varias de ellas para ser integrados.

 Datos Web • Son recuperados de la web, y aunque no poseen un formato determinado constituyen uno de las principales fuentes de datos.

• Atendiendo a su aspecto temporal:  Datos Estables • Datos que no van a cambiar a lo largo del tiempo, como publicaciones científicas, que se incrementarán, pero las ya existentes no variarán.

 Datos poco cambiantes • Datos que pueden sufrir algunas modificaciones. Por ejemplo algunos datos personales, como la dirección, el teléfono,…

 Datos cambiantes frecuentemente. • Datos de los que se espera que sufran cambios, como la información del tráfico, tasas de ventas, … 24

Tipos de Datos (IV)

• Tipos de Datos objetos de Estudio en nuestro contexto:  Datos Estructurados y Semiestructurados  Datos Elementales  Ítems de Datos como Materia Prima y Productos de Datos

25

Índice de Contenidos

1. Importancia de la Calidad de los Datos en las Organizaciones. 2. Definiciones Básicas 3. Procesos técnicos relacionados con los datos. 4. Tipos de Datos 5. Tipos de Sistemas 6. Definición del Concepto de Calidad de Datos y de Información (DIQ) 7. Dimensiones de Calidad de Datos . 8. Bibliografía y Referencias 26

Tipos de Sistemas de Información

• Los Sistemas de Información son el entorno donde se ejecutan los procesos técnicos de los datos. • Criterios de clasificación:  Distribución • Estudia si los datos van a ser o no distribuidos entre distintas localizaciones • Valores Posibles ={“Sí”, “No”}

 Heterogeneidad • Tiene en cuenta los diferentes tipos de semánticas y técnicas usados para la representación conceptual y lógica de los datos. • Valores Posibles ={“Sí”, “No”}

 Autonomía • Define el grado de jerarquía de los sistemas así como las posibles reglas de coordinación entre ellos, estableciendo derechos y obligaciones. • Valores Posibles ={“Totalmente”, “Semi”, “No”} 27

Tipos de Sistemas De Información (II)

Distribución SÍ

Sistemas Distribuidos

Sistemas Colaborativos

Sistemas Monolíticos Sistemas Peer-to-Peer NO



SEMI

Sistemas Data Warehouse

TOTALMENTE

Autonomía

Heterogeneidad

28

Índice de Contenidos

1. Importancia de la Calidad de los Datos en las Organizaciones. 2. Definiciones Básicas 3. Procesos técnicos relacionados con los datos. 4. Tipos de Datos 5. Tipos de Sistemas 6. Definición del Concepto de Calidad de Datos y de Información (DIQ) 7. Dimensiones de Calidad de Datos . 8. Bibliografía y Referencias 29

Definición de Calidad de Datos (I)

• Definiciones de Calidad de Datos / Calidad de Información  Berti y Scannapieco (2006) y Lee et al. (2006): • Concluyen que una definición muy aceptada es “fitness for use”.

 Brien (1991): • “Es el grado con el que la información tiene contenido, forma y características temporales que le dan un valor añadido al usuario final”.

 Eppler (2001): • “Calidad de información es la característica de la información para satisfacer los requisitos funcionales, técnicos, cognitivos y estéticos de los productores, consumidores, administradores y expertos”.

30

Definición de Calidad de Datos (II)

 Huang et al. (1999): “ • La calidad de la información puede ser definida como la información que se adapta a su uso para los consumidores de información”.

 Kahn y Strong (1998): • “Calidad de información es el conjunto de características que deben satisfacer o superar las expectativas del consumidor”.

 Lesca y Lesca (1998): • es “el conjunto de características que hacen que la información tenga más valor para los usuarios”.Es el grado con el que los productos de datos satisfacen las necesidades y requisitos de los clientes.

31

Definición de Calidad de Datos (III)

• ¿Qué se ve afectado por la Calidad de Datos?  Todas aquellas Entidades que forman parte del proceso de negocio: • Calidad de la materia prima – Calidad del esquema de la Base de Datos – Calidad de los propios datos. – Soporte del SGBD.

• Calidad de los procesos técnicos implicados en los datos • Calidad de los productos de datos.

• ¿Cómo se define la calidad de datos?  Mediante las dimensiones de calidad de datos • Es posible definir para cada entidad ciertas características que permitan simplificar el estudio de la calidad de datos, descomponiéndola en unidades más pequeñas como propone ISO 9126. 32

Dimensiones de Calidad de Datos (IV)

•Focos de estudio de la calidad de los datos (Piattini et al., 2006)

Calidad de los Datos

Calidad de la Base de Datos

Calidad del SGBD

Calidad del Modelo Conceptual

Calidad de la Presentación

Calidad del Modelo de Datos

Calidad de los Datos

Calidad del Modelo Lógico

Calidad del Modelo Físico

33

Índice de Contenidos

1. Importancia de la Calidad de los Datos en las Organizaciones. 2. Definiciones Básicas 3. Procesos técnicos relacionados con los datos. 4. Tipos de Datos 5. Tipos de Sistemas 6. Definición del Concepto de Calidad de Datos y de Información (DIQ) 7. Dimensiones de Calidad de Datos . 8. Bibliografía y Referencias 34

Dimensiones de Calidad de Datos

• Aspectos de Medición para Calidad de los Propios Datos:  Es necesario medir para Gestionar la Calidad de los propios datos.  Tradicionalmente se han desarrollado métricas ad hoc para dimensiones de calidad identificadas a partir de las necesidades de los usuarios.  No existe un conjunto de dimensiones universales porque cada autor define las que mejor se adaptan a su contexto.  Como las métricas se definen para esas dimensiones, también dependen fuertemente del contexto y son poco exportables a otros contextos y por tanto poco generalizables. 35

Dimensiones de Calidad de Datos (II)

•Dimensiones de Calidad  La calidad es un concepto muldimensional. • Para medir la calidad es necesario descomponer la calidad en características observables llamadas dimensiones de calidad, en base a las cuales es posible definirla, identificarla y medirla. • La calidad es un concepto muldimensional porque se necesitan varias dimensiones para decir cómo de bueno son los datos que se van a usar para una aplicación.

Características de Calidad Características de Calidad -1

Características de Calidad -2

Características de Calidad -3

Atributo de Calidad

Atributo de Calidad

Característica 1.1

Característica 1.2

Atributo de Calidad

Atributo de Calidad

Estructura de Calidad según ISO 9126

36

Dimensiones de Calidad de Datos (III) • English (1999) distingue dos categorías de dimensiones:  Calidad inherente • Exactitud de los datos, compleción de valores, ...

 Calidad Pragmática • Oportunidad, Características, ...

• Strong et al. (1997) identifica las siguientes:  Intrínsecas • Precisión, Objetividad, Credibilidad,...

 Accesibilidad • Accesibilidad, Seguridad en el acceso, ...

La más aceptada y utilizada

 Contextual • Relevancia, Valor añadido, oportunidad,...

 Representacional • Interpretabilidad, facilidad de comprensión , ... 37

Dimensiones de Calidad de Datos (IV) • ISO/IEC 25012 • Presenta las dimensiones de calidad de datos para los sistemas de Información Inherentes

Inherentes y Dependientes

Dependientes

Compleción Consistencia Credibilidad Actualidad

Conformidad Confidencialidad Eficiencia Precisión Trazabilidad Entendibilidad

Disponibilidad Portabilidad Recuperabilidad

38

Dimensiones de Calidad de Datos (V)

• Algunas Dimensiones inherentes a los datos:  Accuracy (exactitud/precisión) • Definida como la diferencia entre el valor real v y el valor almacenado en la base de datos v’ – Ejemplos: » Una persona se llama “Ismael” y en la base de datos aparece “Ishmail” (sintatic accuracy) » Una persona se llama “Ismael” y en la base de datos aparece como “Ramón” (semantic accuracy)

 Completitud • Definida como la medida en la que los datos tienen suficiente alcance o profundidad para la tarea que se está realizando. – Ejemplos: » Cuando se dejan valores sin almacenar en una base de datos, bien porque no se conocen, bien porque no existen.

39

Dimensiones de Calidad de Datos (VI)

• Algunas Dimensiones relacionadas con el Tiempo:  Oportunidad (Timeliness) • Expresa cómo de actuales son los datos para una tarea. – Ejemplos: » Cotizaciones de Valores de Bolsa: si llega un dato en un instante t y hay que decidir realizar una acción antes de un instante t’ en el que con toda probabilidad ese dato va a cambiar. Si se toma la decisión pasado t’ con el dato que se tenía en el momento t las consecuencias de la decisión probablemente no serán las mismas.

 Volatilidad (Volatility) • Caracteriza la frecuencia con la que los datos varían en el tiempo. – Ejemplos: » Fechas de Nacimiento no varían (Volatilidad nula). » Cotizaciones de Valores de Bolsa (gran volatilidad)

 Actualidad (Currency) • Se refiere al retraso que se puede producir al actualizar los datos. – Ejemplo: » Se le quiere mandar una felicitación de Navidad a una persona que cambió de dirección postal

40

Dimensiones de Calidad de Datos (VII)

• Dimensiones Relacionadas con la Integridad  Consistencia (Consistency) • Captura la violación de las reglas semánticas definidas para un conjunto de datos. – Ejemplo: » Violación de las reglas de integridad de identidad » Violación de las reglas de integridad referencial » Violación de las reglas de integridad de dominio

• Otras dimensiones:  Accesibilidad • Determinar el grado en el que un usuario puede acceder a los datos.

41

Dimensiones de Calidad de Datos (VIII)

•Algunos ejemplos de Formas de Medir1 (Lee et al., 2006)  Grado de Adherencia a las restricciones de Integridad de una tabla T: • Integridad de Entidad:

GAIE (T )  1 

NúmerodePKNulas (T ) NT (T )

NT=Número de Tuplas

• Integridad Referencial: GAIR(T , TD)  1 

NúmerodeFKNoExistent es (T ) NT (TD)

NT=Número de Tuplas

TD= Tabla Dependiente

• Integridad de Atributo o Columna (Accuracy):

NVI ( A) GAIA( A)  1  NT ( A)  Compleción de una Tabla NVNC (T ) C (T )  1  NT (T )

NVI(A)= Número de Valores Incorrectos del Atributo A NT=Número de Tuplas

NVNC(T)= Número de Valores no Completos de la tabla T NT=Número de Tuplas

1 Muchas

de estas medidas se pueden definir de la misma forma sobre distintas entidades, por lo que habría que identificar dichas entidades y adaptar la definición a ellas.

42

Dimensiones de Calidad de Datos (IX)

•Algunos ejemplos de Formas de Medir (Lee et al., 2006) (2)  Grado de Consistencia de una Tabla (T) NVTC (T ) GC(T )  1  NT (T )  Grado de Credibilidad de una tabla:

NVTC=Número de Violaciones de Tipo de Consistencia

GC(T )  min(GC(TO), GC(T ' ))

TO=Tabla Origen T’= Comparación Lógica

 Cantidad Apropiada De Datos: NVP(T)=Número de Valores Proporcionados

 NVP (T ) NVN (T )  TCAD(T )  min  , NVN ( T ) NVP (T )    Tasa de Actualidad de los Datos   Actualidad (T )   TasaOportunidad (T )  max 1  ),0  Volatilida d (T )    

NVN(T)=Número de Valores Necesarios

s

S= Sensibilidad del Contexto

43

Índice de Contenidos

1. Importancia de la Calidad de los Datos en las Organizaciones. 2. Definiciones Básicas 3. Procesos técnicos relacionados con los datos. 4. Tipos de Datos 5. Tipos de Sistemas 6. Definición del Concepto de Calidad de Datos y de Información (DIQ) 7. Dimensiones de Calidad de Datos . 8. Bibliografía y Referencias 44

Bibliografía y Referencias

• • • • •



• • • • •

Aiken, P., Allen, M.D., Parker, B., Mattia, A. (2007) “Measuring Data Management Practice Maturity: A Community’s Self-Assessment” IEEE Computer 40(4):42-50 Ballou, D. P. and G. K. Tayi (1999). "Enhancing Data Quality in Data Warehouse Environments." Communications of the ACM 42(1): 73-78. Batini, C. and M. Scannapieco (2006). Data Quality: Concepts, Methodologies and Techniques. Berlin, Springer-Verlag Berlin Heidelberg. Bobrowski, M., M. Marré, et al. (1998). A Software Engineering View of Data Quality. Second International Software Quality in Europe, Brussels, Belgium. Bovee, M., R. P. Srivastava, et al. (2003). "A Conceptual Framework and Belief-Function Approach to Assesing Overall Information Quality." International Journal of Intelligent Systems 18: 51-74. Brien, J. O. (1991). Introduction to Information Systems in Business Management. Boston, MA: USA. De Miguel, A. and M. Piattini (1999). Diseño de Bases de Datos Relacionales. Madrid, Ra-Ma. English, L. (1999). Improving Data Warehouse and Business Information Quality: Methods for reducing costs and increasing Profits. New York, NY, USA, Willey & Sons. Eppler, M. J. (2001). "The Concept of Information Quality: An interdisciplinary Evaluation of recent Information Quality Frameworks." Studies in Communication Sciences 1: 167-182. Eppler, M. J. (2003). Managing Information Quality. Secacus, NJ, USA, Springer-Verlag New York Inc. Gertz, M., M. T. Özsu, et al. (2004). "Report on the Dagstuhl Seminar "Data Quality on the Web"." SIGMOD RECORD 33(1): 127-132.

45

Bibliografía y Referencias (II)

• •

• • • • • • •



Huang, K. T., Y. W. Lee, et al. (1999). Quality Information and Knowledge. Upper Saddle River, NJ, USA, Prentice-Hall. ISO/IEC-JTC1/SC7 (1998). ISO/IEC 9126: Information Technology - Software Product Evaluation - Quality Characteristics and Guidelines for their Use. Geneva, Switzerland, International Organization for Standarization. Kahn, B. K., D. M. Strong, et al. (2002). "Information Quality Benchmarks: Product and Service Performance." Communications of the ACM 45(4ve): 184-192. Lesca, H. and E. Lesca (1995). Gestion de l’information, qualité de l’information et performance de’l enterprise. Paris, France, Litec. Liu, L. and L. N. Chi (2002). Evolutional Data Quality: a theory-specific view. Seventh International Conference on Information Quality (ICIQ'02), MIT, Cambridge, MA, USA. Redman, T. C. (1996). Data Quality for the Information Age. Boston, MA, USA, Artech House Publishers. Strong, D. M., Y. W. Lee, et al. (1997). "Data Quality in Context." Communications of the ACM 40(5): 103-110. Strong, D. M., Y. W. Lee, et al. (1997). "Ten potholes in the road to information quality." IEEE Computer 30(18): 38-46. Wand, Y. and R. Y. Wang (1996). "Anchoring Data Quality Dimensions in Ontological Foundations." Communications of the ACM 39(11): 86-95. Wang, R. Y. (1998). "A Product Perspective on Total Data Quality Management." Communications of the ACM 41(2): 58-65.

46

10 de Mayo de 2010 “Una Introducción a la Calidad de los Datos y de la Información en Sistemas de Información”

Muchas gracias por su atención

Ismael Caballero [email protected]

Grupo Alarcos- Escuela Superior de Informática Universidad de Castilla La Mancha

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.