CALIDAD DE DATOS
Cecilia Moguel Méndez
Introducción
Antes de la aparición de que la tecnología de servidores se volviera accesible
a todos, las empresas usaban reglas de negocios para corregir faltas comunes
de ortografía y errores tipográficos en nombres y direcciones, así como para
actualizar datos de los clientes quienes se habían mudado, muerto, ido a
prisión, casado, divorciado o experimentado cambios en su modo de vida.
Las agencias gubernamentales empezaron a contratar servicios para hacer
referencias cruzadas de los datos de clientes con el Registro Nacional de
cambio de Dirección. Estas tecnologías ahorraron grandes millones de
dólares comparado con la corrección de datos manuales. Los envíos se
dirigieron al cliente con más precisión.
Calidad de Datos
Los datos se consideran de alta calidad si representan correctamente la
construcción del mundo real al que se refieren.
Calidad de datos es adecuar las características de los datos de un
negocio a sus necesidades.
Los datos son de alta calidad "si son aptos para los usos previstos en
las operaciones, la toma de decisiones y la planificación" (J.M.
Juran).
La calidad de los datos es una disciplina centrada en asegurar que los
datos son aptos para su uso en los procesos de negocio que van
desde las operaciones básicas, desde análisis y toma de
decisiones, a la participación y la interacción con entidades
externas. (Gardner)
Calidad de Datos
Calidad de datos es la condición o estado que hace que los datos
satisfagan los requerimientos de negocio. De acuerdo a esta
definición de Larry English, la calidad de datos permite conocer y cumplir de
manera consistente las expectativas de los usuarios finales, trabajadores del
conocimiento y clientes finales de un negocio, entendiendo como trabajador
del conocimiento a aquellas personas que procesan datos para obtener
información y la utilizan en cualquier actividad de su trabajo.
Fuentes de Baja Calidad
Beneficios
Los Datos de alta calidad son esenciales para que las operaciones en las
organizaciones sean exitosas. Cuando estás trabajando con datos más
precisos de tu organización, puedes entender tu ambiente de negocios,
llegar más rápido a tus clientes y reducir costos de ineficiencias.
La calidad es esencial para los procesos operativos y transaccionales. Se ve
afectada por la forma se introducen los datos, almacenados y gestionados.
El control de Calidad de Datos (DQA, Data Quality Assurance) es el proceso
de verificación de la fiabilidad y la eficacia de los datos.
Beneficios
• Contabilidad de ingresos más precisa, facturación exacta.
• Reducción de los costos de envío.
• Reducción de costes de publicidad directa / marketing.
• Reducción de los costes operativos.
• Sistemas más rápidos y entregas más exactas
• Ventas más eficaces.
• Mejorar servicio al cliente.
• Mejores relaciones con los clientes.
• Las empresas tienen más probabilidades de ser compatibles con las
regulaciones gubernamentales.
• Apoyar la privacidad de los datos.
Dimensiones de Calidad de Datos
• Accesibilidad
• Interpretación
• Cantidad
• Objetividad
• Credibilidad
• Relevancia
• Completitud
• Reputación
• Representación
• Seguridad
• Manipulación
• Puntualidad
• Libre de errores
• Entendimiento
Metodología de calidad de datos
Un plan de calidad de datos debe contemplar actividades en las siguientes
áreas:
• Detección
• Reparación
• Corrección
• Prevención
Metodología de calidad de datos
La funcionalidad esperable de las herramientas de calidad de datos consiste
de:
• Profiling de datos
• Estandarización
o normalización
• Limpieza
• Coincidencia
• Enriquecimiento
• Monitoreo
Reporte generado durante Profiling de Datos
DataFlux
El Cuadrante Mágico de Gartner
SAS/DataFlux
www.dataflux.com
Sede: Cary, Carolina del Norte, EE.UU.
Base de clientes: 2.500 (estimado)
FORTALEZAS
• Amplia funcionalidad y grado de integración.
• Facilidad de uso y numerosas aplicaciones.
• Atención al cliente y soporte.
• La notoriedad de marca, las referencias y la viabilidad de proveedores.
PRECAUCIONES
• Los recientes cambios de organización y estrategia.
• Adopción limitada de la plataforma de gestión de datos.
• Precio del modelo y puntos de precios.
• Rendimiento y escalabilidad.
• Modelos alternativos de entrega.
SAP BUSINESS OBJECTS
www.sap.com
Sede: Walldorf, Alemania
Base de clientes: 4.600 (estimado)
FORTALEZAS
• Amplitud de la funcionalidad.
• Fuerte presencia en los mercados de aplicaciones y de la plataforma de BI.
• La profundidad de la integración
• Soporte para múltiples dominios de datos.
PRECAUCIONES
• Puntos de prueba limitados para nueva funcionalidad.
• Horarios de soporte técnico y liberación.
• Modelos alternativos de entrega.
TRILLIUM SOFTWARE
www.trilliumsoftware.com
Sede: Billerica, Massachusetts, EE.UU.
Base de clientes: 1.050 (estimado)
FORTALEZAS
• Amplitud de la funcionalidad.
• Notoriedad de la marca, presencia en el mercado y trayectoria.
• Capacidades de calidad.
• Enfoque en el riesgo y soluciones de cumplimiento.
• Servicio y asistencia
PRECAUCIONES
• Usabilidad y Complejidad
• Informes de resultados y visualización de perfiles
• Estrategia a la luz de las tendencias de convergencia del mercado
• Requisitos de formación y disponibilidad
IBM
www.ibm.com
Sede: Armonk, Nueva York, EE.UU.
Productos: InfoSphere Information Analyzer, InfoSphere QualityStage,
InfoSphere Discovery
Base de clientes: 2.000 (estimado)
FORTALEZAS
• Amplitud de la funcionalidad
• Base instalada y diversidad de uso
• Sinergia con otros productos de IBM InfoSphere relacionadas
• Presencia en el mercado
• Últimos lanzamientos de productos.
PRECAUCIONES
• Problemas generales de usabilidad
Calidad de Datos
“La calidad es gratis. No es un regalo, pero es gratis. Lo que cuesta dinero son
los datos sin calidad- todas las acciones que implican no hacer bien los
procesos la primera vez.”
Larry P. English
Bibliografía
• Larry P. English, Improving Data Warehouse and Business Information
Quality (IDQ&BIQ), NY: John Wiley & Sons, 1999, p. 210.
• Larry P. English, Total Information Quality Management: A Complete
Methodology for IQ Management, DM Review Magazine, September,
2003.
• Gartner RAS Core Research, Magic Quadrant for Data Quality Tools, 4
June 2008.
• David Loshin, Data Best Practices for Spend Analysis, A DataFlux White
Paper.
• The Three Key Phases for Data Migration - and Beyond, A DataFlux White
Paper.
• Helmuth Gümbel, Data Quality – the Base for your Enterprise
Applications.
Bibliografía
• Data Management Dynamics: The ROI from Data Quality.
• International Resort Company Chooses DataFlux to Standardize, Cleanse
and Integrate Customer Data, DataFlux White Paper.
• Danette McGilvray, Executing Data Quality Projects: Ten Steps to Quality
Data and Trusted Information™, Morgan Kaufmann Publishers. 2008.
• Mónica Bobrowski, Martina Marré, Daniel Yankelevich, Measuring Data
Quality.
Referencias
•
•
•
•
http://searchdatamanagement.techtarget.com/definition/data-quality
http://en.wikipedia.org/wiki/Data_quality
http://www.informatica.com/
http://www.gartner.com/technology/reprints.do?id=11BO662V&ct=120809&st=sb
• http://www.iaidq.net/webinars/doc/2006-06english_tiqm_methodology_dm_review_feature_2003-09_v2.pdf
• http://www.sas.com/offices/latinamerica/argentina/noticias/notas_prens
a/dataquality_porque_paraque.html
• http://jazzwarehouse.blogspot.mx/2012/05/empezando-con-calidad-dedatos.html
Descargar

CALIDAD DE DATOS