CALIDAD DE DATOS
Cecilia Moguel Méndez
Introducción
Antes de la aparición de que la tecnología de servidores se volviera
accesible a todos, las empresas usaban reglas de negocios para corregir
faltas comunes de ortografía y errores tipográficos en nombres y
direcciones, así como para actualizar datos de los clientes quienes se habían
mudado, muerto, ido a prisión, casado, divorciado o experimentado
cambios en su modo de vida.
Las agencias gubernamentales empezaron a contratar servicios para hacer
referencias cruzadas de los datos de clientes con el Registro Nacional de
cambio de Dirección. Estas tecnologías ahorraron grandes millones de
dólares comparado con la corrección de datos manuales. Los envíos se
dirigieron al cliente con más precisión
Calidad de Datos
Los datos se consideran de alta calidad si representan correctamente la
construcción del mundo real al que se refieren.
Calidad de datos es adecuar las características de los datos de un
negocio a sus necesidades.
Los datos son de alta calidad "si son aptos para los usos previstos en
las operaciones, la toma de decisiones y la planificación" (J.M.
Juran).
La calidad de los datos es una disciplina centrada en asegurar que los
datos son aptos para su uso en los procesos de negocio que van
desde las operaciones básicas, desde análisis y toma de
decisiones, a la participación y la interacción con entidades
externas. (Gardner)
Calidad de Datos
Calidad de datos es la condición o estado que hace que los datos
satisfagan los requerimientos de negocio. De acuerdo a esta definición
de Larry English, la calidad de datos permite conocer y cumplir de manera
consistente las expectativas de los usuarios finales, trabajadores del
conocimiento y clientes finales de un negocio, entendiendo como trabajador
del conocimiento a aquellas personas que procesan datos para obtener
información y la utilizan en cualquier actividad de su trabajo.
Beneficios
Los Datos de alta calidad son esenciales para que las operaciones en las
organizaciones sean exitosas. Cuando estás trabajando con datos más
precisos de tu organización, puedes entender tu ambiente de negocios,
llegar más rápido a tus clientes y reducir costos de ineficiencias.
Es crucial para los procesos operativos y transaccionales.
Se ve afectada por la forma se introducen los datos, almacenados y
gestionados.
El control de Calidad de Datos (DQA, Data Quality Assurance) es el proceso
de verificación de la fiabilidad y la eficacia de los datos.
Beneficios
• Contabilidad de ingresos más precisa, facturación exacta , reducir los costos
de envío.
• Reducción de costes de publicidad directa / marketing.
• Reducción de los costes operativos.
• Sistemas más rápidos y entregas más exactas
• Ventas más eficaces.
• Mejorar servicio al cliente.
• Mejores relaciones con los clientes.
• Las empresas tienen más probabilidades de ser compatibles con las
regulaciones gubernamentales.
• Apoyar la privacidad de los datos.
Dimensiones de Calidad de Datos
• Accesibilidad
• Objetividad
• Cantidad
• Relevancia
• Credibilidad
• Reputación
• Completitud
• Seguridad
• Representación
• Manipulación
• Libre de errores
• Puntualidad
• Entendimiento
• Valor agregado
Metodología de calidad de datos
Un plan de calidad de datos debe contemplar actividades en las
siguientes áreas:
• Detección
• Reparación
• Corrección
• Prevención
Metodología de calidad de datos
La funcionalidad esperable de las herramientas de calidad de datos
consiste de:
• Profiling de datos
• Estandarización
o normalización
• Limpieza
• Coincidencia
• Enriquecimiento
• Monitoreo
El Cuadrante Mágico de Gartner
SAS/DataFlux
www.dataflux.com
Sede: Cary, Carolina del Norte, EE.UU.
Base de clientes: 2.500 (estimado)
FORTALEZAS
• Amplia funcionalidad y grado de integración.
• Facilidad de uso y numerosas aplicaciones.
• Atención al cliente y soporte.
• La notoriedad de marca, las referencias y la viabilidad de proveedores.
PRECAUCIONES
• Los recientes cambios de organización y estrategia.
• Adopción limitada de la plataforma de gestión de datos.
• Precio del modelo y puntos de precios.
• Rendimiento y escalabilidad.
• Modelos alternativos de entrega.
SAP BUSINESS OBJECTS
www.sap.com
Sede: Walldorf, Alemania
Base de clientes: 4.600 (estimado)
FORTALEZAS
• Amplitud de la funcionalidad.
• Fuerte presencia en los mercados de aplicaciones y de la plataforma de BI.
• La profundidad de la integración
• Soporte para múltiples dominios de datos.
PRECAUCIONES
• Puntos de prueba limitados para nueva funcionalidad.
• Horarios de soporte técnico y liberación.
• Modelos alternativos de entrega.
TRILLIUM SOFTWARE
www.trilliumsoftware.com
Sede: Billerica, Massachusetts, EE.UU.
Base de clientes: 1.050 (estimado)
FORTALEZAS
• Amplitud de la funcionalidad.
• Notoriedad de la marca, presencia en el mercado y trayectoria.
• Capacidades de calidad.
• Enfoque en el riesgo y soluciones de cumplimiento.
• Servicio y asistencia
PRECAUCIONES
• Usabilidad y Complejidad
• Informes de resultados y visualización de perfiles
• Estrategia a la luz de las tendencias de convergencia del mercado
• Requisitos de formación y disponibilidad
IBM
www.ibm.com
Sede: Armonk, Nueva York, EE.UU.
Productos: InfoSphere Information Analyzer, InfoSphere QualityStage,
InfoSphere Discovery
Base de clientes: 2.000 (estimado)
FORTALEZAS
• Amplitud de la funcionalidad
• Base instalada y diversidad de uso
• Sinergia con otros productos de IBM InfoSphere relacionadas
• Presencia en el mercado
• Últimos lanzamientos de productos.
PRECAUCIONES
• Problemas generales de usabilidad
Bibliografía
• Larry English, Improving Data Warehouse and Business Information Quality
(IDQ&BIQ), NY: John Wiley & Sons, 1999, p. 210.
• Gartner RAS Core Research, Magic Quadrant for Data Quality Tools, 4 June
2008.
• David Loshin, Data Best Practices for Spend Analysis, A DataFlux White Paper.
• The Three Key Phases for Data Migration - and Beyond, A DataFlux White
Paper.
• Helmuth Gümbel, Data Quality – the Base for your Enterprise Applications.
• Ted Friedman, Andreas Bitterer, Magic Quadrant for Data Quality Tools. 4
June 2008.
• Data Management Dynamics: The ROI from Data Quality.
• International Resort Company Chooses DataFlux to Standardize, Cleanse and
Integrate Customer Data, DataFlux White Paper.
• Danette McGilvray, Executing Data Quality Projects: Ten Steps to Quality
Data and Trusted Information™, Morgan Kaufmann Publishers. 2008.
• Mónica Bobrowski, Martina Marré, Daniel Yankelevich, Measuring Data
Quality.
Referencias
• http://searchdatamanagement.techtarget.com/definition/dataquality
• http://en.wikipedia.org/wiki/Data_quality
• http://www.informatica.com/
• http://www.gartner.com/technology/reprints.do?id=11BO662V&ct=120809&st=sb
• http://www.iaidq.net/webinars/doc/2006-06english_tiqm_methodology_dm_review_feature_2003-09_v2.pdf
• http://www.sas.com/offices/latinamerica/argentina/noticias/notas
_prensa/dataquality_porque_paraque.html
• http://jazzwarehouse.blogspot.mx/2012/05/empezando-concalidad-de-datos.html
Descargar

CALIDAD DE DATOS