Ingresa a

Sergiovirtual

INGRESA A MOODLE

Haz Clic Aquí

Incorrecto

Ingresa a

SergioNET

Comunidad Sergista en línea



Olvidé mi contraseña
¿Cuál es mi usuario?

Ingresa a

Tucorreo

Si eres estudiante


Si eres FUNCIONARIO

haz clic aquí

Menu

LA IMPORTANCIA DE LA CALIDAD DE LOS DATOS PARA BIG DATA

Las organizaciones almacenan datos en toda clase de formatos, estos deben seguir modelos de calidad y características como velocidad y volumen entre otros, los datos con baja calidad afectan el desempeño de los sistemas de información en las organizaciones.

big-data-analisis-de-datos-escuela-ciencias-exactas-ingenieria-universidad-sergio-arboleda

Por: William Frasser Acevedo

Docente programa de Ingeniería de Sistemas y Telecomunicaciones

Las organizaciones almacenan grandes cantidades de datos de toda clase de formatos; desde aquellos que están estructurados en bases de datos hasta los no estructurados y semiestructurados, como documentos de texto, audio, ventas comerciales, consultas en internet, video, resultados de investigaciones científicas, encuestas de marketing digital, entre otros. Teniendo en cuenta que los datos provienen de muchas fuentes, estos deben cumplir en alto grado con el conjunto de atributos determinados por modelos afines de calidad y características relacionadas con velocidad, volumen, variedad, veracidad, valor, visualización y variabilidad. Por esta razón, el bajo grado de calidad de los datos es un factor que afecta el desempeño de los sistemas de información en las organizaciones, debido a que representa uno de los problemas que no se perciben fácilmente y más graves en los procesos transaccionales.

Dado que el concepto de calidad de datos es universal y aplicable a cualquier base de datos para Big Data representa un elemento determinante, pues los registros individuales de una operación en una base de datos son el principal insumo para analizar y visualizar los mismos. Por tanto, los problemas de calidad se transfieren a través del proceso de carga de datos hasta el producto final, generando informes carentes de análisis que pueden afectar el desempeño de la organización.

Según el Modelo de Calidad de los Datos Norma ISO 25012, la calidad de datos es la cualidad de un conjunto de información, recogida en una base de datos, un sistema de información o un almacén de datos y, entre sus características están, la exactitud, completitud, integridad, actualización, coherencia, relevancia, accesibilidad y confiabilidad necesarias para que estos datos resulten útiles en el procesamiento, análisis u otra finalidad que el usuario quiera darles.

Así pues, las especiales características de Big Data dependen de la calidad de los datos y de los estándares de calidad que debe cumplir cualquier tipo de dato para asegurar que se obtendrán resultados fiables de los procesos de análisis y visualización de los mismos. En consecuencia, organizaciones públicas y privadas deben ver la calidad de los datos como un objetivo estratégico e implementar planes de gestión de calidad, más allá de su origen y propósito de uso, con miras a asegurar la calidad de la información contenida en las bases de datos y su alineación con los objetivos de negocio. Dichos planes deben incluir actividades como: programas de administración de datos, análisis y medición de datos, tecnologías para soportar los controles de calidad de los datos y la implementación de un modelo de calidad de datos teniendo como referente la Norma ISO 25012.


LEA TAMBIÉN