De los datos al conocimiento

Datos-Informacion-Conocimiento

Hay una cadena de valor sumamente importante en los Sistemas de Información. Es la cadena que lleva de los datos al conocimiento:

datos –> información –> conocimiento

Los datos son el punto de partida. Se obtienen de los hechos del mundo real y son representaciones de atributos de las entidades del mundo real y de sus procesos modelados por los Sistemas de Información. Esta representación puede ser numérica, como en el caso del importe de una transacción o el valor de una temperatura, pero también puede ser un atributo como el nombre de una persona o su DNI, o una sentencia sobre la entidad como el próximo paso a dar en una oportunidad comercial.

El proceso mediante el cual un sistema de información adquiere los datos es llamado captura de datos. Esta captura puede ser manual, como cuando un empleado bancario da de alta la ficha de un nuevo cliente o automática como cuando los datos son adquiridos de otro sistema, tal como sucede cuando nos descargamos los datos fiscales de la Agencia Tributaria para hacer la declaración del IRPF. Hay que señalar que el proceso de captura puede tener, y de hecho suele tener, errores, ya sea que la captura sea manual o automática.

En la captura manual son frecuentes distintos tipos de errores. Los más notables son:
  • Errores de trancripción, como cuando el operador se equivoca escribiendo el nombre de una calle.
  • Errores de codificación, que ocurren si por ejemplo se asigna mal la categoría a un libro.
  • Errores de omisión, cuando el operador no rellena algunos campos.

Estos errores se pueden prevenir y mitigar al desarrollar una aplicación. Por ejemplo, para evitar los errores de transcripción, los números de DNI o de una cuenta bancaria tienen información redundante. Si en el formulario de captura se hacen las validaciones correspondientes usando de los algoritmos de verificación, es posible detectar esos errores en el momento de introducirlos y dar la oportunidad de corregirlos. Los errores de omisión se pueden mitigar haciendo obligatorios los campos considerados como esenciales.

En la captura automática también puede haber errores, cosa que percibimos cuando integramos dos sistemas de información diferentes. Por ejemplo, puede suceder que el campo para la dirección postal en un sistema acepte 60 caracteres y en el otro 40. Si pasamos datos del primer sistema al segundo, puede haber direcciones largas que queden recortadas, ya que el operador las habrá escrito con la comodidad de tener espacio suficiente. También puede haber errores de codificación como los que estamos acostumbrados a ver en el correo electrónico cuando los servidores y los clientes de correo no se ponen de acuerdo en la codificación de caracteres a utilizar y nos aparecen símbolos inadecuados en lugar de las vocales acentuadas.

Puede haber otros errores como la duplicidad de registros o la disparidad de criterios entre los operadores de la misma aplicación acerca del significado de un campo. La casuística de errores en la captura de datos puede ser muy amplia, pero para el presente artículo la muestra presentada sirve para llamar la atención sobre la importancia de la captura de datos en los Sistemas de Información, ya que los datos son el punto de partida en la cadena de la que estamos hablando, y si no tienen la calidad suficiente el resto se malogrará. Es como querer preparar una comida con malos ingredientes.

El segundo eslabón en la cadena es la información. Pero, ¿qué es la información? ¿No es acaso lo mismo que los datos? Según la Teoría de la Información formulada por Claude Shannon, “un bit de información es lo que reduce la incertidumbre a la mitad”[1]. Sólo se necesita un bit de información para indicar si una cuenta bancaria está bloqueada o no. Podemos ver fácilmente que para que los datos se conviertan en información deben tener la capacidad de disminuir la incertidumbre, y esto depende mucho del problema a resolver. Por ejemplo, si en un ERP se debe determinar si se autoriza el pedido de un cliente, el dato de su estatura no reduce la incertidumbre, pero con los datos de su límite de crédito y el saldo actual sí que se reduce la incertidumbre. Vemos que los datos tienen que ser relevantes para que sean información.

Por otra parte, supongamos que en un sistema de estudio climático captamos datos de temperatura de una multitud de termómetros esparcidos por una región, pero que desconocemos la hora a que fueron tomadas. Tenemos los datos de las temperaturas pero no nos sirven porque les falta el contexto.

Por lo tanto, sólo con los datos relevantes y con el contexto adecuado, que también es un conjunto de datos, podemos hablar de que disponemos de información. Esto significa que estar informado no es lo mismo que tener muchos datos.

Luego, con la información podemos obtener conocimiento. Este es un proceso humano mediante el cual extraemos modelos y leyes, identificamos patrones, en definitiva obtenemos conocimiento que luego influenciarán en nuestra conducta, ya que nos influenciará al tomar decisiones. Para esto es necesario que la información esté bien representada, que sea completa y que se pueda analizar y consultar según se van formulando diferentes hipótesis.

Actualmente se reconoce el valor que tienen los sistemas de inteligencia de negocio o de Business Intelligence (BI) reuniendo datos de distintos sistemas y ofreciendo la información mediante informes, consultas interactivas, herramientas de exploración y análisis multidimensionales. El propósito del BI es en definitiva tener mejor información para comprender y tomar mejores decisiones, decisiones informadas.

Pero como hemos visto, para conseguir este objetivo soñado por todas las organizaciones tenemos que trabajar desde los orígenes de los datos, desde el diseño de los sistemas transaccionales que van a ser la fuente del BI. Estos sistemas tienen que tener datos de calidad, relevantes y con contexto. Y estos datos deben mantenerse actualizados según las entidades del mundo real van cambiando.  Si en nuestra organización vamos a encarar un proyecto de BI es necesario que como parte inicial del mismo consideremos si los datos con los que se va a alimentar reúnen estos requisitos.

No obstante, debemos considerar que los proyectos de BI deben ser hechos siguiendo metodologías ágiles, es decir con ciclos de análisis, desarrollo e implantación cortos. La razón no es sólo operativa sino también cognitiva. Es importante que los usuarios puedan ir explotando la información relevante generada por el sistema de BI en un período de tiempo razonable y sin que haya grandes inversiones de por medio. Esa es la razón operativa. Pero también ocurre que en la medida en que los usuarios del sistema de BI explotan la información que éste produce, son capaces de mejorar su comprensión del modelo de trabajo de la organización e incluso hacerlo evolucionar, introducir cambios, entender mejor los factores del entorno, en definitiva, desarrollar conocimiento. Esta una mejora cognitiva y debido a ella surgirán nuevas necesidades de información. Por ejemplo, comprender la relevancia de un factor que antes se sospechaba poco influyente causará que se quiera definir una nueva dimensión para el análisis, lo que a su vez puede producir cambios en cascada en cómo se captura y se trata la información en los sistemas que alimentan el BI.

Cuando diseñamos una estrategia en Sistemas de Información, debemos mantener una visión integral, fresca y evolutiva para llegar a elaborar un cuerpo de conocimientos que nos permitan mejorar nuestra actividad y alcanzar las metas deseadas.

Referencias

[1] A Mathematical Theory of Communication.

 

One thought on “De los datos al conocimiento

  1. Pingback: En los datos, la calidad importa | Liberix Information Technologies