Encabezado: Si basura entra, basura sale. >
"Si basura entra, basura sale: la importancia de contar con datos de calidad"
Esp. Sebastián Zaballa

Si nunca oíste hablar sobre esto, si tu familia, amigos o compañeros de trabajo nunca te dijeron nada y si hasta incluso lo buscaste en Instagram y lo más cercano que encontraste fue acerca del “cuidado del gato”, esta nota es para vos.

Por más que nunca hayas abordado el tema particularmente, es algo que hacés a diario. A veces bien, otras no tanto y en ocasiones hasta mal, pero no te asustes porque no es de forma voluntaria, sino porque quizás, aún no lo tenés incorporado. 

Por eso, es nuestro deber e intención, que luego de esta guía, entiendas un poco más sobre la calidad del dato, que forme parte de  tu vida y que, así como incorporaste el celular, puedas aplicarlo y hacer que otros lo hagan.

Para ello, primero, debemos entender qué quiere decir…

¿Qué es la Calidad del Dato?

Veamos algunas definiciones según la Real Academia Española

Calidad: propiedad o conjunto de propiedades inherentes a algo, que permiten juzgar su valor, tanto en forma negativa como positiva. En criollo, quiere decir que podemos determinar si algo es bueno, malo o más o menos.

Dato: información dispuesta de manera adecuada para su tratamiento por un ordenador. La verdad es que la definición es literalmente del diccionario, no necesariamente solo lo trata un ordenador o computadora, sino que nosotros, los humanos, tratamos todos los días con los datos, lo que decimos y escribimos son datos, incluso acciones pueden ser datos para otros. Es interesante diferenciar entre dato e información, esta última es aquel dato que nos es útil para tomar alguna decisión.

Son muy lindas las definiciones, ¿pero aún no se entiende cómo aplicarlo a la realidad? Veamos un ejemplo:

Suena el despertador un domingo a la mañana, ¿qué pasó? Para mí no es, yo los domingos no me tengo que levantar temprano, ¿lo habrá puesto mi pareja? 

Analicemos lo que pasó: si no es para mí, que el despertador que haya sonado es solo un dato, no le doy importancia, me doy vuelta y sigo durmiendo. Pero si lo puso  mi pareja, en ese caso sí es importante, porque  es información que le permitirá decidir levantarse, quedarse un ratito más en la cama o seguir durmiendo y aceptar las consecuencias. Ahí hablamos sobre el dato, pero ¿dónde está la calidad?

Supongamos que me pidieron que ponga el despertador el día anterior y me dijeron a qué hora debía hacerlo; podrían darse tres situaciones: la primera, me olvidé, pero como sonó, eso no pasó. La segunda lo programé a otra hora, o por último, lo puse correctamente. ¡Qué bueno, encontramos la calidad! Claramente, los dos primeros escenarios son de mala calidad, por culpa mía y por alguna razón, no escuché o lo hice mal, interpreté otra hora, etc. En la tercera situación tenemos una buena calidad.

Aunque es más complejo que este ejemplo, no está  tan lejos del sentido común. El objetivo de esta nota es  ayudar a entender  por qué es importante la calidad del dato, a detectar los posibles orígenes de su mala calidad y cómo prevenirlos.

¿Por qué se recopilan los datos?

Básicamente los datos, los recopilamos para:

- Registro: durante la acción diaria registramos lo que hacemos, ya sea para el ahora o para el después. Los registros pueden ser variados, por ejemplo, el estado de salud de los pacientes internados, peticiones de muestras de sangre, prescripciones de medicamentos e informes, entre otros. Pueden ser para nosotros y para otros, como así también, para el futuro inmediato o no.

- Apoyo: en el proceso de atención sanitaria de los pacientes, por ejemplo, durante  una ronda de quienes están internados, los médicos a cargo van por las habitaciones y leen los datos registrados por otras personas (enfermeros, técnicos, otros médicos, etc.), o equipos (instrumentos de monitoreo), para la toma de decisiones. Otro caso, podría ser en una visita en el consultorio donde el profesional lee la historia clínica del paciente para apoyarse en diagnósticos previos, medicación o diferentes datos que figuren en ella.

- Mejora: en el tiempo y con el funcionamiento de nuestra organización sanitaria, se registran inventarios, prácticas, procesos (médicos y administrativos), costos, etc. Estos registros además del apoyo para el cuidado y tratamiento del paciente, sirven para  análisis, trabajos de investigación, optimización de procedimientos, entre otros  y eso  nos permite mejorar. 

“Para todo necesitamos de los datos.”

En la generación de datos deberíamos asegurar que la calidad  sea la adecuada para su utilización actual y futura. Entonces, en base a la definición de la Calidad del Dato y lo visto ahora, podemos definirla como la adecuación del mismo para un uso particular o específico. Es así que diremos que un dato es de calidad cuando es efectivo.

¿Por qué es importante la Calidad del Dato?

Para poder medirla necesitamos cumplir una serie de parámetros que se denominan dimensiones o medidas de la calidad de datos.

Estas dimensiones se clasifican en:

- Completitud: todos los eventos importantes (datos), relacionados con la atención clínica han sido registrados, sin obviar ninguno. No es más ni menos que completar todos los datos que nos solicitan y en forma correcta. Por ejemplo, cuando nos piden llenar un formulario y tenemos campos que son obligatorios.

- Conformidad: Los datos tienen formatos que se adhieren a estándares, convenciones o normativas vigentes. Registrar el dato en base a estándares, locales o internacionales, según corresponda. Por ejemplo, temperatura corporal, peso en adultos y en niños o bebés, periodo de embarazo, etc.

- Consistencia: libres de contradicciones y coherente con otros datos en un contexto de uso específico. Por ejemplo, cuando nos preguntan si tenemos fiebre, respondemos afirmativamente y contestamos o registramos 36°, entonces algo está mal.

- Exactitud: se representa correctamente el verdadero valor del atributo deseado de un concepto. 

- Unicidad: que ninguna entidad existente en los registros esté duplicada. Que no haya duplicidad, si tenemos un maestro de pacientes que sea uno solo, luego se puede utilizar en varios lugares.

- Integridad: cuando todas las referencias entre atributos de distintas entidades están completas, deben estar relacionados en forma correcta y coherente.

Para entender estos últimos dos parámetros pongamos un ejemplo: tengo un archivo de Excel y en la primera solapa el registro de los pacientes que atiendo con sus datos personales, por unicidad se entiende que no voy a tener dos solapas con la misma información, ya que me puede pasar que lo actualice en una y no en la otra.

Ahora bien, supongamos que en otra solapa, registro los signos vitales de mis pacientes cuando vienen a una consulta, ¿cómo me referencio a mi paciente en esta nueva solapa? Puedo utilizar por ejemplo el DNI en las dos solapas, donde en la primera lo hago como clave para identificar cada fila y en la segunda, como referencia a la primera, ¡eso cumple con la integridad!

“La calidad de nuestras decisiones y planes será tan buena como la de los datos en los que nos basamos.”

Orígenes de la mala Calidad del Dato

Ese input o registro puede darse por:

Datos de entrada: son  la mayor fuente de errores, pueden ser: tipográficos, falta de comunicación o importancia, desconocimiento del negocio, humano, mecánico por un mal calibrado del equipo, un mal diseño que nos lleva al segundo input, entre otros.

Errores en el diseño: mala implementación de la lógica o validaciones incorrectas de los datos tratados. Supongamos que debemos registrar la hora y minutos en los que se realizó la práctica y donde lo debemos registrar solo nos permite poner la hora.

Datos de origen externo: que no pasen previamente por mecanismos de validación propios. Hay que revisarlos o asegurarnos de dónde provienen. Igual no viene nada mal tomar una muestra y validarlos. Imaginemos que los análisis de laboratorio son realizados en una entidad externa a nuestra institución,  nos los envían en forma electrónica y necesitamos incorporarlos a nuestro sistema. Las primeras veces debemos controlar que se ingresen bien y cada tanto realizar un chequeo.

Incorporación de nuevas aplicaciones: se desconoce, o no se tienen en cuenta los estándares de la organización. Lo que antes mencionamos cuando definimos   integridad.

Migraciones de datos: ¿cuándo las realizamos? Por ejemplo, en la actualización de versiones en los aplicativos, no analizar bien los cambios implicados, siempre debe sumar, no restar. Es decir, que en el caso en que los datos se reduzcan hay que guardarlos, los eliminados son irrecuperables.

Más claro échale agua

Si tuviéramos que resumir toda la nota en una frase podríamos decir que, tal y como se plantea en el título: si basura entra, basura sale, en colores y prolija, pero no deja de ser basura.

La calidad de la salida está determinada por la calidad de la entrada. Es importante tenerlo siempre presente, desde el momento de la carga hasta la recepción de un mail, estamos llenos de datos pero no tenemos garantizada su calidad.