La Higiene del Dato: El Secreto Mejor Guardado de la Digitalización Documental

  • Tribuna de opinión

Higiene

¿Qué tienen en común un médico del siglo XIX y la digitalización? La respuesta está en la higiene, pero esta vez aplicada a los datos. Así lo señala Jesús Cabañas, director regional para Iberia de PFU, en este artículo de opinión.

Inma Cons Pombo, consultora jurídica, Kalaman ConsultingJesús Cabañas, director regional para Iberia, 
PFU, A RICOH COMPANY


Ignaz Semmelweis (1818-1865) fue un médico húngaro cuyos estudios salvaron millones de vidas. Por ello, lo llamaron “El Salvador de Madres”. Su idea era simple y lógica para nosotros hoy, pero muy innovadora en su tiempo. Ignaz descubrió que cuando los médicos y matronas se lavaban las manos y seguían ciertas medidas de higiene, menos pacientes morían después del parto (en ese entonces, entre el 10% y el 35% fallecían). Sin embargo, otros médicos de la época se centraban más en los instrumentos y procesos, y desacreditaban a Ignaz porque su teoría los hacía responsables de esas muertes. Solo con los descubrimientos de Pasteur y la invención de la asepsia se reconoció que Ignaz tenía razón.

No es el foro para hablar de problemas médicos, pero si para evidenciar la importancia de la higiene del dato para que los procesos que se quieren automatizar funcionen de forma eficiente y el proceso ni enferme ni muera.

Al igual que en el siglo XIX los médicos no eran conscientes de las diversas situaciones que podían contaminar sus manos y menos de sus nefastas consecuencias. Hoy en día muchas administraciones no son conscientes de los problemas que puede acarrear una descuidada “higiene documental” a la hora de afrontar la automatización de diversos procedimientos. La higiene del dato debe convertirse en prioritaria pues será la garantía de que esta automatización sea eficaz y eficiente.

Es precisamente esta necesidad de higiene del dato la que nos lleva a enfocar la digitalización de cualquier proceso administrativo de un modo holístico que nos permita controlar la ingesta de documentación en la organización distinguiendo los diferentes canales.

En el canal presencial la administración debe compaginar una atención exquisita y rápida con un cierto control que permita asegurarse de que los datos necesarios son correctos y la calidad de la documentación es la adecuada. Para ello es importante que dispongan de los dispositivos adecuados para hacer la ingesta rápida (se pueda escanear todo tipo de documentación desde un único dispositivo, pasaportes, A4, IDs, Libros de Familia, etc..) y fiable (control de dobles alimentaciones y problemas de calidad). Para nosotros como fabricantes nuestra obsesión en los equipos de la nueva serie fi-8000 estas dos reglas son la obsesión de nuestros ingenieros.

Por su parte el canal online ha traído tantas ventajas para el ciudadano como problemas para la administración, ya que se pierde el control de la calidad del documento que se recibe. Hoy en día es posible escanear un documento de muchas maneras y cuando accedemos a las bases de datos de imágenes nos encontramos para un mismo documento sorprendentes variaciones en tamaño (50K a 10MB) y en calidad de la imagen. La calidad, que a la postre es lo que necesitamos para extraer datos fiables, viene determinada por la impresora donde se imprime el formulario online y por el dispositivo de escaneo. Los problemas de falta de tóner y mantenimiento en equipos doméstico suelen provocar documentos muy sucios, con manchas y líneas verticales. Estos formularios son posteriormente escaneados una vez que el usuario lo ha rellenado o firmado. A la hora del escaneado las opciones son muchas más; foto de móvil, App de escaneado móvil, multifuncional o escáner documental (el gran desconocido). Esta variabilidad afecta claramente a la legibilidad del documento, la calidad del dato y la eficiencia del proceso.

Cabe recordar que por mucho que se implanten sistemas de RPA y de automatización estos necesitan datos fiables, si los datos son erróneos no puede esperarse una salida con éxito.

Un enfoque holístico como el que proponen muchos expertos y como el que ofrecemos desde PFU bajo el nombre de i-DCS, parece que emerge como una garantía de que las iniciativas de optimización de procesos con las nuevas herramientas de RPA e IA sean operativas. Esto al igual que lo que proponía Ignaz implica un alto grado de disrupción ya que hace consciente de que para una correcta higiene del dato tanto el Hardware, Software y Servicios deben estar alineados. Solo de este modo podremos conseguir que los procesos administrativos que se pretendan automatizar sean eficientes y eficaces.

Si bien las imágenes de mala calidad son un problema, también es cierto que los últimos avances de la IA en el campo de la visión artificial han generado nuevas herramientas de OCR/ICR/HTR que han aumentado mucho la fiabilidad de la lectura en los últimos 2 años. Una correcta elección de la tecnología de reconocimiento puede suponer la diferencia entre que sea viable o no digitalizar un proceso.

También las herramientas de captura de datos y extracción de información han evolucionado muchísimo permitiendo a las organizaciones optar por tecnología en la nube para construir su propia herramienta utilizando servicios online como AWS, Google o Microsoft, o bien trabajar con soluciones On-prem como ABBYY que, sin necesidad de tirar líneas de código, permitan que usuarios no técnicos puedan explotar una plataforma de captura transversal a toda la organización. De hecho, este tipo de plataformas transversales emergen como una gran oportunidad en muchas áreas tan demandantes de recursos humanos. Una plataforma transversal permitiría abrir un nuevo porfolio de servicios para áreas de soporte que por simple evolución puedan estar con menor carga de trabajo. ¿Por qué no convertir el centro de reprografía en un centro de servicios de transformación digital? ¿Por qué no cambiar la mentalidad para que los centros reciban documentos y en lugar de más documentos devuelvan datos de calidad a los procesos?

En los últimos 2 años la tecnología de captura de datos y extracción de información potenciada por la IA ha evolucionado de una forma sin igual. Las tecnologías de escaneo inteligentes de última generación nos permiten mejorar la experiencia del ciudadano, no solo con la ingesta de cualquier tipo documental sino garantizando la correcta higiene en los datos extraídos. Por otro lado, estas mismas tecnologías llevadas al entorno de digitalización masiva (como nuestra serie fi 8950) nos están permitiendo afrontar con un mínimo coste los proyectos de digitalización de archivo histórico. Este paso referido como el “Big Scan” nos permitirá desmaterializar los archivos físicos y convertirlos en activos digitales muy valiosos para las administraciones públicas. No solamente eliminaríamos el elevado coste que supone la custodia documental, sino que con las herramientas adecuadas se puede realizar una explotación efectiva de dichas fuentes documentales.

La transformación de las imágenes y documentos recibidos a través de los diferentes portales de atención al ciudadano con OCRs cognitivos de última generación que garanticen la máxima higiene de los datos son sin duda uno de los grandes retos que hay que acometer como paso previo a su explotación. Las herramientas de captura en sus diferentes versiones combinadas con las tecnologías RPA, el uso de modelos de tratamiento PLN y la nueva IA Generativa son sin duda la base para construir unos procesos administrativos eficientes en recursos y eficaces en su función. La adecuada implementación acompañada de la capacitación adecuada al personal permitirá aumentar exponencialmente la productividad interna al mismo tiempo que mejorar los tiempos de atención al ciudadano y se les da un trato impecable.

La digitalización de los diferentes procesos administrativos en los que están inmersas muchas de las administraciones es un paso complejo y que no está exento de problemas culturales y materiales. La higiene de los datos provenientes de los diferentes canales de atención al ciudadano es algo que debe preocupar a los responsables tecnológicos ya que puede ser la diferencia entre que un proceso termine eficazmente y con éxito o que nazca enfermo ocasionando gastos innecesarios e imprevistos tanto a la administración como al ciudadano. Este foco en la calidad del dato debe estar presente en todas las fases del proceso desde la ingesta documental pasando por la extracción hasta la explotación. Este mismo foco en la higiene del dato debe hacerse presente en las mesas de contratación de Hardware y Software, ya que una adjudicación de equipamiento Hw o Sw basada únicamente en precio sin contemplar su implicación en la higiene del dato y la experiencia del usuario puede provocar que les pase como a los colegas de Ignaz que el proyecto acabe en la tumba simplemente por no tener en cuenta algo tan sencillo y lógico como esa higiene documental.