Puntos clave para la Ingesta de Datos en la Industria 4.0

Iván Martín González

La Ingesta de datos de infraestructuras OT es la capa de digitalización básica en la Industria 4.0. Se trata de recabar datos e información de los activos, equipos y sistemas que forman parte de la planta de producción para ser capaces de monitorizarla, tratarla y visualizarla, y extraer una ventaja de ellos.

Esto da pie al control y diagnóstico de los procesos, análisis delos datos, y permite desplegar disciplinas de Inteligencia Artificial como el Big Data o Machine Learning para la detección de anomalías, mantenimiento predictivo, la optimización de procesos o la eficiencia energética.

¿Cómo es un proceso de Ingesta de Datos industrial?

La arquitectura de un proceso de Ingesta de Datos comienza con una pregunta: ¿Qué infraestructuras queremos monitorizar? Los equipos industriales que queramos monitorizar y diagnosticar serán sobre los que trabajemos.

El proceso comenzará con un enlace que se genera desde estos dispositivos hasta un servidor en el que se recaba la información extraída.

A partir de este proceso de captación del dato y envío, esa información se almacena y aparecen dos posibilidades: visualizarla y/o aplicar casos de aprendizaje automático.

Es decir, mostrarla en una herramienta unificada, con dashboards personalizados en los que podemos navegar por toda esa información de forma inteligente para sacarle partido; y desarrollar aprendizajes automáticos, que ayuden a predecir incidencias, funcionamiento, etc.

 

¿Cuáles son los puntos clave en un proceso de Ingesta de Datos?

Vayamos, fase por fase, viendo qué decisiones deberemos tomar para diseñar una buena arquitectura de datos y qué tener en cuenta.

Lectura de datos en campo: sistemas de extracción.

¿Cómo obtenemos esos datos? Hay distintas formas de captar estos datos de los equipos y la elección de una u otra dependerá del tipo de información que se quiera obtener de ellos.

¿Cuánto hay que profundizar en el hardware que realiza tu proceso productivo para obtener el dato? Si hay que modificar el programa del equipo determinado para sacar un dato, necesitaremos un método intrusivo. Sin embargo, si desde un equipo externo podemos preguntar el dato al equipo y estelo devuelve, serán sistemas menos intrusivos.

Esto hay que tenerlo en cuenta porque puede afectar al rendimiento del equipo o sobrecargar la red, ya que estamos solicitando más funcionalidad a su core.

Cuando hablamos de métodos más intrusivos, son por ejemplo Bus de Campo o TCP/IP Sockets.

Por otro lado, están los que hacen de concentradores de la información y que nos permiten extraer los datos con menos consumos y menos carga, como puede ser a través de PLC u OPC UA.

Ante esto, la primera elección será conocer qué tipos de datos necesito obtener de esos equipos para determinar a qué nivel de profundidad he de llegar para extraerlo.

 

Tratamiento de datos, ¿cuáles aplicar?

Una vez el equipo envía el dato, este se procesa, pudiendo aplicar tratamientos u operaciones sobre él. Las más comunes, y que otorgan un gran abanico de posibilidades en la aplicación posterior de inteligencia sobre el dato son:

Alertas: configuración de eventos que nos notifiquen cambios específicos en datos determinados. Se trataría de información sobre laque queremos ser reactivos y nos permite tener un histórico de las situaciones anómalas que suceden en el proceso.

Agregación: se trata de generar nuevos datos enriquecidos a partir de la combinación de otras variables. Es habitual que el dato en bruto no nos sirva de indicativo, si no que tenga que ser relacionado con otros para darnos una validez.

Conversión: transformar los valores de esos datos porque sea necesaria una conversión de las unidades de medida o corrección de esa medida.

Normalización: se trata de definir una unificación de escalas para poder comparar valores y medidas extraídas de distintos dispositivos en igualdad.

Las tecnológicas de automatización y digitalización como Mytra trabajan en campo con cliente para determinar todos estos tratamientos del dato, de la mano de expertos en monitorización digital de activos y el verdadero conocedor del proceso industrial específico.

 

Flujo de datos, ¿cómo enviar la información?

Se trata del movimiento de datos allá donde se quieran almacenar para realizar el tratamiento, visualización u enriquecimiento.

La tecnología con la que se realice este envío de datos la seleccionaremos teniendo en cuenta cómo de cerca del Real Time necesitemos que esté el dato. Dependiendo del uso que se le dé, deberá variar la velocidad y frecuencia del envío del dato.

En este punto, diferenciamos entre:

Streaming (flujo). Cuando hablamos del envío en tiempo real de toda la información. Es un proceso que está continuamente en sucesión, por lo que llevará consigo una carga constante de la red, un mayor coste…

Batch (lotes). La información se procesa en paquetes de datos, -en lotes-, cada vez que se alcance un evento determinado. Este evento puede ser alcanzar un determinado volumen de datos, un periodo de tiempo o cada vez que suceda algo que marquemos. Este método relaja la red de comunicación puesto que no está continuamente circulando información.

¿Dónde enviar ese dato?

La siguiente decisión a la que enfrentarse es decidir dónde queremos almacenar esa información: servidores propios o la nube.

Los servidores propios se conocen como un almacenamiento On-premise. En este caso, se tiene un mayor control sobre la infraestructura que guarda el dato.

Cloud: almacenar la información en la nube permite acceder a ella desde cualquier lugar, la escalabilidad del proyecto.

 

En el caso de las infraestructuras Cloud, existen plataformas IoT preparadas para desarrollar esta monitorización con aplicaciones estándar, (como IoT Central de Azure); o el desarrollo de una infraestructura personalizada para modelar esa monitorización y diagnóstico.

 

Explotación de dato: ¿Cómo saco partido de toda la información?

Una vez contamos con toda la información y datos de nuestros activos, sistemas y procesos, tenemos varias opciones.

La primera es la visualización de esos datos: el Dashboarding. Interfaz para la explotación visual de los datos, que ayude al análisis y control del proceso, recursos y mantenimiento.

El siguiente paso sería la aplicación de Machine Learning, el aprendizaje automático del sistema en base a toda la información recibida, y que se ha integrado en la Industria 4.0. Gracias a esta disciplina de la Inteligencia Artificial se pueden crear casos de uso para reducir costes, agilizar producción, optimizar recursos, labores de mantenimiento, eficiencia energética…

 

Si quieres conocer el proceso de Ingesta de Datos y las decisiones que se toman en todo el proceso, en base a los objetivos, pueden ver el Webinar de ingesta de datos: No Data, No Gain que realizaron nuestros especialistas:

Automatización
Data Streaming
IoT

¿Te ha gustado?

Compártelo en redes sociales

Subscríbete
a nuestra newsletter

Mantente al día de todas las novedades Mytra: proyectos, eventos, noticias…

Descubre más

Ver más contenido

Suscríbete a

nuestra newsletter

Mantente al día de todas las novedades Mytra: proyectos, eventos, noticias…