Revista de Marina
Última edición
Última edición

Modelos generativos con aplicaciones en la industria naval y militar

  • JULIO ESPINOZA LLANOS

Por JULIO ESPINOZA LLANOS

  • Fecha de recepción: 13/11/2024
  • Fecha de publicación: 30/04/2024. Visto 331 veces.
  • Resumen:

    Detectar defectos en el acero es vital para la industria naval y militar. Los modelos de Deep Learning necesitan cuantiosos datos para ser entrenados que son escasos. Este artículo usa redes generativas adversarias convolucionales profundas para crear imágenes sintéticas de defectos en el acero, idénticas a las reales, ampliando y diversificando conjuntos de datos para entrenar modelos de clasificación. Esta técnica es viable, beneficiosa y prometedora para mejorar los sistemas de control de calidad en diversos ámbitos de la industria.

  • Palabras clave: Deep Learning, GAN, DCGAN, classification.
  • Abstract:

    Identifying defects in steel manufacture is vital for the shipbuilding and military industry. Deep Learning models lack sufficient data for training, in addition to the time-consuming nature of this task. This article explains the use of deep convolutional adversarial generative networks (DCGAN) to create synthetic images of steel defects, identical to real ones, by expanding and diversifying data to train classification models. This technique is feasible, beneficial, and promising for improving quality control systems in various fields of this industry.

  • Keywords: deep learning, DCGAN, Deep Learning, classification models.

En un mundo donde las imágenes generadas por inteligencia artificial han causado revuelo y controversia, es fácil olvidar el potencial positivo de esta tecnología. Es más, últimamente las imágenes “fake” creadas con Inteligencia Artificial han provocado confusión e incluso problemas políticos o sociales importantes, llevando a pensar que esta tecnología es indeseable. En el ámbito naval, donde la calidad y la resistencia del acero son muy importantes, la inteligencia artificial puede desempeñar un papel crucial y beneficioso para la industria.

En la industria naval y militar, la detección precisa de defectos en el acero es esencial para garantizar la seguridad y la eficacia de nuestros buques y vehículos. Los modelos de Deep Learning (DL) pueden ser de gran ayuda en esta tarea, pero a menudo se ven obstaculizados por la falta de datos suficientes para su entrenamiento y el excesivo tiempo que consume esta tarea.

Este artículo se centra en la inspección de láminas de metal, específicamente en la mejora de modelos de clasificación de imágenes de defectos superficiales en acero. En este contexto, la solución complementaria podría residir en la misma tecnología que ha causado tanta controversia: la generación de imágenes mediante inteligencia artificial, en especial con redes generativas o GAN´s.

Al utilizar redes generativas profundas para aumentar los datos de entrenamiento de modelos de clasificación, podemos superar las limitaciones de la disponibilidad de datos y proporcionar un conjunto amplio y diverso de imágenes para entrenar los clasificadores. Los resultados de este artículo demuestran la viabilidad de generar imágenes artificiales de defectos en el acero que son indistinguibles de las reales, lo que podría tener implicaciones significativas para la industria naval y las Fuerzas Armadas, que, con una implementación correcta, esta tecnología podría revolucionar la forma en que mantenemos e inspeccionamos el acero en estos sectores críticos.

Redes Generativas Adversarias (GANs): Las redes generativas adversarias, conocidas como GANs, han revolucionado el campo del aprendizaje automático no supervisado, especialmente en la generación de imágenes realistas. Para facilitar las cosas, imaginemos dos capitanes de barcos piratas en un juego de engaño. Uno, el “generador”, crea mapas falsos del tesoro, mientras que el otro, el “discriminador”, se esfuerza por distinguir los mapas reales de los falsos. Con cada ronda, el generador se vuelve más hábil en la creación de mapas que parecen auténticos, y el discriminador se vuelve más astuto en la detección de los falsos. Este es el principio detrás de las GANs.

En términos más técnicos y sin entrar en detalles, el objetivo de las GANs es que el generador produzca imágenes tan convincentes que el discriminador no pueda distinguir entre las imágenes reales y las generadas. Esto se logra a través de un proceso de retroalimentación en el que el generador mejora constantemente en base a las críticas del discriminador (Goodfellow, 2014), todo ello mediante una función objetivo como score.

Las aplicaciones de las GANs son diversas y fascinantes. De hecho, han sido utilizadas para crear imágenes de personas que no existen, para transferir estilos artísticos de una imagen a otra, e incluso para generar imágenes de alta resolución a partir de bocetos. Sin embargo, es importante recordar que las imágenes producidas por las GANs son simplemente simulaciones generadas por la red, y no representan objetos o personas reales, sin embargo, llegaron a establecerse como una técnica prominente en el campo del aprendizaje automático no supervisado.

Ejemplos claros de aplicación de esta técnica fueron el caso de la famosa imagen del Sumo Pontífice vistiendo una chaqueta blanca que confundió a todos sus seguidores, como también imágenes de caras de personas que realmente no existen (Ilustración 3) o incluso aplicaciones en la transferencia de estilos artísticos, donde se transfieren las características predominantes del estilo artístico de un pintor a una imagen real cualquiera (Ilustración 4: Transfer Style GAN (Elaboración propia).Ilustración 4). En efecto, el producto de estos modelos es solo una sintetización de imágenes creadas por generalización de un modelo GAN.

DCGAN: Deep Convolutional Generative Adversarial Networks: Un año después del surgimiento de las redes generativas adversarias (GANs), Radford y Metz publicaron un artículo en 2015 titulado “Aprendizaje de representación no supervisada con redes generativas adversarias convolucionales profundas”. Este trabajo introdujo una mejora significativa a los modelos GANs mediante el uso de redes convolucionales profundas, conformando las Deep Convolutional Generative Adversarial Networks o DCGANs (Radford & Metz, 2015).

Las DCGANs son capaces de generar imágenes de alta calidad y resolución al aprender representaciones más abstractas y complejas de los datos (Ilustración 5). En términos generales, un modelo DCGAN funciona de la misma manera que un modelo GAN. Sin embargo, la parte generadora del DCGAN está compuesta por capas convolucionales transpuestas que permiten expandir las imágenes para aumentar su resolución. También incluye capas de normalización que estabilizan y aceleran el entrenamiento, lo que resulta en una mayor calidad de las imágenes generadas. Por otro lado, el componente discriminador del modelo DCGAN está compuesto por capas de convolución que pueden aplicar filtros a las imágenes para capturar un mapa de características.

Las DCGANs han demostrado ser efectivas en la generación de imágenes realistas en una amplia gama de áreas, incluyendo el reconocimiento de objetos, la síntesis de rostros, y la generación de paisajes o arte. Además, su arquitectura ha sentado las bases para desarrollos futuros en el campo de las GANs.

Aplicación de DCGAN en la industria naval para control de defectos en metal: Para darle aplicabilidad al estado del arte, en este artículo se utilizó una DCGAN para crear imágenes de defectos en el acero que no existen en la realidad. Estas imágenes se pueden usar para entrenar a otros modelos de inteligencia artificial que se encarguen de detectar y clasificar los defectos en el acero, por ejemplo, la corrosión. De esta forma, se puede mejorar la calidad del control de calidad en la industria del acero, sin necesidad de tener cuantiosas imágenes reales de defectos.

Para hacer esto, se usó una base de datos de imágenes de defectos en el acero llamada Surface Defect Database de la Universidad Northeastern (NEU), que tiene 1.800 imágenes de 6 tipos de defectos diferentes. En este estudio, solo se usó el tipo de defecto llamado “scratches” (Ilustración 6 En naranjo) como producto mínimo viable. Los pasos que se siguieron fueron los siguientes:

O    Preparación de los datos: Se cambiaron las imágenes de formato* BMP de 200 pixeles a uno más pequeño de 64 pixeles. También se normalizaron los valores de los colores de las imágenes entre 0 y 1, para que el entrenamiento fuera más rápido.

O    Configuración del modelo: Se definió el tamaño del ruido, que es un factor que influye en la variedad y el detalle de las imágenes generadas. También se definió el número de iteraciones que se repite en el entrenamiento, para ver cómo mejora la calidad de las imágenes. Y finalmente se ajustaron los parámetros de aprendizaje y de las capas convolucionales, para darle profundidad al modelo.

Resultados

En la siguiente imagen se puede apreciar el estilo de una muestra real perteneciente al dataset original descargado para entrenar al modelo, de manera tal de poder visualizar y comparar diferencias con las imágenes generadas sintéticamente.

Es evidente la evolución de la sintetización desde las primeras iteraciones hasta las últimas 6.000, pasando desde imágenes pixeladas hasta llegar a una imagen casi indistinguible en comparación con las reales.

Por otra parte, se asume que 6.000 iteraciones son suficientes para tener buenos resultados sin mayor esfuerzo computacional en un tiempo prudente de 20 minutos, lo que hace que esta técnica sea práctica y accesible. Por lo tanto, la implementación de DCGANs representa una estrategia prometedora para mejorar la precisión y eficacia de los modelos de clasificación en la industria del acero, contribuyendo a un control de calidad más riguroso y confiable.

Conclusiones

Los modelos generativos, como las redes generativas adversarias convolucionales profundas (DCGANs), tienen un potencial significativo para mejorar y transformar la eficacia de los sistemas de control de calidad en la industria naval y las Fuerzas Armadas. Aunque estos modelos pueden generar contenido visual ficticio pero realista, su aplicación en la industria es beneficiosa y prometedora.

En este estudio, se utilizó un modelo DCGAN para ampliar un conjunto de datos de defectos en el acero. Los resultados resaltan la similitud casi imperceptible entre las imágenes generadas y las reales, lo que reafirma la viabilidad de esta técnica para su implementación en la industria naval y militar.

La generación de imágenes sintéticas de defectos superficiales en el acero utilizando el modelo DCGAN tiene un alto potencial para superar las limitaciones asociadas con la disponibilidad de datos. Es más, al proporcionar un conjunto ampliado y diverso de imágenes, se puede mejorar la implementación de modelos de clasificación con inteligencia artificial.

Esta técnica, aunque se aplicó inicialmente a la inspección de fallas de la producción de acero, tiene un alto potencial en diversas áreas de la industria naval y las Fuerzas Armadas. Podría ser particularmente útil para mejorar los modelos de detección de fallas de soldadura, la identificación de corrosión y el control de incendios, entre otros.

En resumen, la implementación de DCGANs en la industria naval y las Fuerzas Armadas podría revolucionar la forma en que se entrena un modelo de Machine Learning o Deep Learning, permitiendo disponer de una mayor cantidad de datos de entrenamiento y, en última instancia, mejorar la precisión y eficacia de los sistemas de control de calidad.

Bibliografía

  1. Goodfellow, I. J. (2014). Generative adversarial Nets. Arxiv.
  2. John, M. (2023). Medium. Obtenido de https://medium.com/swlh/dcgan-under-100-lines-of-code-fc7fe22c391
  3. Radford, A., & Metz, L. (2015). Unsupervised Representation Learning With Deep Convolutional Generative Adversarial Networks. ICLR.
  4. Zhang, A., Lipton, Z., & Smola, A. (2022). Dive into deep learning.

Inicie sesión con su cuenta de suscriptor para comentar.-

Comentarios

Artículos Relacionados

Modelo de clasificación de corrosión basado en Deep Learning
CIENCIA Y TECNOLOGÍA

Modelo de clasificación de corrosión basado en Deep Learning

La corrosión es un problema común en la industria que puede provocar fallas en equipos y estructuras, resultando en pérd...

Modelos generativos adversarios con aplicaciones en la industria del acero
CIENCIA Y TECNOLOGÍA

Modelos generativos adversarios con aplicaciones en la industria del acero

Todos hemos visto últimamente cómo las imágenes “fake” creadas con inteligencia artificial han provocado confusión e inc...