Una red neuronal es un método de inteligencia artificial (IA) que enseña a los ordenadores a procesar datos inspirándose en el cerebro humano. Es un tipo de proceso de aprendizaje automático, denominado aprendizaje profundo, que utiliza nodos o neuronas interconectados en una estructura en capas que se asemeja al cerebro humano.
El ejemplo que nos ocupa es un caso real, un algoritmo de identificación de roturas en pantallas de móvil. El sistema, mediante IA, permite evaluar el estado de la pantalla del teléfono, y detectar grietas y roturas. Gracias a los enormes avances en IA, el objetivo del proyecto era detectar fisuras en los dispositivos móviles, con el objetivo de valorar, a modo de peritaje, si se pueden asegurar por una compañía de seguros.
Ratio de éxito
Se pretendía mejorar el modelo de red neuronal con tecnología TensorFlow que ofrece como resultado: “Móvil OK” / “Móvil KO”. El estudio fue realizado por los ingenieros de Delonia tras cuatro semanas de trabajo, a lo que siguió más de un año de refinamiento y entrenamiento. Una de las conclusiones fue que el algoritmo utilizado hasta entonces no era eficiente y que un algoritmo basado en el modelo de predicción RESNET permitía alcanzar un porcentaje de acierto muy superior. El ratio de éxito pasaba del 40% al 64% y se reducía la “no respuesta” a un marginal 3%.
El modelo de red neuronal implementado era una variante de LeNet y no era capaz de diferenciar en un tanto por ciento elevado los patrones de móvil OK (móvil con pantalla en perfecto estado) y móvil KO (móviles con grietas en la pantalla).
El modelo RESNET mostró mayor eficacia a la hora de resolver el problema propuesto. Hoy en día se puede incorporar en procesos de tiempo real sin impacto significativo en los tiempos de respuesta (por ejemplo, en la suscripción de pólizas de seguros).
Se ha desarrollado un modelo diferente de detección de grietas (RESNET) que ha resultado ser más eficiente, al diseñar el algoritmo en la determinación de existencia de patrones asociados a roturas ópticas de cristales.
Corrección de errores
La principal solución alternativa se ha conseguido tras trabajar en dos puntos críticos en las pantallas de los móviles que generan la mayoría de los errores: el ruido alrededor del móvil y el recuadro del centro de la pantalla. Para solucionar el ruido alrededor del móvil basta con mejorar el algoritmo de recorte. En lo que respecta al centro de la pantalla, es posible no mostrarlo en el momento de la captura. Otra opción es quitar peso a las predicciones de esa zona. Se incorpora un algoritmo adicional de detección de esquinas para lograr una imagen completa.
Tras dos años de entrenamiento se alcanzó una automatización de más del 90% de los procesos analizados.
¿Cómo se utilizan las redes neuronales y los sistemas de “machine learning”?
- Definir los aspectos que el sistema de IA ha de conocer o decidir. Por ejemplo, identificar grietas en cristales. Hay que enseñar qué es una grieta y qué no lo es.
- Un sistema sin entrenar acierta en un 50% de los casos por mera probabilidad (random). Gracias al entrenamiento, la IA (a veces llamada algoritmo) mejora sus aciertos. Al añadir fuente de datos ampliamos su “conocimiento”.
- El aprendizaje no es un proceso constante. Se pueden producir disociaciones (el sistema no es capaz de entender). La entropía (incapacidad de encontrar patrones) también empeora el ratio de aciertos (el sistema “desaprende”). En el caso de identificar grietas en cristales, se controla la entropía al quitar imágenes poco nítidas, se crean excepciones y se asegura una “homogenización”. El objetivo es que la máquina sea más certera.
- El ratio de acierto pasa de un 50% a un 80% en un año y llega al 95% en dos años. A partir de aquí el proceso se puede automatizar porque la máquina se equivoca en un porcentaje similar al de un ser humano. Es posible alcanzar ratios de acierto del 98%.
Conclusión
- El estadio inicial de cualquier IA es como el de un recién nacido, carente de acierto o afinidad.
- El aprendizaje depende de muchos factores, pero en ningún caso se puede suprimir un tiempo suficiente de entrenamiento, que en el caso que nos ocupa fue de casi dos años.
- Tras el aprendizaje, se consiguen porcentajes muy altos de acierto (>90%) lo que permite pasar a fases de automatización. La máquina reemplaza al humano pero siempre con medidas de control y auditoría.