El ingeniero informático Mikel Ferrero Jaurrieta (Pamplona, 1995) ha desarrollado nuevos métodos para mejorar la manera en que la inteligencia artificial procesa información con el fin de hacerla más sensible al orden de las palabras y que así sea capaz de entender mejor el contexto y los matices de los textos. Esto mejora su capacidad para tareas como identificar si el tono de un escrito es positivo o negativo, determinar si un mensaje es “spam” o no y clasificar de forma automática diferentes tipos de documentos técnicos, tal como recoge en su tesis doctoral, defendida en la Universidad Pública de Navarra (UPNA).
Para operar de manera efectiva, la inteligencia artificial depende del procesamiento de información, cuyas tareas básicas son la comparación, la ordenación y la fusión. Estos cometidos se vuelven más complejos cuando los datos tienen múltiples dimensiones o factores. La tesis de Mikel Ferrero plantea nuevos procedimientos para manejar esta complejidad, permitiendo a las computadoras ordenar, comparar y fusionar información de manera más efectiva al tener en cuenta cómo interactúan entre sí diferentes partes de los datos.
En concreto, el investigador aplica nuevos métodos de fusión de información en un campo de la inteligencia artificial: las redes neuronales, que son sistemas informáticos inspirados en el funcionamiento del cerebro humano. En concreto, existe un desafío en el procesamiento de textos: “la importancia del orden de las palabras o frases, especialmente, cuando hay una dependencia temporal entre ellas”, según Mikel Ferrero. Por ejemplo, en un texto, una palabra puede tener un significado diferente dependiendo de las que la preceden o la siguen (así, en la frase “no es bueno”, esta última palabra pierde su carácter positivo, debido a las que se sitúan por delante), y esto es “crucial para entender correctamente el mensaje”.
Con el fin de abordar “este desafío”, Mikel Ferrero ha desarrollado nuevos operadores de fusión de información no-simétricos. En las redes neuronales convencionales, se utilizan operadores simétricos, que tienen dificultades para captar la importancia del orden entre las palabras. Por el contrario, los métodos no simétricos para combinar información de diferentes partes del texto consideran que el orden importa, ya que no tratan todas las combinaciones de palabras por igual. Dichos métodos permiten a las redes neuronales analizar el texto teniendo en cuenta la importancia del orden de las palabras y cómo se relacionan entre sí temporalmente. Esto mejora la capacidad de las computadoras para tareas como identificar el tono emocional de un texto, determinar si un mensaje es correo no deseado y clasificar diferentes tipos de documentos como patentes o preguntas.
La tesis doctoral de Mikel Ferrero ha sido dirigida por Carlos López Molina, profesor del Departamento de Estadística, Informática y Matemáticas de la UPNA, y Zdenko Takác, docente de la Universidad Tecnológica Eslovaca en Bratislava (Eslovaquia). Además, la investigación ha recibido financiación de la empresa pública Tracasa Instrumental, la Agencia Estatal de Investigación y el Fondo Europeo de Desarrollo Regional (FEDER).
Mikel Ferrero es graduado en Ingeniería Informática por la UPNA (2018) y Máster en Modelización e Investigación Matemática, Estadística y Computación por las universidades Pública de Navarra, Zaragoza y País Vasco (2020).
A lo largo de su trayectoria profesional, ha trabajado en Tesicnor S.L., Hiberus Tecnología, Centro Nacional de Tecnología y Seguridad Alimentaria (CNTA), UPNA (Fondo Documental de la Memoria Histórica en Navarra) y Tracasa Instrumental.
Durante su tesis doctoral, realizada en el grupo de investigación en Inteligencia Artificial y Razonamiento Aproximado (GIARA), ha publicado seis artículos en revistas consideradas de prestigio en el área de Ciencias de la Computación e Inteligencia Artificial como “Engineering Applications of Artificial Intelligence”, “IEEE Transactions on Fuzzy Systems” o “Information Fusion” y ha recibido dos premios en conferencias internacionales. Es también coautor de quince trabajos tanto en congresos nacionales como internacionales.