El procesamiento del lenguaje natural es una parte de la inteligencia artificial que se ocupa de la interacción entre los seres humanos y los ordenadores. El objetivo principal del procesamiento del lenguaje natural es permitir una interacción personas-máquinas que aproveche la capacidad de cálculo y almacenamiento de los ordenadores y ponerlas al servicio de un conjunto de tareas. Dichas tareas pueden agruparse en la comprensión e interpretación del lenguaje, por una parte, y la generación de lenguaje, por otra.
Ejemplos de aplicaciones específicas del procesamiento del lenguaje natural son la extracción de información, el resumen y la simplificación de textos, el reconocimiento de entidades, el análisis del sentimiento y la opinión, la traducción automática, la clasificación automática de documentos y la síntesis de voz.
Hasta hace unos pocos años, las aplicaciones del procesamiento del lenguaje natural se basaban exclusivamente en la lingüística computacional, es decir, en el tratamiento informático de datos lingüísticos por medio de técnicas de recopilación y análisis de corpus (colecciones de textos de millones de palabras), así como en el desarrollo de programas específicos para el análisis del lenguaje.
La última década ha visto cómo la inteligencia artificial está resolviendo problemas de procesamiento del lenguaje natural. La inteligencia artificial es una disciplina informática que se ocupa de desarrollar sistemas y programas capaces de imitar la inteligencia humana.
La inteligencia artificial se organiza en campos que recuerdan las capacidades humanas, como son el aprendizaje automático, la visión por ordenador, la ingeniería de robots, el razonamiento, la planificación, los agentes inteligentes y el procesamiento del lenguaje natural.
Hay dos grandes corrientes en la inteligencia artificial. Una tiene por objetivo resolver tareas específicas. Otra está orientada a la creación, conocida como inteligencia artificial generativa. La inteligencia artificial generativa utiliza algoritmos y modelos para generar distintos tipos de contenido, como imágenes, música, vídeos y texto. Algunas aplicaciones generalizadas de la inteligencia artificial, como son los asistentes virtuales, los traductores automáticos, los gestores de redes sociales y recomendaciones, los motores de búsqueda y los asistentes de voz y escritura, la han convertido en un ingrediente de nuestra vida cotidiana. La generalización del uso de grandes modelos de lenguaje como ChatGPT ha supuesto un salto cualitativo porque ha permitido a millones de usuarios llevar la inteligencia artificial generativa a un amplísimo conjunto de tareas.
Innovación educativa. En este contexto, la Universidad de La Rioja está implantando una oferta educativa orientada a la capacitación de profesionales en el ámbito de la confluencia de la inteligencia artificial con la lingüística computacional y el procesamiento del lenguaje natural. Esta oferta se suma a la que ya ha consolidado la Universidad de La Rioja en ingeniería informática, inteligencia artificial y ciencia de datos.
Por lo tanto, se ha optado por un perfil distintivo y completamente innovador en el panorama de la formación superior de España: títulos oficiales en aplicaciones de la inteligencia artificial lingüística orientados a personas con cualquier tipo de formación, incluidas las de humanidades, ciencias sociales y biomédicas.
Se ha hecho un esfuerzo por formar equipos docentes interdisciplinares lingüística-informática y para adaptar la formación a personas sin conocimientos previos de computación ni de programación.
La primera edición del Máster en Procesamiento del Lenguaje e Inteligencia Artificial ha tenido un éxito que demuestra la validez de este enfoque, tanto en captación de estudiantes como en la superación del programa formativo. En efecto, el Máster, que incluye materias de computación y programación, anotación de corpus, aprendizaje automático, procesamiento del lenguaje y casos de uso de la inteligencia artificial en ámbitos como la ciberseguridad, las transacciones financieras, el turismo y la síntesis de voz, emprende en el curso 2023-2024 su segunda edición con treinta personas matriculadas y encara la conversión en máster oficial tras haber sido verificado por la Agencia Nacional para la Evaluación de la Calidad y la Acreditación (ANECA), que realiza una evaluación previa a la implantación de los títulos universitarios.
Precisamente en proceso de verificación de ANECA se encuentra el Grado en Lingüística Computacional y Tecnología del Lenguaje, que la Universidad de La Rioja acomete como una acción de captación de talento a nivel nacional, ya que es el único título de estas características que va a impartir en este momento la universidad española. Este grado, además, se va a ofrecer en formación dual, es decir, con parte de las actividades formativas en empresas tecnológicas, en las que los estudiantes adquieren parte de su formación en un medio de ejercicio profesional real y con un contrato retribuido. Las compañías tecnológicas riojanas Bosonit, Gnoss e Hiberus, así como la Fundación DIALNET, forman parte del proyecto y aportan su capacidad formativa, su experiencia y sus medios al empeño de dotar al tejido empresarial regional de los profesionales que demanda.
Cursos especializados en inteligencia artificial. Junto con los títulos oficiales de grado y máster, la Universidad de La Rioja ha puesto en marcha un programa de cursos de especialización en inteligencia artificial aplicada al procesamiento del lenguaje, que se propone tanto dar una formación complementaria al estudiantado de los títulos oficiales, como crear una comunidad de enseñanza y aprendizaje que reúna a estudiantes, profesorado, profesionales y empresas en torno a la economía digital del lenguaje, que está reconocida como línea estratégica por el Gobierno de España a través del Plan de Recuperación, Transformación y Resiliencia de la Unión Europea Nueva economía de la lengua, el cual se propone aprovechar el potencial del español y de las lenguas cooficiales como factor de crecimiento económico y competitividad internacional.
Estos cursos de especialización, de entre 20 y 40 horas de formación en formato virtual o semipresencial, han versado hasta ahora de computación y programación básica, redes neuronales artificiales, herramientas visuales para la lingüística computacional y programación con Python.
Hay previstos ya cursos de ingeniería del prompt, estadística para procesamiento del lenguaje, FileMaker y Excel para tratamiento de datos lingüísticos, anotación semántico-sintáctica para procesamiento del lenguaje y creación y explotación de modelos de lenguaje, entre otros. Se ha previsto un curso por mes, con contenidos que pueden consultarse en detalle en www.unirioja.es/plan-de-transformacion/economia-digital-del-lenguaje/actividades/.
Por último, se están llevando acciones de dinamización de los títulos orientadas, entre otros aspectos, a la captación de estudiantes españoles y extranjeros. En los últimos meses se ha presentado el programa formativo en numerosas universidades europeas y americanas, con las que ya se han planificado eventos conjuntos y se están elaborando convenios de colaboración. También las sociedades y asociaciones científicas que se ocupan del lenguaje y su procesamiento están colaborando en esta labor.
La Sociedad Española para el Procesamiento del Lenguaje Natural, la Asociación Española de Lingüística Aplicada, la Sociedad de Lingüística Española y la Asociación Española de Lingüística de Corpus, así como la Asociación Internacional de Lingüística Aplicada, van a participar en un evento que marque el principio de una colaboración basada en los objetivos e intereses compartidos en torno a la nueva economía de la lengua.
En definitiva, se están dando pasos dirigidos a incrementar el perfil internacional de la Universidad de La Rioja, que trata de convertirse en un centro internacional de referencia para el tratamiento computacional del lenguaje, incluida la inteligencia artificial.