Los grandes modelos de lenguaje están revolucionando la inteligencia artificial. En el campo de la medicina, podrían ofrecer nuevas herramientas para mejorar el acceso a la información, el diagnóstico, el tratamiento y la investigación.
A partir de GPT-3.5 de OpenAI
Los últimos años se produjo un avance exponencial en el campo de la inteligencia artificial, especialmente en el área de los grandes modelos de lenguaje (LLMs). Estos modelos, capaces de generar texto, traducir idiomas, escribir diferentes tipos de contenido creativo y responder a preguntas de manera informativa, han revolucionado la forma en que usamos un conjunto de herramientas tecnológicas.
A partir del lanzamiento público de GPT-3.5 a fines de 2022, y fundamentalmente por el impacto y expectativas creadas, se produjeron un conjunto de avances, y una explosión en los LLMs. Este modelo, con 175 mil millones de parámetros, demostró una capacidad sin precedentes para comprender y generar texto. Los LLMs se convirtieron en una herramienta poderosa con muchísimas posibilidades de aplicación práctica, inclusive en el dominio de la medicina.
¿Qué ha cambiado desde GPT-3.5?
Desde entonces, los LLMs han evolucionado a un ritmo vertiginoso. Los modelos más recientes son más grandes, más precisos y capaces de realizar tareas de mayor complejidad. Algunas de las mejoras más notables incluyen:
- Mayor capacidad de razonamiento: los LLMs actuales pueden realizar tareas que requieren un alto nivel de razonamiento, como resolver problemas matemáticos o analizar datos complejos.
- Mejor comprensión del lenguaje natural: los modelos han mejorado significativamente su capacidad para comprender las sutilezas del lenguaje humano como la ironía, el sarcasmo y las metáforas y comprender otros lenguajes más allá del inglés.
- Mayor especialización: se incorporan capacidades o se desarrollan LLMs para dominios específicos, como el médico o el financiero.
- Multimodalidad: probablemente, uno de los aspectos más sorprendentes y que puede producir mayor impacto. Los LLM multimodales no solo procesan texto, sino que también integran imágenes, audio y otros tipos de datos, permitiendo una comprensión y generación de contenido más rica y compleja.
- Incorporación de agentes inteligentes: estos agentes no solo responden a consultas, sino que pueden ejecutar tareas complejas de manera autónoma, interactuando con diversos sistemas y plataformas.
- Desarrollo de técnicas y herramientas para acceso a información privada: una de las innovaciones más relevantes para el uso de LLM en entornos sensibles como el médico es la técnica de Retrieval-Augmented Generation (RAG). RAG combina la generación de lenguaje con la recuperación de información, proporcionando respuestas precisas y contextualizadas mientras maneja datos privados de manera segura.
- Diversidad de actores: además de OpenAI, y los modelos GPT4, GPT4o, hay otros actores, como Gemini, de Google; Claude, de Anthropic; Mistral, y los públicos, como los Llama 1, 2 y 3 en sus distintas versiones.
El impacto en la medicina
La posibilidad de aplicar los modelos de lenguaje natural (LLMs) en el ámbito médico promete facilitar el acceso a información digital para la atención al paciente. Se especula que estos modelos podrían impactar en varias áreas clave.
En la asistencia en el diagnóstico, podrían ayudar a los médicos a identificar posibles diagnósticos al analizar síntomas y resultados de pruebas, y corroborar rápidamente con literatura actualizada.
En cuanto a la educación y capacitación médica, permiten crear materiales educativos personalizados y responder a las preguntas de los estudiantes. Los profesionales de la salud podrían utilizar estos modelos para acceder rápidamente a la información médica más reciente.
Y en lo referido a la investigación médica, tienen el potencial de ayudar a los investigadores a analizar grandes cantidades de datos clínicos y volúmenes de literatura científica.
Desafíos y consideraciones éticas en el dominio de la medicina
A pesar de sus grandes promesas, la aplicación de los modelos de lenguaje natural (LLMs) en la medicina también plantea desafíos importantes como el sesgo, la privacidad y la responsabilidad.
En el caso del sesgo, pueden perpetuar los prejuicios presentes en los datos con los que son entrenados.
La privacidad es otro de los puntos cruciales; la protección de la información médica es fundamental, y se debe garantizar que los datos de los pacientes sean manejados de manera segura y confidencial.
Y finalmente, en lo referido a la responsabilidad también es vital, y necesario establecer marcos regulatorios claros para asegurar que los LLMs se utilicen de manera responsable y ética.
José Manuel Castaño
Especialista en Lingüística formal en la UBA, Ph.D. en Computer Science en Brandeis University (USA), docente e investigador, durante muchos años en distintas instituciones y niveles. Especialista en Inteligencia Artificial y Procesamiento del Lenguaje Natural. Trabaja en I+D en este área en el DIS del HIBA.