Meta calienta la carrera armamentista de IA de la gran tecnología con un nuevo modelo de lenguaje

24 feb (Reuters) – Meta Platforms Inc (META.O) lanzó el viernes a los investigadores un nuevo modelo de lenguaje grande, el software central de un nuevo sistema de inteligencia artificial, calentando una carrera armamentista de IA a medida que las grandes compañías tecnológicas se apresuran a Integrar tecnología en sus productos y atraer inversores.

La batalla pública para dominar el espacio de la tecnología de IA comenzó a fines del año pasado con el lanzamiento de ChatGPT de OpenAI respaldado por Microsoft y ha llevado a los pesos pesados ​​de la tecnología desde Alphabet Inc (GOOGL.O) hasta Baidu Inc de China (9888.HK) a anunciar sus propios ofrendas .

LAMA de Meta, abreviatura de Large Language Model Meta AI, está disponible bajo una licencia no comercial para investigadores y organizaciones afiliadas al gobierno, la sociedad civil y la academia. Un blog.

Los grandes modelos de lenguaje extraen grandes cantidades de texto para resumir información y generar contenido. Pueden responder preguntas, por ejemplo, con oraciones que se pueden leer como si estuvieran escritas por humanos.

Últimas actualizaciones

Ver 2 historias más

El modelo, que según Meta requiere «mucho menos» poder de cómputo que las ofertas anteriores, fue entrenado en 20 idiomas con alfabetos latino y cirílico.

«El anuncio de hoy de Meta parece ser un paso adelante en la prueba de sus capacidades creativas de inteligencia artificial para que puedan implementarlas en sus productos en el futuro», dijo Gil Luria, analista senior de software de DA Davidson.

«La IA generativa es una nueva aplicación de IA con la que Meta tiene poca experiencia, pero que es claramente importante para el futuro de su negocio».

READ  Las orcas han interrumpido una carrera de botes cerca de España en la última muestra de comportamiento peligroso y caótico.

La IA se ha convertido en un punto brillante para las inversiones en el sector de la tecnología, cuyo lento crecimiento ha provocado despidos generalizados y un recorte en las carreras experimentales.

Meta dijo que LAMA puede superar a los competidores que examinan más parámetros o variables que el algoritmo tiene en cuenta.

En particular, afirmó que una versión de LAMA con 13 mil millones de parámetros superaría a GPT-3, un predecesor reciente del modelo estructurado ChatGPT.

Describió su modelo LAMA de 65 mil millones de parámetros como «competitivo» con Chinchilla70B y PalM-540B de Google, que es más grande que el modelo que Google usó para demostrar su búsqueda impulsada por el chat de Bart.

Un portavoz de Meta atribuyó el rendimiento a una gran cantidad de datos «más limpios» y «mejoras arquitectónicas» al modelo que mejoraron la consistencia del entrenamiento.

Meta lanzó el modelo de lenguaje grande OPT-175B en mayo del año pasado, dirigido a investigadores, que formó la base de una nueva iteración de su chatbot BlenderBot.

Más tarde introdujo un modelo llamado Galactica, que podía escribir artículos científicos y resolver problemas matemáticos, pero rápidamente retiró la demostración después de producir respuestas incorrectas que parecían oficiales.

Información de Yuvraj Malik y Eva Mathews en Bangalore y Katie Paul en Nueva York; Editado por Shailesh Kuber y Grant McCool

Nuestros estándares: Principios de confianza de Thomson Reuters.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *