La competencia por desarrollar el modelo de inteligencia artificial más potente se intensifica con la llegada de LLaMA 2. Meta, la compañía de Mark Zuckerberg, ha anunciado la disponibilidad de su nueva IA de código abierto, que está ahora disponible de forma gratuita para uso comercial e investigativo.
El anuncio se realizó durante el evento Inspire de Microsoft, una alianza estratégica que permite el acceso a LLaMA 2 a través de Azure AI. Con este movimiento, Meta se enfrenta directamente a GPT-4, el modelo de lenguaje que impulsa a ChatGPT, y refuerza su posición en el campo de la inteligencia artificial, donde Google también ha logrado avances significativos con PaLM 2 y sus aplicaciones especializadas, como Med-PaLM 2.
LLaMA 2 destaca por el reconocimiento de Meta de la alta demanda de modelos de lenguaje de código abierto. Esta valoración surgió tras la filtración de LLaMA 1 en marzo pasado, lo que impulsó la proliferación de iniciativas de código abierto que pueden desarrollarse, ejecutarse y mantenerse sin enormes inversiones económicas.
Meta ha anunciado que pondrá a disposición los parámetros y el código inicial del modelo preentrenado, así como versiones conversacionales optimizadas de LLaMA 2. Además de Azure, la IA estará disponible en otras plataformas como Hugging Face y AWS.
LLaMA 2 ha experimentado un crecimiento significativo en comparación con su predecesor. Meta afirma que se entrenó con un 40% más de datos y tiene el doble de extensión de contexto que LLaMA 1.
Según Meta, los modelos preentrenados de LLaMA 2 fueron entrenados con 2 billones de tokens, mientras que las versiones conversacionales optimizadas se basaron en más de 1 millón de anotaciones humanas. Para satisfacer diferentes necesidades, se han lanzado tres tamaños del modelo de lenguaje, con 7,000, 13,000 y 70,000 millones de parámetros.
La liberación de LLaMA 2 como un proyecto de código abierto forma parte de la estrategia de Meta para promover la transparencia y la accesibilidad. Además, la compañía busca ganar un espacio importante en la comunidad de desarrolladores e investigadores, brindando una opción a aquellos que no pueden acceder a tecnologías propietarias como GPT-4 de OpenAI o PaLM 2 de Google debido a limitaciones técnicas o económicas.
Es probable que en un futuro próximo veamos más alternativas basadas en LLaMA 2, como potenciadores de ChatGPT y Bard, entre otras implementaciones. Meta sabe que tiene un potencial interesante en el mundo del código abierto, mientras que Microsoft busca demostrar que su enfoque en IA no se limita a su inversión en OpenAI y diversificar sus esfuerzos en este campo.