La industria de la IA entra en una guerra de cien modelos, la barrera técnica se reduce, pero aún existen desafíos comerciales.

robot
Generación de resúmenes en curso

La "batalla de los cien modelos" en el campo de la IA: de un problema académico a un problema de ingeniería

El mes pasado, estalló una "guerra de animales" en la industria de la IA.

Por un lado está el modelo Llama lanzado por Meta, que es muy bien recibido en la comunidad de desarrolladores debido a su naturaleza de código abierto. Por otro lado, está el modelo grande llamado Falcon. En mayo, se lanzó Falcon-40B, que superó a Llama y se posicionó en la cima de la lista de LLM de código abierto.

La lista fue elaborada por la comunidad de modelos de código abierto, proporcionando un conjunto de estándares para evaluar la capacidad de LLM y realizar clasificaciones. Básicamente, la tabla de clasificación es dominada alternadamente por Llama y Falcon. Tras el lanzamiento de Llama 2, la familia Llama recuperó terreno; a principios de septiembre, Falcon lanzó la versión de 180B, logrando una vez más una clasificación más alta.

Curiosamente, los desarrolladores de Falcon son del Instituto de Innovación Tecnológica de Abu Dabi, la capital de los Emiratos Árabes Unidos. Las autoridades de los Emiratos Árabes Unidos han declarado que participan en este campo para desafiar a los jugadores clave.

Hoy en día, el campo de la IA ha entrado en la etapa de "baile de demonios": los países y empresas con recursos están desarrollando sus propios modelos de lenguaje grande. Solo dentro del círculo de los países del Golfo, hay más de un jugador. En agosto, Arabia Saudita acaba de comprar más de 3000 chips H100 para universidades nacionales, destinados a entrenar LLM.

La diversidad en la industria de la IA se debe al artículo "Attention Is All You Need" publicado por Google en 2017. Este artículo presentó el algoritmo Transformer, que se ha convertido en el motor clave de la actual ola de entusiasmo por la IA. Actualmente, todos los modelos grandes, incluyendo la serie GPT que ha sorprendido al mundo, se basan en el Transformer.

La llegada del Transformer ha ralentizado considerablemente la innovación en los algoritmos fundamentales en el ámbito académico. Elementos de ingeniería como la ingeniería de datos, la escala de computación y la arquitectura de modelos se han convertido en factores importantes en la competencia de IA. Cualquier empresa tecnológica con una capacidad técnica adecuada puede desarrollar grandes modelos.

Sin embargo, que la entrada sea fácil no significa que todos puedan convertirse en gigantes de la era de la IA. La competencia central de los grandes modelos de código abierto radica en una comunidad de desarrolladores activa. La serie Llama de Meta se ha convertido en un referente para los LLM de código abierto, y muchos modelos se han desarrollado basándose en ella.

Al mismo tiempo, la diferencia de rendimiento sigue siendo evidente. En la última prueba de AgentBench, GPT-4 lidera con 4.41 puntos, mientras que los resultados de otros LLM de código abierto rondan alrededor de 1 punto. Esta brecha proviene de la experiencia acumulada por equipos de científicos de élite y años de investigación.

Además de los desafíos técnicos, la rentabilidad también es un gran problema. Actualmente, la mayoría de las empresas de IA enfrentan un grave desbalance entre costos e ingresos. Se estima que las empresas tecnológicas a nivel mundial invertirán 200 mil millones de dólares anualmente en infraestructura de modelos grandes, mientras que se espera que los ingresos sean de solo 75 mil millones de dólares, lo que genera una brecha enorme.

En general, el campo de la IA está experimentando una transición de un problema académico a un problema de ingeniería. Aunque la barrera de entrada se ha reducido, la verdadera creación de valor y el éxito comercial aún enfrentan numerosos desafíos. Los futuros ganadores pueden no depender únicamente del modelo en sí, sino que también necesitarán hacer avances en los escenarios de aplicación, la construcción de ecosistemas y los modelos de negocio.

GPT-2.62%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Republicar
  • Compartir
Comentar
0/400
liquidation_watchervip
· hace21h
La batalla de modelos está en curso
Ver originalesResponder0
MevTearsvip
· 08-12 10:44
Los parámetros de rendimiento no son una verdad absoluta.
Ver originalesResponder0
TokenTherapistvip
· 08-12 10:43
La competencia tecnológica es realmente intensa.
Ver originalesResponder0
ApeWithNoFearvip
· 08-12 10:40
¿De qué sirve la clasificación de carreras?
Ver originalesResponder0
TooScaredToSellvip
· 08-12 10:35
Las barreras comerciales son más importantes.
Ver originalesResponder0
GasWastervip
· 08-12 10:22
Un modelo grande es divertido.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)