L'industrie de l'IA entre dans une guerre de cent modèles, le seuil technologique Goutte mais des défis commerciaux subsistent.

robot
Création du résumé en cours

La "guerre des cent modèles" dans le domaine de l'IA : des problèmes académiques aux problèmes d'ingénierie

Le mois dernier, l'industrie de l'IA a connu une "guerre des animaux".

D'un côté, il y a le modèle Llama lancé par Meta, qui est très apprécié de la communauté des développeurs en raison de sa nature open source. De l'autre, il y a un grand modèle appelé Falcon. En mai, Falcon-40B a été lancé, surpassant Llama et atteignant le sommet du classement des LLM open source.

Ce classement est élaboré par la communauté des modèles open source, fournissant un ensemble de normes pour évaluer les capacités des LLM et établir un classement. Le classement est essentiellement dominé par Llama et Falcon qui alternent en tête. Après le lancement de Llama 2, la famille Llama a repris l'avantage ; début septembre, Falcon a lancé la version 180B, atteignant à nouveau un classement plus élevé.

Il est intéressant de noter que les développeurs de Falcon proviennent de l'Institut de recherche sur l'innovation technologique d'Abou Dabi, la capitale des Émirats arabes unis. Les autorités émiriennes ont déclaré qu'elles s'engagent dans ce domaine pour perturber les acteurs clés.

Aujourd'hui, le domaine de l'IA est entré dans une phase de "chaos total" : les pays et les entreprises ayant des ressources financières travaillent tous à la création de leurs propres grands modèles de langage. Rien qu'au sein des pays du Golfe, il n'y a pas qu'un seul acteur. En août, l'Arabie Saoudite a récemment acheté plus de 3000 puces H100 pour ses universités, afin de former des LLM.

La situation florissante de l'industrie de l'IA peut être attribuée à l'article "Attention Is All You Need" publié par Google en 2017. Cet article a révélé l'algorithme Transformer, qui est devenu le moteur clé de cette vague actuelle d'IA. Tous les grands modèles actuels, y compris la série GPT qui a choqué le monde, sont basés sur la technologie Transformer.

L'émergence des Transformateurs a considérablement ralenti la vitesse d'innovation des algorithmes de base dans le domaine académique. Des éléments d'ingénierie tels que l'ingénierie des données, l'échelle de calcul et l'architecture des modèles deviennent des facteurs importants dans les compétitions d'IA. Toute entreprise technologique ayant une certaine capacité technique peut développer de grands modèles.

Cependant, le fait d'entrer sur le marché facilement ne signifie pas que tout le monde peut devenir un géant à l'ère de l'IA. La compétitivité clé des grands modèles open source réside dans une communauté de développeurs active. La série Llama de Meta est devenue le baromètre des LLM open source, et de nombreux modèles ont été développés sur cette base.

En même temps, l'écart de performance reste évident. Dans les derniers tests d'AgentBench, GPT-4 a obtenu un score de 4,41, loin devant, tandis que les autres LLM open source se situent généralement autour de 1 point. Cet écart provient de l'expérience accumulée par des équipes de scientifiques de premier plan et de recherches à long terme.

En plus des défis technologiques, la rentabilité est également un grand problème. Actuellement, la plupart des entreprises d'IA sont confrontées à un déséquilibre grave entre les coûts et les revenus. On estime que les entreprises technologiques mondiales investiront 200 milliards de dollars par an dans les infrastructures de grands modèles, tandis que les revenus devraient atteindre seulement 75 milliards de dollars, créant un énorme fossé.

Dans l'ensemble, le domaine de l'IA est en train de passer d'un problème académique à un problème d'ingénierie. Bien que la barrière à l'entrée ait été abaissée, la véritable création de valeur et le succès commercial font encore face à de nombreux défis. Les futurs gagnants pourraient ne pas seulement dépendre du modèle lui-même, mais également avoir besoin de percées dans les cas d'utilisation, la construction d'écosystèmes et les modèles commerciaux.

GPT-0.65%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 6
  • Reposter
  • Partager
Commentaire
0/400
liquidation_watchervip
· Il y a 17h
La guerre des modèles est en cours
Voir l'originalRépondre0
MevTearsvip
· 08-12 10:44
Les paramètres de performance ne sont pas une vérité absolue.
Voir l'originalRépondre0
TokenTherapistvip
· 08-12 10:43
La concurrence technologique est vraiment intense.
Voir l'originalRépondre0
ApeWithNoFearvip
· 08-12 10:40
À quoi sert de courir pour le classement ?
Voir l'originalRépondre0
TooScaredToSellvip
· 08-12 10:35
Les barrières commerciales sont plus importantes.
Voir l'originalRépondre0
GasWastervip
· 08-12 10:22
Un grand modèle est amusant
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)