AI sektöründe yüzlerce model savaşı başlıyor, teknik engeller düşüş gösteriyor ancak ticari zorluklar hâlâ mevcut.

robot
Abstract generation in progress

AI alanındaki "yüz model savaşı": akademik bir sorun olmaktan mühendislik sorununa dönüşüm

Geçen ay, AI endüstrisinde bir "hayvan savaşı" patlak verdi.

Bir taraf, Meta tarafından piyasaya sürülen Llama modelidir; açık kaynak özellikleri sayesinde geliştirici topluluğunun büyük beğenisini kazanmıştır. Diğer taraf ise Falcon adında büyük bir modeldir. Mayıs ayında, Falcon-40B piyasaya sürüldü ve Llama'yı geride bırakarak açık kaynak LLM sıralamasında zirveye yerleşti.

Bu liste, açık kaynak model topluluğu tarafından hazırlanmıştır ve LLM yeteneklerini ölçmek için bir standart sunmakta ve sıralama yapmaktadır. Sıralama temelde Llama ve Falcon'un sırayla listeyi domine etmesiyle oluşmaktadır. Llama 2'nin piyasaya sürülmesiyle, Llama ailesi bir puan kazanmıştır; Eylül ayı başında Falcon 180B versiyonunu piyasaya sürdüğünde, bir kez daha daha yüksek bir sıralama elde etmiştir.

İlginçtir ki, Falcon'un geliştiricisi Birleşik Arap Emirlikleri'nin başkenti Abu Dabi'deki Teknoloji İnovasyon Araştırma Enstitüsü'dür. BAE yetkilileri, bu alana katıldıklarını, temel oyuncuları devirmek için olduğunu belirtti.

Artık AI alanı "kaos içinde dans" aşamasına girdi: maddi güce sahip ülkeler ve şirketler, kendi büyük dil modellerini oluşturuyor. Körfez ülkeleri arasında birden fazla oyuncu var. Ağustos ayında, Suudi Arabistan yerel üniversiteler için 3000'den fazla H100 çipi satın aldı, LLM eğitimi için.

AI endüstrisindeki bu çeşitliliğin nedeni, 2017'de Google'ın yayımladığı "Attention Is All You Need" makalesidir. Bu makale, Transformer algoritmasını ortaya koyarak bu AI dalgasının kilit itici gücü oldu. Şu anda tüm büyük modeller, dünyayı şaşkına çeviren GPT serisi de dahil olmak üzere, Transformer temeli üzerine inşa edilmiştir.

Transformer'ın ortaya çıkışı, akademik alandaki temel algoritma yenilik hızını büyük ölçüde yavaşlattı. Veri mühendisliği, hesaplama ölçeği, model mimarisi gibi mühendislik unsurları, AI yarışmalarında önemli faktörler haline gelmektedir. Belirli bir teknik yeterliliğe sahip teknoloji şirketleri, büyük modeller geliştirebilmektedir.

Ancak, girişin kolay olması herkesin AI çağında dev olabileceği anlamına gelmez. Açık kaynaklı büyük modellerin temel rekabet gücü, aktif geliştirici topluluğundadır. Meta'nın Llama serisi, açık kaynak LLM'lerin yön göstericisi haline geldi ve birçok model buna dayanarak geliştirildi.

Aynı zamanda, performans farkı hala belirgin. En son AgentBench testinde, GPT-4 4.41 puanla açık ara önde, diğer açık kaynak LLM'lerin puanları genellikle 1 civarında. Bu fark, üst düzey bilim insanı ekiplerinin ve uzun süreli araştırma birikimlerinin deneyiminden kaynaklanıyor.

Teknik zorlukların yanı sıra, kâr elde etmek de büyük bir sorun. Şu anda, çoğu AI şirketi maliyet ile gelir arasında ciddi bir dengesizlikle karşı karşıya. Küresel teknoloji şirketlerinin her yıl büyük model altyapısına 200 milyar dolar yatırım yapacağı tahmin ediliyor, ancak beklenen gelir yalnızca 75 milyar dolar, büyük bir açık var.

Genel olarak, AI alanı akademik bir sorun olmaktan mühendislik sorununa dönüşmektedir. Giriş engelleri azalmasına rağmen, gerçek değer yaratma ve ticari başarı hala birçok zorlukla karşı karşıyadır. Gelecekte başarılı olanlar yalnızca modelin kendisine değil, aynı zamanda uygulama senaryoları, ekosistem geliştirme ve iş modeli konularında da atılımlar yapmak zorunda kalacaklar.

GPT-0.17%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 5
  • Repost
  • Share
Comment
0/400
MevTearsvip
· 08-12 10:44
Performans parametreleri katı bir gerçek değildir.
View OriginalReply0
TokenTherapistvip
· 08-12 10:43
Teknolojik rekabet gerçekten çetin.
View OriginalReply0
ApeWithNoFearvip
· 08-12 10:40
Ön sıralamada yer kaplamanın ne faydası var?
View OriginalReply0
TooScaredToSellvip
· 08-12 10:35
Ticari engeller daha önemlidir
View OriginalReply0
GasWastervip
· 08-12 10:22
Büyük modeller eğlencelidir.
View OriginalReply0
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)