# AI領域的"百模大戰":從學術難題到工程問題上個月,AI業界爆發了一場"動物戰爭"。一方是Meta推出的Llama模型,由於其開源特性,深受開發者社區歡迎。另一方則是名爲Falcon的大模型。5月,Falcon-40B問世,力壓Llama登頂了開源LLM排行榜。該榜單由開源模型社區制作,提供了一套測算LLM能力的標準並進行排名。排行榜基本上就是Llama和Falcon輪流刷榜。Llama 2推出後,Llama家族扳回一城;到9月初,Falcon推出了180B版本,又一次取得了更高的排名。有趣的是,Falcon的開發者是阿聯酋首都阿布扎比的科技創新研究所。阿聯酋官方表示,他們參與這個領域是爲了顛覆核心玩家。如今,AI領域已步入"羣魔亂舞"階段:有財力的國家和企業,都在打造自己的大語言模型。僅在海灣國家圈子內,就不止一個玩家。8月,沙特阿拉伯剛爲國內大學購買了3000多塊H100芯片,用於訓練LLM。AI業界這種百花齊放的局面,要歸功於2017年Google發表的《Attention Is All You Need》論文。該論文公開了Transformer算法,成爲此輪AI熱潮的關鍵推手。目前所有大模型,包括震驚世界的GPT系列,都建立在Transformer基礎之上。Transformer的問世,讓學術界的底層算法創新速度大大放緩。數據工程、算力規模、模型架構等工程要素,日漸成爲AI競賽的重要因素。只要有一定技術能力的科技公司,都可以開發出大模型。然而,入場容易並不意味着人人都能成爲AI時代的巨頭。開源大模型的核心競爭力在於活躍的開發者社群。Meta的Llama系列已成爲開源LLM的風向標,大量模型都基於它開發。同時,性能差距仍然明顯。在最新的AgentBench測試中,GPT-4以4.41分遙遙領先,而其他開源LLM的成績多在1分左右。這種差距源自頂尖科學家團隊和長期研究積累的經驗。除了技術挑戰,盈利也是一大難題。目前,大多數AI公司面臨成本與收入嚴重失衡的問題。據估計,全球科技公司每年將在大模型基礎設施上投入2000億美元,而預計收入僅750億美元,存在巨大缺口。總的來說,AI領域正經歷從學術難題到工程問題的轉變。雖然入場門檻降低,但真正的價值創造和商業成功仍面臨重重挑戰。未來的勝出者可能不僅僅依靠模型本身,更需要在應用場景、生態建設和商業模式上有所突破。
AI行業進入百模大戰 技術門檻降低但商業挑戰仍存
AI領域的"百模大戰":從學術難題到工程問題
上個月,AI業界爆發了一場"動物戰爭"。
一方是Meta推出的Llama模型,由於其開源特性,深受開發者社區歡迎。另一方則是名爲Falcon的大模型。5月,Falcon-40B問世,力壓Llama登頂了開源LLM排行榜。
該榜單由開源模型社區制作,提供了一套測算LLM能力的標準並進行排名。排行榜基本上就是Llama和Falcon輪流刷榜。Llama 2推出後,Llama家族扳回一城;到9月初,Falcon推出了180B版本,又一次取得了更高的排名。
有趣的是,Falcon的開發者是阿聯酋首都阿布扎比的科技創新研究所。阿聯酋官方表示,他們參與這個領域是爲了顛覆核心玩家。
如今,AI領域已步入"羣魔亂舞"階段:有財力的國家和企業,都在打造自己的大語言模型。僅在海灣國家圈子內,就不止一個玩家。8月,沙特阿拉伯剛爲國內大學購買了3000多塊H100芯片,用於訓練LLM。
AI業界這種百花齊放的局面,要歸功於2017年Google發表的《Attention Is All You Need》論文。該論文公開了Transformer算法,成爲此輪AI熱潮的關鍵推手。目前所有大模型,包括震驚世界的GPT系列,都建立在Transformer基礎之上。
Transformer的問世,讓學術界的底層算法創新速度大大放緩。數據工程、算力規模、模型架構等工程要素,日漸成爲AI競賽的重要因素。只要有一定技術能力的科技公司,都可以開發出大模型。
然而,入場容易並不意味着人人都能成爲AI時代的巨頭。開源大模型的核心競爭力在於活躍的開發者社群。Meta的Llama系列已成爲開源LLM的風向標,大量模型都基於它開發。
同時,性能差距仍然明顯。在最新的AgentBench測試中,GPT-4以4.41分遙遙領先,而其他開源LLM的成績多在1分左右。這種差距源自頂尖科學家團隊和長期研究積累的經驗。
除了技術挑戰,盈利也是一大難題。目前,大多數AI公司面臨成本與收入嚴重失衡的問題。據估計,全球科技公司每年將在大模型基礎設施上投入2000億美元,而預計收入僅750億美元,存在巨大缺口。
總的來說,AI領域正經歷從學術難題到工程問題的轉變。雖然入場門檻降低,但真正的價值創造和商業成功仍面臨重重挑戰。未來的勝出者可能不僅僅依靠模型本身,更需要在應用場景、生態建設和商業模式上有所突破。