# AI领域的"百模大战":从学术难题到工程问题上个月,AI业界爆发了一场"动物战争"。一方是Meta推出的Llama模型,由于其开源特性,深受开发者社区欢迎。另一方则是名为Falcon的大模型。5月,Falcon-40B问世,力压Llama登顶了开源LLM排行榜。该榜单由开源模型社区制作,提供了一套测算LLM能力的标准并进行排名。排行榜基本上就是Llama和Falcon轮流刷榜。Llama 2推出后,Llama家族扳回一城;到9月初,Falcon推出了180B版本,又一次取得了更高的排名。有趣的是,Falcon的开发者是阿联酋首都阿布扎比的科技创新研究所。阿联酋官方表示,他们参与这个领域是为了颠覆核心玩家。如今,AI领域已步入"群魔乱舞"阶段:有财力的国家和企业,都在打造自己的大语言模型。仅在海湾国家圈子内,就不止一个玩家。8月,沙特阿拉伯刚为国内大学购买了3000多块H100芯片,用于训练LLM。AI业界这种百花齐放的局面,要归功于2017年Google发表的《Attention Is All You Need》论文。该论文公开了Transformer算法,成为此轮AI热潮的关键推手。目前所有大模型,包括震惊世界的GPT系列,都建立在Transformer基础之上。Transformer的问世,让学术界的底层算法创新速度大大放缓。数据工程、算力规模、模型架构等工程要素,日渐成为AI竞赛的重要因素。只要有一定技术能力的科技公司,都可以开发出大模型。然而,入场容易并不意味着人人都能成为AI时代的巨头。开源大模型的核心竞争力在于活跃的开发者社群。Meta的Llama系列已成为开源LLM的风向标,大量模型都基于它开发。同时,性能差距仍然明显。在最新的AgentBench测试中,GPT-4以4.41分遥遥领先,而其他开源LLM的成绩多在1分左右。这种差距源自顶尖科学家团队和长期研究积累的经验。除了技术挑战,盈利也是一大难题。目前,大多数AI公司面临成本与收入严重失衡的问题。据估计,全球科技公司每年将在大模型基础设施上投入2000亿美元,而预计收入仅750亿美元,存在巨大缺口。总的来说,AI领域正经历从学术难题到工程问题的转变。虽然入场门槛降低,但真正的价值创造和商业成功仍面临重重挑战。未来的胜出者可能不仅仅依靠模型本身,更需要在应用场景、生态建设和商业模式上有所突破。
AI行业进入百模大战 技术门槛降低但商业挑战仍存
AI领域的"百模大战":从学术难题到工程问题
上个月,AI业界爆发了一场"动物战争"。
一方是Meta推出的Llama模型,由于其开源特性,深受开发者社区欢迎。另一方则是名为Falcon的大模型。5月,Falcon-40B问世,力压Llama登顶了开源LLM排行榜。
该榜单由开源模型社区制作,提供了一套测算LLM能力的标准并进行排名。排行榜基本上就是Llama和Falcon轮流刷榜。Llama 2推出后,Llama家族扳回一城;到9月初,Falcon推出了180B版本,又一次取得了更高的排名。
有趣的是,Falcon的开发者是阿联酋首都阿布扎比的科技创新研究所。阿联酋官方表示,他们参与这个领域是为了颠覆核心玩家。
如今,AI领域已步入"群魔乱舞"阶段:有财力的国家和企业,都在打造自己的大语言模型。仅在海湾国家圈子内,就不止一个玩家。8月,沙特阿拉伯刚为国内大学购买了3000多块H100芯片,用于训练LLM。
AI业界这种百花齐放的局面,要归功于2017年Google发表的《Attention Is All You Need》论文。该论文公开了Transformer算法,成为此轮AI热潮的关键推手。目前所有大模型,包括震惊世界的GPT系列,都建立在Transformer基础之上。
Transformer的问世,让学术界的底层算法创新速度大大放缓。数据工程、算力规模、模型架构等工程要素,日渐成为AI竞赛的重要因素。只要有一定技术能力的科技公司,都可以开发出大模型。
然而,入场容易并不意味着人人都能成为AI时代的巨头。开源大模型的核心竞争力在于活跃的开发者社群。Meta的Llama系列已成为开源LLM的风向标,大量模型都基于它开发。
同时,性能差距仍然明显。在最新的AgentBench测试中,GPT-4以4.41分遥遥领先,而其他开源LLM的成绩多在1分左右。这种差距源自顶尖科学家团队和长期研究积累的经验。
除了技术挑战,盈利也是一大难题。目前,大多数AI公司面临成本与收入严重失衡的问题。据估计,全球科技公司每年将在大模型基础设施上投入2000亿美元,而预计收入仅750亿美元,存在巨大缺口。
总的来说,AI领域正经历从学术难题到工程问题的转变。虽然入场门槛降低,但真正的价值创造和商业成功仍面临重重挑战。未来的胜出者可能不仅仅依靠模型本身,更需要在应用场景、生态建设和商业模式上有所突破。