"Битва ста моделей" в области ИИ: от академических задач к инженерным проблемам
В прошлом месяце в индустрии ИИ разразилась "война животных".
С одной стороны, это модель Llama, выпущенная Meta, которая благодаря своей открытой природе пользуется большой популярностью в сообществе разработчиков. С другой стороны, имеется большая модель под названием Falcon. В мае вышла Falcon-40B, которая обошла Llama и заняла первое место в рейтинге открытых LLM.
Этот список составлен сообществом открытых моделей и предоставляет набор стандартов для оценки возможностей LLM и их ранжирования. В рейтинге в основном Llama и Falcon по очереди занимают первые места. После выхода Llama 2 семья Llama вернула себе преимущество; к началу сентября Falcon выпустил версию 180B и снова занял более высокое место.
Интересно, что разработчиком Falcon является Институт научных инноваций в Абу-Даби, столице ОАЭ. Официальные лица ОАЭ заявили, что они участвуют в этой области, чтобы подорвать позиции ключевых игроков.
В настоящее время область ИИ вступила в стадию "разгула бесов": страны и компании с финансовыми возможностями создают свои большие языковые модели. Только в кругах стран Персидского залива не один игрок. В августе Саудовская Аравия только что приобрела более 3000 чипов H100 для своих университетов, чтобы обучать LLM.
Ситуация в индустрии ИИ, когда процветает множество направлений, обязана своей заслугой статье Google 2017 года «Внимание — это все, что вам нужно». Эта статья представила алгоритм Transformer, став ключевым фактором в текущем буме ИИ. В настоящее время все большие модели, включая шокировавшую мир серию GPT, основаны на основе Transformer.
Появление трансформеров значительно замедлило скорость инноваций в базовых алгоритмах в академической среде. Элементы инженерии, такие как обработка данных, масштаб вычислений и архитектура моделей, становятся всё более важными факторами в конкуренции AI. Любая технологическая компания с определённой технической компетенцией может разработать большие модели.
Тем не менее, легкий вход не означает, что каждый может стать гигантом эпохи ИИ. Ключевым конкурентным преимуществом открытых крупных моделей является активное сообщество разработчиков. Серия Llama от Meta стала ориентиром для открытых LLM, множество моделей разработаны на ее основе.
В то же время разница в производительности по-прежнему очевидна. В последнем тесте AgentBench GPT-4 с 4,41 баллами значительно опережает другие открытые LLM, чьи результаты в основном около 1 балла. Эта разница обусловлена опытом команд ведущих ученых и многолетними исследованиями.
Помимо технических вызовов, получение прибыли также является большой проблемой. В настоящее время большинство ИИ-компаний сталкиваются с серьезным дисбалансом между затратами и доходами. По оценкам, глобальные технологические компании ежегодно будут вкладывать 200 миллиардов долларов в инфраструктуру больших моделей, в то время как ожидаемые доходы составят всего 75 миллиардов долларов, что создает огромный разрыв.
В целом, сфера ИИ переживает переход от академических задач к инженерным проблемам. Хотя барьер для входа снижен, настоящие создание ценности и коммерческий успех по-прежнему сталкиваются с многочисленными вызовами. Победители будущего могут не только полагаться на саму модель, но также должны добиться прорыва в области применения, построения экосистемы и бизнес-моделей.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
18 Лайков
Награда
18
6
Репост
Поделиться
комментарий
0/400
liquidation_watcher
· 08-13 17:32
Модельная битва в разгаре
Посмотреть ОригиналОтветить0
MevTears
· 08-12 10:44
Параметры производительности не являются жесткой истиной
AI индустрия вступает в битву ста моделей, технологический порог падает, но коммерческие вызовы все еще существуют.
"Битва ста моделей" в области ИИ: от академических задач к инженерным проблемам
В прошлом месяце в индустрии ИИ разразилась "война животных".
С одной стороны, это модель Llama, выпущенная Meta, которая благодаря своей открытой природе пользуется большой популярностью в сообществе разработчиков. С другой стороны, имеется большая модель под названием Falcon. В мае вышла Falcon-40B, которая обошла Llama и заняла первое место в рейтинге открытых LLM.
Этот список составлен сообществом открытых моделей и предоставляет набор стандартов для оценки возможностей LLM и их ранжирования. В рейтинге в основном Llama и Falcon по очереди занимают первые места. После выхода Llama 2 семья Llama вернула себе преимущество; к началу сентября Falcon выпустил версию 180B и снова занял более высокое место.
Интересно, что разработчиком Falcon является Институт научных инноваций в Абу-Даби, столице ОАЭ. Официальные лица ОАЭ заявили, что они участвуют в этой области, чтобы подорвать позиции ключевых игроков.
В настоящее время область ИИ вступила в стадию "разгула бесов": страны и компании с финансовыми возможностями создают свои большие языковые модели. Только в кругах стран Персидского залива не один игрок. В августе Саудовская Аравия только что приобрела более 3000 чипов H100 для своих университетов, чтобы обучать LLM.
Ситуация в индустрии ИИ, когда процветает множество направлений, обязана своей заслугой статье Google 2017 года «Внимание — это все, что вам нужно». Эта статья представила алгоритм Transformer, став ключевым фактором в текущем буме ИИ. В настоящее время все большие модели, включая шокировавшую мир серию GPT, основаны на основе Transformer.
Появление трансформеров значительно замедлило скорость инноваций в базовых алгоритмах в академической среде. Элементы инженерии, такие как обработка данных, масштаб вычислений и архитектура моделей, становятся всё более важными факторами в конкуренции AI. Любая технологическая компания с определённой технической компетенцией может разработать большие модели.
Тем не менее, легкий вход не означает, что каждый может стать гигантом эпохи ИИ. Ключевым конкурентным преимуществом открытых крупных моделей является активное сообщество разработчиков. Серия Llama от Meta стала ориентиром для открытых LLM, множество моделей разработаны на ее основе.
В то же время разница в производительности по-прежнему очевидна. В последнем тесте AgentBench GPT-4 с 4,41 баллами значительно опережает другие открытые LLM, чьи результаты в основном около 1 балла. Эта разница обусловлена опытом команд ведущих ученых и многолетними исследованиями.
Помимо технических вызовов, получение прибыли также является большой проблемой. В настоящее время большинство ИИ-компаний сталкиваются с серьезным дисбалансом между затратами и доходами. По оценкам, глобальные технологические компании ежегодно будут вкладывать 200 миллиардов долларов в инфраструктуру больших моделей, в то время как ожидаемые доходы составят всего 75 миллиардов долларов, что создает огромный разрыв.
В целом, сфера ИИ переживает переход от академических задач к инженерным проблемам. Хотя барьер для входа снижен, настоящие создание ценности и коммерческий успех по-прежнему сталкиваются с многочисленными вызовами. Победители будущего могут не только полагаться на саму модель, но также должны добиться прорыва в области применения, построения экосистемы и бизнес-моделей.