A "Guerra dos Cem Modelos" no campo da IA: de problemas acadêmicos a problemas de engenharia
No mês passado, houve uma "guerra dos animais" na indústria de IA.
De um lado está o modelo Llama lançado pela Meta, que, devido à sua natureza de código aberto, é muito apreciado pela comunidade de desenvolvedores. Do outro lado, temos o grande modelo chamado Falcon. Em maio, o Falcon-40B foi lançado, superando o Llama e conquistando o topo do ranking de LLMs de código aberto.
Esta lista foi criada pela comunidade de modelos de código aberto e fornece um conjunto de padrões para medir a capacidade de LLM e classificar. A tabela classificativa é basicamente dominada alternadamente por Llama e Falcon. Após o lançamento do Llama 2, a família Llama recuperou um lugar; no início de setembro, o Falcon lançou a versão 180B, novamente alcançando uma classificação mais alta.
Curiosamente, os desenvolvedores do Falcon são do Instituto de Inovação Tecnológica de Abu Dhabi, na capital dos Emirados Árabes Unidos. As autoridades dos Emirados Árabes Unidos afirmam que estão a participar neste setor para desafiar os principais players.
Hoje, o campo da IA entrou na fase de "dança dos demônios": países e empresas com recursos financeiros estão todos desenvolvendo seus próprios modelos de linguagem de grande escala. Apenas no círculo dos países do Golfo, há mais de um jogador. Em agosto, a Arábia Saudita acabou de comprar mais de 3000 chips H100 para universidades nacionais, para treinar LLM.
A diversidade na indústria de IA deve-se ao artigo "Attention Is All You Need" publicado pelo Google em 2017. Este artigo revelou o algoritmo Transformer, que se tornou o motor chave desta onda atual de IA. Atualmente, todos os grandes modelos, incluindo a série GPT que surpreendeu o mundo, são baseados na arquitetura Transformer.
O surgimento do Transformer fez com que a velocidade de inovação dos algoritmos básicos na academia diminuísse significativamente. Elementos de engenharia como engenharia de dados, escala de computação e arquitetura de modelos tornaram-se fatores importantes na competição de IA. Qualquer empresa de tecnologia com uma certa capacidade técnica pode desenvolver grandes modelos.
No entanto, a facilidade de entrada não significa que todos possam se tornar gigantes na era da IA. A principal vantagem competitiva dos grandes modelos de código aberto reside em uma comunidade de desenvolvedores ativa. A série Llama da Meta tornou-se um ponto de referência para LLMs de código aberto, com muitos modelos desenvolvidos com base nela.
Ao mesmo tempo, a diferença de desempenho continua a ser evidente. Nos mais recentes testes do AgentBench, o GPT-4 obteve uma pontuação de 4,41, liderando de forma destacada, enquanto os outros LLMs de código aberto apresentaram pontuações em torno de 1 ponto. Essa diferença resulta da experiência acumulada por equipes de cientistas de topo e de uma longa pesquisa.
Além dos desafios técnicos, a rentabilidade também é um grande problema. Atualmente, a maioria das empresas de IA enfrenta um sério desequilíbrio entre custos e receitas. Estima-se que as empresas de tecnologia em todo o mundo gastarão 200 mil milhões de dólares anualmente em infraestrutura de grandes modelos, enquanto a receita prevista é de apenas 75 mil milhões de dólares, o que representa uma enorme lacuna.
De um modo geral, o campo da IA está a passar por uma transição de um problema académico para um problema de engenharia. Embora a barreira de entrada tenha diminuído, a verdadeira criação de valor e o sucesso comercial ainda enfrentam muitos desafios. Os futuros vencedores poderão não depender apenas do modelo em si, mas também precisam de fazer avanços nos cenários de aplicação, na construção de ecossistemas e nos modelos de negócios.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
16 Curtidas
Recompensa
16
6
Repostar
Compartilhar
Comentário
0/400
liquidation_watcher
· 14h atrás
A batalha de modelos está em andamento
Ver originalResponder0
MevTears
· 08-12 10:44
Os parâmetros de desempenho não são uma verdade absoluta.
Ver originalResponder0
TokenTherapist
· 08-12 10:43
A competição tecnológica é realmente intensa.
Ver originalResponder0
ApeWithNoFear
· 08-12 10:40
Qual é a utilidade de correr para a frente na classificação?
A indústria de IA entra na batalha das cem modelos. O Gota tecnológico diminuiu, mas os desafios comerciais ainda persistem.
A "Guerra dos Cem Modelos" no campo da IA: de problemas acadêmicos a problemas de engenharia
No mês passado, houve uma "guerra dos animais" na indústria de IA.
De um lado está o modelo Llama lançado pela Meta, que, devido à sua natureza de código aberto, é muito apreciado pela comunidade de desenvolvedores. Do outro lado, temos o grande modelo chamado Falcon. Em maio, o Falcon-40B foi lançado, superando o Llama e conquistando o topo do ranking de LLMs de código aberto.
Esta lista foi criada pela comunidade de modelos de código aberto e fornece um conjunto de padrões para medir a capacidade de LLM e classificar. A tabela classificativa é basicamente dominada alternadamente por Llama e Falcon. Após o lançamento do Llama 2, a família Llama recuperou um lugar; no início de setembro, o Falcon lançou a versão 180B, novamente alcançando uma classificação mais alta.
Curiosamente, os desenvolvedores do Falcon são do Instituto de Inovação Tecnológica de Abu Dhabi, na capital dos Emirados Árabes Unidos. As autoridades dos Emirados Árabes Unidos afirmam que estão a participar neste setor para desafiar os principais players.
Hoje, o campo da IA entrou na fase de "dança dos demônios": países e empresas com recursos financeiros estão todos desenvolvendo seus próprios modelos de linguagem de grande escala. Apenas no círculo dos países do Golfo, há mais de um jogador. Em agosto, a Arábia Saudita acabou de comprar mais de 3000 chips H100 para universidades nacionais, para treinar LLM.
A diversidade na indústria de IA deve-se ao artigo "Attention Is All You Need" publicado pelo Google em 2017. Este artigo revelou o algoritmo Transformer, que se tornou o motor chave desta onda atual de IA. Atualmente, todos os grandes modelos, incluindo a série GPT que surpreendeu o mundo, são baseados na arquitetura Transformer.
O surgimento do Transformer fez com que a velocidade de inovação dos algoritmos básicos na academia diminuísse significativamente. Elementos de engenharia como engenharia de dados, escala de computação e arquitetura de modelos tornaram-se fatores importantes na competição de IA. Qualquer empresa de tecnologia com uma certa capacidade técnica pode desenvolver grandes modelos.
No entanto, a facilidade de entrada não significa que todos possam se tornar gigantes na era da IA. A principal vantagem competitiva dos grandes modelos de código aberto reside em uma comunidade de desenvolvedores ativa. A série Llama da Meta tornou-se um ponto de referência para LLMs de código aberto, com muitos modelos desenvolvidos com base nela.
Ao mesmo tempo, a diferença de desempenho continua a ser evidente. Nos mais recentes testes do AgentBench, o GPT-4 obteve uma pontuação de 4,41, liderando de forma destacada, enquanto os outros LLMs de código aberto apresentaram pontuações em torno de 1 ponto. Essa diferença resulta da experiência acumulada por equipes de cientistas de topo e de uma longa pesquisa.
Além dos desafios técnicos, a rentabilidade também é um grande problema. Atualmente, a maioria das empresas de IA enfrenta um sério desequilíbrio entre custos e receitas. Estima-se que as empresas de tecnologia em todo o mundo gastarão 200 mil milhões de dólares anualmente em infraestrutura de grandes modelos, enquanto a receita prevista é de apenas 75 mil milhões de dólares, o que representa uma enorme lacuna.
De um modo geral, o campo da IA está a passar por uma transição de um problema académico para um problema de engenharia. Embora a barreira de entrada tenha diminuído, a verdadeira criação de valor e o sucesso comercial ainda enfrentam muitos desafios. Os futuros vencedores poderão não depender apenas do modelo em si, mas também precisam de fazer avanços nos cenários de aplicação, na construção de ecossistemas e nos modelos de negócios.