A Meta (META; M1TA34) revelou nesta quarta-feira detalhes sobre a próxima geração do chip acelerador de inteligência artificial interno da companhia.
Por que isso é importante
A Reuters noticiou mais cedo este ano que a Meta planejava implementar uma nova versão de um chip personalizado de data center para lidar com a crescente quantidade de potência de computação necessária para executar produtos de IA no Facebook, Instagram e WhatsApp.
O chip, chamado internamente de “Artemis”, ajudará a Meta a reduzir sua dependência dos chips de IA da Nvidia e reduzir seus custos de energia em geral.
Citações
“A arquitetura deste chip está fundamentalmente focada em fornecer o equilíbrio certo entre computação, largura de banda de memória e capacidade de memória para servir modelos de classificação e recomendação”, escreveu a empresa em comunicado.
Contexto
O novo chip Meta Training and Inference Accelerator (MTIA) faz parte de um amplo esforço no processo de desenvolvimento de chip de silício personalizado da empresa, que inclui também olhar para outros sistemas de hardware.
Além de construir os chips e hardware, a Meta tem feito investimentos significativos no desenvolvimento de software necessário para aproveitar o poder de sua infraestrutura da forma mais eficiente possível.
A empresa também está gastando bilhões de dólares na compra de chips de IA da Nvidia e de outros fabricantes: Este ano, o presidente-executivo da Meta, Mark Zuckerberg, disse que a empresa planeja adquirir cerca de 350.000 chips H100 da Nvidia.
Combinados com outros fornecedores, a Meta planeja acumular o equivalente a 600.000 chips H100 este ano, disse o executivo.
Numeros
A TSMC produzirá o novo chip em seu processo “5nm”. A Meta disse que ele é capaz de alcançar três vezes o desempenho de seu processador de primeira geração.
O que vem aí
O chip tem sido implementado em data center e está empenhado em servir aplicações de IA. A empresa disse que possui vários programas em andamento “que visam expandir o escopo do MTIA, incluindo o suporte a cargas de trabalho (de IA generativa)”.