Grand Teton da Meta traz NVIDIA Hopper para seus data centers



A Meta anunciou hoje sua plataforma de IA de próxima geração, Grand Teton, incluindo a colaboração da NVIDIA em design.

Comparado com a plataforma Zion EX da geração anterior da empresa, o sistema Grand Teton oferece mais memória, largura de banda de rede e capacidade de computação, disse Alexis Bjorlin, vice-presidente de Meta Infrastructure Hardware, no OCP Global Summit 2022, uma conferência Open Compute Project.

Os modelos de IA são amplamente usados ​​no Facebook para serviços como feed de notícias, recomendações de conteúdo e identificação de discurso de ódio, entre muitos outros aplicativos.

“Estamos empolgados em apresentar este mais novo membro da família aqui na cúpula”, disse Bjorlin em comentários preparados para a conferência, acrescentando seus agradecimentos à NVIDIA por sua profunda colaboração no design do Grand Teton e suporte contínuo ao OCP.

Projetado para escala de data center

Com o nome da montanha de 13.000 pés que coroa um dos dois parques nacionais de Wyoming, Grand Teton usa GPUs NVIDIA H100 Tensor Core para treinar e executar modelos de IA que estão crescendo rapidamente em tamanho e recursos, exigindo maior computação.

A arquitetura NVIDIA Hopper, na qual o H100 é baseado, inclui um Transformer Engine para acelerar o trabalho nessas redes neurais, que são frequentemente chamadas de modelos de base porque podem abordar um conjunto crescente de aplicativos, desde processamento de linguagem natural até saúde, robótica e muito mais.

O NVIDIA H100 foi projetado para desempenho e eficiência energética. Os servidores acelerados por H100, quando conectados à rede NVIDIA em milhares de servidores em data centers de hiperescala, podem ser 300 vezes mais eficientes em termos de energia do que os servidores somente com CPU.

“As GPUs NVIDIA Hopper são construídas para solucionar os difíceis desafios do mundo, oferecendo computação acelerada com maior eficiência energética e desempenho aprimorado, ao mesmo tempo em que adiciona escala e reduz custos”, disse Ian Buck, vice-presidente de hiperescala e computação de alto desempenho da NVIDIA. “Com o Meta compartilhando a plataforma Grand Teton com tecnologia H100, os construtores de sistemas em todo o mundo em breve terão acesso a um design aberto para infraestrutura de computação de data center em hiperescala para turbinar a IA em todos os setores”.

Montanha de uma máquina

Grand Teton possui 2x a largura de banda da rede e 4x a largura de banda entre processadores host e aceleradores de GPU em comparação com o sistema Zion anterior da Meta, disse Meta.

A largura de banda de rede adicionada permite que a Meta crie clusters maiores de sistemas para treinar modelos de IA, disse Bjorlin. Ele também possui mais memória do que o Zion para armazenar e executar modelos de IA maiores.

Implantação simplificada, confiabilidade aumentada

Reunir todos esses recursos em um servidor integrado “simplifica drasticamente a implantação de sistemas, permitindo-nos instalar e provisionar nossa frota com muito mais rapidez e aumentar a confiabilidade”, disse Bjorlin.



Source link

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *