
Oracle e AMD ampliam poder de IA na nuvem
A Oracle e a AMD anunciaram no início do mês que as GPUs AMD Instinct™ MI355X estarão disponíveis na Oracle Cloud Infrastructure (OCI) para oferecer aos clientes mais opções e custo-benefício até 2 vezes melhor para treinamento de IA em larga escala e cargas de trabalho de inferência em comparação à geração anterior. A Oracle oferecerá clusters de IA em zettascale acelerados pelos mais recentes processadores AMD Instinct com até 131.072 GPUs MI355X para possibilitar que os clientes criem, treinem e infiram IA em escala.
“Para dar suporte aos clientes que executam as cargas de trabalho de IA mais exigentes na nuvem, nos dedicamos a fornecer as mais amplas ofertas de infraestrutura de IA”, disse Mahesh Thiagarajan, vice-presidente executivo da Oracle Cloud Infrastructure. “As GPUs AMD Instinct, combinadas com o desempenho, a rede avançada, a flexibilidade, a segurança e a escala da OCI, ajudarão nossos clientes a atender às suas necessidades de inferência e treinamento para cargas de trabalho de IA e novas aplicações de agente”, conta o executivo.
Para dar suporte a novas aplicações de IA que exigem conjuntos de dados maiores e mais complexos, os clientes precisam de soluções de computação projetadas especificamente para treinamento de IA em larga escala. O OCI Supercluster em zettascale com GPUs AMD Instinct MI355X atende a essa necessidade ao fornecer uma arquitetura de rede de cluster RDMA de alto rendimento e latência ultrabaixa para até 131.072 GPUs MI355X. O AMD Instinct MI355X oferece quase o triplo de poder de computação e um aumento de 50% na memória de alta largura de banda do que a geração anterior.
“A AMD e a Oracle compartilham um histórico de fornecer aos clientes soluções abertas para acomodar alto desempenho, eficiência e maior flexibilidade de design de sistema”, disse Forrest Norrod, vice-presidente executivo e gerente geral do Data Center Solutions Business Group da AMD. “A última geração de GPUs AMD Instinct e NICs Pollara na OCI ajudará a dar suporte a novos casos de uso em inferência, ajuste fino e treinamento, oferecendo mais opções aos clientes à medida que a adoção da IA cresce”, explica Norrod.
AMD Instinct MI355X está chegando à OCI
As instâncias com tecnologia AMD Instinct MI355X na Oracle Cloud Infrastructure foram desenvolvidas para oferecer desempenho superior, alta flexibilidade em nuvem e compatibilidade com software de código aberto. Elas atendem especialmente aos clientes que operam modelos de linguagem de larga escala e cargas de trabalho intensivas de inteligência artificial.
Com até 2,8 vezes mais taxa de transferência em relação à geração anterior, essas GPUs permitem resultados mais rápidos e a execução de modelos mais robustos, com menor latência. Seu design com 288 gigabytes de memória HBM3 e até oito terabytes por segundo de largura de banda garante que mesmo os maiores modelos possam ser processados inteiramente em memória, acelerando tanto o treinamento quanto a inferência.
O suporte ao novo padrão FP4 de 4 bits também permite a implementação mais econômica de modelos modernos de IA generativa, com eficiência e velocidade elevadas. Todo esse poder computacional está integrado a um novo cluster com arquitetura densa e sistema de resfriamento a líquido, capaz de atingir até 125 quilowatts por rack, com 64 GPUs de 1.400 watts cada — configuração ideal para cargas exigentes.
A estrutura foi projetada para atender à produção em larga escala, com otimização para aplicações baseadas em agentes, resposta rápida e alto volume de tokens por segundo. Complementando o conjunto, um nó principal robusto com CPUs AMD Turin de alta frequência e até três terabytes de memória permite orquestração de tarefas e processamento de dados com alto desempenho.
Além disso, a pilha de software aberta AMD ROCm proporciona aos desenvolvedores liberdade para adaptar seus projetos sem amarrações a fornecedores específicos. Por fim, a Oracle será a primeira nuvem a integrar as novas NICs AMD Pollara às suas redes de backend, viabilizando conectividade de baixa latência com suporte a RoCE avançado e padrões abertos do Ultra Ethernet Consortium, para entregar máxima eficiência em redes de alto desempenho.
Leia também
Mais conteúdo que continua valendo a pena
- Saiba como eliminar fotos duplicadas no computador
- Dicas AMD para decidir entre nuvem pública ou privada
- Resumo da semana #07: Quanto vale o show?
- #Mickey90 : DISNEY COMEMORA 90 ANOS DE MICKEY MOUSE COM FESTIVIDADES MUNDIAIS
- Trailer Estendido Back 4 Blood anuncia a disponibilidade para o Xbox Game Pass no dia de lançamento