Principais OEMs estreiam os primeiros sistemas do mundo criados para enfrentar as cargas de trabalho de IA certificados pela NVIDIA Enterprise
28/1/2021 –
Primeiro programa de certificação de data centers destaca os servidores acelerados e testados para a jornada de machine learning e análise
A Inteligência Artificial (IA), tecnologia mais avançada da atualidade, exige uma nova geração de computadores ajustados e testados para impulsionar esse avanço. Agora, os data centers podem assumir o controle de uma nova classe de servidores acelerados dos parceiros da NVIDIA Enterprise para impulsionar a jornada rumo à IA e à análise de dados. Os principais fabricantes de servidores estão oferecendo a primeira onda de sistemas certificados pela NVIDIA, os únicos servidores do setor testados para cargas de trabalho modernas.
Esses sistemas aceleram a IA graças às GPUs mais atuais da NVIDIA com redes NVIDIA Mellanox. Eles usam técnicas de machine learning que revelam informações de quantidades crescentes de dados corporativos, informações preciosas que não estão presentes em sistemas tradicionais.
Dell Technologies, Hewlett Packard Enterprise (HPE), e Supermicro já estão disponibilizando os servidores certificados. A NVIDIA está colaborando com os principais OEMs (Original Equipment Manufacturer) em todo o mundo para impulsionar a IA em todos os setores.
Os primeiros sistemas da linha que contam com GPUs NVIDIA A100 Tensor Core incluem:
Servidores em rack Dell EMC PowerEdge R7525 e R740;
O sistema HPE Apollo 6500 Gen10 e o servidor HPE ProLiant DL380 Gen10;
O servidor Supermicro A+ AS -4124GS-TNR, AS -2124GQ-NART e AS -4124GO-NART.
“A certificação NVIDIA dá às empresas a confiança de que estão adquirindo servidores que atendem as melhores práticas da NVIDIA. Isso significa que esses sistemas podem lidar com as tarefas mais difíceis de machine learning e análise de dados, por exemplo”, explica Marcio Aguiar, diretor da NVIDIA Enterprise para América Latina. “Entre os principais OEMs, Dell, HPE e Supermicro já estão disponíveis no Brasil, o que auxilia a incentivar o mercado da região.”
Um momento decisivo para a IA corporativa
Os sistemas foram lançados em um momento em que as maiores empresas do mundo estão começando a investir em IA. A American Express está usando os modelos de IA mais atuais para detecção de fraudes em tempo real. A Ford usa redes generativas adversariais para gerar os dados necessários para testar carros autônomos. Já a Domino’s aplica a IA para saber com mais precisão quando seus pedidos estarão prontos, entregando 3 bilhões de pizzas todos os anos.
Essas são algumas das várias empresas que estão aproveitando uma avançada nova forma de computação, que surgiu na web e agora está presente em diversos setores, de varejo e logística, até finanças e saúde.
A Gartner estima que 37% das organizações estejam atualmente desenvolvendo IA e calcula que esse número crescerá para 75% até 2024.
Escalando uma montanha de Big Data
As empresas buscam informações estratégicas escondidas sob uma montanha crescente de dados. A Walmart, por exemplo, processa mais de 2,5 petabytes de dados a cada hora.
Para processar esses dados, os modelos de IA aumentaram de tamanho em quase 30 mil vezes em apenas cinco anos, levando à necessidade de computação acelerada.
A crescente onda de dados e os modelos de IA em expansão para processá-los estão gerando um aumento exponencial no tráfego de rede, tanto no data center quanto na edge da rede. Para lidar com isso, as empresas precisam de uma infraestrutura segura, confiável e de alta velocidade que se dimensione com eficiência.
Gabaritando o teste da IA
Os sistemas certificados pela NVIDIA oferecem o desempenho, a programabilidade e o rendimento seguro de que a IA corporativa precisa. Eles combinam a potência computacional das GPUs baseadas na arquitetura NVIDIA Ampere com a segurança e a alta velocidade da rede NVIDIA Mellanox.
Para receber a certificação, os sistemas são testados em diversas cargas de trabalho, desde tarefas que exigem vários nós de computação até tarefas que só precisam de uma parte da capacidade de uma única GPU. Os servidores são otimizados para executar softwares de IA do catálogo do NGC, o hub de aplicações otimizadas por GPU da NVIDIA.
O NGC também armazena um conjunto em expansão de kits de desenvolvimento de softwares que levam a IA a mercados verticais, como a área da saúde (Clara) e da robótica (Isaac). Além disso, ele contém estruturas que ajudam as empresas a dar os primeiros passos em casos de uso emergentes, como sistemas de recomendação (Merlin) e análise de vídeo inteligente (Metropolis).
Mais especificamente, os sistemas certificados pela NVIDIA devem passar por testes de:
Treinamento e inferência de deep learning;
Algoritmos de machine learning;
Análise de vídeo inteligente;
Redução da carga da rede e do armazenamento.
Os testes se concentram em casos de uso do mundo real. Eles usam frameworks e contêineres populares de IA, todos disponíveis no catálogo do NGC. Por causa disso, os sistemas certificados pela NVIDIA oferecem a todas as empresas acesso aos mesmos hardwares e softwares por trás de alguns dos computadores de IA mais avançados do planeta.
Todos os maiores provedores de serviços em cloud do mundo e oito dos dez maiores supercomputadores do mundo são impulsionados pela tecnologia da NVIDIA. Os sistemas baseados na NVIDIA também são líderes em benchmarks de IA, como o MLPerf.
Uma espiada nos componentes
Os sistemas certificados pela NVIDIA incluem avançados servidores de data center com até oito GPUs A100 e adaptadores de rede InfiniBand ou Ethernet de alta velocidade. Os outros são sistemas de IA personalizados para executar IA na edge da rede corporativa.
Os OEMs certificam os sistemas usando cabos, switches e placas de rede NVIDIA Mellanox, como a ConnectX-6 Infiniband ou adaptadores Ethernet e DPUs BlueField-2. Todos os sistemas foram certificados usando o switch InfiniBand NVIDIA Mellanox 8700 HDR de 200G ou o switch Ethernet Mellanox SN3700.
Todos os sistemas certificados pela NVIDIA Enterprise estão disponíveis com suporte empresarial em todo o pacote de software, incluindo suporte para código aberto.
Com os sistemas mais atuais da Dell, GIGABYTE, HPE, Inpsur e Supermicro, todas as empresas podem começar a própria jornada rumo à IA corporativa. Até o momento, 14 servidores de seis fabricantes de sistemas estão certificados e prontos para fornecer computação acelerada. Eles estão entre cerca de 70 sistemas de pelo menos 11 fabricantes de servidores envolvidos no programa.