A plataforma de computação em nuvem da Amazon, AWS, anunciou na terça-feira o lançamento de um novo produto chamado “AI Factories”, que permite que grandes empresas e agências governamentais executem os sistemas de inteligência artificial da Amazon em seus próprios data centers. Os clientes fornecem salas de informática e energia, e a AWS é responsável por implantar toda a infraestrutura de IA e realizar operações e manutenção unificadas. Ele também pode ser conectado a serviços de nuvem AWS existentes.

Este modelo destina-se a organizações que são extremamente sensíveis à soberania dos dados e esperam que os seus dados não precisem de ser carregados para fornecedores de modelos terceiros ou de partilhar recursos de hardware subjacentes com outros.
O conceito de “fábrica de IA” no novo nome do produto vem do sistema de hardware existente da Nvidia com o mesmo nome, que integra um conjunto completo de componentes necessários para executar modelos grandes, como chips GPU e equipamentos de rede. A AI Factory da AWS é na verdade um projeto de cooperação aprofundada com a NVIDIA. Ambas as empresas confirmaram que a solução combinará as capacidades técnicas de ambas as partes para fornecer aos clientes poder de computação de IA integrado e pilha de plataforma.
Em termos de configuração específica, as empresas podem optar por instalar a GPU Blackwell de última geração da NVIDIA ou usar o novo chip de treinamento Trainium3 desenvolvido pela própria Amazon para atender às diferentes necessidades de poder e custo de computação. Além do poder de computação, o sistema integrará a própria rede, armazenamento, banco de dados e componentes de segurança da AWS, e poderá acessar diretamente o Amazon Bedrock, um serviço de seleção e hospedagem de modelos, e o SageMaker, uma plataforma de construção e treinamento de modelos, formando um ambiente unificado desde o hardware subjacente até as ferramentas de desenvolvimento de camada superior.
É importante notar que a AWS não é a única gigante da computação em nuvem que aposta em “fábricas de IA”. Já em outubro, a Microsoft demonstrou sua infraestrutura de IA baseada na tecnologia NVIDIA AI Factory, que é usada para hospedar OpenAI e outras cargas de trabalho em data centers globais, e construiu uma nova geração de data centers de nível de "superfábrica de IA" em Wisconsin e Geórgia em torno dessa arquitetura. No entanto, naquela altura, a Microsoft não enfatizou a implementação directa de sistemas semelhantes nas salas dos clientes sob a forma de nuvens privadas locais, mas em vez disso concentrou-se na sua capacidade de construir a sua própria infra-estrutura de nuvem.
Em termos de lidar com a soberania dos dados, a Microsoft anunciou anteriormente planos para construir centros de dados e serviços em nuvem localmente em vários países e propôs uma variedade de soluções de localização, incluindo "Azure Local". A Microsoft fornecerá e hospedará o hardware e depois o implantará nas instalações dos clientes para atender aos requisitos regulatórios e de conformidade. Em contraste, a AWS propôs claramente um modelo de data centers de propriedade do cliente e a AWS "movendo a fábrica de IA" desta vez, confundindo ainda mais as fronteiras entre data centers privados empresariais tradicionais e nuvens públicas, e nuvens híbridas e salas de hospedagem corporativa retornaram mais uma vez ao centro do palco da indústria.
Do ponto de vista do mundo exterior, a onda de IA generativa está a levar vários grandes fornecedores de serviços de nuvem a aumentar novamente o investimento em centros de dados construídos pelas empresas e em arquitecturas de nuvem híbrida, o que faz lembrar a época em que "as salas de computadores empresariais eram reis", há mais de uma década. À medida que fornecedores de hardware como a NVIDIA estão cada vez mais ligados aos gigantes da nuvem, a implantação localizada e soberana em torno de “fábricas de IA” provavelmente se tornará uma das principais opções para grandes organizações ao planejarem infraestrutura de IA nos próximos anos.