OpenAI lança API de processamento Flex para tarefas de IA mais baratas e mais lentas

Em um esforço para competir de forma mais agressiva com empresas rivais de IA como o Google, a OpenAI introduziu o Flex Processing, uma opção de API que oferece preços mais baixos para o uso de modelos de IA, mas com tempos de resposta mais lentos e “indisponibilidade ocasional de recursos”.

O processamento flexível é uma versão beta dos modelos de inferência o3 e o4-mini lançados recentemente pela OpenAI e foi projetado para lidar com tarefas de baixa prioridade e "não produção", como avaliação de modelo, enriquecimento de dados e cargas de trabalho assíncronas, disse OpenAI.

Ele reduz os custos de API pela metade. Para o3, os preços de processamento Flex são de US$ 5 por milhão de tokens de entrada (~750.000 palavras) e US$ 20 por milhão de tokens de saída, em comparação com os preços padrão de US$ 10 por milhão de tokens de entrada e US$ 40 por milhão de tokens de saída. Para o4-mini, o Flex reduziu o preço de US$ 1,10 por milhão de palavras de entrada e US$ 4,40 por milhão de palavras de saída para US$ 0,55 por milhão de palavras de entrada e US$ 2,20 por milhão de palavras de saída.

A introdução dos processadores Flex ocorre num momento em que os preços da inteligência artificial de ponta continuam a subir e os concorrentes estão a lançar modelos mais baratos, mais eficientes e orientados para o orçamento. Na quinta-feira, o Google lançou o Gemini 2.5 Flash. O desempenho deste modelo de inferência é equivalente ou até melhor que o DeepSeek R1, e o custo da palavra de entrada é menor.

Em um e-mail aos clientes anunciando o preço Flex, a OpenAI também observou que os desenvolvedores nos níveis 1-3 de seus níveis de uso devem concluir um processo de autenticação recém-introduzido para acessar o o3. (Os níveis são determinados pelo valor gasto em serviços OpenAI.) O resumo de inferência e o suporte à API de streaming da O3 também exigem autenticação.

A OpenAI disse anteriormente que a autenticação tem como objetivo impedir que atores mal-intencionados violem suas políticas de uso.

saber mais:

https://platform.openai.com/docs/guides/flex-processing