Há algumas semanas, a OpenAI lançou seu mais recente modelo de linguagem em larga escala para serviços generativos de inteligência artificial, GPT-4Turbo, em seu primeiro evento para desenvolvedores. Posteriormente, a Microsoft anunciou que adicionaria o modelo GPT-4Turbo ao seu serviço Azure OpenAI. Hoje, a Microsoft anunciou melhorias em seu serviço Azure OpenAI, com o modelo GPT-4 Turbo com Vision agora disponível para os clientes como uma prévia pública.

A Microsoft disse em uma postagem no blog:

Este modelo avançado de IA multimodal mantém todos os recursos poderosos do GPT-4Turbo, ao mesmo tempo que introduz a capacidade de processar e analisar a entrada de imagem. Isso abre a oportunidade de aproveitar o GPT-4 para uma gama mais ampla de tarefas, incluindo melhorias de acessibilidade, interpretação e análise visual de dados e resposta visual a perguntas (VQA).

Além disso, a Microsoft adicionou mais recursos para clientes do Azure OpenAI por meio da versão prévia do GPT-4 Turbo com Vision. Um deles é o reconhecimento óptico de caracteres (OCR), que examina uma imagem e extrai qualquer texto da imagem para que possa ser integrado aos prompts do usuário.

Outro recurso do GPT-4 TurbowithVision é o aterramento de objetos, que permite que a IA inspecione uma imagem e exiba os principais objetos na imagem com base em instruções de texto do usuário. Da mesma forma, a IA também pode analisar frames específicos de um vídeo.

A Microsoft adicionou:

Ao combinar GPT-4 Turbo com Vision, Azure AI Search e Azure AI Vision, agora é possível adicionar imagens e dados de texto para desenvolver soluções que se conectam aos dados do usuário usando pesquisa vetorial para melhorar a experiência do chatbot.

O preço do serviço é de US$ 0,01 por 1.000 palavras de entrada e US$ 0,03 por 1.000 palavras de saída, com preços variados para recursos aprimorados.

Atualmente, o GPT-4Turbo com Vision está disponível nas regiões Austrália Leste, Suécia Central, Suíça Norte e Oeste dos EUA da AzureOpenAI. Os clientes que acessarem a visualização pública do GPT-4Turbo com recursos de visão serão atualizados automaticamente para uma “versão estável e pronta para produção nas próximas semanas”.