A Microsoft lançou recentemente oficialmente um novo serviço de “API de aterramento” chamado Web IQ. Este é um conjunto de pesquisa e acesso à informação projetado para agentes de IA (agentes de IA) e nativamente orientado para a era da IA. É suportado pelos recursos de indexação e compreensão de pesquisa do Bing. A Microsoft disse que o Web IQ pode conectar sistemas de IA e vários agentes inteligentes com as informações mais recentes do mundo real de toda a rede, cobrindo vários formatos de conteúdo, como páginas da web, notícias, fotos e vídeos.

WebIQ1.png

De acordo com a Microsoft, o Web IQ usa a mesma infraestrutura de API do Microsoft Copilot e de muitos sistemas de IA convencionais (incluindo ChatGPT), mas não é a interface antiga usada nos primeiros dias para fornecer recursos de rede para esses grandes modelos, mas um sistema de nova geração reconstruído "de baixo para cima". Jordi Ribas, presidente do Grupo de Pesquisa e IA da Microsoft, disse que a API foi redesenhada e otimizada em termos de eficiência, velocidade e relevância dos resultados. Atualmente, o Web IQ tem sido usado para gerar as principais respostas do Copilot nos resultados de pesquisa do Bing. Também foi adotado pelo ChatGPT para dar suporte a algumas respostas online e atender diretamente ao cenário de perguntas e respostas no Copilot.

Ao contrário da pesquisa tradicional para usuários humanos, o Web IQ é posicionado como uma “pesquisa projetada para agentes, não para pessoas”. Ribas explicou ao Search Engine Land que, quando os humanos pesquisam, a classificação costuma ser a principal consideração, mas para os agentes de IA, a importância da classificação é relativamente baixa. O que é mais crítico é se a informação apropriada pode ser extraída do documento e reorganizada e entregue rapidamente. Os agentes de IA não apenas emitirão uma consulta e terminarão como muitos usuários humanos, mas continuarão a explorar a recuperação descendente e distribuída, e continuarão a fazer perguntas e a invocar pesquisas em torno da tarefa, colocando assim requisitos completamente diferentes nos sistemas subjacentes de recuperação e atribuição.

WebIQ_GDSAT2.pngWebIQ_P95Latency2.png

A Microsoft disse que esse "comportamento de pesquisa semelhante ao de um agente" levou a equipe a reestruturar todo o sistema, desde a indexação e recuperação até a classificação, seleção de parágrafos e organização geral, e cada camada foi ajustada de acordo com as necessidades de "fundamento no tempo de inferência". Devido à alta frequência de chamadas de pesquisa de agentes de IA e links longos, o Web IQ foi projetado para ser o mais eficiente possível, reduzindo o consumo de tokens de grandes modelos, garantindo ao mesmo tempo a qualidade dos resultados e alcançando "menos tokens de entrada, melhores respostas de saída e custos de chamada mais baixos". Em termos de velocidade, a Microsoft afirma que o Web IQ é aproximadamente 2,5 vezes mais rápido do que as “próximas melhores alternativas” atualmente no mercado.

Em termos de acesso e usabilidade, o Web IQ é atualmente usado pelo Microsoft Copilot, ChatGPT da OpenAI e outras plataformas de grandes modelos. A Microsoft planeja abrir gradualmente o acesso a mais desenvolvedores e parceiros à medida que o sistema se expande e amadurece. Para organizações e desenvolvedores interessados ​​em experimentar ou integrar o Web IQ, a Microsoft recomenda o envio de requisitos e informações de interesse por meio de seu site oficial.

WebIQ_TokenEfficiency3.png

Para os setores de busca e marketing, a mudança da Microsoft é vista como uma aposta importante na tendência do “agente web”. À medida que mais agentes de IA começam a interagir diretamente com o conteúdo da web, a arquitetura do site, a anotação de conteúdo e os métodos de otimização técnica provavelmente mudarão para melhor suportar esses tipos de acesso à máquina e cenários de compreensão. A Search Engine Land acredita que, embora os usuários humanos não “desapareçam” como resultado, os agentes de IA estão chegando rapidamente ou mesmo a caminho. Os proprietários e profissionais de sites precisam se preparar para esta rodada de evolução da rede o mais rápido possível, para que seus sites possam ser atualizados e adaptados simultaneamente.