Esta semana, o AICopilot no navegador Microsoft Edge adicionou um recurso que gera resumos de texto em vídeo. Mas, como explicou Mikhail Parakhin, CEO da Microsoft Advertising and Network Services, os recursos de economia de tempo do EdgeCopilot ainda são bastante limitados e funcionam apenas com vídeos pré-processados ​​​​ou com legendas.

"Para que isso funcione, precisamos pré-processar o vídeo. Se o vídeo tiver legendas, podemos restaurá-lo; se não houver legendas e não o tivermos pré-processado, então não funcionará", escreveu Parakhin.

Em outras palavras, o EdgeCopilot em si não é tanto um vídeo resumido, mas uma transcrição que resume o vídeo. O Copilot também pode executar funções semelhantes no Microsoft 365, incluindo resumir videoconferências do Teams e chamadas de agentes de atendimento ao cliente – em ambos os casos, o áudio precisa ser transcrito primeiro pela Microsoft. O Copilot no Microsoft Stream também pode resumir qualquer vídeo, mas novamente exige que o usuário gere uma transcrição escrita.

A conversa começou depois que o designer Pietro Schirano postou uma gravação de tela do EdgeCopilot resumindo o vídeo do trailer do GTAVI no YouTube. Neste caso, o Copilot parece ter feito o trabalho perfeitamente. O usuário na gravação pressiona o botão “Gerar resumo do vídeo” na barra lateral do Copilot e, apenas alguns segundos depois, o Copilot gera um resumo do vídeo com pontos-chave e carimbos de data/hora.

É claro que muitas plataformas, incluindo YouTube e Vimeo, podem gerar transcrições e legendas automaticamente se o usuário tiver habilitado esse recurso. TheVerge perguntou a Parakhin sobre

Copilot é apenas o exemplo mais recente de como a Microsoft enfrenta o Google (e outros) em uma corrida para gerar IA generativa. No mês passado, o Google atualizou seu chatbot Bard com uma extensão do YouTube que permite resumir o conteúdo do vídeo e extrair informações específicas dele. Ainda esta semana, o Google anunciou uma grande atualização para o Gemini, mas a atualização em si tem seus problemas – em uma apresentação, os editores da empresa podem ter deturpado algumas das capacidades da IA, e o Google nem sempre esclarece os fatos.

Parashin falou abertamente nas redes sociais sobre os vários estágios de desenvolvimento do Copilot.