
A Microsoft vem ampliando as capacidades do Copilot, seu assistente de inteligência artificial, e um dos recursos mais inovadores é o Copilot Vision — uma ferramenta que combina visão computacional com IA para interpretar o que está sendo exibido na tela do usuário. Disponível no navegador Microsoft Edge, em dispositivos com Windows e também em celulares Android e iOS, essa funcionalidade permite que o assistente “leia” imagens, páginas da web, gráficos, vídeos e até mesmo documentos, oferecendo respostas contextuais e sugestões de ações com base no conteúdo visual.
Na prática, o Copilot Vision funciona como um olhar extra sobre a sua tela. Ao capturar uma imagem, selecionar um arquivo ou simplesmente analisar o que está aberto no navegador, o usuário pode interagir com a IA por texto ou comando de voz. É possível pedir descrições detalhadas, solicitar análises, extrair informações de gráficos, comparar dados de dois apps abertos ou até obter explicações sobre símbolos e objetos — como no caso de uma tatuagem analisada durante testes, na qual a IA reconheceu o estilo e deu um parecer sobre seu significado ornamental.
Entre os usos mais interessantes estão tarefas cotidianas, como revisar documentos, traduzir trechos de texto em PDFs, gerar resumos visuais ou até comparar produtos em uma página de e-commerce. Embora o recurso de compartilhamento direto da tela ainda seja restrito ao Microsoft Edge, as versões mobile e desktop permitem envio de imagens, capturas ou arquivos para análise — o que já abre inúmeras possibilidades para estudantes, profissionais e usuários em geral que buscam agilidade e suporte na leitura de conteúdo visual.
Para utilizá-lo no Windows, basta pressionar Win + C ou clicar no ícone do Copilot na barra de tarefas, adicionar uma imagem clicando em “+” e inserir a pergunta. Nos celulares, é necessário baixar o app Microsoft Copilot e, após configurar permissões, enviar uma imagem ou tirar uma foto para iniciar a interação. Já no Microsoft Edge, o usuário deve ativar o Copilot pela barra lateral e liberar o acesso contextual à página atual para que a IA possa “ver” e interpretar o conteúdo exibido.
Durante testes práticos, o recurso mostrou precisão ao identificar imagens com símbolos astrológicos em tecidos e ao listar smartwatches com bom custo-benefício exibidos em uma página da Amazon, oferecendo nomes, preços e avaliações. Isso demonstra como o Copilot Vision vai além da simples consulta textual e se posiciona como um verdadeiro copiloto digital, pronto para decodificar o mundo visual e responder de forma personalizada.
Com essa proposta, o Copilot Vision transforma o uso da inteligência artificial em algo ainda mais integrado à experiência do usuário, atendendo quem busca produtividade, organização ou simplesmente uma maneira mais inteligente de interagir com o conteúdo digital do dia a dia.
Foto: Reprodução