Tecnologia
Tendência

Copilot Vision: a nova interface inteligente da Microsoft que “lê” sua tela e interage em tempo real

A Microsoft deu um passo importante na evolução da interação entre usuários e sistemas operacionais com o lançamento oficial do Copilot Vision, funcionalidade integrada ao Windows 11 — e parcialmente ao Windows 10 — que permite ao assistente virtual “enxergar” a tela do computador em tempo real. Inicialmente disponível apenas para testadores do programa Windows Insider, o recurso passou a ser liberado de forma mais ampla em abril, mas, por enquanto, está restrito a usuários nos Estados Unidos.

Diferente do polêmico Recall — função ainda em fase de testes que armazena capturas periódicas da tela —, o Copilot Vision funciona sob demanda, atuando como uma extensão visual do chatbot da Microsoft. Com ele, o usuário pode, por exemplo, pedir ajuda para organizar uma lista de tarefas exibida na tela ou esclarecer informações que aparecem em um documento ou site. A ideia é transformar o assistente virtual em um verdadeiro “parceiro de navegação”, com capacidade de compreender visualmente o contexto do que está sendo feito no dispositivo.

O recurso é especialmente útil para tarefas multitarefa ou quando se precisa de explicações rápidas sobre conteúdos complexos. Basta acionar o Copilot com comandos simples para que ele analise a tela ativa e ofereça respostas contextualizadas, transformando a experiência digital em algo mais intuitivo e produtivo. O diferencial está na integração direta com o ambiente gráfico do Windows, que permite ao assistente interagir visualmente com qualquer aplicação em uso.

Importante destacar que, ao contrário do Recall — criticado por questões de privacidade, já que registra capturas de tela a cada cinco segundos —, o Copilot Vision não mantém registros automáticos. Ele opera somente com permissão do usuário, respeitando as diretrizes de segurança e privacidade do sistema. A Microsoft reforça que o foco está em criar uma experiência assistiva sem comprometer dados sensíveis.

Com essa novidade, a empresa sinaliza que está investindo pesado em interfaces conversacionais multimodais, onde visão computacional e linguagem natural se encontram para oferecer um suporte mais inteligente, proativo e contextual. A expectativa é que, em breve, a funcionalidade seja expandida globalmente, incluindo versões em português.

Foto: Reprodução

ccb Conteudo

Insira aqui uma breve biografia

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo