Quando o navegador se tornar o próximo campo de batalha da IA, quem será eliminado?

O futuro da IA está nos agentes que podem navegar nas páginas web de forma autónoma. As empresas de tecnologia estão investindo no desenvolvimento de proxies de navegador para automatizar tarefas da web e aumentar a produtividade. Este artigo explora seus casos de uso, desafios atuais e oportunidades apresentadas por cenários nativos da Web3. Este artigo foi escrito por Mario Chow e Figo, @IOSG, e foi compilado, compilado e contribuído pela BlockBeats. OpenAI Sam Altman: Estou interessado em adquirir o Google Chrome!) Maior batalha de navegadores em mercados participantes) (Antecedentes adicionados: Perplexidade oferece US $ 34,5 bilhões para adquirir navegador Chrome, minions do mecanismo de busca de IA batalha gigantes) Nos últimos 12 meses, a relação entre navegadores da web e automação mudou drasticamente. Quase todas as grandes empresas de tecnologia estão lutando para construir seu próprio (browser agent) proxy de navegador. A partir do final de 2024, essa tendência está se tornando mais pronunciada: a OpenAI lançou o modo Agent em janeiro, a Anthropic lançou o "uso do computador" para o modelo Claude, o Google DeepMind lançou o Project Mariner, o Opera anunciou o navegador proxy Neon e a Perplexity AI lançou o navegador Comet. O sinal é claro: o futuro da IA está em agentes que possam navegar nas páginas da web de forma autônoma. Essa tendência não é apenas adicionar chatbots mais inteligentes aos navegadores, é uma mudança fundamental na forma como as máquinas interagem com o ambiente digital. Os agentes de navegador são sistemas de IA que "veem" páginas da web e tomam medidas: clicando em links, preenchendo formulários, rolando páginas, inserindo texto: assim como os usuários humanos. Este modelo promete desbloquear enorme produtividade e valor económico automatizando tarefas que ainda são manuais ou demasiado complexas para scripts tradicionais. ▲ GIF demo: AI browser agent em ação: siga as instruções, navegue até a página do conjunto de dados de destino, faça capturas de tela automaticamente e extraia os dados necessários. Quem vai ganhar a guerra dos navegadores de IA? Quase todas as grandes empresas de tecnologia (, bem como algumas startups ) estão desenvolvendo seus próprios agentes de IA de navegador. Aqui estão alguns dos projetos mais representativos: OpenAI – Modo Agente O modo Agente da OpenAI ( anteriormente conhecido como Operador, lançado em janeiro de 2025 ) é um agente de IA com seu próprio navegador. Os operadores podem lidar com uma variedade de tarefas on-line repetitivas: preenchimento de formulários da web, pedidos de mantimentos, agendamento de reuniões: tudo através de uma interface web padrão comumente usada por seres humanos. ▲ Os agentes de IA agendam reuniões como assistentes profissionais: verifique calendários, encontre horários disponíveis, crie eventos, envie confirmações e gere documentos .ics para você. Anthropic – "Computer Use" de Claude No final de 2024, a Anthropic introduziu um novo recurso "Computer Use ( Computer )Use" para Claude 3.5, dando-lhe a capacidade de operar computadores e navegadores como um humano. Claude pode olhar para a tela, mover o cursor, clicar em botões e inserir texto. Esta é a primeira ferramenta de proxy de grande modelo de seu tipo a entrar na versão beta pública, permitindo que os desenvolvedores permitam que Claude navegue em sites e aplicativos automaticamente. Anthropic posiciona-o como um recurso experimental com o objetivo principal de automatizar fluxos de trabalho de várias etapas em páginas da web. Perplexidade – A startup de IA Comet Perplexity ( mais conhecida por seu mecanismo de perguntas e respostas ) lançou o navegador Comet em meados de 2025 como uma alternativa alimentada por IA ao Chrome. Em sua essência, o Comet é um mecanismo de pesquisa de IA conversacional integrado ao (omnibox) da barra de URL que fornece perguntas e respostas instantâneas e resumos em vez dos links de pesquisa tradicionais. Além disso, o Comet tem o Comet Assistant integrado, um agente residente na barra lateral que automatiza tarefas de rotina em todos os locais. Por exemplo, ele pode resumir as mensagens abertas, agendar uma reunião, gerenciar a paginação do navegador ou navegar e rastrear informações da Web em seu nome. Permitindo que os agentes estejam cientes do conteúdo atual da web por meio de uma interface de barra lateral, o Comet visa misturar perfeitamente a navegação com assistentes de IA. Cenários de aplicativos do mundo real de proxies de navegador No artigo anterior, analisamos como ( grandes empresas de tecnologia, como )OpenAI, Anthropic, Perplexity, etc., têm (browser proxies de navegador através de diferentes formulários de produtos agents) Funcionalidade de injeção. Para entender seu valor de forma mais intuitiva, podemos dar uma olhada mais de perto em como esses recursos podem ser aplicados à vida cotidiana e aos fluxos de trabalho corporativos em cenários do mundo real. Automação Web Diária #E-commerce & Compras Pessoais Um cenário muito prático é delegar tarefas de compras e reservas a um agente. Os agentes podem preencher automaticamente seu carrinho de compras on-line e fazer pedidos com base em listas fixas, ou podem encontrar os preços mais baixos em vários varejistas e concluir o processo de checkout em seu nome. Para viagens, você pode pedir à IA para executar tarefas como: "Reserve um voo para Tóquio no próximo mês ( tarifa abaixo de US $ 800 ) e reserve um hotel com Wi-Fi gratuito." O agente lida com todo o processo: pesquisa de voos, comparação de opções, preenchimento de informações de passageiros, conclusão de reservas de hotel, tudo através de sites de companhias aéreas e hotéis. Esse nível de automação vai muito além dos robôs de viagem existentes: não é apenas recomendar, é executar diretamente as compras. # Melhorar a eficiência do escritório Os proxies são capazes de automatizar muitas das ações de negócios repetitivas que as pessoas fazem em seus navegadores. Por exemplo, organize e-mails e extraia listas de tarefas ou verifique lacunas em vários calendários e agende reuniões automaticamente. O assistente Comet da Perplexity já pode resumir o conteúdo da sua caixa de entrada ou adicionar uma agenda para você através da interface web. Os agentes também podem fazer login na ferramenta SaaS para gerar relatórios regulares, atualizar planilhas ou enviar formulários depois de autorizado por você. Imagine um agente de RH que pode fazer login automaticamente em diferentes quadros de empregos para publicar vagas; Ou um agente de vendas que pode atualizar o perfil do lead para o sistema CRM. Essas tarefas mundanas teriam consumido muito tempo dos funcionários, mas a IA pode fazer isso automatizando formulários da web e ações de página. Além de uma única tarefa, os agentes podem conectar fluxos de trabalho completos em vários sistemas de rede. Todas essas etapas precisam ser executadas em diferentes interfaces web, que é a força do agente do navegador. Os agentes podem fazer login em vários painéis para solucionar problemas e até mesmo orquestrar processos, como a integração de novos funcionários ( a criação de ) de conta em vários sites SaaS. Essencialmente, qualquer operação de várias etapas que atualmente exija clicar em vários sites pode ser executada por um agente. Desafios e limitações de hoje Apesar do potencial, os proxies de navegador de hoje ainda estão longe de ser perfeitos. As implementações atuais revelam alguns desafios técnicos e de infraestrutura de longa data: Incompatibilidade de arquitetura...

AGENT-5.67%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)