Скиллы Новичок Управление и автоматизация

Agent Browser

Скачать ZIP
18
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

Agent Browser — это CLI-инструмент для автоматизации браузера без графического интерфейса, оптимизированный для AI-агентов. Он позволяет управлять веб-страницами через структурированные команды, используя снимки дерева доступности и ссылки (refs) для точного выбора элементов.

Что это такое

Agent Browser предоставляет агентам возможность взаимодействовать с вебом так же, как это делает человек: открывать страницы, нажимать кнопки, заполнять формы и извлекать данные — но при этом полностью программно и детерминированно.

Вместо CSS-селекторов или XPath используется модель ссылок (@e1, @e2), получаемых из снимков страницы. Это делает автоматизацию более устойчивой к изменениям интерфейса.

Быстрый старт

agent-browser open  # Открыть страницу
agent-browser snapshot -i # Получить интерактивные элементы
agent-browser click @e1 # Клик по элементу
agent-browser fill @e2 "text" # Ввести текст
agent-browser close # Закрыть браузер

Основной рабочий процесс

  • Открыть страницу: agent-browser open
  • Сделать снимок: agent-browser snapshot -i
  • Взаимодействовать с элементами через refs
  • Повторно делать snapshot после изменений DOM

Ключевые команды

Навигация

agent-browser open 
agent-browser back
agent-browser forward
agent-browser reload
agent-browser close

Снимки страницы

agent-browser snapshot # Полное дерево
agent-browser snapshot -i # Только интерактивные элементы
agent-browser snapshot -c # Компактный вывод
agent-browser snapshot -d 3 # Ограничение глубины
agent-browser snapshot -s "#main" # Область по селектору

Взаимодействие

agent-browser click @e1
agent-browser fill @e2 "text"
agent-browser type @e2 "text"
agent-browser hover @e1
agent-browser check @e1
agent-browser select @e1 "value"
agent-browser press Enter
agent-browser scroll down 500
agent-browser drag @e1 @e2

Получение данных

agent-browser get text @e1
agent-browser get html @e1
agent-browser get value @e1
agent-browser get attr @e1 href
agent-browser get title
agent-browser get url

Скриншоты и PDF

agent-browser screenshot
agent-browser screenshot path.png
agent-browser screenshot --full
agent-browser pdf output.pdf

Запись видео

agent-browser record start ./demo.webm
agent-browser record stop
agent-browser record restart ./take2.webm

Когда использовать

  • Автоматизация многошаговых сценариев
  • Работа со сложными веб-приложениями
  • Заполнение форм и тестирование интерфейсов
  • Сбор и извлечение данных
  • Сценарии, где важна точность и повторяемость

Особенности

  • Детерминированный выбор элементов через refs
  • Снимки дерева доступности вместо DOM-зависимых селекторов
  • Поддержка сессий и сохранения состояния
  • Высокая производительность в headless-режиме
  • Подходит для интеграции с AI-агентами

Agent Browser — это инструмент, который делает взаимодействие AI-агентов с вебом предсказуемым, быстрым и устойчивым к изменениям интерфейса.


Файл из источника

10693_agent-browser-3-0.1.0.zip