Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.
Agent Browser — это CLI-инструмент для автоматизации браузера без графического интерфейса, оптимизированный для AI-агентов. Он позволяет управлять веб-страницами через структурированные команды, используя снимки дерева доступности и ссылки (refs) для точного выбора элементов.
Что это такое
Agent Browser предоставляет агентам возможность взаимодействовать с вебом так же, как это делает человек: открывать страницы, нажимать кнопки, заполнять формы и извлекать данные — но при этом полностью программно и детерминированно.
Вместо CSS-селекторов или XPath используется модель ссылок (@e1, @e2), получаемых из снимков страницы. Это делает автоматизацию более устойчивой к изменениям интерфейса.
Быстрый старт
agent-browser open # Открыть страницу
agent-browser snapshot -i # Получить интерактивные элементы
agent-browser click @e1 # Клик по элементу
agent-browser fill @e2 "text" # Ввести текст
agent-browser close # Закрыть браузер
Основной рабочий процесс
- Открыть страницу:
agent-browser open - Сделать снимок:
agent-browser snapshot -i - Взаимодействовать с элементами через refs
- Повторно делать snapshot после изменений DOM
Ключевые команды
Навигация
agent-browser open
agent-browser back
agent-browser forward
agent-browser reload
agent-browser close
Снимки страницы
agent-browser snapshot # Полное дерево
agent-browser snapshot -i # Только интерактивные элементы
agent-browser snapshot -c # Компактный вывод
agent-browser snapshot -d 3 # Ограничение глубины
agent-browser snapshot -s "#main" # Область по селектору
Взаимодействие
agent-browser click @e1
agent-browser fill @e2 "text"
agent-browser type @e2 "text"
agent-browser hover @e1
agent-browser check @e1
agent-browser select @e1 "value"
agent-browser press Enter
agent-browser scroll down 500
agent-browser drag @e1 @e2
Получение данных
agent-browser get text @e1
agent-browser get html @e1
agent-browser get value @e1
agent-browser get attr @e1 href
agent-browser get title
agent-browser get url
Скриншоты и PDF
agent-browser screenshot
agent-browser screenshot path.png
agent-browser screenshot --full
agent-browser pdf output.pdf
Запись видео
agent-browser record start ./demo.webm
agent-browser record stop
agent-browser record restart ./take2.webm
Когда использовать
- Автоматизация многошаговых сценариев
- Работа со сложными веб-приложениями
- Заполнение форм и тестирование интерфейсов
- Сбор и извлечение данных
- Сценарии, где важна точность и повторяемость
Особенности
- Детерминированный выбор элементов через refs
- Снимки дерева доступности вместо DOM-зависимых селекторов
- Поддержка сессий и сохранения состояния
- Высокая производительность в headless-режиме
- Подходит для интеграции с AI-агентами
Agent Browser — это инструмент, который делает взаимодействие AI-агентов с вебом предсказуемым, быстрым и устойчивым к изменениям интерфейса.
Файл из источника