Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.
Agent Browser — это CLI-инструмент для автоматизации взаимодействия с браузером, предназначенный для использования из командной строки или в скриптах. Он поддерживает навигацию по страницам, заполнение форм, создание скриншотов, извлечение данных и перехват сетевых запросов, используя подход snapshot-and-ref. :
Установка и запуск
Установить навык можно следующими способами:
clawhub install murphykobe/agent-browser-2
Если CLI ещё не установлен:
npx clawhub@latest install murphykobe/agent-browser-2
Или через OpenClaw CLI:
openclaw skills install murphykobe/agent-browser-2
Что делает этот навык
Agent Browser автоматизирует работу с веб-страницами: от перехода по URL до сложных сценариев взаимодействия. Он позволяет агентам работать с живыми страницами без необходимости напрямую писать код на Playwright или Puppeteer. :
Ключевая идея — использование снимков страницы (snapshot) и ссылок на элементы (ref). Это делает сценарии автоматизации более читаемыми, предсказуемыми и легко комбинируемыми.
Когда использовать
- Автоматическое заполнение и отправка многошаговых форм
- Сбор цен, товаров и других данных с сайтов
- Создание полноэкранных скриншотов
- Тестирование логина и сохранение сессий
- Запись демонстраций работы веб-приложений
Как это работает
Основной рабочий процесс строится вокруг трёх шагов:
- Переход на страницу
- Получение snapshot с интерактивными элементами
- Взаимодействие с элементами через ссылки вида
@e1,@e2
После любых изменений страницы рекомендуется повторно делать snapshot, чтобы работать с актуальными элементами.
Пример рабочего процесса
Предположим, пользователь просит: «войти на сайт и сделать скриншот панели управления».
Действия агента
- Открыть страницу входа
- Сделать snapshot и получить ссылки на элементы
- Заполнить поля логина и пароля
- Нажать кнопку входа
- Дождаться перехода на нужный URL
- Сделать полноэкранный скриншот
Результат
Скриншот страницы будет сохранён локально, например, в файл dashboard.png. :
Ключевые возможности
- Навигация по страницам (open, back, reload)
- Работа с элементами через ref-ссылки
- Получение данных (текст, HTML, атрибуты)
- Проверка состояния элементов
- Ожидание событий и загрузки
- Работа с сессиями и состоянием
- Контроль сетевых запросов
Инструмент особенно эффективен для сложных SPA-приложений и сценариев, где важна точность выбора элементов и скорость выполнения. :
Почему это важно
В отличие от традиционных инструментов автоматизации, Agent Browser не требует ручной работы с селекторами или DOM. Вместо этого он использует структуру доступности страницы, что делает сценарии устойчивыми к изменениям верстки.
Это особенно полезно для AI-агентов, которым нужна предсказуемая и стабильная среда для взаимодействия с вебом.
Файл из источника