AI Browser Agent

Агент для автономной автоматизации браузера: получает задачу в тексте, управляет браузером через OpenAI и выполняет действия на страницах (переходы, клики, ввод в формы и т.д.).

Требования

Node.js 18+
Ключ OpenAI API

Установка

npm install

При установке автоматически ставится Chromium для Playwright (postinstall).

Настройка

Скопируйте пример конфигурации:
```
cp .env.example .env
```

В .env укажите ключ OpenAI:

OPENAI_API_KEY=sk-your-openai-api-key-here

Запуск

Обычный режим

npm start

Программа запросит задачу в консоли. Введите текст задачи (например: «Открой google.com и найди погоду в Москве») и нажмите Enter. Откроется браузер, агент начнёт выполнять задачу.

Интерактивный режим (браузер в половину экрана)

npm run start:interactive

Перед стартом агента появится подсказка: разместите консоль слева, браузер откроется справа в половину экрана. Удобно, когда нужно следить за действиями агента.

Только браузер (без агента)

npm run browser

Запускается только браузер с постоянным контекстом. API-ключ не нужен. Закройте окно браузера или нажмите Ctrl+C для выхода.

Безопасность

Для потенциально опасных действий (например, отправка формы, переход по ссылке) агент запрашивает подтверждение в консоли: «Allow? (yes/no)». Ответьте yes или no.

Что умеет агент

Навигация: открытие URL, новая вкладка, переключение вкладок
Страница: клик по элементу (по id из снимка страницы), ввод текста, выбор в выпадающем списке, чекбоксы/радио, прокрутка, ожидание
Завершение: по окончании задачи агент вызывает task_done и выводит результат в консоль
Вопрос пользователю: если нужны данные от вас (пароль, выбор), агент вызовет request_user_input — ответ вводится в консоль

Задача классифицируется (навигация, форма, чтение), для каждого типа используется свой системный промпт.

Примеры задач

«Открой https://example.com и нажми на ссылку "More information"»
«Зайди на google.com, введи в поиск "погода Москва" и нажми Поиск»
«Открой страницу логина example.com, введи логин user и пароль (запроси у пользователя), нажми Войти»

После выполнения

Браузер остаётся открытым. Можно закрыть его вручную или запустить приложение снова и ввести новую задачу.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
src		src
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
package-lock.json		package-lock.json
package.json		package.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI Browser Agent

Требования

Установка

Настройка

Запуск

Обычный режим

Интерактивный режим (браузер в половину экрана)

Только браузер (без агента)

Безопасность

Что умеет агент

Примеры задач

После выполнения

About

Uh oh!

Releases

Packages

Languages

universe-coder/test-work-ai-dev

Folders and files

Latest commit

History

Repository files navigation

AI Browser Agent

Требования

Установка

Настройка

Запуск

Обычный режим

Интерактивный режим (браузер в половину экрана)

Только браузер (без агента)

Безопасность

Что умеет агент

Примеры задач

После выполнения

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages