Skip to content

universe-coder/test-work-ai-dev

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

AI Browser Agent

Агент для автономной автоматизации браузера: получает задачу в тексте, управляет браузером через OpenAI и выполняет действия на страницах (переходы, клики, ввод в формы и т.д.).

Требования

  • Node.js 18+
  • Ключ OpenAI API

Установка

npm install

При установке автоматически ставится Chromium для Playwright (postinstall).

Настройка

  1. Скопируйте пример конфигурации:
    cp .env.example .env
  2. В .env укажите ключ OpenAI:
    OPENAI_API_KEY=sk-your-openai-api-key-here
    

Запуск

Обычный режим

npm start

Программа запросит задачу в консоли. Введите текст задачи (например: «Открой google.com и найди погоду в Москве») и нажмите Enter. Откроется браузер, агент начнёт выполнять задачу.

Интерактивный режим (браузер в половину экрана)

npm run start:interactive

Перед стартом агента появится подсказка: разместите консоль слева, браузер откроется справа в половину экрана. Удобно, когда нужно следить за действиями агента.

Только браузер (без агента)

npm run browser

Запускается только браузер с постоянным контекстом. API-ключ не нужен. Закройте окно браузера или нажмите Ctrl+C для выхода.

Безопасность

Для потенциально опасных действий (например, отправка формы, переход по ссылке) агент запрашивает подтверждение в консоли: «Allow? (yes/no)». Ответьте yes или no.

Что умеет агент

  • Навигация: открытие URL, новая вкладка, переключение вкладок
  • Страница: клик по элементу (по id из снимка страницы), ввод текста, выбор в выпадающем списке, чекбоксы/радио, прокрутка, ожидание
  • Завершение: по окончании задачи агент вызывает task_done и выводит результат в консоль
  • Вопрос пользователю: если нужны данные от вас (пароль, выбор), агент вызовет request_user_input — ответ вводится в консоль

Задача классифицируется (навигация, форма, чтение), для каждого типа используется свой системный промпт.

Примеры задач

  • «Открой https://example.com и нажми на ссылку "More information"»
  • «Зайди на google.com, введи в поиск "погода Москва" и нажми Поиск»
  • «Открой страницу логина example.com, введи логин user и пароль (запроси у пользователя), нажми Войти»

После выполнения

Браузер остаётся открытым. Можно закрыть его вручную или запустить приложение снова и ввести новую задачу.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published