Servicio de análisis de imágenes y documentos utilizando Google Gemini y OpenCV.
- Análisis de tickets para extraer fecha, token de facturación y categoría
- Análisis de documentos fiscales para extraer información del contribuyente
- Procesamiento de imágenes usando procesamiento local con OpenCV y pytesseract
- Python 3.9+
- Tesseract OCR instalado en el sistema
- API Key de Google Gemini
- Clonar el repositorio:
git clone <repositorio>
cd ComputerVisionService- Crear un entorno virtual:
python -m venv venv_cv
source venv_cv/bin/activate # En Windows: venv_cv\Scripts\activate- Instalar dependencias:
pip install -r requirements.txt- Configurar variables de entorno:
# Crear archivo .env con la siguiente información
GENAI_API_KEY=tu_api_key_aquiPara iniciar el servidor:
python main.pyO usando directamente uvicorn:
uvicorn app.main:app --host 0.0.0.0 --port 8000 --reloadEl servidor estará disponible en http://localhost:8000 y la documentación en http://localhost:8000/docs
POST /api/v1/ticket/: Analiza un ticket usando Google GeminiPOST /api/v1/ticket/manual: Analiza un ticket usando procesamiento local
POST /api/v1/fiscal/: Analiza un documento fiscal para extraer información del contribuyente
ComputerVisionService/
├── app/
│ ├── core/ # Configuración y utilidades
│ ├── models/ # Modelos Pydantic
│ ├── routers/ # Endpoints de la API
│ ├── services/ # Lógica de negocio
│ └── main.py # Aplicación FastAPI
├── .env # Variables de entorno
├── main.py # Punto de entrada
└── requirements.txt # Dependencias