Files
cbc2027/README.md
2025-12-16 22:32:27 +00:00

6.3 KiB

Nextcloud AI Service v8 Final

Sistema completo de procesamiento de audio, PDF y generación de resúmenes colaborativos mediante 3 modelos de IA.

🚀 Características Principales

🤖 Sistema Unificado de 3 IAs

  • GPT-OSS-120B: Extracción de puntos clave mediante DeepInfra API
  • Claude CLI: Desarrollo de resúmenes integrales mediante Z.ai API
  • Gemini CLI: Formato y estilo final mediante CLI de Google

📁 Procesamiento de Archivos

  • Audio: Transcripción con Whisper y generación de resúmenes
  • PDF: OCR avanzado y conversión a documentos editables
  • Documentos: Generación de resúmenes automáticos
  • Sincronización: Integración completa con Nextcloud via WebDAV

🎯 Características Técnicas

  • Docker Multi-etapa: Optimizado para producción
  • GPU CUDA 12.1: Aceleración por hardware NVIDIA
  • CLI Tools: Claude CLI y Gemini CLI para máxima compatibilidad
  • Unificación: Sistema colaborativo que genera un único documento final

🛠️ Instalación

Requisitos

  • Docker y Docker Compose
  • NVIDIA GPU con drivers CUDA 12.1+
  • 16GB+ RAM recomendado
  • 20GB+ espacio en disco

Configuración

  1. Clonar el repositorio

    git clone https://gitea.cbcren.online/ren/nextcloud-ai-v8-final.git
    cd nextcloud-ai-v8-final
    
  2. Configurar variables de entorno

    cp .env.example .env
    # Editar .env con tus credenciales
    
  3. Iniciar servicios

    docker-compose up -d
    

⚙️ Configuración de Variables de Entorno

Nextcloud

NEXTCLOUD_URL=https://tu-nextcloud.com
NEXTCLOUD_USER=tu_usuario
NEXTCLOUD_PASS=tu_contraseña

APIs de IA

GEMINI_API_KEY=tu_gemini_key
DEEPINFRA_API_KEY=tu_deepinfra_key
ANTHROPIC_BASE_URL=https://api.z.ai/api/anthropic
ANTHROPIC_AUTH_TOKEN=tu_z_ai_token

Notificaciones (Opcional)

TELEGRAM_TOKEN=tu_bot_token
TELEGRAM_CHAT_ID=tu_chat_id

📊 Arquitectura del Sistema

┌─────────────────┐    ┌─────────────────┐    ┌─────────────────┐
│   GPT-OSS-120B  │───▶│    Claude CLI   │───▶│   Gemini CLI    │
│  (DeepInfra)    │    │     (Z.ai)      │    │    (Google)     │
└─────────────────┘    └─────────────────┘    └─────────────────┘
         │                       │                       │
         ▼                       ▼                       ▼
┌─────────────────────────────────────────────────────────────────┐
│                    Sistema Unificado                            │
│                 (Documento Final Único)                      │
└─────────────────────────────────────────────────────────────────┘
                                │
                                ▼
┌─────────────────────────────────────────────────────────────────┐
│                     Nextcloud Service                          │
│              (Sincronización WebDAV)                           │
└─────────────────────────────────────────────────────────────────┘

🔧 Uso

Procesamiento Automático

  1. Sube archivos de audio a la carpeta Audios en Nextcloud
  2. El sistema detecta automáticamente y genera resúmenes
  3. Los documentos finales se guardan en Documentos
  4. Las versiones Markdown se sincronizan con Notes

Monitoreo

  • Logs: docker-compose logs -f app
  • Estado: docker-compose ps
  • Telegram: Notificaciones automáticas (si está configurado)

🎨 Salida del Sistema

El sistema genera documentos unificados con:

  1. Puntos Clave: Extraídos por GPT-OSS-120B
  2. Resumen Integral: Desarrollado por Claude CLI (500+ palabras)
  3. Quiz de Evaluación: 10 preguntas de opción múltiple
  4. Metadatos: Información del proceso colaborativo

🐳 Docker

Estructura de Contenedores

  • app: Servicio principal con soporte GPU
  • ollama: Servidor Ollama para modelos locales

Personalización

# Reconstruir contenedores
docker-compose build

# Reiniciar servicios
docker-compose restart

# Ver logs en tiempo real
docker-compose logs -f app

🚨 Troubleshooting

Problemas Comunes

  1. Error de permisos Claude CLI

    • Solución: CLAUDE_DANGEROUSLY_SKIP_PERMISSIONS=1 en docker-compose.yml
  2. Timeout en procesamiento

    • Aumentar MODEL_TIMEOUT_SECONDS en .env
  3. Problemas de GPU

    • Verificar drivers NVIDIA y CUDA 12.1+
    • Comprobar nvidia-smi
  4. Error de APIs

    • Verificar keys y endpoints en .env
    • Comprobar límites de las APIs

📈 Métricas y Optimización

Rendimiento

  • Tiempo de procesamiento: ~2-5 minutos por audio de 5min
  • Uso de VRAM: ~8-12GB con modelos GPU
  • Calidad de resúmenes: Formato académico con análisis profundo

Optimización

  • VRAM Management: Limpieza automática cada 5 minutos
  • Error Handling: Reintentos automáticos con backoff exponencial
  • Timeout Configurable: Adaptarse a diferentes cargas de trabajo

🔐 Seguridad

  • API Keys: Almacenadas como variables de entorno
  • WebDAV: Autenticación básica con HTTPS
  • CLI Tools: Configuración segura sin permisos de root
  • Redes: Aislamiento de contenedores Docker

🤝 Contribuciones

  1. Fork del repositorio
  2. Crear rama feature
  3. Commit con cambios descriptivos
  4. Pull Request para revisión

📄 Licencia

MIT License - Ver archivo LICENSE para detalles

📞 Soporte

Para problemas o preguntas:

  • Crear issue en el repositorio
  • Revisar logs del sistema
  • Verificar documentación de variables de entorno

Versión: 8.0 Final Última Actualización: Septiembre 2024 Estado: Producción estable