6.3 KiB
6.3 KiB
Nextcloud AI Service v8 Final
Sistema completo de procesamiento de audio, PDF y generación de resúmenes colaborativos mediante 3 modelos de IA.
🚀 Características Principales
🤖 Sistema Unificado de 3 IAs
- GPT-OSS-120B: Extracción de puntos clave mediante DeepInfra API
- Claude CLI: Desarrollo de resúmenes integrales mediante Z.ai API
- Gemini CLI: Formato y estilo final mediante CLI de Google
📁 Procesamiento de Archivos
- Audio: Transcripción con Whisper y generación de resúmenes
- PDF: OCR avanzado y conversión a documentos editables
- Documentos: Generación de resúmenes automáticos
- Sincronización: Integración completa con Nextcloud via WebDAV
🎯 Características Técnicas
- Docker Multi-etapa: Optimizado para producción
- GPU CUDA 12.1: Aceleración por hardware NVIDIA
- CLI Tools: Claude CLI y Gemini CLI para máxima compatibilidad
- Unificación: Sistema colaborativo que genera un único documento final
🛠️ Instalación
Requisitos
- Docker y Docker Compose
- NVIDIA GPU con drivers CUDA 12.1+
- 16GB+ RAM recomendado
- 20GB+ espacio en disco
Configuración
-
Clonar el repositorio
git clone https://gitea.cbcren.online/ren/nextcloud-ai-v8-final.git cd nextcloud-ai-v8-final -
Configurar variables de entorno
cp .env.example .env # Editar .env con tus credenciales -
Iniciar servicios
docker-compose up -d
⚙️ Configuración de Variables de Entorno
Nextcloud
NEXTCLOUD_URL=https://tu-nextcloud.com
NEXTCLOUD_USER=tu_usuario
NEXTCLOUD_PASS=tu_contraseña
APIs de IA
GEMINI_API_KEY=tu_gemini_key
DEEPINFRA_API_KEY=tu_deepinfra_key
ANTHROPIC_BASE_URL=https://api.z.ai/api/anthropic
ANTHROPIC_AUTH_TOKEN=tu_z_ai_token
Notificaciones (Opcional)
TELEGRAM_TOKEN=tu_bot_token
TELEGRAM_CHAT_ID=tu_chat_id
📊 Arquitectura del Sistema
┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐
│ GPT-OSS-120B │───▶│ Claude CLI │───▶│ Gemini CLI │
│ (DeepInfra) │ │ (Z.ai) │ │ (Google) │
└─────────────────┘ └─────────────────┘ └─────────────────┘
│ │ │
▼ ▼ ▼
┌─────────────────────────────────────────────────────────────────┐
│ Sistema Unificado │
│ (Documento Final Único) │
└─────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────┐
│ Nextcloud Service │
│ (Sincronización WebDAV) │
└─────────────────────────────────────────────────────────────────┘
🔧 Uso
Procesamiento Automático
- Sube archivos de audio a la carpeta
Audiosen Nextcloud - El sistema detecta automáticamente y genera resúmenes
- Los documentos finales se guardan en
Documentos - Las versiones Markdown se sincronizan con
Notes
Monitoreo
- Logs:
docker-compose logs -f app - Estado:
docker-compose ps - Telegram: Notificaciones automáticas (si está configurado)
🎨 Salida del Sistema
El sistema genera documentos unificados con:
- Puntos Clave: Extraídos por GPT-OSS-120B
- Resumen Integral: Desarrollado por Claude CLI (500+ palabras)
- Quiz de Evaluación: 10 preguntas de opción múltiple
- Metadatos: Información del proceso colaborativo
🐳 Docker
Estructura de Contenedores
- app: Servicio principal con soporte GPU
- ollama: Servidor Ollama para modelos locales
Personalización
# Reconstruir contenedores
docker-compose build
# Reiniciar servicios
docker-compose restart
# Ver logs en tiempo real
docker-compose logs -f app
🚨 Troubleshooting
Problemas Comunes
-
Error de permisos Claude CLI
- Solución:
CLAUDE_DANGEROUSLY_SKIP_PERMISSIONS=1en docker-compose.yml
- Solución:
-
Timeout en procesamiento
- Aumentar
MODEL_TIMEOUT_SECONDSen .env
- Aumentar
-
Problemas de GPU
- Verificar drivers NVIDIA y CUDA 12.1+
- Comprobar
nvidia-smi
-
Error de APIs
- Verificar keys y endpoints en .env
- Comprobar límites de las APIs
📈 Métricas y Optimización
Rendimiento
- Tiempo de procesamiento: ~2-5 minutos por audio de 5min
- Uso de VRAM: ~8-12GB con modelos GPU
- Calidad de resúmenes: Formato académico con análisis profundo
Optimización
- VRAM Management: Limpieza automática cada 5 minutos
- Error Handling: Reintentos automáticos con backoff exponencial
- Timeout Configurable: Adaptarse a diferentes cargas de trabajo
🔐 Seguridad
- API Keys: Almacenadas como variables de entorno
- WebDAV: Autenticación básica con HTTPS
- CLI Tools: Configuración segura sin permisos de root
- Redes: Aislamiento de contenedores Docker
🤝 Contribuciones
- Fork del repositorio
- Crear rama feature
- Commit con cambios descriptivos
- Pull Request para revisión
📄 Licencia
MIT License - Ver archivo LICENSE para detalles
📞 Soporte
Para problemas o preguntas:
- Crear issue en el repositorio
- Revisar logs del sistema
- Verificar documentación de variables de entorno
Versión: 8.0 Final Última Actualización: Septiembre 2024 Estado: Producción estable