renato97/cbc2027

Fork 0

Files

renato97 9fb01d5c22 Initial commit

2025-12-16 22:32:27 +00:00

6.3 KiB

Raw Blame History

Nextcloud AI Service v8 Final

Sistema completo de procesamiento de audio, PDF y generación de resúmenes colaborativos mediante 3 modelos de IA.

🚀 Características Principales

🤖 Sistema Unificado de 3 IAs

GPT-OSS-120B: Extracción de puntos clave mediante DeepInfra API
Claude CLI: Desarrollo de resúmenes integrales mediante Z.ai API
Gemini CLI: Formato y estilo final mediante CLI de Google

📁 Procesamiento de Archivos

Audio: Transcripción con Whisper y generación de resúmenes
PDF: OCR avanzado y conversión a documentos editables
Documentos: Generación de resúmenes automáticos
Sincronización: Integración completa con Nextcloud via WebDAV

🎯 Características Técnicas

Docker Multi-etapa: Optimizado para producción
GPU CUDA 12.1: Aceleración por hardware NVIDIA
CLI Tools: Claude CLI y Gemini CLI para máxima compatibilidad
Unificación: Sistema colaborativo que genera un único documento final

🛠️ Instalación

Requisitos

Docker y Docker Compose
NVIDIA GPU con drivers CUDA 12.1+
16GB+ RAM recomendado
20GB+ espacio en disco

Configuración

Clonar el repositorio

git clone https://gitea.cbcren.online/ren/nextcloud-ai-v8-final.git
cd nextcloud-ai-v8-final

Configurar variables de entorno

cp .env.example .env
# Editar .env con tus credenciales

Iniciar servicios
```
docker-compose up -d
```

⚙️ Configuración de Variables de Entorno

Nextcloud

NEXTCLOUD_URL=https://tu-nextcloud.com
NEXTCLOUD_USER=tu_usuario
NEXTCLOUD_PASS=tu_contraseña

APIs de IA

GEMINI_API_KEY=tu_gemini_key
DEEPINFRA_API_KEY=tu_deepinfra_key
ANTHROPIC_BASE_URL=https://api.z.ai/api/anthropic
ANTHROPIC_AUTH_TOKEN=tu_z_ai_token

Notificaciones (Opcional)

TELEGRAM_TOKEN=tu_bot_token
TELEGRAM_CHAT_ID=tu_chat_id

📊 Arquitectura del Sistema

┌─────────────────┐    ┌─────────────────┐    ┌─────────────────┐
│   GPT-OSS-120B  │───▶│    Claude CLI   │───▶│   Gemini CLI    │
│  (DeepInfra)    │    │     (Z.ai)      │    │    (Google)     │
└─────────────────┘    └─────────────────┘    └─────────────────┘
         │                       │                       │
         ▼                       ▼                       ▼
┌─────────────────────────────────────────────────────────────────┐
│                    Sistema Unificado                            │
│                 (Documento Final Único)                      │
└─────────────────────────────────────────────────────────────────┘
                                │
                                ▼
┌─────────────────────────────────────────────────────────────────┐
│                     Nextcloud Service                          │
│              (Sincronización WebDAV)                           │
└─────────────────────────────────────────────────────────────────┘

🔧 Uso

Procesamiento Automático

Sube archivos de audio a la carpeta Audios en Nextcloud
El sistema detecta automáticamente y genera resúmenes
Los documentos finales se guardan en Documentos
Las versiones Markdown se sincronizan con Notes

Monitoreo

Logs: docker-compose logs -f app
Estado: docker-compose ps
Telegram: Notificaciones automáticas (si está configurado)

🎨 Salida del Sistema

El sistema genera documentos unificados con:

Puntos Clave: Extraídos por GPT-OSS-120B
Resumen Integral: Desarrollado por Claude CLI (500+ palabras)
Quiz de Evaluación: 10 preguntas de opción múltiple
Metadatos: Información del proceso colaborativo

🐳 Docker

Estructura de Contenedores

app: Servicio principal con soporte GPU
ollama: Servidor Ollama para modelos locales

Personalización

# Reconstruir contenedores
docker-compose build

# Reiniciar servicios
docker-compose restart

# Ver logs en tiempo real
docker-compose logs -f app

🚨 Troubleshooting

Problemas Comunes

Error de permisos Claude CLI
- Solución: CLAUDE_DANGEROUSLY_SKIP_PERMISSIONS=1 en docker-compose.yml
Timeout en procesamiento
- Aumentar MODEL_TIMEOUT_SECONDS en .env
Problemas de GPU
- Verificar drivers NVIDIA y CUDA 12.1+
- Comprobar nvidia-smi
Error de APIs
- Verificar keys y endpoints en .env
- Comprobar límites de las APIs

📈 Métricas y Optimización

Rendimiento

Tiempo de procesamiento: ~2-5 minutos por audio de 5min
Uso de VRAM: ~8-12GB con modelos GPU
Calidad de resúmenes: Formato académico con análisis profundo

Optimización

VRAM Management: Limpieza automática cada 5 minutos
Error Handling: Reintentos automáticos con backoff exponencial
Timeout Configurable: Adaptarse a diferentes cargas de trabajo

🔐 Seguridad

API Keys: Almacenadas como variables de entorno
WebDAV: Autenticación básica con HTTPS
CLI Tools: Configuración segura sin permisos de root
Redes: Aislamiento de contenedores Docker

🤝 Contribuciones

Fork del repositorio
Crear rama feature
Commit con cambios descriptivos
Pull Request para revisión

📄 Licencia

MIT License - Ver archivo LICENSE para detalles

📞 Soporte

Para problemas o preguntas:

Crear issue en el repositorio
Revisar logs del sistema
Verificar documentación de variables de entorno

Versión: 8.0 Final Última Actualización: Septiembre 2024 Estado: Producción estable

6.3 KiB Raw Blame History