Sistema completo de detección de highlights con VLM y análisis de gameplay

- Implementación de detector híbrido (Whisper + Chat + Audio + VLM)
- Sistema de detección de gameplay real vs hablando
- Scene detection con FFmpeg
- Soporte para RTX 3050 y RX 6800 XT
- Guía completa en 6800xt.md para próxima IA
- Scripts de filtrado visual y análisis de contexto
- Pipeline automatizado de generación de videos
This commit is contained in:
renato97
2026-02-19 17:38:14 +00:00
parent c1c66a7d9a
commit 00180d0b1c
45 changed files with 10636 additions and 260 deletions

31
install_vlm.sh Normal file
View File

@@ -0,0 +1,31 @@
#!/bin/bash
# Instalador de VLM para GPU local
echo "=== INSTALADOR DE VLM PARA RTX 3050 ==="
echo ""
# Opción 1: Moondream (recomendado - muy ligero)
echo "Opción 1: Moondream (400MB, ideal para 4GB)"
echo " - Especializado en análisis de video"
echo " - Responde preguntas sobre contenido visual"
echo " - Instalación: pip install moondream"
echo ""
# Opción 2: LLaVA 7B cuantizado
echo "Opción 2: LLaVA 7B 4-bit (4GB VRAM)"
echo " - Bueno para detección de escenas complejas"
echo " - Requiere: pip install llava"
echo " - Modelo: llava-v1.5-7b-Q4_K_M.gguf"
echo ""
# Opción 3: MiniCPM-V
echo "Opción 3: MiniCPM-V (2.8B parámetros)"
echo " - Muy eficiente en VRAM"
echo " - Bueno para detección de actividades"
echo " - Instalación: pip install transformers torch"
echo ""
echo "Recomendación: Moondream - Es el más ligero y específico para video"
echo ""
echo "Para instalar:"
echo " pip install moondream transformers torch"