- Implementación de detector híbrido (Whisper + Chat + Audio + VLM) - Sistema de detección de gameplay real vs hablando - Scene detection con FFmpeg - Soporte para RTX 3050 y RX 6800 XT - Guía completa en 6800xt.md para próxima IA - Scripts de filtrado visual y análisis de contexto - Pipeline automatizado de generación de videos
32 lines
960 B
Bash
32 lines
960 B
Bash
#!/bin/bash
|
|
# Instalador de VLM para GPU local
|
|
|
|
echo "=== INSTALADOR DE VLM PARA RTX 3050 ==="
|
|
echo ""
|
|
|
|
# Opción 1: Moondream (recomendado - muy ligero)
|
|
echo "Opción 1: Moondream (400MB, ideal para 4GB)"
|
|
echo " - Especializado en análisis de video"
|
|
echo " - Responde preguntas sobre contenido visual"
|
|
echo " - Instalación: pip install moondream"
|
|
echo ""
|
|
|
|
# Opción 2: LLaVA 7B cuantizado
|
|
echo "Opción 2: LLaVA 7B 4-bit (4GB VRAM)"
|
|
echo " - Bueno para detección de escenas complejas"
|
|
echo " - Requiere: pip install llava"
|
|
echo " - Modelo: llava-v1.5-7b-Q4_K_M.gguf"
|
|
echo ""
|
|
|
|
# Opción 3: MiniCPM-V
|
|
echo "Opción 3: MiniCPM-V (2.8B parámetros)"
|
|
echo " - Muy eficiente en VRAM"
|
|
echo " - Bueno para detección de actividades"
|
|
echo " - Instalación: pip install transformers torch"
|
|
echo ""
|
|
|
|
echo "Recomendación: Moondream - Es el más ligero y específico para video"
|
|
echo ""
|
|
echo "Para instalar:"
|
|
echo " pip install moondream transformers torch"
|