- Implementación de detector híbrido (Whisper + Chat + Audio + VLM) - Sistema de detección de gameplay real vs hablando - Scene detection con FFmpeg - Soporte para RTX 3050 y RX 6800 XT - Guía completa en 6800xt.md para próxima IA - Scripts de filtrado visual y análisis de contexto - Pipeline automatizado de generación de videos
28 lines
727 B
Bash
Executable File
28 lines
727 B
Bash
Executable File
#!/bin/bash
|
|
|
|
echo "=== SETUP VLM PARA RTX 3050 ==="
|
|
echo ""
|
|
|
|
# Crear entorno virtual si no existe
|
|
if [ ! -d "vlm_env" ]; then
|
|
python3 -m venv vlm_env
|
|
fi
|
|
|
|
source vlm_env/bin/activate
|
|
|
|
# Instalar dependencias
|
|
echo "Instalando dependencias..."
|
|
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu118
|
|
pip install transformers Pillow
|
|
|
|
# Descargar Moondream (automático al primera ejecución)
|
|
echo ""
|
|
echo "✅ Dependencias instaladas"
|
|
echo ""
|
|
echo "Para ejecutar:"
|
|
echo " source vlm_env/bin/activate"
|
|
echo " python3 vlm_detector.py --video nuevo_stream_360p.mp4"
|
|
echo ""
|
|
echo "Esto analizará el video y creará 'gameplay_segments_vlm.json'"
|
|
echo "con los timestamps EXACTOS donde está jugando LoL"
|