Initial commit: AbletonMCP-AI complete system

- MCP Server with audio fallback, sample management
- Song generator with bus routing
- Reference listener and audio resampler
- Vector-based sample search
- Master chain with limiter and calibration
- Fix: Audio fallback now works without M4L
- Fix: Full song detection in sample loader

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
renato97
2026-03-28 22:53:10 -03:00
commit 6ec8663954
120 changed files with 59101 additions and 0 deletions

View File

@@ -0,0 +1,344 @@
# 🎛️ AbletonMCP AI — Roadmap a Calidad DJ Profesional
> **Documento Maestro** | 28-Mar-2026
> Basado en: `server.py`, `sample_selector.py`, `glm_coherence_diversity.md`, `glm_sample_intelligence.md`, `human_feel.md`
>
> Objetivo: evolucionar el sistema desde un generador MIDI funcional a una herramienta de producción Tech House de **calidad de lanzamiento DJ profesional (DJ Hertz, Innervisions, Get Physical)**.
---
## 🗺️ Mapa de fases
| Fase | Nombre | Estado | Tareas |
|------|--------|--------|--------|
| **0** | Fundación y estabilidad | ✅ DONE | T001T010 |
| **1** | Inteligencia de samples | 🔴 P1 | T011T024 |
| **2** | Coherencia musical & Paleta | 🔴 P1 | T025T039 |
| **3** | Human Feel & Dinámicas | 🟠 P2 | T040T050 |
| **4** | Soundscape & Tonal | 🟠 P2 | T051T062 |
| **5** | Arranjo y estructura DJ | 🟡 P3 | T063T077 |
| **6** | Masterización & Lanzamiento | 🟡 P3 | T078T090 |
| **7** | IA Autónoma y Aprendizaje | 🔵 FUTURO | T091T110 |
---
## FASE 0 — Fundación y Estabilidad ✅
- [x] **T001** — Migrar proyecto a `C:\Users\ren\AbletonMCP_AI` con junction a `ProgramData`
- [x] **T002** — Crear `start_server.bat` con `PYTHONPATH` correcto
- [x] **T003** — Sincronizar `opencode.json` y `.opencode.json` apuntando a ruta nueva
- [x] **T004** — Verificar que `server.py` arranca sin errores en log
- [x] **T005** — Confirmar que `SampleManager` carga la librería completa en `librerias\all_tracks`
- [x] **T006** — Confirmar conexión MCP activa y visible en cliente AI
- [x] **T007** — Resolver permisos NTFS en `ProgramData` para edición directa
- [x] **T008** — Configurar logging a nivel INFO en producción
- [x] **T009** — Integrar estructura de errores: `MCPError`, `ValidationError`, `TimeoutError`
- [x] **T010** — Pipeline end-to-end: generar 1 canción y verificar que carga en Ableton
---
## FASE 1 — Inteligencia de Samples 🔴 PRIORIDAD MÁXIMA
> **Goal**: De 800 samples disponibles, el sistema usa todos inteligentemente, sin repetir, con coherencia tonal.
### 1.A — Fix de repetición (impacto inmediato)
- [ ] **T011**`server.py → _find_library_file()`: aumentar `limit` de semantic search de `10` a `50`
- Bug actual: solo se evalúan 10 resultados; si tienen penalización de diversidad, el sistema queda atascado en los mismos archivos.
- [ ] **T012**`sample_selector.py → select_sample()`: shuffled candidate pool con `session_seed`
- Antes de scorear, aplicar `random.shuffle()` al pool con seed basado en timestamp de la generación.
- [ ] **T013**`server.py → _build_audio_fallback_sample_paths()`: bucket sampling por subcarpeta
- Limitar a máximo 15 archivos por subcarpeta. Garantiza que samples de distintas colecciones entren al pool.
- [ ] **T014** — Verificar y reparar persistencia de `sample_history.json` entre reinicios del servidor
- Si el archivo no existe al arrancar: inicializar con diccionario vacío (no con None).
- [ ] **T015** — Herramienta MCP `get_sample_coverage_report()`
- Devolver: % de cobertura por subcarpeta, samples más usados, samples nunca usados.
### 1.B — Análisis espectral en indexado
- [ ] **T016**`vector_manager.py → _build_index()`: agregar llamada a `AudioAnalyzer.analyze()` para cada sample
- Extraer y guardar en `.sample_embeddings.json`: `key`, `key_confidence`, `spectral_centroid`, `is_harmonic`.
- Flag `--skip-audio-analysis` para rebuild rápido en desarrollo.
- [ ] **T017**`sample_selector.py → _calculate_sample_score()`: agregar factor `brightness_fit` (peso 0.10)
- `atmos`, `pad`, `drone`: penalizar `spectral_centroid > 8000 Hz`.
- `bass`, `sub_bass`: penalizar `spectral_centroid > 3000 Hz`.
- `lead`, `chord`: preferir key dentro de ±1 quinta de la key del proyecto.
- [ ] **T018** — Mejorar el embed de texto en `vector_manager.py` para incluir info espectral
- Formato: `"kick 808 drums bright=low harmonic=no key=None"`
- [ ] **T019** — Validar que `audio_analyzer.py` con `librosa` detecta key en ≥70% de samples
- Script de prueba: analizar 50 archivos aleatorios y reportar `key`, `confidence`.
- [ ] **T020** — Agregar campo `is_tonal` al metadata del índice
- `True` para: chords, pad, lead, bass, pluck, arp, drone.
- `False` para: kick, snare, hat, crash, fill.
### 1.C — Sistema de fatiga persistente
- [ ] **T021** — Crear `sample_fatigue.json` en `~/.abletonmcp_ai/`
- Estructura: `{path: {role: {uses: int, last_used: timestamp}}}`
- Reemplaza gradualmente `_recent_sample_diversity_memory`.
- [ ] **T022** — Factor de fatiga continuo (vs. binario actual)
- 0 usos: sin penalización → `fatigue_factor = 1.0`
- 1-3 usos: `fatigue_factor = 0.75`
- 4-10 usos: `fatigue_factor = 0.50`
- 10+ usos: `fatigue_factor = 0.20` (casi bloqueado)
- [ ] **T023** — Herramienta MCP `reset_sample_fatigue(role=None)`
- Sin `role`: resetear toda la fatiga. Con `role`: resetear solo ese rol.
- [ ] **T024** — Herramienta MCP `get_sample_fatigue_report()`
- Top-10 samples más usados por rol con conteos y timestamps.
---
## FASE 2 — Coherencia Musical & Sistema de Paleta 🔴 PRIORIDAD MÁXIMA
> **Goal**: Cada canción tiene una "identidad sonora" coherente. Drums, bass y music suenan como si vinieran de la misma sesión.
### 2.A — Palette Lock
- [ ] **T025** — Selección de "folder ancla" por bus al inicio de cada generación
- Elegir aleatoriamente de las carpetas **menos usadas** (via Coverage Wheel).
- Mapear: `drums_anchor`, `bass_anchor`, `music_anchor` (FX libre).
- [ ] **T026**`sample_selector.py → _calculate_sample_score()`: agregar factor `palette_bonus`
- Folder ancla: `score *= 1.4` | Folder compatible: `score *= 1.2` | Diferente: `score *= 0.9`
- [ ] **T027** — Guardar la palette en el manifest de generación
- Formato: `{"palette": {"drums": "Splice/Techno/Kit_A", "bass": "SM/TechHouse/Bass"}}`
- [ ] **T028** — Herramienta `set_palette_lock(drums, bass, music)` para override manual
### 2.B — Coverage Wheel
- [ ] **T029** — Crear `collection_coverage.json` en `~/.abletonmcp_ai/`
- Estructura: `{folder_path: {uses: int, last_used: timestamp}}`
- [ ] **T030** — Al terminar cada generación: actualizar Coverage Wheel con carpetas usadas
- [ ] **T031** — Lógica de selección de ancla: weighted random sampling por frescura
- `freshness = max(0, 10 - uses_last_10_gens)` → elegir ancla con mayor freshness.
- [ ] **T032** — Herramienta MCP `get_coverage_wheel_report()` → heatmap de uso por carpeta
### 2.C — Wild Card Injection
- [ ] **T033** — Seleccionar 2-3 roles "wild card" por generación
- Para wild cards: solo 2 filtros duros (rol correcto + duración válida), sin penalización.
- [ ] **T034**`select_sample_wildcard(role, seed)` en `SampleSelector`
- Log: `"Wild card selected: {path} for role {role}"`
### 2.D — Section Casting
- [ ] **T035** — Definir `ROLE_SECTION_VARIANTS` en `song_generator.py`
```python
ROLE_SECTION_VARIANTS = {
'top_loop': {'intro': 'minimal filtered subtle', 'drop': 'full punchy driving', 'break': 'sparse reversed'},
'atmos': {'intro': 'atmospheric wide', 'drop': 'driving textured', 'break': 'deep long ambient'},
'pad': {'intro': 'soft subtle', 'drop': 'full wide powerful', 'break': 'evolving textured'},
'vocal_chop': {'intro': 'minimal', 'drop': 'aggressive chopped', 'break': 'reversed distant'},
}
```
- [ ] **T036** — `server.py → _find_library_file()`: pasar `section` como modificador del query
- `query_modified = f"{base_query} {ROLE_SECTION_VARIANTS[role][section]}"`
- [ ] **T037** — Seleccionar samples distintos por sección para roles con variantes
### 2.E — Fingerprint tonal de la canción
- [ ] **T038** — Al seleccionar el primer sample armónico: extraer fingerprint
- `fingerprint = {key, spectral_centroid, is_major, brightness_category}` → guardar en contexto de generación.
- [ ] **T039** — Penalización de fingerprint mismatch para samples armónicos subsiguientes
- Key a más de 2 quintas: `score *= 0.6` | Brightness muy diferente (>3000 Hz): `score *= 0.8`
---
## FASE 3 — Human Feel & Dinámicas 🟠 PRIORIDAD ALTA
> **Goal**: La música respira. Hay tensión-release, fades naturales, groove humano.
- [ ] **T040** — `Remote_Script.py`: agregar comando `write_clip_envelope`
- Parámetros: `track_index`, `clip_index`, `points: List[(time_beats, value)]`
- [ ] **T041** — Herramienta `apply_clip_fades(track_index, section, fade_in_bars, fade_out_bars)`
- Intro: fade-in 4-8 bars en kick, bass, top loops.
- Outro: fade-out simétrico. Break: fade-down al inicio + fade-up antes del drop.
- [ ] **T042** — Herramienta `write_volume_automation(track_index, curve_type, section_map)`
- Curves: `linear`, `exponential`, `s_curve`, `punch`.
- Build: curva exponencial 0.5 → 0.85 en bus de music.
- [ ] **T043** — Implementar curvas de volumen por sección en `song_generator.py`
- Intro: music al 60% → building → 100% en drop. Break: drums 30%, music+atmos 70%.
- [ ] **T044** — Herramienta `inject_dynamic_variation(track_index, role)`
- Ghost notes MIDI: velocidad 20-40. Downbeats: 90-110. Upbeats: 60-80.
- Para audio clips: micro-automatizaciones de ±3dB en forma de LFO lento.
- [ ] **T045** — Herramienta `apply_sidechain_pump(intensity, style)`
- `'subtle'`: pump mínimo solo en drop.
- `'jackin'`: pump pronunciado cada beat (tech house clásico).
- `'breathing'`: pump lento cada 2 beats.
- [ ] **T046** — Variación de velocidad MIDI por sección
- Intro: velocidades 15%. Drop: plenas + ghost notes.
- [ ] **T047** — Herramienta `apply_loop_variation(role, sections_map)`
- Intro: top loop filtrado/suave. Drop: agresivo/abierto. Break: swing alto.
- [ ] **T048** — Herramienta `inject_pattern_fills(track_index, fill_density, section)`
- Snare rolls, flams, tom fills, hi-hat busteos.
- Densidad: `'sparse'` (1 cada 8 bars), `'medium'`, `'heavy'` (cada 2 bars).
- [ ] **T049** — Herramienta `apply_swing_to_clip(track_index, clip_index, swing_percent)`
- Por sección: intro 8%, drop 14%, break 18%.
- [ ] **T050** — Herramienta paraguas `humanize_set(intensity)` (0.3 / 0.6 / 1.0)
---
## FASE 4 — Soundscape & Tonal 🟠 PRIORIDAD ALTA
> **Goal**: Identidad harmónica y espectral definida. No hay samples que "rompen" el ambiente.
- [ ] **T051** — Análisis masivo de key con Krumhansl-Schmuckler durante el indexado
- [ ] **T052** — `KEY_COMPATIBILITY_MATRIX` con scores 0-1 para cada par de keys
- [ ] **T053** — Integrar `KEY_COMPATIBILITY_MATRIX` en `_calculate_sample_score()` (factor 0.25)
- [ ] **T054** — Detección de `project_key` al iniciar generación (manual o inferida)
- [ ] **T055** — Rechazar samples con `key_compatibility < 0.40` para roles críticos (chords, lead, pad)
- [ ] **T056** — Definir `BRIGHTNESS_RANGES` óptimas por rol (sub_bass, bass, kick, pad, lead, atmos…)
- [ ] **T057** — Factor `spectral_fit` en `_calculate_sample_score()` (peso 0.10)
- [ ] **T058** — Paneo espectral inteligente por sección (dinámico según `AUDIO_LAYER_MIX_PROFILES`)
- [ ] **T059** — Filtros de frecuencia automáticos por sección (high-pass en intro, high-cut en break)
- [ ] **T060** — Brightness embedding de 8 bandas por sample en el índice
- [ ] **T061** — Tags automáticos de color espectral: `dark`, `neutral`, `bright`, `warm`, `harsh`
- [ ] **T062** — Herramienta `analyze_mix_spectrum()` → análisis del master en tiempo real
---
## FASE 5 — Arranjo y Estructura DJ Profesional 🟡 PRIORIDAD P3
> **Goal**: Estructura DJ real: intro largo para mezclar, drops definidos, breaks tensos, outro largo.
- [ ] **T063** — Definir `DJ_ARRANGEMENT_TEMPLATES` por subgénero (tech_house, deep_house, techno_minimal)
```python
'tech_house': {
'intro': {'bars': 16, 'elements': ['kick','bass','hat'], 'energy': 0.4},
'build_1': {'bars': 8, 'elements': ['+perc','+top_loop'], 'energy': 0.6},
'drop_1': {'bars': 16, 'elements': ['full'], 'energy': 1.0},
'break': {'bars': 8, 'elements': ['-kick','+atmos','filter_bass'], 'energy': 0.5},
'drop_2': {'bars': 16, 'elements': ['full','+vocal_peak'], 'energy': 1.0},
'outro': {'bars': 16, 'elements': ['-vocal','-music'], 'energy': 0.4},
}
```
- [ ] **T064** — `generate_arrangement(template, length_bars)` → genera toda la sesión en Arrangement view
- [ ] **T065** — Intro DJ-compatible de mínimo 16 bars (solo kick + bass + hat)
- [ ] **T066** — Outro DJ-compatible de mínimo 16 bars (misma lógica inversa)
- [ ] **T067** — Loop markers automáticos en puntos clave (drop marcado como loop 16 bars)
- [ ] **T068** — Variación de pattern de kick por sección (ghost notes en build, reverse en break)
- [ ] **T069** — Hi-hat evolution: de closed a open gradualmente por sección
- [ ] **T070** — Bassline evolution: de root-note en intro a melodic walk en drop_2
- [ ] **T071** — Herramienta `inject_transition_fx(type, position_bar)` (riser / crash / snare_roll)
- [ ] **T072** — Filter sweep automation en transiciones (high-pass sube 8 bars antes del drop)
- [ ] **T073** — Reverb tail automation en breaks (reverb 0% → 40% → 0%)
- [ ] **T074** — Pitch automation: riser en últimos 4 beats del break, snap al drop
- [ ] **T075** — Micro-timing "push" del groove (kick 5ms, bass +8ms) para feel orgánico
- [ ] **T076** — `GROOVE_TEMPLATES` por subgénero: `tech_house_drop`, `tech_house_break`, `deep_house_drop`
- [ ] **T077** — `apply_groove_template(section, template_name)` aplicado automáticamente al arrangement
---
## FASE 6 — Masterización & Lanzamiento 🟡 PRIORIDAD P3
> **Goal**: La canción suena a promo de label internacional, lista para Beatport.
- [ ] **T078** — Validar `ROLE_GAIN_CALIBRATION` prácticamente: kick 8 LUFS, bass 10 LUFS
- [ ] **T079** — Herramienta `calibrate_gain_staging()` → medir LUFS de cada bus y ajustar faders
- [ ] **T080** — Verificar headroom en Master Track (≥ 6 dBFS antes del limitador)
- [ ] **T081** — `BUS DRUMS`: parallel compression calibrada (attack 30ms, release 100ms)
- [ ] **T082** — `BUS BASS`: sub en mono, high-cut automático por encima de 300Hz
- [ ] **T083** — `BUS MUSIC`: glue compressor 2:1 + stereo widener solo en mid-high
- [ ] **T084** — Verificar sends de FX (Space/Echo/Heat/Glue) coherentes con `AUDIO_LAYER_MIX_PROFILES`
- [ ] **T085** — Herramienta `run_mix_quality_check()`: LUFS, peak, RMS, balance L/R, correlation mono
- [ ] **T086** — Flags automáticos de issues críticos (clip, desbalance L/R, kick muy silencioso)
- [ ] **T087** — Herramienta `export_stem_mixdown(stem_config)` → stems 24-bit / 44.1kHz WAV
- [ ] **T088** — Generación automática de metadata Beatport (BPM, key, género desde el manifest)
- [ ] **T089** — A/B testing: generar 3 variantes del mismo drop con diferentes palette locks
- [ ] **T090** — Herramienta `analyze_reference_track(file_path)` → extraer BPM, key, LUFS, spectral balance del track de referencia
---
## FASE 7 — IA Autónoma y Aprendizaje 🔵 FUTURO
> **Goal**: El sistema aprende de las preferencias del usuario y mejora con cada sesión.
- [ ] **T091** — Sistema de rating `rate_generation(session_id, score: 1-5, notes)`
- [ ] **T092** — Feedback loop: samples de sesiones bien puntuadas tienen menor fatiga futura
- [ ] **T093** — Predicción de preferencias de palette por BPM/key (con 20+ generaciones)
- [ ] **T094** — Análisis de tendencias de la librería: identificar carpetas con mala performance histórica
- [ ] **T095** — Modo "Autopilot DJ": 16 tracks concatenados con Palette Lock linked entre sí
- [ ] **T096** — Herramienta `generate_dj_set(duration_hours, style_evolution)` → set de 4 horas completo
- [ ] **T097** — Análisis de referencia de Beatport top-100 Tech House (BPM, keys, spectral profiles)
- [ ] **T098** — Hot zone detection: identificar características comunes de drops con mejor rating
- [ ] **T099** — Medir si el set "mueve" via detección de variación de volumen en Ableton (proxy energía)
- [ ] **T100** — Herramienta `auto_improve_set(feedback_json)` → regenerar secciones con bajo score sin tocar las exitosas
---
## 🛠️ Infraestructura y Soporte
- [ ] **T101** — Tests de regresión para `sample_selector.py` (repetición, palette lock, key match)
- [ ] **T102** — Benchmark de performance del indexado (base: 800 samples < 20 min)
- [ ] **T103** — Hot reload de configuración sin reiniciar el servidor
- [ ] **T104** — `howto.md` actualizado con ejemplos JSON-RPC explícitos por herramienta
- [ ] **T105** — CI automático en Gitea con webhooks + badge de status
- [ ] **T106** — `CHANGELOG.md` con versiones del sistema
- [ ] **T107** — Backup diario de `~/.abletonmcp_ai/` (sample_history, fatigue, coverage)
- [ ] **T108** — Dashboard de métricas: `get_system_metrics()` → generaciones totales, cobertura %, promedio estrellas
- [ ] **T109** — Soporte para Deep House, Minimal Techno, Afro House en `STYLE_CONFIGS`
- [ ] **T110** — Script `import_sample_pack(folder, genre_tag, collection_name)` → indexa + actualiza Coverage Wheel
---
## 📊 Métricas de éxito por Fase
| Fase | KPI | Target |
|------|-----|--------|
| 1 | % samples únicos en 20 generaciones | > 85% |
| 1 | % samples con key detectada | > 60% |
| 2 | Coherencia de palette (% samples del folder ancla) | > 65% |
| 2 | Coverage de librería en 20 generaciones | > 80% carpetas usadas |
| 3 | Diferencia de energía drop vs break | > 6 dB LUFS |
| 4 | Key mismatch rate en samples armónicos | < 10% |
| 5 | Intro/Outro duration DJ-compatible | ≥ 16 bars |
| 6 | LUFS integrado del master | 10 a 8 LUFS |
| 6 | Headroom en master | ≥ 0.3 dBTP |
---
## 🚀 Orden de implementación recomendado
| Sprint | Tareas | Objetivo |
|--------|--------|----------|
| **1** (inmediato) | T011 → T015 | Fix de repetición de samples |
| **2** | T025 → T032 | Palette Lock + Coverage Wheel |
| **3** | T040 → T050 | Human Feel básico |
| **4** | T016 → T020, T051 → T055 | Tonal intelligence |
| **5** | T063 → T072 | Estructura DJ |
| **6** | T078 → T087 | Gain staging + export |
---
*Documento vivo — actualizar con cada sprint completado.*