Article
90210: Open-Source KI-Movie-Generator mit Veo 3.1 und Gemini
90210: Open-Source KI-Movie-Generator mit Veo 3.1 und Gemini
Ein neues Open-Source-Projekt namens 90210 ermöglicht die vollautomatische Produktion von Kurzfilmen aus Drehbüchern. Die lokal laufende App generiert synchronisiertes Video, natives Audio, Dialoge, Musik und Untertitel — alles gesteuert durch ein Qualitäts-orakel, das automatisch re-rolled und adaptive Qualitätssteigerungen vornimmt.
Tech-Stack
Das System kombiniert aktuelle Top-Modelle:
- Google Veo 3.1: Video + Audio-Generierung
- Nano Banana: Portrait-Shots
- Gemini 2.5 Pro: Director-Logsik und Story-Orchestration
- ElevenLabs Music: Soundtrack-Generierung
Qualitätssteuerung durch ML-Orakel
Jede Qualitätsentscheidung ist mathematisch fundiert:
Quality Oracle kombiniert sieben Metriken:
- VideoScore, ViCLIP, LAION aesthetic, MUSIQ für Videoqualität
- ArcFace, LPIPS für Konsistenz
- Whisper für Audio-Alignment
Story Oracle sichert die Narrative:
- Reagan-6 arcs, TRIPOD turning points für Plot-Struktur
- Average Shot Length, SBERT coherence für visuellen Fluss
Das System re-rolled automatisch bei unzureichender Qualität und eskaliert bei Bedarf zu höheren Tier-Leveln.
Setup und Kosten
# Backend
python3 -m venv .venv
.venv/bin/pip install -e ./backend
cp .env.example .env # API keys eintragen
./run-backend.sh
# Frontend
cd frontend && pnpm install && pnpm dev
Typische Kosten für einen 2-Minuten-Film: ~$20 ($0.10–0.40/sek Video + $0.01/sek Music).
Die PWA lässt sich auf iOS via Safari Share → Add to Home Screen installieren und bietet native-App-Erlebnis. Optional: Tailscale für Remote-Zugriff oder die Quality-Oracle-Dependencies (~3GB) für vollständiges ML-Setup.
Alle Design-Specs, Veo-3.1-Deep-Dives und Cost-Latency-Quality-Math sind im Repo dokumentiert. Ein beeindruckendes Beispiel für produktionsreife AI-Videopipelines mit transparenter Qualitätssicherung.