Article

90210: Open-Source KI-Movie-Generator mit Veo 3.1 und Gemini

Open Source Video Generation Gemini Veo ElevenLabs AI Tools

90210: Open-Source KI-Movie-Generator mit Veo 3.1 und Gemini

Ein neues Open-Source-Projekt namens 90210 ermöglicht die vollautomatische Produktion von Kurzfilmen aus Drehbüchern. Die lokal laufende App generiert synchronisiertes Video, natives Audio, Dialoge, Musik und Untertitel — alles gesteuert durch ein Qualitäts-orakel, das automatisch re-rolled und adaptive Qualitätssteigerungen vornimmt.

Tech-Stack

Das System kombiniert aktuelle Top-Modelle:

  • Google Veo 3.1: Video + Audio-Generierung
  • Nano Banana: Portrait-Shots
  • Gemini 2.5 Pro: Director-Logsik und Story-Orchestration
  • ElevenLabs Music: Soundtrack-Generierung

Qualitätssteuerung durch ML-Orakel

Jede Qualitätsentscheidung ist mathematisch fundiert:

Quality Oracle kombiniert sieben Metriken:

  • VideoScore, ViCLIP, LAION aesthetic, MUSIQ für Videoqualität
  • ArcFace, LPIPS für Konsistenz
  • Whisper für Audio-Alignment

Story Oracle sichert die Narrative:

  • Reagan-6 arcs, TRIPOD turning points für Plot-Struktur
  • Average Shot Length, SBERT coherence für visuellen Fluss

Das System re-rolled automatisch bei unzureichender Qualität und eskaliert bei Bedarf zu höheren Tier-Leveln.

Setup und Kosten

# Backend
python3 -m venv .venv
.venv/bin/pip install -e ./backend
cp .env.example .env  # API keys eintragen
./run-backend.sh

# Frontend
cd frontend && pnpm install && pnpm dev

Typische Kosten für einen 2-Minuten-Film: ~$20 ($0.10–0.40/sek Video + $0.01/sek Music).

Die PWA lässt sich auf iOS via Safari Share → Add to Home Screen installieren und bietet native-App-Erlebnis. Optional: Tailscale für Remote-Zugriff oder die Quality-Oracle-Dependencies (~3GB) für vollständiges ML-Setup.

Alle Design-Specs, Veo-3.1-Deep-Dives und Cost-Latency-Quality-Math sind im Repo dokumentiert. Ein beeindruckendes Beispiel für produktionsreife AI-Videopipelines mit transparenter Qualitätssicherung.