Kitta AI
Text-zu-Sprache
Mit Fish Audio, MiniMax, Qwen u. a. in natürliche Sprache umwandeln
Sprache zu Text
Hochgeladenes Audio präzise transkribieren
KI-Bild
Bilder mit führenden Modellen aus Prompts erzeugen
KI-Video
Videos aus Textbeschreibungen und Stilen erstellen
Lippensync & Digital Human
Sprache und Bild für Avatare und Präsentationen synchronisieren
Stimm-Workspace
Workspace für Sprachsynthese und Projekte
Kurzvideo & Synchronisation
Schnelle Voiceovers für Social, Ads und UGC
Hörbuch & Podcast
Lange Erzählungen mit natürlichem Tempo
Bildung & Training
Klare Vorlesestimmen für Kurse und interne Kommunikation
Modellbibliothek
TTS-Anbieter, Funktionen und Spezifikationen vergleichen
Anleitung Stimmklon
Von Samples bis Training und Best Practices
API-Spielplatz
REST-Endpunkte online mit API-Key testen
API-Schlüssel
Tokens erstellen und verwalten
Preise
App öffnen
.

API documentation & playground

Choose an API below for endpoint details, parameters, and live testing with your API key.

  • Text to Speech (HTTP)

    REST synthesis with your voice model ID and engine options.

  • Text to Speech (HTTP v2)

    Synthesize speech with a voice ID and optional engine settings.

  • TTS WebSocket

    Streaming speech over WebSocket for realtime use cases.

  • TTS WebSocket v2

    Updated WebSocket protocol for TTS.

  • Speech to Text

    Transcribe audio from a public URL.

  • Voice clone — create model

    Upload reference audio to create a voice model.

  • Voice clone — delete model

    Remove a voice model by ID.

  • Voice clone — list models

    List public and personal voice models.

  • Lip sync — create task

    Create a lip-sync video generation task.

  • Lip sync — query task

    Poll task status and results by ID.

  • Lip sync — list tasks

    List lip-sync tasks and statistics.

  • User profile (API)

    Remaining API quota and basic account info.