Skip to content
-
Subscribe to our newsletter & never miss our best posts. Subscribe Now!
TechBox TechBox TechBox
TechBox TechBox TechBox
  • Accueil
  • Frontière de l’IA
  • Partage Open Source
  • Guides
  • Français
    • English
    • Français
    • Deutsch
    • Español
    • Русский
    • 日本語
  • Accueil
  • Frontière de l’IA
  • Partage Open Source
  • Guides
  • Français
    • English
    • Français
    • Deutsch
    • Español
    • Русский
    • 日本語
Close

Search

Subscribe
Partage Open Source

Un autre outil de clonage vocal local open source

By Jason
05/14/2026 3 Min Read
Commentaires fermés sur Un autre outil de clonage vocal local open source

Un autre outil puissant de clonage vocal fonctionnant localement a été publié en open source. Le succès d’ElevenLabs en 2023 a montré la forte demande pour la synthèse vocale par IA. Beaucoup souhaitent créer des voix off avec leur propre voix ou cloner un timbre qu’ils aiment, ce qui les pousse à s’abonner à divers services en ligne. Cependant, la réalité est souvent la suivante : la plupart de ces services nécessitent d’envoyer ses données dans le cloud et de payer un abonnement mensuel de plusieurs dizaines de dollars. Vos échantillons vocaux et vos modèles entraînés sont verrouillés sur les serveurs d’autrui. Si le service augmente ses prix ou ferme, vous perdez tout.

Certains ont essayé des solutions open source, mais se heurtent souvent à des outils complexes en ligne de commande. Créer un dialogue à plusieurs personnages ? Ajouter de la réverbération ? Comparer différents moteurs ? Désolé, il faut tout assembler soi-même.

Récemment, un projet nommé Voicebox​ a été open sourcé sur GitHub. Sa solution de clonage vocal locale permet à chacun de réaliser des productions vocales professionnelles sur son propre ordinateur. Il a déjà obtenu 21K étoiles sur GitHub. C’est une station de travail de clonage vocal entièrement locale, intégrant 7 moteurs TTS, un éditeur multipiste et une API complète. Il fait presque tout ce qu’ElevenLabs propose, mais s’exécute entièrement sur votre machine, gratuitement.

Caractéristiques principales :

  • Exécution locale :​ Toutes les opérations se font sur votre appareil. Utilise MLX/Metal sur macOS (4-5x plus rapide sur Apple Silicon), CUDA sous Windows, et prend en charge AMD/Intel Arc.
  • Éditeur « Stories » multipiste :​ Un éditeur chronologique pour organiser des dialogues, podcasts ou livres audio avec différentes voix sur différentes pistes.
  • 8 effets audio intégrés :​ Détournement de hauteur, réverbération, délai, compression, etc., utilisant la bibliothèque pedalboard de Spotify, avec prévisualisation en temps réel.
  • API REST :​ API complète pour l’intégration dans d’autres projets.

Moteurs TTS principaux :

  • Qwen3-TTS (d’Alibaba) :​ Moteur principal, modèles 0.6B/1.7B, 10 langues, clonage haute qualité, accepte des « instructions de performance ».
  • LuxTTS :​ Très rapide, 1 Go de VRAM, 150x temps réel sur CPU, sortie 48 kHz. Parfait pour les brouillons.
  • Chatterbox Multilingual :​ 23 langues, dont l’arabe, le finnois, le swahili.
  • Chatterbox Turbo :​ 350M paramètres, comprend les marqueurs paralangagiers comme [rire], [soupir].
  • TADA :​ Modèle long format, audio cohérent de plus de 700 secondes, timestamps au niveau phonème.
  • Kokoro :​ Le plus petit, 82M paramètres, 50 voix prédéfinies, besoins matériels minimaux.

L’installation est simple.​ Téléchargez l’installeur depuis voicebox.sh(macOS/Windows) ou utilisez Docker. Après lancement, téléchargez des modèles comme Qwen3-TTS 1.7B, créez un profil vocal en enregistrant ou important un audio, et générez de la parole.

Cas d’utilisation :​ Livres audio multi-personnages, génération de dialogues pour podcasts, doublage vidéo avec post-traitement intégré.

Le projet, sous licence MIT, rend le clonage vocal professionnel accessible et sécurisé, fonctionnant sur un ordinateur standard sans dépendance au cloud.

Adresse du projet :​ https://github.com/jamiepine/voicebox

Author

Jason

Follow Me
Other Articles
Previous

10 000 Stars en 10 jours : Rétro-ingénierie de Claude Mythos

Next

3000 Étoiles : Cette Compétence Claude Réduit Radicalement le Temps de Dessin des Diagrammes d’Architecture

Latest Articles

  • 3000 Étoiles : Cette Compétence Claude Réduit Radicalement le Temps de Dessin des Diagrammes d’Architecture
  • Un autre outil de clonage vocal local open source
  • 10 000 Stars en 10 jours : Rétro-ingénierie de Claude Mythos

Recent Comments

Aucun commentaire à afficher.
    Copyright 2026 — TechBox. All rights reserved.