Envoyer la recherche

Synthèse vocale IA

La fonction de synthèse vocale de VEGAS Pro vous permet de convertir le texte des vidéos en parole et de l'ajouter en tant que fichier audio. Il constitue un moyen efficace pour transformer de grandes quantités de texte en parole sans avoir besoin d'engager des acteurs narrateurs professionnels. Grâce à cette fonction, vous pouvez utiliser la technologie de l'IA pour générer des voix de synthèse dans différentes langues et options vocales. De plus, il offre la possibilité de traduire vos narrations dans différentes langues à l'aide de voix natives au son naturel. Par ailleurs, la fonctionnalité cloud vous permet d'accéder de manière transparente à de nouvelles voix et fonctionnalités sans nécessiter un nouveau logiciel.

REMARQUE

Si votre crédit disponible est épuisé, vous avez la possibilité d'acheter du crédit supplémentaire.

Pour plus d'informations, consultez la rubrique Activate credit.

Conversion de texte en parole

Choisissez Outils | Synthèse vocale.
Dans la boîte de dialogue Synthèse vocale, saisissez le texte que vous souhaitez transformer en son dans le champ de texte.

Ajuster le style

Changer de voix	Cliquez sur la liste déroulante Voix et sélectionnez la voix souhaitée.
Ajuster la vitesse	Utilisez le curseur pour diminuer ou augmenter la vitesse de parole.
Modifier le style de discours	Pour les voix sélectionnées, vous pouvez choisir parmi différents styles de voix.
Ajuster la hauteur	Utilisez le curseur pour diminuer ou augmenter la hauteur.

Cliquez sur Générer de la parole. Le texte est converti et lu.

Vous pouvez maintenant enregistrer le discours généré sous forme de fichier audio et l'importer dans votre projet.

Enregistrement d'un fichier audio dans un projet

Cliquez sur Ajouter aux fichiers du projet. Le fichier audio généré sera sauvegardé en tant que fichier .wav dans votre projet.

Vous pouvez accéder à ce dossier via la fenêtre Média de projet.

Insertion d'un fichier audio dans le projet

Cliquez sur Insérer dans la barre temporelle. Le fichier audio sera inséré en tant que nouvel événement audio sur une nouvelle piste audio intitulée Contenu audio synthétisé à la position actuelle du curseur dans votre barre temporelle et sera automatiquement enregistré dans le projet.

Traduction de texte

Saisissez le texte dans le champ correspondant.
Cliquez sur le bouton pour traduire le texte.
Dans la boîte de dialogue qui s'affiche, sélectionnez les langues :
- Langue du texte : langue du texte saisi
- Traduire en : langue cible
Cliquez sur le bouton Traduire. Le texte du champ de texte sera remplacé par une traduction dans la langue spécifiée.

Chargement du texte de titres et d'événements de texte dans la synthèse vocale

Vous pouvez charger le texte de n'importe quel événement Titres et texte de votre barre temporelle dans l'outil de synthèse vocale afin de générer un fichier audio pour ce texte.

Cliquez sur l'événement qui contient votre fichier généré par Titres et texte pour le sélectionner.
Dans la boîte de dialogue Synthèse vocale, cliquez sur le bouton Charger le texte d'un événement existant. Cette opération charge le texte de l'événement Titres et texte dans le champ de saisie de la synthèse vocale.
Prévisualisez le son et apportez les modifications nécessaires.

Utilisation du mode d'entrée SSML

SSML (Speech Synthesis Markup Language) est un langage de balisage conçu spécifiquement pour contrôler la sortie des systèmes de synthèse vocale (TTS). Il permet de donner des instructions détaillées sur la mise en forme et le style de la langue parlée, comme l'accentuation de certains mots, le contrôle de la durée des pauses ou la modification de la vitesse d'élocution.

SSML fournit un ensemble de balises qui peuvent être intégrées dans le texte pour indiquer comment il doit être prononcé ou exprimé. Ces balises permettent de contrôler divers aspects de la synthèse vocale, notamment la prosodie, la prononciation, le volume, etc.

Pour plus d’informations, consultez la rubrique .https://learn.microsoft.com/fr-fr/azure/ai-services/speech-service/speech-synthesis-markup

EXEMPLE

Copier

Exemple SSML

<speak version="1.0"  xml:lang="string">
  <voice name="en-US-ChristopherNeural" effect="eq_car" role="YoungAdultMale" >
     Welcome <break strength="medium" /> to text to speech.
  <p>
  <prosody rate="slow">This is a sentence that will be spoken slowly.</prosody>  <prosody rate="fast">This is a sentence that will be spoken quickly.</prosody>
  </p>
  <p>
  <break time="1s"/>A pause of 1 second is inserted here.<break time="1s"/>
  </p>
    </voice>
    <voice name="en-US-JennyMultilingualNeural" style="assistant">
        <lang xml:lang="en-US">
           Enjoy using the feature!
        </lang>
        <lang xml:lang="de-DE">
                    Viel Spaß beim Benutzen des Features!
        </lang>
    </voice>
</speak>

Dernière modification le décembre 08, 2025