Baptisé «Voice Engine», ce modèle d’IA peut reproduire la voix d’une personne à partir d’un échantillon audio de 15 secondes, selon un communiqué d’OpenAI sur les résultats d’un test à petite échelle. «Nous reconnaissons que la capacité de générer des voix ressemblant à celles de personnes comporte de sérieux risques, qui sont particulièrement importants en cette année électorale», a déclaré l’entreprise basée à San Francisco.
«Nous travaillons avec des partenaires américains et internationaux issus du gouvernement, des médias, du divertissement, de l’éducation, de la société civile et d’autres secteurs et nous prenons en compte leurs commentaires au fur et à mesure que nous développons l’outil.»
En cette année électorale cruciale dans le monde, les chercheurs en désinformation craignent une utilisation abusive des applications d’IA générative (production automatisée de textes, images, etc.), et notamment des outils de clonage de voix, qui sont bon marché, faciles à utiliser et difficiles à retracer.
OpenAI a assuré avoir adopté «une approche prudente et informée» avant une diffusion plus large du nouvel outil «en raison du potentiel d’utilisation abusive des voix synthétiques».
Lire aussi : IA: le développeur de ChatGPT, OpenAI, promet des «superpouvoirs» pour tous
Cette présentation prudente intervient après un incident politique majeur, quand un consultant travaillant pour la campagne présidentielle d’un rival démocrate de Joe Biden a mis au point un programme automatisé qui usurpait l’identité du président américain, en campagne pour sa réélection.
La voix imitant celle de Joe Biden appelait des électeurs pour les inciter à s’abstenir lors de la primaire du New Hampshire. Les États-Unis ont depuis interdit les appels par des voix clonées, générées par de l’IA, afin de lutter contre les arnaques politiques ou commerciales.
OpenAI a précisé que les partenaires qui testent «Voice Engine» ont accepté des règles exigeant notamment le consentement explicite et informé de toute personne dont la voix est dupliquée et la transparence pour les auditeurs: ils doivent savoir clairement que les voix qu’ils entendent sont générées par l’IA.
«Nous avons mis en place un ensemble de mesures de sécurité, y compris une marque en filigrane pour pouvoir retracer l’origine de tout son généré par Voice Engine, ainsi qu’un contrôle proactif de son utilisation», a insisté OpenAI.
En octobre dernier, la Maison Blanche avait dévoilé des règles et principes pour encadrer le développement de l’IA, dont celui de la transparence.
Joe Biden s’était ému à l’idée que des criminels ne s’en servent pour piéger des personnes en se faisant passer pour des membres de leur famille.