Folosind doar un fișier audio de 15 secunde compania poate clona orice voce.
Această tehnologie, numită Voice Engine, reprezintă o extindere a capabilităților preexistente de conversie text-în-vorbire ale companiei și promite să revoluționeze modul în care interacționăm cu mașinile.
Voice Engine nu este doar o simplă îmbunătățire a sistemelor de text-în-vorbire existente, ci un pas uriaș către crearea de voci umane incredibil de realiste și emotive. OpenAI descrie acest instrument ca fiind capabil să producă discursuri naturale, analizând un scurt eșantion audio pentru a imita vocea oricărui vorbitor.
Dezvoltată din 2022, tehnologia stă la baza actualei oferte de vocile prestabilite ale companiei și este prezentată ca o soluție potențială pentru o serie de aplicații, de la asistență la citire până la traducerea limbajului.
Unul dintre exemplele remarcabile menționate de OpenAI în contextul utilizării Voice Engine este colaborarea cu Universitatea Brown. În cadrul acestui parteneriat, tehnologia a fost folosită pentru a crea o clonă vocală pentru un pacient cu probleme de vorbire, utilizând înregistrări audio dintr-un proiect școlar. Acest exemplu subliniază potențialul profund umanitar al inovației, oferind o nouă speranță pentru cei afectați de condiții care le limitează capacitatea de a comunica.
Provocări și soluții în utilizarea responsabilă a tehnologiei
Cu toate aceste avantaje, capacitatea de a replica cu fidelitate vocea umană ridică și întrebări serioase legate de confidențialitate și etică. Într-un moment în care deepfake-urile constituie o preocupare globală, OpenAI este conștientă de riscurile asociate abuzului acestei tehnologii. Compania subliniază importanța unei abordări prudente, având în vedere „riscurile serioase” în special în contextul anilor electorali.
Pentru a contracara aceste riscuri, OpenAI a implementat o serie de măsuri de siguranță, inclusiv watermarking-ul pentru a urmări originea înregistrărilor audio și o monitorizare proactivă a utilizării sistemului. Mai mult, orice utilizare a tehnologiei în scopuri publice va trebui să fie însoțită de o informare clară că vocile sunt generate prin inteligență artificială. Aceste precauții sunt complementate de o „listă de voci interzise”, care are rolul de a preveni crearea de clone vocale ale figurilor publice fără consimțământul acestora.
Pe lângă aspectele etice și de securitate, OpenAI oferă și o perspectivă asupra potențialului economic al Voice Engine. Cu un cost estimat de 15 dolari pentru un milion de caractere, această tehnologie ar putea democratiza accesul la producția de conținut audio, inclusiv audiobook-uri, la un preț accesibil.
Referirile la o versiune „HD” sugerează că OpenAI are în vedere și opțiuni premium, deși detaliile rămân încă neclarificate.
Urmărește-ne și pe Google News
Rețele de socializare: Instagram, Facebook și Twitter
MENȚIUNE:
Informaţiile publicate de Vesteazilei.ro pot fi preluate doar în limita a 500 de caractere şi cu citarea sursei cu link activ.
Orice abatere de la această regulă constituie o încălcare a Legii 8/1996 privind dreptul de autor.