Modelele AI pot suferi de „halucinații" auditive. Aplicațiile de transcriere sunt induse în eroare de accentele diferite și de tulburările de limbaj
Postat la: 27.04.2024 | Scris de: ZIUA NEWS
0
Până acum, tendința programelor de inteligență artificială de a inventa ocazional lucruri sau de a avea „halucinații" a fost bine documentată. Roboții de chat au generat informații medicale eronate, au inventat cazuri juridice false și au fabricat citate. Acum, un nou studiu a descoperit că modelele de inteligență artificială nu numai că văd lucruri, dar și aud lucruri, scrie revista Science.
Whisper de la OpenAI, un model de inteligență artificială antrenat să transcrie înregistrări audio, a inventat propoziții în aproximativ 1,4% din transcrierile înregistrărilor audio testate. În mod deconcertant, o mare parte din propozițiile fabricate conțineau texte ofensatoare sau potențial dăunătoare.
„Medicii folosesc instrumente de conversie a vorbirii în text pentru a transcrie notițele pacienților", spune Allison Koenecke, informatician la Universitatea Cornell și autor principal al studiului. „Dacă Whisper inventează niște transcrieri care nu sunt spuse, despre cum un pacient a omorât pe cineva și, de asemenea, sau îl îndeamnă să ia un medicament care este complet inventat, imaginați-vă cât de grave pot fi consecințele."
Studiul subliniază provocările cu care se confruntă instrumentele de transcriere: diversitatea tiparelor de vorbire din întreaga lume, precum și disponibilitatea limitată a datelor de instruire, spune Odette Scharenborg, tehnolog la Universitatea de Tehnologie din Delft, care nu a fost implicată în studiu. „Niciun sistem de conversie a vorbirii în text nu este încă capabil să modeleze la un nivel bun toată această variabilitate a articulației și a pronunției", spune ea.
Roboții de chat generativi se bazează pe modele de limbaj de mari dimensiuni (LLM), care primesc solicitări de text și produc rezultate prin prezicerea cuvintelor probabile pe baza modelelor învățate în urma antrenamentului pe miliarde de pagini de text din cărți și pagini web. Sistemele de transcriere combină aceste modele lingvistice cu modele audio care învață reprezentări ale tiparelor de vorbire.
Modelele mari de inteligență artificială funcționează bine: Transcrierile lor sunt mai precise decât alte instrumente de conversie a vorbirii în text care se bazează pe modele lingvistice de dimensiuni reduse. Dar Koenecke a vrut să analizeze mai atent. „Chiar dacă performanța pare mai bună decât media, avem aceste cazuri limită în cadrul textului în sine pe care ne temem că oamenii le-ar putea rata dacă presupun că Whisper transcrie totul cu fidelitate", spune ea.
Echipa lui Koenecke a oferit lui Whisper aproximativ 20 de ore de înregistrări audio de la vorbitori cu și fără afazie, o tulburare de limbaj în care oamenii au tendința de a vorbi încet și cu mai multe pauze. Segmentele audio conțineau dialoguri conversaționale pe teme precum povești personale și relatări de basm. În rulările efectuate în aprilie și mai 2023 pe o versiune anterioară a Whisper, cercetătorii au constatat că 1,7% din segmentele audio de la vorbitori cu afazie și 1,2% din segmentele audio de la persoane fără afazie au dus la transcrieri cu unele texte fabricate.
Aproximativ 40% dintre segmentele fabricate au fost dăunătoare sau îngrijorătoare într-un anumit fel. Aproximativ jumătate dintre aceste secvențe îngrijorătoare făceau referire la acte de violență, aluzii sexuale sau stereotipuri demografice. De exemplu, înregistrările audio despre salvarea pisicilor de către pompieri au inclus adăugiri inventate despre un „cărucior îmbibat de sânge" și „mângâieri". Un material audio inofensiv despre o umbrelă a inclus invenții despre un „cuțit al terorii" și despre oameni uciși.
Cercetătorii au grupat restul halucinațiilor audio în alte două categorii: informații false cu privire la o persoană, cum ar fi nume inventate, date false despre relațiile sau starea de sănătate. Whisper a avut tendința și de a adăuga fraze precum „Mulțumim pentru vizionare" la finalul transcrierilor" și de a adăuga linkuri către diverse site-uri, atât reale cât și inexistente.
De când a fost realizat experimentul original, OpenAI și-a actualizat modelul pentru a sări peste perioadele de tăcere și a retranscrie sunetul în cazul în care software-ul detectează o halucinație probabilă. În decembrie 2023, când cercetătorii au reluat unele dintre fișierele audio, au constatat că Whisperul actualizat a eliminat cele mai multe dintre invențiile găsite în testele lor anterioare. Efectuarea de audituri regulate pentru a verifica dacă există halucinații și încorporarea acestor feedback-uri în modele - așa cum se pare că a făcut OpenAI - va contribui la asigurarea unor rezultate mai bune, spune Koenecke.
Între timp, dr. Scharenborg recomandă insistent ca utilizatorii să verifice manual rezultatele oricărui instrument de transcriere cu inteligență artificială, în special dacă îl folosesc pentru a lua decizii importante. „Nu numai din cauza potențialelor halucinații", spune ea, „ci și pentru că toate sistemele de transcriere de la vorbire la text fac erori de transcriere".
DIN ACEEASI CATEGORIE...
ULTIMA ORA
-
ANAF îi ia în vizor pe românii care nu își declară veniturile
Toate veniturile trebuie declarate la ANAF. Cât vine vorba despre venituri, vorbim despre banii proveniți din dividende, criptomonede, acțiuni și depozite bancare. Inclusiv cei care au deschis un depozit la bancă trebuie să raporteze acest lucru în cazul în care există o dobândă. Totodată, se mai modifică și alte aspecte importante.
-
Povestea neștiută a celei mai vechi tăblițe cu cele Zece Porunci: A fost vândută pe o sumă colosală
Pea mai veche tăbliţă cunoscută, inscripţionată cu cele Zece Porunci din Vechiul Testament, a fost vândută cu 5,04 milioane de dolari, mai mult decât dublul estimării sale maxime.
-
Politico fac e o analiză decisivă: Al treilea război mondial este deja în desfășurare!
Dacă ați fi mers pe linia frontului în primele săptămâni ale războiului din Ucraina, ați fi putut auzi strigăte în ucraineană și rusă, poate amestecate cu voci care vorbeau limbi regionale precum buryat și cecenă, scrie POLITICO.
-
Ce au decis judecătorii CAB în dosarul Călin Georgescu-anularea alegerilor prezidențiale - Fostul candidat independent a fost prezent în instanță
Instanţa Curţii de Apel Bucureşti a acordat un nou termen în procesul Călin Georgescu-anularea alegrilor prezidențiale, pentru 13 ianuarie 2025, pentru când se citează părţile, prin poştă şi prin mail sau fax
-
Candidatul comun zice că nu există nicio legătură între el și partidele de la guvernare. Crin Antonescu și-a anunțat demisia din PNL
Noiua coaliție guvernamentală, formată din PSD, PNL, UDMR și minoritățile naționale, a anunțat astăzi asumarea unui candidat comun la alegerile prezidențiale de anul viitor, în persoana lui Crin Antonescu. Fostul lider al liberalilor a spus că a acceptat propunerea partidelor de a fi candidatul comun la alegerile prezidențiale viitoare.
-
Răsturnare de situație: Care a fost, de fapt, cauza decesului actorului Mircea Diaconu - Fiica acestuia, mărturii emoționante
Marele actor Mircea Diaconu s-a stins din viață cu doar 10 zile înainte de a împlini 75 de ani. Se știa că acesta se confrunta de ceva vreme cu o boală incurabilă, iar ultimele sale momente le-a petrecut pe un pat în Spitalul Fundeni.
-
Elon Musk începe Operațiunea "Resetarea": Prima mare instituție care va intra în malaxor
Omul de afaceri Elon Musk, cea mai bogată persoană din lume şi persoana desemnată de viitorul preşedinte al SUA, Donald Trump, cu reformarea administraţiei publice, a luat la ţintă Rezerva Federală americană.
-
Trădare, dar să știm și noi: 21 de parlamentari suveraniști au votat pentru noua coaliție pro europeană
Blocul suveranist suferă o lovitură extrem de grea, la primul mare test din Parlament. La votul pentru președinții Senatului și Camerei Deputaților, 21 de parlamentari care nu pot fi decât din AUR, POT sau SOS România au votat alături de coaliția pro europeană formată din PSD, PNL, UDMR și Minoritățile Naționale.
-
Controlul statului asupra vietii private: ANAF monitorizează retragerile din bancomate. Atenție la suma pe care o scoateți
Românii care retrag sume mari de bani din bancomate intră în atenția Agenției Naționale de Administrare Fiscală (ANAF). Instituția a anunțat că va monitoriza atent aceste tranzacții pentru a preveni fraudele fiscale.
DIN CATEGORIE
- TOP CITITE
- TOP COMENTATE
- 1.Revoltă în Germania, după aderarea deplină a României și Bulgariei la Spațiul Schengen. „Dezastru pentru siguranța oamenilor în Europa"
- 2.Cum a pierdut Călin Georgescu războiul în instanță cu BEC? Propaganda de pe TikTok nu a respectat legea - motivarea judecătorilor CAB
- 3.Fizicienii anuntă ca au descifrat secretele gravitației cuantice din găurile negre subatomice din care tâșnește materia
- 4.Experimentul care dă fiori Europei: cu un laptop și un smartphone, un expert IT a dezvăluit riscurile panourilor fotovoltaice
- 5.Masoneria globalistă se cutremură: B'nai B'rith International, cea mai veche organizație evreiască, transmte lui Iohannis îngrijorările despre Georgescu
- 6.Rusia șochează lumea medicală: a reușit dezvoltarea unui vaccin care reușește să trateze majoritatea tipurilor de cancer!
- 7.Am intrat în spatiul Schengen si nu prea. Care sunt statele care au reintrodus controale la frontiere
- 8.Tucker Carlson: Deep State vrea Al Treilea Război Mondial - fie împotriva Rusiei, fie împotriva Iranului. Este singura lor șansă de a-l opri pe Trump
- 9.Escrocherie de proporții: nu răspunde dacă ești apelat de un număr care începe cu aceste trei cifre
- 10.Decizia CCR a afectat puternic piața financiară din România: Cotația leu/ euro vine cu surprize
comentarii
Adauga un comentariuAdauga comentariu