Cum să obții voci mai bune pentru sinteza vocală în limba pe care o înveți

Când apeși pe pictograma difuzorului de lângă o frază în Polyglotton, browserul tău folosește motorul text-to-speech al dispozitivului pentru a o citi cu voce tare. Pe majoritatea dispozitivelor, aceasta funcționează bine pentru limba ta maternă — dar sună robotic sau eșuează complet pentru limba pe care încerci să o înveți.

Acest ghid explică de ce se întâmplă acest lucru și îți arată exact cum să rezolvi problema pe fiecare platformă.

De ce dispozitivul tău nu are vocea de care ai nevoie

Sistemul tău de operare a fost configurat în fabrică pentru regiunea în care a fost vândut. Instalarea tuturor vocilor lingvistice de la bun început ar adăuga 200 MB până la 2 GB per limbă — iar cu aproximativ 100 de limbi acceptate pe Windows, macOS și Android, ajungi rapid la 20–200 GB de date audio pe care majoritatea utilizatorilor nu le vor folosi niciodată.

De aceea, producătorii livrează doar vocile pentru regiunea ta și îți permit să descarci restul la cerere.

Vestea bună: acest lucru se schimbă în liniște. Noua generație de voci sintetizate prin AI — Neural TTS de la Apple în macOS Sonoma și versiunile ulterioare, vocile neurale Microsoft în Windows 11 și vocile WaveNet de la Google pe Android — sunt semnificativ mai mici și sună mult mai bine decât modelele concatenative mai vechi. Pe măsură ce AI pe dispozitiv devine standard (Apple Intelligence în iOS/macOS 26, Google Gemini Nano pe Pixel, Samsung Galaxy AI), sistemul tău de operare va fi tot mai capabil să genereze orice voce din mers, în loc să descarce înregistrări în prealabil. Probabil mai avem doar unul sau doi ani până când orice limbă va suna natural din cutie. Deocamdată, o instalare manuală rapidă te duce acolo.

macOS (Ventura, Sonoma, Sequoia)

macOS include vocile de cea mai înaltă calitate Apple — „Enhanced” și „Premium” — dar implicit se descarcă doar limba sistemului tău.

Deschide Meniu Apple → Setări sistem
Fă clic pe Accesibilitate în bara laterală
Fă clic pe Conținut vorbit
Lângă Voce sistem, fă clic pe meniul derulant și alege Gestionare voci… (Sonoma/Sequoia) — sau fă clic pe pictograma ⓘ de lângă vocea selectată (Ventura)
În lista de voci, găsește limba ta țintă (de ex. maghiară, neerlandeză, franceză)
Extinde limba pentru a vedea vocile disponibile — caută opțiunile de calitate Enhanced sau Premium, sună vizibil mai natural
Fă clic pe butonul ⬇ descarcă de lângă vocea dorită
Așteaptă finalizarea descărcării, apoi repornește browserul

După repornire, noua voce va apărea în panoul de setări audio din Polyglotton, în selectorul de voci pentru acea limbă.

Sfat pentru macOS Sequoia: Poți și să îi vorbești lui Siri: „Adaugă o voce pentru [limbă]” și se va deschide direct panoul de setări potrivit.

Windows 11

Windows 11 folosește vocile neurale Microsoft (numite Voci naturale), care sună foarte realist — dar din nou: implicit este instalată doar limba de afișare.

Metoda 1 — prin Setări limbă (recomandat)

Deschide Setări → Oră și limbă → Limbă și regiune
Fă clic pe Adăugare limbă și caută limba ta țintă (de ex. franceză, germană, maghiară)
În timpul instalării, asigură-te că Sinteză vocală este bifat în lista de funcții opționale
Fă clic pe Instalare și așteaptă finalizarea descărcării
Repornește browserul pentru ca noua voce să fie disponibilă

Metoda 2 — prin Setări vorbire

Deschide Setări → Oră și limbă → Vorbire
Sub Gestionare voci, fă clic pe Adăugare voci
Selectează limba ta țintă și fă clic pe Adăugare
Repornește browserul după instalare

Notă: Windows poate instala mai întâi o voce de bază. Pentru versiunea naturală (neurală), mergi după instalarea pachetului de limbă la Setări → Accesibilitate → Narator → Adăugare voci naturale.

Android

Android acceptă două motoare TTS principale. Majoritatea telefoanelor Android standard folosesc Google Text-to-Speech; dispozitivele Samsung Galaxy includ și motorul TTS Samsung. În orice caz, pașii de instalare sunt similari.

Google Pixel și Android standard

Deschide Setări → Accesibilitate → Ieșire text-to-speech
Atinge ⚙ pictograma roată de lângă Google Text-to-Speech
Atinge Instalare date vocale
Găsește limba ta țintă în listă și atinge ⬇ pictograma descărcare de lângă aceasta
După descărcare, revino și setează acea limbă ca preferată dacă este necesar

Samsung Galaxy

Telefoanele Samsung Galaxy au propria lor cale de setări:

Deschide Setări → Management general → Text-to-speech
(Pe unele modele: Setări → Accesibilitate → Text-to-speech)
Sub Motor preferat, alege Google Text-to-Speech pentru cea mai largă acoperire lingvistică sau păstrează motorul Samsung dacă limba ta este trecutată acolo
Atinge ⚙ pictograma roată de lângă motor
Atinge Instalare date vocale
Selectează limba ta țintă și atinge ⬇ descarcă
Închide și redeschide browserul (Chrome sau Samsung Internet) pentru a detecta noua voce

Samsung Internet vs Chrome: Ambele folosesc motorul TTS al sistemului, dar Chrome pe Android tinde să aibă o compatibilitate mai bună cu Web Speech API. Dacă vocile lipsesc în continuare, încearcă să schimbi browserul.

iOS și iPadOS

iOS folosește vocile de sistem Apple, gestionate la fel ca pe macOS.

Deschide Setări → Accesibilitate → Conținut vorbit → Voci
Atinge limba ta țintă din listă
Atinge ⬇ pictograma descărcare de lângă vocea dorită (alege Enhanced pentru cea mai bună calitate)
Reîncarcă Safari după instalare

Redarea vocii în Polyglotton folosește Web Speech API, complet acceptată în Safari pe iOS 16+ și Chrome pe Android.

După instalare: selectarea vocii în Polyglotton

Odată ce ai descărcat o voce, deschide panoul de setări audio din Polyglotton (butonul difuzor din colțul din dreapta jos al paginii unei lecții) și selectează noua voce din meniul derulant Voce — va apărea automat odată ce browserul o detectează.

Poți de asemenea ajusta Viteza și Înălțimea pentru a potrivi ritmul care ți se pare natural. Vitezele mai mici sunt excelente pentru a surprinde detalii de pronunție; vitezele mai mari ajută la construirea fluidității odată ce te-ai familiarizat cu frazele.

Ce urmează

Valul următor al AI pe dispozitiv face ca tot acest proces manual să devină depășit. Apple Intelligence (lansată pe iOS 26 și macOS Tahoe în 2025–2026) include un strat de sinteză neurală care poate genera vorbire naturală în orice limbă acceptată direct pe dispozitivul tău — fără niciun pachet vocal descărcat în prealabil. Microsoft urmează o cale similară cu vocile neurale alimentate de Copilot în Windows, iar Google Gemini Nano pe Android gestionează deja sinteza multilingvă offline.

În unul sau doi ani, dispozitivul tău ar trebui să poată vorbi orice limbă la fel de natural ca limba ta maternă — automat, fără nicio configurare. Până atunci, pașii de mai sus te duc aproape tot drumul chiar azi.