Jak uzyskać lepsze głosy syntezy mowy dla języka docelowego
Jak uzyskać lepsze głosy syntezy mowy dla języka docelowego
Gdy dotkniesz ikony głośnika przy frazie w Polyglotton, Twoja przeglądarka używa wbudowanego silnika zamiany tekstu na mowę Twojego urządzenia, aby przeczytać ją na głos. Na większości urządzeń działa to dobrze dla Twojego ojczystego języka — ale brzmi robotycznie lub całkowicie zawodzi w przypadku języka, którego próbujesz się uczyć.
Ten przewodnik wyjaśnia, dlaczego tak się dzieje i dokładnie pokazuje, jak to naprawić na każdej platformie.
Dlaczego Twoje urządzenie nie ma potrzebnego głosu
Twój system operacyjny został skonfigurowany w fabryce dla regionu, w którym był sprzedawany. Instalacja wszystkich głosów językowych z góry dodałaby od 200 MB do 2 GB na język — a przy około 100 obsługiwanych językach na Windows, macOS i Androidzie szybko daje to 20–200 GB danych audio, których większość użytkowników nigdy nie użyje.
Dlatego producenci dostarczają tylko głosy dla Twojego regionu i pozwalają pobierać resztę na żądanie.
Dobra wiadomość: to się po cichu zmienia. Nowa generacja głosów syntetyzowanych przez AI — Neural TTS Apple w macOS Sonoma i nowszych wersjach, głosy neuronowe Microsoft w Windows 11 i głosy WaveNet Google na Androidzie — są znacznie mniejsze i brzmią o wiele lepiej niż starsze modele konkatenacyjne. W miarę jak lokalna AI staje się standardem (Apple Intelligence w iOS/macOS 26, Google Gemini Nano na Pixel, Samsung Galaxy AI), Twój system operacyjny będzie coraz bardziej zdolny do generowania dowolnego głosu w locie, zamiast pobierania nagrań z wyprzedzeniem. Prawdopodobnie dzieli nas tylko rok lub dwa od momentu, gdy każdy język będzie brzmiał naturalnie od razu po uruchomieniu. Na razie szybka ręczna instalacja doprowadzi Cię tam, gdzie chcesz.
macOS (Ventura, Sonoma, Sequoia)
macOS zawiera najwyższej jakości głosy Apple klasy „Enhanced” i „Premium”, ale domyślnie pobierany jest tylko język Twojego systemu.
- Otwórz Menu Apple → Ustawienia systemowe
- Kliknij Dostępność na pasku bocznym
- Kliknij Treść mówiona
- Obok Głos systemowy kliknij listę rozwijaną i wybierz Zarządzaj głosami… (Sonoma/Sequoia) — lub kliknij ikonę ⓘ obok wybranego głosu (Ventura)
- Na liście głosów znajdź swój język docelowy (np. węgierski, niderlandzki, francuski)
- Rozwiń język, aby zobaczyć dostępne głosy — szukaj opcji jakości Enhanced lub Premium, brzmią one wyraźnie bardziej naturalnie
- Kliknij przycisk ⬇ pobierz obok wybranego głosu
- Poczekaj na zakończenie pobierania, a następnie uruchom ponownie przeglądarkę
Po ponownym uruchomieniu nowy głos pojawi się w panelu ustawień audio Polyglotton, w selektorze głosów dla tego języka.
Wskazówka dla macOS Sequoia: Możesz też powiedzieć do Siri: „Dodaj głos dla [język]” i otworzy się właściwy panel ustawień.
Windows 11
Windows 11 używa głosów neuronowych Microsoft (zwanych Głosami naturalnymi), które brzmią bardzo realistycznie — ale znowu: domyślnie zainstalowany jest tylko język Twojego interfejsu.
Metoda 1 — przez Ustawienia języka (zalecana)
- Otwórz Ustawienia → Czas i język → Język i region
- Kliknij Dodaj język i wyszukaj swój język docelowy (np. francuski, niemiecki, węgierski)
- Podczas instalacji upewnij się, że Zamiana tekstu na mowę jest zaznaczone na liście funkcji opcjonalnych
- Kliknij Zainstaluj i poczekaj na zakończenie pobierania
- Uruchom ponownie przeglądarkę, aby nowy głos stał się dostępny
Metoda 2 — przez Ustawienia mowy
- Otwórz Ustawienia → Czas i język → Mowa
- W sekcji Zarządzaj głosami kliknij Dodaj głosy
- Wybierz swój język docelowy i kliknij Dodaj
- Uruchom przeglądarkę ponownie po instalacji
Uwaga: Windows może najpierw zainstalować podstawowy głos. Aby uzyskać wersję naturalną (neuronową), przejdź po instalacji pakietu językowego do Ustawienia → Ułatwienia dostępu → Narrator → Dodaj naturalne głosy.
Android
Android obsługuje dwa główne silniki TTS. Większość standardowych telefonów z Androidem używa Google Text-to-Speech; urządzenia Samsung Galaxy zawierają również silnik TTS Samsung. W obu przypadkach kroki instalacji są podobne.
Google Pixel i standardowy Android
- Otwórz Ustawienia → Dostępność → Dane wyjściowe zamiany tekstu na mowę
- Dotknij ⚙ ikony koła zębatego obok Google Text-to-Speech
- Dotknij Zainstaluj dane głosowe
- Znajdź swój język docelowy na liście i dotknij ikony ⬇ pobierz obok niego
- Po pobraniu wróć i w razie potrzeby ustaw ten język jako preferowany
Samsung Galaxy
Telefony Samsung Galaxy mają własną ścieżkę ustawień:
- Otwórz Ustawienia → Zarządzanie ogólne → Zamiana tekstu na mowę
(Na niektórych modelach: Ustawienia → Dostępność → Zamiana tekstu na mowę) - W Preferowany silnik wybierz Google Text-to-Speech dla najszerszego pokrycia językowego lub zachowaj silnik Samsung, jeśli Twój język jest na liście
- Dotknij ⚙ ikony koła zębatego obok silnika
- Dotknij Zainstaluj dane głosowe
- Wybierz swój język docelowy i dotknij ⬇ pobierz
- Zamknij i ponownie otwórz przeglądarkę (Chrome lub Samsung Internet), aby wykryć nowy głos
Samsung Internet vs Chrome: Oba używają systemowego silnika TTS, ale Chrome na Androidzie zazwyczaj ma lepszą kompatybilność z Web Speech API. Jeśli głosy nadal są niedostępne, spróbuj zmienić przeglądarkę.
iOS i iPadOS
iOS używa systemowych głosów Apple, zarządzanych tak samo jak na macOS.
- Otwórz Ustawienia → Dostępność → Treść mówiona → Głosy
- Dotknij swojego języka docelowego na liście
- Dotknij ikony ⬇ pobierz obok wybranego głosu (wybierz Enhanced dla najlepszej jakości)
- Odśwież Safari po instalacji
Odtwarzanie głosu w Polyglotton używa Web Speech API, w pełni obsługiwanego w Safari na iOS 16+ i Chrome na Androidzie.
Po instalacji: wybór głosu w Polyglotton
Po pobraniu głosu otwórz panel ustawień audio w Polyglotton (przycisk głośnika w prawym dolnym rogu strony lekcji) i wybierz nowy głos z listy rozwijanej Głos — pojawi się automatycznie, gdy Twoja przeglądarka go wykryje.
Możesz też dostosować Prędkość i Wysokość, aby dopasować tempo, które wydaje Ci się naturalne. Niższe prędkości świetnie sprawdzają się przy wyłapywaniu szczegółów wymowy; wyższe prędkości pomagają rozwinąć płynność, gdy już oswoisz się z frazami.
Co nas czeka
Kolejna fala lokalnej AI sprawia, że cały ten ręczny proces staje się przestarzały. Apple Intelligence (wdrażane w iOS 26 i macOS Tahoe w latach 2025–2026) zawiera neuronową warstwę syntezy, która może generować naturalnie brzmiącą mowę w dowolnym obsługiwanym języku bezpośrednio na Twoim urządzeniu — bez konieczności pobierania pakietu głosowego. Microsoft podąża podobną ścieżką z napędzanymi przez Copilot neuronowymi głosami w Windows, a Google Gemini Nano na Androidzie obsługuje już wielojęzyczną syntezę offline.
W ciągu najbliższego roku lub dwóch Twoje urządzenie powinno być w stanie mówić w każdym języku tak naturalnie, jak w Twoim ojczystym — automatycznie, bez żadnej konfiguracji. Do tego czasu powyższe kroki pozwolą Ci osiągnąć ten cel już dziś.