Jak rozpoznać deepfake po błędach w głosie?
Deepfake, który ma na celu wprowadzenie nas w błąd, to nie tylko wygenerowany obraz, ale także zmanipulowany dźwięk. Eksperci NASK przygotowali kilka wskazówek, jak rozpoznać manipulacje w generowanym głosie i skutecznie zidentyfikować fałszywe nagrania.

Choć modele AI stale się rozwijają, generowane głosy często wydają się „płaskie” lub pozbawione emocji. Barwa głosu może brzmieć sztucznie, zwłaszcza podczas wyrażania emocji, takich jak złość, radość czy smutek.
W naszym najnowszym odcinku Joanna Gajewska z NASK, która na co dzień zajmuje się analizą i badaniem generowanych treści, wskazuje konkretne przykłady błędów w generowanym głosie. Sprawdź jak w praktyce zastosować te wskazówki, by nie dać się nabrać na oszustwo.
Sygnały w głosie zdradzające deepfake
Twórcy deepfake’ów, manipulując głosem, używają zaawansowanych modeli generatywnych, które jednak nie są doskonałe. Oto typowe błędy, które mogą zdradzić oszustów:
- Nietypowa intonacja
Generowane głosy nie interpretują znaków interpunkcyjnych. Skutkuje to dziwnym rytmem wypowiedzi. Może to wyglądać tak, jakby osoba mówiła bez przerwy, nie uwzględniając naturalnych pauz czy akcentów. - Zmiana akcentu lub języka
Niekiedy w trakcie nagrania można usłyszeć subtelną zmianę akcentu, co jest efektem niedokładnej synchronizacji modelu. W ekstremalnych przypadkach zdarzają się nawet przejścia z jednego języka na inny. - Nagłe zmiany głośności
Fałszywe głosy często zdradzają swoją sztuczność poprzez niespodziewane wahania poziomu głośności. Przykładowo, jedna część wypowiedzi może być wyjątkowo głośna, a inna ledwo słyszalna. - Nienaturalne lub brakujące odgłosy tła
Warto zwrócić uwagę na dźwięki w tle. Jeśli brakuje naturalnych odgłosów środowiska, takich jak echo w pomieszczeniu czy szum otoczenia, może to być sygnałem, że głos został wygenerowany. - Syntetyczna barwa głosu
Choć modele AI stale się rozwijają, generowane głosy często wydają się „płaskie” lub pozbawione emocji. Barwa głosu może brzmieć sztucznie, zwłaszcza podczas wyrażania emocji, takich jak złość, radość czy smutek.
Nie przegap kolejnego odcinka
Wiedza to najlepsza obrona przed cyfrowymi manipulacjami. Świadomość jak odróżniać prawdziwe głosy od fałszywych, pomoże podczas codziennego korzystania z internetu i mediów społecznościowych rozpoznawać techniki, które stosują oszuści.
Premiera kolejnego odcinka już za tydzień. Będzie on poświęcony błędom logicznym w deepfake’ach – czyli nieoczywistym, ale zdradzającym manipulację sygnałom.
Wyróżnione aktualności
Fakty, nie mity. NASK i UMB wspólnie przeciw dezinformacji medycznej
NASK podpisuje kolejne porozumienie przeciwko dezinformacji medycznej i mówi stanowcze „nie” fake-newsom na temat zdrowia. Po Warszawskim Uniwersytecie Medycznym, czas na Uniwersytet Medyczny w Białymstoku.
Szkoły coraz bliżej technologicznej rewolucji. Znamy oferty na szkolne laboratoria przyszłości!
Edukacyjna rewolucja nabiera tempa. Tysiące szkół w całej Polsce już wkrótce zyskają nowoczesne pracownie, w których uczniowie będą mogli rozwijać cyfrowe umiejętności i poznawać technologie przyszłości. 30 października w NASK otwarto oferty firm, które chcą wyposażyć szkoły w laboratoria sztucznej inteligencji i STEM – miejsca, gdzie nauka spotka się z technologią.
Zostań internetowym detektywem i sprawdź się w zawodach OSINT CTF
Internetowe śledztwa, szukanie tropów i łączenie kropek – brzmi znajomo? Jeśli lubisz rozwiązywać zagadki ukryte w labiryncie danych, zawody OSINT CTF NASK 2025 to miejsce, w którym poczujesz się jak w domu. Właśnie rusza rejestracja uczestników.
Kongres OSE 2025 – zarejestruj się!
Jak promować język szacunku w cyfrowym świecie? W jaki sposób budować w szkole przestrzeń dla dialogu i różnicy zdań? Na te i inne pytania odpowiedzą eksperci podczas Kongresu OSE, który jest organizowany przez NASK. Wydarzenie odbędzie się 2 grudnia. Właśnie ruszyła rejestracja uczestników. Na zgłoszenia czekamy do 24 listopada.
Najnowsze aktualności
Jak wychować AI? Poznaj PLLuM-Align
PLLuM-Align to pierwszy w Polsce otwarty zbiór danych z przykładami ludzkich preferencji. Służy do ulepszania i dostrajania modeli językowych. Zawiera ponad 4 tys. ręcznie ocenionych przykładów, które pomagają tworzyć bezpieczne, pomocne i zgodne z polskim kontekstem odpowiedzi.
Polska w centrum innowacji - Web Summit 2025
– Polska staje się symbolem nowej Europy – ambitnej, zmotywowanej i zorganizowanej. Gdy część Europy Zachodniej zwalnia, Polska i Europa Wschodnia nabierają rozpędu – mówił w Lizbonie Paddy Cosgrave, CEO Web Summit.
Wolność w sieci czy era regulacji?
Co zmieni się w internecie po wdrożeniu unijnych regulacji DSA? Jak nowe prawo może wpłynąć na nasze bezpieczeństwo, ochronę dzieci i wizerunku, a także przyszłość cyfrowej komunikacji? Odpowiedzi na te pytania padły podczas debaty Strefy Dialogu Jutra Human Answer Institute w Polskiej Agencji Prasowej.







