Aktualność
23 Stycznia 2025|3 min. czytania

Jak rozpoznać deepfake po błędach w głosie?

Deepfake, który ma na celu wprowadzenie nas w błąd, to nie tylko wygenerowany obraz, ale także zmanipulowany dźwięk. Eksperci NASK przygotowali kilka wskazówek, jak rozpoznać manipulacje w generowanym głosie i skutecznie zidentyfikować fałszywe nagrania.

Grafika przedstawia Igę Świątek, Andrzeja Dudę, Paulinę Hennig-Kloska w pionowych prostokątach na niebieskim tle, z centralnym napisem: 'DEEPFAKE Nie wierz, w to co słyszysz'. Napis 'DEEPFAKE' wyróżnia się kolorem czerwonym, a słowo 'słyszysz' jest podkreślone i zaznaczone na niebiesko. Obrazek wskazuje na zagrożenia związane z technologią deepfake i zwraca uwagę na ostrożność w odbiorze treści multimedialnych.
Łuna gradientu wychodząca od dołu

Choć modele AI stale się rozwijają, generowane głosy często wydają się „płaskie” lub pozbawione emocji. Barwa głosu może brzmieć sztucznie, zwłaszcza podczas wyrażania emocji, takich jak złość, radość czy smutek.  

W naszym najnowszym odcinku Joanna Gajewska z NASK, która na co dzień zajmuje się analizą i badaniem generowanych treści, wskazuje konkretne przykłady błędów w generowanym głosie. Sprawdź jak w praktyce zastosować te wskazówki, by nie dać się nabrać na oszustwo. 

Sygnały w głosie zdradzające deepfake  

Twórcy deepfake’ów, manipulując głosem, używają zaawansowanych modeli generatywnych, które jednak nie są doskonałe. Oto typowe błędy, które mogą zdradzić oszustów: 

  1. Nietypowa intonacja
    Generowane głosy nie interpretują znaków interpunkcyjnych. Skutkuje to dziwnym rytmem wypowiedzi. Może to wyglądać tak, jakby osoba mówiła bez przerwy, nie uwzględniając naturalnych pauz czy akcentów.
  2. Zmiana akcentu lub języka
    Niekiedy w trakcie nagrania można usłyszeć subtelną zmianę akcentu, co jest efektem niedokładnej synchronizacji modelu. W ekstremalnych przypadkach zdarzają się nawet przejścia z jednego języka na inny. 
  3. Nagłe zmiany głośności
    Fałszywe głosy często zdradzają swoją sztuczność poprzez niespodziewane wahania poziomu głośności. Przykładowo, jedna część wypowiedzi może być wyjątkowo głośna, a inna ledwo słyszalna.
  4. Nienaturalne lub brakujące odgłosy tła
    Warto zwrócić uwagę na dźwięki w tle. Jeśli brakuje naturalnych odgłosów środowiska, takich jak echo w pomieszczeniu czy szum otoczenia, może to być sygnałem, że głos został wygenerowany.
  5. Syntetyczna barwa głosu
    Choć modele AI stale się rozwijają, generowane głosy często wydają się „płaskie” lub pozbawione emocji. Barwa głosu może brzmieć sztucznie, zwłaszcza podczas wyrażania emocji, takich jak złość, radość czy smutek. 

Nie przegap kolejnego odcinka  

Wiedza to najlepsza obrona przed cyfrowymi manipulacjami. Świadomość jak odróżniać prawdziwe głosy od fałszywych, pomoże podczas codziennego korzystania z internetu i mediów społecznościowych rozpoznawać techniki, które stosują oszuści. 

Premiera kolejnego odcinka już za tydzień. Będzie on poświęcony błędom logicznym w deepfake’ach – czyli nieoczywistym, ale zdradzającym manipulację sygnałom. 

Udostępnij ten post

Wyróżnione aktualności

Dwóch mężczyzn w garniturach siedzi przy stole i przegląda dokumenty, za nimi stoją flagi Polski i Unii Europejskiej.
Typ_aktualnosc Aktualność
31 Października 2025|4 min. czytania

Fakty, nie mity. NASK i UMB wspólnie przeciw dezinformacji medycznej

NASK podpisuje kolejne porozumienie przeciwko dezinformacji medycznej i mówi stanowcze „nie” fake-newsom na temat zdrowia. Po Warszawskim Uniwersytecie Medycznym, czas na Uniwersytet Medyczny w Białymstoku.

Otwarcie ofert na pracownie AI i STEM
Typ_aktualnosc Aktualność
30 Października 2025|2 min. czytania

Szkoły coraz bliżej technologicznej rewolucji. Znamy oferty na szkolne laboratoria przyszłości!

Edukacyjna rewolucja nabiera tempa. Tysiące szkół w całej Polsce już wkrótce zyskają nowoczesne pracownie, w których uczniowie będą mogli rozwijać cyfrowe umiejętności i poznawać technologie przyszłości. 30 października w NASK otwarto oferty firm, które chcą wyposażyć szkoły w laboratoria sztucznej inteligencji i STEM – miejsca, gdzie nauka spotka się z technologią.

Grafika promująca Zawody OSINT CTF organizowane przez NASK, z datą 24–25 listopada 2025 i turkusową flagą z logo OSINT CTF na fioletowym tle.
Typ_aktualnosc Aktualność
31 Października 2025|3 min. czytania

Zostań internetowym detektywem i sprawdź się w zawodach OSINT CTF

Internetowe śledztwa, szukanie tropów i łączenie kropek – brzmi znajomo? Jeśli lubisz rozwiązywać zagadki ukryte w labiryncie danych, zawody OSINT CTF NASK 2025 to miejsce, w którym poczujesz się jak w domu. Właśnie rusza rejestracja uczestników.

Grafika promująca Kongres OSE 2025 organizowany przez NASK. Na plakacie widnieje hasło wydarzenia: „Szacunek i odporność społeczna – edukacja wobec hejtu, AI i wyzwań przyszłości”. W tle widoczny jest nowoczesny, niebieski motyw graficzny symbolizujący technologię i edukację cyfrową. Na dole umieszczono informacje o dacie wydarzenia – 2 grudnia 2024 roku – oraz link do strony rejestracyjnej: kongres.ose.gov.pl.
Typ_aktualnosc Aktualność
03 Listopada 2025|4 min. czytania

Kongres OSE 2025 – zarejestruj się!

Jak promować język szacunku w cyfrowym świecie? W jaki sposób budować w szkole przestrzeń dla dialogu i różnicy zdań? Na te i inne pytania odpowiedzą eksperci podczas Kongresu OSE, który jest organizowany przez NASK. Wydarzenie odbędzie się 2 grudnia. Właśnie ruszyła rejestracja uczestników. Na zgłoszenia czekamy do 24 listopada.

Informacje

Najnowsze aktualności

Grafika promująca model językowy PLLuM. Na górze znajdują się geometryczne kształty w kolorach fioletu, turkusu i bieli. Na dole widnieje logo PLLuM wraz z napisem „Polish Large Language Model”.
Typ_aktualnosc Aktualność
17 Listopada 2025|4 min. czytania

Jak wychować AI? Poznaj PLLuM-Align

PLLuM-Align to pierwszy w Polsce otwarty zbiór danych z przykładami ludzkich preferencji. Służy do ulepszania i dostrajania modeli językowych. Zawiera ponad 4 tys. ręcznie ocenionych przykładów, które pomagają tworzyć bezpieczne, pomocne i zgodne z polskim kontekstem odpowiedzi.

Zbliżenie na podświetlone logo PLLuM – Polish Large Language Model – na stoisku Polski podczas międzynarodowych targów technologicznych. W tle widoczne oznaczenia Ministerstwa Cyfryzacji.
Typ_aktualnosc Aktualność
13 Listopada 2025|4 min. czytania

Polska w centrum innowacji - Web Summit 2025 

– Polska staje się symbolem nowej Europy – ambitnej, zmotywowanej i zorganizowanej. Gdy część Europy Zachodniej zwalnia, Polska i Europa Wschodnia nabierają rozpędu – mówił w Lizbonie Paddy Cosgrave, CEO Web Summit.

Panel dyskusyjny w centrum prasowym PAP. Na scenie Małgorzata Rozenek-Majdan, Iwona Prószyńska i Dariusz Standerski. Standerski mówi do mikrofonu. Widać kamery nagrywające wydarzenie i publiczność na sali.
Typ_aktualnosc Aktualność
12 Listopada 2025|7 min. czytania

Wolność w sieci czy era regulacji?

Co zmieni się w internecie po wdrożeniu unijnych regulacji DSA? Jak nowe prawo może wpłynąć na nasze bezpieczeństwo, ochronę dzieci i wizerunku, a także przyszłość cyfrowej komunikacji? Odpowiedzi na te pytania padły podczas debaty Strefy Dialogu Jutra Human Answer Institute w Polskiej Agencji Prasowej.