Aktualność
24 Lutego 2025|5 min. czytania

Polski Asystent AI już tu jest!

Prace nad PLLuM czyli polskim modelem językowym zaowocowały premierą rodziny polskich narzędzi do przetwarzania i generowania tekstów w języku polskim. Internauci mogą już wpisywać do PLLuMa swoje pierwsze prompty. A NASK przejmuje rolę lidera projektu.

Prace nad PLLuM czyli polskim modelem językowym zaowocowały premierą rodziny polskich narzędzi do przetwarzania i generowania tekstów w języku polskim. Internauci mogą już wpisywać do PLLuMa swoje pierwsze prompty. A NASK przejmuje rolę lidera projektu.
Łuna gradientu wychodząca od dołu

PLLuM (Polish Large Language Model) to projekt, który miał na celu stworzenie otwartego polskiego modelu językowego oddającego złożoność naszego języka. Model opracowywany był na zlecenie Ministerstwa Cyfryzacji między innymi przez naukowców z NASK, a także Politechniki Wrocławskiej, Instytutu Podstaw Informatyki PAN, Instytutu Slawistyki PAN, Ośrodka Przetwarzania Informacji oraz Uniwersytetu Łódzkiego. Ma być bezpieczny i wolny od treści szkodliwych i nieprawdziwych. Dzięki temu będzie on śmiało wykorzystywany także w administracji publicznej. 

O procesie tworzenia modelu i efektach tych prac opowiada Szymon Łukasik, dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji. 

 

Jakie są największe wyzwania związane z tworzeniem polskiego dużego modelu językowego PLLuM? Czy język polski jako “low resource language” postawił przed Wami szczególne bariery? 

Szymon Łukasik: Język polski można określić jako język o niskich zasobach. Chodzi o to, że nie dysponujemy bardzo dużą ilością danych, które pozwoliłyby na wytrenowanie modelu od zera. W związku z tym staramy się kontynuować uczenie już dostępnych modeli otwartych. Równocześnie staramy się pozyskiwać dane od wydawców, twórców treści. To sprawia, że projekt, który z założenia jest projektem o charakterze inżynierskim, staje się projektem z zakresu prawa własności intelektualnej i lingwistyki. To jest ogromne wyzwanie. Każdy by chciał, żebyśmy mieli w Polsce bardzo dużo zasobów obliczeniowych i centrów, które pozwalałyby na trenowanie dużych modeli. Okazuje się natomiast, że równie ważnym aspektem jest to, że potrzebujemy po prostu mieć dane, żeby nawet te duże modele zasilić. 

Modele tworzone w ramach PLLuM były trenowane na bardzo unikalnym zbiorze instrukcji. 

S.Ł.: Tak. Kluczową rolę w projekcie pełnią weryfikatorzy. Dzięki ich pracy wiemy czy model rzeczywiście odpowiada tak, jakbyśmy tego chcieli. Czy nie generuje treści szkodliwych czy nie odpowiada na te pytania, na które chcielibyśmy, żeby nie odpowiadał np. nie generuje treści szkodliwych czy nie odpowiada na te pytania, na które chcielibyśmy, żeby nie odpowiadał np. jak skonstruować bombę. NASK miał tutaj ogromny wkład dzięki doświadczeniu naszych ekspertów. Specjalizujemy się w cyberbezpieczeństwie, mamy doświadczenie w pracy z treściami szkodliwymi. Nasz zespół jest dosyć mocno multidyscyplinarny. Są w nim zarówno programiści, prawnicy i ludzie, którzy z tymi treściami szkodliwymi mieli do czynienia. Dzięki ich zaangażowaniu weryfikacja nazwijmy ją „na żywym organizmie” była możliwa. 

W jakich zastosowaniach PLLuM może być użyty w administracji publicznej? 

S.Ł.: PLLuM podpowie jak załatwić jakąś sprawę, wygeneruje wzór pisma. To są rzeczy, które są istotne zarówno dla obywatela, ale dla urzędnika również. Mówimy tu o podstawowym zastosowaniu. Dla administracji publicznej można też dokonywać wdrożeń dedykowanych dla poszczególnych urzędów, skrojonych na ich potrzeby. Chcemy też rozwijać stworzony w NASK system EZD, żeby modele językowe wspierały też elektroniczną obsługę dokumentacji. 

Czy polskie modele językowe mogą konkurować z globalnymi rozwiązaniami, takimi jak ChatGPT, pod kątem jakości i funkcjonalności? 

S.Ł.: To zależy jaki zakres zadań naszemu modelowi językowemu zadamy. Jeżeli chcemy mieć duży model językowy, który jest tak zwanym modelem ogólnego użytku, to najlepsze będą takie, które były trenowane na bardzo dużych zbiorach danych i które potrzebują dużych zasobów obliczeniowych. Natomiast do takich specjalistycznych zadań, chociażby właśnie w administracji publicznej czy do wsparcia obywateli w zupełności wystarczą mniejsze modele wytwarzane w taki sposób jak nasza rodzina modeli. To będzie wystarczające. PLLuM jest funkcjonalny w środowisku obliczeniowym, który nie posiada wielu zasobów. Jednak, jeżeli ktoś dysponuje większymi możliwościami obliczeniowymi to zastosowanie także większych modeli z tej rodziny jest możliwe. Na ten moment w takich kwestiach jak np. zadawanie pytań do dokumentów, mogę śmiało stwierdzić, że jak najbardziej jesteśmy w stanie konkurować z z dużymi modelami, tworzonymi komercyjnie przez gigantów technologicznych. Warto podkreślić, że PLLuM bardzo dobrze radzi sobie z treściami szkodliwymi i tematami kulturowymi. To znaczy, że ten model jest rzeczywiście zaadaptowany do polskiego kontekstu kulturowego.  

Projekt PLLuM będzie dalej rozszerzany i liderem tego procesu będzie NASK, a konkretnie Ośrodek Badań nad Bezpieczeństwem SI. Jakie zadania stoją teraz przed Wami?

S.Ł.: Udało nam się poszerzyć konsorcjum i NASK będzie pełnił rolę lidera koordynując pracę, starając się od każdego konsorcjanta wydobyć to co najlepsze. Mamy bardzo fajny zespół, który ma różne kompetencje, niektórzy bardzo dobrze się odnajdują w tematach danych, niektórzy bardzo dobrze się odnajdują w tematach treningów, inni z kolei są dobrzy w kwestiach wdrożeniowych. Będziemy starali się te prace koordynować i prowadzić do wdrożeń, bo ten projekt ma w tym momencie już bardziej wdrożeniowy charakter. Oczywiście dalej będą prowadzone prace nad modelami, nad ich rozwijaniem, pozyskiwaniem danych. Tu się nic nie zmienia. Jednak priorytetowe będzie dla nas teraz praktyczne wdrażanie modeli do pracy.  

Udostępnij ten post

Wyróżnione aktualności

Ilustracja przedstawia zdjęcie rentgenowskie ludzkiej głowy w profilu, ale zamiast mózgu znajduje się w niej spleciona chałka. Tło jest ciemnoniebieskie, co kontrastuje z jasnym pieczywem i rentgenowskimi kośćmi czaszki. Obrazek ma humorystyczny i surrealistyczny charakter.
Typ_aktualnosc Aktualność
30 Stycznia 2025|7 min. czytania

Chałkoń z farmy lajków. Humor w social mediach i jego ciemne oblicze

Internet żyje trendami, a jednym z największych w ostatnim czasie jest tzw. Chałkoń. Wygenerowany przez sztuczną inteligencję żart, wskazuje na skuteczność virali w kształtowaniu opinii publicznej i skłania do pytań o zagrożenie rozprzestrzeniania się dezinformacji.

Grafika przedstawia Igę Świątek, Andrzeja Dudę, Paulinę Hennig-Kloska w pionowych prostokątach na niebieskim tle, z centralnym napisem: 'DEEPFAKE Nie wierz, w to co słyszysz'. Napis 'DEEPFAKE' wyróżnia się kolorem czerwonym, a słowo 'słyszysz' jest podkreślone i zaznaczone na niebiesko. Obrazek wskazuje na zagrożenia związane z technologią deepfake i zwraca uwagę na ostrożność w odbiorze treści multimedialnych.
Aktualność
23 Stycznia 2025|3 min. czytania

Jak rozpoznać deepfake po błędach w głosie?

Deepfake, który ma na celu wprowadzenie nas w błąd, to nie tylko wygenerowany obraz, ale także zmanipulowany dźwięk. Eksperci NASK przygotowali kilka wskazówek, jak rozpoznać manipulacje w generowanym głosie i skutecznie zidentyfikować fałszywe nagrania.

data leak
Aktualność
22 Stycznia 2025|3 min. czytania

Twoje dane osobowe wyciekły? Musisz działać szybko! Sprawdź, co robić

 Kiedy imię, nazwisko, numer PESEL czy dane logowania trafiają w niepowołane ręce, skutki mogą być dramatyczne – od kradzieży tożsamości po straty finansowe. Jak się chronić przed skutkami wycieku danych osobowych? Radzą Eksperci z CERT Polska.

Premier Wietnamu Phạm Minh Chính stoi, otoczony przez ludzi witających go w świetle aparatów fotograficznych. Po lewej stronie znajduje się Paweł Olszewski, sekretarz stanu w Ministerstwie Cyfryzacji, a obok niego dyrektor NASK Radosław Nielek. W tle widać fotografów i dziennikarzy robiących zdjęcia oraz nocną scenerię.
Aktualność
17 Stycznia 2025|4 min. czytania

Premier Wietnamu w instytucie NASK

Premier Wietnamu Pham Minh Chinh z wizytą w instytucie badawczym NASK. Delegacja odwiedziła Warszawę przy okazji 75-ej rocznicy nawiązania stosunków dyplomatycznych między Wietnamem i Polską.

Informacje

Najnowsze aktualności

1 4
Aktualność
24 Lutego 2025|9 min. czytania

Jak dezinformacja kształtuje nasze postrzeganie Ukrainy?

Trzy lata wojny w Ukrainie, to także trzy lata walki w cyberprzestrzeni. To trzy lata walki na granicach informacji i dezinformacji, newsów i fake newsów — wszystkiego, co służy wpływowi na społeczeństwa i liderów innych krajów.

Abstrakcyjna ilustracja przedstawiająca cyfrowe dane w postaci niebieskich linii kodu i punktów świetlnych na ciemnym tle. Obrazek przypomina futurystyczną wizualizację przepływu informacji lub technologii cyfrowej, symbolizując koncepcje związane z big data, sztuczną inteligencją i cyberprzestrzenią.
Typ_aktualnosc Aktualność
24 Lutego 2025|4 min. czytania

NASK liderem projektu wykorzystującego AI w cyberbezpieczeństwie

Blisko 8 milionów euro na innowacyjne technologie do walki z cyberzagrożeniami to budżet międzynarodowego konsorcjum, którego liderem jest instytut badawczy NASK. AIPITCH to projekt, którego założeniem jest osiągnięcie większej efektywności w identyfikowaniu zagrożeń w cyberprzestrzeni.

Grafika promująca międzypokoleniowe warsztaty organizowane w ramach inicjatywy „Szkoła Międzypokoleniowa”. Na niebieskim tle widnieją dwie okrągłe fotografie – po lewej stronie uśmiechnięty starszy mężczyzna w żółtym swetrze trzymający smartfon, po prawej młody chłopak w beżowej bluzie również z telefonem w ręce. Pomiędzy zdjęciami znajduje się logo inicjatywy oraz napis w języku polskim: „Trwają międzypokoleniowe warsztaty!”. W dolnej części grafiki widoczne są logotypy Ministerstwa do spraw Polityki Senioralnej, Ministerstwa Edukacji Narodowej, Ministerstwa Cyfryzacji oraz NASK.
Typ_aktualnosc Aktualność
24 Lutego 2025|4 min. czytania

„Szkoła międzypokoleniowa” – seniorzy i uczniowie wspólnie zdobywają kompetencje cyfrowe

Konkurs „Szkoła międzypokoleniowa” nabiera tempa – w całej Polsce trwają warsztaty dotyczące bezpiecznego korzystania z internetu dla seniorów. Dzięki ankietom od uczestników, wiemy jak przebiega nauka i jak tworzą się międzypokoleniowe więzi. Mamy już ponad 6200 odpowiedzi, a kolejnych wciąż przybywa!