Aktualność
24 Lutego 2025|5 min. czytania

Polski Asystent AI już tu jest!

Prace nad PLLuM czyli polskim modelem językowym zaowocowały premierą rodziny polskich narzędzi do przetwarzania i generowania tekstów w języku polskim. Internauci mogą już wpisywać do PLLuMa swoje pierwsze prompty. A NASK przejmuje rolę lidera projektu.

Zdjęcie przedstawia mężczyznę - Szymona Łukasika.
Łuna gradientu wychodząca od dołu

PLLuM (Polish Large Language Model) to projekt, który miał na celu stworzenie otwartego polskiego modelu językowego oddającego złożoność naszego języka. Model opracowywany był na zlecenie Ministerstwa Cyfryzacji między innymi przez naukowców z NASK, a także Politechniki Wrocławskiej, Instytutu Podstaw Informatyki PAN, Instytutu Slawistyki PAN, Ośrodka Przetwarzania Informacji oraz Uniwersytetu Łódzkiego. Ma być bezpieczny i wolny od treści szkodliwych i nieprawdziwych. Dzięki temu będzie on śmiało wykorzystywany także w administracji publicznej. 

O procesie tworzenia modelu i efektach tych prac opowiada Szymon Łukasik, dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji. 

 

Jakie są największe wyzwania związane z tworzeniem polskiego dużego modelu językowego PLLuM? Czy język polski jako “low resource language” postawił przed Wami szczególne bariery? 

Szymon Łukasik: Język polski można określić jako język o niskich zasobach. Chodzi o to, że nie dysponujemy bardzo dużą ilością danych, które pozwoliłyby na wytrenowanie modelu od zera. W związku z tym staramy się kontynuować uczenie już dostępnych modeli otwartych. Równocześnie staramy się pozyskiwać dane od wydawców, twórców treści. To sprawia, że projekt, który z założenia jest projektem o charakterze inżynierskim, staje się projektem z zakresu prawa własności intelektualnej i lingwistyki. To jest ogromne wyzwanie. Każdy by chciał, żebyśmy mieli w Polsce bardzo dużo zasobów obliczeniowych i centrów, które pozwalałyby na trenowanie dużych modeli. Okazuje się natomiast, że równie ważnym aspektem jest to, że potrzebujemy po prostu mieć dane, żeby nawet te duże modele zasilić. 

Modele tworzone w ramach PLLuM były trenowane na bardzo unikalnym zbiorze instrukcji. 

S.Ł.: Tak. Kluczową rolę w projekcie pełnią weryfikatorzy. Dzięki ich pracy wiemy czy model rzeczywiście odpowiada tak, jakbyśmy tego chcieli. Czy nie generuje treści szkodliwych czy nie odpowiada na te pytania, na które chcielibyśmy, żeby nie odpowiadał np. nie generuje treści szkodliwych czy nie odpowiada na te pytania, na które chcielibyśmy, żeby nie odpowiadał np. jak skonstruować bombę. NASK miał tutaj ogromny wkład dzięki doświadczeniu naszych ekspertów. Specjalizujemy się w cyberbezpieczeństwie, mamy doświadczenie w pracy z treściami szkodliwymi. Nasz zespół jest dosyć mocno multidyscyplinarny. Są w nim zarówno programiści, prawnicy i ludzie, którzy z tymi treściami szkodliwymi mieli do czynienia. Dzięki ich zaangażowaniu weryfikacja nazwijmy ją „na żywym organizmie” była możliwa. 

W jakich zastosowaniach PLLuM może być użyty w administracji publicznej? 

S.Ł.: PLLuM podpowie jak załatwić jakąś sprawę, wygeneruje wzór pisma. To są rzeczy, które są istotne zarówno dla obywatela, ale dla urzędnika również. Mówimy tu o podstawowym zastosowaniu. Dla administracji publicznej można też dokonywać wdrożeń dedykowanych dla poszczególnych urzędów, skrojonych na ich potrzeby. Chcemy też rozwijać stworzony w NASK system EZD, żeby modele językowe wspierały też elektroniczną obsługę dokumentacji. 

Czy polskie modele językowe mogą konkurować z globalnymi rozwiązaniami, takimi jak ChatGPT, pod kątem jakości i funkcjonalności? 

S.Ł.: To zależy jaki zakres zadań naszemu modelowi językowemu zadamy. Jeżeli chcemy mieć duży model językowy, który jest tak zwanym modelem ogólnego użytku, to najlepsze będą takie, które były trenowane na bardzo dużych zbiorach danych i które potrzebują dużych zasobów obliczeniowych. Natomiast do takich specjalistycznych zadań, chociażby właśnie w administracji publicznej czy do wsparcia obywateli w zupełności wystarczą mniejsze modele wytwarzane w taki sposób jak nasza rodzina modeli. To będzie wystarczające. PLLuM jest funkcjonalny w środowisku obliczeniowym, który nie posiada wielu zasobów. Jednak, jeżeli ktoś dysponuje większymi możliwościami obliczeniowymi to zastosowanie także większych modeli z tej rodziny jest możliwe. Na ten moment w takich kwestiach jak np. zadawanie pytań do dokumentów, mogę śmiało stwierdzić, że jak najbardziej jesteśmy w stanie konkurować z z dużymi modelami, tworzonymi komercyjnie przez gigantów technologicznych. Warto podkreślić, że PLLuM bardzo dobrze radzi sobie z treściami szkodliwymi i tematami kulturowymi. To znaczy, że ten model jest rzeczywiście zaadaptowany do polskiego kontekstu kulturowego.  

Projekt PLLuM będzie dalej rozszerzany i liderem tego procesu będzie NASK, a konkretnie Ośrodek Badań nad Bezpieczeństwem SI. Jakie zadania stoją teraz przed Wami?

S.Ł.: Udało nam się poszerzyć konsorcjum i NASK będzie pełnił rolę lidera koordynując pracę, starając się od każdego konsorcjanta wydobyć to co najlepsze. Mamy bardzo fajny zespół, który ma różne kompetencje, niektórzy bardzo dobrze się odnajdują w tematach danych, niektórzy bardzo dobrze się odnajdują w tematach treningów, inni z kolei są dobrzy w kwestiach wdrożeniowych. Będziemy starali się te prace koordynować i prowadzić do wdrożeń, bo ten projekt ma w tym momencie już bardziej wdrożeniowy charakter. Oczywiście dalej będą prowadzone prace nad modelami, nad ich rozwijaniem, pozyskiwaniem danych. Tu się nic nie zmienia. Jednak priorytetowe będzie dla nas teraz praktyczne wdrażanie modeli do pracy.  

Udostępnij ten post

Wyróżnione aktualności

Zdjęcie z wydarzenia medialnego Impact. Na pierwszym planie widać ekran podglądu realizatorskiego, który pokazuje dwa kadry: po lewej stronie Radosław Nielek, dyrektor NASK, w brązowej marynarce i białej koszuli, po prawej stronie dziennikarka trzymająca mikrofon. W tle widoczni rozmyci uczestnicy rozmowy oraz kamery.
Typ_aktualnosc Aktualność
14 Maja 2025|3 min. czytania

Szeroki front małych systemów na Impact’25

Wbrew pozorom zapewnienie cyfrowego bezpieczeństwa w gminie jest trudniejsze niż w banku – mówił w dyskusji podczas Impact’25 Radosław Nielek, dyrektor NASK. W jednej gminie może znajdować się jednocześnie wiele różnych systemów informatycznych – wodociągów, szkół, placówek medycznych.

Piotr Bisialski z NASK na scenie podczas konferencji.
Typ_aktualnosc Aktualność
13 Maja 2025|7 min. czytania

NASK o krok przed cyberprzestępcami. Forum Bezpieczeństwa Banków 2025

Kradzież tożsamości, ataki na infrastrukturę i próby manipulacji danymi. Sektor finansowy jest na pierwszej linii frontu w walce z cyberprzestępcami. NASK – jako lider w dziedzinie cyberbezpieczeństwa - wychodzi naprzeciw tym wyzwaniom. – Udział w Forum Bezpieczeństwa Banków to dla nas okazja do poznania realnych potrzeb sektora bankowego i wdrożenia konkretnych działań – mówił Piotr Bisialski, kierownik zespołu NASK Incident Response Team.

Wiceminister cyfryzacji Dariusz Standerski przemawia podczas konferencji dotyczącej projektu HIVE AI. W tle na ekranie widoczne są slajdy prezentacji z tytułem „Cele, założenia i organizacja projektu”. Przy stole prezydialnym siedzą Radosław Nielek, Agnieszka Karlińska. W sali znajduje się licznie zgromadzona publiczność, a jedno z przemówień jest rejestrowane telefonem przez uczestnika.
Typ_aktualnosc Aktualność
12 Maja 2025|5 min. czytania

PLLuM rośnie w siłę

600 tysięcy promptów wpisanych w okienko PLLuMa i nowości, od których dzielą nas nie lata, a zaledwie tygodnie – kolejne modele i prototyp inteligentnego asystenta. W siedzibie NASK w Warszawie spotkali się wszyscy uczestnicy konsorcjum HIVE AI. Grupy, która ma za zadanie rozwijać i wdrażać polski model językowy (PLLuM).

MAK od NASK
Typ_aktualnosc Aktualność
12 Maja 2025|4 min. czytania

Rozkwitnij z MAK. Program Mentoringu Aktywnych Kobiet nabiera barw

Podnieś swoje kompetencje z zakresu cyberbezpieczeństwa i wejdź na rynek nowych technologii! Już kilkaset kobiet zgłosiło chęć udziału w programie MAK (Mentoring Aktywnych Kobiet), ogłoszonym przez NASK we współpracy z Ministerstwem Cyfryzacji. Zostań jedną z nich — zgłoś swój udział i rozwiń skrzydła w indywidualnym programie mentoringowym. Nabór trwa do końca maja.

Informacje

Najnowsze aktualności

Abstrakcyjna grafika przedstawiająca trójwymiarowe struktury przypominające układy scalone, pokryte cyfrowym wzorem składającym się z zer i jedynek w kolorze żółtym. Obraz symbolizuje technologie cyfrowe, przetwarzanie danych lub sztuczną inteligencję.
Typ_aktualnosc Aktualność
20 Czerwca 2025|7 min. czytania

Prawda czy fałsz? Co da nam AI Act?

Czy AI Act pomoże, czy zaszkodzi? Pierwsze na świecie kompleksowe prawo dotyczące sztucznej inteligencji wchodzi w życie. Zapraszamy na wyjątkowy webinar z ekspertami NASK, Ministerstwa Cyfryzacji oraz partnerów, którzy porozmawiają o faktach i mitach dotyczących AI Act.

Mężczyzna w niebieskiej koszuli w paski trzyma w dłoniach smartfon z trzema aparatami. W dolnej części obrazka znajdują się logotypy: Fundusze Europejskie na Rozwój Cyfrowy, Rzeczpospolita Polska, Unia Europejska oraz NASK, co sugeruje, że projekt jest współfinansowany przez Unię Europejską.
Typ_aktualnosc Aktualność
18 Czerwca 2025|6 min. czytania

Zanim klikniesz – zastanów się

Cyberprzestępcy najczęściej łowią przypadkowe osoby – niezmiennie jednym z głównych zagrożeń dla internautów, obserwowanych przez zespół CERT Polska pozostaje phishing. Pozornie nieszkodliwe maile, często wzywające do pilnego działania, mogą prowadzić do fałszywych witryn wyłudzających dane.

Wiceminister cyfryzacji Dariusz Standerski przemawia na scenie podczas Digital Summit w Europejskim Centrum Solidarności w Gdańsku. Za nim znajduje się duży ekran z grafiką wydarzenia zawierającą nazwę „DIGITAL SUMMIT”, daty 17–18.06 oraz lokalizację. Na ekranie widoczne są również logotypy i hasło „Gdańsk jako centrum cyfrowej Europy”. Na sali obecna jest publiczność, scena oświetlona jest światłem w odcieniach niebieskiego i fioletowego.
Typ_aktualnosc Aktualność
17 Czerwca 2025|6 min. czytania

PLLuM i polska wizja cyfrowej Europy

PLLuM i jego możliwości zostały zaprezentowane podczas Digital Summit 2025 - najważniejszego wydarzenia dotyczącego cyfrowej transformacji podczas polskiej prezydencji w Radzie UE. „Nie jesteśmy starym kontynentem. Jesteśmy kontynentem AI. Jesteśmy cyfrowym kontynentem” – mówił wiceminister Standerski. PLLuM to dowód na prawdziwość tej tezy.