Aktualność
24 Lutego 2025|5 min. czytania

Polski Asystent AI już tu jest!

Prace nad PLLuM czyli polskim modelem językowym zaowocowały premierą rodziny polskich narzędzi do przetwarzania i generowania tekstów w języku polskim. Internauci mogą już wpisywać do PLLuMa swoje pierwsze prompty. A NASK przejmuje rolę lidera projektu.

Zdjęcie przedstawia mężczyznę - Szymona Łukasika.
Łuna gradientu wychodząca od dołu

PLLuM (Polish Large Language Model) to projekt, który miał na celu stworzenie otwartego polskiego modelu językowego oddającego złożoność naszego języka. Model opracowywany był na zlecenie Ministerstwa Cyfryzacji między innymi przez naukowców z NASK, a także Politechniki Wrocławskiej, Instytutu Podstaw Informatyki PAN, Instytutu Slawistyki PAN, Ośrodka Przetwarzania Informacji oraz Uniwersytetu Łódzkiego. Ma być bezpieczny i wolny od treści szkodliwych i nieprawdziwych. Dzięki temu będzie on śmiało wykorzystywany także w administracji publicznej. 

O procesie tworzenia modelu i efektach tych prac opowiada Szymon Łukasik, dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji. 

 

Jakie są największe wyzwania związane z tworzeniem polskiego dużego modelu językowego PLLuM? Czy język polski jako “low resource language” postawił przed Wami szczególne bariery? 

Szymon Łukasik: Język polski można określić jako język o niskich zasobach. Chodzi o to, że nie dysponujemy bardzo dużą ilością danych, które pozwoliłyby na wytrenowanie modelu od zera. W związku z tym staramy się kontynuować uczenie już dostępnych modeli otwartych. Równocześnie staramy się pozyskiwać dane od wydawców, twórców treści. To sprawia, że projekt, który z założenia jest projektem o charakterze inżynierskim, staje się projektem z zakresu prawa własności intelektualnej i lingwistyki. To jest ogromne wyzwanie. Każdy by chciał, żebyśmy mieli w Polsce bardzo dużo zasobów obliczeniowych i centrów, które pozwalałyby na trenowanie dużych modeli. Okazuje się natomiast, że równie ważnym aspektem jest to, że potrzebujemy po prostu mieć dane, żeby nawet te duże modele zasilić. 

Modele tworzone w ramach PLLuM były trenowane na bardzo unikalnym zbiorze instrukcji. 

S.Ł.: Tak. Kluczową rolę w projekcie pełnią weryfikatorzy. Dzięki ich pracy wiemy czy model rzeczywiście odpowiada tak, jakbyśmy tego chcieli. Czy nie generuje treści szkodliwych czy nie odpowiada na te pytania, na które chcielibyśmy, żeby nie odpowiadał np. nie generuje treści szkodliwych czy nie odpowiada na te pytania, na które chcielibyśmy, żeby nie odpowiadał np. jak skonstruować bombę. NASK miał tutaj ogromny wkład dzięki doświadczeniu naszych ekspertów. Specjalizujemy się w cyberbezpieczeństwie, mamy doświadczenie w pracy z treściami szkodliwymi. Nasz zespół jest dosyć mocno multidyscyplinarny. Są w nim zarówno programiści, prawnicy i ludzie, którzy z tymi treściami szkodliwymi mieli do czynienia. Dzięki ich zaangażowaniu weryfikacja nazwijmy ją „na żywym organizmie” była możliwa. 

W jakich zastosowaniach PLLuM może być użyty w administracji publicznej? 

S.Ł.: PLLuM podpowie jak załatwić jakąś sprawę, wygeneruje wzór pisma. To są rzeczy, które są istotne zarówno dla obywatela, ale dla urzędnika również. Mówimy tu o podstawowym zastosowaniu. Dla administracji publicznej można też dokonywać wdrożeń dedykowanych dla poszczególnych urzędów, skrojonych na ich potrzeby. Chcemy też rozwijać stworzony w NASK system EZD, żeby modele językowe wspierały też elektroniczną obsługę dokumentacji. 

Czy polskie modele językowe mogą konkurować z globalnymi rozwiązaniami, takimi jak ChatGPT, pod kątem jakości i funkcjonalności? 

S.Ł.: To zależy jaki zakres zadań naszemu modelowi językowemu zadamy. Jeżeli chcemy mieć duży model językowy, który jest tak zwanym modelem ogólnego użytku, to najlepsze będą takie, które były trenowane na bardzo dużych zbiorach danych i które potrzebują dużych zasobów obliczeniowych. Natomiast do takich specjalistycznych zadań, chociażby właśnie w administracji publicznej czy do wsparcia obywateli w zupełności wystarczą mniejsze modele wytwarzane w taki sposób jak nasza rodzina modeli. To będzie wystarczające. PLLuM jest funkcjonalny w środowisku obliczeniowym, który nie posiada wielu zasobów. Jednak, jeżeli ktoś dysponuje większymi możliwościami obliczeniowymi to zastosowanie także większych modeli z tej rodziny jest możliwe. Na ten moment w takich kwestiach jak np. zadawanie pytań do dokumentów, mogę śmiało stwierdzić, że jak najbardziej jesteśmy w stanie konkurować z z dużymi modelami, tworzonymi komercyjnie przez gigantów technologicznych. Warto podkreślić, że PLLuM bardzo dobrze radzi sobie z treściami szkodliwymi i tematami kulturowymi. To znaczy, że ten model jest rzeczywiście zaadaptowany do polskiego kontekstu kulturowego.  

Projekt PLLuM będzie dalej rozszerzany i liderem tego procesu będzie NASK, a konkretnie Ośrodek Badań nad Bezpieczeństwem SI. Jakie zadania stoją teraz przed Wami?

S.Ł.: Udało nam się poszerzyć konsorcjum i NASK będzie pełnił rolę lidera koordynując pracę, starając się od każdego konsorcjanta wydobyć to co najlepsze. Mamy bardzo fajny zespół, który ma różne kompetencje, niektórzy bardzo dobrze się odnajdują w tematach danych, niektórzy bardzo dobrze się odnajdują w tematach treningów, inni z kolei są dobrzy w kwestiach wdrożeniowych. Będziemy starali się te prace koordynować i prowadzić do wdrożeń, bo ten projekt ma w tym momencie już bardziej wdrożeniowy charakter. Oczywiście dalej będą prowadzone prace nad modelami, nad ich rozwijaniem, pozyskiwaniem danych. Tu się nic nie zmienia. Jednak priorytetowe będzie dla nas teraz praktyczne wdrażanie modeli do pracy.  

Udostępnij ten post

Wyróżnione aktualności

Dwóch mężczyzn w garniturach siedzi przy stole i przegląda dokumenty, za nimi stoją flagi Polski i Unii Europejskiej.
Typ_aktualnosc Aktualność
31 Października 2025|4 min. czytania

Fakty, nie mity. NASK i UMB wspólnie przeciw dezinformacji medycznej

NASK podpisuje kolejne porozumienie przeciwko dezinformacji medycznej i mówi stanowcze „nie” fake-newsom na temat zdrowia. Po Warszawskim Uniwersytecie Medycznym, czas na Uniwersytet Medyczny w Białymstoku.

Otwarcie ofert na pracownie AI i STEM
Typ_aktualnosc Aktualność
30 Października 2025|2 min. czytania

Szkoły coraz bliżej technologicznej rewolucji. Znamy oferty na szkolne laboratoria przyszłości!

Edukacyjna rewolucja nabiera tempa. Tysiące szkół w całej Polsce już wkrótce zyskają nowoczesne pracownie, w których uczniowie będą mogli rozwijać cyfrowe umiejętności i poznawać technologie przyszłości. 30 października w NASK otwarto oferty firm, które chcą wyposażyć szkoły w laboratoria sztucznej inteligencji i STEM – miejsca, gdzie nauka spotka się z technologią.

Grafika promująca Zawody OSINT CTF organizowane przez NASK, z datą 24–25 listopada 2025 i turkusową flagą z logo OSINT CTF na fioletowym tle.
Typ_aktualnosc Aktualność
31 Października 2025|3 min. czytania

Zostań internetowym detektywem i sprawdź się w zawodach OSINT CTF

Internetowe śledztwa, szukanie tropów i łączenie kropek – brzmi znajomo? Jeśli lubisz rozwiązywać zagadki ukryte w labiryncie danych, zawody OSINT CTF NASK 2025 to miejsce, w którym poczujesz się jak w domu. Właśnie rusza rejestracja uczestników.

Grafika promująca Kongres OSE 2025 organizowany przez NASK. Na plakacie widnieje hasło wydarzenia: „Szacunek i odporność społeczna – edukacja wobec hejtu, AI i wyzwań przyszłości”. W tle widoczny jest nowoczesny, niebieski motyw graficzny symbolizujący technologię i edukację cyfrową. Na dole umieszczono informacje o dacie wydarzenia – 2 grudnia 2024 roku – oraz link do strony rejestracyjnej: kongres.ose.gov.pl.
Typ_aktualnosc Aktualność
03 Listopada 2025|4 min. czytania

Kongres OSE 2025 – zarejestruj się!

Jak promować język szacunku w cyfrowym świecie? W jaki sposób budować w szkole przestrzeń dla dialogu i różnicy zdań? Na te i inne pytania odpowiedzą eksperci podczas Kongresu OSE, który jest organizowany przez NASK. Wydarzenie odbędzie się 2 grudnia. Właśnie ruszyła rejestracja uczestników. Na zgłoszenia czekamy do 24 listopada.

Informacje

Najnowsze aktualności

Dyrektor Radosław Nielek i uczestnik wydarzenia
Typ_aktualnosc Aktualność
29 Listopada 2025|6 min. czytania

Tropy odnalezione, zagadki rozwiązane. Znamy zwycięzców OSINT CTF NASK

Siatka kont szerzących dezinformację została rozpracowana, zleceniodawca przekazany odpowiednim służbom, a kryzys dyplomatyczny zażegnany. Dwudniowe internetowe śledztwo dobiegło końca. Teraz wszystko jest już jasne – znamy zwycięzców pierwszych w administracji publicznej zawodów z zakresu wywiadu jawnoźródłowego.

Zdjęcie kobiety, siedzącej  ze skrzyżowanymi nogami na tle różowej ściany z różowym tabletem.
Typ_aktualnosc Aktualność
28 Listopada 2025|5 min. czytania

Dzień bez Zakupów. Chwila przerwy od szaleństwa konsumpcji

Dzień bez Zakupów obchodzimy co roku tuż po Black Friday, który nie trwa przecież jeden dzień, a całe tygodnie. Chichot losu, bo akurat po rozpoczynającym się w piątek szaleństwie zakupowym, powinniśmy... powstrzymać się od kupowania już następnego dnia. Warto to jednak zrobić, zwłaszcza, że nadmierny konsumpcjonizm ma dwie wielkie wady – szkodzi planecie i jest świetną okazją dla oszustów.

Grafika promująca wydarzenie „Cyfrowy Biznes” w Gorzowie Wielkopolskim 4 grudnia 2025 r. Na niebieskim tle widnieją zdjęcia dwóch ekspertów NASK – Pawła Kostkiewicza i Marka Rozińskiego – oraz logotypy Funduszy Europejskich, Rzeczypospolitej Polskiej, Unii Europejskiej i Krajowego Planu Odbudowy.
Typ_aktualnosc Aktualność
28 Listopada 2025|3 min. czytania

Bezpieczny i innowacyjny biznes w erze cyfrowej

Jak wykorzystać potencjał cyfrowej transformacji? Jak wzmocnić bezpieczeństwo swojej firmy w erze rosnących e-zagrożeń? Na te pytania już 4 grudnia odpowiedzą eksperci podczas bezpłatnego spotkania w Gorzowie Wielkopolskim „Bezpieczny biznes w cyfrowym świecie”. Warsztaty organizowane przez Ministerstwo Rozwoju i Technologii we współpracy z Urzędem Marszałkowskim Województwa Lubuskiego i NASK przyniosą praktyczną wiedzę, narzędzia oraz inspiracje