Aktualność
24 Lutego 2025|5 min. czytania

Polski Asystent AI już tu jest!

Prace nad PLLuM czyli polskim modelem językowym zaowocowały premierą rodziny polskich narzędzi do przetwarzania i generowania tekstów w języku polskim. Internauci mogą już wpisywać do PLLuMa swoje pierwsze prompty. A NASK przejmuje rolę lidera projektu.

Zdjęcie przedstawia mężczyznę - Szymona Łukasika.
Łuna gradientu wychodząca od dołu

PLLuM (Polish Large Language Model) to projekt, który miał na celu stworzenie otwartego polskiego modelu językowego oddającego złożoność naszego języka. Model opracowywany był na zlecenie Ministerstwa Cyfryzacji między innymi przez naukowców z NASK, a także Politechniki Wrocławskiej, Instytutu Podstaw Informatyki PAN, Instytutu Slawistyki PAN, Ośrodka Przetwarzania Informacji oraz Uniwersytetu Łódzkiego. Ma być bezpieczny i wolny od treści szkodliwych i nieprawdziwych. Dzięki temu będzie on śmiało wykorzystywany także w administracji publicznej. 

O procesie tworzenia modelu i efektach tych prac opowiada Szymon Łukasik, dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji. 

 

Jakie są największe wyzwania związane z tworzeniem polskiego dużego modelu językowego PLLuM? Czy język polski jako “low resource language” postawił przed Wami szczególne bariery? 

Szymon Łukasik: Język polski można określić jako język o niskich zasobach. Chodzi o to, że nie dysponujemy bardzo dużą ilością danych, które pozwoliłyby na wytrenowanie modelu od zera. W związku z tym staramy się kontynuować uczenie już dostępnych modeli otwartych. Równocześnie staramy się pozyskiwać dane od wydawców, twórców treści. To sprawia, że projekt, który z założenia jest projektem o charakterze inżynierskim, staje się projektem z zakresu prawa własności intelektualnej i lingwistyki. To jest ogromne wyzwanie. Każdy by chciał, żebyśmy mieli w Polsce bardzo dużo zasobów obliczeniowych i centrów, które pozwalałyby na trenowanie dużych modeli. Okazuje się natomiast, że równie ważnym aspektem jest to, że potrzebujemy po prostu mieć dane, żeby nawet te duże modele zasilić. 

Modele tworzone w ramach PLLuM były trenowane na bardzo unikalnym zbiorze instrukcji. 

S.Ł.: Tak. Kluczową rolę w projekcie pełnią weryfikatorzy. Dzięki ich pracy wiemy czy model rzeczywiście odpowiada tak, jakbyśmy tego chcieli. Czy nie generuje treści szkodliwych czy nie odpowiada na te pytania, na które chcielibyśmy, żeby nie odpowiadał np. nie generuje treści szkodliwych czy nie odpowiada na te pytania, na które chcielibyśmy, żeby nie odpowiadał np. jak skonstruować bombę. NASK miał tutaj ogromny wkład dzięki doświadczeniu naszych ekspertów. Specjalizujemy się w cyberbezpieczeństwie, mamy doświadczenie w pracy z treściami szkodliwymi. Nasz zespół jest dosyć mocno multidyscyplinarny. Są w nim zarówno programiści, prawnicy i ludzie, którzy z tymi treściami szkodliwymi mieli do czynienia. Dzięki ich zaangażowaniu weryfikacja nazwijmy ją „na żywym organizmie” była możliwa. 

W jakich zastosowaniach PLLuM może być użyty w administracji publicznej? 

S.Ł.: PLLuM podpowie jak załatwić jakąś sprawę, wygeneruje wzór pisma. To są rzeczy, które są istotne zarówno dla obywatela, ale dla urzędnika również. Mówimy tu o podstawowym zastosowaniu. Dla administracji publicznej można też dokonywać wdrożeń dedykowanych dla poszczególnych urzędów, skrojonych na ich potrzeby. Chcemy też rozwijać stworzony w NASK system EZD, żeby modele językowe wspierały też elektroniczną obsługę dokumentacji. 

Czy polskie modele językowe mogą konkurować z globalnymi rozwiązaniami, takimi jak ChatGPT, pod kątem jakości i funkcjonalności? 

S.Ł.: To zależy jaki zakres zadań naszemu modelowi językowemu zadamy. Jeżeli chcemy mieć duży model językowy, który jest tak zwanym modelem ogólnego użytku, to najlepsze będą takie, które były trenowane na bardzo dużych zbiorach danych i które potrzebują dużych zasobów obliczeniowych. Natomiast do takich specjalistycznych zadań, chociażby właśnie w administracji publicznej czy do wsparcia obywateli w zupełności wystarczą mniejsze modele wytwarzane w taki sposób jak nasza rodzina modeli. To będzie wystarczające. PLLuM jest funkcjonalny w środowisku obliczeniowym, który nie posiada wielu zasobów. Jednak, jeżeli ktoś dysponuje większymi możliwościami obliczeniowymi to zastosowanie także większych modeli z tej rodziny jest możliwe. Na ten moment w takich kwestiach jak np. zadawanie pytań do dokumentów, mogę śmiało stwierdzić, że jak najbardziej jesteśmy w stanie konkurować z z dużymi modelami, tworzonymi komercyjnie przez gigantów technologicznych. Warto podkreślić, że PLLuM bardzo dobrze radzi sobie z treściami szkodliwymi i tematami kulturowymi. To znaczy, że ten model jest rzeczywiście zaadaptowany do polskiego kontekstu kulturowego.  

Projekt PLLuM będzie dalej rozszerzany i liderem tego procesu będzie NASK, a konkretnie Ośrodek Badań nad Bezpieczeństwem SI. Jakie zadania stoją teraz przed Wami?

S.Ł.: Udało nam się poszerzyć konsorcjum i NASK będzie pełnił rolę lidera koordynując pracę, starając się od każdego konsorcjanta wydobyć to co najlepsze. Mamy bardzo fajny zespół, który ma różne kompetencje, niektórzy bardzo dobrze się odnajdują w tematach danych, niektórzy bardzo dobrze się odnajdują w tematach treningów, inni z kolei są dobrzy w kwestiach wdrożeniowych. Będziemy starali się te prace koordynować i prowadzić do wdrożeń, bo ten projekt ma w tym momencie już bardziej wdrożeniowy charakter. Oczywiście dalej będą prowadzone prace nad modelami, nad ich rozwijaniem, pozyskiwaniem danych. Tu się nic nie zmienia. Jednak priorytetowe będzie dla nas teraz praktyczne wdrażanie modeli do pracy.  

Udostępnij ten post

Wyróżnione aktualności

Zaawansowana robotyczna ręka trzyma długopis i wypełnia dokument na biurku. W tle widać ekran komputera z wyświetlonymi danymi, co sugeruje pracę w środowisku technologicznym lub biurowym. Sceneria jest nowoczesna, z chłodnym, futurystycznym oświetleniem.
Aktualność
20 Lutego 2025|4 min. czytania

Ctrl+Alt+Praca: jaką rzeczywistość wygeneruje nam AI?

Gdyby sztuczna inteligencja była Twoim współpracownikiem, to razem pilibyście kawę czy mijalibyście się na korytarzu bez słowa? Jak AI zmieni polski rynek pracy - mówił ekspert z NASK na prestiżowej konferencji unijnych ministrów organizowanej w ramach polskiej prezydencji w UE.

Na pierwszym planie widać uśmiechniętą kobietę w czarnym stroju, trzymającą otwartą teczkę z podpisaną umową. Obok niej siedzi mężczyzna w garniturze, spoglądający w stronę dokumentu. W tle widoczne są flagi Polski i Unii Europejskiej.
Typ_aktualnosc Aktualność
20 Lutego 2025|3 min. czytania

„Klub Cyfrowych Możliwości” - 25 milionów złotych na innowacje w polskich szkołach

W świecie, w którym kompetencje cyfrowe stają się jednym z kluczowych czynników rozwoju, ważne jest, by każdy – niezależnie od miejsca zamieszkania czy płci – miał szansę odkrywać i kształtować swoje zainteresowania w obszarze nowych technologii.

Obraz przedstawia pięć osób - Emilię Wierzbicki, Donalda Tuska, Elona Muska, Anitę Werner, Ewę Drzyzgę na kadrach z nagrań wideo. Zdjęcia są przetworzone cyfrowo, nadając im niebieskawy odcień. Na środku grafiki znajduje się duży napis „DEEPFAKE” w czerwonym kolorze, a poniżej czarny tekst: „Błędy logiczne? To może być DEEPFAKE” z ostatnim słowem wyróżnionym na niebiesko. Całość sugeruje tematykę manipulacji audiowizualnej i wskazuje na możliwość fałszowania treści za pomocą technologii deepfake.
Typ_aktualnosc Aktualność
19 Lutego 2025|3 min. czytania

Jak rozpoznać deepfake po błędach logicznych?

W kolejnym, przedostatnim już odcinku cyklu wideo „Jak rozpoznać deepfake?” czas na jedne z najbardziej wyrazistych wskaźników manipulacji – błędy logiczne. W deepfake’ach nie zawsze chodzi o techniczne niedoskonałości obrazu czy dźwięku. Często to niespójności w treści i kontekście zdradzają, że mamy do czynienia z fałszerstwem.

Ciemne ujęcie dłoni piszących na klawiaturze laptopa, symbolizujące cyberbezpieczeństwo i ochronę danych. Nałożona grafika przedstawia cyfrowe elementy interfejsu, w tym świecący zamek i futurystyczne okręgi, sugerujące zabezpieczenia i ochronę prywatności w sieci.
Typ_aktualnosc Aktualność
19 Lutego 2025|2 min. czytania

Cyberoodporny samorząd – jak bronić się przed manipulacją?

Solidna porcja cennych informacji i wskazówek na temat dezinformacji oraz cyberhigieny. Tak w skrócie można określić bezpłatne szkolenia w formie webinarów przeprowadzane przez specjalistów z Instytutu NASK dla samorządów.

Informacje

Najnowsze aktualności

Agnieszka Gryszczyńska
Typ_aktualnosc Aktualność
20 Marca 2025|3 min. czytania

Trzy pytania o SECURE Summit 2025 do prof. Agnieszki Gryszczyńskiej z Prokuratury Krajowej

Co pomogło ustalić tożsamość sprawców konkretnych cyberprzestępstw? Co sprzyja zwalczaniu cyberprzestępczości i jakie zmiany w prawie należałoby wprowadzić? Prof. ucz. dr hab. inż. Agnieszka Gryszczyńska*, dyrektorka Departamentu ds. Cyberprzestępczości w Prokuraturze Krajowej zaprasza na swój panel i na tę jedyną w swoim rodzaju konferencję.

Rynek nazw domeny .pl – szczegółowy raport NASK za czwarty kwartał 2024 roku. Infografika przedstawia kluczowe dane: prawie 2,6 miliona aktywnych nazw w domenie .pl, prawie 195 tysięcy nowych nazw oraz ponad 1,1 miliona abonentów.
Typ_aktualnosc Aktualność
19 Marca 2025|4 min. czytania

Domeny.pl - polska domena rośnie w siłę

Świetne wieści dla rynku domeny .pl. Polskie adresy internetowe zyskują na popularności, a statystyki pokazują, że coraz więcej osób i firm decyduje się na wybór właśnie tej końcówki. W ostatnim kwartale 2024 roku zarejestrowano 194 628 nowych domen – to tak, jakby co dwie minuty pojawiały się trzy nowe nazwy!

Father holding coffee cup and talking to smiling daughter using laptop during breakfast in kitchen
Typ_aktualnosc Aktualność
19 Marca 2025|7 min. czytania

Cyberbezpieczne dzieci – jak technologie pomagają chronić najmłodszych

Ponad połowa nastolatków w Polsce doświadczyła już jakiejś formy cyberprzemocy. Jak więc chronić dzieci, nie odbierając im dostępu do cyfrowego świata? Z pomocą przychodzą nowoczesne technologie i świadome towarzyszenie, czyli monitoring tego co robią najmłodsi w sieci.