Reklama

Nauka

Powstanie pierwszy polski otwarty wielki model językowy (PLLuM) i inteligentny asystent

Polski wielki model językowy PLLuM, wytrenowany na treściach głównie polskojęzycznych, oraz oparty na nim inteligentny asystent - powstaną w ramach współpracy sześciu polskich jednostek naukowych. “Nie stać nas na to, by zostawać w tyle”- komentują przedstawiciele projektu.

Bądź na bieżąco!

Zapisz się do newslettera

Konsorcjum PLLuM (Polish Large Language Universal Model) powstało 29 listopada br. (w przeddzień pierwszych urodzin chatGPT). Tworzy je sześć spośród wiodących w Polsce jednostek naukowych z obszaru sztucznej inteligencji i językoznawstwa: Politechnika Wrocławska (lider konsorcjum), Państwowy Instytut Badawczy NASK (PIB NASK), Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy (OPI PIB), Instytut Podstaw Informatyki PAN, Uniwersytet Łódzki oraz Instytut Slawistyki PAN. O powołaniu konsorcjum poinformowali w piątek w przesłanym PAP komunikacie przedstawiciele PIB NASK.

Od około roku wielkie językowe modele generatywne (LLMs) zachwycają niewyobrażalnymi dotychczas możliwościami sztucznej inteligencji. Te najbardziej znane modele, jak ChatGPT czy Google Bard, mają jednak swoje ograniczenia: są płatne, są zamknięte (nie można poznać ani modyfikować ich algorytmów) i zostały wytrenowane ze zbyt małym udziałem treści polskojęzycznych (dlatego w polskich odpowiedziach pojawia się więcej błędów niż w języku angielskim).

Pomóż w rozwoju naszego portalu

Wspieram

Reklama

Stąd pomysł, aby stworzyć otwarty, darmowy model w większości wytrenowany na treściach polskojęzycznych, a także opracować wykorzystującego ten model inteligentnego asystenta. “Całość projektu ma być przeprowadzona zgodnie z dobrymi praktykami etycznej i odpowiedzialnej sztucznej inteligencji, w tym przy zachowaniu reprezentatywności, przejrzystości i sprawiedliwości danych” - zapewniają przedstawiciele projektu. Istotną rolę odegra tu Krajowe Centrum Doskonałości Danych z siedzibą w NASK-PIB.

“Wypracowany przez czołowe jednostki badawcze przy współpracy z administracją publiczną, zgodnie z zasadami odpowiedzialnego rozwoju systemów AI, transparentny i całkowicie dostępny otwarty model będzie innowacją na skalę światową w rozumieniu przedsięwzięcia łączącego dostęp do danych, kompetencji, zasobów technicznych oraz know-how jednostek naukowych i rządowych we wspólnym celu wspierania nauki i gospodarki, w tym konkurencyjności polskich przedsiębiorstw” – podkreśla Wojciech Pawlak, dyrektor Państwowego Instytutu Badawczego NASK.

Oprócz płatnych modeli językowych, istnieją już wprawdzie wielkie modele językowe na otwartych licencjach, jednak wśród nich nadal brakuje modeli wytrenowanych na reprezentatywnych zbiorach języka polskiego. Niewielki udział polskich tekstów w procesie trenowania lub jedynie dostrojenie do języka polskiego sprawiają, że modele te nie nadają się do wielu komercyjnych zastosowań w języku polskim. Dlatego PLLuM - jak czytamy w komunikacie - ma na celu wsparcie polskich przedsiębiorców w wyścigu technologicznym poprzez stworzenie dostępu do modeli z rozszerzonym językiem polskim na bezpłatnej, otwartoźródłowej licencji, który będzie odpowiadał wymogom rynku.

Reklama

“Wielkie modele językowe stały się uniwersalnymi, podstawowymi silnikami dla przetwarzania języka naturalnego, ale ich zbudowanie czy dotrenowanie przekracza możliwości polskich przedsiębiorców. Dlatego stworzenie otwartego polskiego wielkiego modelu językowego w połączeniu z dostępną już w Polsce infrastrukturą obliczeniową dla AI (np. na PWr) jest takie ważne, bo może wesprzeć rozwój nauki, ale także małe i średnie przedsiębiorstwa, które w obszarze IT oraz AI są motorem napędowym polskiej gospodarki” – wyjaśnia cytowany w komunikacie prof. Maciej Piasecki, kierownik projektu po stronie Politechniki Wrocławskiej, lidera konsorcjum.

Z kolei dyrektor OPI-PIB dr inż. Jarosław Protasiewicz dodaje: “W interesie nas wszystkich leży dynamiczny rozwój branży IT i środowiska naukowego w Polsce. Istotne jest, aby opracowywać nowe narzędzia IT i udostępniać je wszystkim za darmo. W OPI opracowaliśmy m.in. model Polish RoBERTa large, który według KLEJ Benchmark jest najlepszym modelem reprezentacyjnym dla języka polskiego. Cieszę się, że teraz nasza wiedza i doświadczenie będą wykorzystane do opracowania modelu PLLuM. Potrzebne są nam modele trenowane na tekstach polskojęzycznych, niezbędne są one m.in. do analizy polskiego internetu”.

Posiadanie otwartego modelu to także dostęp do obiektu badawczego, do możliwości opracowywania i testowania metod wyjaśnialności tego modelu, zaglądania w głąb czarnej skrzynki.

“Model PLLuM będzie stymulował rozwój nauki w Polsce nie tylko w obszarze rozwoju AI, ale także wyjaśnialności sztucznej inteligencji (XAI - Explainable AI). A na tego konia szczególnie warto stawiać – bo temat krytycznej analizy jest równie ważny, co sam rozkwit możliwości AI, a poza tym, jako Polska, mamy szansę zajmować tu czołowe pozycje na świecie” – podkreśla dr Inez Okulska, kierowniczka Zakładu Inżynierii Lingwistycznej i Analizy Tekstu z NASK-PIB.

Reklama

W ocenie przedstawicieli konsorcjum wyraźnie większy udział tekstów oryginalnie napisanych w języku polskim oraz zawierających informacje o Polsce (polskiej nauce, sztuce, historii, prawie, gospodarce i innych) pozwoli zwiększyć widoczność naszego języka i kultury, które w obecnie dostępnych modelach są odczuwalnie marginalizowane.

PLLuM ma bowiem - mają nadzieję jego twórcy - służyć nie tylko naukowcom i przedsiębiorcom, lecz przede wszystkim polskiemu społeczeństwu – odbiorcy innowacyjnych rozwiązań opartych na tym modelu. Jednym z nich jest polskojęzyczny inteligentny asystent, który będzie miał na celu zwiększenie dostępności usług publicznych, zarówno cyfrowych, jak i podczas tradycyjnej wizyty w urzędzie czy punkcie obsługi. Oferując możliwość formułowania zapytań w języku naturalnym (tak jak w przypadku rozmowy z urzędnikiem), wychodzi naprzeciw również osobom wykluczonym cyfrowo. A to dopiero początek możliwości, jakie da to ogromne, wspólne przedsięwzięcie polskich badaczy, biznesu i administracji publicznej - zapowiadają twórcy.(PAP)

Nauka w Polsce

lt/ bar/

2023-12-01 16:13

Ocena: +2 0

Reklama

Wybrane dla Ciebie

Sztuczna inteligencja kole w oczy

Żyjemy w czasach galopującego rozwoju technologii. Niestety, do naszych lokalnych realiów najlepiej pasuje często przywoływane w relacjach sportowych stwierdzenie: świat nam znowu uciekł.

Kiedy jeszcze rok temu eksperymentowałem z pierwszymi narzędziami mającymi na celu zaprzęgnięcie sztucznej inteligencji do pisania czy komponowania, przyznam się, że miałem niezły ubaw. Niedoskonałość tych narzędzi polegała na kompletnym nieodróżnianiu prawdy od fałszu. Ot, zasysały informacje z zasobów internetu, przetrawiały je i wyrzucały produkt absurdalny. Przykład? Kazałem AI napisać moją biografię. Jedno z narzędzi nie odróżniło tego, co o mnie, od tego, co ja popełniłem. Upraszczając, do mojej biografii wkleiły się fragmenty recenzji mojego pióra, przez co stałem się członkiem Voo Voo, nagrywałem z Metallicą, nie mówiąc o licznych książkach mojego autorstwa (nie popełniłem żadnej). O tym, jak świat szybko galopuje, przekonałem się, uczestnicząc w panelach w ramach Forum Ekonomicznego w Krynicy bądź je prowadząc. Kiedy my zachłystywaliśmy się pojęciem czwartej rewolucji przemysłowej (Przemysł 4.0 – komputeryzowane systemy produkcji wyposaża się dodatkowo w łącza sieciowe, z wykorzystaniem technologii informacyjnych i komunikacyjnych w przemyśle), już wówczas obecny na forum przedstawiciel sekcji analitycznej z Cambridge powiedział o stojącej „za rogiem” piątej rewolucji – gdy głównym graczem będzie sztuczna inteligencja. Choć trudno go nazwać prorokiem, miał rację. Lista powszechnie dostępnych nam narzędzi (bezpłatnych i płatnych) jest zaskakująco długa i praktycznie co chwilę pojawiają się nowe bądź doskonalsze ich wersje. Te narzędzia uczą się same, zasysając to, co im niezbędne, z globalnej sieci i zasobów. Śpimy, a one się uczą. Miesiąc temu jednemu z takich narzędzi zadałem napisanie krótkiego chorału bazującego na stylu Händla i Bacha, a tekstowo na hasłach jednego z lokalnych komitetów w wyborach samorządowych. I przyznam, zgłupiałem. Efekt był porażający, muzycznie bowiem to była perełka, a generator mowy (czy raczej śpiewu) nie robił żadnych błędów wymowy w języku polskim. Niespełna miesiąc temu pojawił się filmik, w którym Czesław Niemen śpiewa hit Zenka Martyniuka, w innym Putin, Kim Dzong Un, Biden, Trump i wielu polityków oraz celebrytów bierze udział w... rytuale znanym z filmu Oczy szeroko zamknięte Stanleya Kubricka. Niezmieniona jest jedynie muzyka Jocelyn Pook (skądinąd rewelacyjna). Zdumiewające.
CZYTAJ DALEJ

O różańcu inaczej

2024-11-21 11:24

[ TEMATY ]

różaniec

Łukasz Krzysztofka/Niedziela

Moc czy nuda? Już dziś kolejne spotkanie z cyklu „Duchowość dla Warszawy” poświęcone modlitwie różańcowej.

Gościem spotkania, organizowanego przez Akademię Katolicką w Warszawie, będzie znany rekolekcjonista o. Krzysztof Pałys, dominikanin. Zmierzy się z pytaniami: czym jest ta popularna modlitwa, której nazwa oznacza „wieniec z róż”? Czy popularność różańca wynikała z powszechnej nieumiejętności czytania, czy z jej kontemplacyjnego charakteru? Co różaniec może powiedzieć współczesnemu człowiekowi? Moc, czy nuda – a może jeszcze coś innego?
CZYTAJ DALEJ

Uratujmy ten Adwent!

2024-11-21 17:57

Marzena Cyfert

Spotkanie z Elżbietą Woźniak-Łojczuk w parafii św. Maurycego we Wrocławiu

Spotkanie z Elżbietą Woźniak-Łojczuk w parafii św. Maurycego we Wrocławiu

O wartości tradycji, rodzinnym przeżywaniu Adwentu i pomocy, jaką niesie w tym „Adwentownik” mówiła Elżbieta Woźniak-Łojczuk podczas spotkania w parafii św. Maurycego we Wrocławiu. Spotkanie zorganizowała wspólnota Betania.

Autorka Adwentownika podzieliła się swoim doświadczeniem przeżywania Adwentu z lat dziecięcych, które wiązało się m.in. z porannym wstawaniem na roraty. – Pamiętam procesję z lampionami i Msze św. Ale pamiętam też powrót z rorat do domu i kakao, które mama zawsze wtedy stawiała nam na stole – mówiła prelegentka, podkreślając, że po powrocie z rorat trzeba było iść do oddalonej o 800 m szkoły. I wszystko to udawało się pogodzić.
CZYTAJ DALEJ

Reklama

Najczęściej czytane

W związku z tym, iż od dnia 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016r. w sprawie ochrony osób fizycznych w związku z przetwarzaniem danych osobowych i w sprawie swobodnego przepływu takich danych oraz uchylenia Dyrektywy 95/46/WE (ogólne rozporządzenie o ochronie danych) uprzejmie Państwa informujemy, iż nasza organizacja, mając szczególnie na względzie bezpieczeństwo danych osobowych, które przetwarza, wdrożyła System Zarządzania Bezpieczeństwem Informacji w rozumieniu odpowiednich polityk ochrony danych (zgodnie z art. 24 ust. 2 przedmiotowego rozporządzenia ogólnego). W celu dochowania należytej staranności w kontekście ochrony danych osobowych, Zarząd Instytutu NIEDZIELA wyznaczył w organizacji Inspektora Ochrony Danych.
Więcej o polityce prywatności czytaj TUTAJ.

Akceptuję