banner

>

>

Grupa Technologii Językowych G4.19 Politechniki Wrocławskiej udostępnia 8 lutego 2013 na otwartej licencji pierwszy polski wordnet Słowosieć.

>

>

Słowosieć jest tzw. wordnetem języka polskiego, czyli rodzajem sieci semantycznej, która odzwierciedla jego system leksykalny: słowa, ich znaczenia i różnorodne powiązania między nimi.

>Wordnety służą automatycznej analizie tekstu. Uważa się je za podstawowy zasób językowy, ważny dla badań nad sztuczną inteligencją. Potrafią one, w sposób przydatny dla programu komputerowego, opisać określone znaczenia i połączenia danego wyrazu. Dzięki temu komputerom będzie łatwiej uczyć się rozumieć polszczyznę i Polaków.


Prace nad słownikiem trwają od ponad 7 lat. W maju 2009 roku udało się stworzyć pierwszy polski wordnet, zawierający opis 27 tysięcy jednostek leksykalnych (tj. znaczeń haseł słownikowych). Najnowsza wersja Słowosieci to najbardziej rozbudowany opis polskiego systemu znaczeń leksykalnych. Całość tworzy pajęczynę ponad 106 tys. wyrazów, 158 tys. różnych znaczeń, które łączy ponad 440 tys. relacji. Jest drugim pod względem wielkości słownikiem elektronicznym tego typu.


Polski program jest efektem ścisłej współpracy lingwistów, lingwistów informatycznych i informatyków, co jest unikalne w skali światowej. Dzięki powiązaniu z największym na świecie WordNetem amerykańskim Słowosieć może być wykorzystywana przez osoby uczące się języka polskiego lub angielskiego.


8 lutego 2013 Słowosieć 2.0 zostanie udostępniona na otwartej licencji wzorowanej na licencji WordNetu Uniwersytetu w Princeton i będzie dostępna do ściągnięcia pod adresem: http://nlp.pwr.wroc.pl/plwordnet/download/?lang=pl

>

Więcej informacji o Słowosieci oraz program wydarzenia można znaleźć na stronie:http://nlp.pwr.wroc.pl/pl/ogloszenia/slowosiec-wersja-20/plwordnet-v20.