- Panie profesorze, czy w Polsce potrzebny jest program rozwoju informatyki? A jeśli tak, to czy potrafimy taki stworzyć?
- Wbrew pozorom jest to trudne pytanie, bo nie można mówić o jednym programie; sposób finansowania nauki poszedł w innym kierunku. Należałoby spojrzeć tu na całość nauk ścisłych i technicznych, i pomyśleć o wielu programach. W tej chwili niektóre kierunki są uznane przez ministerstwo za ważne dla rozwoju nauki w Polsce. To dotyczy m. in. nauk informacyjnych i obliczeniowych, które są wymieniane jako ważne, natomiast nie są w sposób specjalny finansowane. Mamy np. w Narodowym Centrum Nauki panel o nazwie „Informatyka i technologie informacyjne”. Jest on taki, jak wiele innych, gdzie obowiązuje procedura konkursowa. I to dobrze, ale nie jest to program finansowany osobno, z racji ważności tematyki. Czy taki byłby potrzebny? Na pewno tak, ale wówczas, gdyby takich programów było więcej, gdybyśmy byli stworzyli priorytety badawcze istotne dla rozwoju kraju.
Niestety, administrowanie naszą nauką poszło w kierunku określenia wąskich obszarów, w których możemy się ubiegać o finansowanie bardzo wąskich tematycznie projektów. W tym systemie bywają nawet znaczące granty, ale jest ich mało, w dodatku można mieć wątpliwości, czy są one dobrze rozdzielane i czy są na nie wystarczające środki. O dużych programach się nie mówi, więc sama konstatacja, że program rozwoju informatyki jest potrzebny, to za mało.
- A może wynika to z powszechnego przekonania, że informatyka to nauka pomocnicza, służebna dla innych?
- Deklaracje są inne, wskazujące na docenianie informatyki jako nauki niezależnej, niemniej jeśli idzie o finansowanie, to znajdują one słabe odzwierciedlenie w faktach. Gdyby np. wspomnieć o ciekawych inicjatywach NCN, to w programie „Maestro” wielkość grantów może dochodzić do 3 mln zł – a to już poważna suma. W ostatnim konkursie NCN z obszaru nauk ścisłych i technicznych finansowanie uzyskało zaledwie 29 projektów, ale nauki techniczne zostały w nim prawie pominięte, a informatyka – zupełnie. Nastąpiło więc bardzo wyraźne skrzywienie w stronę nauk podstawowych - fizycznych i chemicznych. A informatyka tutaj winna być, zwłaszcza że były z tego obszaru bardzo dobre projekty.
- Pytam o informatykę – kierunek, w który warto inwestować - nie bez powodu: mamy przecież zespoły młodych informatyków, którzy wygrywają światowe olimpiady, zawody, konkursy i to od lat. Poza tym nasze firmy informatyczne wchodzą z powodzeniem na rynki zagraniczne. Czyli potencjał intelektualny mamy w tym obszarze spory i obiecujący. Czy wobec tego nie powinno się większej wagi przywiązywać do rozwoju informatyki, zwłaszcza że to nie jest tak droga nauka jak fizyka czy biologia, a i wdrożenia chyba tańsze...
- Rzeczywiście jest ogromne pole do popisu dla nauk informatycznych, przedsięwzięć o niskiej kosztochłonności i możliwości wpisywania się w niezwykle ważne badania. I gdyby stworzyć taki szeroki program rozwoju informatyki, to z pewnością skorzystałaby cała nauka i kraj. Ale trzeba byłoby inaczej spojrzeć na finansowanie całej nauki, strukturę przyznawania grantów. Trzeba byłoby przede wszystkim zauważyć, że na obecnym poziomie finansowania nauki nie da się skonstruować poważnych, mocnych i trwałych programów rozwoju określonych dziedzin nauki. Mówi o tym historia porażek takich działań od lat 90.
Dobrą ilustracją problemu struktury polskiej nauki są choćby losy tych młodych zdolnych informatyków, którzy zdobywają laury na forum międzynarodowym. Nasze zespoły badawcze nie mają środków na zapewnienie stabilnego zatrudnienia i rozwoju naukowego tym ludziom i ich tracą. Przechwytują ich koncerny, prywatny biznes. My możemy im zaoferować co najwyżej umowę o dzieło, ewentualnie etat na krótki czas. Sprawę mogłyby polepszyć programy 5- letnie, natomiast już przy grantach 3-letnich – o ile się je zdobędzie - brakuje stabilizacji. Nasz instytut na razie jest w bardzo dobrej sytuacji, uczestniczymy i prowadzimy wiele programów, także unijnych, więc dajemy bardzo dobre wynagrodzenia. Ale z drugiej strony nie wiemy, co będzie po zakończeniu tych programów - przyszłość jest niepewna i będzie taka, jeśli nie pojawią się programy dłuższe w finansowaniu niż 3-letnie oraz nie zwiększą się środki statutowe, z których opłacamy wkład własny przy ubieganiu się o kolejne dotacje.
- Dyletantowi, który obserwuje informatykę w Polsce może wydawać się, że zajmuje się ona głównie problemami związanymi z digitalizacją zasobów. Czy takie spojrzenie jest prawdziwe? Czym się zajmuje polska informatyka?
- Digitalizacja zasobów – choć bardzo potrzebna, nie jest nauką, acz są w tym ciekawe elementy naukowe. Nas interesuje nie sama cyfryzacja, którą mogą robić przyuczeni do tego ludzie, ale tematyka zasobów językowych, nad czym pracujemy z innymi zespołami w Polsce. To jest przetwarzanie języka naturalnego – coś, co stało się mocnym elementem polskiej informatyki i informatyki w ogóle. Nasz Zespół
Tworzenie jednak tego typu narzędzi wymaga przede wszystkim dostępności wiarygodnych danych o języku w postaci obszernej grupy tekstów opracowanych lingwistycznie i informatycznie. W Polsce takim zbiorem jest Narodowy Korpus Języka Polskiego powstały kilka lat temu w ramach koordynowanego przez nas projektu.
Narodowy Korpus Języka Polskiego służy i będzie służyć głównie humanistom, jest już podstawą przygotowywanego Wielkiego Słownika Języka Polskiego. Ale jest także bazą dla pracy naszego zespołu, którego specjalnością jest systematyzowanie zasobów internetowych oraz ich udostępnianie użytkownikowi. IPI PAN buduje w związku z tym wyszukiwarkę internetową, która ma zgromadzić zasoby całego polskiego Internetu.
- Taki polski Google?
- Unikamy porównywania z Google, bo nie jesteśmy w stanie takiego giganta stworzyć. Ale możemy zrobić wyszukiwarkę rodzimą, zawierającą ok. miliard dokumentów. Jej stworzenie podyktowane jest naszą odmiennością kulturową, a co za tym idzie – specyfiką języka polskiego. Systematyzacja, jaką się w tej pracy posługujemy polega na automatycznym podziale zasobów internetowych na grupy tematyczne i daje możliwość wyszukiwania kontekstowego – zarówno pojedynczych dokumentów, jak i grup, np. kanałów tematycznych czy serwisów oraz dywersyfikację odpowiedzi wyszukiwarki. Z kolei uzyskanie zróżnicowania odpowiedzi tak, aby użytkownik ujrzał nie tylko najlepsze dokumenty, ale także rozmaitość czy niejednoznaczność tematyczną jest możliwe dzięki zastosowaniu dywersyfikacji. No i uwzględnieniu kontekstu – istotnego, kiedy poszukiwany dokument jest zrozumiały tylko w otoczeniu innych dokumentów.
Tu proszę mi pozwolić na krótką dygresję. Prace nad wyszukiwarką wyrosły po części z naszych niezależnie prowadzonych badań w innych obszarach informatyki – nie tylko inżynierii lingwistycznej, ale komputerowych systemów uczących się, czy heurystycznych metod optymalizacji (szersze badania prowadzimy jeszcze m. in. na polu matematycznych podstaw informatyki, automatycznej weryfikacji poprawności oprogramowania, w tym bezpieczeństwa przesyłania danych, oraz tworzenia nowych technologii dla elektronicznych rynków usług).
- Czy tego rodzaju wyszukiwarki są tworzone w innych krajach?
- Oczywiście, tak. Nie my jesteśmy pionierami w tej dziedzinie, choć w pewnych fragmentach prac badawczych jesteśmy w czołówce światowej. Nasza praca odkrywcza jest w tym fragmencie, który dotyczy analizy semantycznej.
- Stworzenie tej wyszukiwarki to wynik badań podstawowych. Jak będzie wyglądało wdrożenie tego osiągnięcia? I kto to będzie robić?
- Jeśli miałoby być wdrożone jakieś nasze osiągnięcie teoretyczne, nam, naukowcom, potrzebna byłaby pomoc programistów. Taki zespół moglibyśmy stworzyć, gdybyśmy mieli pieniądze. W sprawie wdrożenia tego projektu będziemy dopiero rozmawiać z ministerstwem nauki, gdyż nie do końca są tutaj jasne przepisy prawne. Problem polega na tym, że do stworzenia tej wyszukiwarki użyliśmy pieniędzy publicznych, zatem rozwiązanie jest własnością publiczną. Nie wiadomo, co z tego można komercjalizować. Ten problem jest zresztą obecnie rozważany w Komisji Europejskiej, przy okazji konstruowania kolejnego, po VII PR, programu o nazwie Horizon 2020. Jak pozwolić podmiotom publicznym na współpracę z biznesem? Dzisiaj to, co zrobiliśmy można udostępnić publicznie, ale nie sprzedać. Bo nie ma wątpliwości co do praw autorskich, praw majątkowych, które przechodzą na instytut, są natomiast wątpliwości jak to dalej kierować w stronę wdrożeń? Oczywiście, można sprzedawać licencje, ale to oznacza ograniczenie konkurencyjności firm, które je kupią (sprzedaż licencji jest nielimitowana). Dlatego bez rozwiązania problemu opłacalności korzystania z publicznych pieniędzy zarówno przez podatnika jak i przedsiębiorcę komercjalizacja osiągnięć takiej nauki jak informatyka jest bardzo trudna.
Dziękuję za rozmowę.