Duomenų dalijimosi kultūra – efektyvesniam mokslui

666

Mokslo pasaulyje pribrendo perversmas – pripažinusi, jog duomenų padėtis yra nusikalstamai bloga ir didžioji jų dalis šiandien yra prarasta dėl aplaidumo, Europos Komisija ketina įsteigti virtualų, internetinį Europos atvirojo mokslo debesį (EAMD), kuris leistų žymiai patogiau pasiekti ir naudotis duomenimis. Šiais veiksmais patvirtintas augantis supratimas, jog didžiausia mokslo vertė yra ne publikacijose, o pačiuose duomenyse – būtent dalijimosi jais kultūra padeda efektyviau kovoti su Zikos virusu ir net gali prisidėti prie teroristų paieškos.

Vytauto Didžiojo universiteto (VDU) Lietuvių kalbos katedros profesorė Rūta Petrauskaitė sako, jog už mokslinę publikaciją ar studento darbą šiandien vertingesni yra jo surinkti duomenys, pavyzdžiai – patys darbai labai greitai sensta, o pavyzdžius gali panaudoti kitas mokslininkas, tęsiantis pradėtus tyrimus. Naujasis debesis yra žingsnis link vieningos skaitmeninės rinkos ir patogesnio dalijimosi mokslo duomenimis, kuris turėtų paspartinti inovacijų kūrimą.

„Pernaudojant duomenis, sutaupomas laikas – pavyzdžiui, Zikos viruso atveju, visi surinko duomenis į vieną vietą ir galėjo labai greitai ieškoti išeičių. NASA atstovai pasakojo, jog jiems atvėrus duomenų prieigą, kelios JAV įmonės pradėjo jais naudotis ir padarė milžinišką pažangą vien todėl, kad nereikėjo eikvoti energijos renkant duomenis savarankiškai. Olandijoje dirbantieji gyvybės mokslų srityje jau apie šešerius metus patys nekuria duomenų, o naudojasi jau sukurtais“, – pasakojo prof. R. Petrauskaitė.

Deja, Lietuvai šioje srityje reikia gerokai pasitempti – šalyje trūksta ne tik dalijimosi kultūros, bet ir apskritai supratimo apie duomenų svarbą. Todėl Lietuvos mokslo taryba rengia naujas sutartis su būsimais projektų vykdytojais, kuriose mokslinių tyrimų metu gautiems duomenims bus skiriamas didelis dėmesys.

2

Jono Petronio nuotrauka

Didžiausios kliūtys – socialinės ir finansinės

Pasak prof. R. Petrauskaitės, kuri neseniai buvo išrinkta bendros kalbos išteklių ir technologijų tinklinės infrastruktūros CLARIN ERIC generalinės asamblėjos prezidente, didžiausios kliūtys, trukdančios Europos atvirojo mokslo debesies sukūrimui, yra ne techninės, o socialinės, susijusios su žmonių mentalitetu ir negebėjimu deramai kaupti, aprašyti duomenų. Trūksta ir susikalbėjimo – duomenis gamina mokslininkai, tačiau apdoroja ir analizuoja ne jie patys, o specialiai parengti ekspertai (angl. infrapeople).

„Atskirtis tarp mokslininkų ir duomenų tvarkytojų yra beveik bedugnė – pastariesiems reikia, kad mokslininkai pasakytų, ką kaupti, o ko ne. Galutinėje stadijoje paaiškėja, kad sutarimo nėra. O kaupimas susijęs su išlaidomis – didelis serverių tinklas, 24 val. per parą palaikantis galimybę naudotis duomenimis, sunaudoja maždaug tiek pat elektros energijos, kiek ir Frankfurto oro uostas“, – praktinę susitarimo būtinybę iliustravo kalbininkė.

Dar vienas opus klausimas – intelektinės teisės ir asmeniniai duomenys. Europos mokslo politikos institucijos, iš esmės palaikydamos atvirąją prieigą prie duomenų, itin rūpinasi jų apsauga. „Štai Europos mokslo tarybos politika – persergėjimai, kodavimai, vos ne viską užrakinti ir raktą išmesti į jūrą, nes dabar iš duomenynų galima išgauti rūpimą informaciją apie norimą asmenį. Kita vertus, tai labai paveiku kovojant su terorizmu, nes apie teroristus irgi galima išsitraukti duomenis“, – privatumo situacijos dvilypumą atskleidė mokslininkė.

Žinoma, pirmiausia duomenų tvarkymui ir ilgalaikiam palaikymui reikalinga parama – tačiau reikia apsispręsti, koks finansavimo modelis yra tinkamiausias. Vienas iš siūlomų variantų yra įšaldyti 5 procentus projektinių lėšų specialiai duomenų reikmėms; kitas, naudojamas JAV – nedidelis mokestis, kurį sumokėję vartotojai gali naudoti  duomenis – ne tik išgauti juose esančią informaciją, bet ir juos kopijuoti, perdirbti, platinti; kitaip tariant, duomenų palaikymą nulemia paklausa. Jei jos nėra – duomenys nefinansuojami.

laptop-819285_1280

Duomenų rengėjai – perspektyvi specialybė

Visi Europos atvirojo mokslo debesiui reikalingi atskiri komponentai jau yra – serveriai, suskaitmeninta tyrimų medžiaga, duomenų infrastruktūros. Tačiau norint deramai viską sudėti į vieną tvarkingą virtualią visumą, reikės pirmiausia skatinti sąmoningumą, kad duomenys turi būti tvarūs – jie turi būti randami, pasiekiami, sąveikauti su kitais duomenimis ir būti pakartotinai naudojami. Tokie yra vadinamieji teisingumo (angl. FAIR) principai, kurių reikėtų laikytis kaupiant duomenis.

Pasak prof. R. Petrauskaitės, Lietuvos mokslo taryba jau suskubo priderinti atvirojo mokslo politiką prie ES reikalavimų – patvirtino atvirosios prieigos gaires, kuriose pažymima, kad duomenys turi būti saugomi, palaikomi ir, laikantis tam tikrų reikalavimų, atveriami. Universitetai, laikydamiesi tokios politikos, duoda apčiuopiamai didesnę naudą valstybei – atsakingai kaupdami ir atverdami savo duomenis, jie gali net 20 kartų padidinti savo įtaką šalies ekonomikai.

Tačiau viena esminių problemų yra ta, jog trūksta specialiai parengtų specialistų, kurie tų principų laikytųsi ir kompetentingai dirbtų su duomenimis – per artimiausią dešimtmetį Europos Sąjungoje reikės apie 0,5 mln. tokių žmonių, todėl verta pagalvoti apie šiai sričiai skirtų studijų organizavimą.

„Vytauto Didžiojo universitetas galėtų prisidėti prie duomenų ir infrastruktūrų valdymo ekspertų rengimo. Dalyvaujame CLARIN ir kituose projektuose, kurie galėtų būti gera duomenų tvarkymo mokykla“, – sako CLARIN ERIC generalinės asamblėjos prezidentė R. Petrauskaitė. CLARIN ERIC – tai viena didžiausių mokslinių tyrimų infrastruktūrų, leidžianti mokslininkams lengvai pasiekti įvairaus pobūdžio skaitmeninius tekstynus, archyvus, kalbos duomenų bankus.

Pasak profesorės, kuri yra sukaupusi didelę patirtį tarpininkaudama, dirbdama su panašiomis mokslinių tyrimų infrastruktūromis, Europos atvirojo mokslo debesies sukūrimas turėtų tapti vienu iš prioritetinių Europos Komisijos darbų; tai padaryti komisijai rekomendavo ir aukšto lygio ekspertų grupė. „Vienas nežinomas autorius pasakė itin taikliai – geriausią būdą, kaip panaudoti tavo duomenis, sugalvos kažkas kitas. Būtent todėl ir verta jais dalintis“.

Parašykite komentarą

El. pašto adresas nebus skelbiamas.

This site uses Akismet to reduce spam. Learn how your comment data is processed.