Výzkumná infrastruktura LINDAT/CLARIAH-CZ v boji proti SARS-CoV-2 a COVID-19 – rozhovor o nabídce ÚFAL s panem prof. Janem Hajičem
Dnes (26. 3. 2020) se na webu MFF UK objevila zpráva: „Výzkumná infrastruktura LINDAT/CLARIAH-CZ a její hostitelská instituce – Ústav formální a aplikované lingvistiky MFF UK – nabízí svou výpočetní kapacitu pro výzkumné výpočty věnované boji s koronavirem SARS-CoV-2 a nemocí COVID-19 v objemu ~1000 CPU po dobu tří měsíců, počínaje 1. dubnem 2020.“ Zeptali jsme se proto prof. Jana Hajiče, zástupce ředitele ústavu na podrobnosti této akce.
Vaše pracoviště – Ústav formální a aplikované lingvistiky MFF UK – bychom asi prvoplánově nezařadili mezi pracoviště, které se budou podílet na „boji proti SARS-CoV-2 a COVID-19“. Jak vlastně vznikla myšlenka na pomoc výzkumné komunitě touto formou?
JH: Vznikla nám volná kapacita díky menšímu objemu výpočtu – odložily se konference, běžného zpracování dat je přeci jen méně. Než jsme stihli vymyslet, co s tím můžeme dělat sami, přišla výzva od ESFRI (European Strategy Forum on Research Infrastructures), aby se výzkumné infrastruktury nějak do boje s COVID-19 zapojily. Ačkoliv tedy výpočetní kapacitu, které samozřejmě nemáme tolik, jako třeba CESNET a IT4Innovations, normálně nezahrnujeme do našich služeb, rychlou reakcí našeho IT oddělení se pdařilo vytvořit bezpečný a oddělený výpočetní cluster, který můžeme poskytnout externě.
Pokud můžete, prozraďte nám, zda se už objevili nějací zájemci, kteří by chtěli této nabídky využít?
JH: Výzva byla zveřejněna dnes, některými kanály (Twitter, web UK) doslova před několika minutami, tak ještě zájemce nemáme…
Očekáváte větší zájem z ČR, nebo od zahraničních výzkumných týmů?
JH: To opravdu netušíme. Spíše asi ze zahraničí, odkud chodí i požadavky na propůjčení kapacity domácích PC pro výpočty při hledání léků a vakcín na COVID-19.
Jaký typ úloh se podle Vás na infrastruktuře bude řešit? Očekáváte spíš „NLP-laděné úlohy“ (např. analýzu textů ze sociálních sítí), nebo třeba chemo- a bioinformatické úlohy?
JH: To je také nejasné. 1000 CPU je na jednu stranu kapka v moři, ale při 24h provozu by za ty tři měsíce bylo možno leccos „upočítat“ v jakémkoli oboru. S těmi NLP službami uvidíme – už jsme mívali i několik miliónů volání našich API za den i z doby před koronavirem. Takové množství technicky opět uneseme, i kdyby bylo požadavků hodně. Aspoň naši robustnost otestujeme.
Co budete považovat za úspěch takovéto akce?
JH: Pokud by byla z té tisícovky CPU alespoň polovina skutečně tři měsíce plně využita.
Ještě praktická otázka: jaké jsou podmínky pro využití této nabídky a co mají zájemci z řad výzkumníků udělat, chtějí-li této nabídky využít?
JH: Pokud chtějí použít NLP nástroje, nemusí žádat o nic, seznam a dokumentace ke každému nástroji je na https://lindat.mff.cuni.cz/en/services. A prostě je mohou používat. Pokud narazí na kapacitní limity, můžeme se pokusit je řešit zvýšením kapacity i nad rámec těch 100 CPU, ale počkáme na zájem.
Pokud by chtěli využít přímo výpočetní cluster, je potřeba napsat email, abychom jim založili externí účet a přidělili prostředky. Veškeré informace jsou na https://covid.ufal.mff.cuni.cz.
Děkujeme za rozhovor a za výzkumnou komunitu!
Já také děkuji a všem přeji, aby zůstali v bezpečí a zdraví,
J. Hajič
Za ResearchJobs.cz se ptal Martin Víta