Jana Albrechtová: AI šetří čas na činnosti, v nichž vás algoritmy nenahradí

Co má společného detekce prasklin na vozovce a analýza ptačích spermií? A jak s tím může pomoct umělá inteligence? Proč je problém, že pěvci mají různě velké spermie? Na to odpovídá v rozhovoru Jana Albrechtová, zooložka z Ústavu biologie obratlovců AV ČR, která do svého výzkumu reprodukce ptáků zapojila umělou inteligenci. 

Proč jsou spermie ptáků tak dobrým „oknem“ do reprodukční biologie?

Studium variability spermií ptáků, v našem případě pěvců, je cenné zejména proto, že odráží širokou škálu reprodukčních strategií mezi druhy. Zjednodušeně lze říci, že z délky a poměrů jednotlivých částí spermií lze odhadnout míru kompetice spermií (promiskuity), a tím i genetické polygamie druhu – i u druhů, které se navenek jeví jako monogamní.

Co vás lákalo na začlenění AI a strojového učení do vašeho výzkumu? Měli jste ve skupině už dříve zkušenosti s podobnými projekty?

Největším lákadlem byla možnost automatizovat měření spermií, které je při manuálním postupu extrémně časově náročné. Před zapojením do programu AI ve vědě a výzkumu v rámci Strategie AV21 jsme v naší skupině žádné AI projekty neřešili. Díky této zkušenosti ale nyní s kolegy plánujeme spolupráce na nových tématech.

Významná část aktivity se točí kolem anotací mikroskopických snímků. Jak byste laikovi vysvětlila, co znamená „správná anotace“? Proč je to pro kvalitu modelu často důležitější než třeba architektura neuronové sítě, která pak snímky bude zpracovávat?

Správnou anotaci (tzv. ground-truth) si lze ukázat na segmentaci buněk: jde o data, kde odborníci přesně vyznačili to, co hledáme. Aby byla anotace opravdu správná, musí se na ní shodnout více expertů. Čím více takto ověřených dat máme, tím lépe model funguje. Můžeme mít sebelepší architekturu, pokud jí ale budeme podsouvat k učení špatná data, nemůžeme čekat, že bude dávat dobré výsledky. Je to stejné jako s malými dětmi – když jim budeme při učení označovat věci špatnými názvy, také v tom budou mít zmatek. Pokud je model dostatečně robustní a chyb v anotacích není mnoho, dokáže tyto věci potlačit. Nicméně správná data jsou opravdový základ strojového učení.

Jak poznáte, že je model dostatečně spolehlivý pro rutinní použití ve výzkumu?

Vše stojí a padá na datech. Jen na dostatečně velké ground-truth sadě můžeme něco porovnávat. Samozřejmě je také potřeba vždy nástroj kontrolovat a mít možnost výsledky ručně korigovat, pokud bychom s výsledky nebyli spokojeni. Takto upravená data mohou zpětně posloužit k doučení modelu.

Jak bude vypadat ideální workflow, až bude nástroj finálně vyvinutý? Počítáte s plně automatickým režimem, nebo bude člověk stále součástí kontroly dat (human-in-the loop)?

Nejoptimističtější variantou je samozřejmě co nejvíce automatický režim. Zároveň ale počítáme s možností manuální kontroly a vyřazení chybně detekovaných či změřených spermií nebo jejich jednotlivých částí. Lidský dohled tak zůstane důležitou pojistkou kvality dat.

Narazili jste při této mezioborové spolupráci mezi zoology a experty na strojové učení na nějaká nedorozumění? Něco, co se vám „ztratilo v překladu“? 

Protože pracujeme s obrazovou dokumentací, se kterou mají kolegové z Ústavu teorie informace a automatizace AV ČR bohaté zkušenosti, byla spolupráce od začátku poměrně hladká. Zpočátku jsme řešili drobné technické problémy, například stíny kolem spermií vznikající při snímání fázovým kontrastem, což se podařilo vyřešit úpravou nastavení mikroskopu. 

Změnila tato spolupráce váš pohled na data?

Kolegové z oblasti strojového učení se museli vyrovnat s mimořádně vysokou variabilitou velikosti spermií napříč druhy pěvců, což algoritmům práci rozhodně neusnadňuje. Nás jako evoluční biology naopak baví kreativní přístup týmu strojového učení, například využití algoritmu původně určeného k detekci prasklin na vozovce pro analýzu ptačích spermií. Spolupráce nás přiměla přemýšlet o datech mnohem systematičtěji a explicitněji.

Co má společného detekce prasklin na vozovce a analýza ptačích spermií? Odpovídá Adam Novozámský z Ústavu teorie informace a automatizace AV ČR

V obou případech se využívají konvoluční neuronové sítě. Přesněji, jedná se o upravenou konvoluční neuronovou síť, jejíž hlavní předností je schopnost pracovat v několika úrovních rozlišení současně. Zatímco základní vrstvy sítě sledují jemné detaily a textury, hlubší vrstvy se zaměřují na celkový tvar a strukturu objektu. Tato hierarchická analýza umožňuje algoritmu spolehlivě identifikovat spermie i v obrazu s výrazným šumem nebo nečistotami, které by jinak mohly být zaměněny za zkoumaný objekt. Celý proces je navíc doplněn o metodu řízeného filtrování, která digitálně zpřesňuje hranice a zajišťuje, že výsledná segmentace přesně kopíruje skutečný obrys spermie. 

Ukazuje se, že AI v zoologii není jen nástroj pro jednorázové experimenty, ale spíše nová výzkumná infrastruktura. Co podle vás musí výzkum v Česku udělat, aby takové nástroje nezůstaly izolované v jednotlivých projektech?

Zásadní je publikování jak samotných aplikací, tak dat získaných pomocí AI v kvalitních mezinárodních vědeckých časopisech. Neméně důležité je, aby tyto nástroje byly následně dostupné i dalším výzkumným týmům či institucím a mohly se stát sdílenou infrastrukturou, nikoli uzavřeným řešením jednoho projektu. 

Vzniká dataset i nástroj s potenciálem přesahu jedné výzkumné skupiny. Jak důležité je podle vás v AI projektech myslet od začátku na sdílení dat, modelů a know-how? A co tomu dnes nejvíc brání?

Na sdílení dat by se mělo myslet už od samotného začátku projektu. Nemyslím si, že by existovala jedna zásadní bariéra, většinou záleží na přístupu a vzájemné domluvě týmů, které na datasetu a nástroji pracují. My jsme se dohodli, že pokud to bude technicky možné, bude po publikaci aplikace i dat nástroj k dispozici dalším výzkumným skupinám, které naši práci budou citovat. 

Když byste se podívala do budoucnosti, co byste ráda viděla jako výsledek vaší práce? Publikaci, nástroj v rutinním provozu, nebo rozšíření metodiky na další obratlovce?

Pro mě i celý tým je klíčovým cílem publikace v prestižním vědeckém časopise, protože to je výstup nejdůležitější jak pro instituci, tak pro naši vědeckou kariéru. To zároveň předpokládá, že aplikace bude funkční a použitelná v rutinním provozu. Rozšíření metodiky na další obratlovce je velmi lákavé, ale v tuto chvíli se soustředíme především na vytvoření robustní metodiky pro spermie ptáků. Teprve poté uvidíme, zda budou kapacity a zdroje na další rozšíření.

Co byste na závěr poradila biologům, kteří mají obrazová data, ale váhají, zda má smysl pouštět se do spolupráce s AI?

Pokud existuje šance, že vám spolupráce s AI ušetří čas, který můžete věnovat jiné vědecké činnosti, v níž vás algoritmy nenahradí (například terénnímu výzkumu nebo laboratorní práci), pak bych neváhala. Vývoj AI nástroje sice vyžaduje čas, finance a trpělivost, ale pokud se podaří eliminovat rutinní a často velmi únavnou práci, dlouhodobě se tato investice jednoznačně vyplatí.

Převzato z webu Vědavýzkum.cz.

Autor: Martin Víta

Zdroj: Ústav informatiky AV ČR

Rozhovor vyšel v rámci copywritingové spolupráce s programem AI: Umělá inteligence pro vědu a společnost Strategie AV21. 


Jana Albrechtová působí na Ústavu biologie obratlovců AV ČR. Spolu s kolegy z Ústavu teorie informace a automatizace AV ČR s Adamem Novozámským a Soňou Nesnídalovou se podílí na řešení jedné z mnoha aktivit programu AI: Umělá inteligence pro vědu a společnost. Jde o aktivitu Fertilita, sexuální promiskuita, reprodukční zdraví: AI jako nástroj pro studium morfologie a kvality spermií u ptáků (a dalších obratlovců). Program je realizován v rámci Strategie AV21.

https://cheersport.at/doc/pkv-games/https://cheersport.at/doc/bandarqq/https://cheersport.at/doc/dominoqq/https://cheersport.at/doc/about-us/
https://middlepassage.dei.uc.pt/https://dm.dei.uc.pt/https://cmd.dei.uc.pt/
https://www.gastroenterologyandhepatology.net/supplements-general/https://www.riifo.com/
https://discurso.userena.cl/https://umd.userena.cl/
https://merdekakreasi.co.id/buku/pkvgames/https://merdekakreasi.co.id/buku/bandarqq/https://merdekakreasi.co.id/buku/dominoqq/
https://ppg.fkip.unisri.ac.id/https://fkip.unisri.ac.id/https://map.fisip.unisri.ac.id/https://hi.fisip.unisri.ac.id/https://fh.unisri.ac.id/https://an.fisip.unisri.ac.id/https://fisip.unisri.ac.id/
https://vokasi.unbrah.ac.id/https://ebooks.uinsyahada.ac.id/
https://maksi.feb.upr.ac.id/https://fkip.upr.ac.id/
slot gacor