. . Leszek Zych / Polityka
Człowiek

Żaneta Świderska-Chadaj: Uczę algorytmy wykrywać nowotwory

O sensie życiowych niepowodzeń i walorach głębokich sieci neuronowych rozmawialiśmy z dr hab. inż. Żanetą Świderską-Chadaj, laureatką Nagrody Naukowej POLITYKI w kategorii Nauki techniczne.

Choć dr hab. inż. Żaneta Świderska-Chadaj została wyróżniona za talent w programowaniu algorytmów i projektowaniu sztucznych sieci neuronowych, nie była cudownym dzieckiem piszącym w języku C++. Owszem, grała w „Simsy” i korzystała z prehistorycznego komunikatora internetowego Gadu-Gadu. – Ale z programowaniem zetknęłam się dopiero na studiach. I byłam zaskoczona jego prostotą: zestaw logicznych zdań, które sprawiają, że maszyna wykonuje nasze polecenia. Pewnie nie dowiedziałabym się tego, gdyby nie to, że nie dostałam się na medycynę.

Żal po karierze lekarza kurowała Świderska-Chadaj na studiach pokrewnych – z inżynierii biomedycznej. Na tyle skutecznie, że z czasem porzuciła myśl o pierwotnych planach. Przetwarzała i interpretowała dane: sygnały EKG oraz obrazy z rezonansu magnetycznego i z tomografii komputerowej. Widziała człowieka, ale nie wprost, tylko przez pryzmat nieoczywistych przejawów aktywności jego organizmu. – I przy tej okazji odkryłam, że znacznie łatwiej niż wkuwać anatomię przychodzi mi uczyć się zjawisk poddających się logice. Zostałam więc na studiach politechnicznych.

Tam też zetknęła się z sieciami neuronowymi, których wszechstronność ujęła ją na tyle, że poświęciła im pracę doktorską. Zastosowała je do wyszukiwania zmian nowotworowych w obrazach tkanki mózgu. Sieci takie są bytami programistycznymi – zbiorami algorytmów projektowanych na wzór biologicznych. Klasyczne zbudowane są z kilku warstw sztucznych neuronów, wystarczających do przetwarzania sygnału lub danych obrazowych. – Ale są też sieci nowsze, zwane głębokimi, o znacznie większej liczbie warstw i parametrów.

Szukanie inspiracji

Sieci same w sobie są tabula rasa. Zadań, które mają wykonywać – na przykład rozpoznawania obrazów – trzeba je nauczyć. – Żeby np. wyszkolić je do odróżniania kotów od psów, musimy je „nakarmić” możliwie wieloma opatrzonymi stosownymi etykietami zdjęciami tych zwierząt. Im więcej danych, tym większa łatwość sieci w generalizowaniu informacji. Ale też nie należy sieci przetrenowywać. – W pewnym momencie nawet ona może się przeuczyć i stracić umiejętność uogólniania. A to umiejętność niezwykle istotna, bo zapewnia możliwość klasyfikacji danych, których sieć nigdy nie widziała.

Zdjęcia kotów i psów zdobyć łatwo, to z nich przecież składa się internet. Nieporównanie trudniej o obrazy zmian nowotworowych. Liczba pacjentów jest ograniczona. Z tym wyzwaniem dr Świderska-Chadaj (i nie tylko ona) radzi sobie na dwa sposoby. Po pierwsze, sztucznie zwiększa ilość danych. Przekształca nieznacznie (obracając, rozjaśniając, zaszumiając) dostępne obrazy – dla sieci obrócona o 10 stopni ludzka komórka to zupełnie nowy materiał dydaktyczny. Po drugie, używa sieci pretrenowanych, czyli takich, które posiadają już pewne wstępne umiejętności rozpoznawania obrazów. – Douczamy wtedy tylko niektóre, głębsze, warstwy. Wykorzystujemy to, co sieć już wie. W pewien sposób naśladujemy ludzki proces uczenia się, rozszerzania wiedzy, którą już mamy.

Konstruując takie algorytmy, trzeba szukać kompromisu. Im bowiem są bardziej skomplikowane, tym większym są obliczeniowym wyzwaniem dla komputerów. – Początkowo dodawano warstwy bez opamiętania. Z czasem zaczęto jednak stosować inne rozwiązania – choćby usuwać niektóre połączenia między neuronami. Zresztą spójrzmy na nasze mózgi. Z przyrostem wiedzy nie rosną nam głowy.

Wspomaganie patologów

– Sztuczna inteligencja to pojęcie bardzo medialne, ale w samej idei nie ma niczego szczególnie nowego – przypomina Świderska-Chadaj. Rozwija się ją od ponad 60 lat. Dużym ograniczeniem były niewystarczające zasoby obliczeniowe, czyli mówiąc prościej: słabe komputery. Na przykład przełomowe prace Yanna LeCuna z lat 80. zostały w praktyce wykorzystane dopiero niedawno. Gigantyczny skok wyznaczyła AlexNet, która w 2012 r. w klasyfikowaniu rozmaitych obrazów przebiła konkurencję o niespotykane w branży 10 proc. – To był początek dynamicznego rozwoju głębokich sieci neuronowych.

Początkowo badacze spoza terytorium nauk komputerowych podchodzili do tego wynalazku z pewną nieufnością. Nazywano je black boxami – czarnymi skrzynkami, w których wnętrzu zachodzą procesy niepoznawalne nawet dla ich twórców. – To było błędne przekonanie. Mamy metody pozwalające na wyjaśnianie, co dzieje się w środku. W przypadku rozpoznawania kotów nie ma to większego znaczenia. Ale kiedy pracujemy z danymi medycznymi, musimy przecież wyjaśnić lekarzom, co właściwie widzi nasza sieć, na jakiej podstawie przypisuje dane do określonej klasy.

Nowe metody analizy wesprą medyków w ich codziennej pracy. – Liczba ekspertów jest niewystarczająca. Ich wykształcenie kosztuje i trwa. Patomorfolog musi skończyć medycynę, odbyć staż, specjalizację. Tymczasem potrzeby starzejących się społeczeństw rosną. Im jesteśmy starsi, tym więcej chorób nas dotyka. A to oznacza więcej preparatów do oceny. Zajęcie to jest trudne i obarczone ryzykiem subiektywności. Trafność zależy choćby od tego, czy ekspert wydaje swe sądy rano czy wieczorem, kiedy jest już zmęczony.

Głębokie sieci stanowią kluczowy element cyfrowej patologii (digital pathology), nowej dziedziny diagnostyki medycznej. Próbka tkanki pobierana jest podczas biopsji lub resekcji, barwiona, układana na szkiełku, fotografowana przez specjalne skanery sprzężone z mikroskopami (jeden plik to kilka gigabajtów danych) i umieszczana w bazie danych, z której korzystać można z dowolnego miejsca na świecie. – W Polsce tego typu skanerów jeszcze się nie stosuje w standardowej diagnostyce, ale w Holandii czy USA już tak. I wszędzie opracowuje się już algorytmy wspomagające – choć na razie głównie jako projekty naukowe, dalekie od wdrożenia klinicznego. Co ważne, sieci będą tylko pomagały patologom, wskazywały podejrzane zmiany, nie zastępowały – podkreśla Świderska-Chadaj. – Nie będzie nas diagnozował komputer.

Zliczanie limfocytów

W sieciach tegorocznej laureatki nie ma niczego magicznego. Nie są nawet uniwersalne. – Jeżeli nauczymy je odróżniać psy i koty, to węża zaklasyfikuje jako jedno z tych zwierząt. Analogicznie jest z nowotworami, tylko nieporównanie gorzej, bo ich różnorodność biologiczna jest olbrzymia. Konieczna jest specjalizacja. Dr Świderska-Chadaj zajmuje się projektowaniem sieci wspierających diagnostykę histopatologiczną.

We współpracy z badaczami ze Stanów Zjednoczonych opracowała niedawno algorytm wykrywający i klasyfikujący podtypy gruczolakoraka, nowotworu płuc. To zajęcie złożone i czasochłonne. Przebiega według podobnego schematu: pierwszy algorytm zwykle nie działa; nie działa też drugi; badacze zmieniają więc parametry, prowadzą kolejne eksperymenty, a później porównują wyniki sugerowane przez sieć z opiniami lekarzy. Dzięki temu można określić trafność wskazań sieci i zestawić z trafnością innych, konkurencyjnych algorytmów.

Niektórzy eksperci współpracują chętniej, inni mniej. – To sprawa w dużej mierze pokoleniowa. Algorytmom skłonniejsi są też zaufać radiolodzy na co dzień pracujący z obrazami z tomografii i rezonansu magnetycznego. Bo są one przecież pewnego rodzaju rekonstrukcją. Ale nastawienie do systemów wspomagających diagnostykę zmienia się na lepsze.

Analiza obrazu może się odbywać też na – nomen omen – głębszym poziomie. Dr Świderska-Chadaj zajmowała się tym podczas stażu podoktorskiego w znakomitym holenderskim Radboud University Medical Center. Jej grupa stworzyła algorytmy rozpoznające i zliczające limfocyty widoczne w skanie histopatologicznym. Taka analiza może pomóc w ocenie skuteczności terapii, w orzekaniu, czy przeszczepiony organ został przez organizm przyjęty czy odrzucony. – Ręczne szacowanie ich liczby byłoby trudne. Bo jak zliczyć 75 tys. komórek układu odpornościowego? A chcąc poznać dynamikę procesów w organizmie, należałoby tę czynność powtarzać.

Głębokie sieci pomagają też szukać czynników prognostycznych i zjawisk niedostrzegalnych ludzkim okiem. Można dzięki nim badać przebieg subtelnych procesów i rozstrzygać, czy między rozmaitymi parametrami zachodzą tylko koincydencje, czy może związki przyczynowo-skutkowe. – To niesamowite, że jesteśmy tu i teraz, kiedy ta dziedzina badań tak gwałtownie się rozwija – mówi Świderska-Chadaj, szczęśliwie niedoszła doktor nauk medycznych.

Ta strona do poprawnego działania wymaga włączenia mechanizmu "ciasteczek" w przeglądarce.

Powrót na stronę główną