Nie Pan pierwszy otrzymał Nagrodę FNP za prace dotyczące modelowania matematycznego i badań operacyjnych. Skąd takie znaczenie tej dziedziny badań?
– Modelowanie procesów i zjawisk jest podstawowym działaniem nauki. Żeby zjawiska badać, trzeba to robić na jakimś modelu.
Dlaczego mamy badać model, a nie rzeczywistość?
– Rzeczywistość jest zbyt bogata i różnorodna. „Kawałek” rzeczywistości, który nas interesuje, trzeba wyciąć z kontekstu i opisać jakimś formalnym językiem. Ponieważ jest to działanie bardzo podstawowe, może być stosowane w wielu dziedzinach badań, od socjologii po biologię molekularną i fizykę wysokich energii. Od modelu przechodzi się często do symulacji...
Czym różni się symulacja od modelowania, a jaką rolę pełnią badania operacyjne?
– Symulacja jest metodą badania procesów, zwykle przebiegających w czasie, na podstawie obserwacji działania programów komputerowych symulujących te procesy. Modelowanie natomiast niekoniecznie wiąże się z implementacją komputerową. Badania operacyjne koncentrują się z kolei na systemach, które składają się z operacji. Komplikacja polega na tym, że operacje są powiązane za pomocą ograniczeń kolejnościowych i konkurują o ograniczone zasoby. Problem decyzyjny polega tu na znalezieniu optymalnego programu wykonania tych operacji przy zadanych ograniczeniach. Charakterystyczne dla badań operacyjnych jest modelowanie problemów decyzyjnych jako zadań programowania matematycznego. Powstanie badań operacyjnych zbiegło się zresztą w czasie z opracowaniem metody rozwiązania zadania programowania liniowego. Za to odkrycie Leonid Kantorowicz dostał Nagrodę Nobla. Z innej strony do rozwiązywania często tych samych problemów decyzyjnych podchodzi sztuczna inteligencja. Różnica polega na tym, że w badaniach operacyjnych model problemu decyzyjnego jest zwykle zadaniem programowania matematycznego, a w sztucznej inteligencji model jest natury logicznej.
Czy to znaczy, że bez modelu nie można rozwiązać problemu?
– Tak, a dokładniej – rozwiązywanie problemów decyzyjnych odbywa się w trójkącie: problem – model – metoda.
Będąc informatykiem, rozwiązuje Pan problemy decyzyjne z odległych dziedzin, między innymi z medycyny. Czy uczony musi być informatykiem, aby wejść na pewien poziom rozwiązywania problemów, czy też informatyk musi być po części biologiem, fizykiem czy mechanikiem?
– Będzie truizmem, gdy powiem, że interdyscyplinarność jest nie do uniknięcia. Do jakiego stopnia uczony musi być informatykiem? Jeśli do rozwiązania problemu stosuje znane narzędzia informatyczne, to lepiej, żeby był specjalistą w swojej dziedzinie. Wtedy jest to typowe zastosowanie informatyki. Jeśli jednak do rozwiązania problemu dochodzi się przez stworzenie nowego paradygmatu przetwarzania informacji, to prym wiodą kompetencje informatyka. Rozwijając metodykę wspomagania decyzji w oparciu o niepełną wiedzę, opracowałem nowe procedury przetwarzania informacji, uwzględniające ich niedoskonałości i semantykę decyzyjną. Dopiero później zastosowałem komputer do implementacji tej metodyki.
Musiał się Pan uczyć medycyny czy wystarczyła współpraca z lekarzami?
– Niewątpliwie wystarczy współpraca, jeśli interakcja jest dostatecznie bogata. Najważniejsze jest wspólne dojście do sformułowania problemu badawczego. Ten problem jest dla informatyka wycięty z całej rzeczywistości medycznej. Lekarz przedstawia go w kategoriach zrozumiałych dla informatyka i w zakresie niezbędnym do współpracy.
Czy problem musi być sformułowany w sposób uproszczony?
– Tak. Model nie jest rzeczywistością, tak jak mapa nie jest terenem. Zawsze pomijamy jakieś szczegóły.
Kto ocenia, które rzeczy są ważne?
– Lekarz ocenia, co jest ważne, a informatyk, co jest możliwe do wzięcia pod uwagę z informatycznego punktu widzenia. Na przykład interpretacja wyników pomiarów: inżynier chciałby robić to z dokładnością, na jaką pozwala aparatura, lekarz będzie przekładał wyniki pomiarów na określenia jakościowe, które stosuje w swoim wnioskowaniu, na przykład temperatura normalna, podwyższona, wysoka.
W modelu nie mamy wszystkich danych, ale to nie jest równoważne z niepełną wiedzą. Bowiem w modelu to my decydujemy, które dane uwzględniamy, świadomie odrzucając pewne informacje. Natomiast Panu chodzi, jak rozumiem, o fakt, że trudno jest osiągnąć pełną wiedzę na temat zjawisk, wydarzeń, a decyzję związaną z nimi jednak musimy podjąć.
– Dokładnie tak. Chodzi o niepełną wiedzę. Dane to wszystko, co możemy komputerowi „powrzucać”, a wiedza to wyinterpretowane związki, które w tych danych istnieją.
Czy możemy powiedzieć, że to jest rozumienie danych?
– To jest krok do rozumienia danych. Trzeba te związki pokazać komuś, kto je zrozumie lub nie. To jest wiedza komputerowa, która dopiero pretenduje do zrozumienia.
Mówiąc krótko, komputer nie zastąpi człowieka ani sztuczna inteligencja nie zastąpi naturalnej?
– Nie. Dzięki sztucznej inteligencji, maszyna może wyindukować z danych reguły decyzyjne, jednak, na przykład w przypadku medycyny, dopiero po zrozumieniu i akceptacji tych reguł przez lekarza reguły te mogą pretendować do miana wiedzy i prowadzić do interesującego, potwierdzającego intuicję odkrycia.
Pamiętamy książki popularnonaukowe sprzed trzydziestu lat, stawiające tezę, że sztuczna inteligencja zastąpi naturalną.
– To bardzo spektakularne, na przykład książka Čapka o buncie robotów. Wyobraźnia może sobie pozwolić na taką projekcję, ale fakty są inne. Na gruncie matematyczno-logicznym Kurt Gödel udowodnił, że z określonego układu aksjomatów, czyli z tego, od czego zawsze zaczyna maszyna, nie można udowodnić każdego prawdziwego twierdzenia arytmetyki. Matematyk ma zdolność zmiany aksjomatów i dostosowania ich do twierdzenia, które ma udowodnić, a maszyna sama tego nie zrobi. Dlatego nie wierzę w wizję myślących maszyn. Jednak niewątpliwie maszyny w coraz większym stopniu będą wyręczały człowieka w wykonywaniu pewnych intelektualnych czynności, bo są sprawniejsze obliczeniowo, bardziej pojemne pamięciowo, nie męczą się, nie mają złych dni itd. W związku z tym potrafią wykonywać prace, które przerastają człowieka swoim ogromem i uciążliwością.
W jaki sposób Pana badania pozwoliły wspomóc czy zastąpić pracę lekarzy w Kanadzie?
– System, który opracowaliśmy, pozwala wspomagać, ale nie zastąpi pracy lekarza. W szpitalu w Ottawie, z którym współpracujemy, w izbie przyjęć nie dyżuruje specjalista chirurg, lecz stażyści, interniści, a nawet wykwalifikowane pielęgniarki. Chirurg jest pod telefonem. Tymczasem trzeba ocenić, czy konkretnemu małemu pacjentowi chirurg jest potrzebny. To nie jest takie proste. Trafność decyzji, czy przywołać chirurga, czy skierować na obserwację, czy też odesłać do domu, jest rzędu sześćdziesięciu procent. Czyli często się zdarza, że do domu odsyła się kogoś bardzo chorego, a chirurga wzywa się do banalnego zatrucia pokarmowego.
Taka dokładność jest czy była?
– Była. Chodziło właśnie o to, aby trafność decyzji podejmowanych przez niespecjalistów poprawić. Zaistniało pytanie, czy można stworzyć narzędzie, które analizowałoby postępowanie dobrego specjalisty i na tej podstawie potrafiło wyciągnąć istotne wnioski, które można by włożyć do komputera i wywoływać w razie potrzeby. Lekarze specjaliści dostarczyli nam sześćset różnych przypadków diagnozowania bólów brzucha u dzieci. Stosując nowatorską metodykę, odkryliśmy istotne związki między obrazem chorego a zaklasyfikowaniem go do jednej z trzech decyzji. Odkryliśmy też, które z badań są istotne dla podjęcia właściwej decyzji oraz wygenerowaliśmy reguły decyzyjne, które można było zaprogramować w małych naręcznych komputerach – palmtopach. To znacznie podwyższyło trafność rozpoznania. Przeprowadziliśmy półroczny test, który pozwolił ocenić praktyczną przydatność systemu. W tym czasie rozpoznano następnych czterysta przypadków. Okazało się, że decyzje podpowiadane przez system są o kilkanaście procent trafniejsze od decyzji podejmowanych przez lekarzy niespecjalistów.
Jak doszło do współpracy polskiego informatyka z kanadyjskimi lekarzami?
– To pokazuje, jak bardzo potrzebne są międzynarodowe konferencje. Prezentowałem metodykę wspomagania decyzji na podstawie niepełnej wiedzy na różnych konferencjach. Na jednej z nich spotkałem profesora Wojtka Michałowskiego, który pracuje w Uniwersytecie w Ottawie. Jest on dyrektorem podyplomowego studium zarządzania w służbie zdrowia. Miał dzięki temu kontakt z lekarzami z pediatrycznego szpitala akademickiego, którzy przedstawili mu sytuację opisaną wcześniej.
Czy teraz ten system będzie mógł zostać zastosowany powszechnie?
– Nie od razu, bo ten system jest skrojony na tamte warunki. Przeniesienie go w inne warunki, na przykład do Polski, dla lekarzy rodzinnych, wymagałoby adaptacji. Jego sukces pozwala nam jednak propagować to rozwiązanie.
Gdy mówi Pan „opracowaliśmy”, ma Pan na myśli...
– Oprócz profesora Michałowskiego i lekarzy z Ottawy, także mój zespół z politechniki, a zwłaszcza doktora Szymona Wilka, który jest łącznikiem naszych zespołów.
Czy ta metodyka ma także inne zastosowania niż medyczne? Z niepełną wiedzą spotykamy się na każdym kroku.
– Obszarów zastosowań było bardzo dużo, choć niewiele kończyło się takim wdrożeniem, o jakim mówiliśmy. Większość zastosowań miała jedynie na celu sprawdzenie, czy metodyka ta nadaje się do danej dziedziny. Na ciekawy problem natrafiliśmy w Międzynarodowym Instytucie Stosowanej Analizy Systemowej (IIASA) w Austrii, w którym bada się problemy globalne, jak na przykład zmiany klimatyczne czy stan biosfery. Badany był też problem oceny zdrowotności lasów syberyjskich na podstawie zdjęć satelitarnych. To są duże zbiory danych, które były analizowane wcześniej tradycyjnymi metodami statystycznymi. Odbiorcy tych analiz nie byli zadowoleni. Spróbowaliśmy naszej metody.
Czy ona nie ma związku ze statystyką?
– Nie jest to metoda statystyczna. Nie wychodzimy od założeń statystycznych, na przykład założenia o normalności rozkładów wartości cech czy zrównoważeniu klas. Dopuszczamy atrybuty o zmiennych nominalnych i nie traktujemy niespójności danych jak szumu. Do interpretacji wyników możemy natomiast stosować różne miary probabilistyczne. Okazało się, że związki, które odkrywamy w postaci reguł decyzyjnych, są o wiele ciekawsze dla odbiorców. Na tej podstawie utworzono mapy, na których pokazano obszary zdrowe, porażone i zupełnie zdegradowane. Był to zatem także problem klasyfikacji. Proszę zauważyć, że problem klasyfikacji jest podstawowym problemem kognitywistycznym. Niektórzy, jak Bertrand Russell, mówią nawet, że cała wiedza jest klasyfikacją...
Nawiązujemy wciąż do filozofii, a przynajmniej do filozofii nauki...
– Musimy mieć jakieś motywacje, a niewątpliwie filozofowie nauki nam ich dostarczają. Wracając do Russella, wiedza wszystkich żyjących to umiejętność klasyfikowania, czyli dopasowywania wzorca sytuacji do zachowań. Nawet zwierzę, gdy odbierze pewne bodźce, po ich zinterpretowaniu stosuje wzór zachowania, odpowiednią taktykę. Klasyfikacja jest podstawowym problemem kognitywistycznym związanym z podejmowaniem decyzji.
Co ma Pan na myśli, mówiąc: „kognitywistyczny”?
– Poznawczy. Najpierw jest rozpoznanie, a potem zachowanie, które jest spójne z tym rozpoznaniem. Jeżeli mówimy o klasyfikacji, to znaczy, że jest to przydział elementów do zbioru. Dochodzimy do pierwocin, czyli teorii zbiorów. Właśnie ta metodyka, o której mówimy, opiera się na nowej teorii zbiorów, którą zaproponował profesor Zdzisław Pawlak z Warszawy, nestor polskiej informatyki.
O jakich czasach i teorii mówimy w tej chwili?
– Profesor Pawlak zaproponował teorię zbiorów przybliżonych w 1982 roku. Jest ona alternatywą dla klasycznej teorii zbiorów Georga Kantora, u którego zbiory definiują się przez tożsamość swoich elementów. Natomiast profesor Pawlak zaproponował, by zbiory definiowały się przez własności elementów opisane w sposób niezależny. Elementy mające takie same własności są nierozróżnialne i tworzą granule wiedzy. Te granule stają się cegiełkami, z których buduje się reprezentację zbioru. Jeśli granule pasują dokładnie do tego zbioru, to reprezentacja jest dokładna. W ogólności jednak będzie różnica między zbiorem elementów utworzonym z granul, które wchodzą w całości do wnętrza zbioru, a zbiorem elementów utworzonym z granul, które mają tylko niepusty przekrój z reprezentowanym zbiorem. Stąd, w ogólności, zbiór jest reprezentowany przez parę zbiorów zwanych dolnym i górnym przybliżeniem. Różnica między dolnym a górnym przybliżeniem pokazuje zakres niespójności, czyli sprzeczności występujących w danych. Okazuje się, że taki prosty pomysł ma ogromne znaczenie dla analizy danych i analizy klasyfikacji.
I Pan w tym niespójnym, sprzecznym świecie musi stworzyć narzędzie do podejmowania decyzji?
– Trzeba w tym świecie rozróżnić to, co jest prawdziwe i pewne, od tego, co jest tylko możliwe. To są pojęcia zbiorów przybliżonych: dolne oraz górne przybliżenie. Dzięki teorii profesora Pawlaka możemy indukować z tych danych reguły pewne i tylko możliwe.
Mówi Pan cały czas o indukcji. Czy nie można mówić po prostu o wnioskowaniu?
– Wnioskowanie może być indukcyjne i dedukcyjne. Tu mamy do czynienia z indukcją, gdyż prawdy, które wnioskujemy z danych, są jedynie domyślne. To nie są prawdy obiektywne, gdyż, jak mówi Karl Popper, można je sfalsyfikować przez kontrprzykład.
Aby budować takie narzędzia do wspomagania decyzji, trzeba mieć szerokie spojrzenie na zagadnienia logiczne, informatyczne, językowe.
– Trzeba wiedzieć, czego się szuka w odkrywaniu wiedzy, we wspomaganiu decyzji, w modelowaniu, na co można sobie pozwolić, jaki jest stan informacji. Poszedłem ze swoimi doktorantami o krok dalej w teorii zbiorów przybliżonych. Założyłem, że w danych istnieje też pewna semantyczna monotoniczność...
Brzmi strasznie.
– Może trzeba powiedzieć inaczej: istnieje pewna monotoniczność, która ma ściśle określoną semantykę decyzyjną. Można ją wyjaśnić tak: weźmy pod uwagę uczniów, którzy są klasyfikowani przez radę pedagogiczną. Mają różne oceny z matematyki, fizyki itd., oraz ocenę ogólną. Prawdą jest, że gdyby uczeń otrzymał z jakiegoś przedmiotu ocenę lepszą niż ma obecnie, to nie powinien otrzymać ogólnej oceny gorszej. Gdyby tak się stało, to powiedzielibyśmy, że to jest niespójność. Liczymy się zatem z monotonicznością typu: im więcej na warunkach, tym więcej na decyzjach, czy – im lepiej na warunkach, tym lepiej na decyzjach. W medycynie im większe zwapnienie guza, tym większa jego złośliwość. Dotąd nie uwzględniano tej monotoniczności jako wiedzy apriorycznej ani w metodach statystycznych, ani w teorii zbiorów przybliżonych. A jest to konieczne, bo ignorując ją, narażamy się na wyciąganie błędnych reguł. Oczywiście, istnieją problemy klasyfikacji, w których taka monotoniczność nie ma miejsca, na przykład w taksonomii roślin. W większości problemów decyzyjnych związanych z klasyfikacją, wyborem czy rangowaniem, taka zależność monotoniczna musi być jednak brana pod uwagę. Typowymi przykładami są problemy oceny ryzyka kredytowego, analizy satysfakcji konsumentów czy wielokryterialnej oceny decyzji.
W jakim stopniu wnioski wyciągane z danych są ryzykowne?
– To w dużej mierze zależy od reprezentatywności danych. Gdy przejeżdżamy przez jakieś nieznane miasto pociągiem i widzimy brudny, obskurny dworzec kolejowy, mamy wrażenie, że całe miasto jest właśnie takie. Tworzymy pewne uogólnienie, które jest prawdziwe w świecie naszych obserwacji, a nie w ogóle.
Interesujące jest w tym kontekście pytanie, czy nauka odkrywa prawdę?
– Człowiek, odkrywając prawdę przez małe „p”, poznaje świat, a w nim siebie jako istotę jedyną w swoim rodzaju. Tym samym zbliża się do prawdy przez duże „P”. Nauka to odkrywanie tej prawdy cząstkowej przez małe „p”.
Czy szukanie przyczyn ma sens w nauce współczesnej?
– Spójrzmy na prace astronomów, którzy sięgają w coraz dalsze krańce wszechświata, aby zrozumieć jego początki. Szukanie przyczyn ma sens. Także lekarz czy finansista chcą znać przyczyny zjawisk, z którymi mają do czynienia.
Moje pytanie wiąże się z pozytywizmem, który starał się zanegować sens poszukiwania przyczyn.
– Przyczyna w tym małym sensie oraz w tym wielkim zawsze jest naturalną potrzebą, pytaniem człowieka.
Powiedział Pan, że filozofia nauki motywuje. Czy to jest powód, żeby w politechnikach wykładać filozofię? Mam wrażenie, że mówienie o humanizacji studiów inżynierskich pozostaje w sferze pomysłu, a może nawet fikcji.
– Obecność przedmiotu humanistycznego nie jest mile widziana na studiach inżynierskich. Źle kojarzy się z programem z przeszłości, gdy była tam filozofia marksistowska i ekonomia polityczna. Nie bez przyczyny jednak wśród rygorozów doktorskich w politechnice jest egzamin z filozofii. Na poziomie doktoranckim to jest potrzebne. Wskazówki, które dają nam filozofowie, są dla nas bardzo przydatne. Gdy czytamy coś, co zaczyna rezonować z naszą intuicją, czujemy motywację, podporę dla własnych pomysłów. Czułem to na przykład, gdy proponowałem nowe modelowanie preferencji, które jest oparte na związkach logicznych. Gdy zacząłem się tym zajmować, natrafiłem na wypowiedź Gastona Bachelarda, myśliciela francuskiego, że jeśli w jakości pojawia się porządek, to po cóż dla jego wyjaśnienia mielibyśmy poszukiwać pośrednictwa liczb. W tym momencie stanęła mi przed oczami alternatywa: czy do modelowania preferencji stosować teorię użyteczności, która jakość przelicza na liczby, czy może brać pod uwagę tylko porządki w ocenie jakości? Myśl Bachelarda przekonała mnie do tego drugiego podejścia, tym bardziej że porządek to informacja, która przychodzi o wiele łatwiej niż przeliczenie jakości na wartość, na przykład pieniężną. Po co dla wyjaśnienia wspomnianych już monotonicznych związków między porządkami przeliczać wszystko na liczby? Wtedy przecież zakłócamy te związki i tracimy z oczu ślad tego, co ważne.
Wszyscy mówią o obiektywizmie liczb.
– Liczba jest niebezpieczna, bo jest pozornie obiektywna. Patrzmy, co się dzieje w systemach punktowych przy rekrutacji. Żeby przeliczyć wiedzę na punkty, przyjmuje się masę arbitralnych założeń, nadaje się wagi różnym przedmiotom, tak jakby można było powiedzieć, ile dodatkowej wiedzy z matematyki kompensuje ubytek wiedzy z polskiego. Jeśli idziemy na uproszczenia, to róbmy to sensownie, by wprowadzały jak najmniej arbitralności. Cały wysiłek w nauce, w modelowaniu, od którego zaczęliśmy rozmowę, idzie w osłabianie założeń. Chodzi o to, aby przyjmować jak najmniej założeń upraszczających i aby te założenia były jak najsłabsze.
Co dla uczonego jest bardziej satysfakcjonujące, odkrycie czy jego zastosowanie?
– Ponieważ jestem inżynierem, dążę do tego, aby to, co odkrywam było użyteczne. W szczególności metody wspomagania decyzji muszą być weryfikowane w praktyce. Pierwsza satysfakcja pojawia się już wtedy, gdy stworzymy spójną i elegancką teorię, ale spełnienie daje dopiero zastosowanie jej w praktyce.