DAVE – polska metoda wyjaśniania decyzji modeli AI
Polscy naukowcy z UJ opracowali metodę DAVE do analizy decyzji modeli Vision Transformer. Dowiedz się, jak działa i gdzie będzie zastosowana.
Polska metoda DAVE pozwala zrozumieć, na jakie elementy obrazu zwraca uwagę model sztucznej inteligencji podczas podejmowania decyzji. Naukowcy z Uniwersytetu Jagiellońskiego i Max Planck Institute for Informatics opracowali to rozwiązanie specjalnie dla modeli Vision Transformer – architektur, które zrewolucjonizowały rozpoznawanie obrazów w ostatnich latach.
Problem czarnej skrzynki w sztucznej inteligencji
Systemy AI są coraz częściej wykorzystywane do wspomagania decyzji w medycynie, finansach i systemach bezpieczeństwa. Problem polega na tym, że zwykle działają jak tzw. “czarne skrzynki” – osiągają wysoką skuteczność, ale trudno zrozumieć, dlaczego wskazały właśnie taki, a nie inny wynik. To szczególnie problematyczne w zastosowaniach wysokiego ryzyka, gdzie eksperci muszą wiedzieć, czy AI opiera się na rzeczywiście istotnych cechach, czy na przypadkowych artefaktach.
Wyjaśnialność sztucznej inteligencji (Explainable AI, XAI) to dziedzina badań mająca na celu opracowanie metod pozwalających zajrzeć do wnętrza modeli i lepiej zrozumieć mechanizmy ich działania. Dotychczasowe podejścia jednak często prowadziły do powstawania rozmytych lub niestabilnych wyników, szczególnie w przypadku modeli Vision Transformer.
Jak działa metoda DAVE?
Metoda DAVE (Distribution-aware Attribution via ViT Gradient Decomposition) to nowe podejście do analizy decyzji modeli wizyjnych. Jak wyjaśnił PAP dr hab. Bartosz Zieliński, profesor Uniwersytetu Jagiellońskiego i dyrektor Jagiellońskiego Centrum Sztucznej Inteligencji, DAVE wskazuje, które fragmenty obrazu były najważniejsze dla podjęcia przez model konkretnej decyzji.
Kluczowa różnica w stosunku do tradycyjnych metod polega na tym, że DAVE analizuje sposób przepływu informacji przez model i oddziela sygnały związane z rzeczywistym przetwarzaniem obrazu od elementów wynikających z architektury modelu lub jego lokalnej niestabilności. To pozwala na stworzenie bardziej precyzyjnych i stabilnych map pokazujących, na jakie obiekty i struktury wizualne zwraca uwagę sztuczna inteligencja.
Dr Adam Wróbel, pierwszy autor publikacji, podkreślił, że większość obecnych metod traktuje model jak czarną skrzynkę i analizuje jedynie zależność między wejściem a wyjściem. DAVE natomiast wykorzystuje wiedzę o wewnętrznej architekturze Vision Transformerów, dzięki czemu potrafi odfiltrować elementy odpowiedzialne za szum i niestabilność wyjaśnień oraz dokładniej wskazać, które fragmenty obrazu rzeczywiście wpłynęły na decyzję modelu.
Wyniki badań i walidacja metody
Badacze sprawdzili skuteczność metody DAVE na kilku grupach modeli Vision Transformer, obejmujących zarówno klasyczne modele uczone w sposób nadzorowany, jak i modele samonadzorowane oraz architektury zaprojektowane z myślą o interpretowalności. We wszystkich testowanych rozwiązaniach DAVE osiągał wyniki porównywalne lub lepsze od dotychczasowych metod wyjaśniania AI.
Signifikancję osiągnięcia potwierdza wyróżnienie na International Conference on Machine Learning (ICML) 2026 – jednej z najbardziej prestiżowych konferencji poświęconych sztucznej inteligencji. W tym roku organizatorzy otrzymali rekordowe 23 918 zgłoszeń, z których do programu zakwalifikowano 26,6 procent. Tytuł “Spotlight”, przyznawany pracom uznanym za szczególnie istotne dla rozwoju dziedziny, otrzymało jedynie 536 artykułów, czyli około 2,2 procent wszystkich zgłoszeń.
Praktyczne zastosowania DAVE
Zdaniem naukowców metoda może znaleźć zastosowanie wszędzie tam, gdzie wykorzystywane są systemy analizujące obrazy:
- Diagnostyka medyczna – analiza zdjęć rentgenowskich, tomografii komputerowej i obrazów mikroskopowych
- Kontrola jakości w przemyśle – automatyczne wykrywanie defektów
- Pojazdy autonomiczne – wspomaganie systemów decyzyjnych
- Analiza zdjęć satelitarnych – monitorowanie zmian terenu i zasobów
Dr Dawid Rymarczyk, autor korespondencyjny, podkreślił, że największą zaletą DAVE jest możliwość sprawdzenia, na które elementy obrazu zwraca uwagę model podczas podejmowania decyzji. W zastosowaniach wysokiego ryzyka może to pomóc ekspertom ocenić, czy sztuczna inteligencja opiera swoje wnioski na rzeczywiście istotnych cechach.
Co to oznacza dla przyszłości AI?
Publikacja opisująca metodę dostępna jest w serwisie arXiv, gdzie gromadzą się wstępne wersje prac naukowych. Naukowcy przygotowują obecnie publiczną wersję kodu, która umożliwi innym zespołom wykorzystanie DAVE we własnych badaniach. Już teraz otrzymali pierwsze zapytania od badaczy ze Stanów Zjednoczonych i Chin zainteresowanych wykorzystaniem metody.
Autorzy rozwiązania spodziewają się, że po udostępnieniu kodu DAVE będzie szeroko wykorzystywany i porównywany z innymi rozwiązaniami w dziedzinie wyjaśnialnej sztucznej inteligencji. Obecna wersja została opracowana dla modeli wizyjnych, jednak zespół pracuje już nad rozszerzeniem metody na modele przetwarzające tekst oraz systemy multimodalne łączące obraz i język.
To osiągnięcie polskich naukowców pokazuje, że Polska może być ważnym graczem w międzynarodowych badaniach nad sztuczną inteligencją. Wyjaśnialność AI staje się coraz ważniejsza w miarę, jak systemy te przejmują coraz bardziej krytyczne role w medycynie, finansach i bezpieczeństwie. Metoda DAVE może okazać się kluczowym narzędziem w budowaniu zaufania do sztucznej inteligencji i zapewnieniu jej bezpiecznego wdrażania w praktyce.
Najczęstsze pytania
Co to jest metoda DAVE i jak działa?
DAVE (Distribution-aware Attribution via ViT Gradient Decomposition) to metoda wyjaśniania decyzji modeli Vision Transformer opracowana przez naukowców z Uniwersytetu Jagiellońskiego. Analizuje przepływ informacji przez model i wskazuje, które fragmenty obrazu były najważniejsze dla podjęcia konkretnej decyzji przez AI.
Czym DAVE różni się od innych metod wyjaśniania AI?
Większość metod traktuje model jak czarną skrzynkę i analizuje tylko zależność między wejściem a wyjściem. DAVE wykorzystuje wiedzę o wewnętrznej architekturze Vision Transformerów, dzięki czemu odfiltruje elementy odpowiedzialne za szum i dokładniej wskazuje, które fragmenty obrazu rzeczywiście wpłynęły na decyzję.
Gdzie będzie zastosowana metoda DAVE?
DAVE ma potencjał wszędzie tam, gdzie wykorzystywane są systemy analizujące obrazy: diagnostyka medyczna (zdjęcia rentgenowskie, tomografia), kontrola jakości w przemyśle, pojazdy autonomiczne i analiza zdjęć satelitarnych.
Kiedy będzie dostępny kod metody DAVE?
Naukowcy przygotowują publiczną wersję kodu, którą udostępnią po oficjalnej prezentacji na konferencji ICML w lipcu 2026. Już teraz otrzymali zapytania od badaczy ze Stanów Zjednoczonych i Chin.
Jakie są praktyczne korzyści z wyjaśniania decyzji AI?
W zastosowaniach wysokiego ryzyka (medycyna, finanse, bezpieczeństwo) wyjaśnianie decyzji AI pozwala ekspertom sprawdzić, czy model opiera się na rzeczywiście istotnych cechach, czy na przypadkowych artefaktach, co jest kluczowe dla bezpieczeństwa systemu.
Na podstawie: Rzeczpospolita. Tekst opracowany redakcyjnie.