Aktualności z Zakładu Analiz Audiowizualnych i Systemów Biometrycznych
Zespół brał udział w prestiżowych szkołach letnich, prezentował wyniki badań na międzynarodowych konferencjach oraz rozwijał własne projekty badawcze, które już dziś znajdują zastosowanie w walce z dezinformacją i treściami syntetycznymi.

Jednym z najważniejszych wydarzeń były liczne szkolenia. Adam Baran uczestniczył we włoskiej International Summer School for Advanced Studies on Biometrics for Secure Authentication, gdzie tematem przewodnim były deepfejki i ataki prezentacyjne – zagadnienia stanowiące podstawę jego doktoratu. Michał Koźbiał brał udział w Oxford Machine Learning Summer School, zgłębiając problematykę modeli wielomodalnych i adaptacyjnych agentów AI. Z kolei Asia Gajewska i Michał Ołowski spędzili lato w Toskanii na IEEE–EURASIP Summer School, gdzie poznawali metody uczenia ciągłego i adaptacyjnego oraz sposoby wykorzystania modeli bazowych w niszowych problemach. Do grona doktorantów dołączyli Adrian Kordas i Donat Stankiewicz, a Michał Banach obronił pracę magisterską.
Centralnym projektem Zakładu był w tym roku DROZD – multimodalny detektor treści modyfikowanych lub generowanych. We wrześniu Ewelina Bartuzi-Trokielewicz i Alicja Martinek prezentowały jego założenia na Forum Ekonomicznym w Karpaczu, natomiast Michał Koźbiał przedstawił wyniki badań na konferencji IEEE International Joint Conference on Biometrics w Osace. Projekt wchodzi w końcową fazę i już teraz pokazuje ogromny potencjał w wykrywaniu materiałów syntetycznych.
Zespół aktywnie uczestniczył także w międzynarodowych konferencjach. W Rotterdamie Asia Gajewska i Alicja Martinek prezentowały artykuł dotyczący wpływu stylu płynności mowy na podatność systemów weryfikacji głosowej. W Tuluzie Alicja Martinek i Ewelina Bartuzi-Trokielewicz, we współpracy z Politechniką Bydgoską, przedstawiały wyniki badań nad wykrywaniem dezinformacji w oparciu o analizę tekstu. Jesienią Alicja Martinek prezentowała rezultaty badań nad artefaktami generacji mowy w Korei Południowej, gdzie wraz z Eweliną Bartuzi-Trokielewicz spotkały się z przedstawicielami AI Safety Institute. Wspólne wyzwania w zakresie detekcji deepfejków otwierają drogę do owocnej współpracy naukowej.
Badania prowadzone w Zakładzie obejmują zarówno analizę audio, jak i wizję komputerową. Michał Ołowski poszukuje sposobów wykorzystania szumu w celu zwiększenia odporności modeli, Asia Gajewska bada zjawisko catastrophic forgetting w uczeniu ciągłym, a Alicja Martinek rozwija metody śledzenia źródeł audio przy użyciu sieci prototypowych. Donat Stankiewicz pracuje nad detekcją partial-deepfakes, czyli nagrań łączących elementy prawdziwe i syntetyczne. W obszarze wizji Adrian Kordas rozwija klasyfikator VLLM, Adam Baran bada PAD-y w ujęciu wielokanałowym, a Michał Koźbiał doskonali algorytmy wykrywania treści nielegalnych. Ela Gomulska analizuje nadużycia logotypów w deepfejkach, natomiast Jarosław Wójtowicz i Michał Banach poszerzają zbiory treningowe, m.in.w zakresie technologii lip-sync.
Podsumowując, rok 2025 był dla Zakładu czasem intensywnego rozwoju i licznych sukcesów naukowych. Udział w szkołach letnich i konferencjach pozwolił zespołowi poszerzyć wiedzę oraz nawiązać międzynarodowe współprace. Projekt DROZD oraz badania nad multimodalną sztuczną inteligencją pokazują, że walka z dezinformacją i deepfejkami wymaga interdyscyplinarnego podejścia, łączącego analizę audio, obrazu i tekstu. Zespół z niecierpliwością oczekuje na publikację wyników w renomowanych czasopismach, a zimowe wieczory poświęca dalszym eksperymentom i lekturze najnowszych prac z dziedziny sztucznej inteligencji.