Wykrywanie i analiza oszustw internetowych promowanych na platformach mediów społecznościowych (SFERA)

W finansowanym z programu NCBR LIDER projekcie SFERA pracujemy na rzeczywistych danych, pochodzących z udokumentowanych przypadków oszustw internetowych. Analizujemy fałszywe reklamy, zmanipulowane wypowiedzi oraz przykłady działań oszustów podszywających się pod znane marki, osoby publiczne i instytucje.

Wyzwanie

Projekt SFERA odpowiada na wiele, często bardzo złożonych wyzwań badawczych, które wynikają z szybko zmieniającego się charakteru cyfrowych oszustw. Mamy do czynienia z treściami generowanymi lub częściowo modyfikowanymi, wykorzystującymi sztuczną inteligencję, tzw. techniki deepfake. Treści te są rozproszone, wielokrotnie publikowane w różnych miejscach, często krótkotrwałe i kontekstowo różnorodne. W obecnych trendach marketingowych, granica między treściami prawdziwymi a zmanipulowanymi bywa bardzo wąska, szczególnie w przypadku formatu fałszywych rekomendacji, reklam czy technik montażu. Projekt SFERA mierzy się z tymi problemami, stawiając na interdyscyplinarne podejście, łączące uczenie maszynowe z analizą medialną i społeczną.

Kierownik projektu

Dr inż. Ewelina Bartuzi-Trokielewicz

Co robimy?

Nasze podejście opiera się na dokładnej analizie tego, jak działają oszuści, jakie technologie wykorzystują oraz jak konstruują swoje przekazy, aby wywołać konkretne działania użytkowników. W projekcie pracujemy na rzeczywistych danych, pochodzących z udokumentowanych przypadków oszustw internetowych. Analizujemy fałszywe reklamy, zmanipulowane wypowiedzi oraz przykłady działań podszywających się pod znane marki, osoby publiczne i instytucje.

Zastosowane rozwiązania mają charakter multimodalny, pozwalając na analizę treści audiowizualnych na kilku poziomach:

obszar wizualny – badamy, czy nagrania mają ślady manipulacji (np. podmiany twarzy, dopasowania ruchu ust do nowego przekazu głosowego, widocznych artefaktów),
obszar dźwiękowy – sprawdzamy, czy głos został wygenerowany za pomocą technik klonowania głosu,
wypowiadana treść – analizujemy język, narracje, stosowane socjotechniki, schematy wypowiedzi i charakterystyczne frazy wykorzystywane w oszustwach.

W projekcie stosowane jest także tzw. podejście data-centric, w którym skupiamy się nie tylko na budowie modeli, ale przede wszystkim na jakości, różnorodności i charakterystyce danych poddając je pogłębionej analizie przypadków. Tworzymy zestaw przypadków oszustw, które pomagają nie tylko uczyć modele, ale też lepiej zrozumieć samą naturę manipulacji cyfrowej.

Nasze modele wykorzystują najnowsze osiągnięcia w zakresie uczenia głębokiego, przetwarzania języka naturalnego, analizy dźwięku, rozpoznawania wzorców i technik widzenia komputerowego. Łącząc te elementy, budujemy system zdolny do wczesnego wykrywania zagrożeń oraz generowania raportów, które mogą być wykorzystane przez instytucje zajmujące się walką z dezinformacją i cyberoszustwami.

Projekt finansowany jest przez Narodowe Centrum Badań i Rozwoju w ramach XV edycji programu LIDER.

Okres realizacji projektu: 01.06.2025 r. – 01.10.2027 r.

Nr Umowy: LIDER15/0362/2024

Wartość dofinansowania: 1 800 000,00 zł