I N C A R C A

ML în Transport: Detectarea Patternurilor de Fraudă la Bilete


Frauda la bilete în transportul public este o problemă persistentă care costă operatorii sume considerabile anual. În dezvoltarea TheBusInfo, am implementat un sistem de machine learning care detectează automat comportamente suspecte și pattern-uri de fraudă, protejând veniturile companiei fără a afecta experiența utilizatorilor onești.
Provocarea principală este că frauda la bilete nu urmează întotdeauna pattern-uri evidente. Unii călători cumpără bilete valabile dar le folosesc pentru mai multe persoane, alții scanează același bilet de mai multe ori, iar unii creează bilete false cu QR code-uri generate. Metodele tradiționale de verificare - controlori aleatori - sunt costisitoare și identifică doar o fracțiune mică din fraudatori.
Am abordat problema prin colectarea și analiza a trei categorii de date: pattern-uri de validare (frecvență, interval între scanări, locații), date despre dispozitiv (ID unic, sistem de operare, comportament app), și corelații între numărul de validări și numărul real de pasageri raportați de șoferi. Aceste date sunt anonimizate și procesate conform GDPR.
Algoritmul folosește un model de detecție a anomaliilor bazat pe clustering și rețele neuronale. În faza de training, sistemul învață comportamentul normal al utilizatorilor onești: un călător tipic validează biletul o dată la urcarea în autobuz, folosește același dispozitiv consistent, și pattern-urile de călătorie sunt relativ predictibile (casă-muncă, școală, magazine).
Când detectează anomalii - de exemplu, același bilet scanat în locații diferite în intervale imposibile, sau un singur cont cu validări pentru 20+ persoane zilnic - sistemul marchează automat cazul pentru investigare. Nu blochează accesul imediat, ci generează alerte pentru operatori care pot verifica manual situația.
Rezultatele au fost impresionante: în primele trei luni de implementare, sistemul a identificat cu 87% acuratețe bilete folosite fraudulos, permițând operatorului să recupereze venituri pierdute și să implementeze măsuri preventive. Mai important, rata de false positive a fost sub 3%, deci utilizatorii legitimi nu au fost deranjați.
Un aspect crucial a fost echilibrul între securitate și privacy. Nu stocăm date personale sensibile, nu urmărim locațiile utilizatorilor în afara momentelor de validare, și oferim transparență completă despre ce date colectăm. Utilizatorii sunt informați că sistemul detectează fraude, ceea ce în sine are un efect preventiv.
Pe viitor, planificăm să extindem sistemul pentru a prezice zone și perioade cu risc crescut de fraudă, optimizând astfel programul controlorilor umani. De asemenea, explorăm folosirea computer vision pentru validarea automată a numărului de pasageri prin camerele din autobuz, oferind o verificare în timp real fără intervenție umană.
Machine learning în transportul public nu înseamnă supravegherea orwelliană a călătorilor, ci folosirea inteligentă a datelor pentru a crea sisteme mai eficiente, mai sigure și mai echitabile pentru toată lumea. Tehnologia permite operatorilor să-și protejeze veniturile menținând în același timp o experiență plăcută pentru pasagerii onești care formează marea majoritate.