Sui social media, si sa, è meglio non pubblicare immagini che contengano informazioni personali come numeri di targhe, nomi di strade, numeri civici, ecc.
E se ti dicessimo che l’intelligenza artificiale generativa potrebbe lo stesso localizzarti solo grazie allo sfondo di un tua foto?
Già, proprio così: alcuni studenti della mitica Università di Stanford hanno sviluppato un’applicazione – una rete neurale – in grado di rilevare la posizione da uno scorcio stradale o anche solo da un’immagine.
Il progetto, chiamato Predicting Image Geolocations (PIGEON), può, nella maggior parte dei casi, determinare con precisione una posizione specifica semplicemente tramite Google Street View.
PIGEON (che in italiano significa piccione), in poche parole, può individuare una località raffigurata in una foto con una precisione del 92% e può individuare una posizione entro 25 chilometri da quella ‘target’ in oltre il 40% dei casi. Almeno così si legge in un documento diffuso da chi ha progettato questa ‘diavoleria’.
Per capire quanto sia impressionante, PIGEON è stato testato sul gioco GeoGuessr, in cui i giocatori devono indovinare le posizioni in base alle immagini di Google Maps e il sistema è stato addestrato a tal punto che ha sconfitto uno dei migliori gamer in vari round, cioè Trevor Rainbolt, tutto documentato da un video visualizzato 1,8 milioni di volte.
Gli studenti hanno sfruttato CLIP, una rete neurale sviluppata da OpenAI in grado di connettere testo e immagini, addestrandola sui nomi delle categorie visive da riconoscere.
Quindi, ispirandosi al già citato GeoGuessr, PIGEON è stato addestrato su un set di dati di 100.000 posizioni originali campionate casualmente dal gioco e su un set di download di quattro immagini per coprire un intero “panorama” in una determinata posizione per un totale di 400.000 immagini.
Rispetto al numero di immagini su cui vengono addestrati altri modelli di intelligenza artificiale, PIGEON, al confronto, impallidisce. Ad esempio, il popolare modello di generazione di immagini di OpenAI, DALL-E, viene addestrato su centinaia di milioni di immagini.
Secondo i creatori di PIGEON, questa tecnologia potrebbe essere utile agli scienziati, ad esempio per individuare determinati luoghi partendo da foto d’archivio.