Imagenet challenge

L’ImageNet Large Scale Visual Recognition Challenge (ILSVRC) valuta gli algoritmi per il rilevamento di oggetti e la classificazione delle immagini su larga scala.

Uno scopo è consentire ai ricercatori di confrontare i diversi progressi nel rilevamento di una più ampia varietà di oggetti; l’altro misurare i progressi della visione artificiale per l’indicizzazione delle immagini su larga scala, per il recupero e per. l’annotazione.

McQuillan osserva che

[Il] set di dati paradigmatico di deep learning chiamato ImageNet (…) consiste di oltre 14 milioni di immagini etichettate, ognuna delle quali è taggata come appartenente a una delle oltre 20.000 categorie o classi. Il presupposto che ha guidato la creazione del set di dati era di un’etichettatura non ambigua; un insieme di termini che descrivessero correttamente un’immagine e che si applicassero a tutti i casi in cui quell’immagine emerge nel mondo. In questo gesto radicale, ImageNet ha amputato l’idea di un punto di vista e ha affermato l’irrilevanza del contesto o dell’esperienza incarnata. Un sistema addestrato su un tale set di dati non sa nulla di storia, potere o significato, in modo che a una foto di “un soldato israeliano che tiene a terra un giovane ragazzo palestinese mentre la famiglia del ragazzo cerca di rimuovere il soldato” possa essere assegnata la didascalia, “Persone sedute in cima a una panchina insieme(D. McQuillan, “Resisting AI: An Anti-fascist Approach to Artificial Intelligence” traduzione in proprio)

Rispondi