Sono milioni le immagini presenti nell’"obitorio" del New York Times. Il nome dice tutto: l’obitorio è un archivio sotterraneo dove il NYT, a partire dal XIX secolo, ha cominciato a stoccare il suo immenso "database" analogico di fotografie, ritagli di giornale, microfilm e altri materiali vari. Ora tutto questo patrimonio è tornato alla luce anche grazie a Google.
"L’obitorio è un tesoro di documenti deperibili, una cronaca inestimabile che non riguarda solo la storia del Times ma narra più di un secolo di eventi globali che hanno plasmato il nostro mondo. Il nostro staff ha cercato per anni di trovare una soluzione pratica al riordino dell’obitorio ma, fino a poco tempo fa, l’idea di un archivio digitalizzato sembrava davvero fuori portata anche per noi." Così ha detto Nick Rockwell, CTO del New York Times.
A questo punto della storia entra in gioco Google che ha messo a disposizione del NYT le sue tecnologie di storage su cloud e di machine learning. Ma il risultato non è stato solo una mera digitalizzazione delle immagini: le due aziende hanno elaborato un progetto che prevede sia il ridimensionamento sia la memorizzazione dei metadati in modo da offrire approfondimenti sui contenuti digitalizzati. L’API Cloud Vision di Google rileva testo, logo, oggetti e altro all’interno delle fotografie, mentre l’API Cloud Natural Language utilizza il testo rilevato per classificarle. Il combinato di questi dati consente di cercare nella raccolta digitalizzata immagini specifiche che altrimenti andrebbero perse nel vasto archivio.