Nuovo Captcha di Google: acquistato ReCAPTCHA. E migliaia di testi andranno online.

Pubblicità

Google ha acquisito ReCAPTCHA, un'evoluzione dei tradizionali sistemi captcha finalizzata a interpretare le parole dubbie individuate dai programmi OCR.

Redazione 

Google ha acquisito ReCAPTCHA, uno spin-off nato da un progetto della School of Computer Science della Carnegy Mellon University, dove alcuni ricercatori hanno implementato i tradizionali sistemi captcha al fine di interpretare le parole dubbie individuate dai programmi OCR (Optical Character Recognition).

I captcha sono quelle strane scritte che appaiono durante la registrazione on line a un servizio, utilizzate per bloccare l’azione di bot e per riconoscere che a fare la richiesta sia stato effettivamente un essere umano. Oltre a funzionare come valido sistema anti-bot e antispam, reCAPTCHA è un servizio che aiuta a digitalizzare libri, quotidiani, magazine e anche i vecchi show radiofonici. Se l’OCR fallisce, la parola non letta correttamente viene associata a un’immagine usata come captcha.

Può capitare, però, che anche in questo caso una macchina non riesca a leggere l’immagine come captcha. È qui che arriva l’aiuto di reCAPTCHA: il sistema invia all’utente una parola nota associata al captcha non individuato dall’OCR. L’utente deve poi fornire una risposta. Se il test relativo al termine per il quale la risposta è nota viene superato, il sistema archivia come corretto anche il nuovo termine.

Uno dei problemi principali dei programmi OCR riguarda la difficoltà di interpretare lettere sbiadite o pagine ingiallite di testi antichi. Come è noto, Google è impegnata nella digitalizzazione di milioni di libri e testi. Oltre ad aumentare la protezione da frodi e spam, la tecnologia reCAPTCHA servirà a potenziare proprio i progetti si scannerizzazione su larga scala, quali Google Books e Google News Archive Search.

Autore: Arianna Bernardini

Ultimi articoli correlati:

Commenta La Notizia!