I’m not a robot!
Svi smo se susreli sa CAPTCHA-om na internetu i rešavali razne zadatke ko zna koliko puta već. Ali, da li znate kako je ovaj „izazov-odgovor“ test nastao?
Test je prisutan na internetu pod nazivom „CAPTCHA“ od 2003. godine zahvaljujući Luis von Ahn-u i njegovom timu sa Carnegie Mallon univerziteta. Međutim, prvi put se ovakav test pojavio još 1997. godine.
Ideja i cilj projekta
U suštini, cilj ovog testa jeste da se razlikuju ljudi od kompjuterskih automatizovanih skripti (u daljem tekstu „roboti“), a otuda i naziv Completely Automated Public Turing test to tell Computers and Humans Apart – CAPTCHA. Na taj način se mogu sprečiti roboti da automatski izvršavaju neke radnje na internetu, recimo da kupuju karte za koncerte u deliću sekunde i tako blokiraju ljude da kupuju.
Rešenje je ubaciti izobličen tekst i polje za unos tog teksta. Takav tekst roboti ne mogu da pročitaju već samo ljudi i eto jednostavnog rešenja.
Rešenje je bilo toliko dobro i jednostavno da su ga koristili svi sajtovi na kojima je bilo potrebe za takvom merom zaštite. U jednom trenutku CAPTCHA probleme su rešavali ljudi po milion na dan, i osnivač Van Ahn se pitao „Mežemo li iskoristiti toliku snagu ljudskog mozga za nešto korisnije?“ i odgovor je bio – da.
Digitalizovanje knjiga
Tako da su iskoristili snagu ljudskog mozga miliona korisnika da digitalizuju knjige. A način na koji su to uradili je podrazumevao skeniranje knjiga, pomoću OCR-a (optičko prepoznavanje karaktera) prevesti slova u digitalni tekst i izdvojiti reči koje OCR softver nije prepoznao. Nakon toga, za rezultat imaju gomilu reči koje softver ne može da prepozna, a koje čovek može. Zatim su te reči ubacivali u CAPTCHA sistem i ljudi su ih rešavali. Kada bi imali dovoljan broj potvrđenih reči, oni bi ih ubacili u digitalizovanu knjigu.
Van Ahn je ovaj projekat nazvao reCAPTCHA, a slogan je bio: „Stop spam, read books“ (Zaustavi spam, čitaj knjige). U tom trenutku oko 100 miliona reCAPTCHA slika je bilo rešeno svakoga dana, što je oko 2.5 miliona knjiga godišnje.
I onda je Google odlučio da kupi reCAPTCHA-u, i kupili su 2009. godine. Oni su iskoristili tu snagu da digitalizuju New York Times arhive (link) koje datiraju još iz 1800.-tih godina pa sve do danas, kao i sve „Google Books“ knjige.
Dodatna primena
Kada im je ponestalo tog materijala, Google je počeo da koristi brojeve kuća koje je skenirao Google Streen View (inače na Street View mapama brojevi su zamagljeni, ali ovde nisu) kako bi ih dodelio objektima i tako olakšao njihovo pronalaženje. Dakle, još jedna korist od reCAPTCHA-e.
Problemi
Sve se odvijalo super, ali ipak nije. Ovakav oblik zaštite je bio nezgodan za slepe i slabovide ljude, pa su uveli opciju za zvuk. Robotski glas je izgovarao brojeve koje je bilo potrebno uneti, ali tako da taj zvuk softver za prepoznavanje zvuka ne može da prepozna. Ali i ovo rešenje nije idealno jer postoje i slabovidi ljudi koji ne čuju dobro, i ljudi koji imaju druge zdravstvene i/ili psihičke probleme.
Drugi problem su bili servisi koji su nudili automatsko rešavanje CAPTCHA problema za vas. Ovakvi servisi plaćaju male sume novca korisnicima trećeg sveta koji rešavanju CAPTCHA. Vi pošaljete CAPTCHA problem servisu, oni korisnicima koji rešavaju, kada reše vrate servisu, i na kraju servis vama. Sve se odvija brzo jer softver reguliše celu razmenu.
I treći, možda i najveći, problem je taj što je optičko prepoznavanje slika postalo toliko napredno da su i roboti počeli da rešavaju izmešana slova i brojeve. Koliko god tekst bio dobro izobličen i pomešan sa raznim linijama i pozadinama, roboti su uspevali da reše.
Google je sproveo istraživanje i rezultati su bili poražavajući. Ljudi su ovakve tekstove rešavali u 33% slučajeva, a roboti su pogađali rešenje u 99.8% slučajeva.
Rešenje
I tada je Google odlučio da promeni to tako što će CAPTCHA zadatke pojednostaviti za čoveka, a odluku o tome da li čovek ili robot rešava zadatak odlučuje Google veštačka inteligencija. Novi projekat je nazvan „No CAPTCHA reCAPTCHA„.
Ova vrsta provere traži od korisnika samo jednu akciju – da klikne „I’m not a robot“ polje. Jednostavno, svako to može, čak i robot? Da, može i robot da klikne ali će Google to znati i neće proći test.
Način na koji ovaj sistem funkciniše je dosta komplikovan jer neuronska mreža u obzir uzima mnogo detalja prilikom odluke o tome da li je polje kliknuo čovek ili robot. Recimo, u obzir se uzima kako se korisnik kretao kroz sajt pre klika, kako je kursorom došao do klika, odakle je, IP adresu, kako je skrolovao… i još dosta drugih informacija koje Google nije otkrio.
O tome kako funkcioniše nova reCAPTCHA sam pisao poseban članak, pa možete pročitati ovde.
I evo nas danas, koristimo ovaj sistem koje je za sad najbolji. Ali, koliko dugo će biti – ne znam. Siguran sam da će se pojaviti veštačka inteligencija koja će se suprotstaviti i onda će Google morati da smisli nešto novo. Ili možda već smišljaju?
Izvori: 1. Inspiracija za članak