| Jueves, 4 de Septiembre de 2014

Captchas y reCaptchas ponen al 10% de la humanidad al servicio de Google

Sin contrato, sin cobrar por ello y en muchos casos sin saberlo, 900 millones de personas trabajan para el mayor buscador de Internet cada vez que rellenan un reCaptcha

Oficina de Google en Washington / Getty
Oficina de Google en Washington / Getty

Marta Ruiz

Todos los internautas trabajamos para Google. Sin haberlo elegido, sin contrato y sin cobrar por ello, claro. Aunque no seamos conscientes, cada vez que rellenamos un reCaptcha para abrirnos una cuenta de correo electrónico, dejar un comentario, registrarnos en una web o abrirnos un blog estamos digitalizando libros y periódicos, escaneando documentos de todo tipo y mejorando los mapas de Google Maps.

Captchas y reCaptchas para todos

¿Imaginan a 900 millones de personas mecanografiando palabras una por una para digitalizar miles y miles de libros manualmente? Dejen de imaginarlo, ocurre tal cual. Solo los 35.000 empleados del mayor buscador de Internet pueden presumir de formar parte de una envidiada plantilla, la de la marca más valiosa del mundo, pero son muchísimos más los que –en muchos casos sin ni siquiera saberlo- ahorran un farragoso trabajo a la compañía mientras navegan por la red. Alrededor del 10% de la población mundial, para que se hagan una idea.

La culpa la tiene un guatemalteco llamado Luis Von Ahn quien, hace ya 14 años, inventó los captchas, esas pruebas consistentes en reconocer una palabra formada por varios caracteres camuflados, distorsionados o tachados y teclearlos a mano para demostrar que somos un humano y no un ordenador. El sistema derivó en uno más complejo, el reCaptcha, que exigía identificar dos palabras en lugar de una, algo más tedioso para el usuario pero que reforzaba la seguridad de la página web frente a amenazas, su única función durante los primeros años del milenio.

Sistema reCaptcha / Google
Sistema reCaptcha / Google

Pronto Von Ahn pensó en darle otra utilidad al sistema de captchas y reCaptchas, de quien él mismo llegó a sentirse culpable por la pérdida de tiempo que suponía para el internauta: “Me empecé a sentir mal porque no solo son odiosos, sino que cada vez que alguien escribe un captcha pierde alrededor de 10 segundos de su vida. Si lo sumamos, se pierden alrededor de quinientas mil horas diarias”, reconoció el informático en una de sus conferencias. Y fue entonces cuando pensó en utilizar como captchas palabras escaneadas de libros que no habían podido ser descifradas y convertidas a texto en el proceso de digitalización debido al deterioro del papel o la tinta con la que estaban impresos, las manchas o el polvo. Una engorrosa tarea que costaría mucho tiempo y dinero sería desarrollada de manera masiva y colaborativa. Esto era aplicable a periódicos y otro tipo de documentos, e incluso manuscritos.

En pleno auge del mundo digital, el de Guatemala sabía que estaba ante una idea extremadamente rentable, creó una compañía a la que llamó precisamente reCaptcha y no opuso resistencia cuando Google se mostró interesado en ella.

Google adquiere el sistema

Así, desde 2009, Google es propietario de reCaptcha y obtiene los beneficios de este trabajo en equipo a gran escala que puede considerarse uno de los primeros ejemplos de crowdsourcing, como se denomina a este concepto de realizar una tarea entre una multitud de manera colaborativa para conseguir más y mejores resultados en menos tiempo.

Desde entonces, dos millones de libros al año se convierten a formato digital gracias a esos segundos de nuestro tiempo que solo cobran sentido formando parte de un todo. Prueba de ellos es que nadie consigue ganar más de dos o tres dólares al día rellenando captchas en las páginas que pagan por ello (de 45 centavos a un dólar y medio por cada 1.000 palabras).

Imágenes de números de portales de Street View usados como captchas / Google
Imágenes de números de portales de Street View usados como captchas / Google

Pero eso no es todo, seguro que se han topado alguna vez con un captcha que no es una serie de caracteres o una palabra impresa sino la fotografía de un número de portal. Se trata del último uso que Google ha encontrado para sacar provecho al sistema: el reconocimiento de números o calles obtenidos de Google Street View con la finalidad de optimizar la precisión de las direcciones en su Google Maps. Un desafío muy fácil para nosotros pero todavía demasiado complicado para la inteligencia artificial.

Marta Ruiz

Marta Ruiz

Comentarios