Cuatro investigadores
de la universidad de Maryland han diseñado un sistema automático capaz de
romper el reCAPTCHA de Google con una precisión cercana al 85%
Este sistema no esta
dirigido a resolver los retos basados en imágenes que ofrece reCAPTCHA sino las
versiones de audio. El audio es utilizado para que aquellas personas que tengan
dificultades para visualizar los retos puedan resolver aquellos que reCAPTCHA
ofrece.
unCAPTCHA descarga el
audio del puzzle y lo suministra a 6 sistemas distintos 'Text-To-Speech'. Estos
sistemas traducen el audio a texto y unCAPTCHA escoge la respuesta más probable
que es posteriormente enviada a los servidores de Google.
Los investigadores
que trabajaron en este sistema hicieron pruebas para comprobar la eficiencia de
esta herramienta, llegando a un 85,15% de precisión al romper 450 reCAPTCHAS en
casi cinco segundos y medio.
Existen otras
herramientas como ReBreakCaptcha cuya finalidad y metodología es prácticamente
idéntica, sin embargo unCAPTCHA informó en todo momento a Google de su
investigación, permitiendo mejorar el sistema.
Según afirman los
investigadores, tras comunicarse los hallazgos Google comenzó a limitar el
éxito de unCAPTCHA. Por ejemplo se detectaron mejoras en la detección de
navegadores bloqueando el uso de Selenium, que al ser usado el audio obtenido
contenía fragmentos sin sentido o incluso texto añadido, cuando antes
únicamente contenían dígitos.
Más información:
- "unCaptcha: A Low-Resource Defeat of reCaptcha’s Audio Challenge": https://www.usenix.org/system/files/conference/woot17/woot17-paper-bock.pdf
- "Defeating Google's audio reCaptcha with 85% accuracy": https://github.com/ecthros/uncaptcha