Saltar Captchas

Gracias al usuario PerverthsO de la Comunidad DragonJAR nos enteramos de un documento escrito por Luis Alberto Cortes Zavala (NaPa) de Security Nation Labs en el que se explica como programar una red neuronal de reconocimiento de captchas.
Recordemos que un captcha se trata de una prueba-desafío usada en la computación para determinar si un usuario es humano o no. Es utilizada para evitar que robots (también spambots) puedan hacer uso de ciertos servicios (encuestas, registrar cuentas de correo electrónico, etc.) aunque se ha comprobado que es posible burlar este tipo de protección; una prueba de esto es el documento expuesto a continuación.
El documento se basa en imágenes de verificación. Recordemos que no sólo existe este tipo de captchas, aunque sí es el más usado en la actualidad. Un ejemplo podría ser una de las siguientes imágenes:

En este caso el usuario debería de escribir manualmente cada una de las letras y números que aparecen en las imágenes para poder realizar una acción, ya un registro, una búsqueda, o cualquier otra cosa. Estas imágenes siempre son aleatorias por lo que es muy difícil encontrarse los mismos caracteres al recargar la página. El artículo consta de 13 páginas y el lenguaje usado es PHP.


30 mayo 2009 










Muy interesante gracias
Muy bueno, bastante explicativo.
Gracias por este articulo.
Excelentisimo articulo. Excelente. Me encanto.
Una cosa que me quedo la duda, cuando separa las letras:
imagecopy($imgchar1, $img, 1, 1, 4, 10, 10, 12);
Las separa en cuadrados, pero como haria cuando la imagen es como la que esta arriba?. Ya que cuando separamos por ejemplo la “m” (primera) nos quedaria un pedazo de la “w” a la derecha, ya que al cortarla verticalmente se tocan las dos.
Otro tema es cuando las letras no estan a la misma separacion. Yo para eso habia pensado buscar lineas verticales en blanco, cuando encontras una, es porque ahi no hay una letras (es una separacion). Pero bueno, para el caso de arriba tampoco serviria.
Igual exelente el articulo
@martin, tienes razón, la imagen escogida para realizar el ejemplo no fue la mas apropiada, he puesto una serie de Captchas mas apropiados a la documentación de Luis Alberto Cortes, aunque recuerda que cada sistema anti captcha es único para ese tipo de letra, fondo, etc… por lo que tendrás que realizar los ajustes necesarios para cada uno de ellos.
Aquí existe un reto relacionado con captchas, ya tiene varios meses y acabó pero las pruebas siguen disponibles:
http://retohacking9.elladodelmal.com/
He probado el script :
De los ejemplos de arriba solo limpiaría 4 y solo reconoce 2 letras de las 5 usando el captcha de ejemplo del pdf (tuve que hacer muchos ajustes y modificaciones)
http://multiple.webcindario.com/captcha/killer/captchakiller.php
Muy interesante, muchas gracias. Justo me habían recomendado leer sobre redes neuronales, me vino de 10!
El enlace esta roto.. Alguien me puede pasar los codigos??
Gracias.