¿Cómo funcionan los CAPTCHA y por qué son tan difíciles de resolver?

Estás intentando comprar un artículo o iniciar sesión en una cuenta. Ingresas tus credenciales, pero antes de continuar, debes demostrar que eres un ser humano. 
Debes seleccionar la casilla marcada como “No soy un robot”. Puedes ver una imagen borrosa con dígitos sesgados que necesita descifrar. Estos son CAPTCHA, y aunque pueden ser una molestia, son necesarios.

¿Correcto?

¿Qué son los CAPTCHA y cómo funcionan? ¿En qué se diferencian de reCAPTCHAs? ¿Y por qué son muchos de ellos tan difíciles?

¿Qué es CAPTCHA?

CAPTCHA significa Completely Automated Public Turing Test to Tell Computers and Humans Apart (Prueba de Turing pública completamente automatizada para distinguir computadoras y seres humanos). 
que es captcha en ingles
Toman su nombre de Alan Turing, el genio del criptoanálisis que creó la prueba de Turing. Esta es una forma de examinar el pensamiento de una máquina, para verificar si su comportamiento es indistinguible del de un ser humano.

Una prueba estándar de Turing involucra a una persona real que juzga a los sujetos. Los CAPTCHA no: generalmente son administrados por una computadora. Como tal, algunos los llaman la “Prueba de Turing inversa”, mientras que otros los conocen como Prueba de interacción humana (HIP).

Los CAPTCHA se crearon para evitar que los bots envíen spam a sitios web. Cualquier experto en tecnología competente puede hacer un programa que suscriba automáticamente a millones de cuentas; Los CAPTCHA están diseñados para evitar que eso suceda.

Es porque a las computadoras les resulta difícil descifrar el texto distorsionado, o al menos más difícil que a los humanos. La mayoría de los CAPTCHA están emparejados con diferentes gradientes de color en el fondo, para oscurecer aún más el mensaje.

Existe un debate sobre quién creó CAPTCHA, aunque el término fue acuñado por la Universidad Carnegie Mellon, Pittsburgh, en 2003.

El equipo académico postuló que podrían usarse para proteger correos electrónicos, encuestas en línea y otros servicios que requieren el registro de robots de motores de búsqueda, gusanos y robots de spam, y ataques de diccionario. También son útiles para combatir los ataques de denegación de servicio distribuido (DDoS).

¿Cómo funcionan los CAPTCHA?

El texto puede estar realmente oscurecido, pero a menudo aún puedes entender lo que significa. Los símbolos más sesgados son, más efectivo es un CAPTCHA. Esto se debe a que los humanos exhiben pareidolia, un fenómeno en el que nuestro cerebro trata de dar sentido a la aleatoriedad. Es tu mente tratando de asignar orden en el caos.

Pareidolia es la razón por la que infieres caras donde no deberían estar: en nubes, edificios, acantilados, árboles, bebidas, flores y más.

Los ejemplos más famosos de este capricho psicológico típicamente presentan religión (con personas que dicen ver a Jesús en su comida) y astronomía. Conocerás a Barnard 33 por su coloquialismo, la Nebulosa Cabeza de Caballo, debido a sus cualidades equinas; otros ven un conejo tallado en los cráteres de la luna.

Esa es también la razón por la que puedes distinguir palabras en CAPTCHA incluso cuando están tachadas y deformadas. Nuestros cerebros hacen conexiones que los programas de computadora generalmente no pueden.

¿Por qué son tan difíciles los CAPTCHA?

Luis von Ahn, anteriormente miembro del equipo CAPTCHA de la Universidad Carnegie Mellon, dice que lleva un promedio de nueve segundos resolver un CAPTCHA. El 92 por ciento lo hace bien. Eso podría hacerte sentir estúpido por ingresar la combinación incorrecta, pero no debería. Todos son parte de ese 8 por ciento restante de vez en cuando.

De hecho, las tasas de falla aumentan de 8 por ciento a casi 30 por ciento si el CAPTCHA distingue entre mayúsculas y minúsculas.

El problema con inferir información es que podemos inferir fácilmente la información incorrecta. Una “I” puede convertirse en un “1”. Es aún más difícil cuando el CAPTCHA no consiste en palabras sino en letras aleatorias.

Afortunadamente, los servicios saben que los humanos son falibles y no siempre pueden leer textos borrosos. La mayoría de los CAPTCHA te dan la opción de generar uno nuevo, así que, si tienes problemas, actualízalo.

La razón principal por la que los CAPTCHA pueden ser tan difíciles es por necesidad. A medida que los CAPTCHA han evolucionado, también lo han hecho los atacantes. 

La inteligencia artificial (IA) puede leer incluso textos particularmente distorsionados con una precisión estimada del 99 por ciento. Los CAPTCHA han tenido que mejorar su juego.
Notablemente, Google ha avanzado la tecnología considerablemente, pero volveremos a eso.

¿Cómo derrotan a los programas CAPTCHA? Se descifran usando algoritmos que buscan formas particulares. Por lo general, convierten el cuadro de texto en escala de grises, eliminando la distorsión que proporcionan los artefactos de color. Luego se centran en patrones y los cruzan con letras y números estándar.

El algoritmo toma, efectivamente, conjeturas educadas cuando se trata de dígitos que permanecen sin identificar.

CAPTCHA: ¿Qué podría salir mal?

Existen numerosos problemas con CAPTCHA, especialmente para las personas con discapacidades. Es particularmente cierto para las personas con mala vista o que sufren de dislexia.

Sí, los CAPTCHA se han desarrollado para combatir los bots de manera más efectiva y ser más fáciles para los humanos. En algunos casos. Se hace de varias maneras significativas. El primero es a través de la variación de la verificación. Un ejemplo ampliamente utilizado de esto es reemplazar el texto con fotos.

Es posible que se te presenten imágenes en una cuadrícula y tengas que hacer clic en cada cuadro que muestre las señales de tráfico. Esto funciona muy bien porque los programas sufren de visión por computadora, es decir, una dificultad para comprender el contenido de las imágenes digitales.

Algunas IA pueden diferenciar y comprender lo que contiene una foto. Piensa en la tecnología DeepFace de Facebook, que puede reconocer características faciales y sugerir perfiles. Sin embargo, estos tipos de CAPTCHA son un desafío adicional para los bots, un obstáculo adicional para los ataques de fuerza bruta y su tipo.

Las imágenes también funcionan bien para aquellos que usan teléfonos inteligentes y tablets: es mucho más fácil seleccionar con un toque los cuadrados correctos. Es decir, ¡siempre y cuando esas fotos se carguen correctamente!

Otra adaptación es el CAPTCHA de audio, que lee el texto para aquellos que luchan por distinguir los dígitos. Estos a menudo van acompañados de sonido de fondo. Esto puede causar más problemas a los spammers que usan software de reconocimiento de voz.

La otra forma importante en que los CAPTCHA han evolucionado es a través de la integración con Google y la introducción de reCAPTCHA. Y no, no son exactamente lo mismo ...

CAPTCHA y reCAPTCHA: ¿Cuál es la diferencia?

La mayoría de los CAPTCHA que ves son en realidad reCAPTCHAs. Este último hace el mismo trabajo que el primero, pero lo supera al fomentar también el aprendizaje automático.

Además, los reCAPTCHA se utilizan para la digitalización de libros.

Fueron desarrollados por el mismo equipo de la Universidad Carnegie Mellon que nos dio el término “CAPTCHA”. El software de código abierto tenía como objetivo “preservar la literatura descifrando una palabra que las computadoras no podían leer”. Efectivamente, cada vez que descifras una palabra encontrada en un reCAPTCHA, se utiliza para el aprendizaje automático. Estás ayudando al programa a comprender las diferentes formas y patrones de símbolos.

CAPTCHA es una combinación aleatoria; reCAPTCHA consiste en palabras específicas que los bots no han podido analizar previamente.

Fue lanzado en 2007 y adquirido por Google en 2009. Muchos consideran a Google un conglomerado masivo en el que no puedes confiar, pero los reCAPTCHA han hecho mucho bien. Solo dos años después de la adquisición, la tecnología había digitalizado por completo los archivos de Google Books y The New York Times. Ambos son depósitos invaluables de información.

Es irónico que la tecnología ahora pueda entender el texto de manera efectiva, haciendo que los reCAPTCHA sean redundantes. Es por eso que Google ha impulsado la idea aún más.

¿Alguna vez te preguntaste qué sucede cuando haces clic en “No soy un robot” y procede de inmediato, sin descifrar nada? El nuevo reCAPCTHA de Google analiza tu actividad en todo el sitio y luego te asigna secretamente un puntaje de probabilidad para determinar si eres humano o un bot.

Esencialmente, se resolvió si tus interacciones con el servicio son más indicativas de una persona real o un programa.

¿Fácil para los humanos, difícil para los bots?

A medida que los bots se vuelven más inteligentes, los sistemas de seguridad también tienen que avanzar. ReCAPTCHA es una idea suficientemente sólida. Por ahora.

Pero muchos cuestionan el poder de Google. La inteligencia artificial puede reconocer el comportamiento humano. Considera todas las cosas que Google ya sabe sobre ti y eso es sin duda un motivo de preocupación.

Tu opinión es importante para mí, porque me ayuda a mejorar. Si te gustó el articulo o tienes alguna sugerencia, déjame tu comentario con tu nombre para poder responderte tan pronto como pueda.

Publicar un comentario (0)
Artículo Anterior Siguiente Artículo