Estás
intentando comprar un artículo o iniciar sesión en una cuenta. Ingresas tus
credenciales, pero antes de continuar, debes demostrar que eres un ser
humano.
Debes
seleccionar la casilla marcada como “No
soy un robot”. Puedes ver una imagen borrosa con dígitos sesgados
que necesita descifrar. Estos son CAPTCHA, y aunque pueden ser una
molestia, son necesarios.
¿Correcto?
¿Qué
son los CAPTCHA y cómo funcionan? ¿En qué se diferencian de
reCAPTCHAs? ¿Y por qué son muchos de ellos tan difíciles?
¿Qué es CAPTCHA?
CAPTCHA
significa Completely Automated Public Turing Test to Tell Computers and Humans
Apart (Prueba de Turing pública
completamente automatizada para distinguir computadoras y seres humanos).
Toman
su nombre de Alan Turing, el genio del
criptoanálisis que creó la prueba de Turing. Esta es una forma de examinar
el pensamiento de una máquina, para verificar si su comportamiento es
indistinguible del de un ser humano.
Una
prueba estándar de Turing involucra a una persona real que juzga a los
sujetos. Los CAPTCHA no: generalmente son administrados por una
computadora. Como tal, algunos los llaman la “Prueba de Turing inversa”,
mientras que otros los conocen como Prueba de interacción humana (HIP).
Los
CAPTCHA se crearon para evitar que los bots envíen spam a sitios web. Cualquier experto en tecnología
competente puede hacer un programa que suscriba automáticamente a millones de
cuentas; Los CAPTCHA están diseñados para evitar que eso suceda.
Es
porque a las computadoras les resulta difícil descifrar el texto distorsionado,
o al menos más difícil que a los humanos. La mayoría de los CAPTCHA están
emparejados con diferentes gradientes de color en el fondo, para oscurecer aún
más el mensaje.
Existe
un debate sobre quién creó CAPTCHA, aunque el término fue acuñado por la
Universidad Carnegie Mellon, Pittsburgh, en 2003.
El
equipo académico postuló que podrían usarse para proteger correos electrónicos,
encuestas en línea y otros servicios que requieren el registro de robots de
motores de búsqueda, gusanos y robots de spam, y ataques de
diccionario. También son útiles para combatir los ataques
de denegación de servicio distribuido (DDoS).
¿Cómo funcionan los CAPTCHA?
El
texto puede estar realmente oscurecido, pero a menudo aún puedes entender lo
que significa. Los símbolos más sesgados son, más efectivo es un
CAPTCHA. Esto se debe a que los humanos exhiben pareidolia, un fenómeno en el que nuestro cerebro trata de dar
sentido a la aleatoriedad. Es tu mente tratando de asignar orden en el
caos.
Pareidolia
es la razón por la que infieres caras donde no deberían estar: en nubes,
edificios, acantilados, árboles, bebidas, flores y más.
Los
ejemplos más famosos de este capricho psicológico típicamente presentan
religión (con personas que dicen ver a Jesús en su comida) y
astronomía. Conocerás a Barnard 33 por su coloquialismo, la Nebulosa
Cabeza de Caballo, debido a sus cualidades equinas; otros ven un conejo
tallado en los cráteres de la luna.
Esa
es también la razón por la que puedes distinguir palabras en CAPTCHA incluso
cuando están tachadas y deformadas. Nuestros cerebros hacen conexiones que
los programas de computadora generalmente no pueden.
¿Por qué son tan difíciles los CAPTCHA?
Luis
von Ahn, anteriormente miembro del equipo CAPTCHA de la Universidad Carnegie
Mellon, dice que lleva un promedio de nueve segundos resolver un
CAPTCHA. El 92 por ciento lo hace bien. Eso podría hacerte sentir
estúpido por ingresar la combinación incorrecta, pero no debería. Todos
son parte de ese 8 por ciento restante de vez en cuando.
De hecho, las tasas de falla aumentan de 8 por ciento a casi 30 por ciento si el CAPTCHA distingue entre mayúsculas y minúsculas.
El
problema con inferir información es que podemos inferir fácilmente
la información incorrecta. Una “I” puede convertirse en
un “1”. Es aún más difícil cuando el CAPTCHA no consiste en palabras sino
en letras aleatorias.
Afortunadamente,
los servicios saben que los humanos son falibles y no siempre pueden leer
textos borrosos. La mayoría de los CAPTCHA te dan la opción de generar uno
nuevo, así que, si tienes problemas, actualízalo.
La
razón principal por la que los CAPTCHA pueden ser tan difíciles es por
necesidad. A medida que los CAPTCHA han evolucionado, también lo han hecho
los atacantes.
La inteligencia
artificial (IA) puede leer incluso textos particularmente
distorsionados con una precisión estimada del 99 por ciento. Los CAPTCHA
han tenido que mejorar su juego.
Notablemente,
Google ha avanzado la tecnología considerablemente, pero volveremos a eso.
¿Cómo
derrotan a los programas CAPTCHA? Se descifran usando algoritmos que
buscan formas particulares. Por lo general, convierten el cuadro de texto
en escala de grises, eliminando la distorsión que proporcionan los artefactos
de color. Luego se centran en patrones y los cruzan con letras y números
estándar.
El
algoritmo toma, efectivamente, conjeturas educadas cuando se trata de dígitos
que permanecen sin identificar.
CAPTCHA: ¿Qué podría salir mal?
Existen
numerosos problemas con CAPTCHA, especialmente para las personas con
discapacidades. Es particularmente cierto para las personas con mala vista
o que sufren de dislexia.
Sí,
los CAPTCHA se han desarrollado para combatir
los bots de manera más efectiva y ser más fáciles para los
humanos. En algunos casos. Se hace de varias maneras
significativas. El primero es a través de la variación de la
verificación. Un ejemplo ampliamente utilizado de esto es reemplazar el
texto con fotos.
Es
posible que se te presenten imágenes en una cuadrícula y tengas que hacer clic
en cada cuadro que muestre las señales de tráfico. Esto funciona muy bien
porque los programas sufren de visión por computadora, es decir, una dificultad
para comprender el contenido de las imágenes digitales.
Algunas
IA pueden diferenciar y comprender lo que contiene una foto. Piensa
en la tecnología DeepFace de Facebook, que puede reconocer
características faciales y sugerir perfiles. Sin embargo, estos tipos de
CAPTCHA son un desafío adicional para los bots, un obstáculo adicional para los
ataques de fuerza bruta y su tipo.
Las
imágenes también funcionan bien para aquellos que usan teléfonos inteligentes y
tablets: es mucho más fácil seleccionar con un toque los cuadrados
correctos. Es decir, ¡siempre y cuando esas fotos se carguen
correctamente!
Otra
adaptación es el CAPTCHA de audio, que lee el texto para aquellos que luchan
por distinguir los dígitos. Estos a menudo van acompañados de sonido de
fondo. Esto puede causar más problemas a los spammers que usan software de
reconocimiento de voz.
La
otra forma importante en que los CAPTCHA han evolucionado es a través de la
integración con Google y la introducción de reCAPTCHA. Y no, no son
exactamente lo mismo ...
CAPTCHA y reCAPTCHA: ¿Cuál es la diferencia?
La
mayoría de los CAPTCHA que ves son en realidad reCAPTCHAs. Este último
hace el mismo trabajo que el primero, pero lo supera al fomentar también el
aprendizaje automático.
Además,
los reCAPTCHA se utilizan para la digitalización de libros.
Fueron
desarrollados por el mismo equipo de la Universidad Carnegie Mellon que nos dio
el término “CAPTCHA”. El software de código abierto tenía como objetivo “preservar
la literatura descifrando una palabra que las computadoras no podían leer”. Efectivamente,
cada vez que descifras una palabra encontrada en un reCAPTCHA, se utiliza para
el aprendizaje automático. Estás ayudando al programa a comprender las
diferentes formas y patrones de símbolos.
CAPTCHA
es una combinación aleatoria; reCAPTCHA consiste en palabras específicas
que los bots no han podido analizar previamente.
Fue
lanzado en 2007 y adquirido por Google en 2009. Muchos consideran a Google un
conglomerado masivo en el que no puedes confiar, pero los reCAPTCHA han hecho
mucho bien. Solo dos años después de la adquisición, la tecnología había
digitalizado por completo los archivos de Google Books y The New York Times. Ambos
son depósitos invaluables de información.
Es
irónico que la tecnología ahora pueda entender el texto de manera efectiva,
haciendo que los reCAPTCHA sean redundantes. Es por eso que Google ha
impulsado la idea aún más.
¿Alguna
vez te preguntaste qué sucede cuando haces clic en “No soy un robot” y procede de inmediato, sin descifrar
nada? El nuevo reCAPCTHA de Google analiza tu actividad en todo el sitio y
luego te asigna secretamente un puntaje de probabilidad para determinar si eres
humano o un bot.
Esencialmente,
se resolvió si tus interacciones con el servicio son más indicativas de una
persona real o un programa.
¿Fácil para los humanos, difícil para los bots?
A
medida que los bots se vuelven más inteligentes, los sistemas de seguridad
también tienen que avanzar. ReCAPTCHA es una idea suficientemente
sólida. Por ahora.
Pero
muchos cuestionan el poder de Google. La inteligencia artificial puede
reconocer el comportamiento humano. Considera todas las cosas
que Google ya sabe sobre ti y eso es sin duda un motivo de
preocupación.