No estoy seguro de lo que hacen exactamente, pero esta es la técnica más común. Al guardar una imagen, puede verificar si la URL de la imagen o el sitio web ya existe en la base de datos. En ese caso, no crea una nueva entrada en la base de datos, sino que simplemente vincula a la existente. También es posible utilizar otra información como ancho / alto / tamaño de archivo / nombre de la imagen para encontrar duplicados, aunque no son tan precisos ya que, por ejemplo, todas las imágenes de Instagram son del mismo tamaño.
Esta no es una solución al 100% y en realidad no es tan importante para evitar duplicados por completo. El gran objetivo es garantizar que una sola página no muestre la misma imagen dos veces. De esa forma, los usuarios tienen la impresión de que no hay duplicados. Y eso se puede lograr con bastante facilidad con las técnicas anteriores.
La solución de alta tecnología sería analizar el contenido de la imagen (composición, paleta de colores, reconocimiento de texto, etc.), pero sería un rendimiento muy intenso y probablemente no lo que hacen.
- ¿Por qué es tan estúpida la Búsqueda de Google?
- ¿Qué opina de la teoría de los bandidos con múltiples brazos para las pruebas A / B y la optimización de la tasa de conversión?
- ¿Hay una plataforma para gobernarlos a todos? Blogging, CMS, SEO, Email Marketing y Lead Nurturing, Social Media, Analytics, y Lead Management
- ¿Cuáles son buenas pautas de SEO para los vendedores afiliados para que no dañen su clasificación?
- ¿Por qué obtengo “strangermeetup.com” como segundo resultado en la página 1 cuando busco en Google “chatear con extraños”? El sitio web tiene estadísticas de tráfico realmente malas según Alexa.com.