No estoy seguro de lo que hacen exactamente, pero esta es la técnica más común. Al guardar una imagen, puede verificar si la URL de la imagen o el sitio web ya existe en la base de datos. En ese caso, no crea una nueva entrada en la base de datos, sino que simplemente vincula a la existente. También es posible utilizar otra información como ancho / alto / tamaño de archivo / nombre de la imagen para encontrar duplicados, aunque no son tan precisos ya que, por ejemplo, todas las imágenes de Instagram son del mismo tamaño.
Esta no es una solución al 100% y en realidad no es tan importante para evitar duplicados por completo. El gran objetivo es garantizar que una sola página no muestre la misma imagen dos veces. De esa forma, los usuarios tienen la impresión de que no hay duplicados. Y eso se puede lograr con bastante facilidad con las técnicas anteriores.
La solución de alta tecnología sería analizar el contenido de la imagen (composición, paleta de colores, reconocimiento de texto, etc.), pero sería un rendimiento muy intenso y probablemente no lo que hacen.
- ¿Cuál es una buena estrategia de SEO externa para principiantes?
- ¿Qué artículos debo leer para saber cómo un motor de búsqueda clasifica los sitios web y cómo lo hace?
- ¿Será SMO golpeado por SEO?
- ¿Qué es el SEO y cómo lo uso para mi sitio web?
- Cómo generar vínculos de retroceso a través del sitio web de publicación de foros