No lo sé para Google, pero mi experiencia con un motor de búsqueda con casi 200 millones de documentos:
Es un poco más complicado
1. Algunas características para la clasificación están inherentemente conectadas al índice invertido (por ejemplo, la posición de la palabra dentro del documento: título, url, título, texto en negrita, texto normal, enlace entrante, etc.). Por lo tanto, estas características de clasificación se calculan previamente para todas las coincidencias posibles (que pueden estar en miles de millones para Google).
2. Algunas características son baratas de considerar (por ejemplo, PageRank y otros factores estáticos). Supongo que estas características baratas se consideran para los primeros cientos de miles de coincidencias.
3. Algunas características son bastante caras de calcular. Supongo que se pueden aplicar solo a los últimos miles de partidos.
4. Algunas funciones se pueden calcular solo después de recuperar el documento en sí (por ejemplo, si los fragmentos de las palabras clave buscadas son exactamente iguales). Esto se aplicará a pedido hasta que encuentre al menos 10 documentos.
Por lo tanto, es una cascada (en este ejemplo con 4 pasos, pero en realidad puede ser más) donde gradualmente reduce el conjunto de resultados.
- Si no fuera un asistente de SEO, ¿qué más le gustaría lograr?
- Cómo clasificar una página web sin vínculos de retroceso
- ¿Qué es un método garantizado que aumenta el tráfico del blog?
- ¿Qué habilidades o trucos pueden ayudar a dominar la Búsqueda de Google?
- ¿Qué son las páginas de destino web?