Entonces quieres vencer a Google. Aquí le mostramos cómo comenzar a pensar en el problema de manera realista.
Definir el verdadero objetivo
Lo primero es definir qué significa “vencer a Google”. Es cierto que una pequeña empresa no tiene posibilidades de vencer a Google en la búsqueda en la Web utilizando el mismo enfoque que Google. En el mejor de los casos, podrías producir un clon (como Bing). Un mejor enfoque es comenzar determinando qué problema central resuelve Google para la mayoría de las personas: encontrar cosas en la Web.
Cuando apareció Google por primera vez, la búsqueda se consideraba una mercancía y Yahoo era el sitio más grande de la Web. ¿Por qué? Porque Yahoo hizo un mejor trabajo al ayudar a las personas a encontrar cosas en la Web que cualquier motor de búsqueda. En ese momento, la mayoría de los resultados de búsqueda eran susceptibles al relleno de palabras clave y eran útiles principalmente para búsquedas de cola larga. Una búsqueda de “Hamlet” podría mostrarle una lista de páginas web aleatorias que contenían la palabra “hamlet” varias veces. Para encontrar un buen sitio web sobre Hamlet, el portal curado de Yahoo ahorró muchas molestias a las personas.
El algoritmo PageRank de Google cambió todo para Yahoo, permitiendo a los usuarios encontrar la mejor página de Hamlet basada en la popularidad del enlace en lugar de una selección aleatoria del editor de Yahoo. Google era más rápido, más fácil de usar, funcionaba para cualquier término de búsqueda y podía manejar el crecimiento de la Web (mientras que el portal de Yahoo se sobrecargaba irremediablemente). Google pudo vencer a Yahoo porque atacaron el mismo problema (encontrar cosas en la Web) de una manera completamente nueva. Cualquier compañía que pueda vencer a Google será tan diferente de Google como Google de Yahoo: la clave es encontrar cosas en la Web mejor que Google.
Identificar fortalezas para evitar
Google no pudo competir con el gran equipo de editores de Yahoo. No podían competir con la base de usuarios de Yahoo o el reconocimiento de marca. Afortunadamente, eso no tuvo impacto en la capacidad de Google para encontrar cosas en la Web. Al evitar las fortalezas de Yahoo, Google pudo competir casi en igualdad de condiciones.
Para un nuevo competidor de Google, algunos puntos fuertes a evitar podrían ser:
- construir un índice de búsqueda masivo y luego actualizarlo constantemente
- utilizando todos los indicadores externos posibles para la clasificación
- algoritmos de optimización para la clasificación
- usando el historial de búsqueda / ubicación para la personalización
- optimizando para obtener los resultados más rápidos
Una empresa joven no podrá acercarse al dominio de Google en ninguna de estas fortalezas, por lo que es mejor encontrar una solución al problema central (encontrar cosas en la Web) que las evite por completo.
Identificar debilidades para explotar
Desde el principio, Google tenía ciertas ventajas sobre Yahoo. Google no tuvo que pagar a editores humanos. Google no exigió a los usuarios que navegaran en una jerarquía compleja para encontrar la categoría correcta. Google no tuvo ningún problema cuando un sitio web dejó de funcionar: el sitio se eliminaría de su índice automáticamente. Lo más importante, a medida que la Web crecía y se volvía más interconectada, Google mejoró debido a los datos adicionales mientras que Yahoo nadaba contra la corriente, contratando más y más editores para administrar su directorio abrumado.
Para un nuevo competidor de Google, algunas debilidades para explotar podrían ser:
- La comprensión de Google del contenido web es indirecta
- La comprensión de Google de la intención de un buscador es indirecta
- Google es vulnerable a vincular spam, spam de contenido y cuasi-spam (granjas de contenido)
- Los buscadores tienen una capacidad limitada para mejorar o enfocar los resultados de búsqueda
- Los buscadores tienen una capacidad limitada para personalizar o despersonalizar resultados
- Los caracteres especiales no se pueden buscar (corchetes, signos de exclamación, etc.)
Estas debilidades se pueden dividir en dos grupos principales: debilidades que comprenden el contenido y debilidades que abordan la intención de los buscadores.
Contenido desaprovechado
Google utiliza muchas señales indirectas para determinar qué contenido es relevante para qué término de búsqueda. Debido a esto, las cosas en la Web que no tienen muchos enlaces entrantes o señales sociales pueden estar infravaloradas. Por ejemplo, si una enciclopedia altamente especializada se pone en línea por primera vez, parte de su contenido puede no aparecer en Google, incluso para resultados de términos de búsqueda altamente relevantes. Esto se complica aún más por los esfuerzos de filtrado de spam de Google que también pueden afectar el contenido de esta naturaleza. En última instancia, Google no puede saber algorítmicamente qué recursos son legítimos y cuáles no, qué recursos son primarios y cuáles son duplicados, o qué páginas se generan y cuáles son escritas por humanos.
Debido a que Google es el motor de búsqueda más grande de la Web, casi todo el spam se crea específicamente para el juego Google. Esta lucha ha abarrotado la Web con una gran cantidad de cuasi contenido inútil, especialmente para temas altamente monetizados. Por ejemplo, intente encontrar reseñas de usuarios para cualquier plan de atención médica específico. Cada resultado superior volverá a vender su atención médica. Google se está volviendo vulnerable al crecimiento de la Web, al igual que Yahoo. La diferencia es que Yahoo tenía un enfoque fundamentalmente defectuoso, mientras que el enfoque de Google solo ha sido debilitado por agentes independientes que apuntan a Google desde todos los ángulos. Mientras Google confíe en algoritmos para administrar la clasificación, los sitios web tienen la oportunidad de jugar con el sistema para cualquier término específico. A medida que Google mitiga estas vías de ataque, sus resultados sufren la debilitada relación señal / ruido. En otras palabras, la densidad de palabras clave puede ser una gran métrica de relevancia, pero solo hasta que alguien ingrese palabras clave en una página de marketing. Entonces la densidad de palabras clave debe tomarse con un grano de sal. Este mismo problema ha sucedido con enlaces entrantes, texto de anclaje, señales sociales y cualquier otro indicador que Google use para determinar algorítmicamente la relevancia.
Por lo tanto, las debilidades de Google en el contenido provienen de dos factores:
- Google no tiene ninguna propiedad del contenido web, lo que permite problemas de clasificación / spam
- Los propietarios de contenido están manipulando activamente las señales que utiliza Google para determinar la clasificación. Esto va desde el spam directo hasta los blogs corporativos que existen para crear contenido nuevo para Google.
Usuarios desatendidos
Si el contenido especializado o los temas altamente monetizados están insuficientemente servidos, también lo es cualquiera que busque esas cosas a través de Google. En términos más generales, los buscadores desatendidos tienden a compartir un problema común: control limitado. Google hace un trabajo admirable al anticipar la intención del buscador, pero si un término no es concluyente o el buscador no usa un término de la misma manera que la mayoría de las personas, Google mostrará malos resultados con pocas formas de mejorarlos.
La búsqueda de Google es un sistema caótico. Si cambia una palabra o incluso una sola letra, puede obtener resultados completamente diferentes. No hay forma de que un buscador anticipe cómo Google interpretará su búsqueda. Dado que Google ofrece pocas formas de filtrar o reenfocar una búsqueda, cada ajuste al término de búsqueda es un nuevo comienzo. Esto puede hacer que refinar una búsqueda sea una tarea frustrante y repetitiva. Los buscadores que intentan encontrar múltiples fuentes o múltiples perspectivas sobre un tema pueden terminar encontrando las mismas pocas fuentes repetidamente.
Poniendolo todo junto
Todas las fortalezas de Google provienen de su enfoque algorítmico y automatizado. Hay dos enfoques alternativos claros para un competidor: el descubrimiento a través de recomendaciones de la comunidad (la esquiva solución de “búsqueda social”) o el enfoque del editor humano (como lo hizo Yahoo, y Mahalo trató de volver a visitarlo). Cualquier “batidor de Google” probablemente tendrá uno de estos dos elementos en su núcleo. Mi dinero está en la búsqueda social, porque se escala naturalmente junto con el crecimiento de la Web. Ambos enfoques proporcionan una comprensión humana del contenido de la Web al tiempo que evitan la mayoría de los problemas de spam que enfrenta Google.
El mayor problema pendiente es cómo manejar la gran inmensidad de la Web. Puede parecer inmanejable, pero hay atajos. Nuggety es mi intento de construir un portal de búsqueda social que no dependa de la catalogación y votación en cada página web. El truco es permitir a los usuarios navegar y organizar la Web a nivel del sitio web, luego buscar en el nivel de la página web. Esto cambia la escala de la Web de billones de páginas web a millones de sitios web, definitivamente manejable para una plataforma social.
“Vencer a Google” es muy poco probable para cualquier empresa, pero no creo que sea imposible. Si una empresa construye una mejor manera de encontrar cosas en la Web, todo lo demás encajará. Esto es lo que sucedió con Yahoo y no hay razón para que no le pueda pasar a Google también.
Cross publicado en http://blog.nuggety.com/how-to-b …