¿Qué tan rápido y confiable es el escalado automático de AWS en la práctica para sobrevivir a un pico repentino en el tráfico?

La respuesta a su pregunta tiende a ser muy específica de la aplicación. También depende de qué servicios de AWS esté hablando. El enlace que proporcionó solo apunta a una declaración general sobre el escalado de AWS.

Supongo que estaba principalmente interesado en el servicio de escalado automático EC2, que está compuesto por Ec2 + Elastic Load Balancer + Cloud Watch + SNS. El mecanismo funciona bien, pero hay una serie de botones y diales que necesita ajustar para obtener el mejor rendimiento para su perfil de escala.

Por ejemplo, ¿cuánto tardan sus AMI en arrancar y autoconfigurarse? ¿Qué métricas y umbrales desea activar un evento de escala? ¿Cuántos sistemas desea agregar cuando se activa un evento de escala, etc.? Una manera fácil de familiarizarse con estas cosas sin tener que hacer demasiado trabajo es crear una aplicación AWS Elastic Beanstalk.

Con muchos de los otros servicios de AWS, la escalabilidad está incorporada y están diseñados desde cero para manejar eventos de escala Digg / Reddit. S3, SimpleDB, Dynamo DB, SNS, etc.

Solo hay una cosa que quiero agregar a la respuesta de Daniel: también debe asegurarse de que su pila de aplicaciones pueda manejar un aumento repentino en el tráfico respondiendo con 503 Servicio no disponible, como la famosa ballena de falla de Twitter, por una fracción de la entrada solicitudes hasta que se agreguen más máquinas al grupo. Es posible que deba realizar algunas pruebas de rendimiento de un solo servidor para determinar un límite superior razonable.