¿Se está abrumando Internet por la cantidad de tráfico diario? Cuando miro a Comcast, Nivel 3 y otros en Down Detector, parece que tienen grandes problemas durante las horas pico en la mayoría de los días.

No lo creo.

Trabajo para una gran empresa de telecomunicaciones como … bueno. Nuestros títulos cambiaron recientemente, pero el trabajo real que hacemos es el de los ingenieros de redes.

Estoy en el trabajo ahora que acabo de terminar dos proyectos de mantenimiento, así que supongo que voy a echar un vistazo a mi primera respuesta aquí en Quora.

Estas son algunas de las cosas que causan interrupciones:

Chicos borrachos con retroexcavadoras.

El trabajo en la carretera salió mal.

Accidentes automovilísticos.

Trabajadores que reemplazan postes de energía.

Inundaciones

Tornados

Huracanes

Serpientes de cascabel.

Los vagabundos.

Ladrones que buscan robar cobre.

Otros ISP que rompen tus cosas.

Ingenieros que no entienden lo que es una “tormenta de difusión”.

Ingenieros que no entienden cómo detener la tormenta de transmisión que acaban de causar.

Un proyecto de mantenimiento realizado incorrectamente.

Fallo de hardware.

Cthulhu (¿De qué otra forma te haces un corte de fibra en aguas profundas?

Varios ALU 7750 están poseídos simultáneamente por espíritus malignos, lo que hace que todos pierdan la gestión. (Eso o ese ingeniero maldito está poniendo bucles en lugares MUY malos otra vez).

Tenga en cuenta que estas redes son bastante masivas, pero a veces las empresas no invierten en cosas importantes como la “redundancia”. O bien, hay redundancia, pero la cantidad de tráfico que debe redirigirse abruma los circuitos, o el enrutador que falló fue un “trozo”, por lo que no hay ningún lugar al que pueda reencaminar el tráfico.

Los cortes de fibra son una pesadilla por sí mismos y, dependiendo de lo que se cortó, cómo se cortó, dónde se cortó, etc., la reparación puede demorar entre unas pocas horas y varios días. Para colmo, si la fibra es parte de un “anillo”, pero los dispositivos en dicho anillo están configurados incorrectamente, aún obtendrá una interrupción masiva porque no pueden redirigir el tráfico.

También tienes “líneas de arrendamiento”. Las compañías a menudo arriendan fibra de otras compañías que ya han instalado infraestructura. El problema es que, una vez que sus datos llegan a esa línea de arrendamiento, la otra compañía es responsable de ello. Algo así como. Por ejemplo, si Comcast alquila una línea de ATT en … Florida, y hay un problema relacionado con ese circuito en particular, Comcast NOC tiene que llamar a ATT NOC, y luego pueden discutir entre sí de quién es realmente el problema. Tiene una fibra que está conectada al enrutador de Comcast en un extremo y al enrutador de ATT en el otro (básicamente). Ninguno de los NOC quiere quedarse atascado con ese ticket, por lo que a menos que un NOC pueda probar definitivamente que el problema reside en el enrutador / red del otro … lo harán por un tiempo. A menos que sea durante el día y las llamadas enojadas comiencen a llegar. O es un circuito 911. (NUNCA atornille un circuito 911. Nunca. NUNCA.) Mientras tanto, probablemente haya un número decente de personas que intentan averiguar qué ingenieros de la compañía cambiaron el tamaño de MTU en la interfaz y causaron un problema colosal (sí, a veces el problema es realmente así de simple. A veces, REALMENTE no lo es).

Entonces, hay un buen error de usuario antiguo. Un cambio aparentemente menor realizado en un enrutador en una malla puede derribar mercados enteros. Y ahora, usted depende de que esa persona haya hecho el resto de su trabajo correctamente, como registrar su trabajo mientras realiza cambios en las configuraciones del dispositivo. De acuerdo, di que no hicieron eso. Ahora, ya no puede conectarse a los dispositivos de forma remota, y abre su EMS de elección (Nokia / ALU usa algo llamado SAM que realiza un seguimiento de todos sus enrutadores), y echa un vistazo a, digamos, el Mercado de Kileen, TX … y todo lo que ves son líneas rojas y alarmas de desplazamiento. ¡Fantástico! Entonces, ahora necesita que le muestren en SecureCRT / PuTTy / TeraTerm / lo que sea, los últimos comandos que ejecutaron. Oh, genial, cerraron la ventana … y nunca registraron nada. Oooookay, ahora preguntas en qué dispositivo estaban, en qué CR (solicitud de cambio) o boleto estaban trabajando … y obtienes una mirada en blanco. Ahora tiene cambios de configuración desconocidos en un enrutador desconocido en algún lugar del mercado de Kileen … y no puede acceder a ninguno de los 10 a 15 enrutadores que componen ese mercado. Es hora de despertar a un técnico … o 10.

Ese es un ejemplo extremo, pero las versiones más pequeñas de ese tipo de cosas suceden todo el tiempo.

En cuanto a las horas pico, parte de su pregunta … Creo, y esta es mi mejor suposición, que el número de personas que usan la red no es lo que está causando los cortes. Podría ser que los cortes ocurran en lugares que tienen mucha gente porque se está trabajando para aumentar la velocidad / capacidad en esas áreas. Pero a veces (perdón por el idioma) sucede una mierda, y algo se arruina por accidente que no se nota hasta el día siguiente. La mayor parte de nuestra mejora de capacidad y cosas así suceden por la noche, y hay momentos en los que las cosas se escapan por las grietas. El uso excesivo definitivamente causa problemas, pero generalmente todo lo que hace es hacer que sus velocidades disminuyan a un ritmo lento. La mayoría de las interrupciones que he visto / causado (no pregunte), se deben a fallas de hardware, configuraciones incorrectas, cortes de fibra y similares, no por demasiadas personas que intentan acceder a las mismas al mismo tiempo.

Espero que esto haya sido al menos un poco útil para ti.

Voy a abusar de mi PTO ahora. Estoy cansado, y trabajar en dispositivos Adtran me da “hambre”. No tengo idea de por qué.

La respuesta rápida simple es no y sobre capacidad e inversión.

La capacidad siempre se puede actualizar para manejar más tráfico y lo es. Depende de quién tiene que hacer la inversión y cómo afecta a otras compañías.

Algunas compañías son más lentas que otras, lo que puede causar cuellos de botella ya que los datos pasan por muchos puntos entre el origen y el destino.