[atnog] Automatisches Rerouting
Bernd Spiess
bernd.spiess at ip-it.com
Mon Aug 28 14:21:53 CEST 2023
Hi Klaus
Ich kenn ähnliche Probleme aus komplexen Märkten wie z.B. Middle East – wirklich lösbar/verbesserbar ist es dort
halt nur mit eigenem IXP Peering an den jeweils relevanten IXP. Das mit indirektem
Steuern der Transits per do-not-announce-to Communities geht bis zu einem gewissen
Grad – nur wenn die Implementation von sowas nicht weit genug gegeben ist, bist wieder
zurück bei der Erkenntnis, dass besser selbst und idealerweise multiple gepeert hättest.
Bei bestimmten Problemfällen kann auch ein paid-peering mit dem Problemsystem eine Lösung sein, falls keine
Peering Session möglich ist (z.B. bei Tier1 Troublemakern) – oder ein paar gut ausgewählt
Peering Links für Session-Cherry-picking um sowas lösen zu können, ist vielleicht auch eine Idee…
Zumindest scheitert es bei Euch klar nicht am Talent der involvierten Upstreams 😊
Zu Noction & Co kann ich leider nichts beitragen
lG Bernd
From: atnog <atnog-bounces at atnog.at> On Behalf Of Klaus Darilion via atnog
Sent: Monday, August 28, 2023 10:45 AM
To: atnog at atnog.at
Subject: [atnog] Automatisches Rerouting
Hallo Leute!
Um zu prüfen ob die Mailingliste nicht funktioniert stelle ich mal eine Frage :)
Wir haben immer wieder das Problem, dass einer unserer globalen Nameserver Standorte nicht gut erreichbar ist und wir dann die Zonenupdates nicht hinliefern können. Z. B. letzten Samstag hatten wir Probleme nach Brasilien zu kommen: RTT war >500ms (kein Packet Loss), und Durchsatz war < 1MBit/s.
Traceroute zeigte, dass wir den den Traffic an NTT gaben, und es via NTT nach Amerika und weiter nach Südamerika ging. Also offensichtlich ein Problem im NTT Netz.
Wir haben 4 Upstreams: NTT, Nextlayer, ACOnet und Conova (Salzburg).
Unser übliche Workaround ist dann, einen Weg/Upstream zu finden, der nicht über den problematischen Transit routet. Also:
* statische Route zu Nextlayer: Nextlayer routete auch via NTT, also das gleiche Problem
* statische Route zu Conova: Conova schickte den Traffic weiter zu Nextlayer, also das gleiche Problem
* statische Route zu ACOnet: ACOnet routet via HE, kein Delay, keine Loss, >100MBit durchsatz -> alles OK
(wir variieren auch noch mit IPv4/IPv6, da das auch manchmal unterschiedlich geroutet wird).
Das ganze läuft nun so lange stabil, bis HE mal ein Problem nach Brasilien hat, und wir die statische Route wieder rausnehmen müssen, oder woanders hinzeigen lassen.
Dieses manuelle re-Routen ist jetzt nicht der Riesenaufwand, aber wenn das 1x in der Woche vorkommt, in der Nacht oder am Wochenende, dann wird es schon unangenehm.
Was würdet ihr in so einem Fall tun?
* Die 24x7 Nummer des Transit anrufen, und der soll das reRouting machen?
* Eine Noction Box kaufen (ich glaube die können das automatische rerouten nach Delay/Loss)?
* Selbst was Basteln für rerouting (kennt da jemand vorhandene Skripte?)?
* Weitere Tier1 dazunehmen um flexibler Routen zu können?
Habt ihr weitere Ideen?
Danke
Klaus
--
Klaus Darilion, Head of Operations
nic.at GmbH, Jakob-Haringer-Straße 8/V
5020 Salzburg, Austria
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://atnog.at/pipermail/atnog/attachments/20230828/801e876d/attachment.htm>
More information about the atnog
mailing list