Alex Warmerdam

Overzicht van artikelen >

Disaster Recovery, deel 2. Email.

Geplaatst op 2-2-2010 09:52 door Alex Warmerdam


NGN Evenement
"Disaster Recovery" op 17 februari
Je kan je hier inschrijven

Alex Warmerdam presenteert daar
ook en behandelt DR vanuit
de praktijk
Leden €50,-, Niet-leden €95,-
Lid worden kan hier
We zijn van het principe uitgegaan dat als er een disaster is, de communicatie als eerste hersteld moet zijn. Je wilt immers iedereen in kunnen inlichten dat er een ramp gebeurd is. Die communicatie geldt zowel intern als extern. Intern kan je die makkelijk oplossen door een calamiteiten telefoonlijst te hebben en iedereen te bellen.
Maar je wilt als bedrijf je klanten, leveranciers en andere relaties op de hoogte kunnen stellen dat de dienstverlening ernstig verstoord is.
We hadden het voordeel dat de gebruikte email toepassingen Lotus Notes is.
Lotus Notes kent namelijk een eigen clustering en replicatie oplossing. 
 

 
Vooral de optie: Provides hot standby (load balacing and automatic failover for Notes clients) is een zeer sterkte oplossing. Met een kleine time-out schakelt de de email client over van node 1 naar node 2. Door er nu voor te zorgen dat vanaf elke werkplek de op de disaster site aanwezige Notes cluster node bereikbaar is, heb je eigenlijk gelijk al wat je wilt. Bij uitval van de server schakelen de gebruikers automatisch over op een andere node. Ten tijde van het bedenken van deze opzet (2007) was er geen ander email platform wat deze functionaliteit 100% bied. Mogelijkerwijs zijn er nu andere email platformen die deze functionaliteit ook bieden. Ik hoor dat graag.
 

Lotus Notes cluster kan bestaan uit 2 tot 6 cluster nodes. 

 


 
Een van de andere voordelen die Lotus Notes cluster software heeft is dat het geen clustering op hardware niveau is. Hierdoor kan je een mix maken van fysieke en gevirtualiseerde servers. 
  
Wat dan nog opgelost moet worden is het ontvangen en versturen van mail. Gelukkig is hiervoor een eenvoudige oplossing. Het MX record van een domain naam bevat naast het aflever adres ook een optie die bepaald welk aflever adres als eerste of als tweede gebruikt moet worden. Als je bijvoorbeeld kijkt naar gmail.
 
gmail.com       MX preference = 5, mail exchanger = gmail-smtp-in.l.google.com
gmail.com       MX preference = 10, mail exchanger = alt1.gmail-smtp-in.l.google.com
gmail.com       MX preference = 20, mail exchanger = alt2.gmail-smtp-in.l.google.com
gmail.com       MX preference = 30, mail exchanger = alt3.gmail-smtp-in.l.google.com
gmail.com       MX preference = 40, mail exchanger = alt4.gmail-smtp-in.l.google.com
 
Dan zie je dat mail eerst afgeleverd moet worden bij gmail-smtp-in.l.google.com, als dat niet lukt dan bij alt1.gmail-smtp-in.1.google.com.
Door de email omgeving te voorzien van twee of meer smtp connectors, kan je de email op de disaster site laten afleveren. Je email omgeving moet dit wel kunnen ondersteunen.
 
Voor webmail geldt hetzelfde. Deze is ook redundant opgezet. Door het ‘A’ record van de DNS entry aan te passen, komen gebruikers uit de webmail server waarvan je weet dat ze die kunnen gebruiken.
 
Eventueel kan je op je website, als deze extern gehost word, ook een linkje plaatsen naar de webmail die je ingeval van een disaster aanpast.
 
Communicatie is nu geregeld.
Een van de voordelen van deze opzet is, je kan hem dagelijks uittesten. 
 
Op naar deel 3.
  
  
  
  
  
 



Share/Save/Bookmark

Reacties

Unieke hot-standby? 2-2-2010 17:33

"Vooral de optie: Provides hot standby (load balacing and automatic failover for Notes clients) is een zeer sterkte oplossing. Met een kleine time-out schakelt de de email client over van node 1 naar node 2. Door er nu voor te zorgen dat vanaf elke werkplek de op de disaster site aanwezige Notes cluster node bereikbaar is, heb je eigenlijk gelijk al wat je wilt. Bij uitval van de server schakelen de gebruikers automatisch over op een andere node. Ten tijde van het bedenken van deze opzet (2007) was er geen ander email platform wat deze functionaliteit 100% bied. Mogelijkerwijs zijn er nu andere email platformen die deze functionaliteit ook bieden. Ik hoor dat graag."

Ik ben onvoldoende bekend met deze functionaliteit, maar wat je beschrijft is functionaliteit die Exchange 2007 Cluster Continuous Replication ook biedt. Gelanceerd in 2006. :)

Interessant om te weten is dat de procedure die je beschrijft is daardoor ook van toepassing op een Exchange 2007 omgeving met CCR waarbij je de nodes elk in een andere datacenter plaatst. En uiteraard Exchange 2010 waarbij die principe verder uitgebouwd is.

Het omleiden van je mailflow en client access wordt vaak vergeten, goed dat dit genoemd word. Ik sluit me dan ook volledig aan bij de laatste opmerking: test het scenario en zorg dat de stappen beschreven staan in een draaiboek. En dat dit draaiboek niet op een share staat van de fileserver die net afgebrand is natuurlijk. :)
Afzender: Jetze Mellema

A...Synchrone 2-2-2010 17:57

Hoi,

Ik ben gelukkig geen Microsoft man, maar als ik naar de roadmap van Microsoft kijk dan zie ik dat Exchange 2007, Thu 8/03/07 als RTM gelanceerd is.
De functionaliteit zoals je aangeeft staat hier beschreven:

http://technet.microsoft.com/en-us/library/bb124521%28EXCHG.80%29.aspx

Cluster continuous replication (CCR) is a high availability feature of Microsoft Exchange Server 2007 that combines the asynchronous log shipping and replay technology built into Exchange 2007 with the failover and management features provided by the Cluster service.
<knip>
Continuous replication is asynchronous Logs are not copied until they are closed and no longer in use by the Mailbox server. This means that the passive node usually does not have a copy of every log file that exists on the active node.

Dat houd in mijn optiek in dat de standby node nooit 100% bij is, terwijl dit bij Lotus Notes wel het geval is.

Op de volgende pagina staat netjes vermeld wat je mag verwachten.
http://technet.microsoft.com/en-us/library/aa995938%28EXCHG.80%29.aspx

Van meldingen als: Storage failures reported to and through the monitoring system. The administrator can recover the storage or initiate a scheduled outage to the passive node.

Geeft mij niet echt het gevoel van automatisch.

Maar ik, nog beter, alle NGN leden horen graag dat het wel automatisch kan zonder tussenkomst van een Administrator.

Alex
Afzender: Alex Warmerdam

Zelfde of niet? 2-2-2010 21:44

Hoi Alex,

Mijn opmerking was niet bedoeld om een discussie te starten en al helemaal geen vergelijkend warenonderzoek, alleen maar ter info dat dit ook met Exchange kan. Maar ik zie dat je nieuwsgierigheid geprikkeld is en dat is altijd goed. :) Exchange 2007 is echt eind 2006 beschikbaar gekomen, zie ook http://support.microsoft.com/kb/158530. Maar neem ook dat niet te serieus, het was een opmerking met een smiley er bij. Zoals ik al zei ken ik Lotus Notes niet goed genoeg om Domino Replication en Domino Clustering tot in de details met Cluster Continuous Replication te vergelijken, maar ik vind het wel interessant om hier wat verder op in te zoomen.

Bij Exchange CCR wordt op de passieve node een kopie van de database up to date gehouden op basis van log shipping. Wanneer er een failover plaats vindt omdat bijvoorbeeld het datacenter waar de actieve node staat niet meer beschikbaar is, dan is het mogelijk dat de laatste logfile nog niet weggeschreven of gekopieerd was naar de andere node. Stel dat de logfile bijna vol was dan hebben we het over 1 MB aan data die de passieve node nog mist. Wanneer de passieve node actief wordt dan raadpleegt hij de Hub Transport server, deze heeft een kopie van de laatst langsgekomen mail bijgehouden en stuurt de laatste bulk opnieuw naar de CCR node. Deze verwerkt de ontbrekende berichten alsnog en zo wordt het verlies van de 1 MB nog verder geminimaliseerd.

Asynchroon? Ja. Mindere oplossing? Weet ik niet. Je moet niet vergeten dat in de Exchange wereld tot en met Exchange 2003 maar één vorm van hoge beschikbaarheid kende, namelijk het Single Copy Cluster. Met Exchange 2007 CCR (en LCR trouwens) werd het voor het eerst mogelijk om meerdere kopieën van je data te bewaren zodat de data geen SPOF meer is. Als je de HA mogelijkheden van Exchange 2007 bekijkt dan zie je dat LCR een hoge beschikbaarheid van de data biedt, SCC een hoge beschikbaarheid van de dienst en alleen CCR zowel hoge beschikbaarheid van de dienst als van de data. De pagina die je aanhaalde geeft een goed overzicht van de werking van CCR in de praktijk, welke fouten er op kunnen treden en hoe daar op gereageerd wordt.

Je kunt CCR dus zeker niet vergelijken met Domino Replication omdat Domino Replication slechts periodiek synchroniseert. CCR komt het meest overeen met Domino Clustering, al werkt het onder de motorkap wel wat anders. Waarbij CCR met logfiles werkt worden transacties achtereenvolgens weggeschreven in een logbestand, doorgevoerd in het database-bestand en het ckeckpoint bijgewerkt. Daarna wordt het logbestand naar de passieve node gekopieerd, als die niet beschikbaar dan blijven de logfiles gewoon op disk staan en worden ze alsnog gekopieerd als de passieve node weer online komt. Domino Clustering werkt anders, daar worden de wijzingen in het geheugen opgeslagen en kan er alleen worden gesynchroniseerd als de andere node ook beschikbaar is. Wanneer die niet beschikbaar is dan blijven de wijzigingen in het geheugen bewaard en als deze server herstart wordt of wegvalt voordat de andere node beschikbaar komt gaan de wijzigingen verloren. Om die reden wordt bij Domino Clustering aanbevolen om ook een replicatie-task te schedulen om de databases zo veel mogelijk identiek te houden.

Het klinkt raar misschien, maar we hebben het hier al over verouderde techniek. In Exchange 2010 is Continuous Availability verder doorontwikkeld, nog steeds gebaseerd op de technische basis van Windows Failover Clustering en Continuous Replication. In Exchange 2010 kun je meer dan 2 kopieën van de data hebben, tot zelfs 16 stuks maximaal. De kopieën zijn zelf herstellend, dat betekent dat eventuele corruptie zelf hersteld kan worden, zonder dat een reseed van de actieve node nodig is. Goed nieuws voor veel beheerder is Incremental Deployment, dat betekent dat je geen cluster meer hoeftaan te maken en te configureren. Zodra je een tweede server aan de Database Availability Group toevoegt wordt de onderliggende techniek door Exchange geconfigureerd. Het toevoegen van een DAG member wordt nu dus even eenvoudig als het configureren van clustering op een Domino database.

Als je meer wilt weten over Exchange dan kun je de artikelen op het Exchange Thema Blog eens volgen: http://www.ngn.nl/ngn/weblogs/exchange-themablog/ of op 9 februari naar de NGN Exchange Middag komen in Bunnik: http://www.ngn.nl/exchangemiddag
Afzender: Jetze Mellema

Web toegang 3-2-2010 00:56

[quote]Voor webmail geldt hetzelfde. Deze is ook redundant opgezet. Door het ‘A’ record van de DNS entry aan te passen, komen gebruikers uit de webmail server waarvan je weet dat ze die kunnen gebruiken.[/quote]
Kan dat softwarematig niet dynamisch cq load-balancen? Dat zat al in Windows 2000 AS.

[quote]Eventueel kan je op je website, als deze extern gehost word, ook een linkje plaatsen naar de webmail die je ingeval van een disaster aanpast.[/quote]
Handig. Zo van "Klik hier, en als dat niet werkt klik dan hier. Of probeer hier .. of hier" ?
Afzender: Michel de Rooij

web redundant 3-2-2010 09:12

Hoi,

@Michel
Er zal vast het e.a. aan verbeterd kunnen worden. Omdat een beperkte groep mensen webmail kunnen gebruiken is hier minder aandacht aan besteed.

Alex

Afzender: Alex Warmerdam

Exchange in DR mode 3-2-2010 09:16

Hoi,

@Jetze,

Ik zou bijna zeggen. Zet eens een test omgeving op en laat zien hoe en dat het werkt :)

Life test die daarna op NGNtv te zien is.

Als ik dan mag testen....

Alex
Afzender: Alex Warmerdam

Wat is je punt? 3-2-2010 12:14

Alex, ik steek heel veel vrije tijd in het delen van kennis over Exchange en ben altijd bereid om wat uit te leggen. Ook hebben wij bij PQR een demo-omgeving klaar staan waarmee je naar hartelust mee kunt testen.

Maar dat doe ik alleen als je met open vizier naar een alternatieve oplossing kunt kijken. Het is geen wedstrijd om gaten te schieten in de oplossing van de concurrent. Ik besteed mijn tijd liever aan 1000 andere dingen dan zinloze flamewars of discussies met fanboys.

Nog veel liever zie ik je op de NGN Exchange middag op 9 februari, daar kun je een hele middag Exchange opsnuiven en presenteert Kay Sellenrode over Exchange 2010 High Availability, inclusief demo's.

Als je daarna nog vragen hebt of specifieke dingen wilt testen, dan hoor ik het graag.
Afzender: Jetze Mellema

Zien is geloven 3-2-2010 12:29

Hoi,

Ik ben en blijf een techneut. Zo ben ik en veel NGN leden.

Dat is puur de insteek van mijn opmerking.

Laten zien is doen geloven.

Dat is alles.

Alex
Afzender: Alex Warmerdam

Reageer op dit artikel

Naam:
Uw Email adres:
Titel:
Bericht: