Implementering av feiltoleranse på Windows Networks

En grunnleggende regel av databehandling (og livet generelt) er at ting bryte ned. På grunn av dette, er det viktig å sikre at komponentene i en Windows-server mislykkes sjelden og kan raskt gjenopprettet etter en feil oppstår. Feiltolerante teknologier er maskinvare- og programvarefunksjoner som hindrer at feil oppstår (høy pålitelighet) og gjør mislykkede komponenter byttes ut eller restaurert med minimal driftsavbrudd (høy tilgjengelighet). Denne artikkelen beskriver de ulike alternativene for å implementere feiltoleranse ved hjelp av Windows Server 2003 Enterprise Edition. Vi skal se kort på feiltoleranse i tre hovedområder:. Maskinvare, lagring og nettverksapplikasjoner

Pålitelig Hardware

Mens hardware feiltoleranse er i hovedsak implementert i systemet (hovedkort) selv, Windows gir indirekte støtte for maskinvare feiltoleranse ved å støtte den underliggende maskinvaren som gjør at en slik feiltoleranse. Eksempler på hardware feiltoleranse på Windows-systemer inkluderer:

Hot swap harddisker for å tillate legge til eller fjerne SATA eller SCSI disker mens systemet er slått på og kjører.
Hot plug PCI-X-spor for å tillate legge til eller fjerne PCI-kort mens systemet er slått på og kjører.
redundante strømforsyninger og kjølevifter for å la systemet fortsette å fungere når strømforsyningen svikter eller en fan slutter å fungere.

I tillegg til disse avanserte maskinvare teknologier, som er generelt bare tilgjengelig på dyrere enterprise-nivå systemer, kan påliteligheten bli styrket ved å sikre omgivelsene er også feil tolerant. For eksempel:
- avbruddsfri strømforsyning (UPS) for å sikre systemer kan slå ordentlig når elektrisk kraft til nettstedet ditt svikter.
- Generatorer å tillate kritiske systemer for å fortsette driften under en langsiktig kraft blackout.
- Spennings filtre (vanligvis bygget inn i UPS) for å sikre spenningsvariasjoner (pigger) ikke skade komponentene eller føre til tap av data.
- Redundans og feiltoleranse i nettverksinfrastruktur enheter som svitsjer og rutere.
- Redundant WAN-koblinger for å gi sekundære nettverkstilkoblinger mellom områder bør det primære WAN koblingen gå ned.
- Redundant ISPer (multihoming) for å sikre svært pålitelig Internett-tilgang.
  
  Endelig varme reserveservere som fullt konfigurert og klar til å gå på nettet bør en produksjonsserver erfaring katastrofal svikt kan gi en enkel, men kostbar løsning for å sikre nær 100% oppetid i virksomhetskritiske miljøer. Gitt en uendelig mengde penger i IT-budsjettet, kan et system admin gjennomføre alle disse teknologiene for å sikre tilnærmet 100% oppetid. Praktisk talt imidlertid må man velge hva man har råd til i riket av avansert maskinvare støtte og planlegge for de beste.
  
  Noe som noen ganger ikke anses ved implementering av feiltolerante maskinvare er å sikre at en tilstrekkelig tilførsel av reservedeler er lett tilgjengelig på stedet, og også lett tilgjengelig. Det er ikke mye hjelp hvis serveren støtter hot swap harddisker hvis du ikke har noen reservedeler rundt eller hvis du holder dem i en annen bygning eller må signere for dem å få dem. En annen ting å vurdere når du bruker en slik maskinvare er å sikre at de er sertifisert for Windows Server-katalogen, som sikrer at maskinvaren er fullt kompatibel med og støttes av Windows Server 2003.
  
  Pålitelig Storage
  
  Trolig den mest kjente feiltolerant teknologi som støttes av Windows er programvare RAID, som er tilgjengelig på systemer der standarddisker har blitt endret til dynamiske disker. RAID 1 (speiling) er en utmerket metode for å gi feiltoleranse for boot /systemvolumer, mens RAID 5 (diskstriping med paritet) øker både hastighet og pålitelighet av høy transaksjonsdatamengder som de hosting databaser. Programvare RAID betyr at RAID er implementert i Windows selv, men for enda høyere ytelse og større feiltoleranse kan du velge å implementere hardware RAID i stedet, selv om dette er generelt en dyrere løsning enn software RAID. Tradisjonelt fleste software RAID-systemer har brukt SCSI, men et annet alternativ vanlig nå til dags er SATA (Serial ATA), som vanligvis er bare en brøkdel av prisen for SCSI, men med nesten sammenlignbar ytelse.
  
  Det er mer til RAID så langt som feiltoleranse i lagring går imidlertid. Ved å implementere (DFS) Distributed File System på nettverket og replikere DFS røtter bruker File Replication Service (FRS), kan du sikre maksimal redundans for delte volumer, slik at brukerne kan få tilgang til delte filer på nettverket ikke bare lettere, men også når en bestemt fil server går ned. For mer informasjon om hvordan DFS fungerer og hvordan du skal gjennomføre det, se Andrew Tabona artikkel Windows 2003 DFS (Distributed File System )
  her på WindowsNetworking.com.
  
  En annen nyttig teknologi er Volume Shadow Copy Service (VSS), som lar Windows holde point-in-time snapshots av datamengder slik at brukerne kan gjenopprette utilsiktede slettede filer eller gå tilbake til tidligere versjoner av dokumenter de arbeider med . Mens strengt tatt ikke en feiltolerant teknologi, gjør VSS gi økt tilgjengelighet for brukerdata og bidrar til å beskytte den mot utilsiktet tap eller ødeleggelse. For mer informasjon om hvordan Shadow Copy fungerer og hvordan du skal gjennomføre det, se Brien Posey artikkel Arbeide med Windows Server 2003 Volume Shadow Copy Service den her på WindowsNetworking.com.
  
  Pålitelig Network Applications
  
  Distribuerte nettverksapplikasjoner selv blitt mer tilgjengelig og pålitelig når det kombineres med flere viktige feiltolerant teknologi i Windows Server 2003 Enterprise Edition. En slik teknologi er serverklynger, høy tilgjengelighet løsning implementert i Enterprise Edition bruker Cluster Service. Serverklynger kan konfigureres på en rekke forskjellige måter, og kan inneholde opp til 8 noder (servere) innenfor hver klynge. Noen av de konfigurasjoner der serverklynger kan gi feiltoleranse for nettverksapplikasjoner inkluderer: