Implementering av feiltoleranse på Windows Networks


En grunnleggende regel av databehandling (og livet generelt) er at ting bryte ned. På grunn av dette, er det viktig å sikre at komponentene i en Windows-server mislykkes sjelden og kan raskt gjenopprettet etter en feil oppstår. Feiltolerante teknologier er maskinvare- og programvarefunksjoner som hindrer at feil oppstår (høy pålitelighet) og gjør mislykkede komponenter byttes ut eller restaurert med minimal driftsavbrudd (høy tilgjengelighet). Denne artikkelen beskriver de ulike alternativene for å implementere feiltoleranse ved hjelp av Windows Server 2003 Enterprise Edition. Vi skal se kort på feiltoleranse i tre hovedområder:. Maskinvare, lagring og nettverksapplikasjoner

Pålitelig Hardware

Mens hardware feiltoleranse er i hovedsak implementert i systemet (hovedkort) selv, Windows gir indirekte støtte for maskinvare feiltoleranse ved å støtte den underliggende maskinvaren som gjør at en slik feiltoleranse. Eksempler på hardware feiltoleranse på Windows-systemer inkluderer:


    Hot legge minne til å tillate å legge til mer RAM mens systemet er slått på og kjører, uten omstart er nødvendig for å anerkjenne den nye hukommelsen.
  • Hot swap harddisker for å tillate legge til eller fjerne SATA eller SCSI disker mens systemet er slått på og kjører.
  • Hot plug PCI-X-spor for å tillate legge til eller fjerne PCI-kort mens systemet er slått på og kjører.
  • redundante strømforsyninger og kjølevifter for å la systemet fortsette å fungere når strømforsyningen svikter eller en fan slutter å fungere.

    I tillegg til disse avanserte maskinvare teknologier, som er generelt bare tilgjengelig på dyrere enterprise-nivå systemer, kan påliteligheten bli styrket ved å sikre omgivelsene er også feil tolerant. For eksempel:

    • avbruddsfri strømforsyning (UPS) for å sikre systemer kan slå ordentlig når elektrisk kraft til nettstedet ditt svikter.
    • Generatorer å tillate kritiske systemer for å fortsette driften under en langsiktig kraft blackout.
    • Spennings filtre (vanligvis bygget inn i UPS) for å sikre spenningsvariasjoner (pigger) ikke skade komponentene eller føre til tap av data.
    • Redundans og feiltoleranse i nettverksinfrastruktur enheter som svitsjer og rutere.
    • Redundant WAN-koblinger for å gi sekundære nettverkstilkoblinger mellom områder bør det primære WAN koblingen gå ned.
    • Redundant ISPer (multihoming) for å sikre svært pålitelig Internett-tilgang.

      Endelig varme reserveservere som fullt konfigurert og klar til å gå på nettet bør en produksjonsserver erfaring katastrofal svikt kan gi en enkel, men kostbar løsning for å sikre nær 100% oppetid i virksomhetskritiske miljøer. Gitt en uendelig mengde penger i IT-budsjettet, kan et system admin gjennomføre alle disse teknologiene for å sikre tilnærmet 100% oppetid. Praktisk talt imidlertid må man velge hva man har råd til i riket av avansert maskinvare støtte og planlegge for de beste.

      Noe som noen ganger ikke anses ved implementering av feiltolerante maskinvare er å sikre at en tilstrekkelig tilførsel av reservedeler er lett tilgjengelig på stedet, og også lett tilgjengelig. Det er ikke mye hjelp hvis serveren støtter hot swap harddisker hvis du ikke har noen reservedeler rundt eller hvis du holder dem i en annen bygning eller må signere for dem å få dem. En annen ting å vurdere når du bruker en slik maskinvare er å sikre at de er sertifisert for Windows Server-katalogen, som sikrer at maskinvaren er fullt kompatibel med og støttes av Windows Server 2003.

      Pålitelig Storage

      Trolig den mest kjente feiltolerant teknologi som støttes av Windows er programvare RAID, som er tilgjengelig på systemer der standarddisker har blitt endret til dynamiske disker. RAID 1 (speiling) er en utmerket metode for å gi feiltoleranse for boot /systemvolumer, mens RAID 5 (diskstriping med paritet) øker både hastighet og pålitelighet av høy transaksjonsdatamengder som de hosting databaser. Programvare RAID betyr at RAID er implementert i Windows selv, men for enda høyere ytelse og større feiltoleranse kan du velge å implementere hardware RAID i stedet, selv om dette er generelt en dyrere løsning enn software RAID. Tradisjonelt fleste software RAID-systemer har brukt SCSI, men et annet alternativ vanlig nå til dags er SATA (Serial ATA), som vanligvis er bare en brøkdel av prisen for SCSI, men med nesten sammenlignbar ytelse.

      Det er mer til RAID så langt som feiltoleranse i lagring går imidlertid. Ved å implementere (DFS) Distributed File System på nettverket og replikere DFS røtter bruker File Replication Service (FRS), kan du sikre maksimal redundans for delte volumer, slik at brukerne kan få tilgang til delte filer på nettverket ikke bare lettere, men også når en bestemt fil server går ned. For mer informasjon om hvordan DFS fungerer og hvordan du skal gjennomføre det, se Andrew Tabona artikkel Windows 2003 DFS (Distributed File System )
      her på WindowsNetworking.com.

      En annen nyttig teknologi er Volume Shadow Copy Service (VSS), som lar Windows holde point-in-time snapshots av datamengder slik at brukerne kan gjenopprette utilsiktede slettede filer eller gå tilbake til tidligere versjoner av dokumenter de arbeider med . Mens strengt tatt ikke en feiltolerant teknologi, gjør VSS gi økt tilgjengelighet for brukerdata og bidrar til å beskytte den mot utilsiktet tap eller ødeleggelse. For mer informasjon om hvordan Shadow Copy fungerer og hvordan du skal gjennomføre det, se Brien Posey artikkel Arbeide med Windows Server 2003 Volume Shadow Copy Service den her på WindowsNetworking.com.

      Pålitelig Network Applications

      Distribuerte nettverksapplikasjoner selv blitt mer tilgjengelig og pålitelig når det kombineres med flere viktige feiltolerant teknologi i Windows Server 2003 Enterprise Edition. En slik teknologi er serverklynger, høy tilgjengelighet løsning implementert i Enterprise Edition bruker Cluster Service. Serverklynger kan konfigureres på en rekke forskjellige måter, og kan inneholde opp til 8 noder (servere) innenfor hver klynge. Noen av de konfigurasjoner der serverklynger kan gi feiltoleranse for nettverksapplikasjoner inkluderer:


        Aktiv /aktiv clustering, der flere noder dele belastningen av behandlingen av klientforespørsler. Hvis en node går ned, kan andre aktive noder ta opp slakk til noden er brakt opp igjen.
      • Aktiv /passiv clustering, der en eller flere noder er på standby og kan bringes opp raskt når en arbeidsgruppe node feiler.
      • Hot standby clustering, der flere failover noder er konsolidert i en enkelt hot standby node som cam bringes på nettet hvis det er nødvendig å ta opp arbeidet til enhver feilet node i klyngen.

        Avhengig av hvordan klynger blir gjennomført, kan du karakterisere nettverk applikasjoner som kjører på din klynge i en av tre forskjellige måter:

        • enkelt forekomst søknader, der en forekomst av applikasjonen kjører på klyngen på et bestemt tidspunkt. Denne tilnærmingen er vanligvis brukt for å arrangere nettverkstjenester, for eksempel et klynge DHCP server.
        • Multiple eksempel klonet applikasjoner, der identisk kode kjører mot identiske data på flere noder gir utseendet til nettverksklienter av en enkelt forekomst søknad. Denne tilnærmingen er vanligvis brukt for å kjøre statsløse søknader, men tilstands programmer kan også implementeres på denne måten gitt koble klienter er utstyrt med symboler som sporer øktstatus.
        • Multiple eksempel partisjonert applikasjoner, hvor programkode og data er partisjonert til å kjøre på forskjellige noder i en klynge. Denne tilnærmingen er vanligvis brukt for å kjøre tilstands applikasjoner, for eksempel en SQL-database applikasjon som enkelt kan deles inn i ulike deler for ulike grupper av kunder.

          Windows Server 2003, støtter Enterprise Edition også en ny funksjon kalt flertallet node clustering, som gjør at noder i en klynge for å være geografisk spredt fra hverandre, men likevel opprettholde indre konsistens og gir feiltoleranse for å gjennomføres på en fordelt måte på flere områder. For mer informasjon om denne funksjonen se kalt geografisk spredt Clusters i Windows Server 2003 i Admin Knowledge Base her på WindowsNetworking.com tips.

          En annen måte å implementere feiltoleranse for distribuerte klient /tjener-applikasjoner er å bruke Network Load Balancing (NLB) komponenten i Windows Server 2003. Denne funksjonen kan brukes til å gi failover støtte for applikasjoner og tjenester som kjører på IP-nettverk, for eksempel web-applikasjoner som kjører på Internet Information Services (IIS). Bruke NLB du kan skalere et program ut for å kjøre på så mange som 32 separate servere, og mens det viktigste formålet med denne tilnærmingen er å øke tilgjengeligheten og gi høyere skalerbarhet, gir NLB også feiltoleranse for å øke påliteligheten i tillegg.

          For en rask innføring i noen av de grunnleggende begrepene clustering på Windows Server 2003, kan du se Brien Posey artikkel Forstå hvordan klase quorum Arbeidet her på WindowsNetworking.com.

          Konklusjon

          De forskjellige maskinvare og programvare feiltolerant teknologier støttes av Windows Server 2003 Enterprise Edition, gjøre det til en kraftig plattform for virksomhetskritiske forretningsapplikasjoner. Ved judiciously velge hvilke av disse teknologiene for å implementere, kan du sikre høy pålitelighet og høy tilgjengelighet samtidig er forsiktig for ikke å bryte budsjettet.