Was ist Redundanz im Rechenzentrum? N, N+1, 2N, 2N+1

Unternehmen setzen weiterhin auf die digitale Transformation, um den Betrieb zu unterstützen und das Geschäftswachstum voranzutreiben. Da sich die Technologie zunehmend in jeden Aspekt des Geschäftsbetriebs integriert, wächst die Bedrohung und die potenziellen Auswirkungen von Ausfallzeiten exponentiell. Um diesen Bedarf an Hochverfügbarkeit zu decken, verlassen sich Unternehmen auf Rechenzentren von Drittanbietern, um ausfallsichere Umgebungen bereitzustellen, die Serviceunterbrechungen standhalten, um Verfügbarkeit und Geschäftskontinuität sicherzustellen.

Die Ursachen für Ausfallzeiten reichen von routinemäßiger Wartung und Hardwarefehlern bis hin zu Naturkatastrophen, Cyberangriffen und einfachen menschlichen Fehlern. Unabhängig davon, wie Ausfallzeiten auftreten, sind die Ergebnisse die gleichen: Sie können nicht auf Ihre kritischen Daten und Anwendungen zugreifen, Ihr Unternehmen betreiben und Ihre Kunden bedienen. Dies wirkt sich auf Ihr Endergebnis aus, indem Es die Einnahmequellen unterbricht, die Produktivität bremst, die Kundenerfahrung herabstuft und Ihren Ruf schädigt.

Die Realität ist, dass Ausfallzeiten einen erschütternden Tribut für Ihr Unternehmen fordern können. Laut Gartner betragen die durchschnittlichen Kosten für Ausfallzeiten 5.600 US-Dollar pro Minute.* Verlorene Dollars können sich bei einem längeren Ausfall schnell ansammeln. Die 11. jährliche ITIC-Umfrage zu den stündlichen Kosten für Ausfallzeiten ergab, dass 40% der Unternehmen angaben, dass die Kosten für eine Stunde Ausfallzeit zwischen 1 Million und mehr als 5 Millionen US—Dollar liegen können – ohne Anwaltskosten, Bußgelder oder Strafen. Die Umfrage ergab auch, dass ein katastrophaler Ausfall, der eine wichtige Geschäftstransaktion unterbricht oder während der Hauptgeschäftszeiten auftritt, Millionen von Dollar pro Minute übersteigen kann.

Da das Uptime Institute berichtet, dass mehr als 75% der Unternehmen in den letzten drei Jahren einen Ausfall erlitten haben, der erhebliche finanzielle und Markenschäden verursacht hat, sind Ausfallzeiten ein echtes und direktes Problem.

Während Ausfallzeiten jedes Unternehmen beeinflussen können, hat jede Organisation eine andere Risikotoleranz. Ein kleines Unternehmen, das nicht 24/7 arbeitet, kann in der Lage sein, geplante Ausfallzeiten außerhalb der Geschäftszeiten für die Wartung kritischer Hardware wie unterbrechungsfreie Stromversorgungssysteme (USV), HLK-Einheiten oder Notstromaggregate zu bewältigen. Ein ungeplanter Ausfall, der nicht schnell wiederhergestellt werden kann, kann jedoch finanziell verheerend sein. Ein Unternehmen mit internationaler Präsenz oder Rund-um-die-Uhr-Betrieb kann nicht einmal für geplante Wartungsarbeiten heruntergefahren werden und muss sich auf Infrastrukturredundanz innerhalb eines Rechenzentrums verlassen, um die gleichzeitige Wartbarkeit zu gewährleisten.

Wenn Ihr Unternehmen auf ein Rechenzentrum eines Drittanbieters angewiesen ist, um Ihre kritischen Server zu unterstützen, müssen Sie das Redundanzmodell verstehen, das das Rechenzentrum verwendet, um sicherzustellen, dass seine Architektur den Schutz bietet, den Ihr Unternehmen benötigt, um online zu bleiben.

Was ist ein redundantes Rechenzentrum?

Rechenzentren beheben Ausfallzeiten, indem sie Redundanz in ihre Infrastruktur integrieren. Eine redundante Rechenzentrumsarchitektur dupliziert kritische Komponenten wie USV—Systeme, Kühlsysteme und Backup-Generatoren, um sicherzustellen, dass der Betrieb des Rechenzentrums auch bei Ausfall einer Komponente fortgesetzt werden kann. Während erhöhte Redundanz Ausfallzeiten besser umgehen kann, ist ein vollständig redundantes Design teuer und nicht in jedem Unternehmensbudget enthalten.

Die gute Nachricht ist, dass Redundanz in einer Vielzahl von Konfigurationen erreicht werden kann, von denen jede ein progressives Sicherheitsniveau aufweist, um spezifische Anforderungen in Bezug auf Leistung, Verfügbarkeit und Kosten zu erfüllen. Um die Architektur zu finden, die Ihren Geschäftsanforderungen entspricht, müssen Sie zunächst Ihre Risikotoleranz und ihre Ausrichtung auf die verschiedenen Redundanzmodelle für Rechenzentren verstehen.

Welche Redundanzstufen gibt es im Rechenzentrum?

Rechenzentrumsredundanz ist keine Einheitslösung. Der Aufbau einer redundanten Architektur wird immer teurer, da mehr Komponenten hinzugefügt werden. Um die richtige Konfiguration für Ihr Unternehmen zu ermitteln, ist es wichtig, die Risiken und Fähigkeiten der verschiedenen Architekturen zu erkennen, einschließlich N, N+1, N+2, 2N und 2N+1.

Beachten Sie außerdem, dass ein bestimmtes Rechenzentrum mit mehreren Redundanzmodellen arbeiten kann. Eine USV kann 2N sein, während das Kühlsystem N + 1 ist. Das Kühlsystem kann N + 1 sein, hat aber immer noch einen einzigen Fehlerpunkt in der Rohrleitung. Alle Power Whips, ein kritischer Teil des Power Flow-Prozesses, müssen 2N sein, um Upstream-Redundanzen zu schaffen; die Einbeziehung einer einzelnen Stromversorgung würde den Zweck einer N + 1- oder 2N-USV zunichte machen, da es sich um einen Single Point of Failure handelt.

Bei all diesen redundanten Architekturen minimiert die Verwendung eines automatischen Übertragungsleistungsdesigns Unterbrechungen weiter. EINE automatische übertragung design sorgt dafür, dass, wenn eine stromquelle geht offline, kapazität ist sofort umgeleitet, um die bezeichnet backup einheit. Ein automatisches Übertragungsleistungsdesign kann durch die Installation eines automatischen Übertragungsschalters (ATS) oder einer logikgesteuerten Schaltanlage erreicht werden. Dies vermeidet Ausfallzeiten, die auftreten können, wenn ein Techniker manuell auf die Sekundäreinheit umschaltet.

Definieren von N

Bevor Sie jedes Redundanzmodell bewerten, müssen Sie N verstehen.

N ist die Mindestkapazität, die benötigt wird, um ein Rechenzentrum bei voller IT-Last mit Strom zu versorgen oder zu kühlen. Wenn ein Rechenzentrum beispielsweise vier USV-Einheiten benötigt, um mit voller Kapazität zu arbeiten, entspricht N vier.

Per Definition enthält N keine Redundanz, wodurch es anfällig für einzelne Fehlerpunkte ist. Dies bedeutet, dass eine voll ausgelastete Anlage mit einer N—Architektur keine Unterbrechung tolerieren kann – sei es ein Hardwarefehler, eine geplante Wartung oder ein unerwarteter Ausfall. Bei einem N-Design würde jede Unterbrechung dazu führen, dass Ihr Unternehmen nicht auf Ihre Anwendungen und Daten zugreifen kann, bis das Problem behoben ist.

N +1 Rechenzentrumsarchitektur

Die N + 1—Redundanz bietet ein minimales Maß an Ausfallsicherheit, indem eine einzelne Komponente — eine USV, ein HLK-System oder ein Generator – zur N-Architektur hinzugefügt wird, um einen Ausfall zu unterstützen oder die Wartung einer einzelnen Maschine zu ermöglichen. Wenn ein System offline ist, übernimmt die zusätzliche Komponente ihre Last. Zurück zum vorherigen Beispiel: Wenn N gleich vier USV-Einheiten ist, liefert N +1 fünf.

Diese Konfiguration folgt anerkannten Designstandards, die eine zusätzliche Komponente für alle vier erforderlichen Komponenten empfehlen, um die volle Kapazität zu unterstützen. Während N + 1 eine gewisse Redundanz einführt, stellt es bei mehreren gleichzeitigen Ausfällen immer noch ein Risiko dar. Um dieses Risiko zu minimieren, verwenden einige Rechenzentren ein N + 2-Redundanzdesign, um zwei zusätzliche Komponenten bereitzustellen. In unserem Beispiel würde dies sechs USV-Einheiten anstelle von fünf liefern.

Aufgrund der Einfachheit seiner Architektur ist ein N + 1-Design billiger und energieeffizienter als die anderen anspruchsvolleren Designs.

Bild: Generatorraum im CoreSite VA3 Northern Virginia Rechenzentrum in Reston, VA von Virtual Tour. CoreSite VA3 verfügt über N+2 redundante Backup-Generatoren.

Bild: Chillers bei CoreSite VA3 Northern Virginia Rechenzentrum in Tampon, VA von Virtual Tour. CoreSite VA3 verfügt über N + 2 Kältemaschinen, Kühltürme. N+2 CRAHs. 100% gleichzeitig wartbar.

2N Data Center Architecture

Ein 2N-Redundanzmodell erstellt ein Spiegelbild der ursprünglichen USV, des Kühlsystems oder der Generatoranordnung, um eine vollständige Fehlertoleranz zu gewährleisten. Das heißt, wenn vier USV-Einheiten erforderlich sind, um die Kapazitätsanforderungen zu erfüllen, würde die redundante Architektur weitere vier USV-Einheiten für insgesamt acht Systeme umfassen. Dieses Design verwendet auch zwei unabhängige Verteilungssysteme.

Diese Architektur ermöglicht es dem Rechenzentrumsbetreiber, einen ganzen Satz von Komponenten für die Wartung zu entfernen, ohne den normalen Betrieb zu unterbrechen. Für den Fall, dass die primäre Architektur ausfällt, übernimmt die sekundäre Architektur die Wartung des Dienstes. Die Ausfallsicherheit dieser Architektur verringert die Wahrscheinlichkeit von Ausfallzeiten erheblich.

Bild: Elektro- und USV-Raum im CoreSite VA3 Northern Virginia Rechenzentrum in Reston, VA von Virtual Tour. CoreSite VA3 verfügt über ein 2N und verteiltes redundantes 4-zu-2-3-USV-System mit einer Catcher UPS 2N-Verteilung auf PDU- und RPP-Ebene

2N+1 Data Center Architecture

2N+1 bietet die vollständig fehlertolerante 2N-Architektur sowie eine zusätzliche Komponente für eine zusätzliche Schutzebene. Diese Architektur kann nicht nur mehreren Komponentenausfällen standhalten, selbst im schlimmsten Fall, wenn das gesamte Primärsystem ausfällt, sondern auch eine N + 1-Redundanz aufrechterhalten.

Diese Redundanzstufe wird im Allgemeinen von großen Unternehmen genutzt, die selbst geringfügige Dienstunterbrechungen nicht tolerieren können.

Was haben Rechenzentrumsebenen mit Redundanz zu tun?

Redundanz ist unzweifelhaft integraler Bestandteil bei der Messung der Zuverlässigkeit, Leistung und Verfügbarkeit von Rechenzentren, doch das Hinzufügen zusätzlicher Komponenten zur wesentlichen Infrastruktur des Rechenzentrums ist nur ein Element zur Bereitstellung dieser Redundanz. Das Uptime Institute bietet ein Einstufungssystem, das Rechenzentren nach vier verschiedenen Stufen zertifiziert – Tier 1, Tier 2, Tier 3 und Tier 4.

Die progressiven Zertifizierungsstufen der Rechenzentrumsebene stellen strenge und spezifische Anforderungen an die Funktionen und das Mindestmaß an Service, das ein für diese Ebene zertifiziertes Rechenzentrum bietet. Während das Niveau der redundanten Komponenten sicherlich ein Faktor ist, bewertet das Uptime Institute auch das Fachwissen der Mitarbeiter, Wartungsprotokolle und mehr. Diese Faktoren ergeben zusammen die folgenden Mindestverfügbarkeitsgarantien**:

  • Rechenzentrum Tier 1 Betriebszeit: 99. 671% oder weniger als 28,8 Stunden Ausfallzeit pro Jahr
  • Tier 2-Betriebszeit des Rechenzentrums: 99.741% oder weniger als 22 Stunden Ausfallzeit pro Jahr
  • Tier 3-Betriebszeit des Rechenzentrums: 99. 982% oder weniger als 1,6 Stunden Ausfallzeit pro Jahr
  • Tier 4-Betriebszeit des Rechenzentrums: 99. 995% oder weniger als 26,3 Minuten Ausfallzeit pro Jahr

Die intensivierenden Funktionen jeder Ebene können Ihnen einen weiteren Bezugspunkt bieten, der Ihnen hilft, das Leistungsniveau eines Rechenzentrums zu verstehen.

Was ist Ihre Risikotoleranz?

Die Auswahl der redundanten Architektur, die Ihren Geschäftsanforderungen entspricht, kann eine Herausforderung sein. Die Zuordnung Ihrer Geschäftsanforderungen zu einem geeigneten Redundanzmodell ist ein wesentlicher Schritt, um sicherzustellen, dass Ihr Rechenzentrumsanbieter den Schutz bietet, der Ihnen eine angemessene Verfügbarkeitsgarantie unter Einhaltung Ihres Budgets bietet. Das richtige Gleichgewicht zwischen dieser Zuverlässigkeit und den Kosten zu finden, ist von entscheidender Bedeutung, da ein ineffektives Redundanzmodell für Rechenzentren verheerende Folgen für Ihr Unternehmen haben kann.

The end game arbeitet mit einem Rechenzentrumsanbieter zusammen, der Ihre Anforderungen erfüllt und Beratung sowie Geschäftssicherheit bietet, sodass Sie Ihre Kunden kontinuierlich betreuen und Ihr Geschäft aufbauen können.

Leave a Reply