Danke für die spannende Erörterung zu Mirrors, der Link war sehr lehrreich!
Wobei dieser Artikel, vorsichtig formuliert, nicht ganz unumstritten ist. Die Empfehlung einen 2-way mirror einem RAIDZ2 vorzuziehen halte ich persoenlich fuer fahrlaessig. Man darf ausserdem nicht vergessen, dass dieser Artikel schon ein paar Jahre auf dem Buckel hat. Damit haben sich die Dinge potentiell ausreichend veraendert, dass die Schlussfolgerungen des Artikels fuer das eigene System hinterfragt werden sollten. Es sind viele gute und richtige Punkte beschrieben, aber eben auch Sachen, die nicht so schwarz-weiss sind wie dargestellt.
Zum Aktuellen Planungsstand liegt es also zwischen RaidZ2 und Mirror.
Beide sind fuer sehr unterschiedliche Workloads gedacht. Letzterer sollte der bestimmende Faktor sein.
Was ich mich frage ist: Wenn nun aus einem VDev eine Platte stirbt, dann bestehe doch das (gefühlt recht hohe) Risiko, dass während des Resilvering die Andere Platte aus dem selben VDev stirbt.
Genau dieser Eindruck wird im Artikel geweckt und er ist meiner Meinung nach aus mehreren Gruenden falsch.
1) Es stimmt, dass waehrend eines RAIDZ Resilverings die mechanische Beanspruchung einer Platte
unter bestimmten Bedingungen hoeher ist als im Normalbetrieb. Mit anderen Worten: Im Normalbetrieb liegt die mechanische Auslastung ausreichend deutlich unter 100%. Das ist im Heimbereich sicher der Fall. Auf der anderen Seite sind zumindest Platten, die fuer den Einsatz im Rechenzentrum gedacht sind, hoffentlich auf mehr oder weniger 100% Auslastung ausgelegt. Und genau hier wird es interessant. Denn da mehr als 100% nicht geht, bedeutet dies, dass beim Resilvering einfach nur ein Teil der Aktivitaet anders ist als im Normalbetrieb. Statt Daten an den Client zu liefern, werden Daten an den Resilver-Prozess geliefert. Und man darf nicht vergessen, dass ZFS fuer extreme Szenarien im RZ-Betrieb entwickelt wurde. Insofern muss man aus meiner Sicht bei Ueberlegeungen wie dieser hier auch von einem solchen Umfeld ausgehen.
2) Statistik: Ein
hoeheres Risiko ist nicht automatisch ein
hohes Risiko. Mal angenommen, das mein Argument 1) falsch sei. Weiterhin angenommen, dass das Ausfallrisiko einer Platte ueber einen Zeitraum von 2 Wochen (wenn das die Dauer des Resilverings ist) im Normalbetrieb bei 1% liegt (sicher deutlich zu hoch angesetzt). Dann bedeutet ein um 50% erhoehtes Risiko beim Resilvering (sicher auch deutlich zu hoch angesetzt), dass das Gesamtrisiko auf 1,5% steigt. Ist das jetzt so eine Riesenunterschied? Aber halt! Bei RAIDZ2 waere auch das noch kein Problem. Denn erst beim Ausfall der dritten Platte sind meine Daten weg. Das Problem mit Wahrscheinlichkeiten ist, dass sie anders funktionieren als das normale "mathematische Bauchgefuehl".
3) Backup bzw. Business Continuity
Es gibt diverse Risiken (v.a. menschliche), die mit deutlich hoehrer Wahrscheinlichkeit eintreten als der Ausfall einer, geschweige denn mehrerer Platten quasi gleichzeitig (egal ob im Mirror oder RAIDZ). Insofern brauche ich sowieso immer ein Backup. Und das relativiert, wenn es funktioniert(!), auch die Auswirkungen eines katastrophalen Plattenausfalls.
4) Click-bait
Der Titel ist reisserisch gewaehlt und das sagt viel ueber den Autor bzw. Artikel aus. Es funktioniert ja offensichtlich seit vielen Jahren, sonst wuerde das Teil nicht regelmaessig auftauchen. Aber serioes finde ich den Text nicht.
Das sollte als Kritik erstmal reichen
Damit wäre der gesamte Pool down, oder? Fühlt sich diese Angst nur für mich recht begründet an?
Ja waere er. Aber zumindest aus meiner Sicht ist es in dieser Form Panikmache (s.o.). Und ich bin wirklich paranoid was meine Daten angeht. Aber das sichere ich ueber verschiedene Backup ab. Und ich habe, weil es primaer um Archiv-aehnliche Daten geht, immer nur RAIDZ genutzt. Nach 4 Jahren RAIDZ1 (5*1 TB) sind es nun ueber 10 Jahre RAIDZ2 (erst 6*4 TB und jetzt 8*16 TB). Und mir sind in Summe mind. 5 Platten verreckt.
Wäre es dann in so einem Fall sinnvoll (da ich ja ältere und neuere Platten habe) jeweils die einzelnen Vdevs aus einer neueren und einer älteren Platte zu erstellen? (Also nicht zwei (risikobelastetere) ältere Platten in einen Mirror).
Kannst Du Deine Platten nochmal kurz beschreiben?