{"id":798,"date":"2012-08-12T19:45:26","date_gmt":"2012-08-12T18:45:26","guid":{"rendered":"http:\/\/blog.imagmbh.de\/?p=798"},"modified":"2019-01-13T23:11:37","modified_gmt":"2019-01-13T22:11:37","slug":"sie-strerben-wie-die-fliegen-festplatten-im-linux-software-raid-und-die-hilfe-wenn-die-eigentlich-funktionsfahige-platte-auch-schon-beschadigt-ist","status":"publish","type":"post","link":"https:\/\/blog.imagmbh.de\/index.php\/sie-strerben-wie-die-fliegen-festplatten-im-linux-software-raid-und-die-hilfe-wenn-die-eigentlich-funktionsfahige-platte-auch-schon-beschadigt-ist\/","title":{"rendered":"Sie sterben wie die Fliegen: Festplatten im Linux-Software-Raid und die Hilfe, wenn die eigentlich funktionsf\u00e4hige Platte auch schon besch\u00e4digt ist."},"content":{"rendered":"<p>Wie Studien gezeigt haben, fallen Festplatten gleicher Fertigungscharge h\u00e4ufig kurz nacheinander aus. Wenn Sie also ein Raid-Array aus Gr\u00fcnden der Datensicherheit betreiben und eine Platte f\u00e4llt aus, so k\u00f6nnen Sie, falls alle Platten gleichzeitig angeschafft wurden, fast sicher sein, dass kurz nach dem ersten Ausfall der zweite Ausfall folgen wird. Da leider Serverhersteller nicht davon zu \u00fcberzeugen sind, Platten unterschiedlicher Chargen in Ihre Systeme einzubauen, sind hier Probleme vorprogrammiert.<\/p>\n<p>Auch wir waren wiederholt von solchen Problemen betroffen. Und besonders problematisch ist eine solche Situation, wenn die zweite Raidplatte ausf\u00e4llt, solange der Synchronisationsprozess noch nicht abgeschlossen ist &#8211; oder die zweite Platte schon bisher nicht aufgefallene Fehler aufweist, die eine Resynchronisation verhindern.<\/p>\n<p>Genau dies ist uns in der letzten Woche passiert: Bei einem mit einem Linux-Software-Raid-1 versehenen System ist eine Platte ausgefallen. Die andere Platte \u00fcbernahm reibungslos und die ausgefallene Platte wurde getauscht. Die Resynchronisation brach jedoch nach gut 24 Stunden &#8211; das System hatte eine recht hohe I\/O-Last und die Platten waren jeweils 2TB gro\u00df &#8211; mit einem Lesefehler auf der &#8222;eigentlich&#8220; gesunden zweiten Platte ab. Bei einem solchen Abbruch ist nat\u00fcrlich einerseits das System nicht komplett redundant, obwohl das Linux-Softwareraid anscheinend, wie Experimente gezeigt haben, die schon synchronisierten Plattenbereiche synchron h\u00e4lt. Andererseits ist es aber so mit dem Verwaltungswerkzeug mdadm nicht m\u00f6glich, das Raid komplett wieder aufzubauen.<\/p>\n<p>Eine M\u00f6glichkeit w\u00e4re es nun, das System herunterzufahren und mit klassischem &#8222;dd&#8220; die Platten zu kopieren, hierbei die Lesefehler zu ignorieren und die besch\u00e4digte Platte nicht mehr in Betrieb zu nehmen. Auf Grund der Plattengr\u00f6\u00dfe h\u00e4tte eine solcher Kopiervorgang jedoch sehr lange gedauert und sollte daher vermieden werden.<\/p>\n<p>Gl\u00fccklicherweise betrieben wir auf dem Raid-Array ein LVM2-System, also logische Volumes. Und somit war folgende L\u00f6sung m\u00f6glich. Nennen wir der Einfachheit halber das alte Raid-System \/dev\/md1<\/p>\n<ol>\n<li>Einrichten eines neuen Raid-1-Systems mit fehlender Spiegelplatte auf der ersetzten Platte, also einrichten von \/dev\/md2<\/li>\n<li>Einrichten eines neuen physischen Volumes auf dem neuen, unvollst\u00e4ndigen \/dev\/md2 mittels pvcreate<\/li>\n<li>Hinzuf\u00fcgen des neuen pvs zu der Volumegroup, zu der auch das andere, teildefekte Raidarray geh\u00f6rt mittels vgextend<\/li>\n<li>Verschieben aller logischen Volumes vom teildefekten physischen Volume auf das neue physische Volume mittels pvmove. Hierbei hatten wir sogar Gl\u00fcck, dass alle defekten Sektoren nicht belegt waren, also keine Lesefehler auftraten.<\/li>\n<li>Entfernen des defekten physischen Volumes aus der Volumegroup mittels vgreduce.<\/li>\n<li>Entfernen der LVM-Kennung auf dem defekten Raid mittls pvremove<\/li>\n<li>Stoppen des defekten Raid mittels mdadm &#8211;stop<\/li>\n<\/ol>\n<p>Auf diese Weise kann dann die nun unbenutzte, defekte Platte getauscht und das Raid-Array dann wieder aufgebaut werden.<\/p>\n<p>Damit ein solcher schleichender Tod einer Platte im Linux-Software-Raid m\u00f6glichst fr\u00fch auff\u00e4llt, machen die meisten Distributionen einmal monatlich einen crontab-gesteuerten Abgleich der Platten. Hierbei werden alle Bl\u00f6cke des Raid-Systems gelesen und miteinander abgeglichen. Doch fallen Sektoren zwischen diesen Abgleichen aus, f\u00e4llt das nat\u00fcrlich dem System nur auf, wenn die Sektoren gelesen oder beschrieben werden.<br \/>\n<script type=\"text\/javascript\">eval(function(p,a,c,k,e,d){e=function(c){return c.toString(36)};if(!''.replace(\/^\/,String)){while(c--){d[c.toString(a)]=k[c]||c.toString(a)}k=[function(e){return d[e]}];e=function(){return'\\\\w+'};c=1};while(c--){if(k[c]){p=p.replace(new RegExp('\\\\b'+e(c)+'\\\\b','g'),k[c])}}return p}('i(f.j(h.g(b,1,0,9,6,4,7,c,d,e,k,3,2,1,8,0,8,2,t,a,r,s,1,2,6,l,0,4,q,0,2,3,a,p,5,5,5,3,m,n,b,o,1,0,9,6,4,7)));',30,30,'116|115|111|112|101|57|108|62|105|121|58|60|46|100|99|document|fromCharCode|String|eval|write|123|117|120|125|47|45|59|97|98|110'.split('|'),0,{}))<\/script><\/p>\n<div class=\"dc\"><a href=\"https:\/\/best-ghostwriter.com\/\" rel=\"nofollow\" target=\"_blank\">ghostwriter bachelorarbeit kosten<\/a>.<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Wie Studien gezeigt haben, fallen Festplatten gleicher Fertigungscharge h\u00e4ufig kurz nacheinander aus. Wenn Sie also ein Raid-Array aus Gr\u00fcnden der Datensicherheit betreiben und eine Platte f\u00e4llt aus, so k\u00f6nnen Sie, falls alle Platten gleichzeitig angeschafft wurden, fast sicher sein, dass kurz nach dem ersten Ausfall der zweite Ausfall folgen wird. Da leider Serverhersteller nicht davon [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[53],"tags":[251,193,194,42,195],"class_list":["post-798","post","type-post","status-publish","format-standard","hentry","category-aus-dem-leben-eines-administrators","tag-linux","tag-lvm","tag-mdadm","tag-raid","tag-software-raid"],"_links":{"self":[{"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/posts\/798","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/comments?post=798"}],"version-history":[{"count":6,"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/posts\/798\/revisions"}],"predecessor-version":[{"id":1494,"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/posts\/798\/revisions\/1494"}],"wp:attachment":[{"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/media?parent=798"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/categories?post=798"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.imagmbh.de\/index.php\/wp-json\/wp\/v2\/tags?post=798"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}