PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Wichtig, I/O-error im filesystem


Gast
2005-09-15, 23:39:04
Ich benutze Software Raid + DMCrypt, urplötzlich kann ich /home nicht mehr mounten, die Nachricht von Mount:

can't read superblock


Wenn ich ein bissel nachforsche, erfahre ich folgendes:


# tail /var/log/dmesg
Starting XFS recovery on filesystem: dm-8 (dev: dm-8)
hdc: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hdc: dma_intr: error=0x40 { UncorrectableError }, LBAsect=188650233, high=11, low=4100857, sector=188650233
ide: failed opcode was: unknown
end_request: I/O error, dev hdc, sector 188650233
I/O error in filesystem ("dm-8") meta-data dev dm-8 block 0x142800f8 ("xlog_recover_do..(read#1)") error 5 buf count 4096
XFS: log mount/recovery failed: error 5
XFS: log mount failed
Adding 979956k swap on /dev/mapper/swap0. Priority:-1 extents:1
Adding 979956k swap on /dev/mapper/swap1. Priority:-2 extents:1


Die Partitionen hda10 und hdc10 bilden zusammen /dev/md6, und das wiederum wird dann entschlüsseld /dev/mapper/home, was ich als /home mounte. Wie gesagt - es geht ohne Vorwarnung und urplötzlich nicht mehr, ist das auf einen physikalischen Schaden der Platte zurückzuführen?

Ich will diese Daten unbedingt retten, und nicht gefährden, was für Tipps könnt ihr mir geben? Morgen früh muss das alles wieder da sein.

(del676)
2005-09-15, 23:42:23
hdc: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hdc: dma_intr: error=0x40 { UncorrectableError }, LBAsect=188650233, high=11, low=4100857, sector=188650233

das ist zu 99% ein physikalischer defekt

du sagst du hast software raid - also müsste er eh noch von der anderen platte alles lesen können (ausser du hast raid0 verwendet X-D)

du könntest nun mal mit smartctl nen smarttest anwerfen (vorher noch kabel und controllersteckplatz tauschen um diese zwei fehlerquellen auszuschliessen) (aber ich denke die platte hat nen physikalischen fehler)

Gast
2005-09-15, 23:42:56
Uff, also wenn du mich fragst, ist das ein Hardware Error, und du kannst deine Daten vergessen.


Es wundert mich allerdings etwas, dass die anderen Mapper Partitionen funktionieren. Der Kratzer oder was auch immer ist wohl an einer Stelle, wo er nur /home beeinflusst.

Gast
2005-09-15, 23:45:08
Nen physikalischen Fehler? Na super. Kann man das irgendwie reparieren/beheben? Diese Daten sind alles, was ich je gesammelt hab .... Zudem ein Projekt, dass ich morgen früh einreichen muss ...

ich benutze übrigens raid0 ...

Gast
2005-09-15, 23:47:46
Bzw. kann ich vom Hersteller Schadenersatz klagen oder was auch immer? Wenigstens ne neue Festplatte? Denn:

1. Sind die Festplatten in einem Wechselrahmen, und haben jeweils einen eigenen Lüfter
2. Ist der Rechner immer an, was auch gut für Platten ist
3. Habe ich den Rechner in keiner Weise beschädigt

(del676)
2005-09-15, 23:47:52
tja, wenn bei raid0 eine hdd ausfällt sind deine daten weg

noch schlimmer isses ja dass du diese daten nichtmal einzel runterkopieren (versuchen) kannst da sie ja 1. ein raid0 sind das erstmal starten muss und 2. verschlüsselt sind

ich würde sagen du hast pech gehabt

du kannst EVENTUELL hoffen dass es das kabel oder der controller sind, ODER die Elektronik der HDD (einfach ne absolut gleiche hdd nehmen und platine umbauen)
aber die canchen dafür stehen wohl nicht gut

Gast
2005-09-15, 23:50:46
In 72 Minuten ist mein smartctl Test fertig.

Ich bin nicht gerade jemand, der mal eben bei ner Platte die Platine auswechselt. Würdet ihr mir evtl. empfehlen, mich an den Händler zu wenden, und bei ihm eine fachmännische Untersuchung der Platte zu erkämpfen, oder machen die mir meine Daten kaputt?

(del676)
2005-09-15, 23:51:09
Bzw. kann ich vom Hersteller Schadenersatz klagen oder was auch immer? Wenigstens ne neue Festplatte? Denn:

1. Sind die Festplatten in einem Wechselrahmen, und haben jeweils einen eigenen Lüfter
2. Ist der Rechner immer an, was auch gut für Platten ist
3. Habe ich den Rechner in keiner Weise beschädigt

du kannst dir ne neue hdd schicken lassen (bei WD schon vorab) wenn die hdd noch garantie hat, die meisten hersteller bieten ein online suchformular an wo man die Seriennummer der HDD eingibt und sieht ob man noch Garantie hat

WD ist SEHR kulant beim tauschen der HDDs, ich habe selber 2 HDDs nach ~2,5 Jahren getauscht weil sie ein lautes laufgeräusch hatten, die ersatzplatten wurden mir 3 tage später an der haustüre überreicht :)

Gast
2005-09-15, 23:55:30
Ich denke zur Zeit darüber nach, die Platten beide zu behalten (in absolut unverändertem Zustand), und mit ihnen, sollte ich mal mehr Geld haben, Reparaturversuche von Profis anstellen zu lassen, und derweil 3 Baugleiche Platten (eine davon die umgetauschte) zu besorgen, und mit denen Raid 5 zu machen, damit das nicht nochmal passiert.

Aber das ist jetzt wirklich mein ganz persönlicher Alptraum.

Wie kann es zu solchen Fehlern kommen? Produktionsfehler, oder kann es an mir liegen?


BTW: ich habe keinen Raid Controller, sondern nur einen IDE Controller am Mainboard. Das istn ziemliches Billigteil, aber wie könnte ihc den herausfinden, woran genau es liegt?

(del676)
2005-09-15, 23:56:59
In 72 Minuten ist mein smartctl Test fertig.

Ich bin nicht gerade jemand, der mal eben bei ner Platte die Platine auswechselt. Würdet ihr mir evtl. empfehlen, mich an den Händler zu wenden, und bei ihm eine fachmännische Untersuchung der Platte zu erkämpfen, oder machen die mir meine Daten kaputt?

naja, wenns nicht die elektronik ist dann müsstest du schon viel geld haben um die daten wiederherstellen zu lassen - aber dich haut das raid0 wieder rein, weil auch die ned alles wiederherstellen können

die messen da mit oszilloskopen jedes bit einzeln raus - das dauert und is eben schweineteuer

(del676)
2005-09-15, 23:59:12
Wie kann es zu solchen Fehlern kommen? Produktionsfehler, oder kann es an mir liegen?


BTW: ich habe keinen Raid Controller, sondern nur einen IDE Controller am Mainboard. Das istn ziemliches Billigteil, aber wie könnte ihc den herausfinden, woran genau es liegt?
zu 1. ... tja pech, das kommt eben vor, es kann alles mögliche sein

du könntest versuchen ein anderes kabel zu nehmen und die platte dort anzustecken wo eine gerade funktioniernde ist - und dann z.b. mit dem programm "badblocks" einmal die hdd scannen

(del676)
2005-09-16, 00:01:51
- wobei jedes programm dass die hdd scannt es natürlich auch schlimmer machen könnte (wenn z.b. der kopf auf die platte geschlagen hat und es nun immer wieder mal dazu kommt)

Gast
2005-09-16, 00:19:32
Glaube ehrlich gesagt nicht, dass es am Kabel liegen könnte, weil ich ja an Teile der Festplatte rankomme.

Genau genommen an alle Partitionen ausser hda10 ... und das ist mit Abstand die Grösste.

Ich werd jetzt wohl wirklich die beiden Platten ruhen lassen, alles Geld was ich habe zusammen kratzen, und mir 3 neue + nen Raid Controller besorgen. (Kannst du mir nen guten für Linux empfehlen? Ich möchte eh Software RAID damit machen)
Dann werd ich raid5 einrichten und sowas wird dann (ausser ich hab RICHTIG Pech) so schnell nicht nochmal passieren.
Ausserdem werd ich mir noch 3 USB Festplatten gleicher Kapazität besorgen, und mit denen ein tägliches Backup durchführen.

Das geht natürlich echt ins Geld, aber das war mir wirklich eine Lehre.

BTW: der Strom in unserem Haus ist zur Zeit seltam, die Lampen flackern kann subtil, und auch der Monitor meiner Freundin (meine nicht)

Kann das in irgendeiner Form damit zusammen hängen? Kann es irgendetwas bringen, wenn ich den PC erstmal ein paar Stunden aus lasse?

Gast
2005-09-16, 00:27:13
achja, an wen könnte man sich für eine solche Osziliskop Untersuchung wenden? Kennst du da irgendeine Institution?

Abnaxos
2005-09-16, 01:29:46
Yesterday,
All those backups seemed a waste of pay.
Now my database has gone away.
Oh I believe in yesterday.
Suddenly,
There's not half the files there used to be,
And there's a milestone hanging over me
The system crashed so suddenly.
I pushed something wrong
What it was I could not say.
Now all my data's gone and I long for yesterday-ay-ay-ay.
Yesterday,
Need for backup seemed so far away.
Seemed my data were all here to stay,
Now I believe in yesterday.


Im Ernst: Du kannst offenbar noch halbwegs auf die Platte zugreifen. Also mach das! Kopiere alles, was du noch hast, so schnell wie möglich herunter, und zwar in der Reihenfolge der Wichtigkeit der Daten (eine halbtote Platte kann gerade in so einer Kopier-Aktion, wo sie stark belastet wird, vollends sterben). Es kann auch helfen, das via Knoppix zu machen, damit hängt sich wenigstens nicht unbedingt gleich das gesamte System auf, wenn die Platte Mist baut. Wenn das gemacht ist, hast du Luft und kannst mal genauer nachsehen, was eigentlich genau falsch ist. Es kann nie schaden, noch eine Platte im Regal herumliegen zu haben. ;)

Noch ein Tip: Ich konnte mal eine verloren geglaubte Platte mit explore2fs unter Windows noch retten. Zwar hat das BIOS keine Festplatte mehr gesehen, Linux hat es dem BIOS einfach geglaubt, aber Windows hat das nochmal genauer nachgeprüft und festgestellt, dass da noch etwas ist. Normalerweise ist diese Fehlertoleranz etwas, was ich an Windows kritisiere (Festplatten, die bereits halb tot sind, scheinen noch zu funktionieren), aber in diesem Fall war sie meine Rettung ...

Lokadamus - nixBock
2005-09-16, 07:10:21
2. Ist der Rechner immer an, was auch gut für Platten istmmm...

Woher kommt diese Aussage? Bei SCSI- Platten wäre es egal bzw. wirklich gut, bei IDE und Sata nicht. Die können meistens ohne Probs auch mitlaufen, aber "gut" ist was anderes. IDE und Sata sind meistens nicht für den 24 Stundeneinsatz ausgelegt ...
Defekte Sektoren entstehen einfach mit der Zeit.
Bei einem Low-Level- Format mappt die HDD defekte Sektoren auf Reservesektoren um, wodurch eine HDD wieder fehlerfrei aussieht und funktioniert, hilft dir im Sinne der Datenrettung aber auch nicht weiter ...

(del676)
2005-09-16, 08:54:53
Glaube ehrlich gesagt nicht, dass es am Kabel liegen könnte, weil ich ja an Teile der Festplatte rankomme.

Genau genommen an alle Partitionen ausser hda10 ... und das ist mit Abstand die Grösste.

Ich werd jetzt wohl wirklich die beiden Platten ruhen lassen, alles Geld was ich habe zusammen kratzen, und mir 3 neue + nen Raid Controller besorgen. (Kannst du mir nen guten für Linux empfehlen? Ich möchte eh Software RAID damit machen)
Dann werd ich raid5 einrichten und sowas wird dann (ausser ich hab RICHTIG Pech) so schnell nicht nochmal passieren.
Ausserdem werd ich mir noch 3 USB Festplatten gleicher Kapazität besorgen, und mit denen ein tägliches Backup durchführen.

Das geht natürlich echt ins Geld, aber das war mir wirklich eine Lehre.

BTW: der Strom in unserem Haus ist zur Zeit seltam, die Lampen flackern kann subtil, und auch der Monitor meiner Freundin (meine nicht)

Kann das in irgendeiner Form damit zusammen hängen? Kann es irgendetwas bringen, wenn ich den PC erstmal ein paar Stunden aus lasse?

http://www.ontrack.de/service/

wenn du eh software raid5 machst (was auch auch empfehlen würde, benutze ich selbst da sogar der 3ware 7506-8 im endeffekt langsamer ist! (ja obwohl es hardware ist)) kannst du einen billigen sata controller nehmen mit gscheider linux unterstützung (oder gleich die onboard trümmer)

fürs backup würde ja eine grosse externe hdd reichen oder?

meine daten sind ebenso verschlüsselt (loop-aes), deshalb habe ich alle datenplatten mit statischen dateien immer readonly gemountet, und nur wenn ich was draufkopiere remounte ich es (eventuell auch ne überlegung wert)

und wenn du schon dabei bist, eine usv mit serial port kostet auch nix - und du hast guten schutz vor über und unterspannung, und wenn der strom ausfällt fährt er die kiste automatisch runter

Rhönpaulus
2005-09-16, 09:42:35
eindeutig festplattenschaden.
mindestens ein sektor kann nicht mehr gelesen werden was wegen der verschlüsselung und raid0 besonders tragisch ist.
wenn proffessionelle datenrettung erfolgen soll die platten vorerst außer betrieb nehmen und keine weiteren rettungsaktionen versuchen.
leseversuche auf der defekten position führen meistens zu weiteren schnellen beschädigungen und damit zu weiteren defekten sektoren.
"hd-regenerator" kann eventuell den/die unlesbaren sektor(en) wiederherstellen aber das ist nicht von dauer.
eine chance für ein backup danach besteht aber durchaus denke ich.

die heutigen ide-platten haben fast alle minderwertige spindellager und halten deshalb nur relaitv wenige betriebsstunden durch.
dauerbetrieb ist deshalb gift für die billigen datenschleudern.
wenn es um hohe lebensdauer geht sind platten mit kugellagern um welten besser als mit flüssigkeitslagern.

Gast
2005-09-16, 16:39:19
wenn du eh software raid5 machst (was auch auch empfehlen würde, benutze ich selbst da sogar der 3ware 7506-8 im endeffekt langsamer ist! (ja obwohl es hardware ist)) kannst du einen billigen sata controller nehmen mit gscheider linux unterstützung (oder gleich die onboard trümmer)

Naja, bei mehr als 2 Festplatten lohnen sich die onboard IDE Anschlüsse wohl nicht mehr.
Zur Zeit benutze ich die primären IDE Slots für die Festplatten, also hda und hdc.
Würde ich jetzt noch hdd (z. B.) zu einem raid hinzufügen, könnte ich nicht mehr gleichzeitig auf alle Platten I/O Operationen simultan ausführen, und hätte hohe Geschwindigkeitsverluste.

Oder irre ich mich?


fürs backup würde ja eine grosse externe hdd reichen oder?

Müsste ziemlich gross sein ;)
Ich hab zur Zeit 2 160GB Platten, und werde, wenn ich auf raid 5 umsteige, 3 gleicher Grösse besorgen. Das bedeutet dann, dass ich 2 160GB USB Festplatten ranschaffen werde (nicht viel teurer als IDE Festplatten), mit denen ich ein nächtliches (oder wöchentliches) Backup durchführe.


und wenn du schon dabei bist, eine usv mit serial port kostet auch nix - und du hast guten schutz vor über und unterspannung, und wenn der strom ausfällt fährt er die kiste automatisch runter
Das ist wahrscheinlich ne sehr gute Idee, danke.



Ich überlege mir jetzt folgendes Vorgehen:

-2 USB Festplatten a 160GB kaufen (~ 160€)

-Auf denen ein unverschlüsseltes raid 0 einrichten (übergangsweise)

-Damit meinen Mailserver etc. wieder vorrübergehend zum Laufen bringen (d.h. / von den kaputten Festplatten komplett rüberkopieren)

-Die alten Festplatten ausbauen, und in den Verpackungen mit denen die USB Festplatten gekommen sind und einer zusätzlichen Kiste in den Keller legen
(Hier wären Aufbewahrungs Tipps sehr hilfreich)

-Dann, mit mehr Geld, 3 IDE Platten a 160 GB und einen Raid controller besorgen. (~ 260€)

-Mit diesen raid5 einrichten, und es verschlüsseln.

-Die Daten von den USB Festplatten auf das neue raid 5 kopieren

-Die USB Festplatten komplett shreddern und dannach dort ein verschlüsseltes raid0 aufsetzen, und auf diese ein tägliches oder wöchentliches backup machen.

Der Vorteil bei dieser Vorgehensweise ist ja ersichtlich. Fällt irgendeine von diesen 5 Platten aus (oder gar eine USB und eine IDE gleichzeitig), ist mein System noch immer rettbar. Ich muss dann einfach die Festplatte umtauschen lassen und ersetzen.


Was haltet ihr davon? Was würdet ihr mir raten?


Ich habe ~1GHz CPU (Athlon XP 1500+) und 512 MB RAM. Mit raid0 und encryption hat das prima funktioniert, aber was sagt ihr zu meinem neuen Modell? Wird das reichen?

Gast
2005-09-16, 16:54:19
http://www.ontrack.de/service/
und wenn du schon dabei bist, eine usv mit serial port kostet auch nix - und du hast guten schutz vor über und unterspannung, und wenn der strom ausfällt fährt er die kiste automatisch runter

Was kostet mich sowas? Was könntest du empfehlen?

(del676)
2005-09-16, 16:57:41
ich rede ja von sata platten - hast du nicht 4 sata ports auf dem mobo?
und raidcontroller brauchst eh nicht wenn du sw raid machst
da reicht sowas: http://geizhals.at/a126020.html (man müsste sich halt vorher wegen der linux treiber, bzw bei normalen controllern sollte ja schon alles im 2.6 kernel integriert sein)

als externe reicht ja auch eine 300gb maxtor?

Gast
2005-09-16, 18:07:13
Hast du mal ne 320GB USB Platte gesehn? Extern ist mir schon wichtig, da die Dinger nichtmal 10€ mehr kosten ,und den riesigen Vorteil haben, Portabel zu sein. Will ich also mal irgendwo was mitnehmen, schlepp ich einfach meine beiden Backup Platten mit, und deaktiviere das Backup so lang ;)

Hab kein S-ATA (und zweifel auch am Nutzen)
Kann man denn da gleichzeitig auf 2 Platten an einem Controller schreiben? Mein Mainboard hat nichtmal S-ATA.

Gast
2005-09-16, 19:37:36
Ich habe in dem Teil eine 2GB Festplatte, mit dem alten / (vor der Verschlüsselung)

Es ist natürlich nicht ganz aktuell, aber so kann ich zumindestens meine e-Mails weiterhin empfangen, ist es theoretisch ungefährlich, wenn ich die defekte Platte einfach drin lasse, aber nicht darauf zugreife?

klutob
2005-09-16, 23:19:50
Hi,

Bevor du weiter an deinem defekten Raid-Sys hantierst.
Kauf dir doch eine >320GB Platte --> USB-Gehäuse, SATA oder IDE ist bei den erzielbaren Datenraten von USB eh wurscht. Eine externe Platte als Backupmedium ist bei wichtigen Daten sowieso eine Notwendigkeit. Danach kannst du unter einer beliebigen LiveCD (Knoppix-readonly) mittels "ddrescue" (Vorteil ggü. "dd"; defekte Sektoren werden ohne Abbruch korrekt übertragen) alle physikalischen Einheiten des Raids auf die Backupdisk kopieren und gefahrlos die Filesystem-Tools (xfsdump) zum Reparieren der angeschlagenen Partition verwenden. Ohne eine entsprechende Kopie, riskierst du bei jedem "Live-Versuch" im Raid die kleine theoretische Chance, ein paar Daten retten zu können.

Gast
2005-09-17, 18:56:18
Danke für alle Hilfe soweit, ein paar Fragen sind aber noch immer offen:

Die Logfiles erwähnen "md-8", betroffen ist aber "md6", was hat das zu bedeuten?

Das CDROM Laufwerk ist am selben Controller, und funktioniert nicht mehr. Kann es doch der Controller sein? (Nochmal zur Erinnerung, alle Partitionen bis auf die größte funktionieren einwandfrei)

Kann ich die Festplatten drin lassen, und den Rechner normal benutzen, wenn ich nicht auf sie zugreife, oder ist das ein Risiko?

PrakashKC
2005-09-18, 16:43:53
Was auch helfen könnte: Die kaputte Festplatte in luftdichten Beutel einfrieren, und am nächsten tag mal anschließen - aber aufpassen, daß sich kein Kondenswasser bildet (am besten Platte mit Kabel einfrieren und das ganz so drin lassen).

Soll schon mal geklappt haben - allerdings hast du nicht viel Zeit. Aber wie gesagt, wenn sich Kondenswasser bildet, kann auch ganz schnell alles weg sein...

Gast
2005-09-19, 00:31:56
Das klingt aber etwas gruselig.


Ich hab das Risiko jetzt einfach mal auf mich genommen, und beide Platten mit testdisk getestet. Laut testdisk scheint alles in Ordnung zu sein:


Structure: Ok.


Was für Analysemethoden würdet ihr mir noch empfehlen, um herauszufinden, was das Problem ist?

Hier mal meine komplette dmesg, ich werd nicht ganz schlau daraus:


Linux version 2.6.13-gentoo-r1 (root@tartaros) (gcc version 3.4.4 (Gentoo 3.4.4, ssp-3.4.4-1.0, pie-8.7.8)) #1 SMP Wed Sep 14 19:45:50 CEST 2005
BIOS-provided physical RAM map:
BIOS-e820: 0000000000000000 - 000000000009fc00 (usable)
BIOS-e820: 000000000009fc00 - 00000000000a0000 (reserved)
BIOS-e820: 00000000000e0000 - 0000000000100000 (reserved)
BIOS-e820: 0000000000100000 - 000000001dfd0000 (usable)
BIOS-e820: 000000001dfd0000 - 000000001dfdf000 (ACPI data)
BIOS-e820: 000000001dfdf000 - 000000001e000000 (ACPI NVS)
BIOS-e820: 00000000fffc0000 - 0000000100000000 (reserved)
479MB LOWMEM available.
found SMP MP-table at 000ff780
On node 0 totalpages: 122832
DMA zone: 4096 pages, LIFO batch:1
Normal zone: 118736 pages, LIFO batch:31
HighMem zone: 0 pages, LIFO batch:1
DMI 2.3 present.
ACPI: RSDP (v000 ACPIAM ) @ 0x000f6700
ACPI: RSDT (v001 A M I OEMRSDT 0x06000418 MSFT 0x00000097) @ 0x1dfd0000
ACPI: FADT (v002 A M I OEMFACP 0x06000418 MSFT 0x00000097) @ 0x1dfd0200
ACPI: MADT (v001 A M I OEMAPIC 0x06000418 MSFT 0x00000097) @ 0x1dfd0390
ACPI: OEMB (v001 A M I AMI_OEM 0x06000418 MSFT 0x00000097) @ 0x1dfdf040
ACPI: DSDT (v001 863GV 863GV15C 0x00000000 INTL 0x02002026) @ 0x00000000
ACPI: Local APIC address 0xfee00000
ACPI: LAPIC (acpi_id[0x01] lapic_id[0x00] enabled)
Processor #0 6:8 APIC version 16
ACPI: IOAPIC (id[0x01] address[0xfec00000] gsi_base[0])
IOAPIC[0]: apic_id 1, version 2, address 0xfec00000, GSI 0-23
ACPI: INT_SRC_OVR (bus 0 bus_irq 0 global_irq 2 dfl dfl)
ACPI: INT_SRC_OVR (bus 0 bus_irq 9 global_irq 9 low level)
ACPI: IRQ0 used by override.
ACPI: IRQ2 used by override.
ACPI: IRQ9 used by override.
Enabling APIC mode: Flat. Using 1 I/O APICs
Using ACPI (MADT) for SMP configuration information
Allocating PCI resources starting at 1e000000 (gap: 1e000000:e1fc0000)
Built 1 zonelists
Kernel command line: root=/dev/ram0 rw init=/sbin/init gentoo=nodevfs
mapped APIC to ffffd000 (fee00000)
mapped IOAPIC to ffffc000 (fec00000)
Initializing CPU#0
PID hash table entries: 2048 (order: 11, 32768 bytes)
Detected 1350.309 MHz processor.
Using tsc for high-res timesource
Console: colour VGA+ 80x25
Dentry cache hash table entries: 65536 (order: 6, 262144 bytes)
Inode-cache hash table entries: 32768 (order: 5, 131072 bytes)
Memory: 479080k/491328k available (3922k kernel code, 11572k reserved, 1186k data, 240k init, 0k highmem)
Checking if this processor honours the WP bit even in supervisor mode... Ok.
Calibrating delay using timer specific routine.. 2703.68 BogoMIPS (lpj=5407366)
Mount-cache hash table entries: 512
CPU: After generic identify, caps: 0383fbff c1c3fbff 00000000 00000000 00000000 00000000 00000000
CPU: After vendor identify, caps: 0383fbff c1c3fbff 00000000 00000000 00000000 00000000 00000000
CPU: L1 I Cache: 64K (64 bytes/line), D cache 64K (64 bytes/line)
CPU: L2 Cache: 256K (64 bytes/line)
CPU: After all inits, caps: 0383fbff c1c3fbff 00000000 00000020 00000000 00000000 00000000
Intel machine check architecture supported.
Intel machine check reporting enabled on CPU#0.
mtrr: v2.0 (20020519)
Enabling fast FPU save and restore... done.
Enabling unmasked SIMD FPU exception support... done.
Checking 'hlt' instruction... OK.
CPU0: AMD Athlon(tm) XP 1500+ stepping 01
Total of 1 processors activated (2703.68 BogoMIPS).
ENABLING IO-APIC IRQs
..TIMER: vector=0x31 pin1=2 pin2=-1
Brought up 1 CPUs
checking if image is initramfs...it isn't (no cpio magic); looks like an initrd
Freeing initrd memory: 1410k freed
NET: Registered protocol family 16
ACPI: bus type pci registered
PCI: PCI BIOS revision 2.10 entry at 0xf0031, last bus=1
ACPI: Subsystem revision 20050408
ACPI: Interpreter enabled
ACPI: Using IOAPIC for interrupt routing
ACPI: PCI Root Bridge [PCI0] (0000:00)
PCI: Probing PCI hardware (bus 00)
ACPI: Assume root bridge [\_SB_.PCI0] segment is 0
Uncovering SIS963 that hid as a SIS503 (compatible=0)
Enabling SiS 96x SMBus.
Boot video device is 0000:01:00.0
ACPI: PCI Interrupt Routing Table [\_SB_.PCI0._PRT]
ACPI: PCI Interrupt Link [LNKA] (IRQs 3 4 5 7 10 *11 12 14 15)
ACPI: PCI Interrupt Link [LNKB] (IRQs 3 4 5 *7 10 11 12 14 15)
ACPI: PCI Interrupt Link [LNKC] (IRQs 3 4 5 7 10 11 12 14 15) *0, disabled.
ACPI: PCI Interrupt Link [LNKD] (IRQs 3 4 5 7 10 11 12 14 15) *0, disabled.
ACPI: PCI Interrupt Link [LNKE] (IRQs *3 4 5 7 10 11 12 14 15)
ACPI: PCI Interrupt Link [LNKF] (IRQs 3 4 *5 7 10 11 12 14 15)
ACPI: PCI Interrupt Link [LNKG] (IRQs 3 4 5 7 10 11 12 14 15) *0, disabled.
ACPI: PCI Interrupt Link [LNKH] (IRQs 3 4 5 7 *10 11 12 14 15)
Linux Plug and Play Support v0.97 (c) Adam Belay
pnp: PnP ACPI init
pnp: PnP ACPI: found 10 devices
SCSI subsystem initialized
usbcore: registered new driver usbfs
usbcore: registered new driver hub
PCI: Using ACPI for IRQ routing
PCI: If a device doesn't work, try "pci=routeirq". If it helps, post a report
PCI: Ignore bogus resource 6 [0:0] of 0000:01:00.0
PCI: Bridge: 0000:00:01.0
IO window: d000-dfff
MEM window: cfe00000-cfefffff
PREFETCH window: bfd00000-cfcfffff
Machine check exception polling timer started.
audit: initializing netlink socket (disabled)
audit(1095862466.488:1): initialized
VFS: Disk quotas dquot_6.5.1
Dquot-cache hash table entries: 1024 (order 0, 4096 bytes)
Installing knfsd (copyright (C) 1996 okir@monad.swb.de).
SGI XFS with ACLs, large block numbers, no debug enabled
SGI XFS Quota Management subsystem
Initializing Cryptographic API
lp: driver loaded but no devices found
Linux agpgart interface v0.101 (c) Dave Jones
[drm] Initialized drm 1.0.0 20040925
ACPI: Power Button (FF) [PWRF]
ACPI: Power Button (CM) [PWRB]
ACPI: CPU0 (power states: C1[C1])
ACPI: Processor [CPU1] (supports 8 throttling states)
PNP: PS/2 controller doesn't have AUX irq; using default 0xc
PNP: PS/2 Controller [PNP0303:PS2K] at 0x60,0x64 irq 112
serio: i8042 AUX port at 0x60,0x64 irq 12
serio: i8042 KBD port at 0x60,0x64 irq 1
Serial: 8250/16550 driver $Revision: 1.90 $ 4 ports, IRQ sharing disabled
ttyS0 at I/O 0x3f8 (irq = 4) is a 16550A
ttyS0 at I/O 0x3f8 (irq = 4) is a 16550A
mice: PS/2 mouse device common for all mice
io scheduler noop registered
io scheduler anticipatory registered
io scheduler deadline registered
io scheduler cfq registered
Floppy drive(s): fd0 is 1.44M
FDC 0 is a post-1991 82077
RAMDISK driver initialized: 16 RAM disks of 4096K size 1024 blocksize
loop: loaded (max 8 devices)
ACPI: PCI Interrupt 0000:00:09.0[A] -> GSI 17 (level, low) -> IRQ 16
skge addr 0xcfff8000 irq 16 chip Yukon rev 1
skge eth0: addr 00:0a:5e:24:b0:4a
Uniform Multi-Platform E-IDE driver Revision: 7.00alpha2
ide: Assuming 33MHz system bus speed for PIO modes; override with idebus=xx
SIS5513: IDE controller at PCI slot 0000:00:02.5
SIS5513: chipset revision 0
SIS5513: not 100% native mode: will probe irqs later
SIS5513: SiS 962/963 MuTIOL IDE UDMA133 controller
ide0: BM-DMA at 0xffa0-0xffa7, BIOS settings: hda:DMA, hdb:DMA
ide1: BM-DMA at 0xffa8-0xffaf, BIOS settings: hdc:DMA, hdd:DMA
Probing IDE interface ide0...
input: AT Translated Set 2 keyboard on isa0060/serio0
hda: Maxtor 6Y160P0, ATA DISK drive
hdb: ST32122A, ATA DISK drive
ide0 at 0x1f0-0x1f7,0x3f6 on irq 14
Probing IDE interface ide1...
hdc: Maxtor 6Y160P0, ATA DISK drive
ide1 at 0x170-0x177,0x376 on irq 15
hda: max request size: 1024KiB
hda: 320173056 sectors (163928 MB) w/7936KiB Cache, CHS=19929/255/63, UDMA(100)
hda: cache flushes supported
hda: hda1 hda2 hda3 < hda5 hda6 hda7 hda8 hda9 hda10 >
hdb: max request size: 128KiB
hdb: 4124736 sectors (2111 MB) w/128KiB Cache, CHS=4092/16/63, UDMA(33)
hdb: cache flushes not supported
hdb: hdb1 hdb2 hdb3
hdc: max request size: 1024KiB
hdc: 320173056 sectors (163928 MB) w/7936KiB Cache, CHS=19929/255/63, UDMA(133)
hdc: cache flushes supported
hdc: hdc1 hdc2 hdc3 < hdc5 hdc6 hdc7 hdc8 hdc9 hdc10 >
libata version 1.12 loaded.
ieee1394: raw1394: /dev/raw1394 device initialized
usbmon: debugfs is not available
ACPI: PCI Interrupt 0000:00:03.3[D] -> GSI 23 (level, low) -> IRQ 17
ehci_hcd 0000:00:03.3: Silicon Integrated Systems [SiS] USB 2.0 Controller
ehci_hcd 0000:00:03.3: new USB bus registered, assigned bus number 1
ehci_hcd 0000:00:03.3: irq 17, io mem 0xcffff000
PCI: cache line size of 64 is not supported by device 0000:00:03.3
ehci_hcd 0000:00:03.3: USB 2.0 initialized, EHCI 1.00, driver 10 Dec 2004
hub 1-0:1.0: USB hub found
hub 1-0:1.0: 6 ports detected
USB Universal Host Controller Interface driver v2.3
usbcore: registered new driver usblp
drivers/usb/class/usblp.c: v0.13: USB Printer Device Class driver
Initializing USB Mass Storage driver...
usbcore: registered new driver usb-storage
USB Mass Storage support registered.
usbcore: registered new driver usbhid
drivers/usb/input/hid-core.c: v2.01:USB HID core driver
md: raid0 personality registered as nr 2
md: md driver 0.90.2 MAX_MD_DEVS=256, MD_SB_DISKS=27
md: bitmap version 3.38
device-mapper: 4.4.0-ioctl (2005-01-12) initialised: dm-devel@redhat.com
Advanced Linux Sound Architecture Driver Version 1.0.9b (Thu Jul 28 12:20:13 2005 UTC).
ALSA device list:
No soundcards found.
oprofile: using NMI interrupt.
NET: Registered protocol family 2
IP route cache hash table entries: 4096 (order: 2, 16384 bytes)
TCP established hash table entries: 16384 (order: 6, 262144 bytes)
TCP bind hash table entries: 16384 (order: 5, 196608 bytes)
TCP: Hash tables configured (established 16384 bind 16384)
TCP reno registered
ip_conntrack version 2.1 (3838 buckets, 30704 max) - 212 bytes per conntrack
ip_tables: (C) 2000-2002 Netfilter core team
ipt_recent v0.3.1: Stephen Frost <sfrost@snowman.net>. http://snowman.net/projects/ipt_recent/
arp_tables: (C) 2002 David S. Miller
TCP bic registered
NET: Registered protocol family 1
NET: Registered protocol family 17
Using IPI Shortcut mode
md: Autodetecting RAID arrays.
md: autorun ...
md: considering hdc10 ...
md: adding hdc10 ...
md: hdc9 has different UUID to hdc10
md: hdc8 has different UUID to hdc10
md: hdc7 has different UUID to hdc10
md: hdc6 has different UUID to hdc10
md: hdc5 has different UUID to hdc10
md: hdc1 has different UUID to hdc10
md: adding hda10 ...
md: hda9 has different UUID to hdc10
md: hda8 has different UUID to hdc10
md: hda7 has different UUID to hdc10
md: hda6 has different UUID to hdc10
md: hda5 has different UUID to hdc10
md: hda1 has different UUID to hdc10
md: created md6
md: bind<hda10>
md: bind<hdc10>
md: running: <hdc10><hda10>
md6: setting max_sectors to 128, segment boundary to 32767
raid0: looking at hdc10
raid0: comparing hdc10(150296000) with hdc10(150296000)
raid0: END
raid0: ==> UNIQUE
raid0: 1 zones
raid0: looking at hda10
raid0: comparing hda10(150296000) with hdc10(150296000)
raid0: EQUAL
raid0: FINAL 1 zones
raid0: done.
raid0 : md_size is 300592000 blocks.
raid0 : conf->hash_spacing is 300592000 blocks.
raid0 : nb_zone is 1.
raid0 : Allocating 4 bytes for hash.
md: considering hdc9 ...
md: adding hdc9 ...
md: hdc8 has different UUID to hdc9
md: hdc7 has different UUID to hdc9
md: hdc6 has different UUID to hdc9
md: hdc5 has different UUID to hdc9
md: hdc1 has different UUID to hdc9
md: adding hda9 ...
md: hda8 has different UUID to hdc9
md: hda7 has different UUID to hdc9
md: hda6 has different UUID to hdc9
md: hda5 has different UUID to hdc9
md: hda1 has different UUID to hdc9
md: created md5
md: bind<hda9>
md: bind<hdc9>
md: running: <hdc9><hda9>
md5: setting max_sectors to 128, segment boundary to 32767
raid0: looking at hdc9
raid0: comparing hdc9(489856) with hdc9(489856)
raid0: END
raid0: ==> UNIQUE
raid0: 1 zones
raid0: looking at hda9
raid0: comparing hda9(489856) with hdc9(489856)
raid0: EQUAL
raid0: FINAL 1 zones
raid0: done.
raid0 : md_size is 979712 blocks.
raid0 : conf->hash_spacing is 979712 blocks.
raid0 : nb_zone is 1.
raid0 : Allocating 4 bytes for hash.
md: considering hdc8 ...
md: adding hdc8 ...
md: hdc7 has different UUID to hdc8
md: hdc6 has different UUID to hdc8
md: hdc5 has different UUID to hdc8
md: hdc1 has different UUID to hdc8
md: adding hda8 ...
md: hda7 has different UUID to hdc8
md: hda6 has different UUID to hdc8
md: hda5 has different UUID to hdc8
md: hda1 has different UUID to hdc8
md: created md4
md: bind<hda8>
md: bind<hdc8>
md: running: <hdc8><hda8>
md4: setting max_sectors to 128, segment boundary to 32767
raid0: looking at hdc8
raid0: comparing hdc8(5373632) with hdc8(5373632)
raid0: END
raid0: ==> UNIQUE
raid0: 1 zones
raid0: looking at hda8
raid0: comparing hda8(5373632) with hdc8(5373632)
raid0: EQUAL
raid0: FINAL 1 zones
raid0: done.
raid0 : md_size is 10747264 blocks.
raid0 : conf->hash_spacing is 10747264 blocks.
raid0 : nb_zone is 1.
raid0 : Allocating 4 bytes for hash.
md: considering hdc7 ...
md: adding hdc7 ...
md: hdc6 has different UUID to hdc7
md: hdc5 has different UUID to hdc7
md: hdc1 has different UUID to hdc7
md: adding hda7 ...
md: hda6 has different UUID to hdc7
md: hda5 has different UUID to hdc7
md: hda1 has different UUID to hdc7
md: created md3
md: bind<hda7>
md: bind<hdc7>
md: running: <hdc7><hda7>
md3: setting max_sectors to 128, segment boundary to 32767
raid0: looking at hdc7
raid0: comparing hdc7(489856) with hdc7(489856)
raid0: END
raid0: ==> UNIQUE
raid0: 1 zones
raid0: looking at hda7
raid0: comparing hda7(489856) with hdc7(489856)
raid0: EQUAL
raid0: FINAL 1 zones
raid0: done.
raid0 : md_size is 979712 blocks.
raid0 : conf->hash_spacing is 979712 blocks.
raid0 : nb_zone is 1.
raid0 : Allocating 4 bytes for hash.
md: considering hdc6 ...
md: adding hdc6 ...
md: hdc5 has different UUID to hdc6
md: hdc1 has different UUID to hdc6
md: adding hda6 ...
md: hda5 has different UUID to hdc6
md: hda1 has different UUID to hdc6
md: created md2
md: bind<hda6>
md: bind<hdc6>
md: running: <hdc6><hda6>
md2: setting max_sectors to 128, segment boundary to 32767
raid0: looking at hdc6
raid0: comparing hdc6(979840) with hdc6(979840)
raid0: END
raid0: ==> UNIQUE
raid0: 1 zones
raid0: looking at hda6
raid0: comparing hda6(979840) with hdc6(979840)
raid0: EQUAL
raid0: FINAL 1 zones
raid0: done.
raid0 : md_size is 1959680 blocks.
raid0 : conf->hash_spacing is 1959680 blocks.
raid0 : nb_zone is 1.
raid0 : Allocating 4 bytes for hash.
md: considering hdc5 ...
md: adding hdc5 ...
md: hdc1 has different UUID to hdc5
md: adding hda5 ...
md: hda1 has different UUID to hdc5
md: created md1
md: bind<hda5>
md: bind<hdc5>
md: running: <hdc5><hda5>
md1: setting max_sectors to 128, segment boundary to 32767
raid0: looking at hdc5
raid0: comparing hdc5(489856) with hdc5(489856)
raid0: END
raid0: ==> UNIQUE
raid0: 1 zones
raid0: looking at hda5
raid0: comparing hda5(489856) with hdc5(489856)
raid0: EQUAL
raid0: FINAL 1 zones
raid0: done.
raid0 : md_size is 979712 blocks.
raid0 : conf->hash_spacing is 979712 blocks.
raid0 : nb_zone is 1.
raid0 : Allocating 4 bytes for hash.
md: considering hdc1 ...
md: adding hdc1 ...
md: adding hda1 ...
md: created md0
md: bind<hda1>
md: bind<hdc1>
md: running: <hdc1><hda1>
md0: setting max_sectors to 128, segment boundary to 32767
raid0: looking at hdc1
raid0: comparing hdc1(979840) with hdc1(979840)
raid0: END
raid0: ==> UNIQUE
raid0: 1 zones
raid0: looking at hda1
raid0: comparing hda1(979840) with hdc1(979840)
raid0: EQUAL
raid0: FINAL 1 zones
raid0: done.
raid0 : md_size is 1959680 blocks.
raid0 : conf->hash_spacing is 1959680 blocks.
raid0 : nb_zone is 1.
raid0 : Allocating 4 bytes for hash.
md: ... autorun DONE.
RAMDISK: Compressed image found at block 0
VFS: Mounted root (ext2 filesystem).
Freeing unused kernel memory: 240k freed
MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.
Bank 1: 9400400000000152
ReiserFS: dm-0: found reiserfs format "3.6" with standard journal
ReiserFS: dm-0: using ordered data mode
ReiserFS: dm-0: journal params: device dm-0, size 8192, journal first block 18, max trans len 1024, max batch 900, max commit age 30, max trans age 30
ReiserFS: dm-0: checking transaction log (dm-0)
ReiserFS: dm-0: Using r5 hash to sort names
MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.
Bank 2: 940040000000017a
ReiserFS: dm-3: found reiserfs format "3.6" with standard journal
ReiserFS: dm-3: using ordered data mode
ReiserFS: dm-3: journal params: device dm-3, size 8192, journal first block 18, max trans len 1024, max batch 900, max commit age 30, max trans age 30
ReiserFS: dm-3: checking transaction log (dm-3)
ReiserFS: dm-3: Using r5 hash to sort names
ReiserFS: dm-3: warning: Created .reiserfs_priv on dm-3 - reserved for xattr storage.
ReiserFS: dm-4: found reiserfs format "3.6" with standard journal
ReiserFS: dm-4: using ordered data mode
ReiserFS: dm-4: journal params: device dm-4, size 8192, journal first block 18, max trans len 1024, max batch 900, max commit age 30, max trans age 30
ReiserFS: dm-4: checking transaction log (dm-4)
ReiserFS: dm-4: Using r5 hash to sort names
XFS mounting filesystem dm-5
Ending clean XFS mount for filesystem: dm-5
XFS mounting filesystem dm-6
Ending clean XFS mount for filesystem: dm-6
ReiserFS: dm-7: found reiserfs format "3.6" with standard journal
ReiserFS: dm-7: using ordered data mode
ReiserFS: dm-7: journal params: device dm-7, size 8192, journal first block 18, max trans len 1024, max batch 900, max commit age 30, max trans age 30
ReiserFS: dm-7: checking transaction log (dm-7)
ReiserFS: dm-7: Using r5 hash to sort names
XFS mounting filesystem dm-8
Starting XFS recovery on filesystem: dm-8 (dev: dm-8)
hda: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hda: dma_intr: error=0x40 { UncorrectableError }, LBAsect=188650233, high=11, low=4100857, sector=188650233
ide: failed opcode was: unknown
end_request: I/O error, dev hda, sector 188650233
I/O error in filesystem ("dm-8") meta-data dev dm-8 block 0x142800f8 ("xlog_recover_do..(read#1)") error 5 buf count 4096
XFS: log mount/recovery failed: error 5
XFS: log mount failed
Adding 979956k swap on /dev/mapper/swap0. Priority:-1 extents:1
Adding 979956k swap on /dev/mapper/swap1. Priority:-2 extents:1
MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.
Bank 1: d400400000000152
MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.
Bank 2: d40040000000017a


BTW: Ich habe die Platten jetzt ausgewechselt (es sind Wechsellaufwerke, könnten die defekt sein?), und jetzt ist - wie erwartet - hda offenbar die schlimme.

(An die CPU Fehler hab ich mich gewöhnt, hat nach nem BIOS Reset angefangen)


ide: failed opcode was: unknown
end_request: I/O error, dev hda, sector 188650233


Und nach wie vor interessiert es mich, ob der Betrieb mit den noch eingebauten und angeschlossenen Festplatten theoretisch ungefährlich ist, ich hab nämlich nen Mailserver da drin, den ich dringend benötige. Wenn ich die Festplatten einfach aus den Wechselrahmen hole, bootet der PC nicht (die Laufwerksbezeichnungen verändern sich ja dann auch ...)
Also?

Rhönpaulus
2005-09-19, 01:01:28
meiner bescheidenen erfahrung nach wird es richtig schlimm wenn in dem defekten bereich weitere lese/schreiboperationen erfolgen.
dann kommen sehr schnell weitere defekte sektoren dazu bis dann am ende der totalausfall ansteht.
ich habe eine defekte samsungplatte noch mehre monatte weiterbetreiben können in dem ich die fehlerbehaftette partition nicht mehr nutzte.
jeder reperaturversuch an der defekten stelle erzeugte weitere defekte sektoren.
defektursache bei mir höchstwarscheinlich ein ausgeschlagenes spindellager.
die platte hatte ca.10000h auf dem zähler und nach ca. 12500h endgültig den dienst eingestellt wobei in der zeit noch einige versuche mit hdregenerator,hutil und chkdsk gemacht wurden.
die ersatzplatte hat schon nach ca. 5000h die ersten fehler gezeigt.
ich nutze sie zur zeit ebenfalls noch weiter und tausche sie erst um wenn die restlichen 140gb auch fehlerhaft werden.
da eh nur dvb-aufnahmen darauf gespeichert werden hällt sich der mögliche schaden in grenzen.

Flipper
2005-09-19, 02:25:59
also zumindest den Fehler

hda: dma_intr: status=0x51 { DriveReady SeekComplete Error }

hatte ich auch mal (normale IDE-Platte, nix raid). Ich glaube, dass damals irgendeine falsche Kernel-Option oder so ähnlich schuld war.. ich weiss es allerdings nicht mehr genau. Ob ich den "UncorrectableError" auch hatte weiss ich nicht mehr.

Gast
2005-09-19, 06:45:08
Hm, der Fehler ist aufgetreten, seit ich nen neuen Kernel (2.6.13-r1) mit NFSv3 Support kompiliert hab, aber ich hab das in keinem Zusammenhang gesehen.

Wenn ich den alten boote, ändert es jedenfalls nichts.