PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Zuverlässigkeit von DDR5 (wieviel bringt On-Chip ECC?)


Rabiata
2022-03-23, 23:07:06
Ich habe heute schon vergeblich nach Informationen darüber gesucht, wie verläßlich die eingebaute Fehlerkorrektur in DDR5 RAM funktioniert.
Hat da jemand einen brauchbaren Link zur Hand?

Der Hintergrund ist daß ich in der Vergangenheit immer etwas paranoid war und meine PCs vorsichtshalber mit ECC RAM ausgestattet habe. Jetzt steht DDR5 vor der Tür, was eine "light" Version schon eingebaut hat. Diese schützt nicht vor Fehlern auf dem Weg zwischen Speicher und dem Speichercontroller in der CPU, aber die Hauptfehlerquelle "umgekippte Bits im Chip" könnte beseitigt sein. Meinungen, Erfahrungen... ?

BlacKi
2022-03-24, 13:16:20
wenn umgekipte bits ein problem im consumer bereich wären, gäbe es nur noch ecc ram.


manche riskieren sogar die stabilität ihres rams zugunsten von performance noch weiter.

Sweepi
2022-03-24, 16:15:47
wenn umgekipte bits ein problem im consumer bereich wären, gäbe es nur noch ecc ram.

Erschließt sich für nicht nicht, warum das der Fall sein sollte.

Tesseract
2022-03-24, 16:39:00
was eine "light" Version schon eingebaut hat.
würde ich so nicht unterschreiben. klassisches ECC inkludiert zwar auch den transfer, führt die berechnung aber nur bei zugriffen durch, d.h. wenn eine große menge an speicherzellen lange zeit nicht gelesen wird könnten sich in einem speicherbereich bitflips anhäufen bis die fehlerkorrektur überfordert ist. in DDR5 findet die korrektur, soweit ich weiß, als integraler teil refreshzyklus statt (= einzelne flips jeden refresh selbstheilend, egal wo im speicher diese auftreten), d.h. es müssten wirklich gehäuft mehrere bit auf ein mal flippen um die korrektur zu überfordern was um größenordnungen unwahrscheinlicher ist .

BlacKi
2022-03-24, 16:49:17
Erschließt sich für nicht nicht, warum das der Fall sein sollte.danke für deine meinung.

Ganon
2022-03-24, 16:50:20
Meinungen, Erfahrungen... ?

Jemanden mit _Erfahrungen_ mit DDR5 RAM zu finden ist sicherlich etwas verfrüht. DDR4 hatte ja schon mit WriteCRC einen Anfang gemacht was Fehlererkennung beim Schreiben betrifft. DDR5 erkennt jetzt Bitflips auch beim Lesen. Aber "richtiges" ECC ist das weiterhin nicht. Wikipedia beschreibt es ganz gut:

https://en.wikipedia.org/wiki/DDR5_SDRAM (linkt auch auf ein YT Video mit einer Erklärung: https://www.youtube.com/watch?v=XGwcPzBJCh0 )
Unlike DDR4, all DDR5 chips have on-die ECC, where errors are detected and corrected before sending data to the CPU. This, however, is not the same as true ECC memory with an extra data correction chip on the memory module. DDR5's on-die error correction is to improve reliability and to allow denser RAM chips with lower the per-chip defect rate. There still exist non-ECC and ECC DDR5 DIMM variants; the ECC variants have extra data lines to the CPU to send error-detection data, letting the CPU detect and correct errors that occurred in transit.

Kurz gesagt, das On-Chip ECC ist dafür da, damit man Chips verdichten kann, was die Fehlerrate erhöht und man somit gegenwirken muss. Das Problem ist aber, dass bei kaputtem RAM, was ggf. Multibit-Fehler verursacht, es hier überhaupt keinen Weg gibt dies der CPU und dem OS zu melden.

Von daher ist DDR5 ECC RAM durchaus noch sinnvoll.

Skysnake
2022-03-24, 17:00:58
ECC RAM betreibt man normal mit petrol scrubbing. Das heißt alle X Stunden wird einmal der komplette RAM gelesen. Damit reduziert man die Wahrscheinlichkeit für Multibit errors

Rabiata
2022-03-24, 17:52:27
Kurz gesagt, das On-Chip ECC ist dafür da, damit man Chips verdichten kann, was die Fehlerrate erhöht und man somit gegenwirken muss. Das Problem ist aber, dass bei kaputtem RAM, was ggf. Multibit-Fehler verursacht, es hier überhaupt keinen Weg gibt dies der CPU und dem OS zu melden.

Von daher ist DDR5 ECC RAM durchaus noch sinnvoll.
Bei einem richtig kaputten RAM erwarte ich, daß das System entweder komplett steht oder im POST eine Fehlermeldung auswirft. Da weiß man zumindest daß man ein Problem hat.
Was ich gern vermeiden will ist ein schleichender Datenverlust, weil ab und zu unerkannt ein Bit umkippt und falsch auf die Platte geschrieben wird. Das geht dann auch ins nächste Backup ein, welches dann auch nicht mehr korrekt ist.
Und die Fehlersuche, wenn nur sporadisch was nicht klappt, kann auch langwierig und nervig sein.

Ganon
2022-03-24, 18:04:26
Allgemein ist DDR5 schon zuverlässiger also DDR3 oder DDR4. Aber Fehler können in der Kette weiterhin auftreten. DDR5 ECC deckt hier halt mehr Stellen ab. Konsequenterweise müsstest du dann aber auch ein Checksummen-Dateisystem wie ZFS, btrfs oder unter Windows ReFS einsetzen und das in einem RAID, falls das noch nicht der Fall ist. Ansonsten kann auch auf dem Weg vom Festplattencontroller zur Festplatte oder zurück ein Bit flippen und dir Daten kaputt machen.