Modellierung und Analyse von zensierten Daten

Immer wieder kommt es vor, dass ein Teil der Daten aufgrund eines eingeschränkten Mess­-/ Wahr­nehmungsbereiches oder einer begrenzten Studienzeit nicht beobachtet werden kann. Da dieser so genannte zensierte Teil der Daten dennoch Informationen enthält, muss auch dieser Teil in der Auswertung mitberücksichtigt werden, um kein verfälschtes Bild zu bekommen. Zensierte Daten treten im Umwelt­bereich, im technischen Bereich, im Wirtschafts- und im medizinischen Bereich auf. 

Man unter­scheidet mehrere Arten der Zensierung, wie z.B. rechts-, links- und intervallzensierte Daten. Von Rechtszensierung spricht man, wenn man aufgrund eines nach oben hin beschränkten Studienzeit­raums nicht in der Lage ist, alle Untersuchungsobjekte bis zu ihrem Ausfall beobachten zu können. Untersuchungen über die Verweildauer einer Maschine oder eines bestimmten Bauteils in einem Sys­tem kann nur in einem begrenzten Zeitraum erfolgen, indem aber nur ein Teil der Schadensfälle beo­bachtet wird. Linkszensierung heißt, dass unterhalb eines bestimmten Schwellwertes keine Informationen vorliegen. So ist z.B. bei der Messung von Schadstoffen im Boden, im Wasser oder in Lebensmitteln die Konzentration teilweise zu gering um vom Messgerät erfasst werden zu können. Intervallzensierung liegt dann vor, wenn der genaue Zeitpunkt des Ausfalls oder der genaue Messwert nicht beobachtet wurden, sondern nur ein Bereich bzw. ein Intervall angegeben werden kann, indem der Ausfall stattgefunden hat. 

Die Analyse und Modellierung zensierter Daten kann nicht mehr mit Standardmethoden der Statistik erfolgen, sondern benötigt adaptierte Verfahren, wie sie bereits im Bereich der Lebensdaueranalysen zahlreich vorhanden sind. Da das Methodenspektrum der Lebens­daueranalysen vor allem auf rechtszensierte Datensituationen zugeschnitten ist, soll im Rahmen des Projektes abgeklärt werden, inwieweit die Verfahren auch für andere Arten der Zensierung (wie z.B. linkszensiert, intervallzensiert) bereits entwickelt wurden bzw. verwendet werden können. 

In der Praxis ist man zusätzlich mit wiederholten Ereignissen (reccurrent events) und/oder mehreren Schadenstypen (multiple modes of failure) konfrontiert, die eine komplexere Analyse mittels multivariater Verfahren oder so genannter „frailty“-Modelle erfordern.  Mittels Simulationsmethoden soll die Robustheit der einzelnen Verfahren und vor allem das Verhalten bei „heavy censoring“ untersucht werden, da Daten­situationen mit einem großen Anteil an zensierten Beobachtungen in der Praxis keine Seltenheit sind.

PRINT / PDF

Ihre Ansprechperson