Stand: 16. Januar 2008, 22:00 letzte Änderungen kursiv gesetzt
Korrelationen.
Normwert, Durchschnitt, Normabweichung, durchschnittliche Abwei- chung, Streuung und die
jeweiligen Veränderungen
Mit dem Ziel ein komplexes, meist multivariables Gebilde “besser zu verstehen”, kann dieses beobachtet werden, um herauszufinden, ob n-tuple (etwa Paare) von Werten, die
Zustände beschreiben von einander abhängen, d.h., ob ein Wert den oder die anderen Werte zur Folge hat. Ziel ist Erkenntnisgewinn, um beispiels- weise wenn-dann Fragen zu beantworten oder schlicht eine
Verhaltensprognose zu gewinnen.
1. Beispiel:
Hängt die Größe des Menschen von seinem Gewicht - oder umgekehrt - ab, ist in lockerer Sprechweise eine typische Frage nach komplexen Zusammenhängen. In
strenger mathematischer Logik lautet die Antwort (zunächst) “nein”, kein kausaler Zusammenhang. Zwar ist die Beobachtung, dass Größe und Gewicht in der Regel (oft, meistens) gemeinsam zunehmen zutreffend.
Sowohl Gewicht wie Größe sind nämlich die gemeinsame Konsequenz eines biochemischen Zustandes, der Wachstum und Gewichtszunahme gleichzeitig auslöst. Es ist aber nicht zutreffend, dass Größe als Konsequenz von Gewicht,
bzw. Gewicht als Konsequenz von Größe “sich” verändern.
Im vorliegenden anschaulichen Fall sind die Verhältnisse jedoch etwas verzwick- ter. Nimmt die Größe des Menschen zu, ist die Zunahme des
Volumens des Knochengerüstes (fast) zwingend, damit ist die Zunahme des Gewichtes ebenfalls zwingend. Insofern gibt es eine starke Beziehung zwischen der Größe des Menschen und dem Gewicht des Knochengerüstes. Es ließe
aber auch umgekehrt denken: Aufgrund eines biochemischen Impulses lagert sich im/am Knochen zusätzliches Material ab und deswegen wächst der Mensch.
Die vorsichtig einschränkende Ausdrucksweise
(“zunächst”, “oft”, “meistens” oder “fast”) ist der Tatsache geschuldet, dass zwischen Gewicht und Größe eines Menschen kein eineindeutiger funktioneller Zusammenhang
besteht. Größe und Gewicht korrelieren - lediglich. Werden Größe/Gewicht vieler Menschen bestimmt und diese als Wertepaare auf XY eingetragen dazu der orthogonale Schnittpunkte in der Fläche, ergebt sich Im XY Diagramm
eine zigarrenförmige Wolke; je breiter die Zigarre, desto schlechter die Korrelation und umgekehrt.
Korrelationen zwischen Variablen zu ermitteln, hat also den Sinn, den unbekannten funktionellen Zusammenhang
durch die best mögliche Näherung zu ersetzen. Die Werkzeuge und die gewinnbaren Aussagen sind die der mathematischen Statistik. Als Beispiel, die Formel
Gewicht = A * Größe + B
sie gelte im Bereich
plus/minus 3% der gewonnenen Gewichtsaussage mit der Wahrscheinlichkeit 0 < epsilon < 1,0 für alle Individuen
20 < Alter in Jahren < 60 und 120 < Größe in cm < 199
Für den
gewählten Zweck mag die Formel und ihre Einschränkungen hinreichend genau sein; der mathematische Formalismus liefert aber keine Aussage über die möglicherweise bestehende partielle oder vollkommene Kausalität zwischen
Gewicht und Größe bzw. zwischen Größe und Gewicht.
2. Beispiel:
In einem Aufsatz in Bild der Wissenschaft vom 11.10.2007 wird postuliert, dass seit je her im täglichen Gebrauch häufig verwendete
Wörter desto seltener verändert werden. Dies gehe so weit, dass solche Wörter sprachübergreifend ähnlicher klingen. Korrelation ist dem zufolge die Funktion:
Phonetische Änderungsgeschwindigkeit = f ( 1 / Verwendungshäufigkeit )
So gut die Korrelation als Ergebnis der Anwendung des mathematischen Formalismus auch sein mag, ist erneut erneut hervorzuheben, dass etwa
über eine physikalisch oder biologische Kausalität zwischen Verwendungsfrequenz und Änderungsgeschwindigkeit nichts ausgesagt und erkannt wird.
Der Fall ist also dadurch gekennzeichnet, dass es eine Korrelation
zwischen Variablen gibt, obwohl der kausale Zusammenhang völlig unbekannt ist.
3. Beispiel
Beobachtet wird, dass der Heizölverbrauch mit der gewünschten Raumtemperatur steigt. Dies liegt daran,
dass der Wärmefluss durch Wände und Fenster proportional mit dem Temperaturgefälle (T-Innen - T-Außen) zunimmt, wie dies zahllose Versuche aller Art bestätigen. Die Korrelation müsste dem zu Folge von der Form sein:
Ölverbrauch = a * (T-Innen - T-Außen) a = Konstante
Zwecks empirischer Bestätigung werden an einem Bauwerk Messungen durchgeführt. Resultat:
Die Messwerte streuen um die o.a. Gerade. Ohne weitergehende Untersuchungen ist Ergebnis: “Der Ölverbrauch hängt von weiteren Variablen ab”. Diese Variablen sind unter anderen die Windgeschwindigkeit und die
Luftfeuchtigkeit. Ohne Versuche oder theoretische Überlegungen bleibt der kausale Zusammenhang allerdings unverändert unbekannt.
Eine Verallgemeinerung
Zeigt sich in einer Messreihe ein formeller
Funktionszusammenhang und ergibt sich eine sehr gute Korrelation dergestalt, dass etwa die Wertepaare genau auf der Kurve liegen, so darf daraus nicht geschlossen werden, dass die Wertepaare entsprechend zu 100% von
einander abhängen. Es könnten nämlich auch andere Variablen die Werte in der Weise beeinflussen, dass die unter den Bedingungen der erfolgten Messungen sich gegenseitig aufheben. Es gibt keine Methode der mathematischen
Statistik die beliebig schwach auf den verborgenen Funktionszusammenhang hinweisen.
Fazit:
Wird zwischen zwei oder mehr Erscheinungen eines Systems eine Korrelation ermittelt, so muss der
vermutete kausale Zusammenhang unbedingt mit nachvollziehbarer Sorgfalt begründet werden, wenn aus dem Zusammenhang sinnvolle (zielführende) Konsequenzen der Art wenn->dann oder “weil a deswegen b
gezogen” werden sollen.
|