Original von TVK_NoWaY
Ist noch recht früh gewesen.
Wir arbeiten gerade mit Trendlinien in Exel und sollten dies nun auch einmal uns Mathematisch herleiten.
Also eine Punktewolken, und alle geraden durch den a-Mittelwert von (x/y) suchen wir die gerade mit der Bedingung, dass bei ihr die Summe der Quardrate der vertikalen Abweichung minimal ist.
Summe (yi-Y)^2 soll minimal sein ; g(x)=Y=m*x+b
wir sollen nun zeigen, dass m Regressionskoeffizient
m=n*Summe(xi*yi) - Summe(xi)*Summe(yi) / n*Summe(xi)^2 - (Summe(yi))^2
Summe steht fürn Summenzeichen
Ich glaube es muss nur heißen:
m=(n*Summe(xi*yi) - Summe(xi)*Summe(yi)) / (n*Summe(xi)^2)
Den Nenner bekommst du, weil in meiner obigen Formel (X^t * X) invertiert werden muss:
(X^t * X) = [[x^t * x, x^t * 1],[1^t * x, 1^t * 1]] (Zeilennotation)
Invertierst man diese Matrix [[a, b],[c, d]], so erhält man
[[a, b],[c, d]]^-1 = (1/(ad-bc)) * [[d, b],[c, a]]
Also folgt für den
Vorfaktor = 1/((1^t * 1)(x^t * x) - (1^t * x)(x^t * 1)) = 1/(n+Summe(x_i^2)-(Summe(x_i)^2)
Im Nenner kann y gar nicht auftauchen, weil da nur X eingeht.
Rechnet man weiter (X^t * X)^-1 * X^t * y, so erhält man:
Vorfaktor * (n * (x^t * y^t) + (x^t * 1)(y^t * 1)) für den Anstieg, d.h.
= (n*Summe(x_i*y_i)+Sumem(x_i)*Summe(y_i)) / (n*Summe(x_i^2)-(Summe(x_i))^2).
Das dies optimal ist sieht man, wenn man sichd ie Formel für den Schätzer b herleitet:
y = Xb+e <=> e = y-Xb
min! (e^t * e) = (y-Xb)^t * (y-Xb) = (y^t * y) -2*y*(Xb)^t + (Xb)^t * (Xb)
Zum minimieren ableiten und Nullsetzen:
d(e^t * e)/db = -2*X^t * y + 2* (X^t * X)*b = 0 <=> b = (X^t * X)^-1 * X^t * y
überprüfen, ob Minimum:
d^2(e^t * e)/d(b * b^t) = 2 * (X^t * X) ist positiv definit, da X reell und linear unabhängig in den Spalten.