W poprzednim artykule pisałem właśnie o regresji liniowej i jej zastosowaniu. Niniejszy artykuł jest kontynuacją tej pracy, w którym formalnie wyprowadzimy estymatory metody najmniejszych kwadratów parametrów modelu regresji liniowej.
Załóżmy, że dysponujemy n obserwacjami y1,y2,…,yn zmiennej y oraz odpowiadającymi im obserwacjami x1,x2,…,xn zmiennej x. Wtedy model zależności w regresji liniowej dla powyższych obserwacji jest postaci
yi=axi+b+ei,i=1,2,…,n,
przy czym a≠0, b∈R są nieznanymi parametrami, a ei to błędy losowe. Oszacowania parametrów a i b uzyskane metodą najmniejszych kwadratów mają postać
ˆa=y1(x1−ˉx)+y2(x2−ˉx)+⋯+yn(xn−ˉx)(x1−ˉx)2+(x2−ˉx)2+⋯+(xn−ˉx)2,ˆb=ˉy−ˉxˆa,
przy czym ˉx=1n(x1+x2+⋯+xn) i ˉy=1n(y1+y2+⋯+yn) są średnimi arytmetycznymi z obserwacji zmiennych x i y, odpowiednio. Otrzymujemy zatem prostą postaci y=ˆax+ˆb zwaną prostej regresji opisującą zależność między zmiennymi x i y.
Wyprowadzenie estymatorów metody najmniejszych kwadratów parametrów a i b podanych we wzorach (2) rozpoczniemy od przedstawienia modelu (1) w postaci wykorzystującej macierze. Poniżej przedstawimy kilka potrzebnych informacji o macierzach, lecz w trosce o zachowanie przejrzystości artykułu, ograniczamy formalizm i szczegółowe definicje do minimum.
Macierz to pewna funkcja, której jednak nie będziemy tutaj dokładnie definiować. Wystarczy nam intuicyjne zrozumienie macierzy jako tablicy liczb. Przykładowa macierz o czterech wierszach i trzech kolumnach jest następująca
[315537441625].
Liczby, które występują w macierzy nazywamy jej elementami. Elementami powyższej macierzy są liczby 3,1,5,5,3,7,4,4,1,6,2,5. Macierzy o tej samej liczbie wierszy i kolumn możemy dodawać i odejmować element po elemencie, np.
[315537441625]+[526144735526]=[3+51+25+65+13+47+44+74+31+56+52+25+6]=[83116711117611411].
Ponadto, macierze możemy również mnożyć. Aby wymnożyć dwie macierze przez siebie, mnożna musi mieć taką samą liczbę kolumn jak liczba wierszy mnożnika. Mnożenie macierzy nie jest mnożeniem element po elemencie jak w przypadku dodawania. Niech
A=[a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮am1am2⋯amn],B=[b11b12⋯b1kb21b22⋯b2k⋮⋮⋱⋮bn1bn2⋯bnk].
Macierze A i B mnożymy według wzoru
AB=[c11c12⋯c1kc21c22⋯c2k⋮⋮⋱⋮cm1cm2⋯cmk],
przy czym
cij=ai1b1j+ai2b2j+⋯+ainbnj.
Będzie nam potrzebna jeszcze jedna operacja na macierzach, a mianowicie transpozycja macierzy. Macierz transponowana macierzy A (oznaczana A′) to taka, której wiersze są kolumnami macierzy A. Mówiąc bardziej zrozumiale, zamieniamy tutaj wiersze na kolumny. Macierzą transponowaną macierzy (3) jest macierz
[354613425715].
Możemy teraz przejść do przedstawienia modelu (1) w postaci macierzowej. Zdefiniujmy wpierw macierze
Y=[y1y2⋮yn],X=[1x11x2⋮⋮1xn],β=[ba],E=[e1e2⋮en]
oznaczające odpowiednio macierze obserwacji zmiennej y, obserwacji zmiennej x wraz z kolumną samych jedynek odpowiadającą wyrazowi wolnemu b, parametrów a i b, oraz macierz błędów ei,i=1,2,…,n. Przy takich oznaczeniach model (1) możemy zapisać wzorem
Y=Xβ+E.
To przedstawienie modelu (1) pozwala nam skorzystać ze znanego wzoru na estymatory metody najmniejszych kwadratów parametrów będących elementami macierzy β, przedstawiającego się następująco
ˆβ=(X′X)−1X′Y,
przy czym (X′X)−1 oznacza odwrotność macierzy X′X (za chwilę powiemy o niej więcej). Podstawiając do tego wzoru macierze X i Y podane w (4), wyznaczymy estymatory parametrów a i b zaprezentowane równaniami (2). Korzystając z podanych powyżej definicji, najpierw transponujemy macierz X:
X′=[11…1x1x2…xn],
a następnie wymnażamy przez siebie macierze X′ i X:1
X′X=[11…1x1x2…xn][1x11x2⋮⋮1xn]=[n∑ni=1xi∑ni=1xi∑ni=1x2i]=[nnˉxnˉx∑ni=1x2i].
Teraz musimy odwrócić macierz X′X, czyli znaleźć do niej macierz odwrotną. Macierz odwrotna A−1 do macierzy A to taka macierz, dla której A−1A=AA−1=I, przy czym
I=[10⋯001⋯0⋮⋮⋱⋮00⋯1]
jest macierzą jednostkową. W świecie macierzy, macierz odwrotna jest czymś w rodzaju liczby odwrotnej (x — liczba niezerowa, 1/x — liczba odwrotna do liczby x) a macierz jednostkowa — liczby jeden. Zazwyczaj szukanie macierzy odwrotnej jest czasochłonne. Na szczęście, nam jest potrzebna macierz odwrotna do macierzy o dwóch wierszach i kolumnach (patrz X′X), którą łatwo znaleźć korzystając ze wzoru
[abcd]−1=[dad−cb−bad−cb−cad−cbaad−cb].
Mianownik ,,ad−cb” dla macierzy X′X liczymy następująco
n⋅n∑i=1x2i−(nˉx)2=n(n∑i=1x2i−nˉx2)=nn∑i=1(xi−ˉx)2,
przy czym ostatnią równość otrzymujemy w następujący sposób korzystając ze wzoru skróconego mnożenia
n∑i=1(xi−ˉx)2=n∑i=1(x2i−2xiˉx+ˉx2)=n∑i=1x2i−n∑i=12xiˉx+n∑i=1ˉx2=n∑i=1x2i−2ˉxn∑i=1xi+ˉx2n∑i=11=n∑i=1x2i−2ˉx(nˉx)+nˉx2=n∑i=1x2i−2nˉx2+nˉx2=n∑i=1x2i−nˉx2.
Zatem
(X′X)−1=[∑ni=1x2in∑ni=1(xi−ˉx)2−nˉxn∑ni=1(xi−ˉx)2−nˉxn∑ni=1(xi−ˉx)2nn∑ni=1(xi−ˉx)2].
Teraz wyznaczamy X′Y:
X′Y=[11…1x1x2…xn][y1y2⋮yn]=[∑ni=1yi∑ni=1xiyi]=[nˉy∑ni=1xiyi].
Podsumowując
ˆβ=[ˆbˆa]=[∑ni=1x2in∑ni=1(xi−ˉx)2−nˉxn∑ni=1(xi−ˉx)2−nˉxn∑ni=1(xi−ˉx)2nn∑ni=1(xi−ˉx)2][nˉy∑ni=1xiyi]=[(∑ni=1x2i)nˉy−nˉx∑ni=1xiyin∑ni=1(xi−ˉx)2−n2ˉxˉy+n∑ni=1xiyin∑ni=1(xi−ˉx)2].
Po przekształceniach, które zostawiamy Czytelnikowi jako ćwiczenie, otrzymujemy estymatory ˆa i ˆb podane w (2).
Przypisy
- Korzystamy ze skróconego zapisu sumowania za pomocą znaku sumy ∑. Przykładowo, sumę a1+a2+⋯+an możemy w skrócie zapisać następująco ∑ni=1ai.
Artykuł został sfinansowany dzięki wsparciu pozyskanemu przez Poznańską Fundację Matematyczną od Miasta Poznań na realizację projektu ,,Potęga matematyki''.