Gdybym poznał kiedyś jakiegoś sympatycznego fizyka (a takich jest sporo!), to prędzej czy później chciałbym się od niego dowiedzieć czegoś o fizyce. Jako że wykazuję ponadprzeciętne zainteresowanie wzorami, zapewne zadałbym mu to jedno, skrzętnie pamiętane na wypadek takiej okazji pytanie: jaki jest najpiękniejszy wzór fizyki? Cóż, osobiście mam swojego faworyta – zdaje się nim być znany nam wszystkim wzór związany z równoważnością masy i energii, który po raz pierwszy pojawił się w opublikowanej w 1905 roku pracy Alberta Einsteina. $E=mc^2$, bo o nim mowa, to zgrabne połączenie trzech najważniejszych wartości fizycznych początku XX wieku – masy, energii i stałej prędkości światła.
Wiemy, jak działa świat – jak matematyk fizykowi, tak fizyk matematykowi. Gdybym więc sam miał tę niesamowitą sposobność, aby przedstawić komuś najpiękniejszy moim zdaniem wzór matematyki, to musiałoby to być coś przynajmniej tak samo inspirującego, jak $E=mc^2$. Na szczęście jest jedna równość matematyczna, która łączy w sobie trzy najważniejsze stałe1 tej nauki: stosunek obwodu koła do jego średnicy ($\pi$), podstawę logarytmu naturalnego ($e$) oraz stałą urojoną ($i$). Równość ta, zwana wzorem Eulera, ma przepiękną postać $$e^{i\pi}+1=0.$$
Nie odważę się uzasadniać tutaj, dlaczego (i czy w ogóle) wzór Einsteina jest prawdziwy – to kolejny ciekawy temat na pouczającą rozmowę z nowym przyjacielem-fizykiem. Możemy jednak pokazać, dlaczego równość Eulera zachodzi, poznając przy okazji fascynujące tajniki geometrii płaszczyzny i tego, jak możemy na niej reprezentować punkty. A później? A później wykorzystać tę równość w praktyce!
Punkt na biegunach
Zwykle, kiedy musimy określić położenie punktu na płaszczyźnie, stosujemy współrzędne kartezjańskie. Mówimy wówczas: punkt $P$ ma współrzędne $(10, -2)$, co oznacza, że znajduje się 10 jednostek na prawo od osi pionowej (rzędnych) i dwie jednostki poniżej osi poziomej (odciętych). Te pozycje określamy zwykle (odpowiednio) jako współrzędną $x$ (poziomą) i współrzędną $y$ (pionową). Czy jest to jedyny sposób, aby opisać położenie punktu na płaszczyźnie?
Zauważmy, że jeśli wybierzemy na płaszczyźnie dowolny punkt $P$ o współrzednych kartezjańskich $(x, y)$, to znajduje się on w odległości $r = \sqrt{x^2 + y^2}$ od środka układu współrzędnych. Wynika to z twierdzenia Pitagorasa, które mówi, że w trójkącie prostokątnym kwadrat długości przeciwprostokątnej jest równy sumie kwadratów długości jego przyprostokątnych. Ten fakt prezentuje też poniższa animacja – korzystając z suwaków sprawdź, jak zmienia się ten trójkąt, gdy punkt zmienia swoje współrzędne.
Nasz punkt zawsze znajduje się więc w jednoznacznie określonej odległości $r$ od początku układu współrzędnych, co oznacza, że znajduje się na okręgu o promieniu $r$ i o środku w punkcie $(0,0)$. Z kolei każdy punkt na tym okręgu jest jednoznacznie określony przez kąt utworzony przez przeciwprostokątną (promień okręgu) i oś poziomą (odciętych). Skorzystaj z poniższej karty interaktywnej, aby przekonać się o tym na własne oczy.
Jeśli zamiast podawać kartezjańskie współrzędne $x$ i $y$ punktu $P$, podajemy odległość punktu $P$ od środka układu współrzędnych oraz kąt, jaki tworzy odcinek $OP$ z osią odciętych, to wówczas określamy jego położenie za pomocą współrzędnych biegunowych. Okazuje się, że istnieje nieskończenie wiele sposobów, na które możemy określić położenie punktu w dwuwymiarowej przestrzeni (spróbuj wymyślić jakiś inny). Ciekawe jest jednak to, że nie da się tego zrobić za pomocą tylko jednego parametru (współrzędnej). Podobnie zresztą nie da się określić położenia punktu w trójwymiarowej przestrzeni za pomocą tylko dwóch współrzędnych.
Naturalne pytanie brzmi, czy gdybyśmy znali biegunowe współrzędne punktu, to moglibyśmy łatwo poznać jego współrzędne kartezjańskie i odwrotnie? Odpowiedź jest pozytywna, o czym się zaraz przekonamy.
Załóżmy, że położenie punktu $P$ określone jest współrzędnymi biegunowymi $(r, \alpha)$. Stosunek wartości $y$ (zwróć uwagę, że $y$ może być ujemne) do $r$ ($r$ jest zawsze dodatnie), to po prostu sinus kąta $\alpha$. Innymi słowy $\frac{y}{r} = \sin(\alpha)$, skąd $y = r\sin(\alpha)$. Stosując analogiczne rozumowanie możemy dojść do wniosku, że kartezjańska współrzędna $x$ punktu P jest równa $r\cos{\alpha}$. A zatem jeśli punkt ma współrzędne biegunowe $(r, \alpha)$, to jego współrzędne kartezjańskie są równe $(r\cos(\alpha), r\sin(\alpha))$.
W drugą stronę, jeśli znamy współrzędne kartezjańskie $(x, y)$ punktu $P$, możemy łatwo obliczyć wartość $r$ z twierdzenia Pitagorasa, otrzymując $r = \sqrt{x^2+y^2}$. A co z kątem $\alpha$? Możemy skorzystać z równań, które wykorzystywaliśmy przed chwilą i określić, dla jakich wartości $\alpha$ spełnione są jednocześnie oba równania: $\frac{y}{r} = \sin(\alpha)$ oraz $\frac{x}{r} = \cos(\alpha)$. Jeśli wartości $x$, $y$ i $r$ spełniają równość $x^2 + y^2 = r^2$, to istnieje dokładnie jedna wartość $\alpha$ z przedziału $[0^\circ, 360^\circ)$, dla której zachodzą oba te warunki jednocześnie.2
Liczby zespolone
Liczby ujemne już w dawnych czasach sprawiały problem matematykom. Wraz z rozwojem tej dziedziny napotkano jednak na jedną bardzo istotną przeszkodę – pojawiające się w różnych okolicznościach pierwiastki z liczb ujemnych. W szkole ponadgimnazjalnej spotkania te przyjmują zwykle postać owianego tajemnicą ujemnego wyróżnika trójmianu kwadratowego ($\Delta$), którego napotkanie na swojej drodze kończy się dość silnym stwierdzeniem: ten trójmian nie ma pierwiastków rzeczywistych. Jest to prawda, ale czy ma jakieś… inne?
Przez $i$ będziemy oznaczać wartość taką, że $i^2 = -1$. Jeśli rozszerzymy zbiór liczb rzeczywistych o tę stałą i nadamy jej takie same prawa jak każdej innej liczbie rzeczywistej (to znaczy będziemy mogli ją dodawać, mnożyć przez siebie i przez liczby rzeczywiste, odejmować i dzielić), to każdą liczbę z nowego zbioru (zwanego zbiorem liczb zespolonych) będziemy mogli zapisać w postaci $$z = a + bi.$$ Innymi słowy, liczba zespolona $z$ składa się z części rzeczywistej ($a$) i części urojonej ($b$). Jeśli $b = 0$, to liczba $z$ jest znaną nam doskonale wartością rzeczywistą.
Wynikiem dodawania dwóch przykładowych liczb zespolonych $2+3i$ oraz $2-i$ jest po prostu $4+2i$, a wynikiem mnożenia $$(2+3i)(2-i) = 2\cdot2 – 2\cdot i + 2\cdot 3i -3i^2 = 4 – 2i + 6i + 3 = 7 + 4i.$$
Dodatkowo, liczbę $\sqrt{-4}$ możemy przestawić w postaci $\sqrt{-1}\cdot\sqrt{4}$, ale skoro $i^2 = -1$, to $\sqrt{-1} = i$, więc ostatecznie3 $\sqrt{-4} = 2i$.
Ale zaraz, zaraz… Skoro liczbę zespoloną definiuje jednoznacznie jej część rzeczywista i urojona, to nic nie stoi na przeszkodzie, aby ją (całą tę liczbę) utożsamić z konkretnym punktem w układzie współrzędnych. Niech więc oś pozioma (oś odciętych) reprezentuje wartość pierwszej, a oś pionowa (oś rzędnych) wartość drugiej części. Wówczas liczbie zespolonej $z = a + bi$ będzie jednoznacznie odpowiadał na tej płaszczyźnie punkt o współrzędnych kartezjańskich $(a,b)$. Poniższy aplet prezentuje tę ideę.
Żeby przekonać się, jak silne praktyczne zastosowanie mają liczby zespolone, rozważmy przykładową funkcję kwadratową $f(x) = x^2 + 2x + 2$. Wyróżnik tego trójmianu jest równy $\Delta = -4$, zatem funkcja $f$ nie ma rzeczywistych pierwiastków. Spójrzmy jednak, co otrzymamy, jeśli nie poddamy się tak szybko i skorzystamy ze znanych nam wzorów na pierwiastki trójmianu kwadratowego: $$x_1 = \frac{-2 – \sqrt{-4}}{2} = \frac{-2 – i\sqrt{4}}{2} = -1 – i$$ oraz $$x_2 = \frac{-2 + \sqrt{-4}}{2} = \frac{-2 + i\sqrt{4}}{2} = -1 + i.$$
Są to pierwiastki zespolone równania $f(x) = x^2 + 2x + 2$, a więc takie argumenty, dla których funkcja $f$ przyjmie wartość 0.4 W istocie $$f(-1-i) = (-1-i)^2 + 2(-1-i) + 2 = 1 + 2i – 1 – 2 – 2i + 2 = 0$$ $$f(-1+i) = (-1+i)^2 + 2(-1+i) + 2 = 1 – 2i – 1 – 2 + 2i + 2 = 0.$$
Mister Euler
Teraz, gdy już wiemy wszystko o współrzędnych biegunowych i tym, jak możemy przedstawić liczby zespolone w układzie współrzędnych, czas powrócić do naszego pięknego wzoru. Przypomnijmy, że myślimy tu o $$e^{i\pi} + 1 = 0.$$ Dlaczego jest on prawdziwy? Postaramy się to udowodnić aż na dwa różne sposoby.
Sposób 1 (z wykorzystaniem pochodnych funkcji)
Niech dana będzie funkcja $f(t)$ działająca ze zbioru liczb rzeczywistych do zbioru liczb zespolonych, taka że $f(t) = \cos(t) + i\sin(t)$. Jej pochodna względem $t$ jest równa $$f'(t) = -\sin(t) + i\cos(t) = i(\cos(t) + i\sin(t)) = i\cdot f(t).$$ Niech teraz $$g(t) = e^{-it}f(t).$$ Wówczas $$g'(t) = \left( e^{-it} \right)’f(t) + e^{-it}\cdot f'(t) = -ie^{-it}f(t) + ie^{-it}f(t) = 0.$$ Oznacza to, że $g(t)$ jest funkcją stałą o wartości niezależnej od $t$. Co więcej $$g(0) = e^{-i\cdot 0}\left( \cos(0) + i\sin(0) \right) = 1\cdot\left( 1 + i\cdot 0 \right) = 1,$$ a zatem $f(t) = e^{it}$ (dlaczego?). To zaś oznacza, że $e^{it} = \cos(t) + i\sin(t)$.
Sposób 2 (z wykorzystaniem rozwinięcia funkcji w szereg — dla ambitniejszych czytelników)
Zauważmy (no dobrze, może nie widać tego na pierwszy rzut oka, a pokazane tego wykracza poza ten artykuł, ale możesz mi uwierzyć na słowo), że $$e^t = \sum_{n=0}^\infty \frac{t^n}{n!} = 1 + t + \frac{t^2}{2!} + \frac{t^3}{3!} \dots$$ Tę sumę nazywamy rozwinięciem funkcji $e^t$ w szereg Taylora. Jeśli w analogiczny sposób rozwiniemy funkcję $e^{it}$, otrzymamy5 $$e^{it} = \sum_{n=0}^\infty \frac{(it)^n}{n!} = 1 + it + \frac{(it)^2}{2!} + \frac{(it)^3}{3!} + \frac{(it)^4}{4!} + \frac{(it)^5}{5!} \dots$$ Wiedząc, że $i^2 = -1$, możemy zredukować parzyste potęgi stałej $i$, otrzymując $$e^{it} = \sum_{n=0}^\infty \frac{(it)^n}{n!} = 1 + it – \frac{t^2}{2!} – i\frac{t^3}{3!} + \frac{t^4}{4!} + i\frac{t^5}{5!} \dots$$ Jeśli pogrupujemy wyrazy względem tego, czy są związane ze stałą $i$, czy nie (dlaczego przy żadnym wyrazie tego szeregu nie będzie wyższej niż pierwsza potęgi $i$?), to otrzymamy $$e^{it} = \left(1 – \frac{t^2}{2!} + \frac{t^4}{4!} \dots\right) + i\left(t – \frac{t^3}{3!} + \frac{t^5}{5!} \dots\right)$$ Okazuje się jednak, że pierwszy nawias6 to po prostu rozwinięcie w szereg Maclaurina funkcji $\cos(t)$, a drugi funkcji $\sin(t)$. Stąd otrzymujemy ostatecznie $$e^{it} = \cos(t) + i\sin(t).$$
I po co to wszystko?
W powyższych rozważaniach, zawsze gdy mówiliśmy o kątach, stosowaliśmy notację stopniową. Argumenty przekazywane do funkcji sinus (i cosinus) były więc stopniowymi miarami kątów, np. $\sin(120^\circ)$. W matematyce o wiele częściej stosuje się jednak tzw. radiany, czyli jednostkę, w której kąt reprezentowany jest przez liczbę rzeczywistą. Przyjmujemy, że jeden radian to taki kąt, że długość łuku okręgu o promieniu $r$ wyznaczona przez ten kąt jest równa $r$. Jako że okrąg o promieniu $r$ ma długość $2\pi r$, wartość $360^\circ$ będzie odpowiadać $2\pi$ radianom. Podobnie $180^\circ$ to $\pi$ radianów, $90^\circ$ to $\pi/2$ radianów itd.
Również we wzorze Eulera ($e^{it} = \cos(t) + i\sin(t)$) przez $t$ możemy rozumieć miarę kąta wyrażoną w radianach, a nie w stopniach. Zamiast więc pisać $e^{i\cdot 180^\circ} = \cos{180^\circ} + i\sin(180^\circ)$ możemy napisać $e^{i\pi} = \cos{\pi} + i\sin(\pi)$. Prawa strona tego równania jest jednak równa -1 (dlaczego?), a zatem rzeczywiście $$e^{i\pi} + 1 = 0.$$
Na pierwszy rzut oka ogólny wzór Eulera nie ma żadnego praktycznego zastosowania, poza estetycznym (i to tylko dla jednej wartości $t$). Spróbujmy go jednak wykorzystać do wyprowadzenia wzoru na cosinus wielokrotności kąta. Po tak wyczerpującym wprowadzeniu na pewno będzie Ci łatwo się zgodzić, że jednocześnie zachodzą dwie poniższe równości: $$\begin{cases}
e^{it} = \cos(t) + i\sin(t)\\
e^{-it} = \cos(-t) + i\sin(-t) = \cos(t) – i\sin(t)
\end{cases}$$ Dodając te równania stronami (i przekształcając efekt tego działania nieznacznie) otrzymamy $$\cos(t) = \frac{e^{it}+e^{-it}}{2},$$ a odejmując $$\sin(t) = \frac{e^{it}-e^{-it}}{2i}.$$ Zatem, przykładowo, $$\begin{align}\notag
\cos(nt) & = \frac{e^{int}+e^{-int}}{2} = \frac{{(e^{it})}^n+{(e^{-it})}^n}{2} \\
& = \frac{{(\cos(t) + i\sin(t))}^n+{(\cos(t) – i\sin(t))}^n}{2}.\notag
\end{align}$$ Jeśli w liczniku tego wyrażenia zastosujemy dwumian Newtona, to otrzymamy $$\begin{align}
\notag\cos(nt) & = \frac{\sum_{k=0}^{n} {n \choose k}\cos^k(t)\cdot (i\sin(t))^{n-k} + \sum_{k=0}^{n} {n \choose k}\cos^k(t)\cdot (-i\sin(t))^{n-k}}{2} \\
\notag& = \sum_{k=0}^{n} {n \choose k}\frac{\cos^k(t)\cdot (i\sin(t))^{n-k} + \cos^k(t)\cdot (-i\sin(t))^{n-k}}{2} \\
\notag& = \sum_{k=0}^{n} {n \choose k}\cos^k(t)\frac{i^{n-k}\sin^{n-k}(t) + (-i)^{n-k}\sin^{n-k}(t)}{2} \\
\notag& = \sum_{k=0}^{n} {n \choose k}\cos^k(t)\sin^{n-k}(t)\frac{i^{n-k} + (-i)^{n-k}}{2}
\end{align}$$ Zwróćmy jednak uwagę, że $$\begin{align}
\notag\frac{i^{n-k} + (-i)^{n-k}}{2} & = \frac{(0 + i)^{n-k} + (0-i)^{n-k}}{2} \\
\notag& = \frac{(\cos(\frac{\pi}{2}) + i\sin(\frac{\pi}{2}))^{n-k} + (\cos(\frac{\pi}{2})-i\sin(\frac{\pi}{2}))^{n-k}}{2} \\
\notag& = \frac{(e^{i\cdot \pi/2})^{n-k} + (e^{-i\cdot \pi/2})^{n-k}}{2} = \cos{\frac{(n-k)\pi}{2}},
\end{align}$$ skąd ostatecznie $$ \cos(nt) = \sum_{k=0}^{n} {n \choose k}\cos^k(t)\sin^{n-k}(t)\cos{\frac{(n-k)\pi}{2}}.$$ Tym samym, przykładowo, $$\begin{align}
\notag\cos(2t) &= {2 \choose 0}\cos^0(t)\sin^{2}(t)\cos{\pi} + {2 \choose 1}\cos(t)\sin(t)\cos{\frac{\pi}{2}} \\
\notag&+ {2 \choose 2}\cos^2(t)\sin^{0}(t)\cos{0} = \\
\notag&= 1\cdot 1 \cdot \sin^{2}(t) \cdot (-1) + 2 \cdot 2 \cdot \cos(t)\sin(t) \cdot 0 + 1 \cdot \cos^2(t) \cdot 1 \cdot 1 = \\
\notag& = \cos^2(t)-\sin^{2}(t)
\end{align}$$
Zadanie sprawdzające: Korzystając z ogólnego wzoru Eulera spróbuj wyprowadzić wzór na sinus czterokrotności kąta ($\sin(4t)$).
Przypisy
- W przedstawionej postaci jest to tak naprawdę 5 stałych, jeśli wliczyć 0 i 1.
- Jest to oczywiście całkowita prawda. Warto jednak zauważyć, że jeśli znajdziemy wartość $\alpha$, która spełnia oba te równania, to spełniać je również będą wszystkie wartości postaci $\alpha + k\cdot360^\circ$, gdzie $k$ jest dowolną liczbą całkowitą. Wynika to z okresowości funkcji trygonometrycznych $\sin$ i $\cos$. Aby więc uniknąć sytuacji, w której ten sam punkt w przestrzeni mógłby być określony kilkoma parami współrzędnych, np. $(1, 120^\circ)$ oraz $(1, 480^\circ)$, wprowadzamy to ograniczenie.
- Bardziej spostrzegawczy czytelnik zwróci z pewnością uwagę na fakt, że z równości $i^2 = -1$ wynika, że $i$ jest równe plus lub minus pierwiastkowi z -1. To samo dotyczy zresztą dowolnej liczby rzeczywistej. Pierwiastek z 9 jest równy 3 lub -3, jednak często stosuje się pierwiastek algebraiczny jako substytut pełnoprawnego pierwiastka. To wyjaśnia, dlaczego wzory, które wykorzystujemy do obliczania pierwiastków trójmianu kwadratowego różnią się tylko znakiem przy pierwiastku algebraicznym z wyróżnika $\Delta$, ale też to, dlaczego dla wyróżnika równego 0 mamy do czynienia z jednym pierwiastkiem podwójnym.
- Ciekawostka: każdy wielomian $n$-tego stopnia ma dokładnie $n$ pierwiastków (z dokładnością do ich krotności), nawet jeśli nie wszystkie są pierwiastkami rzeczywistymi. Co więcej, jeśli pierwiastkiem wielomianu jest liczba $z = a + bi$, to jest nim też liczba do niej sprzężona, a więc $\bar{z} = a – bi$. Spróbuj to udowodnić.
- Musimy tu niestety pominąć uzasadnienie faktu, że zastosowany tu szereg Taylora jest zbieżny.
- Zastosowany powyżej zapis nie jest do końca poprawny matematycznie. Jeśli jednak spojrzymy na część rzeczywistą i część urojoną osobno, można go usprawiedliwić.
Artykuł został sfinansowany dzięki wsparciu pozyskanemu przez Poznańską Fundację Matematyczną od Miasta Poznań na realizację projektu ,,Potęga matematyki''.