Podstawy Fizyki sem.2

Transkrypt

Podstawy Fizyki sem.2
Podstawy Fizyki II
Strona
1
Strona 2
Podstawy Fizyki II
SPIS TREŚCI
WSTĘP ......................................................................................................... 5
12. MAGNETYZM ....................................................................................... 7
12.1. POLE MAGNETYCZNE.......................................................................................................8
12.2. RUCH ŁADUNKU W POLU MAGNETYCZNYM ..........................................................................9
12.3. POLE MAGNETYCZNE PRĄDU ...........................................................................................16
12.4. ZJAWISKO INDUKCJI ELEKTROMAGNETYCZNEJ .....................................................................27
12.5. MAGNETYCZNE WŁASNOŚCI MATERII ................................................................................39
12.6. ENERGIA POLA MAGNETYCZNEGO ....................................................................................45
13. OBWODY PRĄDU ZMIENNEGO ......................................................... 49
13.1. IMPEDANCJA ...............................................................................................................50
13.2. DRGANIA ELEKTRYCZNE .................................................................................................54
13.3. DRGANIA TŁUMIONE W OBWODZIE RLC ...........................................................................58
13.4. MOC W OBWODACH PRĄDU ZMIENNEGO ..........................................................................62
14. FALE.................................................................................................... 64
14.1. CO TO JEST FALA...........................................................................................................65
14.2. RÓWNANIE RÓŻNICZKOWE FALI .......................................................................................66
14.3. SUPERPOZYCJA FAL .......................................................................................................69
14.4. FALE STOJĄCE ..............................................................................................................71
14.5. FALA AKUSTYCZNA ........................................................................................................73
14.6. ENERGIA FALI...............................................................................................................74
14.6. EFEKT DOPPLERA .........................................................................................................76
15. FALE ELEKTROMAGNETYCZNE ........................................................... 78
15.1. WIDMO FAL ELEKTROMAGNE- TYCZNYCH ..........................................................................79
15.2. RÓWNANIA MAXWELLA ................................................................................................79
15.3. ROZCHODZENIE SIĘ FALI ELEKTROMAGNETYCZNEJ................................................................82
15.4. WEKTOR POYNTINGA....................................................................................................85
16. OPTYKA .............................................................................................. 87
16.1. PRAWA ZAŁAMANIA I ODBICIA ŚWIATŁA ............................................................................88
16.2. OPTYKA GEOMETRYCZNA ...............................................................................................96
16.3. POLARYZACJA ............................................................................................................105
16.4. INTERFERENCJA..........................................................................................................107
Strona
3
16.5. DYFRAKCJA ...............................................................................................................111
17. SZCZEGÓLNA TEORIA WZGLĘDNOŚCI ............................................ 115
17.1. SZCZEGÓLNA TEORIA WZGLĘDNOŚCI. ..............................................................................116
17.2. TRANSFORMACJA LORENTZA.........................................................................................119
17.3. KONSEKWENCJE PRZEKSZTAŁCEŃ LORENTZA .....................................................................121
17.4. DYNAMIKA RELATYWISTYCZNA ......................................................................................127
18. FIZYKA KWANTOWA ........................................................................ 131
18.1. PRAWA PROMIENIOWANIA...........................................................................................132
18.2. KWANTOWA NATURA PROMIENIOWANIA ........................................................................137
18.3. DUALIZM KORPUSKULARNO-FALOWY .............................................................................148
19. FIZYKA ATOMU I FIZYKA JĄDRA ATOMOWEGO ............................ 151
19.1. BUDOWA ATOMU.......................................................................................................152
19.2. JĄDRO ATOMOWE ......................................................................................................163
19.3. PROMIENIOTWÓRCZOŚĆ ..............................................................................................167
19.4. ROZPADY PROMIENIOTWÓRCZE.....................................................................................170
19.5. REAKCJE JĄDROWE .....................................................................................................176
20. ELEMENTY MECHANIKI KWANTOWEJ.............................................. 184
20.1. WŁAŚCIWOŚCI FALOWE MATERII ...................................................................................185
20.2. FUNKCJA FALOWA I RÓWNANIE SCHRÖDINGERA ...............................................................190
20.3. ROZWIĄZANIA RÓWNANIA SCHRÖDINGERA DLA WYBRANYCH POTENCJAŁÓW .........................193
20.4. KWANTOWY MODEL ATOMU ........................................................................................199
21. FIZYKA CIAŁA STAŁEGO .................................................................. 206
21.1. WIĄZANIA CHEMICZNE ................................................................................................207
21.2. STRUKTURY KRYSTALICZNE ...........................................................................................214
21.3. MODEL PASMOWY CIAŁ STAŁYCH...................................................................................220
21.4. URZĄDZENIA PÓŁPRZEWODNIKOWE ...............................................................................231
21.5. LASERY.....................................................................................................................241
Strona 4
Podstawy Fizyki II
Wstęp
Niniejsze materiały zostały opracowane w ramach realizacji
Programu
Rozwojowego
Politechniki
Warszawskiej
współfinansowanego przez Unię Europejską w ramach
Europejskiego
Funduszu
Społecznego
PROGRAM
OPERACYJNY KAPITAŁ LUDZKI. Przeznaczone są dla
słuchaczy
Studiów
Podyplomowych
„KOMPUTEROWE
WSPOMAGANIE
PROJEKTOWANIA
I
PODSTAWY
WZORNICTWA PRZEMYSŁOWEGO” prowadzonych na
Wydziale Samochodów i Maszyn Roboczych Politechniki
Warszawskiej.
Niniejsze opracowanie przygotowano dla przedmiotu pt.
„Podstawy Fizyki”. Jego zawartość merytoryczna w pełni
odpowiada zakresowi opisanemu w sylabusie opracowanym dla
tego przedmiotu.
Skrypt stanowi drugą część opracowanych materiałów
dydaktycznych, stanowi kontynuację pierwszej części i dotyczy
zagadnień omawianych podczas drugiego semestru wykładów z
ww przedmiotu. Opracowane zagadnienia podzielone zostały
na 10 rozdziałów.
W rozdziale 12 omówione zostały właściwości fizyczne pola
magnetycznego, ruch ładunku i przewodnika z prądem w polu
magnetycznym a także magnetyczne właściwości materii.
Rozdział 13 dotyczy podstawowych właściwości obwodów prądu
zmiennego.
W rozdziale 14 wprowadzone pojęcia fali, fali stojącej, energii i
natężenia fali a także opisano mechanizmy rozchodzenia i
nakładania się fal.
W rozdziale 15 opisano podstawowe właściwości
elektromagnetycznych oraz równania Maxwella.
Strona
fal
5
Rozdział 16 dotyczy optyki geometrycznej oraz podstawowych
zjawisk optyki falowej takich jak interferencja, dyfrakcja czy
polaryzacja.
W rozdziale 17 przedstawiono założenia szczególnej teorii
względności, elementy mechaniki relatywistycznej oraz
konsekwencje przekształceń Lorentza.
Rozdział 18 stanowi wprowadzenie do zagadnień fizyki
kwantowej,
omówione
zostały
zjawiska
ukazujące
korpuskularną naturę światła.
W rozdziale 19 opisana jest budowa atomu, w tym model Bohra
atomu wodoru, a także zagadnienia z fizyki jądrowej dotyczące
rozpadów promieniotwórczych i reakcji jądrowych.
Rozdział 20 poświęcony jest mechanice kwantowej.
Przedstawiono w nim między innymi zasadę nieoznaczoności
Heisenberga, równanie Schrödingera wraz z rozwiązaniami dla
prostych układów kwantowych oraz kwantowy model atomu.
W rozdziale 21 przedstawiono elementy fizyki ciała stałego w
tym podstawowe informacje o wiązaniach chemicznych,
strukturze krystalicznej a także o strukturze pasmowej ciał
stałych.
Strona 6
Podstawy Fizyki II
12
Magnetyzm
W tym rozdziale:
o
Ruch ładunku w polu magnetycznym, siła
Lorentza
o
Przewodnik z prądem w polu magnetycznym,
silnik elektryczny
o
Pole magnetyczne prądu, prawo BiotaSavarta, prawo Ampera
o
Magnetyczne własności materii, moment
magnetyczny elektronu, rodzaje
magnetyków
o
Indukcja elektromagnetyczna, prawo indukcji
Faradaya
o
Prądnica, alternator
o
Indukcyjność, transformator
o
Energia pola magnetycznego
Strona
7
12.1. Pole magnetyczne
Pierwsze wzmianki o wykorzystaniu zjawiska magnetyzmu
pochodzą ze starożytności. Kompasy wykorzystywane w
nawigacji pojawiły się w Chinach około I wieku n.e.
Dokładniejszy opis zjawisk magnetyzmu zawdzięczamy jednak
badaniom nad prądem elektrycznym, które ujawniły bliski
związek pola magnetycznego z elektrycznym i możliwość
wzajemnej indukcji obu pól.
W przypadku pola elektrycznego, jego źródłem były ładunki
elektryczne. Układ ładunków dodatniego i ujemnego,
umieszczonych w stałej odległości od siebie określiliśmy jako
dipol elektryczny. Odpowiednikiem dipolu elektrycznego jest
dipol magnetyczny, czyli magnes, składający się z dwóch
nierozdzielnych biegunów magnetycznych – północnego N i
południowego S. Biegun północny nie może istnieć bez
południowego i jeśli rozdzielimy magnes sztabkowy w poprzek
na dwie połówki otrzymamy dwa magnesy zawierające również
bieguny N i S. Dalszy podział magnesu będzie prowadził do
wytworzenia coraz mniejszych dipoli magnetycznych, aż
otrzymamy najmniejszy niepodzielny dipol zawierający również
dwa bieguny.
Prawo Gaussa dla magnetyzmu
Pole magnetyczne nazywamy polem bezźródłowym. Linie
takiego pola są zawsze liniami zamkniętymi, nie mają początku
ani końca jak w przypadku pola elektrycznego. W prosty sposób
możemy sformułować prawo Gaussa dla pola magnetycznego:


 B  dS  0
(12.1)
Ponieważ linie pola magnetycznego są zamknięte to całkowita
wartość strumienia wektora indukcji pola magnetycznego
przechodząca przez dowolną powierzchnię zamkniętą jest
równa zeru.
Strona 8
Podstawy Fizyki II
12.2. Ruch ładunku w polu
magnetycznym
Siła Lorentza
Na ładunek elektryczny poruszający się w polu magnetycznym
działa tzw. siła Lorentza. Działanie tej siły obserwujemy w
przypadku, kiedy ładunek porusza się, a wektor prędkości
posiada
składową
prostopadłą
do
kierunku
pola
magnetycznego. W tym przypadku siła powoduje zakrzywienie
toru ruchu ładunku.
Rysunek 12.1. Siła Lorentza działająca na ładunek poruszający się w polu
magnetycznym
Wartość siły Lorentza zależy od wartości ładunku
elektrycznego, prędkości poruszania się tego ładunku i również
od „siły” pola magnetycznego. Aby scharakteryzować tę „siłę”
pola
magnetycznego
wprowadzamy
wektor
indukcji

magnetycznej B . Wektor ten na zewnątrz magnesu jest
skierowany od bieguna północnego „N” do bieguna
południowego „S” magnesu. Jednostką indukcji jest tesla

N
Nms
J s
V s
1
1
1 2  .
1T  1
2
2
Cms
Cm
Cm
m 

Strona
9
Siłę Lorentza FL możemy wyrazić jako iloczyn ładunku q przez

iloczyn wektorowy prędkości v oraz wektora indukcji pola
magnetycznego

B:



FL  q v  B
(12.2)
Wektor siły Lorentza FL jest prostopadły do płaszczyzny
wyznaczonej przez wektory v oraz B a jego zwrot możemy
określić z reguły śruby prawoskrętnej lub reguły prawej dłoni
(rozdział 1.3). Kierunek i zwrot wektora siły Lorentza
działającej na dodatni ładunek poruszający się z prędkością v
prostopadłą do kierunku pola magnetycznego B pokazany jest
na rysunku 12.1.
W ogólnym przypadku ładunek może znajdować się zarówno w
polu magnetycznym, jak i polu elektrycznym. Wypadkowa siła
działająca w takim przypadku na ten ładunek będzie złożeniem
siły elektrostatycznej oraz Lorentza:




F qE q v  B
(12.3)
Siła Lorentza powoduje zakrzywienie toru ruchu ładunku tak,
że ładunek poruszający się prostopadle do linii sił pola
magnetycznego porusza się po okręgu. Siła Lorentza jest więc
siłą dośrodkową działającą na ładunek q o masie m poruszający
się po okręgu o promieniu r :
F L  Fd
qvB 
mv 2
r
(12.4)
W powyższym przypadku wektory prędkości i indukcji są do
siebie prostopadłe, więc iloczyn wektorowy (jego wartość)
możemy zastąpić zwykłym mnożeniem. Z równania 12.4
otrzymujemy promień r okręgu, po jakim porusza się ładunek q
o masie m w polu magnetycznym o indukcji B:
r
Strona 10
mv
qB
(12.5)
Podstawy Fizyki II
Po przekształceniach wzoru możemy przekonać się, że prędkość
kątowa w takim ruchu nie zależy od prędkości postępowej
ładunku:
v
r
ω 
qB
m
(12.6)
Przykłady
Przykładem wykorzystania działania siły Lorentza do
zakrzywienia toru ładunku jest cyklotron. W cyklotronie
naładowane cząstki są przyspieszane polem elektrycznym
pomiędzy tzw. duantami. Pole magnetyczne zakrzywia tor lotu
cząstki tak, że cząstka wraca ponownie w obszar pomiędzy
duantami.
Rysunek 12.2 Schemat działania cyklotronu z zaznaczonym torem ładunku
dodatniego.
Ponieważ częstość obiegu cząstki nie zależy od jej prędkości v
(jak wykazaliśmy we wzorze 12.6), możemy tak dobrać częstość
przełączania pola elektrycznego przyłożonego do duantów, by
przyspieszało cząstkę zawsze, kiedy jest ona między duantami.
Cząstka (np. elektron) wyemitowana w środku przyrządu,
między duantami w miarę kolejnych przejść przez obszar
pomiędzy duantami zwiększać będzie swoją prędkość a więc i
promień toru lotu cząstki tak, że w końcu opuści ona cyklotron.
Strona
11
W przypadku lampy katodowej telewizora kineskopowego
strumień elektronów emitowany z rozgrzanej katody trafia w
obszar skrzyżowanych pól magnetycznych. W ten sposób
wiązka może być odchylana w pionie i w poziomie i kierowana
w odpowiednie miejsce na kineskopie, gdzie uderzając w
warstwę luminoforu rozświetla dany punkt. Punkty układają
się w linie a linie składają się na kolejne „klatki” obrazu, które
są wyświetlane jedna po drugiej na tyle szybko, że nasze oko
nie zauważa procesu odświeżania obrazu.
W spektrometrze masowym najpierw za pomocą odpowiednich
parametrów
pola
elektrycznego
i
magnetycznego
selekcjonujemy cząstki o identycznym ładunku i prędkości,
które to cząstki następnie wlatują w obszar pola
magnetycznego tak, że ich wektor prędkości jest prostopadły do
wektora indukcji magnetycznej. Ponieważ ich ładunek i
prędkość są identyczne, jedynym parametrem wpływającym na
promień toru cząstek w polu magnetycznym jest ich masa.
Izotopy tego samego pierwiastka, posiadające ten sam ładunek,
ale różniące się masą, będą poruszać się po różnych torach, co
możemy wykryć za pomocą detektora. Za pomocą spektrometru
masowego możemy zatem badać skład izotopowy pierwiastków
wchodzących w skład związków chemicznych.
Jeśli prędkość cząstki posiada nie tylko składową prostopadłą
do kierunku pola magnetycznego ale i składową równoległą do
tego kierunku, wówczas tor ruchu cząstki będzie linią śrubową.
Z takim torem śrubowym mamy do czynienia na przykład w
zjawisku zorzy polarnej. Gdy naładowane cząstki, powstałe w
większości na Słońcu, wpadają w obszar pola magnetycznego
Ziemi, działająca na nie siła Lorentza powoduje zakrzywienie
toru ich lotu tak, że poruszają się one po torach śrubowych
wzdłuż linii Ziemskiego pola magnetycznego, w kierunku
ziemskich biegunów magnetycznych. Ponieważ linie sił pola
magnetycznego zagęszczają się w pobliżu biegunów
magnetycznych Ziemi, koncentracja naładowanych cząstek w
tym rejonie jest stosunkowo duża. Podczas oddziaływania tych
cząstek z atmosferą Ziemi powstaje promieniowanie, które
obserwujemy jako zorzę polarną.
Strona 12
Podstawy Fizyki II
Przewodnik z prądem w polu magnetycznym
Jeśli przewodnik, przez który płynie prąd elektryczny znajduje
się w polu magnetycznym, to na nośniki ładunku poruszające
się wewnątrz tego przewodnika działa siła Lorentza. Jeżeli we
wzorze na siłę Lorentza wartość ładunku q wyrazimy za
pomocą natężenia I przepływającego prądu oraz powiążemy
prędkość nośników ładunku v z czasem t, w jakim pokonują one
odcinek przewodnika o długości l, to otrzymujemy wzór na siłę
Lorentza F działającą na nośniki ładunku poruszające się w
przewodniku znajdującym się w polu magnetycznym o indukcji
B:

 
 
l 
F q v B  I t B  I l B
t

 
F  I l B

(12.7)
Siła ta nazywana elektrodynamiczną działając na przewodnik z
prądem jest wprost proporcjonalna do natężenia prądu I,
długości przewodnika l oraz indukcji pola magnetycznego B.
Silnik elektryczny
Siłę elektrodynamiczną wykorzystuje się w silnikach
elektrycznych. Rozpatrzmy uproszczony model silnika
elektrycznego składającego się z pojedynczej ramki, w której
płynie prąd, umieszczonej w polu magnetycznym o indukcji B,
pomiędzy dwoma biegunami magnesu (w rzeczywistym silniku
jest to kilka ramek o wspólnej osi obrotu). Ramka ta może
obracać się wokół własnej osi prostopadłej do kierunku wektora
indukcji magnesu stałego. Jeżeli przez ramkę płynie prąd o
natężeniu I, to na każdy z boków ramki działa siła
elektrodynamiczna



( F  I l B )
skierowana
prostopadle
zarówno do kierunku przepływu prądu jak i do kierunku pola
magnetycznego (rysunek 12.3). Siły działające na boki o
długości a mają tę samą wartość, F  I a B , ale przeciwny
zwrot i w efekcie kompensują się. Wartość siły działającej na
każdy z boków o długości b wynosi F  I bB . Siły te działają
Strona
13
na ramieniu o długości a 2 (odległość boku b od osi obrotu
ramki wynosi a 2 ) tak, że efektywnie na ramkę działać będzie
moment sił M :


M  2 a 2 I bB sinα  IA B sinα
(12.8),
gdzie B oznacza indukcję pola magnetycznego, I natężenie
prądu płynącego w prostokątnej ramce o wymiarach a x b i
polu powierzchni A, zaś α jest kątem, jaki tworzy wektor

normalny (prostopadły) do płaszczyzny ramki z wektorem B .
Zwrot wektora normalnego wyznaczamy z reguły śruby
prawoskrętnej obracanej w kierunku opływania ramki przez
prąd elektryczny.
Rysunek 12.3. Schemat zasady działania silnika elektrycznego prądu stałego.
Moment siły działający na ramkę z prądem jest maksymalny,
kiedy płaszczyzna ramki jest równoległa do linii sił pola
magnetycznego (α=π/2). Jeśli ramka jest ustawiona prostopadle
do kierunku pola magnetycznego (α=0) to wypadkowy moment
sił jest równy zeru. Jeżeli ramka posiada jakąś prędkość
Strona 14
Podstawy Fizyki II
obrotową to przechodzi przez „martwe” położenie, jeżeli
natomiast ramka silnika będzie nieruchoma w takim
położeniu, to silnik nie może ruszyć z miejsca. W praktyce w
silnikach elektrycznych stosuje się układ ramek (uzwojenia)
znajdujące się pod pewnym kątem względem siebie. Wówczas
nawet, jeżeli jedno z uzwojeń znajdować się będzie w
„martwym” położeniu na inne będzie działał niezerowy moment
siły i silnik zacznie się obracać.
Ze wzoru 12.8 wynika, że moment siły działający na ramkę
silnika będzie dążył do jej ustawienia prostopadle do pola
magnetycznego. Przy ustalonym kierunku przepływu prądu w
ramce, po przejściu ramki przez „martwe” położenie zmianie
ulegnie zwrot momentu sił działających na ramkę – ramka
będzie chciała wrócić do „martwego” położenia. W efekcie
zamiast ruchu obrotowego, obserwowalibyśmy oscylacje ramki
wokół tego „martwego” położenia. Aby uzyskać ruch obrotowy
należy w momencie, gdy ramka silnika jest prostopadła do pola
magnetycznego zmienić kierunek przepływu prądu. Zmianę
kierunku przepływu prądu w ramce zsynchronizowaną z
obrotem ramki realizuje się za pomocą tzw. komutatora.
Komutator zbudowany jest z dwóch elektrod w kształcie
półpierścienia osadzonych na osi obrotu ramki, do których
podłączone jest uzwojenie ramki. Po tych ruchomych
elektrodach ślizgają się grafitowe szczotki, do których
przyłożone jest napięcie źródła. Przeskok szczotek między
półpierścieniami powoduje zmianę kierunku przepływu prądu
w ramce.
Strona
15
12.3. Pole magnetyczne prądu
Prawo Biota-Savarta
Kierunek linii pola magnetycznego możemy określić
eksperymentalnie za pomocą igły kompasu, która zawsze
ustawia się wzdłuż linii pola magnetycznego. Jeśli taką igłę
kompasu umieścimy w pobliżu przewodnika to możemy
zaobserwować, że igła obróci się w momencie włączenia prądu
w przewodniku. Oznacza to, że przepływ prądu w przewodniku
jest źródłem pola magnetycznego. Przemieszczając igłę
magnetyczną wokół przewodnika możemy określić kierunek i

zwrot wektora indukcji pola magnetycznego B w każdym
punkcie. W przypadku przewodnika prostoliniowego linie pola
magnetycznego tworzą okręgi w płaszczyźnie prostopadłej do
kierunku przepływu prądu elektrycznego. Kierunek i zwrot
wektora indukcji pola magnetycznego w dowolnym punkcie
wokół przewodnika możemy wyznaczyć z reguły śruby
prawoskrętnej lub reguły prawej dłoni. Jeśli przewodnik z
prądem obejmiemy prawą dłonią tak, że kciuk wskazywać
będzie kierunek przepływu prądu elektrycznego, to zagięte
palce dłoni wyznaczać nam będą zwrot wektora B indukcji pola
magnetycznego.

Wartość oraz zwrot wektora indukcji pola magnetycznego dB ,
pochodzącego od elementu dl przewodnika, przez który
przepływa prąd elektryczny o natężeniu I, wyznaczone w
odległości r od tego elementu dl, opisuje prawo Biota-Savarta:



 I dl  r
dB  0
4 r 3
Strona 16
(12.9),
Podstawy Fizyki II
gdzie
0
jest
przenikalnością
magnetyczną
próżni
Vs m
Vs
H
H
1
 1 . W powyższym
, μ 0   1 2
m A
Am
m
m

wzorze wektor dl ma zwrot zgodny z umownym zwrotem

przepływu prądu w przewodniku a wektor r prowadzimy od

elementu dl do punktu P, w którym chcemy obliczyć wektor

 0  4  10 7
indukcji magnetycznej B (rysunek 12.4).
Rysunek 12.4. Wyznaczanie indukcji pola magnetycznego za pomocą prawa
Biota Savarta
Pole magnetyczne pętli z prądem
Prostym przykładem zastosowania prawa Biota-Savarta może
być wyznaczenie indukcji B pola magnetycznego wytworzonego
przez zamkniętą pętlę kołową o promieniu R, w której płynie
prąd elektryczny o natężeniu I. Jeżeli będziemy szukać
indukcji B w punkcie znajdującym się w środku tej pętli to
odległość pomiędzy każdym z fragmentów przewodnika a
punktem, w którym obliczamy pole jest stała i wynosi R.


Również wektory dl oraz r są do siebie prostopadłe w
każdym punkcie pętli, a więc szukając wartości dB indukcji
Strona
17
pola magnetycznego pochodzącego od odcinka dl przewodnika
otrzymamy:
dB 
 0 I dlR sin 2   0 I dl

4R 3
4R 2
(12.10)
Ponieważ każdy z wektorów dB pochodzących od dowolnego
fragmentu dl przewodnika będzie miał ten sam kierunek i
zwrot prostopadły do płaszczyzny pętli, więc wypadkowy
wektor indukcji pochodzący od całej pętli obliczymy, dokonując
całkowania po całej długości okręgu:
B
2R

0
B
 0 I dl
4R 2
(12.11)
0I
2R
(12.12)
W podobny sposób możemy obliczyć indukcję pola
magnetycznego w punkcie położonym na osi przechodzącej
przez środek pętli (rysunek 12.5).
Rysunek 12.5. Obliczanie wektora indukcji pochodzącego od pętli z prądem
W tym przypadku należy jednak pamiętać, że wektory dB
pochodzące od fragmentów dl pętli nie są równoległe, a więc w
Strona 18
Podstawy Fizyki II
obliczeniach wypadkowego natężenia należy uwzględnić tylko
składowe wzdłuż osi pętli dBw. Składowe prostopadłe do osi,
czyli równoległe do płaszczyzny pętli, pochodzące od dwóch
fragmentów dl ułożonych symetrycznie na okręgu będą się
znosiły jak na rysunku 12.5. W takim przypadku wektor
indukcji B w odległości Z od środka pętli wynosi:
B Z  
 0 IR 2
2R 2  Z 2 
3/2
(12.13)
Można wykazać, że dla ramki z prądem o dowolnym kształcie,
kierunek i zwrot wektora B indukcji pola magnetycznego,
wytworzonego przez płynący w ramce prąd, jest prostopadły do
płaszczyzny
tej
ramki.
Ramka
taka
może
być

scharakteryzowana za pomocą momentu magnetycznego  :


  AI n
(12.14),

gdzie n jest wektorem jednostkowym prostopadłym do
powierzchni ramki określonym prawoskrętnie w stosunku do
kierunku przepływu prądu o I płynącego w ramce, A – jest
powierzchnią ramki. Kierunek i zwrot wektora momentu
magnetycznego ramki z prądem jest taki sam jak kierunek i
zwrot wektora indukcji pola magnetycznego B wytworzony
przez taką ramkę z prądem i taki sam jak wektora normalnego
ramki.
Przykładem urządzenia, w którym mamy do czynienia z
oddziaływaniem pola magnetycznego na pętlę z prądem jest
głośnik. W większości głośników w polu magnetycznym
nieruchomego magnesu stałego umieszczana jest cewka z
prądem, która może poruszać się tylko w jednym kierunku. Do
cewki zamocowana jest membrana głośnika. W zależności od
kierunku przepływu prądu w cewce, cewka i cała membrana są
przyciągane lub odpychane przez magnes, a drgania membrany
wytwarzają falę dźwiękową.
Strona
19
Prawo Ampera
Prawo Ampera pozwala łatwo obliczyć indukcję pola
magnetycznego szczególnie w przypadkach, kiedy układ
charakteryzuje się wysoką symetrią.
Krążenie wektora indukcji po dowolnej krzywej zamkniętej jest
równe wypadkowemu natężeniu prądu przenikającemu przez
powierzchnię rozpiętą na tej krzywej, pomnożonemu przez
wartość przenikalności magnetycznej próżni.


 B  dl   B cosθ dl  0 I
(12.15),
gdzie B jest indukcją pola magnetycznego na konturze
zamkniętym, dl – wycinkiem tego konturu, θ – kątem między
wektorem B oraz dl, zaś I wartością wypadkowego prądu
objętego przez zamknięty kontur. Krążenie wektora indukcji
magnetycznej wzdłuż krzywej zamkniętej (inaczej całkę po
zamkniętym konturze) wyraziliśmy tutaj jako sumę (całkę)

iloczynów skalarnych wektora B w danym punkcie krzywej i

wektora dl stycznego do tej krzywej.
Pole magnetyczne prostoliniowego przewodnika z prądem
Jako przykład zastosujemy prawo Ampera do obliczenia
indukcji magnetycznej pochodzącej od nieskończenie długiego,
prostoliniowego przewodnika. Jako krzywą zamkniętą
wybieramy okrąg o promieniu r ułożony w płaszczyźnie
prostopadłej do przewodnika tak, że przez jego środek
przechodzi przewodnik. W tym przypadku wektor indukcji pola
magnetycznego B w każdym punkcie tego okręgu jest do niego
styczny, podobnie jak wektor dl. Ponieważ wektory B oraz dl są
do siebie równoległe i zgodne, czyli kąt θ jest równy zeru, to
cosθ = 1 w każdym punkcie konturu. W efekcie iloczyn
skalarny możemy zastąpić iloczynem wartości. Ponadto
wartość wektora indukcji B jest identyczna w każdym punkcie
okręgu, ponieważ każdy jego punkt znajduje się w identycznej
odległości od przewodnika i jako wartość stała może być
wyciągnięta przed znak całkowania. Pozostała całka po
Strona 20
Podstawy Fizyki II
konturze zamkniętym jest równa długości tego konturu a więc
w naszym przypadku długości obwodu okręgu o promieniu r:


 B  dl   B dl cos   B dl  B  dl  B 2 r
(12.16)
Na podstawie prawa Ampera przyrównujemy wyznaczone
krążenie wektora indukcji magnetycznej do prądu objętego
przez wybrany kontur zamknięty i możemy wyznaczyć
indukcję pola magnetycznego B wytworzoną przez prąd
elektryczny o natężeniu I płynący przez prostoliniowy
przewodnik, w odległości r od tego przewodnika:
B 2 r   0 I
 I
B 0
2 r
(12.17)
Zalety stosowania prawa Ampera do obliczenia indukcji pola
magnetycznego pokazuje przykład kabla koncentrycznego.
Kabel taki składa się z żyły, oddzielonej warstwą izolatora od
współśrodkowego metalowego ekranu (oplotu). Podobnie jak
poprzednio, jako krzywą zamkniętą wybierzemy okrąg w
płaszczyźnie prostopadłej do przewodu, współśrodkowy z żyłą i
oplotem. W kablu koncentrycznym prąd w ekranie płynie w
przeciwną stronę niż w żyle i dlatego suma natężeń prądów
przecinających kulistą powierzchnię rozpiętą na okręgu
obejmującym kabel jest równa zeru. Na mocy prawa Ampera
oznacza to, że również indukcja pola magnetycznego na
zewnątrz takiego kabla koncentrycznego jest równa zeru.
Wzorzec ampera
Ponieważ przewodnik z prądem jest źródłem pola
magnetycznego, więc jeśli ustawimy dwa przewodniki z
prądem równolegle do siebie (rysunek 12.6) to jeden znajdować
się będzie w polu magnetycznym wytworzonym przez drugi.
Wektor indukcji pola magnetycznego wytworzony przez
przewodnik
pierwszy jest zwrócony prostopadle do
przewodnika drugiego i zgodnie ze wzorem 12.17 wynosi
Strona
21
B1 
0 I 1
, gdzie D oznacza odległość między przewodnikami,
2 D
zaś I1 jest natężeniem prądu elektrycznego płynącego w
pierwszym przewodniku. Na przewodnik drugi działa więc siła
Lorentza, której wartość wyznaczamy za pomocą wzoru 12.7:
F  I 2 lB1 
I 2I 1 l
2 D
(12.18),
gdzie l oznacza długość odcinka, na którym przewody są
ułożone równolegle do siebie. Siła o identycznej wartości, lecz
przeciwnym zwrocie będzie działać na przewodnik pierwszy.
Kierunek działania siły wyznacza odcinek łączący przewodniki,
a zwrot zależy od kierunku przepływu prądów. Jeśli prądy
mają zgodne kierunki, między przewodnikami występuje siła
przyciągająca; jeśli kierunek prądu jest przeciwny –
odpychająca, jak na rysunku 12.6.
Rysunek 12.6. Siły wzajemnego oddziaływania dwóch równoległych przewodników
z prądem: kierunek prądu zgodny (z lewej) i przeciwny (z prawej).
Za pomocą elektrodynamicznej siły oddziaływania dwóch
przewodników z prądem zdefiniowany jest wzorzec jednostki
natężenia prądu elektrycznego układu SI – ampera:
Stały prąd elektryczny o natężeniu 1 ampera płynąc w dwóch
równoległych,
prostoliniowych,
nieskończenie
długich
przewodach, umieszczonych w odległości 1m od siebie
powoduje wzajemne oddziaływanie tych przewodów ze sobą z
siłą równą
Strona 22
2  10 7 N na każdy metr długości przewodu.
Podstawy Fizyki II
Pole magnetyczne solenoidu
Jako przykład zastosowania prawa Biota-Savarta obliczyliśmy
indukcję pola magnetycznego wytworzonego przez pętlę z
prądem. Wiemy już, że indukcja ta skierowana jest prostopadle
do płaszczyzny pętli. Wartość indukcji pola magnetycznego
możemy zwiększyć układając koło siebie kolejne pętle. Taki
układ wielu pętli, tzw. zwojów, nazywać będziemy cewką a w
sytuacji, gdy zwoje te mają kształt okręgu, czyli gdy powstały w
wyniku nawinięcia wielu zwojów na powierzchni cylindra
nazywamy solenoidem.
Pole magnetyczne wytwarzane wewnątrz cewki możemy
obliczyć stosując prawo Ampera. Rozważmy prostokątny
kontur zamknięty o długości a przecinający ściankę boczną
cewki jak na rysunku 12.7 i obliczmy krążenie wektora
indukcji po tym konturze. Jeśli solenoid jest nieskończenie
długi (odpowiednio długi) to pole magnetyczne na zewnątrz
solenoidu nie istnieje (indukcja magnetyczna pochodząca od
górnej części uzwojeń solenoidu jest kompensowana indukcją
od dolnej części).
Rysunek 12.7. Zastosowanie prawa Ampera do obliczenia pola magnetycznego
wewnątrz cewki solenoidalnej i toroidalnej
W efekcie krążenie wektora indukcji magnetycznej dla odcinka
konturu znajdującego się na zewnątrz solenoidu jest równe
zeru. Odcinki prostopadłe do cewki są również prostopadłe do
wektora indukcji magnetycznej i ze względu na zerową wartość
iloczynu skalarnego krążenie na tych odcinkach również

wynosi zero. Jedyny wkład do krążenia wektora B po
Strona
23
wybranej krzywej prostokątnej pochodzi zatem od odcinka
równoległego do osi solenoidu znajdującego się wewnątrz tego
solenoidu. Ponieważ pole magnetyczne wewnątrz solenoidu jest
jednorodne (indukcja magnetyczna B ma tę samą wartość i
zwrot w każdym punkcie), więc krążenie wektora indukcji
magnetycznej na odcinku o długości a, będzie równe iloczynowi
B oraz a. Jeżeli na tym odcinku o długości a znajduje się N
uzwojeń solenoidu, w którym płynie prąd o natężeniu I, to
suma natężeń prądów przecinających powierzchnię rozpiętą na
wybranym konturze zamkniętym wyniesie N I. Prawo Ampera
przyjmuje więc postać:
B a  0 N I
(12.19)
Stąd wartość wektora indukcji magnetycznej wyniesie:
B
0 N I
 0n I
a
(12.20),
gdzie n oznacza gęstość nawinięcia zwojów – ilość zwojów na
jednostkę długości cewki.
Pole magnetyczne toroidu
W podobny sposób jak dla solenoidu, korzystając z prawa
Ampera możemy obliczyć pole magnetyczne wytworzone przez
toroid. W cewce toroidalnej uzwojenie jest nawinięte na torusie
o przekroju prostokątnym lub kołowym. Jako krzywą
zamkniętą wybierzemy w tym przypadku okrąg współśrodkowy
do torusa, którego promień zawiera się w przedziale od
wartości promienia wewnętrznego do promienia zewnętrznego
cewki toroidalnej (Rysunek 12.7). Ponieważ rozważany układ
jest symetryczny, wektor indukcji w każdym miejscu tego
okręgu będzie taki sam tak, że ponownie całkę okrężną można
będzie zastąpić wymnożeniem wektora indukcji przez długość
tego konturu (obwód okręgu). Płaszczyznę rozpiętą na
wybranym okręgu przecina N przewodników z prądem, w
których płynie prąd o natężeniu I. Prawo Ampera przyjmuje
zatem postać:
B 2 r  0 N I
Strona 24
(12.21)
Podstawy Fizyki II
Po przekształceniu otrzymujemy
wzór
magnetyczną wewnątrz cewki toroidalnej:
B
na
0 N I
2 r
indukcję
(12.22)
Jak widać, wartość wektora indukcji jest w tym przypadku
odwrotnie proporcjonalna do promienia wybranego okręgu –
wartość indukcji wewnątrz toroidu jest największa w pobliżu
jego wewnętrznej, a najmniejsza przy jego zewnętrznej
krawędzi.
Moment magnetyczny
W rozdziale 12.2 pokazaliśmy, że na przewodnik z prądem
znajdujący się w polu magnetycznym działać będzie siła



elektrodynamiczna F  I l  B (wzór 12.7). Obliczyliśmy, że
moment M siły, działający na prostokątną ramkę z prądem,
którą umieścimy w polu magnetycznym o indukcji B, będzie
wynosić M  I A B sin (wzór 12.8), gdzie A oznacza
powierzchnię ramki z prądem, I – natężenie prądu płynącego w
ramce zaś α jest kątem, jaki tworzy wektor normalny do
płaszczyzny ramki z wektorem indukcji magnetycznej B.
Moment sił działający na ramkę obraca ją tak, aby ustawiła się
prostopadle do linii zewnętrznego pola magnetycznego.
Przypomnijmy również, że ramka z prądem wytwarza pole
magnetyczne prostopadłe do płaszczyzny tej ramki (rysunek
12.5) o kierunku i zwrocie zgodnym z wektorem momentu


magnetycznego   A I n (wzór 12.14). Za pomocą tak

zdefiniowanego momentu magnetycznego  ramki z prądem

można również wyrazić wektorowo moment sił M działających
na ramkę umieszczoną w zewnętrznym polu magnetycznym o
indukcji B:



M   B
(12.23)
Strona
25
Z powyższego równania wynika, że moment M sił obraca ramkę

z prądem tak, aby jej moment magnetyczny  ustawił się
zgodnie z zewnętrznym polem magnetycznym o indukcji B.
Momentowi magnetycznemu ramki z prądem możemy
przypisać również pewną energię potencjalną, zależną od jego
ustawienia względem pola magnetycznego. Praca obrócenia
ramki z prądem o pewien kąt w zewnętrznym polu
magnetycznym B związana jest z momentem sił działających
na tę ramkę:
W   M dα   0 B sinα dα   0 B cosα


W     B
(12.24),
gdzie  oznacza kąt między wektorem indukcji B zewnętrznego

pola magnetycznego, a wektorem  momentu magnetycznego
ramki z prądem. Energia ramki z prądem umieszczonej w polu
magnetycznym o indukcji B jest równa powyższej pracy, jaką
należy wykonać, aby ustawić ją w ustalonej pozycji w
zewnętrznym polu magnetycznym. W przypadku, gdy moment

magnetyczny ramki  ma taki sam zwrot jak wektor indukcji
pola magnetycznego B, czyli dla pozycji  = 0 energia ta wynosi
zaś
w
pozycji
=π
E 0   B cos0   B
E    B cos    B , a więc praca obrócenia ramki z
prądem o kąt π wynosi W obrotu  2 μB .
Strona 26
Podstawy Fizyki II
12.4. Zjawisko indukcji
elektromagnetycznej
Przekonaliśmy się, że przepływ prądu stałego wytwarza pole
magnetyczne.
Doświadczenia,
przeprowadzone
przez
angielskiego fizyka Michaela Faradaya i amerykańskiego
Josepha Henry’ego w 1831 roku pokazały, że możliwe jest
również wywołanie przepływu prądu za pomocą pola
magnetycznego a odkryte zjawisko zostało nazwane indukcją
elektromagnetyczną.
Prawo indukcji Faradaya
Jeśli umieścimy nieruchomy magnes w pobliżu pętli z
przewodnika, nie zaobserwujemy przepływu prądu – średnia
prędkość nośników ładunku w przewodniku jest równa zeru, a
zatem wartość siły Lorentza działającej na te nośniki jest
również równa zeru. Siła Lorentza pojawi się jednak, jeśli
przewodnik będzie poruszał się w polu magnetycznym,
przecinając linie sił tego pola. Działanie siły Lorentza
spowoduje spychanie nośników jednego znaku w określonym
kierunku – między końcami przewodnika wytworzy się zatem
napięcie. Taki sam efekt zaobserwujemy, kiedy magnes
porusza się względem przewodnika.
Jeśli końce przewodnika połączymy z galwanometrem,
zauważymy, że przez obwód popłynie prąd indukowany. W
obwodzie takim pojawią się dwa spadki napięcia – jeden na
galwanometrze, drugi na pętli. Suma tych spadków napięć jest
równa sile elektromotorycznej. Podobnie jak w przypadku
ogniwa, siłę elektromotoryczną, oznaczaną również jako SEM,
definiujemy jako stosunek pracy W wykonanej na przeniesienie
ładunku q w obwodzie zamkniętym do wartości tego ładunku q.
Siłę elektromotoryczną SEM, podobnie jak napięcie, wyrażamy
w woltach [V].
Strona
27
Przybliżając i oddalając magnes do pętli z przewodnika
możemy zauważyć, że napięcie mierzone na jego końcach jest
tym większe, im szybciej będzie poruszał się magnes. Do
wytworzenia napięcia na zaciskach pętli przewodnika możemy
użyć również drugiej pętli. Zmiany pola magnetycznego można
w tym przypadku uzyskać zarówno przybliżając i oddalając
pętlę zasilaną prądem stałym jak i przepuszczając przez
nieruchomą pętlę prąd zmienny.
Wartość siły elektromotorycznej SEM powstałej w zjawisku
indukcji magnetycznej określa prawo indukcji Faradaya:
Wartość siły elektromagnetycznej indukowanej w obwodzie
zamkniętym
jest
równa
szybkości
zmian
strumienia
magnetycznego przechodzącego przez dowolną powierzchnię
rozpiętą na tym obwodzie.
SEM  
dΦ B
dt
(12.25)
Wielkość ΦB oznacza strumień magnetyczny (strumień wektora
indukcji magnetycznej), który definiujemy podobnie jak
strumień natężenia pola elektrycznego (wzór 10.25 oraz 10.26)
jako iloczyn skalarny wektora indukcji magnetycznej i wektora
normalnego do danej powierzchni.


Φ B   B  dS
(12.26)
Jednostką strumienia magnetycznego jest weber [1 Wb=1 V s].
Jeśli wektor indukcji pola magnetycznego B jest stały w
każdym punkcie i przecina powierzchnię S pod pewnym stałym
kątem, wówczas strumień wektora indukcji magnetycznej
przechodzącej przez tę powierzchnię wyrazimy jako:
 
Φ B  B  S  B S cos
(12.27),
gdzie  oznacza kąt między wektorem S normalnym do
powierzchni a wektorem indukcji magnetycznej B.
Strona 28
Podstawy Fizyki II
Reguła Lenza
Kierunek przepływu prądu indukowanego
zamkniętym określa reguła przekory Lenza:
w
obwodzie
Prąd indukowany w obwodzie płynie w takim kierunku, że jego
pole magnetyczne przeciwdziała zmianie strumienia pola
magnetycznego, która ten prąd wywołuje.
Jeśli magnes stały zbliżamy do obwodu zamkniętego, zwiększa
się liczba linii pola magnetycznego przecinająca powierzchnię
określoną przez ten obwód, czyli wzrasta strumień
magnetyczny. Żeby przeciwdziałać temu wzrostowi strumienia
magnetycznego, zgodnie z regułą Lenza, w obwodzie zostanie
wyindukowany prąd o takim kierunku przepływu, żeby wektor
indukcji pola magnetycznego wytworzonego przez ten prąd
miał przeciwny zwrot do linii pola magnesu sztabkowego. W
efekcie obwód ten będzie odpychać zbliżający się magnes. Jest
to zgodne z zasadą zachowania energii – zbliżając magnes do
pętli musimy wykonać pracę, aby przeciwstawić się siłom
wzajemnego odpychania magnesu i pętli. Praca mechaniczna
jest zamieniana w pracę wykonaną nad nośnikami ładunku –
dochodzi zatem do zamiany energii mechanicznej w energię
elektryczną. Gdyby kierunek przepływu prądu w pętli był
odwrotny, magnes byłby przyciągany w kierunku pętli –
poruszałby się zatem coraz szybciej, indukując coraz większy
prąd. Otrzymalibyśmy urządzenie wytwarzające energię bez
konieczności wykonywania pracy – perpetuum mobile
pierwszego rodzaju. Urządzenie takie nie spełnia zasady
zachowania energii.
Przykład
Prostokątna ramka o szerokości l, wykonana z przewodnika o
całkowitym oporze R jest wyciągana z obszaru pola
magnetycznego o indukcji B, prostopadłego do płaszczyzny
ramki. Oblicz, jaka moc jest niezbędna, by zapewnić stałą
prędkość v wysuwania tej ramki. Wyznacz ciepło, jakie wydzieli
się na oporze ramki.
W zadaniu tym strumień pola magnetycznego jest określony
przez powierzchnię tej części ramki, która znajduje się w polu
Strona
29
magnetycznym. Szerokość ramki wynosi l a długość tej części
ramki, która znajduje się w polu magnetycznym oznaczmy
przez x. Jeśli ramka jest wyciągana z obszaru pola
magnetycznego ze stałą prędkością to długość x będzie się
zmniejszała stale w czasie ( x  x 0  v t ). Oznacza to, że
również powierzchnia obszaru znajdującego się w polu
magnetycznym będzie się zmniejszała proporcjonalnie do czasu
zmieniając
tym
samym strumień wektora indukcji
magnetycznej. Zgodnie z prawem indukcji Faradaya siła
elektromotoryczna SEM przeciwdziałająca takiej zmianie
strumienia wynosi:
SEM  
dΦ B dB l x 

 B lv
dt
dt
(12.28)
Ponieważ opór ramki wynosi R, korzystając z prawa Ohma
obliczamy wartość natężenia prądu przepływającego przez
ramkę:
I
B lv
R
(12.29)
Zgodnie z założeniami, ramka porusza się ruchem
jednostajnym, czyli siła, którą musimy działać na ramkę, aby
utrzymać stałą prędkość jej przesuwu, równoważy siłę
działającą na przewodnik z prądem w polu magnetycznym:



FB  I l  B 
Stąd możemy obliczyć
poruszania ramki:
P F v 
moc
B 2l 2 v
R
mechaniczną
B 2l 2 v 2
 I 2R
R
(12.30)
niezbędną
do
(12.31)
Wyznaczona przez nas moc mechaniczna jest równa mocy
wydzielanej w postaci ciepła na całkowitym oporze
elektrycznym ramki.
Strona 30
Podstawy Fizyki II
Prądy wirowe – prawo Faradaya
Zmienny prąd elektryczny płynący przez pętlę z przewodnika
wytwarzać będzie zmieniające się w czasie pole magnetyczne.
Umieśćmy teraz w pobliżu (w polu magnetycznym pierwszej
pętli) drugą pętlę z przewodnika. Przez pętlę tę przechodzić
będzie strumień indukcji pola magnetycznego proporcjonalny
do pola powierzchni drugiej pętli oraz wartości indukcji
magnetycznej wytworzonej przez pierwszą pętlę – zmieniającej
się w czasie. Zgodnie z prawem indukcji Faradaya zmiana
strumień pola magnetycznego powoduje powstanie siły
elektromotorycznej, co w konsekwencji wywoła przepływ
ładunku elektrycznego w drugiej pętli. Jeśli zamiast drugiej
pętli postawimy litą płytę z przewodnika zmienne pole
magnetyczne wywoła wirowe pole elektryczne w tej płycie –
ruch nośników ładunku w przewodzącej płycie dobywać się
będzie wzdłuż krzywych zamkniętych (w szczególnych
przypadkach okręgów).
Aby obliczyć wartość siły SEM takiego wirowego pola
elektrycznego musimy najpierw obliczyć pracę przemieszczenia
ładunku elektrycznego q wzdłuż linii pola (okrąg o
promieniu r ):


W   F  dl  q E 2 r
(12.32)
Wówczas siła elektromotoryczną SEM zgodnie z definicją
będzie równa stosunkowi wykonanej nad ładunkiem pracy W
do wartości q tego ładunku będzie miał postać:


ε W/q   E  dl

(12.33),

gdzie E  F q . Porównując otrzymaną zależność z prawem
indukcji Faradaya otrzymujemy prawo Faradaya:


 E  dl  
dΦ B
dt
(12.34)
Jeśli w jakimś obszarze obserwujemy pole magnetyczne
zmienne w czasie, to wokół tego obszaru powstaje wirowe pole
Strona
31
elektryczne. Znak minus w powyższym wzorze wyraża regułę
przekory Lenza, czyli mówi nam, że powstałe wirowe pole
elektryczne przeciwdziałać będzie zmianom strumienia pola
magnetycznego.
Warto porównać zależność 12.34 z zależnością 10.21 dla
elektrostatyki, wiążącą natężenie pola i różnicę potencjałów w
polu elektrostatycznym. W przypadku prawa Faradaya, a więc
w przypadku pola magnetycznego, obliczając pracę
przemieszczenia ładunku całkowanie wykonujemy wzdłuż
pewnej krzywej zamkniętej, podczas gdy w elektrostatyce praca
przesunięcia po krzywej zamkniętym była równa zeru, bo
wracaliśmy do punktu o tym samym potencjale elektrycznym.
W elektrostatyce praca przeniesienia ładunku między dwoma
punktami nie zależała od wyboru drogi przemieszczenia, ale
jedynie od różnicy potencjałów między tymi punktami. W
przypadku pola wywołanego indukcją elektromagnetyczną nie
możemy jednak określić potencjału pola w danym punkcie
przestrzeni.
Wykrywacze metali wykorzystują właśnie wirowe pola
elektryczne oraz prawo Faradaya do detekcji obiektów
metalowych. W pętli z przewodnika, znajdującej się w dolnej
części urządzenia wytwarzany jest impulsowy prąd
elektryczny, co powoduje powstanie zmiennego pola
magnetycznego. Jeśli poniżej pętli znajduje się metalowy
przedmiot, to takie zmienne pole magnetyczne wywoła w
metalu przepływ prądu wirowego. Ponieważ ten wirowy prąd
będzie zmieniał się w czasie wytworzy zatem zmienne pole
magnetyczne. Pole to z kolei wyindukuje w obwodzie
wykrywacza metali prąd płynący w kierunku przeciwnym do
kierunku pierwotnego impulsu. Monitorując zatem natężenie
prądu w pętli wykrywacza możemy wykryć obecność
metalowego przedmiotu. Na podobnej zasadzie działają
stosowane na lotniskach bramki zabezpieczające przed
wnoszeniem metalowej broni.
Strona 32
Podstawy Fizyki II
Prądnica i alternator
Opierając się na zjawisku indukcji elektromagnetycznej,
możemy zbudować urządzenie nazywane prądnicą, która
zamienia pracę mechaniczną na energię elektryczną. Budowa
prądnicy jest identyczna jak budowa omawianego już wcześniej
silnika elektrycznego. Pomiędzy dwoma biegunami magnesu
umieszczamy ramkę, mogącą obracać się wokół osi prostopadłej
do kierunku wektora indukcji magnetycznej wytworzonej przez
ten magnes.
Obroty ramki będą powodowały zmiany wartości strumienia
wektora indukcji pola magnetycznego przechodzącego przez
ramkę a więc zgodnie z prawem indukcji Faradaya w ramce
będzie powstawała siła elektromotoryczna i prąd elektryczny.
Kiedy płaszczyzna ramki znajduje się w położeniu równoległym
do kierunku wektora indukcji magnetycznej, strumień tego
wektora jest równy zeru, a jego zmiany są wówczas
maksymalne. Strumień osiąga wartość maksymalną, kiedy
płaszczyzna ramki jest ustawiona prostopadle do kierunku
wektora indukcji. Zmiany wartości strumienia wektora
indukcji magnetycznej ΦB, indukowana siła elektromotoryczna
E oraz schematyczne położenie ramki między magnesami w
funkcji czasu przedstawiono na Rysunku 12.8.
Rysunek 12.8. Zależność czasowa strumienia indukcji magnetycznej i siły
elektromotorycznej dla prądnicy.
Strona
33
Zgodnie z definicją, siła elektromotoryczna indukowana na
końcach ramki zależy od zmian strumienia wektora indukcji
magnetycznej. Siła elektromotoryczna odpowiada zatem
współczynnikowi nachylenia wykreślonej wartości strumienia
wektora indukcji magnetycznej od czasu. W przypadku
prądnicy najszybsze zmiany strumienia następują, gdy ramka
przechodzi przez położenie, w którym jej płaszczyzna jest
równoległa do kierunku wektora indukcji. W prądnicy, podczas
przejścia przez położenie, w którym płaszczyzna ramki jest
prostopadła do kierunku wektora indukcji, następuje zamiana
kierunku podłączeń kontaktów elektrycznych ramki – jest to
realizowane podobnie jak w przypadku silnika elektrycznego za
pomocą komutatora. Z tego względu na wykresie siły
elektromotorycznej SEM nie obserwujemy przejścia przez zero.
Prądnica generuje prąd zmienny, ale wartości siły
elektromotorycznej zawsze mają jednakowy kierunek. W
przypadku alternatora końce ramki są podłączone zawsze do
tych samych kontaktów elektrycznych. W momencie przejścia
ramki przez położenie prostopadłe następuje zmiana znaku siły
elektromotorycznej (zmiana kierunku przepływu prądu) –
krzywa przecina oś odciętych. Alternator generuje prąd
sinusoidalnie zmienny.
Indukcyjność
Jeżeli w uzwojeniu cewki elektrycznej będzie płynął zmienny
prąd to pole magnetyczne wytworzone wewnątrz cewki będzie
się zmieniać w czasie. A więc uzwojenie cewki obejmować
będzie zmienny strumień pola magnetycznego. Zgodnie z
prawem indukcji Faradaya na uzwojeniu cewki indukować się
zatem będzie prąd elektryczny, który zgodnie z regułą Lenza
przeciwdziałać będzie zmianom strumienia wektora indukcji
pola magnetycznego, które wywołały powstanie pola
magnetycznego w cewce.
W momencie podłączenia cewki do źródła w jej uzwojeniu
zaczyna płynąć prąd wytwarzający pole magnetyczne. Wówczas
w cewce indukowany jest prąd, wytwarza pole magnetyczne
przeciwstawiające się powstałemu polu magnetycznemu, a więc
prąd o kierunku przeciwnym niż prąd źródła. Jeśli natomiast
Strona 34
Podstawy Fizyki II
odłączamy cewkę od źródła, to ponieważ natężenie prądu w
uzwojeniu maleje, powstały prąd indukowany płynie w
kierunku zgodnym z prądem źródła przeciwstawiając się
zanikowi prądu.
Zgodnie z prawem indukcji Faradaya siła elektromotoryczna,
powstająca na jednym zwoju cewki wynosi:
dΦ B
SEM

zwój
dt
(12.35),
gdzie
jest
strumieniem
magnetycznym
ΦB  B S
przechodzącym przez przekrój S pojedynczego uzwojenia.
Całkowity strumień magnetyczny dla cewki, równy N ΦB, jest
proporcjonalny do natężenia przepływającego prądu I :
N ΦB  L I
L
N ΦB
I
(12.36)
(12.37)
Współczynnik proporcjonalności L nazywany indukcyjnością
jest cechą charakterystyczną danego elementu indukcyjnego.
Jednostką indukcyjności jest jeden henr [1H  1
Vs
Wb
].
1
A
A
Podstawiając powyższą zależność 12.36 do wzoru 12.35
znajdujemy całkowitą siłę elektromotoryczną powstałą w
cewce, która jest proporcjonalna do pochodnej natężenia prądu
po czasie:
ε  L ddIt
(12.38)
Obliczmy indukcyjność dla solenoidu. Korzystając ze wzoru
12.20 na indukcję pola magnetycznego wewnątrz solenoidu
możemy wyznaczyć strumień wektora indukcji pola
magnetycznego przecinający powierzchnię S przekroju
solenoidu:
Strona
35
ΦB  N B S  N 0nI S  na 0nI S
(12.39),
gdzie a oznacza długość solenoidu, N ilość zwojów, n = N/a –
gęstość nawinięcia uzwojenia. Podstawiając tak wyznaczony
strumień ΦB do wzoru 12.37 na indukcyjność L otrzymujemy:
L
NΦ B na 0 In S 

 0n 2aS  0n 2V
I
I
(12.40),
gdzie aS = V jest objętością solenoidu. Warto pamiętać, że
indukcyjność wykazują nie tylko cewki, ale także pozostałe
elementy obwodów elektrycznych. Nawet prosty fragment
przewodnika posiada pewną niewielką indukcyjność. Z tego
względu przy projektowaniu obwodów, szczególnie tych, w
których występują szybkie zmiany natężenia prądu
elektrycznego – np. podzespołów komputera, pracujących z
sygnałami elektrycznymi zmiennymi z częstotliwością rzędu
gigahertzów – należy zawsze uwzględniać efekty związane z
indukcyjnością.
Zjawisko samoindukcji jest również przyczyną powstawania
tzw. przepięć indukcyjnych w obwodach elektrycznych. Jeśli w
obwodzie znajdują się urządzenia wyposażone w elementy o
dużej indukcyjności – np. silniki elektryczne lub zasilacze
komputerowe – w trakcie wyłączania urządzeń w obwodzie
może wytwarzać się siła elektromotoryczna o znacznej
wartości. Powoduje ona krótkotrwały impuls wysokiego
napięcia, który może znacznie przekraczać nominalne napięcie
przewidziane dla elementów obwodu. Może być to przyczyną
występowania przebić w izolacji elektrycznej lub przeciążenia
bezpieczników obwodu. Sposobem na uporanie się z drugim
problemem jest stosowanie tzw. bezpieczników zwłocznych.
Bezpieczniki tego typu nie rozłączają obwodu pod wpływem
przepływu prądu o charakterze impulsowym. Inną metodą
redukcji niepożądanych skutków zjawiska samoindukcji jest
włączenie w obwód kondensatora, który pozwala na
zmagazynowanie energii elektrycznej związanej z impulsem
powstałym na skutek samoindukcji. Energia ta jest następnie
rozpraszana na elementach oporowych.
Strona 36
Podstawy Fizyki II
Indukcja wzajemna
Jeśli dwie cewki umieścimy blisko siebie, tak że strumień pola
magnetycznego wytworzonego przez jedną cewkę przepływa
częściowo przez uzwojenia drugiej cewki, zmiany pola
magnetycznego
wytworzonego
przez
pierwszą
cewkę
doprowadzą do wytworzenia siły elektromotorycznej na
uzwojeniu drugiej cewki. Zjawisko to nosi nazwę indukcji
wzajemnej. Efekt ten jest tym wyraźniejszy, tym większy jest
współczynnik sprzężenia, im większa część strumienia pola
magnetycznego wytworzonego przez jedną cewkę obejmuje
drugą cewkę. Warunek ten możemy zapewnić np. umieszczając
jedno uzwojenie osiowo wewnątrz drugiego.
Transformator
Omawiając właściwości ferromagnetyków oraz wpływ
przenikalności magnetycznej materiału na wartość indukcji
pola magnetycznego (Rozdział 12.3.) wykazaliśmy, że indukcja
magnetyczna wewnątrz rdzenia ferromagnetycznego jest
wielokrotnie silniejsza niż w powietrzu. W transformatorach na
rdzeń ferromagnetyczny o kształcie prostokątnej ramki
nawinięte są dwa uzwojenia (Rysunek 12.9). Napięcie zmienne
U1 przyłożone do jednego z uzwojeń (uzwojenie pierwotne)
powodować będzie przepływ prądu zmiennego w tym uzwojeniu
i wywoływać zmienne pole magnetyczne, którego indukcja jest
proporcjonalna do liczby zwojów N1 w uzwojeniu pierwotnym.
Dla idealnego transformatora strumień magnetyczny nie ulega
rozproszeniu na zewnątrz rdzenia transformatora, więc do
drugiego uzwojenia, uzwojenia wtórnego, dotrze zmienny
strumień magnetyczny wytworzony w uzwojeniu pierwotnym.
W efekcie, zgodnie z zasadą indukcji Faradaya, w drugim
uzwojeniu powstanie siła elektromotoryczna U2, której wartość
zależeć będzie także od liczby uzwojeń N2 w uzwojeniu
wtórnym. W efekcie otrzymujemy, że stosunek napięć na
uzwojeniach pierwotnym i wtórnym jest równy stosunkowi
ilości zwojów w obu uzwojeniach:
U1 N1

U2 N2
(12.41)
Strona
37
Stosunek ten nazywany jest przekładnią transformatora.
Otrzymujemy w ten sposób transformator – urządzenie do
zamiany wartości napięcia prądu zmiennego, przy zachowaniu
pierwotnej częstotliwości zmian tego napięcia i (prawie) tej
samej mocy. Sprawność transformatorów jest zwykle duża, a
straty energii związane są z oporem uzwojeń oraz energią
niezbędną na przemagnesowanie rdzenia. Strat związanych z
prądami wirowymi powstającymi w rdzeniu możemy częściowo
uniknąć, dzieląc rdzeń na cienkie blaszki polakierowane
jednostronnie warstwą nieprzewodzącą.
Rysunek 12.9. Schemat konstrukcji transformatora (z lewej) i autotransformatora (z
prawej).
Warto podkreślić, że napięcie w obwodzie wtórnym jest
przesunięte w fazie względem prądu w obwodzie pierwotnym o
π – ma, zgodnie z regułą Lenza, przeciwną fazę do napięcia
pierwotnego.
Autotransformator
Szczególnym typem transformatora jest autotransformator. W
urządzeniu tego typu występuje tylko jedno uzwojenie. Spełnia
ono rolę jednocześnie uzwojenia pierwotnego i wtórnego –
stosunek wartości napięcia na uzwojeniu wtórnym do napięcia
na uzwojeniu pierwotnym zależy od miejsca podłączenia
styków obu obwodów do uzwojenia (Rysunek 12.9). W
autotransformatorze regulowanym
kontakt
elektryczny
obwodu wtórnego z uzwojeniem następuje za pomocą ruchomej
szczotki grafitowej, co umożliwia płynną regulację napięcia na
uzwojeniu wtórnym.
Transformatory
energetycznych
Strona 38
wykorzystywane
są
powszechnie
sieciach
przesyłowych
najpierw
w
do
Podstawy Fizyki II
podwyższenie wartości napięcia na linii przesyłowej a
następnie do obniżenia napięcia w stacji odbiorczej. Wysokie
napięcia linii przesyłowych pozawalają znacznie zmniejszyć
wartość natężenia przesyłanego prądu jednocześnie zachowując
tę samą moc prądu (P = U I ), a mniejsze natężenie prądu
oznacza mniejsze straty cieplne związane z oporem
elektrycznym
(prawo
Joula).
Ciekawym
przykładem
transformatora jest cewka zapłonowa samochodu. Prąd stały o
niskim napięciu z akumulatora jest zamieniany w prąd
skokowo zmienny przez tzw. przerywacz. Jest on połączony z
zaciskami cewki o niewielkiej ilości zwojów, nawiniętej na
wspólnym rdzeniu z cewką o dużej ilości zwojów. Taki zmienny
(przerywany) sygnał prądowy generuje na uzwojeniu wtórnym
wysokie napięcie, które jest następnie przekazywane na świece
zapłonowe, a one w odpowiedniej chwili inicjują zapłon
mieszanki paliwowej.
12.5. Magnetyczne własności
materii
W poprzednim rozdziale ramce z prądem przypisywaliśmy

moment magnetyczny  . Również elektronom krążącym na
orbicie wokół jądra atomowego można przypisać moment
magnetyczny – ruch elektronu odpowiada przepływowi prądu
w ramce. Ponieważ elektron charakteryzuje się ujemnym
ładunkiem elektrycznym to zwrot wektora momentu

magnetycznego  tego elektronu jest przeciwny do zwrotu

wektora L jego orbitalnego momentu pędu.
Strona
39
Rysunek 12.10. Orbitalny dipolowy moment magnetyczny elektronu.
Oprócz orbitalnego momentu magnetycznego, elektron posiada
także wewnętrzny moment magnetyczny, niezależny od jego
ruchu orbitalnego, nazywany spinem. (spinowy moment
magnetyczny). Spinowy moment magnetyczny może przybierać
dwie wartości o przeciwnych zwrotach, skierowane prostopadle
względem płaszczyzny orbity. Całkowity moment magnetyczny
atomu możemy obliczyć sumując orbitalne i spinowe momenty
magnetyczne wszystkich elektronów.
Własności magnetyczne materii są wynikiem oddziaływania
wewnętrznych momentów magnetycznych, charakteryzujących
poszczególne atomy, z zewnętrznym polem magnetycznym, jak
również wzajemnego oddziaływania sąsiadujących momentów
magnetycznych.
Jak pokazaliśmy na przykładzie prostokątnej ramki z prądem
na moment magnetyczny umieszczony w zewnętrznym polu
magnetycznym działa moment sił powodujący ustawienie
wektora momentu magnetycznego zgodnie z kierunkiem i
zwrotem zewnętrznego pola magnetycznego. Warto podkreślić,
że zachowanie takie ma podobny charakter jak oddziaływania
dipolu elektrycznego z zewnętrznym polem elektrycznym. Tak
samo jak dipol elektryczny umieszczony między okładkami
kondensatora ustawia się w kierunku pola elektrycznego
(odwraca się ładunkiem dodatnim w kierunku ujemnie
naładowanej okładki kondensatora) tak magnes umieszczony w
polu magnetycznym ustawi się w kierunku zewnętrznego pola
magnetycznego.
Strona 40
Podstawy Fizyki II
Zewnętrzne pole magnetyczne możemy scharakteryzować za

pomocą wektora natężenia pola magnetycznego H . Wektor
natężenia i wektor indukcji pola magnetycznego mają ten sam
kierunek i zwrot a współczynnikiem proporcjonalności jest
stała charakteryzująca właściwości magnetyczne ośrodka – dla
próżni jest to przenikalność magnetyczna próżni μ0 :


B  0 H
(12.42)
Umieszczenie materiału w zewnętrznym polu magnetycznym o
natężeniu
H spowoduje
uporządkowanie
atomowych
momentów magnetycznych w kierunku zewnętrznego pola
magnetycznego
wpływając
jednocześnie
na
wartość
efektywnego pola magnetycznego wewnątrz materiału.
Podobnie jak dla dielektryków wprowadziliśmy wektor
polaryzacji i podatność elektryczną, tak teraz dla magnetyków

M i podatność

magnetyczną . Wektor namagnesowania M charakteryzuje
wprowadzamy wektor namagnesowania
moment magnetyczny jednostki objętości materiału wywołany

zewnętrznym polem magnetycznym o natężeniu H :



M  H  r 1H
(12.43)
Podatność magnetyczna χ („chi”) jest współczynnikiem
proporcjonalności magnetyzacji M od natężenia pola
magnetycznego H. Współczynnik μr nazywa się względną
przenikalnością magnetyczną ośrodka i pokazuje ilekroć
większa będzie indukcja pola magnetycznego w cewce
wypełnionej materiałem w stosunku do cewki próżniowej:


B  0 r H
(12.44)
Wykonując np. rdzeń cewki z materiału o dużej wartości
podatności magnetycznej (np. z żelaza), możemy uzyskać
wielokrotnie większą wartość indukcji magnetycznej niż dla
cewki bez rdzenia (próżniowej). Z żelaza wykonuje się np.
rdzenie elektromagnesów.
Strona
41
Efektywne
pole
magnetyczne
(efektywna
indukcja
magnetyczna) w rdzeniu (w materiale) jest sumą zewnętrznego

pola magnetycznego ( H ) oraz pola magnetycznego związanego

z wektorem namagnesowania rdzenia ( M ):



B  0H  0 M
(12.45)
Rodzaje magnetyków
Ze względu na własności magnetyczne, materiały możemy
podzielić na:
 diamagnetyki
 paramagnetyki
 ferromagnetyki
Własności dia- i paramagnetyzmu są własnościami atomowymi
i występują we wszystkich stanach skupienia, zaś
ferromagnetyzm występuje tylko w ciałach stałych.
Diamagnetyki
W przypadku diamagnetyków pole zewnętrzne wywołuje
magnetyzację materiału o zwrocie przeciwnym do tego pola.
Podatność magnetyczna diamagnetyków przyjmuje wartości
ujemne rzędu 10 5 . Przykładami diamagnetyków są ołów,
miedź, rtęć i srebro. Diamagnetyki są wypychane z obszaru
niejednorodnego pola magnetycznego.
Paramagnetyki
W
atomach
paramagnetyków
wypadkowy
moment
magnetyczny jest różny od zera. Wartość podatności jest w
temperaturze pokojowej jednak niewielka, rzędu 10 5 do 10 4 .
Umieszczone w polu magnetycznym momenty magnetyczne
atomów dążą do ustawienia się zgodnie z kierunkiem pola
magnetycznego. Ponieważ drgania cieplne przeciwdziałają
uporządkowaniu momentów magnetycznych, podatność maleje
Strona 42
Podstawy Fizyki II
wraz ze wzrostem temperatury. Zależność temperaturową
podatności χ paramagnetyków określa prawo Curie:

C
T
(12.46),
gdzie C jest wielkością charakterystyczną dla materiału
paramagnetyka nazywaną stałą Curie. Umieszczone w polu
magnetycznym niejednorodnym paramagnetyki są wciągane w
obszar silniejszego pola. Paramagnetykami są np. lit, glin i
platyna.
Ferromagnetyki
W ferromagnetykach istnieją silne oddziaływania pomiędzy
momentami magnetycznymi sąsiadujących atomów. Powoduje
to tworzenie się obszarów, tzw. domen magnetycznych, o
uporządkowanym ustawieniu momentów magnetycznych.
Przypomnijmy,
że
wpływ
„sąsiadów”
na
zjawiska
porządkowania dipoli elektrycznych opisywaliśmy już w
przypadku ferroelektryków. Opis procesów porządkowania
momentów magnetycznych w ferromagnetykach jest podobny
do porządkowania dipoli elektrycznych w ferroelektrykach,
choć oczywiście przyczyny ich występowania są różne w
przypadku pola magnetycznego i elektrycznego.
Ponieważ ustawienie wszystkich momentów magnetycznych w
materiale w jednym kierunku powodowałoby wytwarzanie na
zewnątrz silnego pola magnetycznego, co jest niekorzystne z
punktu widzenia wysokiej energii układu, w materiale na ogół
występuje wiele domen o różnym kierunku uporządkowania,
tak by pola na zewnątrz próbki nie było.
Kiedy nienamagnesowany ferromagnetyk umieścimy w
zewnętrznym polu magnetycznym, wraz ze wzrostem natężenia
tego pola momenty magnetyczne domen będą ustawiać się
zgodnie z kierunkiem pola, co spowoduje wzrost
namagnesowania. W przypadku ferromagnetyków podatność
magnetyczna może przyjmować duże wartości – rzędu setek lub
tysięcy. Kiedy wartość pola zewnętrznego jest na tyle duża, że
wszystkie momenty magnetyczne ustawią się w jednym
Strona
43
kierunku (powstanie jedna duża domena), uporządkowanie
momentów magnetycznych próbki osiągnie stan nasycenia
(Rysunek 12.11).
Rysunek 12.11. Pętla histerezy ferromagnetyka
Przy zmniejszeniu wartości zewnętrznego pola magnetycznego
do zera, namagnesowanie ferromagnetyka nie spadnie do zera,
ale utrzyma się na pewnym poziomie. Poziom ten nazywamy
pozostałością magnetyczną (remanencją). Aby rozmagnesować
materiał, należy przyłożyć zewnętrzne pole skierowane
przeciwnie do tego, jakie zostało użyte do jego
namagnesowania.
Wartość
pola
niezbędna
do
rozmagnesowania materiału nazywamy polem koercji.
W zmiennym polu zewnętrznym wykres namagnesowania
zakreśli pętlę histerezy. Pole zawarte wewnątrz pętli histerezy
jest proporcjonalne do pracy, wykonanej na przemagnesowanie
materiału w jednym cyklu. Materiały miękkie magnetycznie
mają wąską pętlę histerezy, a twarde magnetycznie – szeroką.
Z tego względu materiały twarde magnetycznie dobrze nadają
się do wyrobu magnesów trwałych lub pamięci magnetycznych
w zastosowaniach, w których wymagana jest trwałość
zapisanej informacji. Materiały miękkie magnetycznie również
mogłyby być wykorzystane jako pamięci magnetyczne – ich
przemagnesowane (zapis informacji cyfrowej) wymaga
niewielkiej energii, jednak pod wpływem zakłóceń i
Strona 44
Podstawy Fizyki II
zewnętrznych pól magnetycznych
zgromadzona może ulec uszkodzeniu.
informacja
w
nich
Właściwości ferromagnetyczne materii obserwujemy tylko
poniżej pewnej temperatury zwanej temperaturą Curie TC.
Powyżej tej temperatury energia drgań cieplnych przewyższa
energię
uporządkowania
dipoli
i
ferromagnetyczne
uporządkowanie domenowe zanika. Zależność temperaturową
podatności χ od temperatury T, powyżej temperatury Curie,
wyraża prawo Curie-Weissa:

CC
T T C
(12.47),
gdzie CC jest stałą Curie, zaś TC temperaturą Curie.
Oprócz ferromagnetyków istnieją także antyferromagnetyki
oraz ferrimagnetyki. W antyferromagnetykach również
występują silne oddziaływania pomiędzy momentami
magnetycznymi, ale w tym przypadku momenty magnetyczne
ustawiają się naprzemiennie. W ferrimagnetykach ustawienie
momentów magnetycznych również jest naprzemienne, ale
momenty magnetyczne o jednym zwrocie są słabsze niż
momenty magnetyczne o zwrocie przeciwnym.
12.6. Energia pola
magnetycznego
Rozważmy obwód, złożony ze źródła zasilania o sile
elektromotorycznej ε, cewki o indukcyjności L i opornika R,
połączonych szeregowo jak na Rysunku 12.12.
Strona
45
Rysunek 12.12. Szeregowe połączenie cewki, opornika i źródła
Po zamknięciu klucza włączającego obwód, prąd w obwodzie
będzie narastał. Zmiana natężenia prądu wywoła powstanie na
cewce siły elektromotorycznej, która będzie skierowana tak,
aby przeciwstawić się zmianom pola magnetycznego wewnątrz
cewki – a zatem przeciwnie do siły elektromotorycznej
zasilającej obwód. Początkowo ta siła elektromotoryczna
samoindukcji jest równa sile elektromotorycznej ogniwa i
natężenie prądu płynącego przez opornik wynosi zero. W miarę
jednak jak zmniejsza się siła elektromotoryczna samoindukcji
na cewce, natężenie prądu płynące przez obwód stopniowo
rośnie aż po pewnym czasie osiągnie wartość równowagową,
identyczną jak dla przypadku, kiedy w obwodzie znajdują się
wyłącznie siła elektromotoryczna i opornik.
Zapiszmy drugie prawo Kirchhoffa dla omawianego obwodu:
ε L
dI
dt
I R 0
(12.48)
Jest to równanie różniczkowe względem prądu I a jego
rozwiązanie, określające zależność czasową natężenia prądu
I(t) możemy opisać równaniem
I
Strona 46
R
t
ε 
1  e L
R



(12.49)
Podstawy Fizyki II
Jest to równanie, opisujące dążenie układu do stanu
równowagi ze stałą czasową  = L/R. Jeżeli równanie 12.48
pomnożymy przez chwilową wartość natężenia prądu I, to
otrzymujemy równanie mające postać bilansu energii:
εI  RI 2  LI
dI
0
dt
(12.50)
Pierwszy człon ( ε I ) określa szybkość dostarczania energii do
obwodu (moc źródła). Drugi ( R I 2 ) wyraża moc rozpraszaną w
postaci ciepła na oporniku. Trzeci człon, L I
dI
, wyraża
dt
szybkość gromadzenia energii w polu magnetycznym,
wytwarzanym w cewce. Opisując szybkość gromadzenia energii
jako
dW M
, otrzymujemy równanie pozwalające obliczyć
dt
energię zgromadzoną w cewce:
dI
dW M
 LI
dt
dt
I
LI 2
0
2
W M   L I dI 
(12.51),
gdzie I oznacza natężenie prądu płynącego przez cewkę, zaś L
jest indukcyjnością tej cewki.
Jeśli podzielimy energię zgromadzoną w solenoidzie przez
objętość tego solenoidu otrzymamy gęstość energii pola
magnetycznego. Dla odcinka solenoidu o długości D i przekroju
S otrzymamy więc:
LI 2 0n 2SDI 2 0n 2 I 2 B 2 BH 0 H 2
B 





2SD
2SD
2
2 0
2
2
B 2 0 H 2
B 

2 0
2
(12.52)
Strona
47
Powyższy wzór na gęstość energii pola magnetycznego
wyprowadziliśmy dla solenoidu, ale jest on prawdziwy dla
dowolnego punktu przestrzeni, w którym wartość indukcji
magnetycznej wynosi B.
Strona 48
Podstawy Fizyki II
13
Obwody prądu
zmiennego
W tym rozdziale:
o
Obwody prądu zmiennego, impedancja
o
Drgania w obwodzie LC
o
Drgania tłumione w obwodzie RLC
o
Moc w obwodach prądu zmiennego
Strona
49
13.1. Impedancja
Dla napięć zmiennych w miejsce oporu
(rezystancji) wprowadzamy impedancję.
elektrycznego
Impedancję obwodu elektrycznego definiuje się jako
stosunek napięcia wymuszającego do natężenia prądu
płynącego przez obwód. Wymiar impedancji jest identyczny jak
wymiar oporu elektrycznego.
Zˆ 
U t 
I t 
(13.1)
Ponieważ natężenie prądu płynącego w obwodzie elektrycznym
może nie być zgodne w fazie z napięciem wymuszającym, tak
zdefiniowana impedancja jest funkcją zespoloną i posiada
zarówno część rzeczywistą Z  jak i urojoną Z  :
Zˆ  Z   i Z   Z e i 
gdzie
Z  Zˆ
oznacza
moduł
impedancji,
(13.2),
zaś
φ
jest
przesunięciem fazowym między natężeniem prądu I (t ) a
napięciem wymuszającym U (t ). Jeżeli źródło napięcia zostanie
połączone z opornikiem R, to natężenie prądu na oporniku jest
zgodne w fazie z napięciem wymuszającym. Wówczas
impedancja Z takiego obwodu posiadać będzie jedynie składową
rzeczywistą równą wartości oporu danego opornika:
Zˆ  Z   R .
W poprzednich rozdziałach charakteryzowaliśmy kondensatory
i cewki i wiemy, że dla tych elementów obwodów elektrycznych
natężenie prądu nie jest zgodne w fazie z napięciem
wymuszającym.
Strona 50
Podstawy Fizyki II
Impedancja kondensatora
W celu wyznaczenia impedancji kondensatora rozważmy obwód
elektryczny
zawierający
źródło
napięcia
zmiennego
U t  U 0 sinωt  i kondensator o pojemności C połączone
szeregowo. Dla źródła prądu stałego kondensator stanowi
rozwarcie – prąd płynie jedynie podczas ładowania
kondensatora, a po jego całkowitym naładowaniu wartość
natężenia prądu spada do zera. W przypadku źródła prądu
zmiennego polaryzacja źródła (znak napięcia) zmienia się
okresowo
powodując
naprzemienne
ładowanie
i
rozładowywanie kondensatora. Natężenie prądu płynącego w
obwodzie będzie tym większe, im większa będzie pojemność
kondensatora (przy identycznym napięciu na jego okładkach
gromadzi się wtedy więcej ładunku) i im większa będzie
częstotliwość napięcia wymuszającego. Zapiszmy II prawo
Kirchhoffa dla takiego obwodu zawierającego źródło i
kondensator:
U C U 0sint   0
(13.3)
Ponieważ ładunek q t  zgromadzony na kondensatorze jest
proporcjonalny do napięcia ładującego UC,
q t   CU C  CU 0sint 
(13.4),
więc natężenie prądu płynącego w takim obwodzie będzie
wynosić:
I t  
dq t 
 C U 0 cost 
dt
(13.5)
Natężenie prądu I (t ) jest proporcjonalne do pojemności
kondensatora oraz częstotliwości kołowej zmian napięcia
zmiennego źródła. Przypomnijmy, że funkcję sinus można
wyrazić
jako
kombinację
funkcji
wykładniczych
sin 
e i  e  i
. Wówczas napięcie źródła oraz wzór 13.5
2i
możemy zapisać w postaci:
Strona
51
U t   U 0 e i ω t
dq t 
dU t 
I t  
C
 CU 0 i ω e i ω t  C ωU 0 e i ω t  2 
dt
dt
(13.6)
Warto zwrócić uwagę, że faza natężenia prądu (wykładnik
funkcji wykładniczej) różni się od fazy napięcia o /2 –
natężenie prądu płynącego przez kondensator wyprzedza w
fazie napięcie o /2.
Rysunek 13.1. Wykres na płaszczyźnie zespolonej impedancji obwodu
zawierającego źródło prądu zmiennego oraz a) opornik, b) kondensator, c) cewkę
Na podstawie definicji (wzór 13.1) w łatwy sposób możemy
ˆ
wyliczyć zespoloną impedancję Z C kondensatora:
Zˆ C 
U t 
1
i


I t  i ωC ωC
(13.7)
Otrzymana impedancja pojemnościowa kondensatora posiada
wyłącznie składową urojoną. Na płaszczyźnie zespolonej
wektor impedancji kondensatora skierowany jest pionowo w
dół jak na rysunku 13.1 a.
Impedancja cewki indukcyjnej
Rozpatrzmy następnie obwód elektryczny składający się ze
źródła prądu zmiennego U (t ) oraz cewki o indukcyjności L.
Dla prądu stałego idealna cewka stanowi zwarcie – cewkę
Strona 52
Podstawy Fizyki II
należy traktować wyłącznie jako przewód o pewnym oporze
elektrycznym. Wraz ze wzrostem częstotliwości zmian napięcia
źródła wartość indukcji pola magnetycznego wytworzonego
przez prąd płynący w cewce będzie się coraz szybciej zmieniać.
Towarzyszyć temu będą coraz szybsze zmiany strumienia pola
magnetycznego przechodzącego przez cewkę a więc zgodnie z
prawem indukcji Faradaya indukowana będzie siła
elektromotoryczna o coraz większej wartości. W rozważanym
obwodzie elektrycznym napięcie na cewce UL(t ) równać się
będzie napięciu źródła U (t ) ( U L t  U t  ). Jednocześnie
napięcie na cewce możemy powiązać z jej indukcyjnością L
(wzór 12.44) i otrzymamy wówczas:
L
dI
 U 0 e i ωt
dt
(13.8)
Aby wyznaczyć natężenie prądu płynącego przez cewkę
scałkujemy powyższą zależność:
U L t 
U 0 e i ωt
U
I t   
dt  
dt  0 e i ωt
L
L
iω L
iU
U
I t    0 e i ωt  0 e i ωt  2 
ωL
ωL
(13.9)
W przypadku cewki indukcyjnej natężenie prądu jest opóźnione
w fazie w stosunku do napięcia o /2.
Impedancja cewki o indukcyjności L, przez którą przepływa
zmienny prąd elektryczny o częstotliwości ω wynosi:
Z L  i ωL
(13.10)
Impedancja cewki jest więc liczbą urojoną, dodatnią i na
płaszczyźnie zespolonej odpowiada wektorowi skierowanemu
pionowo w górę (rys. 13.1).
Strona
53
13.2. Drgania elektryczne
Obwód LC
Rozważmy obwód elektryczny składający się z kondensatora o
pojemności C oraz cewki o indukcyjności L połączonych
szeregowo ( obwód LC ) jak na rysunku 13.2.
Rysunek 13.2. Obwód LC kondensatora C oraz cewki indukcyjnej L połączonych
szeregowo
Początkowo klucz zamykający obwód jest otwarty tak, że w
obwodzie nie płynie prąd. Kondensator naładowano z
zewnętrznego źródła ładunkiem q0. Zamknięcie klucza
umożliwia przepływ prądu w obwodzie i rozpoczyna się
rozładowywanie kondensatora. Gdy kondensator będzie bliski
całkowitego rozładowania, prąd płynący przez cewkę osiągnie
wartość maksymalną. Po rozładowaniu kondensatora znika
różnica potencjałów między jego okładkami, wymuszająca
przepływ ładunku w obwodzie – jej rolę przejmuje natomiast
siła elektromotoryczna, wytworzona na cewce. Na skutek
występowania tej siły elektromotorycznej po całkowitym
rozładowaniu kondensatora nastąpi jego ponowne ładowanie.
Zmieni się jednak polaryzacja okładek – znak ładunku
zgromadzonego na okładkach będzie przeciwny niż na
początku. Po naładowaniu kondensatora ponownie nastąpi jego
rozładowanie przez cewkę. Siła elektromotoryczna powstająca
Strona 54
Podstawy Fizyki II
w cewce na skutek zmiany natężenia prądu płynącego przez
obwód będzie przeciwnego znaku niż w pierwszej części cyklu.
Spowoduje to ponowne ładowanie kondensatora – układ wróci
do stanu początkowego.
Równorzędny opis zmian zachodzących w obwodzie LC może
zostać
sformułowany
w
odniesieniu
do
energii,
zmagazynowanej w kondensatorze i w cewce. Początkowo cała
energia układu występuje w postaci pola elektrycznego,
wytworzonego pomiędzy okładkami kondensatora. Po
rozładowaniu kondensatora natężenie prądu płynącego przez
cewkę osiąga wartość maksymalną, co oznacza, że również
energia zgromadzona w postaci pola magnetycznego jest
wówczas maksymalna. Następnie energia ta jest zużywana na
ponowne ładowanie kondensatora. Widzimy zatem, że w
obwodzie LC zachodzą wzajemne okresowe zamiany energii
elektrycznej na magnetyczną i odwrotnie. Pokażemy, że w
idealnym obwodzie (bez strat) całkowita energia jest
zachowana.
Wartości napięć na cewce UL i na kondensatorze UC możemy
zapisać:
U L  L
dI
d 2q
 L 2
dt
dt
UC 
q
C
(13.11)
(13.12)
Z II prawa Kirchhoffa wynika, że w opisywanym obwodzie LC
napięcia te muszą być równe: U C U L  0 . Stąd otrzymujemy
równanie opisujące przepływ ładunku w obwodzie LC:
d 2q
q

0
2
dt
LC
(13.13)
Jest to równanie identycznej postaci jak równanie 6.5 opisujące
mechaniczne drgania harmoniczne – oscylator harmoniczny.
Tym razem jednak opisujemy przepływ ładunku w obwodzie
LC i układ taki nazywać będziemy oscylatorem
elektromagnetycznym.
Zależność
wartości
ładunku
Strona
55
elektrycznego zgromadzonego na kondensatorze C od czasu
możemy opisać funkcją:
q  q 0 cos0 t 
(13.14),
gdzie q0 jest wartością ładunku, jaką początkowo naładowany
został kondensator, zaś 0 jest częstotliwością własną drgań w
obwodzie LC. Wartość 0 można wyznaczyć porównując
równanie 13.13 z równaniem 6.5:
0 
1
(13.15)
LC
Spróbujmy wyrazić energię zgromadzoną w obwodzie LC w
postaci pola elektrycznego i magnetycznego za pomocą ładunku
elektrycznego q :
WE 
WB 
LI 2
2

L
2
q 2 q 02 cos 2 ω 0t 

2C
2C
q 02 02 sin2 ω 0t  
L
2
q 02
q sin ω 0t 
WB 
2C
2
0
(13.16)
1
LC
sin2 ω 0t 
2
(13.17)
W powyższym
wzorze energię pola magnetycznego
wyznaczyliśmy na podstawie zależności 12.51, podstawiając za
natężenie
prądu
elektrycznego
pochodną
ładunku
elektrycznego q po czasie
I 
dq
d
q 0 cosω 0 t   q 0ω 0 sinω 0 t 

dt dt
(13.18)
oraz wyrażając częstotliwość kołową drgań własnych ω0 za
pomocą indukcyjności cewki L oraz pojemności C kondensatora
(zależność 13.15). Korzystając z tożsamości trygonometrycznej
sin2α  cos 2α  1 łatwo wykazać, że:
Strona 56
Podstawy Fizyki II
Suma energii zgromadzonych w postaci pola magnetycznego i
elektrycznego w obwodzie LC zawsze jest wartością stałą,
równą energii zgromadzonej początkowo na kondensatorze.
E W E W B 
q 02
 const.
2C
(13.19)
Obwód RLC
Ponieważ każdy rzeczywisty obwód posiada pewien skończony
opór elektryczny, zgromadzona w obwodzie energia ulega
stopniowemu rozpraszaniu w postaci ciepła. Rozpatrzmy więc
układ składający się z kondensatora o pojemności C, cewki
indukcyjnej o indukcyjności L oraz opornika o oporze R
połączonych szeregowo jak na rysunku 13.3.
Rysunek 13.3. Obwód RLC
II prawo Kirchhoffa dla takiego obwodu RLC można zapisać w
postaci:
U C U L  RI  0
(13.20),
gdzie UC oznacza napięcie na kondensatorze, UL napięcie na
cewce indukcyjnej zaś iloczyn RI jest równy spadkowi napięcia
na oporze R, przez który płynie prąd elektryczny o natężeniu I.
Dokonując podstawienia podobnego jak dla obwodu LC
(równania 13.11, 13.12 oraz 13.18), otrzymujemy różniczkowe
równanie drgań ładunku elektrycznego q w obwodzie RLC:
Strona
57
L
d 2q
dq q
R
 0
2
dt
dt C
(13.21)
Równanie to ma podobną postać, jak równanie 6.19 dla
tłumionego oscylatora mechanicznego. Również rozwiązanie
tego równania, czyli zależność q(t ) wartości ładunku od czasu
będzie miało postać analogiczną jak w przypadku drgań
mechanicznych:
q t   q 0 e  t cost   
(13.22),
gdzie q0 jest wartością początkową ładunku zgromadzonego na
kondensatorze C. Funkcja q(t ) jest iloczynem dwóch funkcji.
Czynnik okresowy cost    opisuje oscylacje wartości
ładunku z częstotliwością kołową ω:

 R 


LC  2L 
1
2
(13.23)
Drugi człon A t   q 0 e  t opisuje spadek amplitudy drgań
wartości ładunku, który jest wykładniczą funkcją czasu ze
współczynnikiem tłumienia  
R
.
2L
Z równania 13.22 wynika, że drgania wartości ładunku w
układzie RLC będą stopniowo zanikać, a zanik ten ma
charakter wykładniczy.
13.3. Drgania tłumione w
obwodzie RLC
Jeżeli w opisywany w poprzednim rozdziale obwód RLC
włączymy szeregowo źródło (Rysunek 13.4), którego siła
elektromotoryczna jest zmienna okresowo (źródło prądu
zmiennego), otrzymujemy układ, w którym zachodzą
Strona 58
Podstawy Fizyki II
wymuszone drgania z tłumieniem. Dla obwodu takiego
II prawo Kirchhoffa będzie miało postać:
L
Symbol
ε
M
dI
q
 RI   ε M sint 
dt
C
oznacza
amplitudę
wymuszenia,
(13.24)
zaś
ω
częstotliwość kołową tego wymuszenia. Różniczkując powyższe
równanie po czasie, możemy otrzymać równanie opisujące
zmiany natężenia prądu płynącego w tym obwodzie:
L
d 2I
dI I
R
  ε M  cost 
2
dt
dt C
(13.25)
Rozwiązaniem tego równania są funkcje sinusoidalne i możemy
je zapisać w postaci:
I t   I 0 sint   
(13.26),
gdzie I0 oznacza amplitudę drgań wartości natężenia prądu
elektrycznego płynącego w obwodzie, zaś  oznacza
przesunięcie fazowe występujące pomiędzy napięciem
wymuszającym M a natężeniem I (t ) prądu w obwodzie.
ε
Rysunek 13.4. Obwód RLC z wymuszeniem o częstotliwości ω
Całkowita impedancja omawianego układu RLC będzie sumą
impedancji poszczególnych elementów, co możemy zapisać:
Strona
59
1 
Zˆ  Zˆ R  Zˆ L  Zˆ C  R  i  L 

C 

(13.27)
Widzimy, że składowa rzeczywista impedancji jest związana z
oporem, a składowa urojona z różnicą impedancji cewki i
kondensatora. Na wykresie w płaszczyźnie zespolonej wektory
opisujące impedancję cewki i kondensatora są skierowane w
przeciwnych kierunkach, a zatem odejmują się jak na rysunku
13.5.
Rysunek 13.5. Wykres na płaszczyźnie zespolonej składowych i wypadkowej
impedancji ZRLC dla szeregowego obwodu RLC.
Obliczmy moduł i przesunięcie fazowe wektora impedancji
obwodu RLC:
1 
Z  ZZ  Z 2  Z 2  R 2   ωL 

ωC 

1
ωL

Z 
ωC
tg 

Z
R
2

Strona 60
(13.28)
Podstawy Fizyki II
Analizując przesunięcie fazowe możemy określić, czy w
obwodzie prąd wyprzedza napięcie (φ < 0), czy jest odwrotnie.
Na podstawie modułu impedancji możemy natomiast określić
maksymalną wartość (amplitudę) natężenia prądu, płynącego
w obwodzie:
I0 
Można
zauważyć,
że
ε
0
(13.29)
Z
jeśli
suma
kondensatora wynosi zero ( ωL 
1
ωC
impedancji
cewki
i
), wówczas przesunięcie
fazowe jest również równe zeru – a więc napięcie i natężenie są
w fazie. Impedancja obwodu ma w takim przypadku jedynie
składową rzeczywistą, równą wartości oporu elektrycznego. W
tym przypadku impedancja obwodu osiąga również minimum.
Wartość natężenia prądu, a więc i moc wydzielana na oporniku
osiągają natomiast maksimum.
Opisując zmiany ładunku w obwodzie RLC pokazaliśmy, że
opornik R wpływa na zmniejszenie częstotliwości tych zmian
oraz tłumi amplitudę zmian ładunku (wzór 13.23). W układzie
RLC, gdy częstotliwość kołowa wymuszenia ω będzie równa
częstotliwości własnej obwodu, obserwować będziemy zjawisko
rezonansu, będące odpowiednikiem rezonansu znanego już z
układów mechanicznych. Częstotliwość rezonansowa ωr w tym
przypadku wynosi:
ω r  ω 02 
ω0 
R2
2L 2
1
(13.30)
LC
Dostrajanie układów elektronicznych do warunków rezonansu
jest stosowane w odbiornikach radiowych i telewizyjnych.
Sygnały radiowe i telewizyjne przesyłane są na odpowiedniej
częstotliwości. Częstotliwość tą nazywamy częstotliwością
nośną. Sygnały przesyłane są natomiast na zasadzie modulacji
amplitudy (AM), lub modulacji częstotliwości(FM).
Strona
61
13.4. Moc w obwodach prądu
zmiennego
Obliczmy moc, jaka wydziela się na oporniku R w omawianym
obwodzie RLC. Chwilowa energia rozpraszana na elemencie
oporowym równa się pracy dW przesunięcia ładunku dq pod
wpływem różnicy potencjałów U (t ), występującej na tym
oporniku, co w analogii do wzoru 11.22 możemy zapisać:
dW  U t dq  U t I t  dt
dW  U 0 sinωt  φ I 0 sinωt  dt
(13.31)
gdzie  oznacza przesunięcie fazowe między natężeniem prądu
I (t ) a napięciem U (t ). Energia rozpraszana na tym oporniku
R w ciągu jednego okresu wynosi:
T
W U 0 I 0  sinωt   sinωt dt
0
U I
W 0 0
2
T
1
0 cos  cos2ωt   dt  2U 0 I 0T cos
(13.32)
Ponieważ zwykle interesuje nas średnia moc wydzielana na
danym urządzeniu, obliczmy średnią wartość tej funkcji dla
jednego okresu drgań:
P
U0 I0
2 2
cos  U SK I SK cos
(13.33)
Symbol ISK oznacza natężenie skuteczne prądu równe
I0
.
2
Natężenie skuteczne ma identyczną wartość jak natężenie
prądu stałego, które powodowałoby rozpraszanie takiej samej
ilości ciepła w jednostce czasu. Poprzez analogię definiujemy
również napięcie skuteczne U SK 
Strona 62
U0
2
.
Podstawy Fizyki II
Strona
63
14
Fale
W tym rozdziale:
Strona 64
o
Rodzaje fal
o
Równanie różniczkowe fali
o
Superpozycja fal
o
Fale stojące
o
Fale akustyczne
o
Energia i natężenie fali
o
Efekt Dopplera
Podstawy Fizyki II
14.1. Co to jest fala
Wyjaśnienie licznych zjawisk
wprowadzenia pojęcia fali.
w
przyrodzie
wymaga
Fala jest to zaburzenie poruszające się w wolnej przestrzeni lub
w ośrodku.
W przyrodzie obserwujemy fale różnego typu – mechaniczne
(dźwiękowe,
fale
na
wodzie),
elektromagnetyczne,
grawitacyjne, cieplne czy fale materii. Fale mechaniczne
związane są z poruszaniem się cząsteczek ośrodka wokół
położenia
równowagowego.
W
przypadku
fal
elektromagnetycznych mówimy o periodycznych zmianach pola
magnetycznego i elektrycznego, które to zmiany rozchodzą się
w przestrzeni – fala elektromagnetyczna nie wymaga ośrodka
materialnego i rozchodzi się także w próżni. Fale materii wiążą
się z koncepcją de Brogliea, mówiącą, że poruszającym się
cząstkom materii można przypisać również właściwości falowe.
Rodzaje fal
Ze względu na sposób rozchodzenia się zaburzenia wyróżniamy
fale poprzeczne oraz podłużne. W przypadku fal poprzecznych
mechanicznych cząsteczki ośrodka drgają wokół położenia
równowagowego w kierunku prostopadłym do kierunku
rozchodzenia się fali. Fala, jaką obserwujemy na powierzchni
wody rozchodzi się w kierunku poziomym, zaś cząsteczki wody
wykonują drgania w kierunku pionowym. Falą poprzeczną jest
również fala elektromagnetyczna (np. światło widzialne), gdzie
w kierunku prostopadłym do kierunku rozchodzenia fali
obserwujemy okresowe zmiany wartości natężenia pola
elektrycznego oraz indukcji pola magnetycznego. Fale takie
możemy polaryzować i wtedy drgania zachodzą tylko w jednej
płaszczyźnie.
Strona
65
W przypadku fal podłużnych drgania cząsteczek ośrodka
odbywają się w kierunku równoległym do kierunku
rozchodzenia się fali. Przykładem może tutaj być fala
akustyczna (dźwiękowa) w powietrzu, gdzie cząsteczki drgają
wokół położenia równowagi w kierunku zgodnym z
rozchodzeniem się fali. W efekcie obserwujemy okresowe
lokalne zwiększanie i zmniejszanie się gęstości powietrza a
więc zarazem okresowe zmiany ciśnienia w ośrodku.
14.2. Równanie różniczkowe fali
Rozpatrzmy sznur, którego jeden z końców wykonuje ruch
drgający harmoniczny w kierunku osi y. Drgania harmoniczne
omawialiśmy już w rozdziale 6 i wiemy, że położenie w funkcji
czasu, y(t ), końca takiego sznura drgającego harmonicznie
można opisać funkcją sinusoidalną y t   A sinωt    . We
wzorze tym A jest amplitudą drgań, czyli maksymalnym
wychyleniem z położenia równowagowego. Wychylenie jednego
z punktów sznura spowoduje również wychylenie sąsiednich
punktów. W ten sposób zaburzenie przyłożone do końca sznura
będzie się rozchodzić wzdłuż sznura. W efekcie wszystkie
punkty sznura (ośrodka) będą wykonywały drgania
harmoniczne wokół położeń równowagowych. Jednocześnie
sąsiednie punkty sznura różnią się fazą. W danej chwili czasu
punkty ośrodka ułożone wzdłuż osi x będą wychylone w
kierunku osi y tworząc krzywą typu sinusoidalnego jak
pokazano na rysunku 14.1. Wprawiając koniec sznura w ruch
drgający wytwarzamy więc poprzeczną (drgania odbywają się w
kierunku y poprzecznym do kierunku x rozchodzenia się fali)
falę harmoniczną. Wielkości charakterystyczne, opisujące taką
falę harmoniczną to: długość fali  – odległość między dwoma
punktami zgodnymi w fazie; amplituda drgania A –
maksymalne wychylenie z położenia równowagi, okres T – czas
po jakim dany punkt x będzie ponownie w tej samej fazie
(rysunek14.1). Opisując fale często podawać będziemy również
częstotliwość fali f, będącą odwrotnością okresu T fali
f  1 T , lub też częstotliwość kołową ω :
Strona 66
Podstawy Fizyki II
ω  2πf  2π T
(14.1)
Definiuje się również wektor falowy k:
k  2 
(14.2)
Powyższą
wielkość
k
nazywamy
w
przypadku
jednowymiarowym także liczbą falową, która definiuje ile razy
długość fali  mieści się na odcinku 2 metrów. Jednostką
liczby falowej jest m 1 .
Rysunek 14.1. Schematyczny rysunek fali poprzecznej rozchodzącej się w
kierunku x
Korzystając z powyższych wielkości stan dowolnego punktu
przestrzeni (wychylenie y z położenia równowagi) znajdującego
się w odległości x od początku układu współrzędnych, w
dowolnej chwili czasu t opisany będzie funkcją sinusoidalną
postaci:
y x,t   A sinkx  ωt 
(14.3)
Argument funkcji sinus nazwiemy fazą , która zależy zarówno
od czasu t jak i położenia x:
  kx  ωt
(14.4)
W powyższym zapisie znak „–” w fazie oznacza falę
rozchodzącą się w kierunku osi x, zaś znak „+” oznacza falę
rozchodzącą się w kierunku przeciwnym do osi x. Warto przy
tym zaznaczyć, że kierunek rozchodzenia się fali definiuje się
Strona
67
poprzez kierunek przemieszczania się w przestrzeni punktu o
stałej fazie ( φ  const. ). Jeżeli np. grzbiet fali przemieszcza się
w kierunku osi x to znaczy, że fala taka rozchodzi się w
kierunku osi x. W takim przypadku w kolejnych chwilach czasu
we wzorze 14.4 wzrasta zarówno człon kx, jak i ωt, fazy drgania
, a więc żeby otrzymać stałą fazę znak między tymi członami
musi być ujemny.
Równanie 14.3, nazywane równaniem fali, jest w istocie
rozwiązaniem różniczkowego równania fali:
2 y
v
t 2
2
2 y
x 2
(14.5),
2 y
gdzie
oznacza drugą pochodną po czasie wychylenia y z
t 2
2 y
położenia równowagowego punktu ośrodka,
jest drugą
x 2
pochodną tego wychylenia y po współrzędnej x punktu ośrodka,
zaś v oznacza prędkość rozchodzenia się stałej fazy (prędkość
fazowa) w przestrzeni.
Do tej pory zakładaliśmy, że mamy do czynienia z falą
poprzeczną i wychylenie z położenia równowagowego odbywa
się wyłącznie w kierunku osi y. W ogólności falę opisywać
będzie każda funkcja Ψ położenia x i czasu t :
x
ψ x,t   f t 
 v
 , która spełniać będzie różniczkowe równanie


fali:
 2
v
t 2
2
 2
x 2
(14.6),
gdzie v jest prędkością rozchodzenia się stałej fazy fali.
Definiuje się dwie prędkości fali: prędkość fazową oraz
prędkość grupową.
Strona 68
Podstawy Fizyki II
Prędkość fazowa
Prędkość fazowa jest to prędkość, z jaką rozchodzi się stała
faza fali (np. grzbiet fali na wodzie). Jeżeli do różniczkowego
równania ruchu (równanie 14.5) wstawimy równanie fali 14.3,
to otrzymamy, że prędkość fazowa fali równa jest stosunkowi
częstotliwości kołowej do liczby falowej. Korzystając z
wcześniejszych definicji częstotliwości kołowej oraz liczby
falowej możemy również wyrazić prędkość fazową fali jako
stosunek długości fali do jej okresu. Można więc powiedzieć, że
fala rozchodząca się z prędkością fazową pokonuje drogę równą
długości fali w czasie równym okresowi tej fali:
vf 
ω

 f 
k
T
(14.7)
14.3. Superpozycja fal
Zgodnie z zasadą superpozycji nakładające się fale dodają się
algebraicznie nie wpływając przy tym na siebie tzn. wychylenie
całkowite punktu x w danej chwili t jest sumą wychyleń
pochodzących od wszystkich składowych fal. Rozpatrzmy sumę
dwóch fal o zbliżonych częstotliwościach ω1 i ω2 oraz liczbach
falowych k1 i k2 oraz identycznych amplitudach A:
y  A cosω1t  k1 x   A cosω 2t  k 2 x 
(14.8)
Przy założeniu bliskości częstotliwości i wektorów falowych
prawdziwe są następujące przybliżenia:
ω1  ω 2  2ω1
(14.9)
k1  k 2  2k1
(14.10)
Wówczas przyjmując oznaczenia ω1  ω 2   ω i k1  k 2  k
oraz stosując wzór na sumę kosinusów otrzymujemy:
Strona
69
k 
 Δ
t
x  cosω1 t  k1 x 
2 
 2
y  2A cos
(14.11)
Jest to równanie fali o częstotliwości ω1 oraz liczbie falowej k1,
której
amplituda
zmienia
się
zgodnie
z
funkcją



k


cos
t
x  . W wyniku superpozycji fal otrzymujemy więc
2
2


falę o tzw. amplitudzie modulowanej od wartości zero do 2A.
Pomiędzy minimami amplitudy znajduje się grupa fal o
niezerowych amplitudach tworząca tzw. paczki falowe.
Prędkość grupowa, dyspersja fal
Prędkość grupowa jest prędkością rozchodzenia się maksimów
amplitudy paczek falowych w tzw. zjawisku dudnień. Definiuje
się ją jako pochodną częstotliwości kołowej po wektorze
falowym:
vg 
dω
dk
Prędkość rozchodzenia się paczki falowej
dyspersyjnym jest inna niż prędkość fazowa.
(14.12)
w
ośrodku
Dyspersja oznacza zależność prędkości fazowej fali od
częstotliwości fali i jest cechą charakterystyczną ośrodka, w
którym fala się rozchodzi.
Jeżeli ośrodek jest bezdyspersyjny, wówczas prędkość fazowa
jest stała i niezależna od częstotliwości fali:
vf 
ω
k
 const.
(14.13)
W ośrodku bezdyspersyjnym prędkość grupowa jest równa
prędkości fazowej:
vg 
Strona 70
dω dv f k 

vf
dk
dk
(14.14)
Podstawy Fizyki II
W przypadku ośrodka dyspersyjnego, czyli takiego, w którym
prędkość fazowa zależy od częstotliwości, grupa fal o zbliżonych
częstotliwościach będzie miała zbliżone, ale jednak różne
prędkości fazowe. W konsekwencji zwiększać się będzie w
czasie szerokość paczki falowej utworzonej z takich fal, gdyż
każda z fal składowych w tym samym czasie pokona inną
odległość.
14.4. Fale stojące
Rozważmy dwie fale o tej samej amplitudzie i częstotliwości,
ale rozchodzące się w przeciwnych kierunkach. Fale takie
możemy łatwo wytworzyć np. w sznurze zamocowanym z jednej
strony do ściany, którego drugi, wolny, koniec wprawimy w
harmoniczny ruch drgający. Powstała w ten sposób fala
rozchodzi się w kierunku ściany, odbija się od niej i wraca nie
zmieniając przy tym ani częstotliwości ani amplitudy drgań.
Zgodnie z zasadą superpozycji obie fale się dodają. Wynik tego
dodawania zależeć jednak będzie od długości sznura i od
częstotliwości drgań, które wytwarzamy na końcu sznura. Przy
ustalonej długości sznura dla pewnych częstotliwości drgań
zaobserwujemy, że w niektórych punktach sznur jest
nieruchomy a w innych amplituda tych drgań jest duża oraz, że
położenie tych punktów nieruchomych i drgających nie zmienia
się w czasie. Mówimy wówczas, że powstała fala stojąca.
Przedstawione zjawisko powstawania fali stojącej opiszemy
teraz ilościowo. Załóżmy, że fala w sznurze rozchodzi się w
kierunku przeciwnym do osi x. Falę taką nazywać będziemy
falą padająca a jej równanie można zapisać w postaci:
t x
 
T  
y padajaca  A sin 2 
(14.15)
Podczas odbicia takiej fali od ściany zmienia się zwrot
rozchodzenia się fali (w kierunku osi x ) oraz jej faza o π a więc
równanie fali odbitej można przedstawić w postaci:
Strona
71
y odbita  A sin
2t
 T

2x
t x
     A sin2   

λ

T
(14.16)
Obliczając sumę fali padającej oraz odbitej korzystamy ze
wzoru trygonometrycznego na różnice sinusów i otrzymujemy
równanie fali stojącej:
y  y padajaca  y odbita  2A sin
2 x
2 t
cos
λ
T
(14.17)
Fala stojąca składa się z węzłów oraz strzałek. W strzałkach
amplituda drgań jest stale maksymalna a w węzłach
wychylenia są zawsze zerowe (w każdej chwili czasu).
Położenia węzłów oraz strzałek nie zależą od czasu i określa je
człon sin 2 x  powyższego równania. Przykładowo w
punktach, dla których 2 x λ  n  , czyli dla całkowitych
wielokrotności połówki długości fali ( x  n λ 2 ) otrzymujemy
węzły.
Rysunek. 14.2 Schematyczny rysunek obrazujący falę stojącą powstającą w tubie
zamkniętej (z lewej) i z jednym końcem otwartym (z prawej).Narysowano dwie fale
o największych długościach możliwych do uzyskania w tubie o danej długości
Fale stojące powstają np. na strunie gitarowej oraz w
piszczałkach organowych. Ponieważ końce struny są
zamocowane, czyli są tam węzły fali stojącej, na strunie mogą
powstać tylko takie fale stojące, dla których całkowita
wielokrotność połowy długości fali jest równa długości struny d
Strona 72
Podstawy Fizyki II
( d  n λ 2 ). W przypadku piszczałek organowych zamkniętych
(rysunek 14.2 a) na obu końcach piszczałki, podobnie jak w
przypadku struny, są węzły a więc również w piszczałce
zamkniętej mogą powstać tylko takie fale stojące, dla których
długość piszczałki d jest równa całkowitej wielokrotności
długości fali stojącej d  n λ 2 . W przypadku piszczałek
otwartych (rysunek 14.2 b) na jednym końcu tuby będzie węzeł
a na drugim strzałka i wówczas długość fali stojącej powstałej
w takiej otwartej tubie o długości d spełniać będzie warunek
d  2n 1 λ 4 .
14.5. Fala akustyczna
Fala akustyczna (fala dźwiękowa w powietrzu) jest falą
podłużną, co oznacza, że drgania cząsteczek ośrodka następują
w tym samym kierunku, w którym rozchodzi się fala. Fala
dźwiękowa wytwarzana jest na przykład w powietrzu przez
membranę głośnika. Sygnał elektryczny dochodzący do
głośnika porusza membraną, co wywołuje lokalne zmiany
gęstości i ciśnienia powietrza. Takie lokalne zaburzenie
ciśnienia z kolei powodują przemieszczanie się sąsiednich
cząsteczek powietrza i w efekcie fala akustyczna rozchodzi się
w tym samym kierunku, w którym drgają cząsteczki ośrodka
(jest falą podłużną). Wychylenie cząsteczek z położenia
równowagowego dla fali akustycznej można opisać równaniem:
s x,t   A coskx  t 
(14.18),
gdzie s (x,t ) oznacza wychylenie z położenia równowagowego
cząsteczki ośrodka znajdującej się w chwili t w punkcie o
współrzędnej x.
Szczegółowa analiza zjawiska rozchodzenia się dźwięku w
gazach pokazuje, że prędkość rozchodzenia się dźwięku jest
zdeterminowana przez proces adiabatyczny zachodzący w
gazie. W efekcie prędkość dźwięku w gazie zależy od
Strona
73
temperatury gazu T, wykładnika adiabaty γ oraz masy molowej
M cząsteczek ośrodka:
v
 RT
M
(14.19)
Dla ośrodka jednorodnego prędkość rozchodzenia się dźwięku
można wyrazić również za pomocą gęstości ośrodka ρ oraz
modułu
ściśliwości
B
(współczynnika
sprężystości
objętościowej):
v
B

(14.20)
W przypadku fali dźwiękowej rozchodzącej się w ciele stałym
moduł ściśliwości zastępujemy modułem Younga. W ogólności
można powiedzieć, że prędkość rozchodzenia się fali
akustycznej zależy od pierwiastka kwadratowego ze stosunku
wielkości charakteryzującej miarę sprężystości do wielkości
będącej miarą bezwładności materiału ośrodka. Prędkość
rozchodzenia się fali akustycznej jest najmniejsza w gazach a
największa w ciałach stałych.
14.6. Energia fali
Przypomnijmy, że definiowaliśmy falę jako rozchodzące się w
przestrzeni zaburzenie. Podczas rozchodzenia się fali materia
efektywnie się nie przemieszcza, nie występuje transport masy,
ale rozchodząca się fala przenosi energię i jest w stanie
wykonać pracę. Rozpatrzmy jeszcze raz sznur przymocowany z
jednej strony do ściany. Jeżeli drugi koniec będziemy podnosili i
opuszczali, powstanie fala, która rozchodzić się będzie w
sznurze. Sam sznur się nie przesuwa, czyli nie obserwujemy
transportu masy, ale jeżeli w pewnym miejscu sznura
umieścimy odważnik to sznur (fala w sznurze) podniesie
odważnik, czyli wykona pracę. Można wykazać, że wartość
energii przenoszonej przez falę w jednostce czasu (moc fali) jest
Strona 74
Podstawy Fizyki II
proporcjonalna do kwadratu amplitudy fali, kwadratu
częstotliwości fali oraz parametrów charakteryzujących
ośrodek, w którym fala się rozchodzi:
Psr 
dE sr
ω2 A2
dt
(14.21)
W
przypadku
fali
dźwiękowej
tymi
parametrami
charakteryzującymi ośrodek są jego gęstość oraz prędkość
rozchodzenia się w nim dźwięku.
Natężenie fali
Energia, jaką może przekazać fala obiektowi zależy nie tyko od
mocy fali, ale także powierzchni obiektu, z jaką ta fala
oddziałuje. Dlatego definiuje się natężenie fali jako stosunek
mocy źródła P do powierzchni S na jaką ta fala oddziałuje:
I
P E

S S t
(14.22)
Jeżeli rozpatrzymy punktowe źródło emitujące falę rozchodzącą
się równomiernie we wszystkich kierunkach (izotropowo), to
natężenie fali będzie odwrotnie proporcjonalne do kwadratu
odległości od źródła:
I
P
4 r 2
(14.23),
gdzie r jest odległością od źródła, zaś 4 r 2 jest powierzchnią
sfery o promieniu r. W efekcie w dwa razy większej odległości
natężenie fali będzie 4 razy mniejsze.
Poziom natężenia fali dźwiękowej, tzw. głośność β, przyjęto
określać w decybelach dB porównując zmierzone natężenie fali
I z referencyjnym I0 zgodnie z formułą:
Strona
75
  10 log10
p
I
 20 log10 a
I0
p0
(14.24)
Natężenie odniesienia I0 jest najmniejszym natężeniem, jakie
jest w stanie usłyszeć ludzkie ucho (próg słyszalności) i wynosi
I 0  10 12 W m 2 . Poziom natężenia fali dźwiękowej można
również określić za pomocą ciśnienia akustycznego pa.
14.6. Efekt Dopplera
Efekt Dopplera polega na zmianie rejestrowanej częstotliwości
fali w przypadku, gdy występuje ruch obserwatora lub źródła
fali względem ośrodka. Rozpatrzmy przypadek, gdy źródło fali
oddala się od obserwatora. Wówczas odległość między
kolejnymi czołami fali jest powiększona o drogę, jaką źródło
przebędzie podczas jednego okresu fali. W ten sposób
efektywnie zwiększa się okres fali, czyli zmniejsza się
częstotliwość fali mierzonej przez obserwatora. W przeciwnym
przypadku, gdy źródło zbliża się do obserwatora, kolejne czoło
fali „goni” poprzednie czoła fali zmniejszając odległość między
nimi a więc długość i okres fali, zwiększając zaś jej
częstotliwość (rysunek 14.3). Podobne rozważania można
przeprowadzić
również
dla
przypadku
obserwatora
poruszającego się względem źródła. W ogólności zmierzoną
częstotliwość można opisać wzorem:
f   f0
v vo
v  vz
(14.24),
gdzie f0 to częstotliwość źródła, v – prędkość rozchodzenia się
fali w ośrodku, v z – prędkość źródła fali, v o – prędkość
obserwatora. W powyższym zapisie górny znak stosujemy,
jeżeli obserwator i źródło zbliżają się do siebie zaś dolny, jeżeli
oddalają. Przykładowo, częstotliwość sygnału karetki, jaką
zmierzy nieruchomy obserwator w przypadku, gdy karetka
Strona 76
Podstawy Fizyki II
zbliża się do niego z prędkością v k wyniesie f   f 0
f f0
v
oraz
v vk
v
, gdy karetka będzie się oddalała. W efekcie w
v vk
chwili mijania obserwator będzie słyszał zmianę tonu sygnału z
wysokiego na niski – gdy karetka się zbliża dźwięk ma wyższą
częstotliwość (wyższe dźwięki), a gdy się oddala mniejszą
częstotliwości (niższe dźwięki).
Rysunek 14.3. Powstawanie efektu Dopplera w przypadku, kiedy porusza się
źródło. Dla nieruchomego źródła (z lewej) obserwatorzy O 1 i O2 odbierają falę o
identycznej częstotliwości. Kiedy źródło się porusza (z prawej) obserwator O 1
odbiera falę o większej długości (niższej częstotliwości), a obserwator O 2 falę o
mniejszej długości (wyższej częstotliwości).
Zjawisko Dopplera wykorzystywane jest np. w radarach
drogowych. Wiązka promieniowania o określonej częstotliwości
wysyłana przez nadajnik odbija się od karoserii poruszającego
się samochodu i wraca do odbiornika. Na podstawie różnicy
częstotliwości pomiędzy falą wysłaną a odebraną możemy
określić prędkość poruszania się pojazdu. Dzięki efektowi
Dopplera
możemy
również
wyznaczyć
prędkości
przemieszczania się
chmur
związanych
z
frontami
atmosferycznymi. Zmiana charakterystycznych częstotliwości
promieniowania elektromagnetycznego pozwala także określić
prędkość gwiazd względem Ziemi.
Strona
77
15
Fale
elektromagnetyczne
W tym rozdziale:
o
Równania Maxwella
o
Prędkość fazowa fali
elektromagnetycznej
o
Natężenie fali elektromagnetycznej,
wektor Poyntinga
Strona 78
Podstawy Fizyki II
15.1. Widmo fal elektromagnetycznych
Otaczająca nas przestrzeń jest wypełniona promieniowaniem
elektromagnetycznym.
Widmo
promieniowania
elektromagnetycznego obejmuje fale o częstotliwościach z zakresu
ponad 20 rzędów wielkości. W zależności od częstotliwości (lub
długości) fali wyróżniamy fale długie (częstotliwości do ok.
104 Hz), fale radiowe (104 – 1011 Hz), podczerwień (1011 –
1014 Hz), zakres światła widzialnego (od koloru czerwonego o
długości fali ok. 700 nm poprzez pomarańczowy, żółty i zielony
do niebieskiego i fioletowego o długości fali ok. 400 nm),
nadfiolet (1015 – 1017 Hz), promieniowanie rentgenowskie (1017
– 1020 Hz) oraz promieniowanie gamma (powyżej 1020 Hz).
15.2. Równania Maxwella
Istnienie fal elektromagnetycznych wynika z równań
Maxwella. Są to podstawowe, omawiane już w poprzednich
rozdziałach równania pola elektrycznego i magnetycznego,
które teraz jeszcze raz przypomnimy.
Prawo Gaussa dla pola elektrycznego wyraża źródłowy
charakter pola elektrycznego – źródłem statycznego pola
elektrycznego są ładunki elektryczne. Istnieją pojedyncze
ładunki elektryczne, na których zaczynają lub kończą się linie
statycznego pola elektrycznego. Wartość strumienia wektora

E natężenia pola elektrycznego przechodzącego przez dowolną
powierzchnię zamkniętą jest równa ładunkowi objętemu przez
tę powierzchnię podzielonemu przez stałą  0 :
Strona
79


Q
 E  dS  
(15.1)
0
Prawo Gaussa dla pola magnetycznego mówi, że nie istnieją
pojedyncze bieguny magnetyczne, monopole magnetyczne a
więc, że pole magnetyczne ma charakter bezźródłowy. Linie
pola magnetycznego nie mają początku ani końca i są liniami
zamkniętymi. Wówczas strumień wektora indukcji pola

magnetycznego B przechodzący przez dowolną powierzchnię
zamkniętą jest równy zeru - tyle samo linii pola magnetycznego
wchodzi i wychodzi z obszaru określonego przez tę dowolną
powierzchnię zamkniętą:


 B  dS  0
(15.2)
Prawo indukcji Faradaya: zmienne pole magnetyczne jest
źródłem wirowego pola elektrycznego. Krążenie wektora
natężenia indukowanego pola elektrycznego po krzywej
zamkniętej równa się szybkości zmian strumienia wektora
indukcji
pola
magnetycznego
przechodzącego
przez
powierzchnię rozpiętą na tej krzywej.

 

d
B
dΦ B
  dS
E

d
l





dt
dt


(15.3)
Następnym równaniem jest uogólnienie prawa Ampera dla
magnetyzmu. Źródłem wirowego pola magnetycznego jest prąd
elektryczny (prawo Ampera) lub zmienne pole elektryczne.
Krążenie wektora indukcji pola magnetycznego po krzywej
zamkniętej jest równe sumie wartości prądów stałych oraz
prądów przesunięcia przenikających przez powierzchnię
rozpiętą na tej krzywej, pomnożonych przez przenikalność
magnetyczną próżni μ0.


 B  dl  0 0


dΦ E
 0 I
dt
 B  dl  0I p  0I
Strona 80
(15.4)
(15.5)
Podstawy Fizyki II
I P  0
dΦ E dΦ D

dt
dt
(15.6),
gdzie Ip oznacza prąd przesunięcia – czyli prąd, którego
przepływ wywołałby wytworzenie pola magnetycznego o
identycznej wartości, jak ta wytworzona przez zmienny
strumień
natężenia
pola
elektrycznego


Φ D   0  E  dS
(równanie 15.6). Aby wyjaśnić istotę prądu przesunięcia
rozważmy proces ładowania kondensatora. Przerwa między
okładkami kondensatora stanowi nieciągłość w obwodzie i
wydawać by się mogło, że w takim obwodzie nie może być
spełnione I prawo Kirchhoffa – do okładki dopływa bowiem
prąd elektryczny ale nie ma gdzie dalej odpływać. Ale
dopływający do okładki kondensatora prąd o natężeniu I
powoduje gromadzenie się na niej ładunku. Między okładkami
kondensatora powstaje jednocześnie pole elektryczne, którego
natężenie
jest
proporcjonalne
do
gęstości
ładunku
zgromadzonego
na
okładce
kondensatora,
a
więc
proporcjonalne do natężenia prądu dopływającego I, czasu
ładowania dt dq  I dt  oraz odwrotnie proporcjonalne do
powierzchni okładek kondensatora A i wynosi:
dE 
d
0

dq A
0

I dt
A 0
(15.7)
Strumień natężenia pola elektrycznego przechodzący przez
pewną powierzchnię A znajdującą się między okładkami
kondensatora i równoległą do tych okładek wynosić będzie:
dΦ E  A dE 
I dt
0
(15.8)
Wyznaczając następnie z równania 15.6 prąd przesunięcia
otrzymujemy:
I P  0
I dt  0
dΦ E
 0
I
dt
dt
(15.9)
Strona
81
Na tym prostym przykładzie procesu ładowania kondensatora
wykazaliśmy, że natężenie prądu przesunięcia między
okładkami kondensatora równa się wartości natężenia prądu
ładującego kondensator. Możemy zatem stwierdzić, że prąd
przesunięcia kontynuuje w tym przypadku prąd ładowania i
pierwsze prawo Kirchhoffa jest spełnione.
Indukowane pole magnetyczne będzie miało największą
wartość na początku procesu ładowania kondensatora, kiedy
zachodzą największe zmiany strumienia natężenia pola
elektrycznego. Po zakończeniu ładowania kondensatora znika
prąd ładowania i indukowane pole magnetyczne zanika.
15.3. Rozchodzenie się fali
elektromagnetycznej
Konsekwencją zapisanych powyżej równań Maxwella są fale
elektromagnetyczne. Jak wynika z równań Maxwella dla fali

elektromagnetycznej wektory natężenia pola elektrycznego E

oraz indukcji B pola magnetycznego są do siebie zawsze
prostopadłe oraz są prostopadłe do kierunku rozchodzenia się
tej fali elektromagnetycznej. Oznacza to, że fala
elektromagnetyczna jest falą poprzeczną.
Zmiany wartości obu wektorów, E i B, następują z tą samą
częstotliwością i opisane są funkcjami sinusoidalnymi
zgodnymi w fazie (rysunek 15.1):
E x,t   E max coskx  ωt 
B x,t   B max coskx  ωt 
(15.10)
Rozpatrzmy falę elektromagnetyczną rozchodzącą się w
kierunku osi x, gdzie wektor natężenia pola elektrycznego
zmienia się wzdłuż osi y zaś wektor indukcji pola
magnetycznego drga odpowiednio w kierunku osi z, jak na
rysunku 15.1.
Strona 82
Podstawy Fizyki II
Rysunek 15.1. Schematyczny
elektromagnetycznej
rysunek
rozchodzenia
się
fali
Jeżeli w pewnym obszarze przestrzeni wokół dowolnego punktu
P indukcja B pola magnetycznego będzie malała w czasie, to
również strumień pola magnetycznego przechodzący przez ten
obszar przestrzeni będzie malał w czasie. Wówczas zgodnie z
prawem indukcji Faradaya wokół punktu P powinno powstać
wirowe pole elektryczne, które kompensować będzie tę zmianę
strumienia pola magnetycznego. W efekcie wartość natężenia
pola elektrycznego E w sąsiednim punkcie odległym o dx
zmieni się o wartość dE. Taka zmiana wartości natężenia pola
elektrycznego (również zmiana strumienia wektora natężenia
pola elektrycznego) zgodnie z prawem Ampera będzie
kompensowana przez wirowe pole magnetyczne powstałe wokół
tego punktu. Oznacza to, że analogicznie do pola elektrycznego
również wartość indukcji pola magnetycznego w punkcie
odległym o dx zmieni się o wartość dB. W ten sposób
wykazaliśmy jakościowo na podstawie równań Maxwella, że
pola elektryczne i magnetyczne są ze sobą powiązane,
konsekwencją czego jest istnienie fal elektromagnetycznych.
Równania Maxwella pozwalają również wyznaczyć wartość
prędkości rozchodzenia się fali elektromagnetycznej.
Strona
83
Prędkość rozchodzenia się fali
elektromagnetycznej
Równania Maxwella można przekształcić tak, że otrzymamy
różniczkowe równanie fali zarówno dla wektora natężenia pola
elektrycznego E jak i magnetycznego H :
 2 E x,t 
 2 E x,t 



0 0
x 2
t 2
 2 H x,t 
 2 H x,t 
  0 0
x 2
t 2
(15.11),
gdzie  0 jest przenikalnością elektryczną próżni, zaś  0
oznacza przenikalność magnetyczną próżni. Równania te mają
podobną postać jak różniczkowe równanie fali (równanie 14.5).
Z porównania równania 15.11 oraz 14.5 wynika, że prędkość
rozchodzenia się fali elektromagnetycznej w próżni, nazywana
prędkością światła c, wynosi:
c
1
 0 0
 3 108 m s
(15.12)
Warto podkreślić w tym miejscu, że rozwiązaniem
różniczkowych równań fali elektromagnetycznej 15.11 muszą
być funkcje sinusoidalne przedstawione w równaniach 15.10.
Źródłem
fali elektromagnetycznej jest niejednostajny
(przyspieszony) ruch ładunków elektrycznych. Ruch taki
możemy wywołać na przykład przykładając napięcie do
przewodnika (anteny). Ładunki dodatnie i ujemne ulegną
wówczas rozsunięciu (powstanie dipol elektryczny). Pod
wpływem zmiennego napięcia ładunki będą drgały
wytwarzając zmienne pole elektryczne, które zgodnie z
równaniami
Maxwella
stanie
się
źródłem
fali
elektromagnetycznej.
Strona 84
Podstawy Fizyki II
15.4. Wektor Poyntinga
Fala elektromagnetyczna, podobnie jak rozważana wcześniej
mechaniczna fala wytworzona w sznurze, niesie energię i jest
zdolna wykonać pracę. W poprzednim rozdziale mówiliśmy, że
opisując zdolność fali do wykonania pracy należy określić, jaka
porcja energii w jednostce czasu dociera do jednostkowej
powierzchni. W przypadku fal elektromagnetycznych chwilową
szybkość przepływu energii, czyli moc przypadającą na

jednostkę powierzchni opisuje wektor Poyntinga S . Wektor
ten definiuje się poprzez iloczyn wektorowy wektora natężenia
pola elektrycznego E oraz natężenia pola magnetycznego H:



S  E H
(15.13)
Jako wynik iloczynu wektorowego wektor Poyntinga jest
prostopadły zarówno do wektora natężenia pola elektrycznego
jak i wektora indukcji magnetycznej. Wektor S wyznacza
kierunek i zwrot rozchodzenia się fali elektromagnetycznej.
Natężenie fali elektromagnetycznej
wartości wektora Poyntinga:
jest
równe
średniej
2
I  S sr
2
1
E 2 sr   E max  1  E max

c μ0
 2  c μ0 2 c μ0
(15.14)
Ciśnienie promieniowania
Fale elektromagnetyczne transportują nie tylko energię, ale
również pęd. Jeżeli obiekt, który oświetlany falą
elektromagnetyczną pochłonie pewną energię ΔU, to
równocześnie przekazany mu zostanie pęd Δp:
Δp 
ΔU
c
(15.15),
Strona
85
gdzie c jest prędkością światła. W przypadku, gdy
promieniowanie elektromagnetyczne ulegnie całkowitemu
wstecznemu odbiciu zmiana pędu obiektu będzie dwukrotnie
większa.
Energia ΔU pochłonięta przez obiekt zależy od natężenia
promieniowania I, powierzchni obiektu A oraz czasu
naświetlania Δt (równanie 14.22):
ΔU  I A Δt
(15.16)
Wartość
siły
oddziaływania
promieniowania
elektromagnetycznego pochłoniętego całkowicie przez obiekt
można obliczyć na podstawie drugiej zasady dynamiki
Newtona:
F 
Δp ΔU I A Δt I A



Δt c Δt
c Δt
c
(15.17)
Ponieważ powyższa siła działa na powierzchnię A obiektu, więc
możemy
wyznaczyć
ciśnienie
promieniowania
elektromagnetycznego:
pp 
F I

A c
(15.18)
W przypadku całkowitego wstecznego odbicia ciśnienie
promieniowania elektromagnetycznego będzie dwukrotnie
większe i wyniesie:
pp 
2I
c
(15.19),
gdzie I oznacza natężenie promieniowania elektromagnetycznego zaś c jest prędkością światła. Wartość ciśnienia
promieniowania jest na tyle niewielka, że nie odczuwamy go w
życiu codziennym. Ciśnienie promieniowania pozwala jednak
na przykład wyjaśnić specyficzne ułożenie i zakrzywienie
warkoczy komet okrążających Słońce a także ma decydujące
znaczenie w utrzymaniu równowagi gwiazd – ciśnienie
promieniowania równoważy siły grawitacji.
Strona 86
Podstawy Fizyki II
16
Optyka
W tym rozdziale:
o
Prawo odbicia i załamania
o
Dyspersja
o
Zwierciadła, soczewki i urządzenia
optyczne
o
Polaryzacja
o
Interferencja
o
Dyfrakcja
Strona
87
Optyka
Optyka zajmuje się zjawiskami fizycznymi związanymi z
falami elektromagnetycznymi z zakresu światła widzialnego.
Często wprowadza się podział na optykę geometryczną
(zajmującą się geometrycznym opisem toru tzw. promienia
świetlnego) i optykę fizyczną (zajmującą się opisem falowych
własności światła, takich jak polaryzacja, interferencja i
dyfrakcja). Podział taki ma znaczenie głównie historyczne,
bowiem geometryczny przebieg promienia świetlnego w
materiale możemy również opisać za pomocą równań fali
elektromagnetycznej.
16.1. Prawa załamania i odbicia
światła
Zasada Huygensa oraz zasada Fermata
Jednymi z podstawowych praw optyki są zasada Huygensa
oraz zasada Fermata.
Zasada Huygensa mówi, że każdy punkt czoła fali można
uważać za źródło nowej (wtórnej) fali kulistej.
Czoło fali tworzy zbiór punktów fali zgodnych w fazie. Jeżeli
czoło fali jest płaszczyzną (linią prostą w przypadku
dwuwymiarowym) (rys. 16.1a), to falę taką nazywamy falą
płaską, zaś jeżeli czoło ma kształt sfery (okręgu) (rys. 16.1b) to
fala nazywana jest falą kulistą.
Rozpatrzmy najpierw falę płaską jak na rysunku 16.1a.
Zgodnie z zasadą Huygensa każdy punkt czoła fali staje się
źródłem nowej fali kulistej. Ponieważ fale rozchodzą się w tym
samym ośrodku, więc każda z tych wtórnych fal w czasie Δt
przebędzie tę samą drogę s = c Δt. W efekcie, po czasie Δt, nowe
Strona 88
Podstawy Fizyki II
czoło fali będzie również falą płaską oddaloną od pierwotnego
czoła fali o odległość s. Analogicznie w przypadku fali kulistej
nowe czoło fali również będzie sferą (okręgiem), ale o promieniu
większym od pierwotnego o długość s (rys. 16.1b).
Rysunek 16.1. Zasada Huygensa
W optyce geometrycznej do opisu przebiegu fal świetlnych
często korzystać będziemy z pojęcia promieni światła, czyli
nieskończenie cienkiej wiązki światła.
Według zasady Fermata promień światła biegnący z jednego
punktu do drugiego wybiera drogę, na której przebycie zużyje
extremum czasu (najczęściej minimum).
Zastosujemy zasady Huygensa oraz Fermata do wyznaczenia
przebiegu promieni świetlnych na granicy dwóch ośrodków o
różnych właściwościach optycznych.
Współczynnik załamania
W
poprzednim
rozdziale
pokazaliśmy,
że
prędkość
rozchodzenia się fali elektromagnetycznej w próżni (prędkość
fazowa) jest równa prędkości światła c  1 ε0 μ0 . Jeżeli
Strona
89
światło rozchodzi się w ośrodku innym niż próżnia jego
prędkość fazowa v zależy od właściwości ośrodka i wynosi:
v
1
c
c


εε0 μμ0
εμ n
(16.1),
gdzie c oznacza prędkość światła w próżni, μ oraz ε oznaczają
odpowiednio względne przenikalności magnetyczną oraz
elektryczną ośrodka zaś n współczynnik załamania ośrodka, w
którym rozchodzi się fala elektromagnetyczna.
Z powyższej zależności wynika, że światło będzie się
rozchodziło z różnymi prędkościami w ośrodkach o różnym
współczynniku
załamania
(różnych
właściwościach
optycznych).
Prawo odbicia
Prawo odbicia mówi, że kąt padania fali świetlnej jest równy
kątowi odbicia.
Prawo to wynika z zastosowania zasady Fermata dla
wyznaczenia przebiegu fali świetlnej między dwoma punktami.
Jeżeli podczas tego przebiegu fala świetlna ulega odbiciu od
granic ośrodków, to minimalny czas na pokonanie takiej drogi
optycznej otrzymamy wtedy, gdy kąt padania jest równy
kątowi odbicia. Warto przy tym zaznaczyć, że w optyce kąt
padania oraz odbicia wyznaczamy względem normalnej do
granicy ośrodków.
Jeżeli współczynnik załamania ośrodka, od granicy którego
odbija się fala, jest większy niż współczynnik załamania
ośrodka, w którym fala propaguje, podczas odbicia następuje
zmiana fazy fali o  (zmiana fazy na przeciwną).
Prawo załamania
Rozpatrzmy teraz przebieg fali świetlnej między dwoma
punktami znajdującymi się w ośrodkach o różnych
Strona 90
Podstawy Fizyki II
współczynnikach załamania n1 oraz n2. Jeżeli współczynnik
załamania w ośrodku drugim jest większy niż w pierwszym
(n1 < n2), to fala świetlna w tym ośrodku rozchodzić się będzie z
prędkością mniejszą niż w pierwszym (wzór 16.1). Czyli jeżeli
w czasie T, odpowiadającym okresowi fali, fala w ośrodku 1
przebędzie drogę λ1, to w ośrodku 2 przebędzie krótszą drogę λ2.
Zgodnie z zasadą Huygensa, każdy z punktów czoła fali
rozchodzącej się w ośrodku 1 docierając do granicy ośrodków
staje się źródłem nowej fali kulistej rozchodzącej się dalej w
ośrodku 2. W przypadku, gdy fala pada na granicę ośrodków
pod pewnym kątem α1 (czoło fali tworzy z granicą ośrodków kąt
α1 oraz promień świetlny tworzy kąt α1 z normalną do granicy
ośrodków) każdy z punktów granicy rozdziału ośrodków staje
się źródłem nowej fali kulistej w innej chwili czasu (rysunek
16.2).
Rysunek 16.2. Załamanie fali na granicy ośrodków o różnych właściwościach
optycznych
Ponieważ w drugim ośrodku fala rozchodzi się wolniej, to czoło
fali w ośrodku 2 tworzyć będzie kąt α2 z granicą ośrodków.
Relację między długościami fali λ1 oraz λ2 a kątami α1 oraz α2
Strona
91
można wyznaczyć porównując odcinki AC w trójkątach ABC
oraz ACD na rysunku 16.2b:
1 sinα1  h  2 sinα2
(16.2)
Wyrażając długości fali λ1 oraz λ2 za pomocą prędkości fali
świetlnej w ośrodkach 1 i 2 ( 1  v 1 T oraz 2  v 2 T ) po
przekształceniach otrzymujemy prawo Snelliusa załamania
wiązki światła na granicy dwóch ośrodków optycznych:
sinα1 v 1 n2


 n21
sinα2 v 2 n1
(16.3)
Na granicy dwóch ośrodków optycznych stosunek sinusów kąta
padania i załamania fali świetlnej jest równy stosunkowi
prędkości rozchodzenia się światła w tych ośrodkach lub
odwrotności
stosunku
współczynników
załamania
tych
ośrodków.
Stosunek współczynnika n2 załamania ośrodka 2 do
współczynnika n1 załamania ośrodka 1 nazywany jest również
względnym współczynnikiem załamania ośrodka 2 względem
ośrodka 1 ( n21  n2 n1 ).
Płytka płasko-równoległa
Rozpatrzmy płasko-równoległą płytkę wykonaną ze szkła o
współczynniku załamania n większym niż współczynnik
załamania otaczającego ją powietrza ( n powietrza  1 ). Niech
promień świetlny pada na tę płytkę pod kątem α jak na
rysunku 16.3.
Na granicy powietrze-szkło promień światła dzieli się częściowo odbije się pod takim samym kątem α oraz częściowo
przechodzi do szkła. Promień światła w szklanej płytce
rozchodzić się będzie pod kątem β, którego wartość
wyznaczamy na podstawie wzoru Snelliusa (wzór 16.3).
Następnie ten załamany promień świetlny trafia ponownie na
granicę ośrodków szkło-powietrze pod kątem β. Również w tym
przypadku promień częściowo odbija się (pod tym samym
kątem β) oraz częściowo załamuje i przechodzi do powietrza.
Strona 92
Podstawy Fizyki II
Stosując wzór Snelliusa dla załamania na granicy szkłopowietrze (kąt padania β) otrzymujemy kąt załamania równy α.
W efekcie w wyniku przejścia wiązki światła przez płytkę
płasko-równoległą otrzymujemy promień równoległy, ale
przesunięty względem pierwotnego (rys. 16.3).
Rysunek 16.3. Przebieg promieni świetlnych przez płytkę płasko-równoległą
Całkowite wewnętrzne odbicie
Na granicy dwóch ośrodków optycznych fala częściowo odbija
się a częściowo załamuje. Względne natężenie wiązki odbitej do
padającej zależy od właściwości optycznych ośrodków oraz kąta
padania. Przy przejściu fali z ośrodka optycznie gęstszego do
ośrodka optycznie rzadszego (n1 > n2), czyli na przykład ze
szkła do powietrza, obserwuje się tzw. całkowite wewnętrzne
odbicie. Dla pewnego granicznego kąta padania otrzymujemy
kąt załamania równy π/2 a więc promienie ślizgają się po
granicy
ośrodków
nie
przechodząc
do
ośrodka
o
współczynniku n2.
Strona
93
sinαgr
sin

2

v 1 n2

v 2 n1
(16.4)
Dla kątów padania większych od kąta granicznego promień
padający ulega całkowitemu odbiciu – natężenia wiązki
padającej i odbitej są równe.
Działanie światłowodu polega na całkowitym wewnętrznym
odbijaniu promieni świetlnych rozchodzących się wewnątrz
światłowodu, co pozwala przekazywać sygnał optyczny na duże
odległości z niewielkimi stratami.
Dyspersja
Omawiając właściwości fal w poprzednich rozdziałach
wprowadziliśmy pojęcie dyspersji do opisania zależności
prędkości fazowej fali od częstotliwości. Wspominaliśmy
wówczas również, że dyspersja nie jest cechą fali a ośrodka, w
którym ta fala się rozchodzi. Zjawisko dyspersji światła w szkle
wykorzystuje się do rozszczepiania wiązki światła białego na
promienie o różnych barwach składowych. Wiązka światła
białego padając na powierzchnię pryzmatu pod kątem α1 ulega
załamaniu na granicy ośrodków powietrze-szkło.
Ponieważ w szkle wewnątrz pryzmatu światło czerwone ma
większą prędkość niż światło fioletowe, to zgodnie ze wzorem
Snelliusa, ulegać będzie załamaniu pod większym kątem niż
światło fioletowe (βfiolet < βczerwone), jak zaznaczono na
rysunku 16.4.
Tak
rozszczepione
promienie
ulegają
ponownemu załamaniu podczas opuszczania pryzmatu
(
sin 2 czerwone n1
).

sin 2 czerwone n2
Strona 94
Podstawy Fizyki II
Rysunek 16.4. Przebieg wąskiej wiązki promieni świetlnych w pryzmacie
W efekcie, po przejściu przez pryzmat o kącie łamiącym φ
(rysunek 16.4), promień światła czerwonego rozchodzić się
będzie względem wiązki padającej pod kątem mniejszym niż
dla barwy fioletowej – kąt odchylenia wiązki światła w
pryzmacie dla barwy czerwonej jest mniejszy niż dla barwy
fioletowej (  czerwone   fiolet ). Można wykazać, że kąt odchylenia
ε
zależy od współczynnika załamania pryzmatu n2 oraz kąta
łamiącego φ pryzmatu:   n  1 .
Strona
95
16.2. Optyka geometryczna
Zwierciadło
Jeżeli na drodze promieni świetlnych wychodzących ze źródła X
(przedmiot) ustawimy płaską idealnie odbijającą przeszkodę
(zwierciadło płaskie), to każdy z promieni wychodzących ze
źródła X ulegnie odbiciu od tej przeszkody, zgodnie z prawem
odbicia, czyli pod kątem równym kątowi padania (rysunek
16.5a). Promienie odbite rozchodzą się w różnych kierunkach i
nie przecinają się. Jeżeli jednak przedłużymy bieg odbitych
promieni świetlnych poza zwierciadło, to otrzymamy punkt
przecięcia Y (rysunek 16.5a) znajdujący w takiej samej
odległości od zwierciadła jak punkt X (y = –x). Punkt Y
nazywamy obrazem punktu X. Warto podkreślić, że ustawiając
źródło w punkcie Y uzyskalibyśmy taki sam przebieg promieni
jak promieni odbitych od zwierciadła. Ponieważ w punkcie Y w
rzeczywistości nie przecinają się promienie świetlne tylko ich
przedłużenie obraz powstały w wyniku odbicia promieni
świetlnych od płaskiego zwierciadła jest obrazem pozornym.
Jeżeli zamiast punktowego źródła światła płaskie zwierciadło
oświetlimy wiązką promieni równoległych padających pod
kątem prostym do zwierciadła (kąt padania θ = 0), to promienie
odbite nadal będą równolegle i poruszać się będą po tych
samych liniach (prostopadłych do zwierciadła). Jeżeli jednak
zakrzywimy powierzchnię zwierciadła, nadając mu kształt
sfery
(lub
okręgu
w
przypadku
dwuwymiarowym
przedstawionym na rysunku 16.5.b) o promieniu R, to takie
promienie równoległe przetną się w punkcie F zwanym
ogniskiem zwierciadła, znajdującym się w odległości f = R/2 od
zwierciadła. Odległość f nazywana jest ogniskową zwierciadła
(ang. focus).
Strona 96
Podstawy Fizyki II
Rysunek 16.5. Odbicie światła w zwierciadle płaskim a) oraz odbicie wiązki
równoległych promieni świetlnych w zwierciadle wklęsłym b)
Zjawisko ogniskowania promieni świetlnych jest konsekwencją
prawa odbicia – dla każdego z promieni świetlnych kąt padania
jest równy kątowi odbicia, przy czym należy pamiętać, że kąt
padania i odbicia wyznaczamy względem normalnej do
powierzchni zwierciadła. W przypadku zwierciadła sferycznego
normalną do powierzchni zwierciadła wyznacza promień R
zwierciadła jak zaznaczono na rysunku 16.5b. Jeżeli źródło
światła umieścimy w ognisku F soczewki sferycznej, to po
odbiciu otrzymamy wiązkę promieni równoległych. Efekt ten
wykorzystuje się na przykład w różnego rodzaju latarkach czy
np. reflektorach samochodowych.
Równanie zwierciadła
Rozważmy teraz powstawanie obrazu przedmiotu X
ustawionego w pewnej odległości x przed zwierciadłem
sferycznym. Obraz Y przedmiotu X powstaje w punkcie
przecięcia promieni świetlnych wychodzących z przedmiotu X.
Strona
97
Rysunek.16.6. Konstrukcja obrazu dla wklęsłego zwierciadła kulistego
Na rysunku 16.6 zaznaczono przebieg charakterystycznych
promieni świetlnych, które umożliwiają łatwą konstrukcję
obrazu:
 promień równoległy do osi zwierciadła po odbiciu
przechodzi przez ognisko F zwierciadła
 promień przechodzący przez ognisko zwierciadła po
odbiciu będzie równoległy do osi zwierciadła
 promień przechodzący przez środek O krzywizny
zwierciadła po odbiciu od zwierciadła poruszać się
będzie po tej samej linii
Oznaczając odległość od obrazu do zwierciadła jako y, na
podstawie relacji geometrycznych między odcinkami x, y i f
można napisać równanie zwierciadła:
Strona 98
Podstawy Fizyki II
1
x

1
y
y
m
x

1
f
(16.5),
gdzie f jest ogniskową zwierciadła, zaś m powiększeniem
zwierciadła.
Powiększenie m zwierciadła definiuje się jako stosunek
wielkości obrazu Y do wielkości przedmiotu X (m=Y/X) i jest
równe odległości obrazu y do odległości x przedmiotu od
zwierciadła.
Jeżeli przedmiot umieścimy w odległości mniejszej niż
ogniskowa zwierciadła to odbite promienie będą się rozbiegały
nie przecinając się. Jeżeli jednak przedłużymy linie przebiegu
promieni odbitych, to otrzymamy punkt przecięcia po drugiej
stronie zwierciadła. W takim przypadku odległość y obrazu od
zwierciadła będzie miała znak ujemny, powiększenie również
będzie ujemne a obraz taki nazywać będziemy obrazem
pozornym. Jeśli przedmiot znajduje się w ognisku zwierciadła,
obraz nie powstanie – miejsce przecięcia promieni odbitych
znajduje się w nieskończoności. Można powiedzieć, że obraz
pozorny nie może być rzutowany na ekran. Obrazy rzeczywiste
(promienie świetlne rzeczywiście się przecinają po odbiciu)
otrzymamy, gdy odległość przedmiotu od zwierciadła jest
większa niż długość ogniskowej. Taki rzeczywisty obraz
możemy rzutować na ekran (obserwować na ekranie).
Powiększony, ale odwrócony obraz uzyskamy, jeżeli przedmiot
będzie się znajdował w odległości większej niż ogniskowa, ale
mniejszej niż promień krzywizny zwierciadła. W przypadku, w
którym przedmiot znajduje się w odległości równej promieniowi
krzywizny zwierciadła, jego obraz jest odwrócony i ma taką
samą wielkość. Dla dużych odległości (większych niż promień
krzywizny zwierciadła) zwierciadło sferyczne zmniejsza i
odwraca obraz.
W przypadku zwierciadła sferycznego wypukłego ognisko jest
pozorne i w równaniu soczewki (równanie 16.5) ogniskową f
bierzemy ze znakiem minus. Obraz powstały w wyniku odbicia
Strona
99
od takiego zwierciadła również jest pozorny, pomniejszony, ale
prosty (nie jest odwrócony).
Soczewka
Jak pokazaliśmy na początku tego rozdziału bieg promieni
świetlnych może ulegać zmianie nie tylko w wyniku odbicia, ale
także w wyniku załamania na granicy ośrodków o różnych
współczynnikach
załamania.
Przykładem
zastosowania
zjawiska załamania do zmiany kierunku przebiegu promieni
świetlnych są soczewki, gdzie nie tylko mamy do czynienia z
innym optycznie materiałem, ale dodatkowo biegiem promieni
kierujemy poprzez nadanie soczewce odpowiedniego kształtu.
Ostateczny bieg promieni świetlnych zależeć będzie od
współczynnika załamania materiału, z którego wykonana jest
soczewka oraz promieni krzywizn powierzchni soczewki.
Ogniskową soczewki o promieniach krzywizny r1 (promień
krzywizny od strony padania promieni) oraz r2 (promień
krzywizny od strony wyjścia promieni) i współczynniku
załamania n materiału, z którego jest wykonana, można
wyznaczyć na postawie tzw. równania szlifierzy:
n
 1 1 
 
 1    
f  no
  r1 r2 
1
(16.6),
gdzie n0 jest współczynnikiem załamania ośrodka, w którym
rozchodzi się światło (dla powietrza przyjmujemy n0 = 1). W
równaniu tym przyjmuje się konwencję, że dla powierzchni
wypukłych promień krzywizny bierzemy ze znakiem dodatnim,
zaś dla powierzchni wklęsłych jest ujemny.
Znając ogniskową soczewki, położenie i wielkość obrazu po
przejściu promieni przez soczewkę wyznaczymy z równania
soczewki, które ma taką samą postać jak dla zwierciadła
sferycznego:
Strona 100
Podstawy Fizyki II
1
x

1
y
y
m
x

1
f
(16.7),
gdzie x jest odległością przedmiotu do osi soczewki; y –
odległością obrazu od soczewki (y > 0 jeżeli obraz znajduje się
po przeciwnej stronie soczewki w stosunku do przedmiotu); f –
ogniskową soczewki, zaś m – powiększeniem soczewki. Zasady
konstrukcji obrazu dla soczewki są podobne jak w przypadku
zwierciadła. Obraz powstaje w punkcie przecięcia się promieni.
Promienie przechodzące przez ognisko soczewki stają się
wiązką promieni równoległych, zaś wiązka promieni
równoległych po przejściu przez soczewkę ogniskuje się w jej
ognisku.
Rysunek 16.7. Przebieg promieni świetlnych przez soczewkę skupiającą.
Przykładową konstrukcję obrazu Y przedmiotu X znajdującego
się w odległości x od soczewki skupiającej dwuwypukłej o
ogniskowej f przedstawiono na rysunku 16.7. Na rysunku
zaznaczono również promienie krzywizny soczewki r1 oraz r2,
na podstawie których można wyznaczyć ogniskową soczewki
(równanie 16.6). Dla soczewki skupiającej ogniskowa f jest
Strona
101
dodatnia, dla rozpraszającej zaś ujemna. Jeżeli otrzymamy
dodatnią odległość y obrazu od soczewki oznacza to, że
powstały obraz jest rzeczywisty i powstaje po przeciwnej
stronie soczewki w stosunku do przedmiotu. Ujemna wartość y
oznacza, że obraz powstanie po tej samej stronie soczewki co
przedmiot i jest pozorny.
Dla soczewki skupiającej, jeśli przedmiot znajduje się w
odległości większej niż dwukrotna długość ogniskowej, obraz
będzie rzeczywisty i pomniejszony. Jeśli odległość przedmiotu
od soczewki zawiera się pomiędzy jedną a dwiema długościami
ogniskowej, obraz będzie rzeczywisty i powiększony. Dla
odległości przedmiotu od soczewki mniejszej niż długość
ogniskowej uzyskujemy obraz pozorny.
Aberracje
W przypadku rzeczywistych soczewek spotykamy różne
niedoskonałości nazywane aberracjami. Na przykład aberracja
chromatyczna jest związana z dyspersją. Ponieważ światło o
różnych długościach posiada różne prędkości w ośrodku
optycznym takim jak szkło czy woda, każda długość fali ulega
załamaniu pod nieco innym kątem i efektywnie ogniska dla
promieni świetlnych o różnych długościach fali nie będą się
znajdowały w tym samym punkcie. Wpływ aberracji na
powstały obraz minimalizuje się robiąc zestawy soczewek
wykonanych z materiałów o różnych współczynnikach
załamania i dobierając odpowiednie promienie krzywizny
soczewki lub jej grubość.
Urządzenia optyczne
W urządzeniach optycznych często stosuje się układy soczewek,
które jak wspomniano we wcześniejszym rozdziale często
pozwalają minimalizować wpływ aberracji, ale przede
wszystkim wpływają na właściwości optyczne układu. Jeżeli
rozpatrzymy układ dwóch cienkich soczewek znajdujących się
blisko siebie, to ogniskową takiego układu można obliczyć z
zależności:
Strona 102
Podstawy Fizyki II
1
f

1
f1

1
f2
(16.8),
gdzie f1 oraz f2 są ogniskowymi każdej z soczewek, zaś f
ogniskową układu.
Pojedyncze soczewki lub też układy soczewek charakteryzuje
się za pomocą zdolności zbierającej definiowanej jako
odwrotność ogniskowej (D = 1/f ). Zdolność zbierającą wyraża
się w dioptriach [1D=1m–1] i dla soczewki skupiającej zdolność
zbierająca jest dodatnia, zaś dla rozpraszającej ujemna.
Rysunek 16.8. Schemat budowy i przebiegu promieni świetlnych w mikroskopie
optycznym
Połączenie kilku soczewek lub też soczewek oraz zwierciadeł
pozwala stworzyć urządzenia optyczne takie jak np.
mikroskopy, lunety, obiektywy aparatów fotograficznych czy
zwykłe okulary lub soczewki korekcyjne. Przebieg promieni
świetlnych oraz powiększenie całkowite tego typu urządzeń
zależy od ogniskowych poszczególnych elementów składowych
Strona
103
oraz od względnej odległości tych elementów. Na rysunku 16.8
przedstawiony jest schemat konstrukcji obrazu w mikroskopie
optycznym. Mikroskop optyczny składa się z obiektywu oraz
okularu o ogniskowych odpowiednio fob oraz fok. Powiększenie
całkowite mikroskopu jest iloczynem powiększenia obiektywu
mob 
y ob
x ob
oraz okularu mok 
y ok
. Ponieważ przedmiot
x ok
umieszczamy blisko ogniska obiektywu, więc odległość xob
przedmiotu od obiektywu możemy zastąpić ogniskową
obiektywu fob. Długość tubusa L (odległość od obiektywu do
okularu) dobieramy następnie tak, żeby obraz obiektywu
znajdował się w pobliżu ogniska okularu (między ogniskiem a
okularem). Ponieważ długość tubusa L jest duża w stosunku do
ogniskowych okularu i obiektywu, więc odległość powstałego
obrazu yob możemy przybliżyć długością tubusa. Przy takich
założeniach również odległość przedmiotu od okularu xok może
być przybliżona ogniskową okularu fok. Do prawidłowej
obserwacji obiektu powstały obraz Y2 (yok) powinien znajdować
się
w
odległości
dobrego
widzenia
yok = d = 25cm.
Uwzględniając powyższe założenia powiększenie mikroskopu
wynosić będzie:
M  mobmok 
L d
f ob f ok
(16.9)
Z powyższego wzoru wynika, że powiększenie całkowite
mikroskopu można więc modyfikować w pewnym zakresie
poprzez zmianę długości tubusa L.
Strona 104
Podstawy Fizyki II
16.3. Polaryzacja
W poprzednich rozdziałach mówiliśmy o świetle jako fali
elektromagnetycznej. Wykazaliśmy również, że jest to fala
poprzeczna, w przypadku której zmiany pola elektrycznego i
magnetycznego odbywają się kierunku prostopadłym do
kierunku rozchodzenia się fali. Co więcej wektory natężenia
pola elektrycznego oraz indukcji pola magnetycznego są do
siebie zawsze prostopadłe. Ponieważ pole elektryczne i
magnetyczne są ze sobą ściśle powiązane skoncentrujemy się

chwilowo tylko na wektorze natężenia pola elektrycznego E .
Wiązka światła niespolaryzowane składa się z wielu fal
elektromagnetycznych rozchodzących się w tym samym
kierunku, dla których wektor natężenia pola magnetycznego
ma różny kierunek.
Rysunek 16.9. Schematyczny rysunek fali elektromagnetycznej a)
niespolaryzowanej i b) spolaryzowanej z zaznaczonym kierunkiem rozchodzenia
się fali oraz kierunkami drgań wektora natężenia pola elektrycznego
W przypadku spolaryzowanej fali elektromagnetycznej drgania
wektora natężenia pola elektrycznego odbywają się tylko w
Strona
105
jednym kierunku (polaryzacja liniowa, rysunek 16.9) lub też
kierunek tych drgań zmienia się systematycznie w czasie
(polaryzacja kołowa lub eliptyczna). Polaryzacja może odbywać
się poprzez absorpcję (filtry polaryzacyjne), przez rozproszenie
(np. na cząsteczkach powietrza w górnych warstwach
atmosfery) lub też przez odbicie niespolaryzowanej fali
elektromagnetycznej od powierzchni dielektryka (np. odbicie od
powierzchni wody). Natężenie fali spolaryzowanej liniowo po
przejściu przez idealny polaryzator zależeć będzie od natężenia
fali padającej oraz kąta φ między kierunkami polaryzacji fali
oraz polaryzatora:
I  I 0 cos 2
(16.10),
gdzie I0 jest natężeniem spolaryzowanej fali padającej. Jeżeli
np. dwa polaryzatory (polaryzator oraz analizator) ustawimy
prostopadle do siebie (φ = π/2), to uzyskamy całkowite
wygaszenie światła przechodzącego przez taki układ.
Jeżeli na idealny polaryzator pada światło niespolaryzowane,
to natężenie światła po przejściu przez polaryzator (natężenie
światła spolaryzowanego) równe jest połowie natężenia światła
padającego ( I  I 0 2 ). Wartość ta wynika z uśrednienia cos 2
dla wielu kierunków polaryzacji wiązki światła padającego.
Zjawisko zmiany natężenia światła przy przejściu przez
polaryzator wykorzystuje się na przykład w wyświetlaczach
ciekłokrystalicznych LCD. Między dwoma polaryzatorami z
płaszczyznami polaryzacji ustawionymi prostopadle do siebie
umieszczone są ciekłe kryształy. Materiały te posiadają
zdolność skręcania płaszczyzny polaryzacji. Układ taki
oświetlamy światłem niespolaryzowanym, które po przejściu
przez pierwszy z polaryzatorów staje się spolaryzowane
liniowo. Następnie ciekły kryształ skręca płaszczyznę
polaryzacji światła o π/2 tak, że w efekcie światło jest
spolaryzowane zgodnie z osią drugiego polaryzatora i
przechodzi przez niego bez straty w natężeniu (jasny piksel).
Ciekłe kryształy umieszczone w polu elektrycznym przestają
skręcać płaszczyznę polaryzacji. Oznacza to, że gdy między
polaryzatory przyłożymy napięcie światło dochodzące do
drugiego polaryzatora będzie polaryzowane prostopadle do jego
Strona 106
Podstawy Fizyki II
osi. Wówczas zgodnie ze wzorem 16.10 otrzymamy zerowe
natężenie światła przechodzącego przez taki układ (ciemny
piksel).
16.4. Interferencja
Interferencja to zjawisko nakładania się wielu fal prowadzące
do zwiększania lub zmniejszania amplitudy wypadkowej fali.
Zgodnie z zasadą superpozycji wypadkową amplitudę fali
będącej złożeniem wielu fal możemy w dowolnym punkcie
przestrzeni i w dowolnej chwili czasu określić jako sumę
amplitud pochodzących od poszczególnych fal. W szczególnym
przypadku, kiedy źródła fali są ze sobą skorelowane,
charakteryzują się tą samą częstotliwością drgań oraz stałym
w czasie przesunięciem fazowym (źródła są spójne, czyli
koherentne), układ wzmocnień (np. jasnych prążków lub
pierścieni) i wygaszeń nie zmienia się w czasie.
Strona
107
Rysunek 16.10. Interferencja fal pochodzących od dwóch wąskich szczelin
(doświadczenie Younga)
Jeżeli przed ekranem z dwiema bardzo wąskimi szczelinami
(szerokość rzędu długości fali) umieścimy źródło światła, to
zgodnie z zasadą Huygensa każda z tych szczelin stanie się
źródłem nowej wiązki światła. Co więcej źródła te będą spójne.
Rozpatrzmy obraz powstały w wyniku nałożenia się fal
pochodzących od tych źródeł na ekranie znajdującym się w
odległości L od szczelin w punkcie P widocznym pod kątem θ
względem osi szczelin, jak na rysunku 16.10. Jeżeli fale te w
punkcie P będą zgodne w fazie, to nastąpi wzmocnienie i
zwiększenie amplitudy fali, jeżeli zaś przeciwne w fazie to
będziemy mieli do czynienia z wygaszeniem. Faza fali zależy od
długości drogi optycznej między szczeliną a punktem P (r1 oraz
r2) oraz długości fali . Jeżeli różnica dróg optycznych jest
wielokrotnością długości fali, to w punkcie P nastąpi
wzmocnienie sygnału (jasne pole), a jeżeli będzie to
wielokrotność długości fali powiększona o pół długości fali, to
fale dochodzące z dwóch źródeł będą przeciwne w fazie i
wygaszą się. Ta różnica dróg optycznych   r2  r1 zależy od
odległości między szczelinami d oraz kąta θ, pod jakim widać
punkt P. Uwzględniając relacje trygonometryczne między tymi
wielkościami warunek na wzmocnienie i wygaszenie sygnału
można zapisać w postaci:
  d sin  m 
(wzmocnienie)
  d sin  m  12  
(wygaszenie)
(16.11)
(16.12)
Natężenie światła w wyniku interferencji dwóch spójnych
wiązek światła opisane będzie wzorem:
 d sin 




I  I max cos 2 
(16.13),
gdzie Imax w przypadku dwóch źródeł wynosić będzie 4I0, czyli
będzie czterokrotnie większe niż maksymalne natężenie
promieniowania pochodzącego od pojedynczego źródła. Na
ekranie będą jednak również miejsca o zerowym natężeniu i
Strona 108
Podstawy Fizyki II
efektywnie średnie natężenie światła padającego na ekran
będzie wynosiło 2I0, czyli tyle samo gdyby oświetlić ekran
dwoma niespójnymi źródłami światła o natężeniu I0 każde.
Zjawisko interferencji wykorzystuje się np. w bardzo
precyzyjnych pomiarach długości za pomocą interferometru
Michelsona. W urządzeniu tym pomiar odbywa się poprzez
przesuwanie ruchomego zwierciadła, co wpływa na różnicę dróg
optycznych pokonywanych przez dwie wiązki światła. Jeżeli
różnica ta jest równa wielokrotności długości fali to
obserwujemy wzmocnienie, jeżeli nie – to wygaszenie. Mierząc
liczbę wzmocnień i wygaszeń możemy określić o ile długości fali
zostało przesunięte zwierciadło. Interferometr Michelsona
pozwala więc mierzyć odległości z dokładnością rzędu setnych
części długości fali.
Interferencja na cienkich warstwach
Zjawisko interferencji pozwala wyjaśnić również występowanie
kolorowych obszarów na powierzchni cienkich warstw takich
jak plamy benzyny na wodzie, czy bańki mydlane. Taką cienką
warstwę płynu można traktować jak płytkę płasko-równoległą.
Rozpatrzmy więc jeszcze raz rysunek 16.3 przedstawiający bieg
promieni świetlnych w płytce płasko-równoległej. Jak
zaznaczono na rysunku promień świetlny, który dotrze do
dolnej powierzchni płytki może ją opuścić lub też odbić się od
granicy ośrodków i następnie opuścić płytkę przy górnej jej
powierzchni (promień zaznaczony linią przerywaną). Promień
taki opuszczając płytkę ulegnie załamaniu na granicy ośrodków
i rozchodzić się będzie pod kątem α, a więc będzie równoległy do
promienia odbitego bezpośrednio od górnej powierzchni.
Ponieważ oba promienie są koherentne mogą więc interferować
ze sobą. Wzmocnienie lub wygaszenie fal zależeć będzie od
różnicy długości dróg optycznych pokonanych przez oba
promienie a więc grubości płytki, jej współczynnika załamania
oraz kąta padania promieni na płytkę.
Przypomnijmy, że jeżeli współczynnik załamania ośrodka, od
granicy którego odbija się fala, jest większy niż współczynnik
załamania ośrodka, w którym fala propaguje, podczas odbicia
następuje zmiana fazy o  (zmiana fazy na przeciwną). W
Strona
109
przypadku płasko-równoległej płytki szklanej znajdującej się w
powietrzu, zmiana fazy następuje więc tylko przy odbiciu fali
świetlnej od jej górnej powierzchni, nie następuje natomiast
przy odbiciu od dolnej powierzchni płytki. Wzmocnienie
interferencyjne otrzymamy więc, gdy różnica dróg optycznych
promieni, z uwzględnieniem zmiany fazy, będzie całkowitą
wielokrotnością długości fali:
m λ  2nd cos 
λ
2
(16.14)
W powyższym wzorze m oznacza całkowitą wielokrotność
długości fali, składnik  2 został wprowadzony by uwzględnić
zmianę fazy przy odbiciu, n oznacza współczynnik załamania
płytki, d jej grubość, a  określa kierunek rozchodzenia się
promieni świetlnych w płytce (kąt załamania światła w
ośrodku). Wyrażenie 2nd cos opisuje różnicę dróg optycznych
promieni, która jest równa drodze optycznej, jaką promień
odbijający się od dolnej powierzchni płytki pokonuje w
materiale płytki (iloczyn drogi geometrycznej i współczynnika
załamania ośrodka).
Przy zadanym kącie padania i przy zadanej grubości cienkiej
warstwy (grubość ścianki bańki) warunek wzmocnienia
spełniony jest tylko dla jednej długości fali (składowa światła o
jednej barwie). Różne kolory na bańce mydlanej wynikają z
faktu, że ścianka bańki jest cieńsza u góry i grubsza na dole a
więc w każdym miejscu fala o innej długości (brawie) ulega
wzmocnieniu. Analizując różnokolorowe wzory na bańce
mydlanej należy jednak uwzględnić nie tylko zmienną grubość
ścian, ale także różny kąt padania światła wynikający ze
sferycznego (w przybliżeniu) kształtu bańki.
Zjawisko
interferencji
na
cienkich
warstwach
jest
wykorzystywane np. przy produkcji warstw antyrefleksyjnych
do przyrządów optycznych, okularów, szyb i lusterek
samochodowych. Element optyczny pokrywany jest cienką
warstwą materiału o współczynniku załamania oraz grubości
tak dobranych, aby promienie odbite od warstwy oraz od szkła
(po przejściu przez warstwę) wygaszały się dla średniej
Strona 110
Podstawy Fizyki II
długości fali światła widzialnego (dla barwy żółtej o długości
około 500nm).
16.5. Dyfrakcja
Dyfrakcja opisuje zjawisko ugięcia, czyli zmiany kierunku
rozchodzenia się fali, następujące na krawędziach przeszkód.
Należy przy tym odróżnić zmianę kierunku rozchodzenia się
fali na granicy ośrodków o różnych właściwościach optycznych
(prawo załamania) od zmiany kierunku rozchodzenia się fali na
krawędziach przeszkód (dyfrakcja). Dyfrakcja najczęściej
kojarzy się z dyfrakcją fali świetlnej, ale w ogólności dotyczy
wszystkich fal i zachodzi na każdej przeszkodzie jednakże efekt
ten jest silniejszy, gdy długość fali jest porównywalna z
wielkością przeszkody.
Rysunek 16.11. Rysunek schematyczny przebiegu promieni świetlnych w zjawisku
dyfrakcji fali na szczelinie
Strona
111
Zjawisko dyfrakcji omówimy na przykładzie szczeliny o
szerokości a, na którą pada płaska fala świetlna o długości λ.
Rozpatrzmy obraz, jaki powstanie na ekranie znajdującym się
w odległości L od tej szczeliny jak na rysunku 16.11. Podzielmy
tę szczelinę na dwie polowy o szerokości a/2. Fale rozchodzące
się z punktów A1 oraz A2 w kierunku punktu P znajdującego się
na ekranie pokonują odpowiednio drogi r1 oraz r2. Jeżeli
założymy, że odległość L od szczeliny do ekranu jest znacznie
większa niż szerokość a szczeliny (L >> a), wówczas z dobrym
przybliżeniem możemy przyjąć, że odcinki r1 oraz r2 są do siebie
równoległe a różnice ich długości możemy powiązać z kątem θ
zależnością:
a
  r2  r1  sin
(16.14)
2
Jeżeli rozpatrzymy teraz promienie r2 oraz r3 wychodzące z
drugiej pary punktów A2 oraz A3, to przy zachowaniu
powyższego warunku L >> a otrzymamy identyczną, jak w
przypadku punktów A1 oraz A2, zależność na różnicę dróg
optycznych
a
δ  r3  r2  sin .
2
Jeżeli
ta
różnica
dróg
optycznych δ będzie wynosiła λ/2, to w punkcie P widocznym
pod kątem θ otrzymamy wygaszenie.
a
2
sin 

(16.15)
2
Podobne rozważania można przeprowadzić dzieląc szerokość
szczeliny a na dowolną całkowitą liczbę odcinków. W ogólności
warunek na wygaszenie dyfrakcyjne ma postać:

a
sin  m , m  1,  2,  3, ...
Pomiędzy minimami na ekranie
maksima dyfrakcyjne. Natężenie
wzmocnienia dane jest zależnością:
Strona 112
obserwować
światła w
(16.16)
będziemy
punktach
Podstawy Fizyki II
 
 
 sin  a sin   
I  I max 

  a sin 

 

2
(16.17),
gdzie Imax jest natężeniem światła w punkcie P0 znajdującym
się na ekranie na osi szczeliny. Z powyższego wzoru wynika, że
jeżeli szerokość szczeliny jest równa długości fali, to nie
będziemy obserwować wygaszenia i ekran będzie oświetlony
prawie jednorodnie – możliwe jest ugięcie światła o kąt /2, bo
sin 

a
dla
a
równy
będzie
jedności.
Wraz
ze
zwiększaniem się szerokości szczeliny zerowe maksimum
(oświetlony obszar na wprost szczeliny) staje się coraz węższe a
natężenie światła w tym obszarze rośnie, zaś maksima
wyższych rzędów zbliżają się do maksimum zerowego
(widoczne są pod mniejszym kątem θ ) oraz ich natężenie
maleje.
Przypomnijmy sobie teraz, że opisując zjawisko interferencji
rozpatrywaliśmy wąskie szczeliny o szerokości rzędu długości
fali. Okazuje się, że przy odpowiednim doborze odległości
między szczelinami oraz szerokości samych szczelin na ekranie
można zaobserwować zarówno efekty interferencyjne jak i
dyfrakcyjne - widoczne będą prążki interferencyjne, których
intensywność modulowana jest zgodnie z zasadami dyfrakcji.
Zdolność rozdzielcza
Zjawisko dyfrakcji obserwuje się nie tylko dla pojedynczej
szczeliny, ale także dla układu wielu szczelin umieszczonych w
regularnych odstępach oraz dla otworu kołowego. Takim
otworem kołowym może być również okrągła soczewka, przez
którą przechodzi światło. Zdolność rozdzielcza takiej soczewki
określa minimalną odległość między obiektami (źródłami
światła), przy której możliwe jest rozdzielenie (rozróżnienie)
tych obiektów.
Dyfrakcyjne ograniczenia rozdzielczości zależą od dwóch
czynników – rozmiaru szczeliny (otworu) i długości fali.
Strona
113
Rozmiar otworu elementu optycznego w przyrządach
optycznych nazywamy aperturą. Im mniejsza apertura, tym
silniejsze efekty dyfrakcyjne. Z wcześniejszych rozważań
wiemy również, że kąt ugięcia fali w zjawisku dyfrakcji jest
proporcjonalny do długości fali. Do ilościowego określenia
zdolności rozdzielczej wprowadza się tak zwane kryterium
Rayleigha. Definiuje ono minimalną odległość kątową , przy
której jesteśmy w stanie rozróżnić dwa położone blisko siebie
obiekty:
sin  1.22
λ
a
(16.18)
W powyższym wzorze a oznacza aperturę elementu optycznego.
Osiągnięcie większej rozdzielczości optycznej (zmniejszenie
kąta ) zatem można osiągnąć albo poprzez stosowanie
przyrządów o dużej aperturze – stąd w teleskopach
astronomicznych stosuje się wielkie zwierciadła – albo użycie
fali o mniejszej długości. To drugie rozwiązanie stosowane jest
w czytnikach płyt o wysokiej gęstości zapisu, tak zwanych
BLU-RAY. Zamiast tradycyjnego lasera emitującego światło o
długości powyżej 600nm zastosowano w nich laser o barwie
niebieskiej i długości fali około 400nm.
Warto wspomnieć, że zjawisko dyfrakcyjnego ugięcia fali
wykorzystuje się również w tak zwanych soczewkach Fresnela.
Rolę szczelin pełnią w tym przypadku na ogół odpowiednio
wyprofilowane w materiale rowki. Soczewki tego typu,
stosowane m.in. w rzutnikach, latarniach morskich i
reflektorach są tańsze i lżejsze od tradycyjnych szklanych
soczewek.
Strona 114
Podstawy Fizyki II
17
Szczególna teoria
względności
W tym rozdziale:
 Postulaty szczególnej teorii względności
 Transformacja Lorentza
 Konsekwencje przekształceń Lorentza
 Dynamika relatywistyczna
Strona
115
17.1. Szczególna teoria
względności.
Teoria względności, stworzona przez Alberta Einsteina,
przedstawia zasady transformowania, czyli przekształcania,
wyników pomiarów pomiędzy poruszającymi się względem
siebie układami. W naszym wykładzie omówimy założenia i
wnioski płynące z tzw. szczególnej teorii względności, która
ogranicza się do inercjalnych układów odniesienia.
Przypomnijmy, że inercjalne układy odniesienia to takie, w
których wszystkie ciała poruszają się bez przyspieszenia, jeżeli
nie doznają działania sił zewnętrznych.
Transformacja Galileusza
Rozpatrzmy na początek dwa układy odniesienia – nieruchomy
związany z obserwatorem stojącym na peronie (układ O) oraz
układ związany z obserwatorem znajdującym się w pociągu
poruszającym się z prędkością v względem peronu, w kierunku
x (układ O′). Załóżmy, że w chwili początkowej oba układy
pokrywają się, czyli obaj obserwatorzy znajdują się tuż obok
siebie oraz osie układów współrzędnych w obu układach mają
ten sam kierunek i zwrot. W pewnej chwili t obserwator stojący
na peronie (układ O) zauważa, że w semaforze stojącym przy
torach zapala się czerwone światło. Stwierdza również, że
semafor znajduje się w punkcie o współrzędnych (x, y, z)
względem niego. Obserwator znajdujący się w pociągu (układ
O′) fakt zapalenia się czerwonego światła semafora zarejestruje
w tym samym momencie t ′ = t. Jego zdaniem współrzędne y ′
oraz z ′ tego semafora są takie same jakie podał obserwator
stojący na peronie (y ′ = y oraz z ′ = z ), ale współrzędna x ′ jest
mniejsza, bowiem w czasie t ′ zdążył się już zbliżyć do tego
semafora o odcinek vt, czyli x'  x  v t .
Strona 116
Podstawy Fizyki II
Powyższe relacje pomiędzy układami O i O′ stanowią tzw.
transformację
Galileusza,
czyli
zestaw
przekształceń
współrzędnych przestrzennych i czasu z jednego układu
odniesienia do innego poruszającego się w kierunku osi x
ruchem jednostajnym prostoliniowym z prędkością v względem
pierwszego układu:
t'  t
x'  x  v t
y'  y
z'  z
(17.1)
Rozważmy obiekt poruszający się w kierunku osi x z pewną
dx
prędkością u 
wyznaczoną w nieruchomym układzie
dt
odniesienia O. Prędkość tego samego obiektu w układzie O′,
poruszającym się z prędkością v w kierunku osi x, definiuje się
dx 
jako u  
, ale ponieważ x'  x  v t więc otrzymujemy:
dt
u 
d
dx
x  v t  
 v u  v
dt
dt
u u  v
(17.2),
Otrzymaliśmy w ten sposób prawo składania prędkości. Jako
przykład rozpatrzmy samochód, którego prędkość względem
fotoradaru stojącego na poboczu (nieruchomy układu
odniesienia O) wynosi u = 60km/h. Rower poruszający się z
prędkością v = 20km/h w tym samym kierunku możemy
traktować jako ruchomy układ odniesienia c poruszający się z
prędkością v względem układu O. Wówczas prędkość u ′
samochodu w układzie związanym z rowerem (prędkość
samochodu
względem
roweru)
wynosić
będzie

.
u  u  v  40km/h
Rozpatrzmy teraz obiekt poruszający się w kierunku osi x z
pewnym przyspieszeniem i opiszmy jego ruch w okładzie O
oraz O′. Zgodnie z transformacją Galileusza przyspieszenie
Strona
117
obiektu w obu układach doniesienia O i O′ będzie miało taką
samą wartość:
a 
du t  du t   v  du t 


a
dt
dt
dt
(17.3)
Transformacja Galileusza jest słuszna dla wszystkich zjawisk,
w których mamy do czynienia z prędkościami (prędkościami
obiektów albo prędkościami względnymi układów odniesienia)
znacznie mniejszymi od prędkości światła. Tak więc wszystkie
zagadnienia klasycznej mechaniki Newtonowskiej mogą być
opisywane za pomocą transformacji Galileusza. W przypadku
prędkości zbliżonych do prędkości światła należy zastosować
szczególną teorię względności oraz transformację Lorentza do
opisu tego samego zdarzenia w dwóch różnych układach
odniesienia.
Postulaty szczególnej teorii względności
U podstaw szczególnej teorii względności leżą dwa postulaty:
o
Dla wszystkich obserwatorów w inercjalnych
układach odniesienia prawa fizyki są takie same i żaden
z układów nie jest wyróżniony.
o
We
wszystkich
inercjalnych
układach
odniesienia i we wszystkich kierunkach światło w
próżni rozchodzi się z taką samą prędkością c.
Zasada względności Einsteina
Warto zaznaczyć w tym miejscu, że pierwszy postulat
szczególnej teorii względności wyraża tzw. zasadę względności
Einsteina. Według klasycznej zasady względności Galileusza w
inercjalnych układach odniesienia poruszających się względem
siebie ze stałymi prędkościami równania Newtona muszą być
niezmiennicze
a
więc
niemożliwe
jest
wyróżnienie
któregokolwiek z tych układów odniesienia za pomocą
eksperymentów mechanicznych. Einstein rozszerzył tę zasadę
względności na wszystkie prawa fizyki (nie tylko mechaniki,
ale także elektromagnetyzmu i optyki). Możemy więc
Strona 118
Podstawy Fizyki II
powiedzieć, że według zasady względności Einsteina nie
istnieje eksperyment fizyczny, który pozwoliłby wyróżnić
którykolwiek z inercjalnych układów odniesienia.
W dalszej części tego rozdziału omówimy wnioski wynikające z
postulatów szczególnej teorii względności.
17.2. Transformacja
Lorentza
Uwzględniając postulaty szczególnej teorii względności
transformacja współrzędnych przestrzennych oraz czasu
między dwoma inercjalnymi układami odniesienia odbywa się
w inny sposób niż według Galileusza. Rozważmy, podobnie jak
w
poprzednim
przykładzie
transformacji
Galileusza,
nieruchomy układ odniesienia O (współrzędne x, y, z, t ), na
przykład peron, oraz drugi układ odniesienia O′ (współrzędne
primowane x ′, y ′, z ′, t ′ ), na przykład pociąg, poruszającym się
względem układu O z prędkością v skierowaną zgodnie z osią x.
Transformację Lorentza przekształcającą współrzędne x, y, z, t
na współrzędne x ′, y ′, z ′, t ′ podamy bez wyprowadzenia:
x'   x  v t 
 y'  y

1

z'  z
v2

1 2
t'   t  v x 
c
2

 c

(17.4),
gdzie c – jest prędkością światła.
W transformacji Lorentza występuje czynnik γ (tzw. czynnik
lorentzowski), który dla niedużych prędkości, znacznie
mniejszych niż prędkość światła jest z dobrym przybliżeniem
równy jedności ( v  c   1 ). Wówczas, dla małych
prędkości, transformacja Lorentza zamienia się w klasyczną
Strona
119
transformację Galileusza. Oznacza to, że transformacja
Galileusza jest przybliżeniem transformacji Lorentza dla
małych prędkości.
Niezmienniki transformacji Lorentza
Zauważmy, że w transformacji Lorentza przekształceniu ulega
nie tylko współrzędna x ′ (kierunek, w którym poruszają się
układy względem siebie), ale także czas t ′. W przypadku
transformacji Galileusza czas był absolutny, czyli biegł tak
samo, niezależnie od układu odniesienia – czas był
niezmiennikiem transformacji Galileusza. Z transformacji
Lorentza wynika natomiast, że czas przekształca się podobnie
jak współrzędne przestrzenne i w rzeczywistości jest czwartą
współrzędną w
czterowymiarowej przestrzeni zwanej
czasoprzestrzenią. Opisując więc jakieś zdarzenie należy podać
zarówno współrzędne przestrzenne (x, y, z ) jak i współrzędną
czasową tego zdarzenia (ct ). W konsekwencji odstęp między
zdarzeniami zależeć będzie od tego, w jakiej odległości od siebie
nastąpiły te zdarzenia, przy czym odległość tę musimy określić
zarówno w czasie jak i przestrzeni.
Długość czterowektora określającego odległość (w przestrzeni i
czasie) między dwoma zdarzeniami nazywamy interwałem
czasoprzestrzennym
( s 2  x 2  y 2  z 2  c 2 t 2 ).
Można wykazać, że przy przejściu z układu O do O′ kwadrat
interwału czasoprzestrzennego jest wielkością stałą, a więc
interwał
czasoprzestrzenny
Δs
jest
niezmiennikiem
transformacji Lorentza:
x 2  y 2  z 2  c 2 t 2 
 x  2  y  2  z  2  c 2 t  2  const.
(17.5)
Przypomnijmy, że zgodnie z postulatami Einsteina w każdym
układzie odniesienia i w każdym kierunku prędkość
rozchodzenia się światła jest stała i wynosi c. Oznacza to, że
również prędkość światła c jest niezmiennikiem transformacji
Lorentza. Oprócz interwału czasoprzestrzennego i prędkości
Strona 120
Podstawy Fizyki II
światła niezmiennikami są również masa spoczynkowa m0,
energia spoczynkowa E0=m0c2 oraz ładunek elektryczny q.
Opisując różnice pomiędzy transformacją Galileusza i Lorentza
podkreślaliśmy, że w teorii względności czas i położenie
(odległość) mają charakter względny. Transformacja Lorentza
przedstawia inne, niż klasyczne, pojmowanie czasu,
równoczesności zdarzeń, inne dodawanie prędkości czy pomiar
odległości.
Konsekwencje
przekształceń
Lorentza
przedstawimy bardziej szczegółowo w dalszej części tego
rozdziału.
17.3. Konsekwencje
przekształceń Lorentza
Względność czasu, dylatacja czasu
Wyobraźmy sobie obserwatora A znajdującego się w pociągu
poruszającym się z dużą prędkością v względem peronu, na
którym stoi obserwator B. Obserwator A wykonuje
eksperyment, w którym świeci pionowo w górę (zdarzenie 1) w
zwierciadło znajdujące się na suficie a następnie mierzy czas od
błysku do momentu dotarcia wiązki świetlnej do detektora,
który trzyma w ręce (zdarzenie 2) (rysunek 17.1).
Jeżeli odległość od obserwatora do zwierciadła wynosi D, to
zmierzony czas Δt0 jest czasem, jaki potrzebuje światło, żeby
pokonać drogę 2D (w górę i w dół) z prędkością światła c
( Δt 0 
2D
c
).
Dla
obserwatora
B
stojącego
na
peronie
eksperyment ten będzie wyglądał trochę inaczej, gdyż cały
pociąg porusza się z prędkością v względem niego. Jego
zdaniem promień świetlny przebędzie drogę 2L, a nie 2D,
zanim dotrze do detektora. Dłuższa droga 2L wynika z faktu,
że zarówno zwierciadło jak i detektor „uciekają” od źródła
Strona
121
światła z prędkością v, jak na rysunku 17.1. W efekcie,
uwzględniając postulat niezmienniczości prędkości światła,
obserwator B zmierzy dłuższy czas Δt.
Rysunek 17.1. Schemat pomiaru czasu w układzie nieruchomym i w układzie
poruszającym się z prędkością v.
Powyższy eksperyment pokazuje nam, że czas w układzie
nieruchomym płynie szybciej niż w tym poruszającym się z
prędkością v a odstępy czasu między zdarzeniami stają się
dłuższe, co nazywa się dylatacją czasu:
Δt   Δt 0

1
1
v2
(17.6),
c2
gdzie Δt jest czasem, jaki upłynął miedzy zdarzeniami 1 i 2 w
układzie nieruchomym związanym z obserwatorem B stojącym
na peronie, zaś Δt0 oznacza czas między zdarzeniami 1 i 2 w
poruszającym się z prędkością v układzie obserwatora A.
Powyższy eksperyment myślowy pokazuje jak ważne jest w
fizyce relatywistycznej określenie nie tylko odległości czasowej
między zdarzeniami, ale również odległości w przestrzeni
Strona 122
Podstawy Fizyki II
między tymi zdarzeniami. Dla obserwatora A oba zdarzenia
(błysk oraz detekcja) występują w tym samym punkcie
przestrzeni i wówczas o odstępie między nimi decyduje
wyłącznie odległość na osi czasu. W drugim przypadku, dla
obserwatora B zdarzenia błysku światła i jego detekcji są
odległe także w przestrzeni o odległość v Δt, co wpływa na
zarejestrowaną odległość w czasie między tymi zdarzeniami.
Rozpatrzymy dwóch bliźniaków, z których jeden wyrusza w
podróż z prędkością zbliżoną do prędkości światła a drugi
pozostaje na nieruchomej planecie. Bliźniak lecący w rakiecie
porusza się względem tego na planecie, więc zgodnie z
transformacją Lorentza jego czas płynie wolniej. Ale również
bliźniak na planecie porusza się względem tego znajdującego
się w rakiecie a więc zdaniem bliźniaka w rakiecie to zegary na
planecie chodzą wolniej. Zagadnienie to jest nazywane
paradoksem bliźniąt. Po to, żeby sprawdzić, który z bliźniaków
ma rację bliźniak w rakiecie musiałby zawrócić, ale wtedy
układy przestają być inercjalne i wnioski szczególnej teorii
względności nie obowiązują – szczególna teoria względności i
transformacja Lorentza dotyczą tylko układów inercjalnych
poruszających się bez przyspieszenia, ze stałymi prędkościami
względem siebie. Układ odniesienia bliźniaka znajdującego się
na planecie pozostaje inercjalny a więc to bliźniak z planety ma
rację i w efekcie powracającego kosmonautę będzie witał
„starszy” bliźniak.
Istnieje szereg eksperymentów potwierdzających istnienie
zjawiska dylatacji. W górnych warstwach atmosfery, na
wysokości rzędu kilku kilometrów powstają nietrwałe cząstki
zwane mionami. Średni czas życia tych cząstek, czyli odstęp
czasowy między ich powstaniem i rozpadem, mierzony w
układzie związanym z tymi cząstkami, czyli w tzw. układzie
własnym, wynosi ok. 2.2 μs. W tym czasie miony, nawet
poruszając się z prędkością światła, pokonałyby odległość rzędu
600 m – jak więc jest możliwe, że miony powstałe na wysokości
rzędu 20 km są rejestrowane także w laboratoriach na
powierzchni Ziemi? W układzie związanym z Ziemią, względem
którego miony poruszają się z prędkością zbliżoną do prędkości
światła, średni czas życia mionów ulega dylatacji i wynosi ok.
Strona
123
64 μs. W takim czasie obiekt poruszający się z prędkością
zbliżoną do prędkości światła jest w stanie pokonać odległość
ponad 20 km, a więc miony zdążają dolecieć do Ziemi zanim się
rozpadną. Te samo zjawisko można również opisać w układzie
związanym z poruszającym się mionem. Jak
już
powiedzieliśmy w układzie tym, czyli układzie własnym, czas
życia mionów wynosi średnio 2.2 μs. Jak więc jest możliwe, że
miony są w stanie dotrzeć do detektorów znajdujących się na
powierzchni Ziemi? Okazuje się, że względem takiego
poruszającego się z dużą prędkością układu odniesienia
związanego z mionem grubość atmosfery ziemskiej musi być
znacznie mniejsza, rzędu kilkuset metrów. Zagadnienie
skrócenia (kontrakcji) długości omówimy w kolejnych
rozdziałach.
Względność równoczesności
Kolejną konsekwencją transformacji Lorentza jest również inne
rozumienie jednoczesności zdarzeń.
Przeprowadźmy eksperyment myślowy. Obserwator A znajduje
się w środku nieruchomego pociągu stojącego na peronie.
Pociąg ten mija drugi identyczny pociąg poruszający się z
prędkością v, w środku którego stoi obserwator B. Gdy oba
pociągi zrównają się zapala się jednocześnie czerwone światło
na początku i niebieskie na końcu pociągu. Do obserwatora B,
nieruchomo stojącego na peronie, oba błyski - czerwony i
niebieski - dotrą równocześnie, gdyż każda z fal świetlnych ma
do pokonania tę samą odległość. Tak więc zdaniem obserwatora
B oba błyski nastąpiły jednocześnie. Tymczasem według
obserwatora A pierwszy nastąpił błysk czerwony a później
błysk niebieski. Wynika to z faktu, że obserwator A zbliża się
do czerwonej oraz oddala od niebieskiej żarówki z prędkością v.
Skrócenie długości
Rozpatrzmy tego samego obserwatora A znajdującego się w
pociągu poruszającym się z prędkością v względem peronu.
Strona 124
Podstawy Fizyki II
Obserwator ten chcąc zmierzyć długość peronu musi zmierzyć
odległość między zdarzeniami - minięcie początku oraz minięcie
końca peronu. Według obserwatora A oba te zdarzenia
następują w tym samym punkcie jego układu odniesienia.
Jeżeli obserwator A zmierzy odległość w czasie Δt0, to jego
zdaniem długość peronu wynosić będzie L  v Δt 0 (prędkość
obserwatora A względem peronu wynosi v). Obserwator B
stojący na końcu peronu zmierzył długość peronu L0 oraz
stwierdził, że czas przejazdu pociągu wraz z obserwatorem A
wyniósł
Δt 
L0
v
a
więc
L 0  v Δt . Stosunek długości
zmierzonych przez obu obserwatorów z uwzględnieniem relacji
17.6 zapisujemy:
Δt 0
L v Δt 0
1



L 0 v Δt  Δt 0 

1
1
v2
c2
(17.7)
1
L  L0

Z powyższej relacji wynika tzw. skrócenie długości obiektów w
ruchu. Obiekty poruszające się z dużymi prędkościami dla
obserwatora nieruchomego wydają się krótsze niż zmierzone w
ich układzie własnym. Pomiar długości peronu wykonany przez
obserwatora A poruszającego się względem peronu daje wartość
mniejszą niż ta zmierzona przez obserwatora B znajdującego
się na peronie. Podobnie długość pociągu zmierzona przez
obserwatora B stojącego na peronie będzie mniejsza niż ta
zmierzona przez obserwatora A znajdującego się wewnątrz
pociągu. Dochodzimy w ten sposób do paradoksu – z punktu
widzenia obserwatora B pociąg z pewnością zmieści się na
długości peronu, zaś według obserwatora A peron jest za krótki.
Paradoks ten jest konsekwencją innego postrzegania
równoczesności przez obserwatorów poruszających się
względem siebie.
Strona
125
Dodawanie prędkości
Z transformacji Lorentza wynika inny niż klasyczny,
Galileuszowy, sposób dodawania (transformowania) prędkości.
Rozpatrzmy układ O′ poruszający się względem układu O z
prędkością v w kierunku osi x. Jeżeli prędkość pewnego obiektu
wzdłuż osi x w układzie O′ wnosi ux′, to w układzie O jego
prędkość ux można wyznaczyć z zależności:
ux 
u x  v
u v
1  x2
c
(17.8)
Jako przykład rozpatrzmy rakietę lecącą z prędkością 0.7c,
która wystrzeliła pocisk z prędkością ux′ = 0.8c względem
rakiety. Prędkość pocisku względem nieruchomego układu
odniesienia O możemy wyznaczyć ze wzoru 17.8:
u x 
0,8c  0,7c
1.5c

 0,962c  c
0,8c  0,7c ) 1.56
1
2
(17.9)
c
Zauważmy, że, mimo iż obie prędkości (rakiety i pocisku) są
zbliżone do prędkości światła, prędkość pocisku względem
Ziemi nie przekracza tej krytycznej wartości. Co więcej,
zgodnie ze wzorem 17.8, jeżeli prędkość jednego z obiektów jest
równa c to suma prędkości (prędkość względna) też jest
równa c. Efekt ten został eksperymentalnie potwierdzony w
1881r. w eksperymencie Michelsona – Morleya, uznawanym za
jeden
z
najważniejszych
eksperymentów
fizyki.
W
eksperymencie tym wykazano, że prędkość światła jest taka
sama w każdym kierunku, niezależnie od pory dnia i roku, a
więc niezależnie od względnego ruchu detektora znajdującego
się na powierzchni Ziemi względem Słońca.
Strona 126
Podstawy Fizyki II
17.4. Dynamika
relatywistyczna
Pęd i masa
Jednym z postulatów szczególnej teorii względności jest
obowiązywanie tych samych praw fizycznych we wszystkich
inercjalnych układach odniesienia, tzn., że wszystkie inercjalne
układy odniesienia są równoważne. Okazuje się, że aby
spełniona była zasada zachowania pędu w przypadku
relatywistycznych prędkości (prędkości zbliżonych do prędkości
światła) niezbędne jest inne zdefiniowanie pędu ciała o masie
m0 oraz prędkości v :


p  mv


p   m0 v

p

m0 v
1
(17.10)
v2
c2
Masa m0 nazywana jest masą spoczynkową ciała, zaś masa m
nazywana jest masą relatywistyczną:
m
m0
1
v2
(17.11)
c2
Masa relatywistyczna przy małych prędkościach ruchu jest
bliska, co do wartości, masie spoczynkowej ciała, gdyż wówczas
czynnik lorentzowski jest bliski jedności. Jak pokazano na
rysunku 17.2.a czynnik Lorentza dąży do nieskończoności przy
prędkościach dążących do prędkości światła c. Oznacza to, że
również relatywistyczna masa ciała o masie spoczynkowej
różnej od zera będzie dążyła do nieskończoności a więc ciała
Strona
127
takiego nie da się rozpędzić do prędkości światła. Prędkość
światła jest więc prędkością graniczną, którą osiągają tylko
obiekty o zerowej masie spoczynkowej – fotony.
Na rysunku 17.2.b przedstawiono zależność pędu ciała o masie
spoczynkowej m od prędkości v. Według klasycznej
newtonowskiej definicji pędu, przedstawionej w rozdziale 3,
pęd ciała rośnie jednostajnie w funkcji prędkości ciała
niezależnie od wartości tej prędkości. Ta klasyczna definicja
jest przybliżeniem relatywistycznej definicji pędu dla niskich
prędkości. Przy prędkościach zbliżonych do prędkości światła
klasyczne podejście staje się błędne a pęd dąży do
nieskończoności.
Rysunek 17.2. Zależność czynnika Lorentza  a) oraz pędu relatywistycznego b)
od prędkości
Energia całkowita, energia kinetyczna
Ze szczególnej teorii względności wynika słynna zależność
Einsteina:
E  mc 2
(17.12)
E   m 0c 
2
m 0c 2
1
Strona 128
v2
c2
(17.13)
Podstawy Fizyki II
Równanie to ukazuje proporcjonalność pomiędzy energią
całkowitą obiektu a jego masą relatywistyczną. Możliwe jest
przekształcanie masy na energię i odwrotnie - masa i energia
są równoważne. Powyższa zależność pomiędzy masą a energią
została potwierdzona eksperymentalnie na przykład w
bilansach energetycznych reakcji jądrowych czy zjawisku
tworzenia par elektron-pozyton.
Z równania 17.13 wynika, że także ciało pozostające w
spoczynku posiadać będzie energię E 0  m0c 2 nazywaną
energią spoczynkową. Ponieważ energia całkowita ciała jest
sumą energii spoczynkowej oraz energii kinetycznej, więc:
Relatywistyczną energię kinetyczną ciała wyznaczamy jako
różnicę całkowitej energii relatywistycznej tego ciała oraz jego
energii spoczynkowej:
Ek  E  E0
Ek 
m 0c 2
1
v
2
 m0c 2    1m0c 2
(17.14)
c2
Dla małych wartości prędkości v ciała powyższą zależność
można
wyrazić
przybliżonym
wzorem

E k  m0c 2 1 

1v2
2c2
m v2

, co oznacza, że klasyczna
  m0c 2  0
2

definicja energii kinetycznej jest przybliżeniem dla małych
prędkości relatywistycznej energii kinetycznej.
Jeżeli zależność 17.13 podniesiemy do kwadratu i
uwzględnimy relację 17.10, to po przekształceniach
otrzymujemy związek między relatywistyczną energią
całkowitą ciała E oraz jego relatywistycznym pędem p:
E 2  m0c 2   pc 2 (17.15)
2
Jeżeli rozpatrzymy ciało o zerowej masie spoczynkowej m0 = 0,
takie jak cząstka promieniowania elektromagnetycznego –
foton – to powyższa zależność upraszcza się do postaci:
Strona
129
E  pc
E
p
c
(17.16)
Jak pokażemy w dalszych rozdziałach, energia fotonów zależy
od częstotliwości ν promieniowania elektromagnetycznego:
E  h  h
c
,

gdzie
h
jest
stałą
Plancka
i
wynosi
2
m
h

6
.626

10
kg. Stąd otrzymujemy, że pęd fotonu jest
s

34
odwrotnie proporcjonalny do długości fali promieniowania i
wynosi:
p
Strona 130
h

(17.17)
Podstawy Fizyki II
18
Fizyka kwantowa
W tym rozdziale:
o
Prawa promieniowania cieplnego,
ciało doskonale czarne
o
Kwantowa natura promieniowania, efekt
fotoelektryczny i efekt Comptona
o
Dualizm korpuskularno – falowy, hipoteza
de Brogliea
Strona
131
18.1. Prawa promieniowania
Promieniowanie cieplne, to promieniowanie, które emitowane
jest
w
wyniku
ruchu
cieplnego
cząstek
materii.
Promieniowanie takie wysyłane jest przez każde ciało w
temperaturze powyżej zera bezwzględnego (0K) i odbywa się
kosztem energii kinetycznej cząstek tego ciała. Nazwa
promieniowanie cieplne odnosi się do sposobu wytwarzania
promieniowania elektromagnetycznego a nie do długości
emitowanych fal. Zgodnie z klasyczną fizyką falową
niejednostajny ruch ładunku elektrycznego jest źródłem
promieniowania elektromagnetycznego. Drgania termiczne
również wywołują przyspieszenie elektronów w materii a więc
stają się źródłem fal elektromagnetycznych, które nazywamy
promieniowaniem cieplnym. Odwrotne do zjawiska emisji,
zjawisko pochłaniania fal promieniowania cieplnego, polega na
wzbudzaniu drgań elektronów przez fale elektromagnetyczne
padające na powierzchnię ciała. Warto podkreślić, że w
zależności od temperatury obiektu emitowane promieniowanie
cieplne charakteryzować się będzie różnymi długościami.
Widmo promieniowania ciała rozgrzanego do bardzo wysokiej
temperatury, które świeci na czerwono czy nawet na biało,
obejmuje zakresie fal widzialnych a ciała o niższej
temperaturze, których promieniowanie odczuwamy tylko za
pomocą receptorów cieplnych emitują głównie fale z zakresu
podczerwieni.
Zdolność emisyjna i absorpcyjna
Ilość energii emitowanej przez ciało w postaci promieniowania
cieplnego zależy od temperatury T tego ciała oraz
częstotliwości tego promieniowania - zdolność emisyjna ciała E
jest więc funkcją częstotliwości oraz temperatury, E (ν,T ).
Zdolność emisyjna ciała jest równa energii emitowanej przez
jednostkową powierzchnię ciała w jednostce czasu w postaci
promieniowania elektromagnetycznego z zakresu częstotliwości
Strona 132
Podstawy Fizyki II
(ν, ν+dν). Zdolność absorpcyjna ciała (zdolność pochłaniania)
również zależy od jego temperatury oraz częstotliwości
padającego promieniowania ― A (ν,T ). Na ogół jednak tylko
część energii promieniowania padającego na ciało jest
pochłaniana a część jest odbijana. Część energii odbitej od ciała
określamy za pomocą współczynnika odbicia R (ν,T ) (od
angielskiego – reflected), który podobnie jak współczynnik
absorpcji (zdolność absorpcyjna) zależy od temperatury oraz
częstotliwości promieniowania.
Energia promieniowania padającego na powierzchnię ciała jest
częściowo pochłaniana a pozostała część jest odbijana, tak że:
Suma współczynników absorpcji A(ν,T) i odbicia R(ν,T) jest dla
dowolnej powierzchni równa jedności, dla każdej częstotliwości
padającego promieniowania oraz dla każdej temperatury:
A,T   R ,T   1 (18.1)
Ciało doskonale czarne
Ciało doskonale czarne w każdej temperaturze w całości
pochłania docierające do niego promieniowanie niezależnie od
jego częstotliwości, jednocześnie nic nie odbijając: A  ,T   1
Zgodnie z powyższą definicją dla ciała doskonale czarnego
A = 1 zaś R = 0, niezależnie od temperatury i częstotliwości.
Wzorcem ciała doskonale czarnego jest wnęka z małym
otworem. Jeżeli jakiś promień wpadnie do otworu, to po kilku
odbiciach od ścian wewnętrznych wnęki zostanie całkowicie
przez nią pochłonięty. Tak więc możemy powiedzieć, że
powierzchnia
otworu
jest
całkowicie
pochłaniająca
promieniowanie niezależnie od jego częstotliwości. Warto
zaznaczyć, że kształt czy wielkość wnęki nie ma przy tym
istotnego znaczenia. Pewnym przybliżeniem ciała doskonale
czarnego mogą być również okna w budynku. Patrząc z
zewnątrz widzimy, że okna budynku są ciemne niezależnie od
koloru ścian pomieszczeń znajdujących się za nimi
Strona
133
Prawo Kirchhoffa
W otaczającym nas świecie obserwujemy pewną równowagę
między zdolnością absorpcyjną oraz emisyjną, tzn. ciała z
jednej strony pochłaniają część docierającego do nich
promieniowania elektromagnetycznego, ale równocześnie
emitują część energii wewnętrznej również w formie
promieniowania elektromagnetycznego. Gdyby tak nie było
temperatura ciała pochłaniającego promieniowanie powinna
ciągle wzrastać. Ponieważ obiekty rzeczywiste osiągają
równowagę, więc wnioskujemy, że jeżeli jakieś ciało
charakteryzuje się dużą zdolnością emisyjną, to również będzie
bardzo dobrze absorbowało padające promieniowanie
elektromagnetyczne. Powyższą obserwację zapisujemy w
postaci tzw. prawa Kirchhoffa promieniowania cieplnego:
Stosunek zdolności emisyjnej do zdolności absorpcyjnej jest dla
wszystkich powierzchni, wszystkich ciał, jednakową uniwersalną
funkcją częstotliwości oraz temperatury.
E ,T 
 ε ,T 
A ,T 
(18.2)
Aby znaleźć funkcję ε (ν,T ) zapiszmy prawo Kirchhoffa dla
ciała doskonale czarnego. Ponieważ, jak już wspominaliśmy,
ciało doskonale czarne pochłania całkowicie padające
promieniowanie,
niezależnie
od
częstotliwości
oraz
temperatury, czyli jego zdolność absorpcyjna jest równa
jedności (A (ν,T ) = 1), to na podstawie równania 18.2
otrzymamy, że ta uniwersalna funkcja ε (ν,T ) w istocie jest
zdolnością emisyjną E (ν,T ) ciała doskonale czarnego. Tak więc
stosunek zdolności emisyjnej do absorpcyjnej dla dowolnego
ciała jest równy zdolności emisyjnej ciała doskonale czarnego.
Prawo Stefana-Boltzmanna
Jak już wspominaliśmy, w temperaturze wyższej od zera
bezwzględnego każde ciało emituje promieniowanie cieplne w
postaci fal elektromagnetycznych z pewnego zakresu długości
Strona 134
Podstawy Fizyki II
fal. Metalowy pręt umieszczony w ognisku jest źródłem ciepła,
które odczuwamy na naszej skórze za sprawą promieniowania
z zakresu podczerwieni, które emituje ten pręt. Taki metalowy
pręt można również tak rozgrzać, podnieść jego temperaturę do
takiej wartości, że zacznie on świecić. Nie oznacza to jednak, że
na naszej skórze nie będziemy już czuli ciepła. Taki „rozgrzany
do białości” pręt będzie źródłem promieniowania zarówno z
zakresu fal widzialnych jak również podczerwieni.
Rysunek 18.1. Widmo promieniowania ciała doskonale czarnego w różnych
temperaturach (schematycznie)
Na rysunku 18.1 przedstawione są widma promieniowania
ciała doskonale czarnego w różnych temperaturach. Widzimy,
że moc promieniowania, a więc energia emitowana w jednostce
czasu, dla ciała doskonale czarnego ma różną wartość dla
różnych długości fali λ. Gdybyśmy chcieli obliczyć całkowitą
ilość energii jaką ciało o temperaturze T emituje w postaci
promieniowania przez jednostkową powierzchnię w jednostce
Strona
135
czasu, a więc całkowitą zdolność emisyjną ciała ET (T ),
musielibyśmy scałkować zdolność emisyjną ciała E (ν,T ) po
wszystkich częstotliwościach E T T    E  ,T  d .
Dla ciała doskonale czarnego całkowita zdolność emisyjna E(T)
w temperaturze T jest proporcjonalna do czwartej potęgi
temperatury, co stanowi treść prawa Stefana-Boltzmanna:
E T T   σ T 4
(18.3),
gdzie stała proporcjonalności σ = 5.67·10 W/(m2·K4).
-8
Prawo przesunięć Wiena
Opisywaliśmy już w tym rozdziale, że wraz z temperaturą
zmienia się skład widma promieniowania ciała. Oznacza to, że
wraz ze wzrostem temperatury zmienia się widmo
promieniowania. Jak pokazano schematycznie na rysunku 18.1
maksimum zdolności emisyjnej ciała (największa wartość mocy
promieniowania) wraz ze wzrostem temperatury przesuwa się
w kierunku fal krótszych.
Relację między długością fali max odpowiadającej maksimum
zdolności emisyjnej promieniowania a temperaturą T tego ciała
opisuje prawo przesunięć Wiena:
maxT  b  const. (18.4),
gdzie stała b = 0.2898·10-2 m·K.
Zgodnie z powyższym wzorem rozgrzewane ciało początkowo
świeci na czerwono a wraz ze wzrostem temperatury pojawiają
się składowe widma o większej częstotliwości, najpierw barwy
czerwonej potem żółtej, zielonej, niebieskiej i fioletowej aż
wreszcie widmo promieniowania obejmuje wszystkie długości
fali i ciało emituje światło białe. Należy przy tym zaznaczyć, że
dla ciała (np. metalu) rozgrzanego „do białości” maksimum
promieniowania wciąż znajdować się może w zakresie
podczerwieni. Przykładem może być tutaj typowa żarówka, w
której metaliczny żarnik (najczęściej stop wolframu)
Strona 136
Podstawy Fizyki II
rozgrzewany jest „do białości”. Maksimum promieniowania
żarówki przypada jednak na zakres podczerwieni i dlatego
żarówka produkuje głównie ciepło (około 97% energii) i tylko
około 3% energii emitowane jest w postaci światła. W
przypadku nowoczesnych źródeł światła opartych na diodach
LED prawie cała energia dostarczona do diody zostaje
zamieniona na promieniowanie z zakresu widzialnego, a więc
takie samo natężenie światła możemy uzyskać znacznie
mniejszym kosztem energetycznym. Szczegóły budowy i
działania diody LED omówimy w dalszej części skryptu.
18.2. Kwantowa natura
promieniowania
Przedstawione powyżej prawa Kirchhoffa, Stefana-Boltzmanna
oraz Wiena opisują podstawowe właściwości promieniowania
cieplnego. Okazało się, że stan wiedzy fizyków pod koniec XIX
wieku nie pozwalał wyjaśnić wszystkich tych zjawisk
fizycznych za pomocą klasycznej falowej teorii promieniowania.
Na przykład model Rayleigha-Jeansa opisuje promieniowanie
cieplne ciała doskonale czarnego za pomocą wnęki, w której
istnieje układ fal stojących o różnych kierunkach i różnych
częstotliwościach. Zgodnie z zasadą ekwipartycji energii na
każdą z fal stojących przypada średnia energia równa kBT, a
energia wypromieniowana przez wnękę (ciało doskonale
czarne) zależeć będzie od liczby takich fal stojących. Można
udowodnić, że liczba fal stojących jest proporcjonalna do
kwadratu częstotliwości, więc dla fal krótkich energia
emitowanej fali powinna dążyć do nieskończoności. Tymczasem
jak wynika z danych eksperymentalnych (Rysunek 18.1)
energia emitowanego promieniowania w granicy krótkofalowej
dąży do zera. Ta drastyczna rozbieżność klasycznych modeli
falowych z wynikami eksperymentalnymi w zakresie fal
krótkich
(ultrafioletowych)
nazywana
jest
katastrofą
ultrafioletową. Teoria Rayleigha-Jeansa przewiduje również
nieskończoną zdolność emisyjną ciała doskonale czarnego w
Strona
137
każdej temperaturze, podczas gdy zgodnie z omawianym
wcześniej prawem Stefana-Boltzmanna jest ona proporcjonalna
do czwartej potęgi temperatury.
Kwanty
Nową teorię promieniowania ciała doskonale czarnego
zaproponował Max Planck. Stworzył on najpierw wzór, który
prawidłowo modeluje widmo promieniowania ciała doskonale
czarnego a dopiero potem starał się znaleźć model fizyczny,
który mógłby uzasadnić taki wzór. Założył, że źródłem
promieniowania są drgające ładunki, które zachowują się jak
oscylatory liniowe. Okazało się jednak, że aby wyjaśnić wyniki
eksperymentalne trzeba przyjąć założenie sprzeczne z
klasyczną fizyką – energia tych oscylatorów może przyjmować
tylko wartości będące wielokrotnością porcji energii ΔE
(kwantu energii):
ΔE  h 
(18.5),
gdzie ν jest częstotliwością drgań oscylatorów harmonicznych
(częstotliwość promieniowania elektromagnetycznego), zaś h
jest stałą Plancka:
h  6.626 1034 J s  4.136 1015 eV s
(18.6).
Kwantowy oscylator posiadać więc będzie energię równą:
E  n h
(18.7),
gdzie n jest liczbą naturalną nazywaną liczbą kwantową. Jego
energia jest skwantowana.
Zmiana energii takiego oscylatora następować będzie w wyniku
pochłonięcia lub oddania porcji energii (kwantu energii).
Prędkość fazową fali definiowaliśmy jako iloczyn długości fali
oraz częstotliwości tej fali (wzór 14.7), więc w przypadku fali
elektromagnetycznej

c
.

Wówczas
energię
promieniowania elektromagnetycznego zapisujemy:
Strona 138
kwantu
Podstawy Fizyki II
ΔE  h  h
c

(18.8).
Zasada korespondencji
Warto zaznaczyć tutaj, że skoro energie atomów w
cząsteczkach są kwantowane, to również energie wszystkich
otaczających nas obiektów (również nas samych) są
kwantowane. Jednakże ze względu na wartość stałej Plancka
nie zauważamy tego kwantowania naszymi zmysłami. Można
by to porównać do wciągania po schodach ciała na pewną
wysokość. Jeżeli liczba schodów jest mała wysokość każdego
schodka musi być duża i wówczas skokowa zmiana energii
potencjalnej ciała będzie wyraźnie widoczna. Jeżeli natomiast
rozpatrzymy bardzo dużą liczbę schodków to ich wysokość może
być na tyle mała, że nie będziemy zauważać skokowej zmiany
energii a jedynie ciągły jednostajny wzrost energii. Mechanika
kwantowa w odniesieniu do obiektów makroskopowych nie stoi
zatem w sprzeczności z mechaniką klasyczną. Stanowi to treść
jednej z podstawowych zasad fizyki kwantowej ― zasady
korespondencji, czyli odpowiedniości wprowadzonej przez
Nielsa Bohra:
Kwantowy opis zjawiska staje się zbieżny z opisem klasycznym
dla dużych wartości liczb kwantowych.
Koncepcja kwantowania energii, mimo że pozwalała
prawidłowo opisywać zjawiska promieniowania cieplnego, była
początkowo trudna do zaakceptowania przez fizyków. Wkrótce
okazało się jednak, że pozwala wyjaśnić zjawiska takie jak
efekt
fotoelektryczny
zewnętrzny,
efekt
Comptona,
powstawanie promieniowania rentgenowskiego, których
klasyczna fizyka falowa nie była w stanie wyjaśnić.
Efekt fotoelektryczny zewnętrzny
Rozpatrzmy lampę składającą się z dwóch metalowych elektrod
umieszczonych w próżni w szklanej bańce. Przeprowadzone
eksperymenty pokazują, że oświetlenie jednej z nich
(fotokatody) światłem o odpowiednio dużej częstotliwości
Strona
139
powoduje emisję elektronów (fotoelektronów) z tej elektrody na
zewnątrz metalu. Zjawisko to nosi nazwę efektu
fotoelektrycznego
zewnętrznego.
Jeżeli
zwiększamy
częstotliwość padającego promieniowania, to wrasta również
energia kinetyczna fotoelektronów. Jeżeli polaryzacja napięcia
między elektrodami jest taka, że fotoelektrony są odpychane od
anody, to przy pewnej wartości napięcia, Uh = -V0, nazywanego
napięciem hamowania, żaden fotoelektron nie jest w stanie
dotrzeć do anody i natężenie prądu w obwodzie zewnętrznym
spada do zera (Rysunek 18.2). Jeżeli przy danym oświetleniu
powstają fotoelektrony, to gdy zwiększamy natężenie światła
(I2 > I1), obserwujemy również zwiększenie natężenia prądu
fotoelektronów docierających do anody (prądu anodowego).
Jednocześnie dla ustalonej częstotliwości padającego światła,
niezależnie od jego natężenia, otrzymujemy to samo napięcie
hamujące: ―V0 (Rysunek 18.2a).
Rysunek 18.2. Efekt fotoelektryczny zewnętrzny. Schematyczne wykresy a)
natężenia prądu anodowego od napięcia polaryzacyjnego dla dwóch różnych
natężeń światła I2>I1; b) natężenia prądu anodowego od napięcia polaryzacyjnego
dla dwóch różnych częstotliwości światła ν2 > ν1; c) wartości napięcia hamowania
od częstotliwości padającej fali świetlnej
Jak już wspominaliśmy, dla większej częstotliwość światła
padającego na fotokatodę, czyli dla mniejszej długość fali,
zwiększa się również wartość napięcia hamowania:
 2  1  V 2  V1 (Rysunek 18.2.b). Zależność wartości
napięcia hamowania U 0  V 0
jest przy tym liniową funkcją
częstotliwości  padającego promieniowania, jak pokazano na
Strona 140
Podstawy Fizyki II
wykresie 18.2.c. Z wykresu tego wynika, że dla wyższej
częstotliwości padającego światła powstałe fotoelektrony mają
większą energię kinetyczną, a więc również energia niesiona
przez kwanty światła zależy liniowo od częstotliwości tego
światła. Okazuje się przy tym, że istnieje graniczna wartość
częstotliwości 0, poniżej której nie obserwuje się już prądu
anodowego, czyli elektrony nie są wybijane z powierzchni
katody. Należy również podkreślić, że emisja fotoelektronów w
zjawisku fotoelektrycznym zewnętrznym odbywa się bez
opóźnienia – jeżeli tylko energia kwantów światła jest
wystarczająca, żeby wyemitować fotoelektrony, to emisja ta
następuje natychmiast, bez opóźnienia.
Klasyczna fizyka falowa nie była w stanie prawidłowo wyjaśnić
powyższych wyników eksperymentalnych. Na przykład według
klasycznej fizyki falowej nie powinno być granicznej
częstotliwości 0 a więc światło o dowolnej częstotliwości
powinno wybijać elektrony z fotokatody. Nawet jeżeli fala o
niskiej częstotliwości niesie niewielką porcję energii, to po
odpowiednio długim czasie, a nie natychmiast, naświetlania do
katody powinna zostać dostarczona energia wystarczająca do
emisji elektronów. Klasyczna fizyka falowa nie była również w
stanie wyjaśnić efektu przedstawionego na wykresie 18.2.a – to
samo napięcie hamowania przy różnych natężeniach
padającego światła. Wedle klasycznej fizyki falowej bowiem,
jeżeli zwiększymy natężenie padającego światła, to zwiększyć
się również powinna ilość energii docierającej do katody w
jednostce czasu, a więc w efekcie energia wybitych z katody
elektronów powinna być większa.
Wyjaśnienie efektu fotoelektrycznego zewnętrznego zostało
przedstawione przez Einsteina, za co zresztą został
uhonorowany nagrodą Komisji Noblowskiej. Einstein w swoim
rozumowaniu rozwinął zaproponowaną przez Plancka teorię
kwantów energii. Przypomnijmy, że według modelu Plancka
fale elektromagnetyczne powstają w wyniku drgań ładunków
(oscylatorów),
przy
czym
energia
oscylatorów
jest
wielokrotnością jednostkowej porcji energii hν. Einstein
założył, że skoro energia takich oscylatorów jest skwantowana i
zmienia się skokowo, więc również wymiana energii odbywa się
Strona
141
kwantowo i powstałe w ten sposób promieniowanie
elektromagnetyczne ma skwantowaną energię. Okazuje się
więc, że światło można rozpatrywać nie tylko klasycznie jako
falę o częstotliwości ν ale także jako strumień kwantów
promieniowania o energii hν. Taki kwant promieniowania
elektromagnetycznego, mający charakter korpuskuły (cząstki)
został nazwany fotonem.
Według fizyki kwantowej, jeżeli foton niosący porcję energii
zderzy się z elektronem katody to przekazuje mu całą swoją
energię. Tak więc każdy pojedynczy foton może wybić z
materiału tylko jeden elektron. Dlatego też natężenie prądu na
anodzie powinno być proporcjonalne do natężenia oświetlenia,
czyli liczby fotonów padających na jednostkę oświetlonej
powierzchni katody w jednostce czasu (Rysunek 18.2.a).
Wartość energii, jaką niesie pojedynczy foton (hν) zależy od
częstotliwości drgań oscylatora, który był jego źródłem. Energia
pojedynczego fotonu zostaje przekazana pojedynczemu
elektronowi z katody. Jeżeli dostarczona energia wystarcza,
żeby pokonać siły wiążące elektron w materiale, elektron
opuszcza powierzchnię katody. Taka minimalna porcja energii
potrzebna do uwolnienia elektronu z materiału nazywana jest
pracą wyjścia φ i jest właściwością badanego materiału.
Nadmiar energii fotonu zamieniany jest w energię kinetyczną
wybitego elektronu.
Zasadę zachowania energii dla efektu fotoelektrycznego
zewnętrznego możemy zapisać:
h     E kin
(18.9),
Maksymalną energię kinetyczną jaką może uzyskać wybity
elektron (przy danej częstotliwości ν padającego światła)
możemy wyznaczyć na podstawie napięcia hamowania U0 –
jeżeli przyłożymy napięcie hamujące o wartości U0, to prąd na
anodzie wynosi zero a więc żaden z elektronów nie ma
wystarczającej energii aby pokonać barierę potencjału U0:
E kinmax  eU 0
Strona 142
(18.10)
Podstawy Fizyki II
Jeżeli energia padającego fotonu jest mniejsza niż praca
wyjścia elektronów z powierzchni materiału, to elektron nie
opuści materiału. Oznacza to również, że według kwantowego
opisu zjawiska fotoelektrycznego istnieje graniczna wartość
częstotliwości 0 promieniowania elektromagnetycznego,
poniżej której zjawisko nie zachodzi:
h 0  
(18.11)
Efekt Comptona
Efekt Comptona jest zjawiskiem, którego również nie daje się
wyjaśnić na gruncie klasycznej fizyki falowej. W efekcie tym w
wyniku
rozproszenia
promieniowania
rentgenowskiego
(promieniowanie elektromagnetyczne o długościach fali rzędu
nanometrów) na elektronach atomowych materiału obserwuje
się falę rozproszoną o długości większej niż fali padającej.
Wedle klasycznej fizyki falowej długość fali promieniowania
rozproszonego powinna być taka sama, gdyż elektrony
pochłaniając falę padającą odbierają od niej energię, ale tę
samą energię następnie emitują. Nawet gdyby w klasycznym
falowym wyjaśnieniu tego zjawiska uwzględnić efekty
dopplerowskie, to powinniśmy obserwować zmianę długości
fali, ale zarówno ją zwiększające jak i zmniejszające.
Dokładniejsze pomiary tego zjawiska przeprowadzone przez
Comptona pokazały, że dla danego materiału zmiana długości
fali zależy od kierunku rozpraszania fali. Wyjaśnienie tego
efektu możliwe było tylko na gruncie fizyki kwantowej.
Compton założył, że pojedyncze kwanty światła (fotony)
zderzają się sprężyście z elektronami materiału przekazując im
swoją energię i pęd zgodnie z zasadą zachowania energii oraz
zasadą zachowania pędu (Rysunek 18.3).
Zasadę zachowania energii w tym przypadku możemy zapisać:
h 0 m 0 c 2  h 1  m c 2
(18.12),
gdzie ν0 oraz ν1 oznaczają odpowiednio częstotliwość
promieniowania padającego oraz rozproszonego; m0 jest masą
Strona
143
spoczynkową elektronu, na którym rozpraszane jest
promieniowanie rentgenowskie zaś m oznacza masę
relatywistyczną tego elektronu po rozproszeniu (elektron
odbity).
Rysunek 18.3. Schematyczne przedstawienie efektu Comptona
Zasadę zachowania pędu dla kierunków x oraz y (zgodnie z
oznaczeniami przyjętymi na Rysunku 18.3) można zapisać:
h 0
c
0

h 1
h 1
c
c
cos  m v cos (kierunek x)
sin  m v sin (kierunek y)
(18.13)
(18.14)
Równania 18.12-18.14 stanowią układ równań, z którego
wyznaczamy długość fali rozproszonego promieniowania λ1 w
zależności od kąta rozproszenia θ:
Strona 144
Podstawy Fizyki II
 1  0 
h
m0c
1  cos   (18.15)
Zakładając więc sprężyste zderzenie kwantu światła z
elektronem Compton otrzymał zależność zgodną z wynikami
eksperymentów – większą długość fali rozproszonej oraz
zależność tej długości od kąta rozpraszania wiązki światła.
Poniżej przedstawimy w skrócie procedurę wyznaczania równania
18.15. Przepiszmy najpierw równania 18.13 i 18.14 do postaci:
h 0
c

h 1
c
(18.16)
cos  m v cos
h 1
sin  m v sin
c
(18.17)
Jeżeli powyższe równania podniesiemy do kwadratu, dodamy
stronami i uporządkujemy uwzględniając jedynkę trygonometryczną
( sin2  cos 2  1 ) otrzymamy:
2
2
h  0 1
 h 0   h 1 
cos  m 2 v 2

 
 2
c2
 c   c 
2
(18.18)
Pomnóżmy te równanie przez c2:
m 2 v 2 c 2  h 2 0 2  h 2 0 2  2h 2 0 1cos
(18.19)
i porównajmy z równaniem 18.12 uporządkowanym i podniesionym
obustronnie do kwadratu:
m 2 c 4  h 2  0  1 2  2m0c 2 h 0  1   m0 2 c 4
(18.20)
Odejmijmy następnie stronami od równania 18.20 równanie 18.19:

m 2 c 4 1 

v2 
  m0 2 c 4  2h 2 0 1 1  cosθ   2m0c 2 h 0  1 
2 
c 
(18.21)
Z definicji masy relatywistycznej (równanie 17.11) wynika:

m 2 1 

v2 
  m0 2
c 2 
(18.22)
Strona
145
A więc równość 18.21 można zapisać w postaci:
m0c 2  0  1   h 0 1 1  cos 
(18.23)
a po podzieleniu obu stron przez m0 c  0 1 otrzymamy:
c c
h
1  cos  (18.24),
 
1  0 m0c
co jest równoważne równaniu 18.15.
Promieniowanie rentgenowskie
Promieniowanie
rentgenowskie
powstaje
w
wyniku
oddziaływania z materią (metalową tarczą) elektronów
rozpędzonych dużą różnicą potencjałów. Oddziaływanie to
odbywa się na dwa sposoby. Po pierwsze rozpędzony elektron
może, uderzając w atom, spowodować zmianę jego konfiguracji
elektronowej, wywołać przeskok elektronu na wyższy poziom
energetyczny. Zagadnienie to szczegółowo omawiać będziemy w
dalszej części skryptu opisując budowę atomu. W tej chwili
zaznaczymy tylko, że taka konfiguracja elektronowa jest
niekorzystna energetycznie, taki wzbudzony stan jest stanem
metastabilnym. Atom wracając do stanu podstawowego emituje
fotony o ściśle określonej energii odpowiadającej różnicy
poziomów energetycznych w atomie – widmo charakterystyczne na Rysunku 18.4.
Oprócz zderzeń rozpędzonych elektronów z elektronami w
atomach, również dodatnio naładowane jądra atomów
przyciągać je będą siłą kulombowską. W efekcie takiego
oddziaływania z pojedynczym jądrem atomowym zakrzywieniu
ulega tor, po jakim porusza się elektron a sam elektron doznaje
przyspieszenia dośrodkowego. Elektron poruszający się ruchem
przyspieszonym pod wpływem przyspieszenia dośrodkowego
emituje falę elektromagnetyczną (kwant energii – foton) tracąc
w ten sposób energię i zmniejszając swoją prędkość. W ten
sposób pojedynczy elektron może oddziaływać wielokrotnie z
jądrami atomowymi tracąc za każdym razem różne porcje
energii i emitując fale o różnych długościach. Powstałe w ten
sposób promieniowanie nazywa się promieniowaniem
Strona 146
Podstawy Fizyki II
hamowania i charakteryzuje się ciągłym widmem (Rysunek
18.4).
Rysunek 18.4. Schematyczne widmo promieniowania rentgenowskiego
Przeprowadzane eksperymenty pokazują, że ciągłe widmo
istnieje tylko powyżej pewnej długości fali λmin. Istnienia tej
tzw. krótkofalowej granicy promieniowania rentgenowskiego
nie potrafiła wyjaśnić klasyczna fizyka falowa. W szczególności
nie dawało się wyjaśnić dlaczego λmin nie zależy od materiału
bombardowanego elektronami.
Wyjaśnienie istnienia krótkofalowej granicy promieniowania
rentgenowskiego możliwe jest tylko na gruncie fizyki
kwantowej. W opisie kwantowym ta graniczna długość fali λmin
odpowiada przypadkowi, gdy rozpędzony elektron zostanie
całkowicie wyhamowany przez jedno jądro, a więc gdy powstały
w ten sposób foton będzie miał energię równą energii
kinetycznej rozpędzonego elektronu:
Strona
147
eU  h max 
min 
hc
hc
min
(18.25).
eU
18.3. Dualizm korpuskularnofalowy
Przedstawione powyżej zjawiska takie jak efekt fotoelektryczny
zewnętrzny, efekt Comptona czy też widmo promieniowania
rentgenowskiego z krótkofalową granicą promieniowania,
wskazują, że promieniowanie elektromagnetyczne należy
traktować jak strumień fotonów. Z drugiej strony omawialiśmy
już wcześniej zjawiska i efekty typowo falowe takie jak
dyfrakcja czy interferencja. Oznacza to, że:
Światło (promieniowanie elektromagnetyczne) posiada naturę
dualną: korpuskularną i falową (korpuskularno–falową).
Procesy rozchodzenia się promieniowania, zjawiska takie jak
dyfrakcja czy interferencja, ujawniają właściwości falowe
promieniowania i mogą być wyjaśnione na gruncie klasycznej
fizyki falowej. W zjawiskach oddziaływania promieniowania
elektromagnetycznego z materią tzn. emisji (ciało doskonale
czarne), absorpcji (efekt fotoelektryczny zewnętrzny) i
rozpraszaniu (efekt Comptona), ujawniają się z kolei
właściwości
korpuskularne
promieniowania
elektromagnetycznego i zjawiska te mogą być wyjaśnione tylko na
gruncie fizyki kwantowej.
Można
również
powiedzieć,
że
właściwości
falowe
promieniowania elektromagnetycznego dominują przy długich
falach (np. fale radiowe). Dla fal radiowych bowiem energia
pojedynczego fotonu jest znacznie mniejsza niż próg detekcji
nawet najczulszych urządzeń pomiarowych. Dla częstotliwości
fali np. 2.5MHz energia fotonu wynosić będzie około 10―8 eV, co
Strona 148
Podstawy Fizyki II
jest wielkością 1010 razy mniejszą niż czułość najlepszych
urządzeń pomiarowych. W przypadku promieniowania z
zakresu światła widzialnego możemy obserwować zarówno
właściwości korpuskularne (np. efekt fotoelektryczny
zewnętrzny) jak i falowe (np. interferencja). Natomiast w
przypadku promieniowania krótkofalowego dominujące są
zjawiska ujawniające korpuskularną naturę promieniowania.
Na przykład krótkofalowe promieniowanie rentgenowskie
ulega
efektowi
Comptona.
Ale
również
dla
tego
promieniowania możliwe jest zaobserwowanie właściwości
falowych – jeżeli jako siatkę dyfrakcyjną wykorzystamy atomy
w sieci krystalicznej (odległości rzędu 10―10 m) to
zaobserwujemy charakterystyczne dla fal zjawisko dyfrakcji.
Hipoteza de Brogliea
Hipoteza de Brogliea mówi, że nie tylko promieniowanie
elektromagnetyczne ma dualną naturę korpuskularno-falową,
ale również obiekty materialne mają dualną naturę
korpuskularno-falową — oprócz właściwości korpuskularnych
posiadają także właściwości falowe.
Długość fali, którą możemy przypisać cząstkom kwantowym
(fale materii), zależy od pędu tak samo jak w przypadku
promieniowania elektromagnetycznego:
λ
h
(18.26),
p
gdzie h jest stałą Plancka, zaś p oznacza pęd cząstki.
Częstotliwość ν fal de Brogliea powiązana jest z energią cząstek
kwantowych w taki sam sposób jak dla fotonów czyli:
E  h  h
c

(18.27),
Z hipotezy de Brogliea wynika, że wszystkim cząstkom
mikroskopowym można przypisać fale o długości określonej
przez wzór 18.26. Okazuje się jednak, że ze względu na wartość
Strona
149
stałej Plancka właściwości falowe obiektów makroskopowych
są niemierzalne. Na przykład długość fali de Borglie’a piłki o
masie m = 0.2 kg lecącej z prędkością v = 120 km/h ≈ 33 m/s
będzie wynosić około 10-34 m. A więc, żeby np. zaobserwować
falowe zjawisko dyfrakcji dla takiej piłki tenisowej
musielibyśmy dysponować siatką dyfrakcyjną o stałej około
10-34 m (tego samego rzędu, co długość padającej fali), podczas
gdy odległości międzyatomowe wynoszą około10-10 m a więc są
24 rzędy wielkości za duże! Właściwości falowe materii
obserwuje się natomiast dla obiektów mikroskopowych takich
jak elektrony, neutrony czy też atomy helu lub ich jądra, czyli
cząstki α.
Właściwości falowe rozpędzonych elektronów wykorzystuje się
np. w mikroskopach elektronowych. Zmieniając pęd elektronów
można wpływać na długość fal de Brogliea elektronów. Fale o
mniejszych długościach niż te z zakresu światła widzialnego
pozwalają obserwować obiekty mikroświata z dokładnością
większą niż dostępna w przypadku mikroskopów optycznych.
Strona 150
Podstawy Fizyki II
19
Fizyka atomu i
fizyka jądra
atomowego
W tym rozdziale:
Budowa atomu
Model Bohra atomu wodoru
Budowa jądra atomowego
Rozpady promieniotwórcze
Rozszczepienie jądra i reaktor jądrowy
Synteza jądrowa
Strona
151
19.1. Budowa atomu
Pojęcie atomu, jako podstawowego, niepodzielnego elementu
budującego materię wywodzi się z czasów starożytnych i do
filozofii zachodniej zostało wprowadzone w 4 wieku p.n.e. przez
Demokryta. Koncepcja atomu powróciła w XVII i XVIII wieku
wraz z intensywnym rozwojem chemii. Zdefiniowanie pojęcia
pierwiastka chemicznego i wykazanie, że związki chemiczne
składają się z atomów różnych pierwiastków zawdzięczamy
pracom Lavoisiera i Daltona. Dopiero na przełomie XIX i XX
wieku eksperymenty Thomsona i Rutherforda pokazały, że
uważane wcześniej za niepodzielne atomy w istocie składają się
z jądra atomowego, obdarzonego ładunkiem dodatnim, oraz
elektronów posiadających ładunek ujemny. Późniejsze
doświadczenia pokazały, że także jądro atomowe można
podzielić na mniejsze elementy – na protony o dodatnim
ładunku i obojętne neutrony. Współcześnie wiemy, że również
te cząstki można podzielić na jeszcze mniejsze fragmenty,
zwane kwarkami. Istnienie kwarków i występujących pomiędzy
nimi oddziaływań wydaje się w pełni wyjaśniać budowę
materii. Zagadnienia te wykraczają jednak poza ramy
niniejszego skryptu. W poniższym rozdziale ograniczymy się
więc do przedstawienia uproszczonego modelu budowy atomu,
jądra atomowego oraz przemian jądrowych, określanych
również jako zjawiska promieniotwórczości.
Elektron
W rozdziale poświęconym elektrostatyce wspominaliśmy już o
istnieniu elementarnego ładunku elektrycznego – ładunku
elektronu. Naładowanie ciała ładunkiem ujemnym oznacza
występowanie w nim nadmiaru elektronów, naładowanie
ładunkiem dodatnim – występowanie niedoboru elektronów.
Masę i ładunek elektronu pozwoliły wyznaczyć dwa
eksperymenty; Thomsona z 1897 roku i Milikana z 1909 roku.
W pierwszym eksperymencie równoległą wiązkę elektronów
skierowano w obszar skrzyżowanych pól elektrycznego i
magnetycznego.
Ładunek
poruszający
się
w
polu
Strona 152
Podstawy Fizyki II
magnetycznym doznaje odchylenia na skutek działania siły
Lorentza. Jeżeli przeprowadzimy pomiar tego odchylenia przy
wyłączonym i włączonym dodatkowo polu elektrycznym o
znanej wartości natężenia, to możliwe będzie wyznaczenie
stosunku ładunku elektronu q (e) do jego masy m:
q m  1.7 1011 C kg . W drugim eksperymencie drobne
kropelki oleju, naładowane poprzez jonizację promieniowaniem
rentgenowskim, były rozpylane wewnątrz komory wyposażonej
w parę elektrod wytwarzających pole elektryczne. Okazało się
wówczas, że ładunek elektryczny znajdujący się na kropelkach
przybiera wartości będące wielokrotnością pewnej wielkości,
którą nazywano ładunkiem elementarnym, ładunkiem
elektronu e:
e  1.602 1019 C
(19.1)
Znając ładunek elektronu i stosunek ładunku elektronu do jego
masy możemy wyznaczyć jego masę:
me  9.109 10 31 kg
(19.2)
W doświadczeniu Thomsona poza wiązką elektronów, badana
była również wiązka zjonizowanych atomów wodoru H+. Takie
zjonizowane atomy wodoru niosą ładunek elektryczny równy
ładunkowi elektronu, ale o przeciwnym znaku i nazywane są
protonami. Stosunek q/m wyznaczony na podstawie pomiaru
odchylenia toru lotu w polu magnetycznym wykazał, że masa
protonu jest około 2000 razy (1840 razy) większa niż masa
elektronu.
Modele budowy atomu Thomsona i Rutherforda
Opierając się na wynikach doświadczeń polegających na
odchylaniu naładowanych cząstek w polu magnetycznym,
Thomson zaproponował model budowy atomu oparty na
następujących założeniach:
Masa i ładunek dodatni są rozłożone równomiernie w całej
objętości atomu, tworząc „chmurę” ładunku dodatniego.
Elektrony znajdują się wewnątrz tej „chmury”
dodatniego i również są rozmieszczone równomiernie.
ładunku
Strona
153
Model ten, nazywany również żartobliwie modelem „rodzynek
w cieście” dobrze wyjaśniał obojętność elektryczną atomu. Taki
model materii zbudowanej z „kulek” o różnej gęstości i
promieniu, odpowiadających różnym pierwiastkom był
stosunkowo prosty i obrazowy i z tych względów zyskał
początkowo dużą popularność.
Rysunek 19.1. Schematyczne przedstawienie modeli budowy atomu: Thomsona (z
lewej) i Rutherforda (z prawej).
Nowych wskazówek dotyczących budowy atomu dostarczył
eksperyment
przeprowadzony
przez
współpracowników
Rutherforda – Geigera i Marsdena. W eksperymencie tym w
kierunku cienkiej złotej folii kierowano wiązkę ciężkich
cząstek, naładowanych dodatnio. Były to zjonizowane
(pozbawione elektronów) jądra helu He2+, określane również
mianem cząstek . Cząstki takie mają w przybliżeniu 4 razy
większą masę, niż zjonizowany atom wodoru H+ i dwa razy
większy ładunek. Okazało się, że w eksperymencie tym
zarejestrowano nie tylko cząstki które przeszły przez złotą
folię, lub nieznacznie zmieniły tor lotu, ale również cząstki
rozproszone na folii w różnych kierunkach, w tym cząstki
„powracające” w kierunku źródła. Okazało się również, że część
cząstek przelatuje przez złotą folię nie doznając żadnego
oddziaływania z atomami złota Wynik taki stał w wyraźnej
sprzeczności z modelem Thomsona „rodzynek w cieście”. Wedle
tego modelu bowiem tak równomiernie rozłożona w przestrzeni
chmura ładunku dodatniego, zobojętniona przez znajdujące się
wewnątrz elektrony, nie mogłaby wywrzeć na ciężkie cząstki
Strona 154
Podstawy Fizyki II
dodatnie dostatecznego oddziaływania, żeby zmienić kierunek
ich lotu na przeciwny – należałoby się raczej spodziewać
stopniowego wytracania energii przez cząstki poruszające się
w materii. Odbicie wsteczne wskazywało tymczasem na
zderzenie cząstek z niewielkim, ale masywnym obiektem o
ładunku dodatnim. Na podstawie wykonanych pomiarów
Rutherford oszacował rozmiar tego masywnego obiektu, który
został nazwany jądrem atomowym. Okazało się, że rozmiar ten
jest około 105 razy mniejszy niż rozmiar całego atomu. A wiec
atomy są w istocie bardzo „puste” – odległość pomiędzy
elektronami, tworzącymi „powłokę” atomu a jego jądrem jest
wielokrotnie większa niż rozmiar samego jądra.
Model atomu wynikający z doświadczeń Rutherforda,
nazywany również modelem planetarnym, możemy opisać
następująco:
Większość masy atomu i jego ładunek dodatni skupione są w
jądrze atomowym.
Elektrony krążą dookoła jądra na
przyciągane siłami elektrostatycznymi.
Promień
atomu
jest
związany
elektronowych. Rozmiar jądra jest
mniejszy niż rozmiar atomu.
orbitach
kołowych,
z
promieniem
orbit
pięć rzędów wielkości
Powyższy model Rutherforda budowy atomu w poprawny
sposób wyjaśniał obojętność elektryczną atomów oraz
poprawnie określał rozmiar jądra atomowego (rzędu 10–15 m)
oraz powłok elektronowych (rzędu 10–10 m).
Podstawowym problemem modelu Rutherforda była kwestia
stabilności atomów. Jeżeli bowiem elektrony poruszają się po
kołowych orbitach wokół jądra atomowego, pod wpływem
oddziaływania
elektrostatycznego,
doznają
wówczas
przyspieszenia dośrodkowego. Ale, jak już wielokrotnie
wspominaliśmy zgodnie klasyczną fizyką falową, ładunek
(elektron) poruszający się z przyspieszeniem staje się źródłem
fal elektromagnetycznych. W ten sposób elektron na orbicie
elektronowej powinien tracić energię, poruszać się coraz
wolniej po orbicie o coraz mniejszym promieniu (po spirali) aż
Strona
155
wreszcie spaść na jądro atomowe. Czyli otaczająca nas materia
powinna być niestabilna. Ponadto podczas takiego ruchu po
spirali płynnie zmieniać się powinna prędkość elektronu oraz
przyspieszenie dośrodkowe, jakiego doznaje elektron. W
konsekwencji w sposób ciągły zmieniać się powinna długość
emitowanego promieniowania - atomy powinny mieć ciągłe
widmo promieniowania. Tymczasem w eksperymentach
przeprowadzonych dla rozgrzanych gazów (można przyjąć, że
mamy do czynienia z emisją przez pojedyncze atomy lub
cząsteczki) rejestrowane były tylko dyskretne wartości długości
emitowanego promieniowania. Otrzymane widma składają się
z tak zwanych linii charakterystycznych – każda linia
odpowiada promieniowaniu o określonej długości. Na
podstawie tych wyników można wnioskować, że elektrony w
atomie nie mogą przyjmować dowolnych energii a także, że
promień orbity, na której się on porusza, może przyjmować
jedynie pewne wyróżnione wartości.
Widma atomowe
Okazuje się, że układ linii w widmie promieniowania jest inny
dla różnych gazów i w ogólności jest charakterystyczny dla
danego pierwiastka. Najprostsze widmo promieniowania
obserwuje się dla atomu wodoru. Badania układu linii
emisyjnych wodoru, przeprowadzone przez Balmera, a
zanalizowane przez Rydberga wykazały, że położenie linii
widmowych widocznych w zakresie światła widzialnego
emitowanych przez wzbudzony atom wodoru, można opisać
wzorem:
1
1
1
 R H  2  2 
λ
2 n 
n  3, 4, 5, ...
(19.3),
gdzie n jest liczbą całkowitą większą od 2, zaś
R H  1.0972107 m-1 jest stałą Rydberga. Późniejsze badania
widma promieniowania wodoru w zakresie ultrafioletu oraz
podczerwieni ujawniły istnienie kolejnych serii linii
emisyjnych. Wszystkie serie wodoru mogą być opisane za
pomocą ogólnego wzoru:
Strona 156
Podstawy Fizyki II
1
1
1
 R H  2  2 

n 
m
n  m , m  1, 2, 3 ...
(19.4)
Serie widmowe badane przez Balmera z zakresu światła
widzialnego odpowiadają zatem wartości m = 2.
Model Bohra atomu wodoru
Postulaty modelu Bohra
Rozwiązanie problemów modelu Rutherforda, związanych ze
stabilnością
oraz
widmem
promieniowania,
zostało
zaproponowane przez Bohra, który przedstawił trzy postulaty:
o
Elektron porusza się po orbicie kołowej dookoła jądra,
przytrzymywany siłą oddziaływania elektrostatycznego.
Energia elektronu znajdującego się na orbicie jest stała
– atom nie emituje promieniowania
o
W atomie dozwolone są tylko takie orbity, dla których
orbitalny moment pędu elektronu jest równy całkowitej
wielokrotności stałej Plancka podzielonej przez 2:
Ln
o
h
 n
2
dla n  1, 2, 3
(19.5)
Emisja lub absorpcja promieniowania następuje wtedy,
kiedy elektron przeskakuje z jednej dozwolonej orbity
na drugą. Częstotliwość wyemitowanego (pochłoniętego)
promieniowania zależy od różnicy energii elektronu
między obiema orbitami:
ΔE  E k  E p  h
(19.6)
Warto zaznaczyć, że model Bohra nie wyjaśniał przyczyn
fizycznych, dla których podane postulaty są słuszne. Zostały
one tak dobrane, aby uzyskać zgodność z wynikami
eksperymentów.
Model
Bohra
zakłada
natomiast
skwantowanie energii i w ten sposób nawiązuje do teorii
Plancka promieniowania ciała doskonale czarnego.
Strona
157
Uwzględniając postulaty Bohra obliczmy energię elektronu
poruszającego się z prędkością v po stabilnej orbicie o
promieniu rn. Siłą dośrodkową w tym ruchu jest siła
oddziaływania elektrostatycznego elektronu z jądrem
atomowym (protonem o ładunku +e):
Fdosrodkowa  FCoulomba
me v 2
e2

rn
4 0 rn2
(19.7),
gdzie e jest ładunkiem elementarnym, zaś me masą elektronu.
Możemy również wyznaczyć orbitalny moment pędu elektronu i
wówczas drugi postulat Bohra można zapisać w postaci:
Ln  me v n rn  n
h
2
(19.8)
Równania 19.7 i 19.8 stanowią układ równań, z którego można
wyznaczyć prędkość vn oraz promień orbity elektronu rn:
rn  n 2
vn 
4 0  2
(19.9)
me e 2
e2
4 0  n
(19.10)
W powyższych wzorach zastosowaliśmy często używany w
fizyce kwantowej symbol  („h kreślone”), który oznacza stałą
Plancka dzieloną przez 2π (   h 2 ). Promień pierwszej orbity
atomu wodoru nazywamy promieniem Bohra:
a0 
4 0  2
me e 2
o
 0.529 A
(19.11)
Całkowita energia elektronu na n-tej orbicie jest sumą jego
energii
kinetycznej
oraz
potencjalnej
oddziaływania
elektrostatycznego:
Strona 158
Podstawy Fizyki II
me v n2
E n   E k n   E p n  
2

e2
4πε0 rn
Po podstawieniu do 19.11 zależności 19.9
otrzymujemy wyrażenie na energię całkowitą:
E n   
me e 4
4πε0 
2
1
2 n
2
2

13.6 eV
n2
(19.11)
oraz 19.10
(19.12)
Rysunek 19.2. Schemat poziomów energetycznych i serii widmowych atomu
wodoru.
Energia elektronu znajdującego się w stanie podstawowym w
atomie wodoru wynosi E0 = -13.6 eV. Energia elektronów
znajdujących się na wyższych poziomach rośnie (jest mniej
ujemna) i dla n   energia ta wynosi E(∞) = 0 – elektron jest
swobodny. Oderwanie elektronu z atomu wodoru (jonizacja)
oznacza więc dostarczenie energii niezbędnej do przeniesienia
elektronu z orbity podstawowej, n = 0, na n   a więc energii
Strona
159
13.6 eV. Wartość taka jest zgodna z eksperymentalnie
wyznaczoną energią jonizacji atomu wodoru.
Zgodnie z trzecim postulatem Bohra podczas przejścia
elektronu z orbity n na orbitę m emitowane jest
promieniowanie elektromagnetyczne o częstotliwości:
νn m 
En  Em
h
(19.13),
gdzie En i Em oznaczają energie elektronu na orbicie
odpowiednio n i m. Podstawiając za energie En i Em wzór 19.12
oraz dzieląc wyrażenie 19.13 przez prędkość światła c, po
przekształceniach otrzymujemy:
1  1

λ  4πε0
2
 me e 4  1
1

 2 
3 
2
m 
 4π c  n
(19.14)
Powyższa zależność wyprowadzona z modelu Bohra ma postać
analogiczną do wzoru 19.4 uzyskanego na podstawie danych
eksperymentalnych. Co więcej stałe proporcjonalności
występujące w tym wzorze dają wartość zbliżoną do
eksperymentalnie wyznaczonej stałej Rydberga RH.
Na podstawie modelu Bohra możemy więc teraz wyjaśnić, że
serie widmowe atomu wodoru są wynikiem przeskoków
elektronów między różnymi poziomami energetycznymi
(Rysunek 19.2). Należy przy tym zaznaczyć, że model Bohra
pozwala uzyskiwać wyniki w pełni zgodne z wynikami
doświadczalnymi tylko dla atomu wodoru. Wyniki zbliżone do
eksperymentalnych otrzymujemy jeszcze dla litu, sodu i
potasu, które z tego względu nazywane są wodoropodobnymi, a
dla pozostałych pierwiastków wyniki znacząco się różnią. O
przyczynach takich rozbieżności opowiemy szerzej w dalszej
części skryptu.
Doświadczenie Franka-Hertza
Zgodnie z modelem Bohra mechanizm emisji i absorpcji
promieniowania elektromagnetycznego przez atomy jest taki
sam. Proces absorpcji może zachodzić efektywnie tylko wtedy,
Strona 160
Podstawy Fizyki II
kiedy energia padającego fotonu jest taka sama jak różnica
energii
odpowiadających
orbitom
elektronowym.
W
eksperymencie Franka-Hertza elektrony lampy próżniowej
zawierającej opary rtęci przyspieszane są między katodą a
anodą zadanym napięciem. Przy zwiększaniu wartości napięcia
przyspieszającego obserwuje się szybki wzrost natężenia prądu
płynącego przez lampę, ale po przekroczeniu pewnej wartości
napięcia obserwuje się gwałtowny spadek natężenia prądu na
anodzie. Przy dalszym zwiększaniu napięcia obserwujemy
kolejne maksima i minima natężenia prądu, jak pokazano na
Rysunku 19.3.
Rysunek 19.3. Schemat układu pomiarowego i wyników doświadczenia FrankaHertza.
Wzrost napięcia między elektrodami lampy próżniowej
powoduje wzrost energii elektronów i statystycznie coraz ich
więcej dociera do anody w jednostce czasu – wzrost natężenia
Strona
161
prądu. Należy zaznaczyć, że ponieważ w lampie znajdują się
również pary rtęci, to elektrony lampy zderzają się sprężyście z
elektronami atomów rtęci. Jak wynika z eksperymentu dla
pewnych wartości energii elektronów z lampy (napięcia lampy)
zderzenia te przestają być sprężyste i elektrony lampy
przekazują swoja energię elektronom atomów rtęci, w wyniku
czego elektrony te przeskakują na wyższy poziom
energetyczny. W efekcie dla takiego napięcia na lampie
natężenie prądu na anodzie gwałtownie maleje, jak pokazano
na Rysunku 19.2.
Widmo charakterystyczne promieniowania rentgenowskiego
W rozdziale 18.2 rozważaliśmy przyczyny istnienia
krótkofalowej granicy widma promieniowania rentgenowskiego. Mówiliśmy wówczas, że widmo to, oprócz widma
ciągłego powstałego w wyniku hamowania wiązki elektronów w
tarczy lampy, posiada również tak zwaną składową
charakterystyczną. Są to wąskie i silne maksima natężenia
promieniowania. Okazuje się, że położenie i natężenia tych
maksimów zależy od materiału, z którego wykonana jest
tarcza. W wyniku oddziaływania elektronów lampy
rentgenowskiej, rozpędzonych dużą różnicą potencjałów (o
dużej energii), z metaliczną tarczą atomy tarczy ulegają
wzbudzeniu. Powrót tych atomów do stanu podstawowego
(przeskok elektronów na niższe orbity) wiąże się z emisją
kwantów promieniowania o określonej długości. W przypadku
widma emisyjnego wodoru mieliśmy do czynienia z
promieniowaniem z zakresu światła widzialnego a także
podczerwieni i ultrafioletu. W omawianym przypadku
promieniowanie emitowane przez lampę rentgenowską
charakteryzuje się mniejszą długością, ale mechanizm jego
powstawania
jest
identyczny.
Długość
emitowanego
promieniowania zależy od struktury poziomów elektronowych
w materiale, jest więc cechą charakterystyczną każdego
materiału i dlatego promieniowanie to nazywane jest
promieniowaniem charakterystycznym.
W dalszej części tego rozdziału skupimy się na budowie i
właściwościach jądra atomowego.
Strona 162
Podstawy Fizyki II
19.2. Jądro atomowe
Proton i neutron
Wiemy już, że zjonizowany atom wodoru H+ (jądro wodoru) ma
ładunek dodatni identyczny, co do wartości, z ładunkiem
elektronu. Załóżmy, że jądro wodoru odpowiada pewnej cząstce
– nazwiemy ją protonem. Masa spoczynkowa protonu wynosi
mp  1.6726 10 27 kg . Masa atomu kolejnego pierwiastka,
helu, jest około czterokrotnie większa niż masa atomu wodoru.
Jonizując atom helu odrywamy od niego dwa elektrony,
otrzymując jon o ładunku +2e (He2+). Zatem, jeśli nośnikiem
ładunku dodatniego jest proton, to jądro helu zawiera dwa
protony. Czterokrotnie większa masa wskazuje jednak na
obecność w jądrze również innych masywnych cząstek,
pozbawionych ładunku elektrycznego. Obecność takich cząstek
jest również niezbędna z innego powodu – pomiędzy dwoma
ładunkami dodatnimi (protonami), skupionymi na niewielkim
obszarze jądra istnieją silne elektrostatyczne oddziaływania
odpychające. Obecność neutralnych cząstek zwiększa
efektywną odległość między protonami a więc mniejsza siłę
oddziaływania kulombowskiego.
Cząstki neutralne występujące w jądrze atomowym nazywamy
neutronami. Masa neutronu jest nieco większa niż protonu i
wynosi mn  1.6749 10 27 kg . Pomiędzy neutronami a
protonami występuje tzw. oddziaływanie silne – o dużej sile,
ale krótkim zasięgu.
Izotopy
Nazwa i właściwości chemiczne danego pierwiastka związane
są z ilością protonów występujących w jądrze atomowym. Ilość
protonów nazywamy liczbą atomową Z. Porządkując
pierwiastki według liczby atomowej otrzymujemy szereg
Strona
163
pierwiastków – szereg taki był podstawą do stworzenia układu
okresowego. Masa danego atomu zależy zarówno od ilości
protonów, jak i neutronów – łączną ilość cząstek budujących
jądro (nukleonów) nazywamy liczbą masową A. Jak
przekonamy się w dalszej części rozdziału, rzeczywista masa
jądra danego pierwiastka nie jest prostą sumą mas nukleonów,
ale zależy również od sił wiążących jądro. Znając liczbę
atomową i masową, można obliczyć liczbę neutronów N w
jądrze:
N  A Z
Jądra danego pierwiastka mogą posiadać różną
neutronów – mogą zatem różnić się liczbą masową.
(19.15)
liczbę
Jądra o jednakowej liczbie protonów, zawierające różną liczbę
neutronów nazywamy izotopami.
Jądra atomowe oznacza się symbolem pierwiastka chemicznego
z liczbą masową w indeksie górnym po lewej stronie tego
symbolu. Na przykład zapis 12C oznacza izotop węgla
zawierający 12 nukleonów, a więc 6 protonów i 6 neutronów.
Zapis 14C oznacza izotop węgla zawierający 6 protonów i 8
neutronów.
Stabilność izotopów
Liczba neutronów w jądrze nie przybiera dowolnych wartości.
Jeśli neutronów jest za mało, jądro może być nietrwałe ze
względu na silne odpychanie elektrostatyczne pomiędzy
protonami. O takim jądrze mówimy, że jest niestabilne.
Podobnie, jeśli neutronów w jądrze jest zbyt dużo, jądro
znajduje się w stanie o wysokiej energii i dąży do osiągnięcia
stanu o niższej energii. Również w tym przypadku może
nastąpić rozpad jądra. Jak przekonamy się w dalszej części
rozdziału, rozpad ma charakter statystyczny – nie możemy
dokładnie określić, kiedy rozpadnie się dane jądro, ale na
podstawie obserwacji wielu procesów rozpadu możemy określić
średni czas życia takiego jądra.
Niestabilne izotopy różnią się od siebie czasem życia. Izotopy
krótkożyciowe, dla których rozpad następuje po czasie rzędu
Strona 164
Podstawy Fizyki II
sekundy lub krótszym, nie są obserwowane w przyrodzie i
reprezentują mało stabilne konfiguracje nukleonów. Izotopy te
mogą być jednak otrzymywane w warunkach laboratoryjnych.
Dla innych izotopów o bardziej stabilnej konfiguracji
nukleonów rozpad następuje średnio po czasie rzędu miesięcy,
lat lub nawet setek tysięcy lat. Izotopy tego typu możemy
obserwować w przyrodzie.
Na podstawie pomiarów czasu życia izotopów możemy stworzyć
tak zwaną mapę nuklidów, gdzie, zwyczajowo, na osi x
odznacza się liczbę neutronów N, a na osi y liczbę atomową Z.
Stabilne izotopy (nie ulegają rozpadowi) obserwujemy dla
wszystkich atomów lżejszych od ołowiu. Dla stabilnych
izotopów pierwiastków lekkich liczba neutronów jest zbliżona
do liczby protonów a dla stabilnych izotopów pierwiastków
cięższych liczba neutronów budujących jądro jest większa niż
liczba protonów. W przypadku ciężkich pierwiastków, dla
których nie istnieją w przyrodzie stabilne izotopy i znamy
jedynie krótkożyciowe jądra wytworzone laboratoryjnie,
możemy jedynie wyróżnić obszary o większej stabilności, tzw.
wyspy stabilności.
Energia wiązania
Masa jądra danego atomu jest nieco mniejsza od sumy mas
nukleonów wchodzących w skład jądra. Aby zrozumieć
przyczynę takiego zjawiska, warto wrócić do rozważań
przedstawionych w rozdziale poświęconym teorii względności.
Wiemy, że masa może być przekształcona w energię zgodnie ze
znanym wzorem Einsteina:
E  mc 2
(19.16)
Energia wiązania nukleonów, wynikająca z oddziaływania
silnego występującego między nimi, powoduje wytworzenie
defektu masy jądra. Całkowitą energię wiązania jądra możemy
obliczyć, odejmując energię odpowiadającą sumie mas
nukleonów m od energii odpowiadającej masie całego atomu M:
Strona
165
E W   mi c 2  M c 2
(19.17)
i
W praktyce wygodniej jest posługiwać się energią wiązania
jądra przypadającą na jeden nukleon:
E WN 
EW
A
(19.18)
Rysunek 19.4. Schematyczny wykres energii wiązania w funkcji liczby masowej
Energia wiązania nukleonu dla różnych pierwiastków
przybiera różne wartości. Na wykresie energii wiązania w
funkcji liczby masowej A (Rysunek 19.4) widzimy, że
najmniejszą wartość przyjmuje ona dla izotopu wodoru 2H, i
generalnie wzrasta wraz ze wzrostem liczby masowej dla
pierwiastków lekkich. Energia wiązania nukleonu osiąga
maksimum dla żelaza Fe i niklu Ni. Dla jąder cięższych
obserwuje się spadek energii wiązania w przeliczeniu na
nukleon. Oznacza to, że jeśli ciężkie jądro ulegnie
rozszczepieniu na mniejsze fragmenty, w procesie tym będzie
wydzielać się energia. Zjawisko to wykorzystuje się w
elektrowniach jądrowych, których zasadę działania omówimy
Strona 166
Podstawy Fizyki II
szczegółowo w dalszej części rozdziału. Energia wydzieli się
również w procesie syntezy (łączenia) lekkich pierwiastków,
prowadzącym do powstania cięższego jądra.
Jednostka energii - elektronowolt
Jednostką wygodną do opisu energii wiązania nukleonów i
energii przemian jądrowych, które będziemy omawiać w
kolejnym rozdziale jest elektronowolt. Jeden elektronowolt –
1eV – jest równy energii, jaką ładunek elementarny uzyskałby
w polu elektrycznym pokonując różnicę potencjałów 1V.
1eV  1.6 1019 J
(19.19)
Dla większości jąder energia wiązania nukleonu zawiera się
pomiędzy 5 a 10 MeV.
19.3. Promieniotwórczość
Rozpad ciężkich jąder odbywa się samorzutnie i ma charakter
statystyczny – nie możemy dokładnie określić, kiedy rozpadnie
się dane jądro, ale na podstawie obserwacji wielu procesów
rozpadu możemy określić średni czas życia takiego jądra.
Prawdopodobieństwo rozpadu jest cechą charakterystyczną
danego izotopu. Aktywność promieniotwórcza R próbki określa
liczbę rozpadów następujących w ciągu sekundy dN dt i
zależy od liczby jąder N jakie mogą ulec rozpadowi oraz stałej
rozpadu promieniotwórczego . Aktywność R wyraża się w
bekerelach [Bq] (1Bq = 1 rozpad na sekundę).
R  N  
dN
dt
(19.20)
Rozwiązując powyższe równanie różniczkowe otrzymujemy
funkcję wykładniczą opisującą średnią liczbę jąder N, jakie po
czasie
t
nie
uległy
jeszcze
rozpadowi
(jąder
promieniotwórczych):
Strona
167
N t  N 0 e  t
(19.21),
gdzie N0 oznacza początkową liczbę jąder promieniotwórczych.
Zakładamy przy tym, że jądra, które uległy już rozpadowi są
stabilne (nie ma wtórnych procesów rozpadu). Z powyższego
wzoru wynika, że ilość rejestrowanych początkowo rozpadów
jest stosunkowo duża i stopniowo maleje, gdyż w próbce
pozostawać będzie coraz mniej jąder, które wciąż mogą ulec
rozpadowi (Rysunek 19.5).
Należy podkreślić jeszcze raz, że zjawisko rozpadu
promieniotwórczego ma charakter statystyczny. Powyższa
zależność nie podaje więc dokładnej liczby a jedynie określa
średnią liczbę jąder, które nie uległy jeszcze rozpadowi.
Rysunek 19.5. Wykres zależności liczby jąder promieniotwórczych od czasu
W fizyce jądrowej tempo rozpadu promieniotwórczego wyraża
się często za pomocą tzw. czasu połowicznego zaniku. Czas
połowicznego zaniku t1/2 jest to czas, po którym liczba jąder N
(a także aktywność próbki R ) maleje do połowy wartości
Strona 168
Podstawy Fizyki II
początkowej, jak zaznaczono na Rysunku 19.5. Na podstawie
zależności 19.21 czas połowicznego rozpadu t1/2 wynosi:
t1 2 
ln2
 τ ln2
λ
(19.22),
gdzie   1  oznacza średni czas życia jądra . Liczbę jąder
promieniotwórczych możemy również wyrazić za pomocą
średniego czasu życia  :
N t   N 0 e

t

(19.23).
Przykład
Czas połowicznego rozpadu jądra pewnego pierwiastka wynosi
1 dzień. Ile razy zmieni się aktywność preparatu zawierającego
ten pierwiastek po czterech dniach?
Po pierwszym dniu połowa jąder ulegnie rozpadowi – zatem
aktywność próbki spadnie do połowy pierwotnej wartości. W
drugim dniu ulegnie rozpadowi połowa z pozostałych jąder,
czyli 1/4 początkowej liczby jąder. Po trzech dniach rozpadnie
się 1/8 jąder, a po czterech – 1/16. Zatem aktywność próbki
spadnie w tym czasie 16 razy.
Taki sam wynik otrzymamy korzystając ze wzoru 19.23:
N t   N 0 e

t

 N 0e

4 ln2
1
N0
1
16
(19.24)
Zastosowania
Datowanie metodą izotopową
W wielu przypadkach obecność izotopów promieniotwórczych w
próbce możemy wykorzystać do wyznaczenia jej wieku.
Przykładem jest datowanie metodą węgla radioaktywnego 14C.
Izotop ten powstaje w górnych warstwach atmosfery, a jego
zawartość w atmosferze utrzymuje się na stałym poziomie.
Strona
169
Żywe organizmy, rośliny i zwierzęta, wymieniają węgiel z
otoczeniem w ten sposób również utrzymując stałą zawartość
węgla 14C w ich tkankach. Po śmierci organizmu wymiana
węgla ustaje a zawartość izotopu 14C zmniejsza się wykładniczo
zgodnie z prawem rozpadu. Analizując udział procentowy
węgla 14C w stosunku do pozostałych izotopów węgla w badanej
próbce oraz wiedząc, że czas połowicznego rozpadu wynosi 5730
lat, można wyznaczyć przybliżony wiek obiektu. Metodę tę
można wykorzystywać m.in. do datowania materiałów
organicznych takich jak drewno, kości czy tkaniny.
Znaczniki radioaktywne
Izotopy radioaktywne o niewielkiej, ale możliwej do zmierzenia
aktywności mogą być również wykorzystywane jako znaczniki
radioaktywne. Właściwości fizyczne i chemiczne izotopów
radioaktywnych nie różnią się zwykle w zdecydowany sposób
od właściwości atomów stabilnych – np. wchodzą w identyczne
reakcje chemiczne. Z tego względu możemy wykorzystywać je
do badania obiegu danego pierwiastka w złożonych układach, a
także organizmach żywych. Metoda taka, przy odpowiednim
doborze rodzaju i zawartości izotopów promieniotwórczych nie
niesie zagrożenia dla badanego obiektu i może być także
stosowana w badaniach ludzi (np. izotopu 11C w badaniach
aktywności ludzkiego mózgu).
19.4. Rozpady
promieniotwórcze
W poprzednim rozdziale opisaliśmy statystyczny charakter
rozpadów
promieniotwórczych.
O
samych
rozpadach
powiedzieliśmy jak dotąd jedynie, że zachodzą samorzutnie,
czyli, że nic nie możemy zrobić żeby taki proces wywołać ani
żeby go kontrolować. W tym rozdziale wymienimy różne
rozpady promieniotwórcze i omówimy ich cechy.
Strona 170
Podstawy Fizyki II
Rozpad 
W wyniku rozpadu  z jądra emitowana jest cząstka ,
zawierająca 4 nukleony – dwa protony i dwa neutrony.
Ponieważ w wyniku emisji cząstki  liczba atomowa Z
zmniejsza się o 2, więc produktem rozpadu jest inny
pierwiastek niż pierwiastek ulegający rozpadowi. Rozpad 
przebiega według następującego schematu:
A
Z
XAZ42Y  42
(19.25)
Jako przykład rozpadu  rozważmy rozpad izotopu uranu 238U:
238
92
2
U234
90Th  4 α
(19.26)
W powstałym jądrze toru 234Th, stosunek liczby neutronów do
protonów wynosi 1.6, co odpowiada bardziej stabilnej
konfiguracji nuklidów, niż w ulegającym rozpadowi jądrze
uranu 238U (stosunek wynosi 1.587). Warto wspomnieć również,
że powyższa reakcja jest głównym źródłem gazowego helu na
Ziemi. Cząstki  powstałe w wyniku takiego rozpadu wyłapują
następnie elektrony i tworzą atomy helu. Czas połowicznego
rozpadu 238U jest bardzo długi i wynosi około 4.5109 lat.
Rozpad 
Istnieją dwa rodzaje rozpadów : – i +.
W wyniku rozpadu – jeden z neutronów obecnych w jądrze
zmienia się w proton. Liczba atomowa zwiększa się zatem o 1,
a więc jądro będące produktem rozpadu reprezentuje inny
pierwiastek niż jądro ulegające rozpadowi. Liczba masowa
pozostaje zachowana. Aby ładunek elektryczny był zachowany,
z atomu emitowany jest elektron. Powstaje również
antyneutrino elektronowe ν , które jest cząstką słabo
oddziałującą z materią. Ogólne równanie reakcji rozpadu –
zapisujemy w następujący sposób:
Strona
171
A
Z
XZA1Y  01 e  ν
Przykładem rozpadu – jest rozpad izotopu cezu
wyniku którego powstaje izotop baru 137Ba.
137
55
0
Cs137
56 Ba 1 e  ν
(19.27)
137Cs,
w
(19.28)
Rozpady tego typu najczęściej obserwujemy dla izotopów
posiadających nadmiar neutronów w stosunku do najbardziej
stabilnej konfiguracji.
W wyniku rozpadu  + jeden z protonów zmienia się w neutron.
Z atomu emitowany jest pozyton – cząstka o właściwościach
podobnych do elektronu, ale obdarzona ładunkiem dodatnim.
Dodatkowo dochodzi do emisji neutrina elektronowego.
Ponieważ liczba protonów ulega zmniejszeniu, również i w tym
rozpadzie jądro będące produktem rozpadu odpowiada innemu
pierwiastkowi niż jądro przed rozpadem. Liczba masowa
zostaje zachowana:
A
Z
XZA1Y  01 e  ν
Przykładem rozpadu + jest rozpad izotopu sodu
wyniku którego powstaje jądro neonu 22Ne:
22
11
22
Na10
Ne 01 e  ν
(19.29)
22Na,
w
(19.30)
Równania 19.25, 19.27 i 19.29 pokazują jak zmienią się, liczby
atomowa i masowa jądra atomowego w zależności od typu
rozpadu promieniotwórczego. Zależności te nazywane są
regułami przesunięć Soddyego i Fayansa. Warto podkreślić, że
Kazimierz Fajans był fizykiem jądrowym polskiego
pochodzenia.
Przemiana 
Jądro atomowe może również przejść do stanu o niższej energii
w wyniku emisji fotonu, czyli kwantu  promieniowania
elektromagnetycznego. Równanie takiej przemiany  możemy
zapisać w następujący sposób:
Strona 172
Podstawy Fizyki II
A
Z
X * AZ X  
(19.31),
gdzie znaczek  oznacza jądro w stanie o wyższej energii (w
stanie wzbudzonym). Wyemitowany foton  charakteryzuje się
zwykle wysoką energią. Po wyemitowaniu takiego kwantu
promieniowania jądro może przejść na stan podstawowy lub
znaleźć się na niższym stanie wzbudzonym. W tym drugim
przypadku, przemiana  może zachodzić kaskadowo aż do
momentu przejścia jądra do stanu podstawowego.
Podczas rozpadu – izotopu kobaltu 60Co powstaje wzbudzone
jądro niklu 60Ni, które przechodzi do stanu podstawowego w
wyniku emisji dwóch fotonów , o energiach równych 1.17 MeV
oraz 1.33 MeV.
Inne procesy rozpadu
Poza
trzema
wymienionymi
powyżej
i
najczęściej
obserwowanymi
w
przyrodzie
procesami
rozpadu
promieniotwórczego, może występować również emisja
neutronu, wychwyt elektronu oraz emisja protonu.
W procesie emisji neutronu zachowywana jest liczba atomowa
jądra a z jądra emitowany jest tylko neutron. Rozpad tego typu
następuje np. dla izotopu 13Be i 5He, choć w przypadku 5He
mamy do czynienia również z rozpadem . Neutrony
emitowane są również w procesie rozszczepienia jąder ciężkich,
które to zjawisko omówimy dokładniej w dalszej części tego
rozdziału.
Wychwyt elektronu polega na przechwyceniu przez proton z
jądra atomowego jednego z elektronów znajdujących się na
najniższej powłoce elektronowej. Przemiana ta jest w istocie
odwrotna do omówionej wcześniej przemiany –. W jej wyniku
maleje liczba protonów w jądrze (liczba atomowa), rośnie
natomiast liczba neutronów – liczba masowa pozostaje więc
stała. Dochodzi również do emisji neutrina elektronowego.
Podczas emisji protonu zmniejsza się o 1 liczba atomowa i
liczba masowa jądra. Rozpady tego typu rzadko występują w
Strona
173
przyrodzie i obserwowane są głównie w przypadku
krótkożyciowych ciężkich jąder wytwarzanych laboratoryjnie.
Promieniowanie jonizujące
Ponieważ cząstki wyemitowane w wyniku omawianych powyżej
rozpadów promieniotwórczych charakteryzują się zwykle
wysoką energią oddziałując z materią mogą wybijać elektrony z
zewnętrznych powłok atomowych (jonizować atomy) lub zrywać
chemiczne wiązania międzyatomowe. Ze względu na tę
zdolność
jonizacji
materii
produkty
rozpadów
promieniotwórczych nazywać będziemy promieniowaniem
jonizującym. Uszkodzenia spowodowane promieniowaniem
jonizującym w przypadku tkanek organizmów żywych mogą
być nieodwracalne. Zwłaszcza zerwanie nici kodu genetycznego
DNA, może prowadzić do powstawania chorych lub
zdegenerowanych komórek. Z drugiej jednak strony
promieniowanie jonizujące może być wykorzystane w technice
czy medycynie. Przykładowo proces naświetlania wiązką
przenikliwego promieniowania  jest wykorzystywany w
przemyśle do modyfikacji właściwości niektórych polimerów a
radioterapia stosowana w leczeniu nowotworów polega na
naświetlaniu
zmian
nowotworowych
za
pomocą
promieniowania , rentgenowskiego albo wiązką elektronów,
protonów czy cząstek α.
Oddziaływanie promieniowania jonizującego z materią
Różne rodzaje promieniowania wykazują różną przenikliwość i
różny stopień oddziaływania z materią.
Promieniowanie  jest słabo przenikliwe – droga cząstek tego
promieniowania w powietrzu jest rzędu centymetrów. Wiązkę
cząstek  można powstrzymać cienką folią lub kartką papieru.
Zabezpieczenie się przed tym promieniowaniem wydaje się być
pozornie łatwe, jednakże emitery promieniowania  mogą się
łatwo dostać do wnętrza ludzkiego organizmu wraz z
wdychanym powietrzem lub pokarmem stanowiąc wówczas
poważne zagrożenie dla zdrowia.
Strona 174
Podstawy Fizyki II
Zasięg promieniowania  w powietrzu jest znacznie większy niż
promieniowania  i może dochodzić do kilku metrów.
Skuteczną ochroną przed promieniowaniem tego typu może być
np. gruba warstwa metalowej blachy. Zagrożeniem dla
organizmów żywych jest nie tylko zewnętrzne oddziaływanie
promieniowania  na skórę, które może prowadzić do oparzeń.
Szczególnie niebezpieczne w skutkach może być oddziaływanie
promieniowania  na układ pokarmowy w wyniku spożycia
skażonej wody lub pokarmu.
Najbardziej przenikliwym typem promieniowania jest
promieniowanie , do osłabienia którego trzeba stosować
materiały o dużej gęstości (np. ołów). Jednak nawet grube
osłony z ołowiu nie gwarantują całkowitego zatrzymania
promieniowania . Ze względu na dużą przenikliwość
promieniowanie tego typu może docierać bezpośrednio do
wnętrza tkanek.
Aby ilościowo opisać wpływ promieniowania jonizującego na
żywy organizm, wprowadza się pojęcie dawki pochłoniętej DT.
Określa ona stosunek całkowitej energii promieniowania
(wyrażonej w dżulach) pochłoniętego przez tkankę do masy tej
tkanki. Jednostką dawki pochłoniętej jest grej [1Gy  1 J kg ].
Na stopień uszkodzenia tkanek organizmów żywych ma wpływ
nie tylko energia, ale i rodzaj cząstek promieniowania
jonizującego. Masywne cząstki  powodują ogromne
zniszczenia tkanek. Skutki oddziaływania promieniowania  i 
na żywe tkanki są mniejsze niż w przypadku promieniowania
. Skutek biologiczny danego rodzaju promieniowania możemy
uwzględnić, wymnażając dawkę pochłoniętą przez odpowiedni
współczynnik
QR
przypisany
do
danego
rodzaju
promieniowania. Współczynnik taki dla promieniowania  i 
przyjmuje się za 1, a dla promieniowania  wynosi on około 20.
Sumując
skutek
biologiczny
wszystkich
rodzajów
promieniowania
oddziaływających
na
daną
tkankę
otrzymujemy równoważnik dawki H T  D TQR . Jednostką

efektywnego równoważnika dawki jest sivert [Sv].
Strona
175
Ponieważ różne tkanki są w różnym stopniu wrażliwe na
promieniowanie, często wprowadza się również efektywny
równoważnik dawki. Jego wartość definiuje się na ogół w
odniesieniu do całego ciała. Szkodliwość promieniowania na
ludzki organizm otrzymujemy, mnożąc dla każdej tkanki
równoważnik dawki przez współczynnik definiujący podatność
tkanki na uszkodzenia wywołane promieniowaniem, a
następnie sumując wpływ związany z oddziaływaniem na
wszystkie tkanki. Najbardziej wrażliwymi na promieniowanie
organami są przewód pokarmowy i wewnętrzne narządy
rozrodcze. Według obowiązujących w Polsce norm, dla osób
narażonych zawodowo na oddziaływanie promieniowania
liczony rocznie efektywny równoważnik dawki nie powinien
przekroczyć 50 mSv.
Warto wspomnieć, że środowisko naturalne nie jest wolne od
źródeł promieniowania – liczony w skali roku efektywny
równoważnik dawki od źródeł naturalnych wynosi od 1 do
4 mSv.
19.5. Reakcje jądrowe
Omawiane powyżej rozpady promieniotwórcze są procesami
samorzutnymi. Pod wpływem czynników zewnętrznych takich
jak krótkozasięgowe oddziaływanie z innym jądrem lub też z
cząstkami elementarnymi lub fotonami, jądra atomowe mogą
podlegać przemianom, które nazywać będziemy reakcjami
jądrowymi. W ich wyniku powstają jądra atomowe innych
pierwiastków, innych izotopów tego samego pierwiastka lub
jądra tego samego izotopu danego pierwiastka w innym stanie
energetycznym.
Rozszczepienie jądra
Reakcje rozpadu, to takie reakcje jądrowe, w wyniku których
zmniejsza się liczba atomowa jądra atomowego. Omawiając
zależność energii wiązania pojedynczego nukleonu od liczby
Strona 176
Podstawy Fizyki II
masowej atomów (Rysunek 19.3) wspominaliśmy, że
rozszczepienie masywnego jądra na mniejsze fragmenty może
uwalniać energię. Właśnie ze względu na uwalnianą energię,
reakcje rozszczepienia jądra wykorzystywane są w reaktorach
jądrowych i bombach atomowych.
Proces rozszczepienia przedstawimy na przykładzie izotopu
uranu 235U. Proces rozszczepienia jest w tym przypadku
inicjowany przez wychwyt neutronu przez jądro 235U. Aby
proces wychwytu mógł zajść, neutron musi mieć odpowiednio
niską energię – tak zwane neutrony szybkie, o dużej energii,
nie są wychwytywane. W wyniku wychwytu neutronu powstaje
wzbudzone jądro uranu 236U a kulisty (w przybliżeniu) kształt
jądra ulega deformacjom. Jeśli deformacja jest znaczna, siły
odpychania elektrostatycznego pomiędzy dwoma fragmentami
jądra powodują rozerwanie go − nazywane również
rozszczepieniem − na dwie zbliżone rozmiarami części. Dwa
fragmenty jądra uwalniają dodatkowo neutrony „nadmiarowe”
w stosunku do liczby protonów. Średnio w jednym procesie
rozszczepienia jądra uranu 236U uwalniane jest 2.5 neutronów.
Reakcję rozszczepienia uranu
sposób:
235
235U
zapisujemy w następujący
U  n236 U140 Xe 94 Sr  2n
(19.32)
Widzimy, że powstające fragmenty nie mają równych mas.
Reprezentują one nietrwałe izotopy, które podlegają kolejnym
procesom
rozpadu.
Energia
wyzwalana
w
procesie
rozszczepienia każdego jądra uranu 235U wynosi około
200 MeV.
Reaktor jądrowy
W elektrowniach jądrowych energia uwolniona w reakcji
rozszczepienia jąder uranu 235U zamieniana jest na energię
elektryczną. Reakcje rozszczepienia powodują wzrost
temperatury wnętrza reaktora (głównie paliwa). Energia
cieplna odbierana jest przez chłodzącą reaktor wodę, która
zamienia się w parę wodną i napędza turbiny. Uzyskana w ten
Strona
177
sposób energia mechaniczna turbiny zamieniana jest na
energię elektryczną. Należy jednak zauważyć, że reaktor
jądrowy jest jedynie jednym z elementów niezbędnych do
wydajnego i bezpiecznego wykorzystania energii jądrowej. W
przypadku złożonej gałęzi przemysłu, jaką jest energetyka
jądrowa, produkcja energii stanowi jedynie niewielki wycinek
całego cyklu obejmującego wydobycie rud pierwiastków
promieniotwórczych, przetwarzanie ich na paliwo i
wzbogacanie go, a następnie przetwarzanie i składowanie
odpadów.
Rozważmy reaktor wykorzystujący omówioną powyżej reakcję
rozszczepienia uranu 235U. Neutrony generowane w wyniku
rozszczepienia uranu 235U są wychwytywane przez kolejne
jądra i proces może zostać powtórzony. Ponieważ w wyniku
pojedynczego rozszczepienia powstają 2 lub 3 neutrony, proces
ten może zachodzić lawinowo (inne określenie to reakcja
łańcuchowa) – pierwsza reakcja rozszczepienia generuje
kolejne. W skali całego reaktora utrzymanie stałego tempa
reakcji wymaga równości liczby neutronów otrzymanej w
danym „pokoleniu” do otrzymanych w „pokoleniu” poprzednim.
Stosunek tych dwóch liczb nazywamy współczynnikiem K
mnożenia reaktora. Stałe tempo reakcji oznacza zatem, że
współczynnik mnożenia jest równy 1 – mówimy wówczas, że
reaktor jest w stanie krytycznym. Utrzymanie stałego tempa
reakcji jądrowej wymaga rozwiązania kilku istotnych
problemów, które przedstawiono poniżej.
Wypływ neutronów
Neutrony, które wydostaną się na zewnątrz reaktora nie biorą
udziału w reakcji rozszczepienia paliwa jądrowego. Nadmierny
wypływ neutronów może zatem prowadzić do wygaszenia
reakcji rozszczepienia. Liczba neutronów opuszczających
reaktor zależy głównie od powierzchni zewnętrznej bloku
zawierającego paliwo, a liczba jąder mogących brać udział w
reakcji rozszczepienia zależy od objętości tego bloku. Zatem im
większy jest element zawierający paliwo jądrowe, tym
korzystniejszy stosunek objętości do powierzchni i tym łatwiej
jest podtrzymać reakcję rozszczepienia.
Strona 178
Podstawy Fizyki II
Parametrem pozwalającym na ilościowe określenie progu
niezbędnego do powstania samo-podtrzymującej reakcji
jądrowej jest masa krytyczna.
Masa krytyczna jest to masa kuli wykonanej z danego izotopu,
przy której tyle samo neutronów opuszcza blok, ile jest
produkowane w wyniku reakcji.
Warto zwrócić uwagę, że masa krytyczna jest zdefiniowana
jedynie dla kształtu kulistego – dla innych kształtów wartość
masy niezbędnej po potrzymania reakcji będzie większa.
Zastosowanie osłon odbijających neutrony do wnętrza reaktora
(reflektora neutronów) może natomiast wydatnie zmniejszyć
masę paliwa jądrowego niezbędnego do funkcjonowania
reaktora. Dla izotopu uranu 235U masa krytyczna wynosi 52 kg.
Dla porównania, dla izotopu plutonu 239Pu wynosi ona jedynie
10 kg.
Spowalnianie i pochłanianie neutronów
Aby szybkie neutrony powstające w wyniku reakcji
rozszczepienia mogły wywołać kolejne reakcje, muszą zostać
spowolnione do tzw. neutronów termicznych. Szybkie neutrony
można spowolnić poprzez zderzenia z jądrami lekkich
pierwiastków – materiał używany w tym celu w reaktorze
nazywamy moderatorem. Analizując zderzenie neutronu z
jądrem na podstawie klasycznych zasad mechaniki łatwo
zauważyć, że im lżejsze będzie jądro, z którym zderzy się
neutron, tym większa będzie strata energii tego neutronu.
Istotne jest przy tym, żeby materiał moderatora
charakteryzował się nie tylko dużą efektywnością w
spowalnianiu neutronów (tzw. duży przekrój czynny na
rozpraszanie neutronów), ale jednocześnie nie pochłaniał
neutronów (tzw. mały przekrój czynny na pochłanianie
neutronów). Często stosowanymi moderatorami są ciężka woda
(D2O), grafit i beryl.
W miarę jak kolejne jądra paliwa jądrowego ulegają
rozszczepieniu, ich ilość w pręcie paliwowym systematycznie
spada, co zmniejsza tempo reakcji jądrowej. Dodatkowo
wnętrze pręta paliwowego stopniowo wypełnia się produktami
rozpadu uranu 235U. Często określa się ten proces jako
Strona
179
„zatruwanie” paliwa. Należy ponadto zauważyć, że izotop 235U
stanowi zwykle niewielką część całkowitej zawartości uranu w
pręcie paliwowym. Inne izotopy, jak 238U również mogą
wychwytywać i generować neutrony. Widać zatem, że tempo
przebiegu reakcji jądrowej zależy od wielu czynników i może
znacznie zmieniać się w czasie. Z tego względu niezbędna jest
możliwość łatwego i szybkiego kontrolowania przebiegu reakcji
jądrowej poprzez pochłanianie nadmiaru neutronów. Funkcję
taką w reaktorach jądrowych pełnią pręty kontrolne wykonane
z materiałów takich jak kadm, bor, ind oraz srebro. Wsunięcie
prętów do wnętrza reaktora powoduje zmniejszenie liczby
neutronów biorących udział w kolejnym „pokoleniu” procesów
rozpadu.
Chłodzenie reaktora
Energia uwalniana podczas procesów rozszczepienia powoduje
wzrost energii wewnętrznej paliwa jądrowego oraz innych
elementów reaktora. Odebranie ciepła z wnętrza reaktora i
zamiana go na energię mechaniczną jest możliwa dzięki
odpowiedniemu układowi chłodzenia, na ogół wodnego.
Ponieważ woda przechodząc przez komorę reaktora ulega
skażeniu promieniotwórczemu (pojawiają się w niej nietrwałe
izotopy), na ogół stosuje się dwa lub więcej obiegów wodnych,
tak aby skażona woda nie miała kontaktu ze środowiskiem
zewnętrznym. W popularnych rozwiązaniach elektrowni typu
PWR (ang. Pressure Water Reactor) woda krążąca w
zamkniętym obiegu pierwotnym pobiera ciepło z reaktora a
następnie oddaje je do obiegu wtórnego. W obiegu wtórnym
wytwarzana jest para wodna pod wysokim ciśnieniem. Para ta
rozprężając się obraca turbinę elektrowni generując prąd
elektryczny.
Bomba atomowa
Jeśli stosunek liczby neutronów otrzymanej w danym
pokoleniu do liczby otrzymanej w pokoleniu poprzednim jest
większy od jedności to tempo reakcji wzrasta w sposób
wykładniczy. Taki stan reaktora określa się jako nadkrytyczny,
a jego konsekwencją może być niekontrolowana reakcja
Strona 180
Podstawy Fizyki II
jądrowa. Wzrost temperatury paliwa jądrowego może
doprowadzić do stopienia prętów paliwowych i eksplozji
reaktora.
W przypadku bomby atomowej celowo doprowadza się do
sytuacji, w której paliwo jądrowe przechodzi w stan
nadkrytyczny. Wewnątrz bomby znajdują się fragmenty
materiału rozszczepialnego, z których każdy ma masę mniejszą
niż masa krytyczna obliczona dla danej geometrii. Inicjatorem
reakcji
jest
wybuch
konwencjonalnego
materiału
wybuchowego, który łączy fragmenty w całość o masie
przekraczającej masę krytyczną. Tempo reakcji jądrowej
narasta na tyle szybko, że dochodzi do rozszczepienia
większości dostępnych jąder materiału rozszczepialnego.
Energia, która wydziela się w wyniku wybuchu bomby
atomowej może wynosić od 1010 do 1013J.
Reakcje syntezy jądrowej
Dla jąder izotopów pierwiastków lekkich, takich jak wodór, hel
lub lit energia wiązania nukleonu jest znacząco mniejsza, niż
dla jąder pierwiastków ze środkowej części szeregu np. dla
żelaza. Należy zatem spodziewać się, że również w procesie
połączenia, syntezy albo fuzji jąder pierwiastków lekkich
dochodzi do wydzielania się energii.
W istocie, procesy syntezy jądrowej stanowią podstawowe
źródło energii dla gwiazd, w tym Słońca. W gwiazdach o
rozmiarach Słońca lub mniejszych dominuje tak zwany cykl
protonowy łączenia wodoru w hel, który dostarcza około 86%
energii Słońca. W cyklu tym z czterech jąder wodoru powstaje
stabilne jądro helu a energia wydzielana w całym cyklu reakcji
wynosi 26.73 MeV. Cykl ten rozpoczyna się od połączenia
dwóch protonów w jądro deuteru:.
1
1
H11 H21 D 01 e  ν
(19.33)
Energia uzyskiwana w każdej takiej reakcji wynosi 0.42 MeV.
Powstałe w wyniku takiej reakcji pozytony e+ ( 01 e ) mogą
Strona
181
ulegać anihilacji z elektronami, w wyniku czego powstają dwa
fotony o łącznej energii 1.02 MeV. W następnym etapie cyklu
jądro deuteru 21 D (reakcja 19.33) łączy się z kolejnym
protonem, w wyniku czego powstaje jądro helu 3He:
2
1
1
3
D

H

He
γ
1
2
(19.34)
Energia wydzielana w tym etapie cyklu wodorowego wynosi
5.49 MeV. Następnie dwa jądra helu 3He łączą się ze sobą,
tworząc jądro helu 42 He . W procesie tym powstają również dwa
protony oraz wydzielana jest energia 12.86 MeV:
3
2
He 23 He42 He11 H11 H
(19.35)
Ponieważ pomiędzy jądrami występują znaczące siły
odpychania elektrostatycznego, do zajścia reakcji syntezy
niezbędna jest wysoka temperatura i ciśnienie. Warunki takie
spełnione są we wnętrzu gwiazd, natomiast odtworzenie ich na
Ziemi jest niezwykle trudne. Warunki niezbędne do
przeprowadzenia kontrolowanej reakcji syntezy jądrowej
uzyskuje się w skali laboratoryjnej w tzw. tokamakach –
specjalnych komorach, w których materia w stanie plazmy o
temperaturze rzędu 108 K jest zamknięta w polu
magnetycznym. Utrzymanie tak gorącej plazmy w pułapce
magnetycznej z daleka od ścian komory jest jednak niezwykle
kosztowne energetycznie, tak że tokamaki zużywają
wielokrotnie więcej energii niż produkują.
Energię syntezy jądrowej wykorzystywano natomiast w
przeszłości do celów wojskowych. W tak zwanej bombie
termojądrowej do wytworzenia warunków niezbędnych do
zajścia reakcji syntezy wykorzystywana jest reakcja
rozszczepienia. Każda bomba termojądrowa zawiera zatem,
obok izotopów lekkich takich jak deuter, tryt i lit, również
pierwiastki ciężkie takie jak uran i pluton. Wybuch bomby
jądrowej pełni w tym przypadku rolę zapalnika dla reakcji
syntezy, z której można uzyskać znacznie większą energię (na
jeden nukleon) niż z reakcji rozszczepienia paliwa jądrowego o
identycznej masie. Energia uzyskana podczas wybuchu bomby
termojądrowej może przekraczać 1016 J.
Strona 182
Podstawy Fizyki II
Strona
183
20
Elementy mechaniki
kwantowej
W tym rozdziale:
Strona 184
o
Właściwości falowe materii
o
Zasada nieoznaczoności Heisenberga
o
Funkcja falowa i równanie Schrödingera
o
Rozwiązania równania Schrödingera
o
Kwantowy model atomu
Podstawy Fizyki II
20.1. Właściwości falowe
materii
W rozdziale 18 pokazaliśmy, że na początku XX wieku
ówczesna fizyka, dziś nazywana fizyką klasyczną, nie potrafiła
wyjaśnić
zjawisk
oddziaływania
promieniowania
elektromagnetycznego z materią – emisji (promieniowanie
ciała doskonale czarnego), absorpcji (zjawisko fotoelektryczne)
oraz rozpraszania (efekt Comptona). Wyjaśnienie tych zjawisk
okazało się możliwe tylko wtedy, gdy będziemy rozważać
promieniowanie elektromagnetyczne jako strumień fotonów.
Oznaczało to, że światło posiada dualną naturę i w procesach
rozchodzenia się ujawnia swoją falową, a w procesach
oddziaływania korpuskularną naturę.
Fale de Brogliea
W rozdziale 18.3 przedstawiliśmy również tzw. hipotezę de
Brogliea:
Nie tylko promieniowanie elektromagnetyczne ma dualną
naturę korpuskularno-falową, ale również obiekty materialne
mają dualną naturę korpuskularno-falową — oprócz właściwości
korpuskularnych posiadają także właściwości falowe.
Długość fali, którą możemy przypisać cząstkom kwantowym
(fale materii), zależy od pędu tak samo jak w przypadku
promieniowania elektromagnetycznego: 

h
p
.
Właściwości falowe elektronów zostały po raz pierwszy
potwierdzone eksperymentalnie w 1927 roku przez Davissona i
Germera. W przeprowadzonym przez nich eksperymencie
wiązka elektronów padała na kryształ niklu i ulegała na nim
selektywnemu odbiciu. Okazało się, że rejestrowane w
Strona
185
detektorze natężenie elektronów rozproszonych na niklu zależy
od kąta obserwacji. Zależność ta jest analogiczna do
niezależnych
wyników
dyfrakcji
promieniowania
rentgenowskiego na tym krysztale. Wynik eksperymentu może
być wyjaśniony wyłącznie jako dyfrakcja fal związanych z
elektronami (dyfrakcja elektronów) na sieci krystalicznej niklu.
Co więcej wyznaczona przez Davissona i Germera długość tych
fal, na podstawie wzoru Braggów, jest zgodna z długością fali
elektronu przewidzianej przez de Brogliea.
Właściwości falowe cząstek wykorzystuje się np. w
mikroskopach elektronowych. Zmieniając pęd elektronów
można wpływać na długość fal de Brogliea elektronów, tak żeby
uzyskać długości fali mniejsze niż te z zakresu światła
widzialnego. Dzięki temu mikroskopy elektronowe posiadają
większą rozdzielczość niż klasyczne mikroskopy optyczne.
Fale de Brogliea i model Bohra budowy atomu wodoru
Przypomnijmy drugi postulat Bohra, który mówił, że elektrony
mogą się poruszać tylko po takich orbitach, dla których ich
orbitalny moment pędu jest równy całkowitej wielokrotności
h 2 :
me v r  n
h
2
(20.1)
Zgodnie z hipotezą de Brogilea elektronowi poruszającemu się
po takiej orbicie elektronowej można przypisać długość fali
e 
h
me v
. Wówczas zależność 20.1 można zapisać w postaci:
2 r  n e
(20.2),
gdzie r oznacza promień dozwolonej orbity elektronowej, n jest
liczbą całkowitą, zaś λe jest długością fali de Brogliea elektronu.
W atomie wodoru dozwolone są tylko takie orbity, na obwodzie
których może się zmieścić całkowita wielokrotność długości fal
de Bogliea elektronów.
Strona 186
Podstawy Fizyki II
Możemy również powiedzieć, że z elektronem znajdującym się
na orbicie elektronowej (elektron związany) związana jest fala
stojąca. W przypadku elektronów swobodnych natomiast,
będziemy mieli do czynienia z falami biegnącymi.
Prawdopodobieństwo i niepewność - zasada
nieoznaczoności Heisenberga
W
klasycznej
mechanice
Newtonowskiej
cząsteczki
traktowaliśmy jako obiekty punktowe a ich ruch opisywaliśmy
podając trzy współrzędne przestrzenne położenia oraz trzy
składowe wektora prędkości. Żeby wyznaczyć położenie obiektu
w kolejnej chwili czasu niezbędne jest przy tym wyznaczenie
wszystkich tych wielkości dowolnie dokładnie. W przypadku
jednak, gdy zaczynamy rozważać odpowiednio małą skalę
pojawiają się podstawowe ograniczenia w precyzji wyznaczenia
położenia i prędkości.
Z punktu widzenia mechaniki kwantowej brak możliwości
przeprowadzenia pomiarów z dowolną dokładnością nie jest
wyłącznie wynikiem nieodpowiedniej dokładności urządzeń
pomiarowych a w istocie jest nieodłączna cechą otaczającego
nas świata.
Po pierwsze istnieje interakcja pomiędzy badanym obiektem a
badającym go urządzeniem. Czyli nie jest możliwe
przeprowadzenie pomiaru jakiegoś obiektu bez zaburzenia jego
ruchu przynajmniej w małym stopniu. Jako przykład
rozważmy piłkę pingpongową poruszającą się w całkowicie
ciemnym pomieszczeniu. Żeby określić jej położenie możemy
spróbować dotknąć jej ręką, ale wówczas niewątpliwie
wpłyniemy na jej ruch – zatrzymamy ją albo odbije się od
naszej ręki. Ten sam efekt wpływania na ruch piłki, choć w
znacznie mniejszym stopniu, wystąpi również, gdy użyjemy
światła do oświetlenia piłki i w ten sposób wyznaczymy jej
położenie. Żeby zauważyć piłkę przynajmniej jeden foton musi
się od niej odbić. Pęd pojedynczego fotonu jest znacznie
mniejszy niż pęd piłeczki pingpongowej i podczas tego
zderzenia ruch piłeczki nie ulegnie zmianie. Ale kiedy
Strona
187
będziemy badać znacznie mniejszy obiekt np. elektron, to
wówczas zderzenie z fotonem może wywierać znaczący wpływ
na jego ruch.
Drugim
czynnikiem
wpływającym
na
dokładność
przeprowadzanych pomiarów jest dualna korpuskularnofalowa natura materii. Rozpatrzmy teraz elektron, którego
ruch będziemy chcieli zbadać za pomocą fotonów. Zgodnie z
rozważaniami przeprowadzonymi w rozdziale 16 (optyka
falowa) wiemy, że nie da się rozróżnić szczegółów obiektu
mniejszych niż długość fali stosowanego promieniowania. W
związku z tym, żeby określić położenie badanego przez nas
obiektu (elektronu) z jak największą dokładnością należy użyć
promieniowania o jak najmniejszej długości fali. Ale fali o
małej długości odpowiadać będzie duża wartość pędu (p = h/λ),
która może być przekazana elektronowi podczas pomiaru.
Jeżeli jednak pomiaru dokonamy za pomocą fotonów o małym
pędzie, czyli dużej długości fali de Brogliea, to wprawdzie ich
oddziaływanie na badany obiekt będzie małe, ale niestety
również położenie elektronu określone będzie mało precyzyjnie.
Przedstawione powyżej rozumowanie pokazuje, że niepewność
określenia położenia (Δx) i pędu (Δpx ) obiektu są ze sobą
powiązane, co jest treścią zasady nieoznaczoności Heisenberga:
Położenie i pęd cząstki nie mogą być jednocześnie określone z
dowolną dokładnością.
Im mniejsza jest niepewność (nieoznaczoność) położenia
cząstki tym większa jest nieokreśloność (nieoznaczoność) jej
pędu.
x p x   2
(20.3)
Przypomnijmy, że stosowany w mechanice kwantowej symbol ħ
(h kreślone) oznacza stała równą:   h 2 .
W trójwymiarowym przypadku powyższą nierówność należy
napisać dla każdej współrzędnej:
Strona 188
Podstawy Fizyki II
x p x   2
y p y   2
(20.4)
z p z   2
Należy zaznaczyć przy tym, że zasada nieoznaczoności
Heisenberga nie odnosi się do iloczynów mieszanych np.
x p y . Współrzędną x położenia obiektu oraz jego pęd
wzdłuż osi y możemy wyznaczyć jednocześnie z dowolną
dokładnością.
Przykład:
Rozpatrzmy piłkę o masie m = 150 g poruszającą się z
prędkością v = 30 m/s (około 100 km/h). Jeżeli założymy, że
prędkość tę możemy zmierzyć z dokładnością Δv = 1 m/s, to
nieoznaczoność pędu tej piłki wynosi Δp = 0.15 kg m/s. Zgodnie
z zasadą nieoznaczoności Heisenberga położenia tej piłki nie
możemy określić z dokładnością większą niż:
x 
 2 1.06  10 34 Js

 3.5  10 34 m
p
2  0.15 kgsm
(20.5)
Wyznaczona przez nas wartość jest prawie 20 rzędów wielkości
mniejsza niż rozmiar jądra atomowego. Zasada nieoznaczoności
jest spełniona dla wszystkich ciał, ale jej rozważanie dla
obiektów makroskopowych nie ma sensu.
Zasada nieoznaczoności Heisenberga odnosi się również do
czasu i energii:
E t   2
(20.6),
gdzie ΔE oznacza nieoznaczoność wyznaczenia energii cząstki
(np. elektronu na orbicie w atomie), zaś Δt ma sens czasu życia
cząstki na danym poziomie energetycznym. Jeżeli zatem
rozpatrzymy stan podstawowy elektronu, na którym elektron
przebywać będzie nieskończenie długo, t   , to jego energia
może być wyznaczona dokładnie ΔE = 0 (ostry poziom
energetyczny). Wzbudzone poziomy energetyczne, które są
Strona
189
metastabilne, zgodnie z powyższą zależnością ulegają rozmyciu
– energia może być określona z pewną niejednoznacznością.
Zgodnie z zasadą nieoznaczoności Heisenberga, jeżeli
potraktujemy elektron (w ogólności materię) jako cząstkę
materii, to wtedy nie będziemy mogli jednocześnie
jednoznacznie określić jego położenia oraz pędu. Warto też
zaznaczyć, że w klasycznej mechanice Newtonowskiej mówimy
o determinizmie – jeżeli znamy warunki początkowe (położenie
oraz prędkości) oraz wypadkową siłę działającą na elektron to
możemy jednoznacznie wyznaczyć jakie będą kolejne jego
położenia. Wedle mechaniki kwantowej natomiast istnieją
różne prawdopodobieństwa, że elektron ten dotrze do różnych
punktów przestrzeni a więc zachowanie elektronu jest
nieprzewidywalne. Jeżeli zasady mechaniki kwantowej
zastosujemy do obiektów makroświata, np. dla piłki rzuconej
poziomo w polu grawitacyjnym Ziemi, otrzymamy bardzo duże
prawdopodobieństwo, że będzie się ona poruszała dobrze
znanym torem parabolicznym. Ale według mechaniki
kwantowej nie mamy jednak pewności takiego zachowania –
istnieje niezwykle małe, bliskie zera prawdopodobieństwo
odchyleń jej ruchu od toru parabolicznego.
20.2. Funkcja falowa i równanie
Schrödingera
Funkcja falowa
Jak pokazaliśmy w poprzednim rozdziale w skali mikroświata
wszelkie pomiary wprowadzają niekontrolowane zakłócenia tak
wielkie, że nie jest możliwe dokładne określenie stanu układu,
tj. wartości położenia i pędu. Okazuje się, że wiele właściwości
takich małych obiektów może być wówczas opisane jedynie za
pomocą prawdopodobieństwa.
W poprzednich rozdziałach fale mechaniczne np. falę na wodzie
opisywaliśmy podając wychylenie y (x,t) z położenia równowagi
Strona 190
Podstawy Fizyki II
punku o współrzędnej x w chwili czasu t. Z kolei w przypadku
fali elektromagnetycznej wyznaczamy wartość wektora

natężenia pola elektrycznego E x ,t  w puncie x i w chwili t.
W ogólności moglibyśmy powiedzieć, że do opisu fali niezbędne
jest określenie wartości pewnej funkcji falowej Ψ (y dla fali
mechanicznej, E dla fali elektromagnetycznej) zależnej od

położenia i czasu: Ψ  Ψ r ,t . W mechanice kwantowej
mówimy o falach – falach materii i do ich opisu stosować
będziemy funkcję falową Ψ. Żeby wyjaśnić sens fizyczny takiej
zespolonej funkcja falowa Ψ odnoszącej się do fal materii
przypomnijmy
sobie
kilka
informacji
na
temat
korpuskularnych i falowych właściwości światła. W przypadku

fali elektromagnetycznej jej funkcja falowa, E x ,t  , opisuje
rozkład pola elektrycznego w przestrzeni i w czasie. W
rozdziale 15 pokazaliśmy, że natężenie światła jest
proporcjonalne do kwadratu amplitudy natężenia pola
elektrycznego I  E 2 . Mówiliśmy również, że natężenie
światła jest proporcjonalne do liczby fotonów docierających w
jednostce czasu do jednostkowej powierzchni. Można również
powiedzieć, że natężenie światła jest proporcjonalne do
prawdopodobieństwa znalezienia fotonu w pobliżu punktu
(detektora).
W przypadku fal materii sama w sobie funkcja falowa Ψ nie ma
sensu fizycznego. Sens fizyczny ma natomiast, w analogii do
2
fali elektromagnetycznej, kwadrat jej modułu Ψ .
Kwadrat
modułu
funkcji
falowej
oznacza
gęstość
prawdopodobieństwa znalezienia cząstki w określonym miejscu
i czasie.
Jest to tak zwana probabilistyczna interpretacja funkcji falowej
zaproponowana w 1927 roku przez Maxa Borna. Żeby
wyznaczyć prawdopodobieństwo P znalezienia w chwili t w
objętości V cząstki opisywanej funkcją falową Ψ, należy gęstość
prawdopodobieństwa scałkować po interesującym nas obszarze
V:
Strona
191

P V ,t    Ψ r ,t  d 3 r
2
(20.7),
V
gdzie d3r oznacza całkowanie po trzech wymiarach przestrzeni
dx, dy oraz dz. Należy przy tym pamiętać, że
prawdopodobieństwo znalezienia cząstki gdziekolwiek jest


2
równe 1 (  Ψ r ,t d 3 r  1 ) co oznacza, że funkcja falowa jest
 

unormowana.
Funkcja falowa stanowi pełną informację o stanie układu
kwantowego.
Równanie Schrödingera
Równanie Schrödingera jest fundamentalnym równaniem
mechaniki kwantowej i pełni podobnie kluczową rolę jak
zasady dynamiki Newtona w mechanice czy równania
Maxwella w elektrodynamice. Rozwiązaniem tego równania
jest funkcja falowa. Jak pokażemy później rozwiązanie
równania Schrödingera, a więc wyznaczenie funkcji falowej,
pozwala nam opisać i zrozumieć właściwości każdego układu
kwantowo-mechanicznego np. atomów, cząstek, elektronów w
ciałach stałych.
Należy podkreślić, że równanie Schrödingera nie może być
wyprowadzone a zostało zapostulowane w 1926 roku przez
Erwina Schrödingera i pełni rolę zasady fizycznej.
Najprostszą formę równania Schrödingera otrzymujemy dla
cząstki o masie m poruszającej się tylko w jednym wymiarze x
w polu sił stacjonarnych (niezmiennych w czasie)
wytwarzających potencjał U (x) – niezależne od czasu równanie
Schrödingera:
 2 d 2Ψ x 

U x Ψ x   E Ψ x 
2m dx 2
(20.8),
W ogólnej postaci potencjał sił, w jakim znajduje się cząstka
może zmieniać się w czasie a ruch cząstki może odbywać się w
Strona 192
Podstawy Fizyki II
trzech kierunkach. Otrzymujemy wówczas tzw. zależne od
czasu równanie Schrödingera:


Ψ r ,t 
2 2 
(20.9),
i

 Ψ r ,t  U x Ψ r ,t 
t
2m
gdzie  2
jest laplasjanem, czyli operatorem sumowania
drugich pochodnych po współrzędnych:  2 
2
2
2


x 2 y 2 z 2
Gdy energia potencjalna nie zależy od czasu to rozwiązanie
równania Schrödingera można przedstawić jako iloczyn dwóch
funkcji, z których jedna zależy tylko od położenia a druga tylko
od czasu:


Ψ r ,t   r e it
(20.10),
W dalszej części skryptu poszukiwać będziemy tej składowej

zależnej od współrzędnych  r , pamiętając, że uzyskany
 
wynik należy pomnożyć jeszcze przez część czasową e i t .
20.3. Rozwiązania równania
Schrödingera dla wybranych
potencjałów
Należy podkreślić, że równanie Schrödingera pozwala opisać
układy
kwantowo-mechaniczne,
ale
analityczne
jego
rozwiązanie możliwe jest tylko w bardzo uproszczonych
przypadkach. Szczegóły matematyczne rozwiązania można
znaleźć w większości akademickich podręczników do fizyki np.
„Podstawy fizyki”, W. Bogusz, J. Garbarczyk, F. Krok, Oficyna
Wydawnicza Politechniki Warszawskiej, „Podstawy Fizyki” D.
Halliday, R. Resnick, J. Walker, PWN.
Strona
193
Sposób rozwiązania równania Schrödingera, także dla
uproszczonych układów wykracza poza ramy niniejszego
skryptu. Skoncentrujemy się natomiast na ciekawych i
ważnych wnioskach, które wynikają z tych rozwiązań.
Potencjał stały
Cząstka znajdująca się w polu o stałym potencjale U (stałej
energii potencjalnej) nie doznaje działania sił, jest więc cząstką
swobodną. Wobec nieobecności sił cząstka nie będzie doznawała
zmiany stanu ruchu. Jej prędkość i energia będą stałe. Energię
potencjalną i potencjał U możemy wyznaczać względem takiego
poziomu odniesienia, żeby można było przyjąć, że ten potencjał
jest równy zeru. W efekcie równanie Schrödingera niezależne
od czasu dla jednego wymiaru zapisać można w postaci:

 2 d 2 x 
 E  x 
2m dx 2
(20.11)
Rozwiązaniem tego równania jest fala biegnąca:
E 
 
Ψ x ,t   A exp i   kx  t 
 
 
(20.12),
gdzie liczba falowa k (lub moduł wektora falowego) w tym
przypadku wynosi: k 
2mE
.

Próg potencjału
Rozważmy teraz cząstkę o energii E, która napotyka na swej
drodze próg potencjału o wysokości V0, przy czym energia
cząstki jest większa niż wysokość progu E > V0. Zauważmy, że
klasyczna cząstka mająca taką energię kinetyczną pokonałaby
z pewnością skok potencjału i dla niej współczynnik przejścia
byłby równy jedności. Tymczasem rozwiązanie równania
Schrödingera dla obszaru poniżej progu zawiera falę zarówno
poruszająca się w kierunku progu jak i w przeciwnym (fala
padająca i odbita). Oznacza to, że według mechaniki kwantowej
istnieje pewne prawdopodobieństwo, że cząstki odbiją się od
tego progu. Co jeszcze ciekawsze, cząstka kwantowa może ulec
Strona 194
Podstawy Fizyki II
odbiciu od progu potencjału, nawet jeżeli będzie z niego
spadała.
Z kolei dla E < V0 klasyczna cząstka z pewnością odbiłaby się
od progu. Dla cząstki kwantowej prawdopodobieństwo odbicia
cząstki również równe jest jedności (jest pewne, że cząstka się
odbije), ale to odbicie nie zachodzi dokładnie w punkcie gdzie
znajduje się próg, jak dla cząstki klasycznej. Istnieje skończone
prawdopodobieństwo znalezienia cząstki wewnątrz progu,
które to prawdopodobieństwo maleje szybko z odległością. Jeśli
zatem zamiast nieograniczonego przestrzennie progu
potencjału mielibyśmy barierę potencjału o skończonej
szerokości, to dla cząstki kwantowej o energii mniejszej od
wysokości bariery będzie istniała szansa przejścia przez tę
barierę.
Bariera potencjału
Rozpatrzmy barierę potencjału o wysokości V0 i szerokości a, do
której zbliża się cząstka kwantowa o energii mniejszej niż
wysokość bariery, E < V0. Podobnie jak w poprzednim
przypadku rozwiązujemy równania Schrödingera dla każdego
obszaru, a po uwzględnieniu warunków brzegowych (ciągłości
funkcji falowej w całym obszarze) możemy wyznaczyć
współczynnik przejścia przez taką prostokątną barierę
potencjału:


2a
1
2mV 0  E  2 
 

T  exp 
(20.13),
gdzie a oznacza szerokość bariery, V0 jej wysokość zaś E jest
energią cząstki, E < V0. Przejście cząstki przez barierę
potencjału przewyższającą energię cząstki nazywane jest
efektem tunelowym. Efekt ten pozwala wyjaśnić naturę
procesu promieniotwórczego rozpadu α, w tym także uzasadnić
różną stabilność jąder atomowych, wyjaśnić działanie
półprzewodnikowej diody tunelowej, nadprzewodnikowego
złącza Josephsona, i in.
Strona
195
Studnia potencjału
Rozpatrzmy teraz jednowymiarową studnię potencjału o
nieskończonej głębokości i szerokości a. Założymy, że energia
potencjalna wewnątrz studni, tj. dla 0 < x < a jest równa zeru,
a poza tym obszarem jest nieskończenie wielka. Klasyczna
cząstka umieszczona w tej studni mogłaby spoczywać w
dowolnym miejscu wewnątrz studni lub poruszać się z dowolną
prędkością odbijając się sprężyście od ścianek studni.
Zachowanie cząstki kwantowej opisane będzie funkcją falową
postaci:
 x   A sink x 
(20.14),
gdzie A jest stałą, zaś liczba falowa k musi przyjmować takie
wartości, żeby funkcja falowa wynosiła zero przy ściankach
studni (warunki brzegowe). Z warunków brzegowych wynika
więc, że dla prawej ścianki studni (dla x = a) argument funkcji
sinus musi być równy całkowitej wielokrotności liczby π:
ka  n
n
k
a
2 2a



 a n
k
n
2
(20.15),
Otrzymaliśmy w ten sposób, że wektor falowy a więc również
funkcja falowa mogą przyjmować tylko dyskretne wartości –
zależą od liczby naturalnej n. Skwantowanie funkcji falowej
wynika więc w naturalny sposób z rozwiązania równania
Schrödingera z uwzględnieniem warunków brzegowych. Liczbę
naturalną n będziemy nazywać liczbą kwantową. Funkcja
falowa będąca rozwiązaniem jest w istocie falą stojącą –
dozwolone są tylko takie długości fali λ, że wewnątrz studni o
szerokości a zmieści się całkowita wielokrotność połowy
długości fali. Funkcje falowe oraz kwadraty modułu funkcji
falowej
(prawdopodobieństwo
znalezienia
cząstki)
przedstawiono na Rysunku 20.1. Jak widać dla stanu n = 1
największe prawdopodobieństwo znalezienia cząstki kwantowej
jest na środku studni, podczas gdy dla cząstki klasycznej każde
położenie ma takie samo prawdopodobieństwo obsadzenia.
Strona 196
Podstawy Fizyki II
Rysunek 20.1. Funkcje falowe oraz kwadraty modułów funkcji falowych dla
nieskończonej studni potencjału.
Wartości energii, jakie może przyjmować cząstka znajdująca
się w nieskończonej studni potencjału wynoszą:
En 
n 2 h 2 n 2 2  2

8ma 2
2ma 2
n  1, 2, 3, ...
(20.16),
W powyższym wzorze również występuje liczba kwantowa n,
która może przyjmować tylko wartości całkowite 1, 2, 3… .
Zerowa wartość n = 0 nie jest dozwolona, gdyż wówczas funkcja
falowa była by równa zeru w całej przestrzeni, co oznaczałoby
brak cząstki. Tak więc, na podstawie rozwiązania równania
Schrödingera dla cząstki znajdującej się w nieskończonej
studni potencjału, otrzymaliśmy skwantowanie dozwolonych
poziomów energetycznych (Rysunek 20.2). Należy przy tym
zwrócić uwagę, że według uzyskanego rozwiązania najmniejsza
energia cząstki wcale nie jest równa zeru – energia ta
nazywana jest czasem energią drgań zerowych.
Strona
197
Rysunek 20.2. Funkcje falowe oraz poziomy energetyczne dla nieskończonej
studni potencjału.
Oscylator harmoniczny
Zagadnienie kwantowego oscylatora harmonicznego jest ważne
w teorii widm optycznych, drgań sieci krystalicznej i w teorii
ciepła molowego ciał stałych. Oscylator harmoniczny
(kwantowy) jest kolejnym przykładem cząstki kwantowej,
która jest związana. Tym razem jednak cząstka nie znajduje
się w nieskończonej studni potencjału o skończonej szerokości
tylko w polu sił sprężystych. Na cząstkę wychyloną z położenia
równowagi działać będzie siła F  k  x skierowana do
położenia równowagi i proporcjonalna do tego wychylenia.
Współczynnik k’ jest współczynnikiem sprężystości. Pole
potencjalne sprężystości opisane jest funkcją U x   12 k  x 2 .
Rozwiązanie równania Schrödingera dla oscylatora jest
znacznie trudniejsze matematycznie niż w przypadku
nieskończonej studni potencjału. Rozwiązanie to istnieje dla
wartości energii En spełniających warunek:
1
k 
1
E n   n   
  n   
2
m 
2

Strona 198
n  0,1, 2, ...
(20.17)
Podstawy Fizyki II
Zaznaczmy, że w powyższym rozwiązaniu liczba kwantowa n
może przyjmować wartości 0, 1, 2, … . Z powyższego wzoru
wynika, że zerowy poziom energii tzn. poziom dla n = 0 ma
wartość energii
E 0  12   12 h . Między poziomami
energetycznymi natomiast występuje stała różnica energii
E    h , dokładnie taka, jaką zapostulował Planck, żeby
wyjaśnić zjawisko promieniowania ciała doskonale czarnego
(Rozdział 18).
Warto podkreślić, że typowe oddziaływania międzyatomowe dla
niewielkich wychyleń z położeń równowagi mogą być opisane
funkcją paraboliczną, a więc wówczas zależność 20.14 opisywać
będzie skwantowanie energii atomów.
20.4. Kwantowy model atomu
Model atomu wprowadzony przez Bohra (Rozdział 19.1)
stanowił istotny postęp w stosunku do modelu Rutherforda.
Niemożliwe było jednak dokładne obliczenie położenia linii
widmowych w atomach wieloelektronowych, nie wyjaśniał
również różnych natężeń promieniowania obserwowanych dla
poszczególnych linii widmowych. Pełny opis konfiguracji
elektronowej atomu stał się możliwy dopiero dzięki tak zwanej
nowej teorii kwantowej, za twórców której uważa się
Heisenberga i Schrödingera.
Liczby kwantowe
Przedstawione w poprzednim rozdziale rozwiązania równania
Schrödingera dotyczyły uproszczonego jednowymiarowego
modelu potencjału. W celu uzyskania rzeczywistego modelu
atomu potencjał wytwarzany przez jądro atomowe należy
opisać w przestrzeni trójwymiarowej we współrzędnych
sferycznych. Rozwiązując równanie Schrödingera, zapisane w
tym samym sferycznym układzie odniesienia, możemy
wyznaczyć funkcje falowe elektronów okrążających jądro
Strona
199
atomowe. Nie będziemy w tym miejscu przedstawiać
szczegółowego
zapisu
rozwiązania
takiego
równania,
koncentrować się natomiast będziemy na wnioskach
wynikających z tego rozwiązania.
Funkcja falowa, w sferycznym układzie współrzędnych, może
być przedstawiona, jako iloczyn trzech funkcji zależnych tylko
od poszczególnych współrzędnych tego sferycznego układu
współrzędnych  r,θ,   R r Θ θ Φ   . Podobnie jak to
było w rozważanych wcześniej przypadkach jednowymiarowych
poszukując rozwiązania równania Schrödingera dla każdej z
tych funkcji (R, Θ, Φ) należy uwzględnić warunki brzegowe. W
efekcie funkcja falowa zależeć będzie od pewnych liczb
całkowitych, które będziemy nazywali liczbami kwantowymi.
o
Główna liczba kwantowa n (n = 1, 2, 3 ...) związana jest
ze składową radialną R(r) funkcji falowej elektronu.
Określa ona numer orbity (powłoki) elektronowej i
kwantuje energię elektronu (zgodnie z zależnością
19.12).
o
Poboczna (lub orbitalna) liczba kwantowa (l = 0, 1, ...,
n − 1) jest związana z wartością bezwzględną
orbitalnego momentu pędu: L  l l  1 
Poboczna liczba kwantowa określa numer podpowłoki,
na której znajduje się elektron.
o
Magnetyczna liczba kwantowa (ml = -l, ..., -1, 0, 1, ..., l)
jest związana z przestrzenną orientacją wektora
orbitalnego momentu pędu. Opisuje ona rzut
orbitalnego momentu pędu na wybraną oś: Lz = m ħ
o
Oprócz
trzech
powyższych
liczb
kwantowych
związanych z funkcjami R, Θ, Φ, do opisu elektronów w
atomie, niezbędna jest jeszcze jedna liczba kwantowa.
Magnetyczna spinowa liczba kwantowa (ms = ½ , − ½)
pokazuje, w którą stronę skierowany jest spin. Spin jest
pewną stałą cechą danej cząstki elementarnej − w
przypadku elektronu wynosi on 1/2. Spin jest związany
z „wewnętrznym” momentem pędu i momentem
magnetycznym elektronu.
Strona 200
Podstawy Fizyki II
Zasady obsadzania poziomów elektronowych
Wypełnienie powłok elektronami (zwane również obsadzeniem)
dla atomu danego pierwiastka następuje według następujących
zasad:

Jako pierwsze obsadzane są poziomy o mniejszej
energii. Obsadzenie dla całego atomu reprezentuje stan
o najniższej możliwej energii potencjalnej.

W atomie żadne dwa elektrony nie mogą mieć tej samej
czwórki liczb kwantowych: n, l, ml, ms. Zasada ta
nazywana jest zakazem Pauliego.
Należy w tym miejscu zwrócić uwagę na fakt, że energia
danego elektronu zależy nie tylko od głównej liczby kwantowej
n, ale częściowo również od pobocznej liczby kwantowej l.
Rysunek 20.3. Diagram obrazujący kolejność obsadzania poszczególnych
podpowłok elektronowych.
Strona
201
Dla małej wartości l orbity mogą przybierać kształt eliptyczny.
W takim przypadku elektron może w trakcie swojego obiegu
dookoła jądra znajdować się (średnio) bliżej, niż elektrony z
niższej powłoki, ale o dużej wartości liczby pobocznej l.
Elektron taki doznaje mniejszego ekranowania ze strony
elektronów znajdujących się na niższych powłokach, zatem
stan o wysokiej liczbie n i małej l może mieć niższą energię od
stanu o mniejszej n i dużej l (Rysunek 20.3). Zjawisko to
nazywane jest efektem przesłaniania.
Tabela 20.1 Liczby kwantowe określające możliwe stany elektronów na drugiej
powłoce.
N
2
2
2
2
2
2
2
2
L
0
0
1
1
1
1
1
1
ml
0
0
-1
-1
0
0
1
1
ms
½
−½
½
−½
½
−½
½
−½
Policzmy teraz, ile elektronów może znaleźć się na
poszczególnych powłokach. Dla powłoki o n = 1 mamy l = 0,
ml = 0 i dwie wartości spinu (ms = ½ , − ½) – zatem na powłoce
tej mogą znajdować się maksymalnie dwa elektrony. Na
kolejnej powłoce o n = 2 możemy mieć dwie wartości liczby
pobocznej l (l = 0 lub l = 1). Dla l = 0 mamy jedną wartość liczby
ml = 0. Zatem w stanie o n = 2, l = 0 mogą znajdować się dwa
elektrony, różniące się od siebie wartością magnetycznej
spinowej liczby kwantowej. Dla l = 1 możemy mieć trzy
wartości liczby magnetycznej ml = −1, 0 lub 1. Biorąc pod
uwagę magnetyczną spinową liczbę kwantową, w stanie o n = 2
i l = 1 może znajdować się sześć elektronów. Suma możliwych
obsadzeń na drugiej powłoce wynosi zatem 8. Wartości liczb
kwantowych dla poszczególnych stanów przedstawia Tabela
20.1. Podobne rozważania moglibyśmy przeprowadzić dla
powłok o wyższych wartościach głównej liczby kwantowej. Dla
każdej powłoki n liczba kwantowa l może przyjmować n
wartości, a dla każdej wartości l mamy 2l+1 wartości m. Dla
Strona 202
Podstawy Fizyki II
n = 3 otrzymalibyśmy 18 możliwych stanów a dla n = 4 liczba
stanów wynosi 36. Można zatem podać ogólny wzór na liczbę
elektronów xn na powłoce n:
x n  2n 2
(20.18)
Przyjęto stosować oznaczenia literowe K, L, M, N, O, P, Q dla
liczb kwantowych n = 1, 2, 3, 4, 5, 6, 7 odpowiednio. Z kolei
liczbom l = 0, 1, 2, 3, 4, 5, 6 odpowiadają oznaczenia literowe s,
p, d, f, g, h, i. Do zapisu konfiguracji elektronowej atomu
danego pierwiastka za pomocą tych oznaczeń stosuje się
następującą konwencję:

podajemy (liczbowo) główną liczbę kwantową

za nią zapisujemy (literowo) poboczną liczbę kwantową

w indeksie górnym zapisujemy liczbę elektronów, które
znajdują się w stanie określonym przez dwie podane
uprzednio liczby kwantowe.
Jako przykład podajmy konfigurację elektronową argonu Ar.
Liczba atomowa Z wynosi w tym przypadku 18, zatem
pierwiastek ten posiada 18 elektronów. Zapis ma postać:
1s2 2s2 2p6 3s2 3p6
(20.19),
co oznacza, że dwa elektrony znajdują się w stanie o n = 1 i
l = 0 (1s2), dwa w stanie o n = 2 i l = 0 (2s2), sześć w stanie o
n = 2 i l = 1 (2p6), dwa w stanie o n = 3 i l = 0 (3s2) oraz sześć w
stanie o n = 3 i l = 1 (2p6).
Dla porównania zapis konfiguracji elektronowej srebra (Z = 47)
ma postać: 1s22s22p63s23p63d104s24p64d105s1
Orbitale
Jak już wielokrotnie wspominaliśmy kwadrat modułu funkcji
falowej elektronu określa prawdopodobieństwo znalezienia tego
elektronu w danym punkcie przestrzeni. Rozwiązując równanie
Schrödingera dla elektronów w atomie wyznaczamy więc
przestrzenny
rozkład
prawdopodobieństwa
znalezienia
elektronu w pobliżu jądra atomowego. Obszary o dużej gęstości
Strona
203
prawdopodobieństwa tworzą tzw. orbitale atomowe. Kształt
orbitali zależy od wartości liczb kwantowych n, l, ml. Kształt
ten ma duże znaczenie dla tworzenia się wiązań chemicznych,
a w konsekwencji kształtu cząsteczek chemicznych. Dla
przykładu rozpatrzmy elektron w stanie podstawowym atomu
wodoru (n = 1, l = 0, ml = 0). Funkcja falowa w takim stanie
kwantowym ma tylko składową radialną. Rozkład radialnej
gęstości
prawdopodobieństwa
(Rysunek 20.4)
posiada
maksimum dla odległości a0 równej promieniowi Bohra (Wzór
19.11). Tak więc, według mechaniki kwantowej, nie możemy
jednoznacznie określić położenia elektronu – istnieje pewne
prawdopodobieństwo zarówno znalezienia elektronu bardzo
blisko jak i bardzo daleko od jądra atomowego, ale największe
prawdopodobieństwo otrzymujemy dla odległości równej
kołowej orbicie modelu Bohra.
Rysunek 20.4. Rozkład radialnej gęstości prawdopodobieństwa dla stanu
podstawowego atomu wodoru.
Rozszczepienie linii widmowych
Istnieje szereg bezpośrednich dowodów doświadczalnych
potwierdzających słuszność modelu kwantowego. Zależność
energii elektronu nie tylko od liczby głównej n, ale również od
pobocznej liczby kwantowej l jest wyraźnie widoczna w
układzie linii emisyjnych poszczególnych pierwiastków.
Istnienie magnetycznej spinowej liczby kwantowej jest z kolei
manifestowane w tak zwanej strukturze subtelnej widma
promieniowania.
Obserwuje
się
rozszczepienie
linii
Strona 204
Podstawy Fizyki II
widmowych, czyli zamiast pojedynczej linii obserwujemy dwie
linie położone bardzo blisko siebie, które jest związane z tak
zwanym oddziaływaniem spin–orbita. Względne ustawienie
spinowego i orbitalnego momentu magnetycznego elektronu
wpływa na niewielką zmianę całkowitej energii elektronu
znajdującego się w stanie kwantowym n i l. Takie
rozszczepienie linii obserwowane np. w liniach emisyjnych sodu
(przejście ze stanu 4s do 3p) w zakresie światła widzialnego.
W zewnętrznym polu magnetycznym energia elektronu zależy
również od orbitalnej liczby magnetycznej ml. Zatem po
umieszczeniu atomów w polu magnetycznym obserwuje się
rozszczepienie poziomów energetycznych elektronów i
dodatkowe linie widmowych (zjawisko Zeemana).
Strona
205
21
Fizyka ciała stałego
W tym rozdziale:
Strona 206
o
Wiązania chemiczne w ciele stałym
o
Struktura krystaliczna ciał stałych
o
Model pasmowy ciał stałych, energia
Fermiego
o
Urządzenia półprzewodnikowe
o
Lasery
Podstawy Fizyki II
Fizyka ciała stałego
W poprzednich rozdziałach podręcznika opisywaliśmy już, że
atom składa się z jądra atomowego i poruszających się wokół
niego elektronów. W tym rozdziale zajmiemy się
właściwościami ciał stałych jako układów wielu atomów.
Poznamy ich strukturę oraz dowiemy się, jakie są ich
właściwości elektryczne. Temu ostatniemu zagadnieniu
poświęcimy szczególną uwagę, ponieważ właściwości te
wykorzystywane
są
w
różnorodnych
urządzeniach
elektrycznych i elektronicznych np. tranzystorach, diodach,
termoparach, laserach, ogniwach elektrochemicznych. Warto
zaznaczyć, że chociaż trudno wyobrazić sobie funkcjonowanie
nowoczesnego społeczeństwa bez tych urządzeń to historia
większości z nich sięga zaledwie kilkudziesięciu lat.
Przypomnijmy, że cechy charakterystyczne ciała stałego
definiowaliśmy w Rozdziale 7. Mówiliśmy wówczas, że ciało
stałe charakteryzuje się ustalonym kształtem i objętością a
oddziaływania między atomami powodują, że ciała stałe
odkształcają się sprężyście pod wpływem naprężenia. Atomy w
ciele stałym ułożone są regularnie tworząc strukturę
krystaliczną, z uporządkowaniem dalekiego zasięgu.
21.1. Wiązania chemiczne
Wszystkie atomy dążą do uzyskania stanu o minimalnej
energii. W przypadku gazów szlachetnych powłoki elektronowe
są całkowicie zapełnione a taka struktura elektronowa
charakteryzuje się najniższą energią. W przypadku pozostałych
atomów to liczba elektronów na ostatniej powłoce elektronowej
– elektronów walencyjnych – jest czynnikiem decydującym o
właściwościach fizycznych i chemicznych pierwiastków. Jeśli
ostatnia powłoka jest zapełniona w niewielkim stopniu, dążąc
do minimalizacji energii, atom będzie „chętnie” oddawał
elektrony. Jeśli natomiast do zapełnienia powłoki brakuje
Strona
207
jednego lub dwóch elektronów, atom będzie „chętnie”
przyjmował elektrony by zapełnić tę powłokę elektronową i w
ten sposób obniżyć swoją całkowitą energię. Miarą zdolności
atomu do przyciągania elektronu jest jego elektroujemność lub
powinowactwo elektronowe. Zgodnie z tymi stwierdzeniami
pierwiastki posiadające niedobór elektronów będą miały dużą
elektroujemność,
a
pierwiastki
posiadające
nadmiar
elektronów – małą elektroujemność.
Przekazanie elektronu z jednego atomu do drugiego np.
elektronu atomu sodu (Na) do atomu chloru (Cl), może być
korzystne energetycznie dla obu atomów. Mechanizm taki jest
podstawą tworzenia wiązań chemicznych typu jonowego i
metalicznego. Wiązania te są stosunkowo silne a związki
chemiczne, w których występują takie wiązania charakteryzują
się wysoką temperaturą topnienia, co oznacza, że rozdzielenie
atomów wymaga dostarczenia dużej energii termicznej. Między
atomami mogą występować również siły oddziaływania
elektrostatycznego niezwiązane bezpośrednio ze zmianą
obsadzenia poziomów elektronowych atomu – w ten sposób
powstają wiązania van der Waalsa. Wiązania te są słabsze, a
struktury oparte na nich z reguły ulegają stopieniu w
stosunkowo niskich temperaturach.
W krystalicznych ciałach stałych na ogół występuje kilka
rodzajów wiązań chemicznych. W takim przypadku mówimy, że
wiązania maja charakter mieszany.
Potencjał wiązania
Energia jonu w sieci zależeć będzie od oddziaływań wszystkich
jonów na ten wybrany jon. Kształt krzywej potencjału zależy od
typu wiązania i struktury krystalicznej kryształów, jednak
zawsze możemy wyróżnić w nim część związaną z
oddziaływaniami
przyciągającymi
(odpowiadającymi
za
tworzenie wiązania) i odpychającymi (Rysunek 21.1.).
Strona 208
Podstawy Fizyki II
Rysunek 21.1. Schematyczny wykres potencjału oddziaływania jonów.
Zaznaczono potencjał związany z siłami przyciągającymi, odpychającymi i
odległość równowagową r0 odpowiadającą długości wiązania.
Te ostatnie powstają, kiedy atomy zbliżają się do siebie na tyle
blisko, że funkcje falowe elektronów zaczynają się nakładać.
Ponieważ zgodnie z zakazem Pauliego elektrony o takich
samych liczbach kwantowych nie mogą znajdować się obok
siebie powstają silne oddziaływania odpychające. Długość
wiązania wyznacza odległość między atomami w krysztale, dla
której siły przyciągające są równoważone przez odpychające (r0
na Rysunku 21.1.). W odległości równowagowej atomy znajdują
się w minimum potencjału. Zerwanie wiązania chemicznego i
swobodny ruch jonu następuje, gdy do układu dostarczona
zostaje energia, np. termiczna, większa od minimum potencjału
oddziaływania. Dlatego też na podstawie wartości temperatury
topnienia można oszacować energię wiązania materiału.
Strona
209
Wiązanie jonowe
Wiązanie jonowe występuje pomiędzy pierwiastkiem o
właściwościach metalicznych (o małej elektroujemności) i
pierwiastkiem niemetalicznym (o dużej elektroujemności).
Rysunek 21.2. Schemat struktury przestrzennej a) i powstawania pęknięć pod
wpływem naprężeń b) dla kryształu jonowego typu NaCl.
Przekazanie elektronu walencyjnego z atomu metalu atomowi
niemetalu jest korzystne energetycznie dla obu atomów. Atom
metalu, pozbawiony elektronu uzyskuje ładunek dodatni –
staje się jonem dodatnim, czyli kationem. Atom niemetalu,
który charakteryzować się będzie ładunkiem ujemnym,
nazywać będziemy anionem. Wiązanie jonowe związane jest z
siłami przyciągania elektrostatycznego pomiędzy powstałymi
kationami i anionami. Jako przykłady związków, w których
występuje wiązanie jonowe (kryształów jonowych), wymienić
można chlorek sodu NaCl (sól kuchenną) lub fluorek potasu
KF. Przykładowa struktura kryształu jonowego NaCl
przedstawiona jest na Rysunku 21.2a. Jony ułożone są
naprzemiennie tak, że najbliżsi sąsiedzi danego jonu mają
przeciwny znak ładunku niż jon. Kryształy jonowe
charakteryzują się wysoką temperaturą topnienia, np. około
Strona 210
Podstawy Fizyki II
800 OC dla chlorku sodu NaCl i 910 OC dla KF, co wskazuje na
dużą siłę wiązania jonowego. Jednocześnie są one kruche i
łatwo pękają. Jeżeli bowiem, pod wpływem dużego naprężenia,
dwie sąsiadujące warstwy kryształu ulegną przesunięciu,
naprzeciw siebie mogą znaleźć się jony nie przeciwnego, ale
tego samego znaku (Rysunek 21.2b). Wówczas warstwy będą
się odpychać a w miejscu przesunięcia warstw nastąpi
pęknięcie. Pomimo, że kryształy jonowe składają się z atomów
obdarzonych ładunkiem, jony te nie mogą jednak
przemieszczać się w strukturze. Brak swobodnych nośników
ładunku powoduje, że kryształy jonowe są zatem izolatorami.
Wiązanie kowalencyjne
W przeciwieństwie do wiązania jonowego, w którym elektron
ulegał całkowitemu przeniesieniu na sąsiadujący atom, w
przypadku wiązania kowalencyjnego mamy do czynienia
zawsze z parą elektronów ulokowanych pomiędzy atomami
tworzącymi wiązanie – ich funkcje falowe mają krótki zasięg.
Elektrony te muszą mieć przeciwny spin, żeby, zgodnie z
zakazem Pauliego, nie miały tego samego zestawu liczb
kwantowych. W każdym wiązaniu mogą brać udział tylko dwa
atomy, ale pomiędzy atomami mogą wielokrotnie występować
wiązania tego typu – na przykład w cząsteczce tlenu O2
występuje wiązanie podwójne a w cząsteczce azotu N2 wiązanie
potrójne.
Kolejną ważną cechą wiązań kowalencyjnych jest ich
kierunkowość. Ułożenie przestrzenne atomów jest takie, żeby
funkcje falowe elektronów tworzących wiązania przekrywały
się w jak najmniejszym stopniu. Jeśli więc w cząsteczce
występują dwa wiązania, atomy sąsiadujące ustawią się po
przeciwnych stronach atomu centralnego i mówimy wówczas,
że cząsteczki mają geometrię liniową. Jeśli centralny atom
wiąże się z sąsiadami przez trzy wiązania kowalencyjne,
najkorzystniejsze jest ich ustawienie w jednej płaszczyźnie
względem siebie w ten sposób, że kąt między nimi będzie równy
120O. Z taką konfiguracją mamy do czynienia w graficie. Atomy
węgla tworzą warstwy o strukturze heksagonalnej typu
Strona
211
„plastra miodu”. Warstwy te są bardzo wytrzymałe na
rozciąganie, a na ich strukturze oparte są zaawansowane
materiały technologiczne – grafen oraz nanorurki węglowe.
Natomiast pomiędzy sąsiednimi warstwami występują słabsze
wiązania, ulegające łatwemu zerwaniu i dlatego grafit jest
łatwo ścieralny. Z kolei, jeśli centralny atom wytwarza cztery
wiązania kowalencyjne, utworzą one tetraedr. Taką strukturę
ma m.in. diament, którego niezwykła twardość wynika
zarówno z siły wiązań pomiędzy atomami węgla jak i geometrii
struktury.
Wiązania kowalencyjne są zwykle silne, a kryształy
kowalencyjne mają wysoką temperaturę topnienia, która w
przypadku diamentu przekracza 3500 OC. Warto zaznaczyć, że
ten kierunkowy charakter wiązania ogranicza możliwość
przemieszczanie się nośników ładunku i w efekcie materiały o
wiązaniu kowalencyjnym są izolatorami lub półprzewodnikami.
Wiązanie metaliczne
Omawiając wiązanie jonowe wspominaliśmy już, że w
przypadku atomów metali korzystne energetycznie jest oddanie
elektronów znajdujących się na powłoce walencyjnej. Z kolei w
przypadku wiązania kowalencyjnego, ze względu na krótki
zasięg funkcji falowych elektronów, elektrony były
zlokalizowane między atomami. Istotą wiązania metalicznego
jest uwspólnianie elektronów walencyjnych między wszystkimi
atomami w krysztale metalu. W przypadku wiązania
metalicznego funkcje falowe elektronów walencyjnych mają
szeroki zasięg. W efekcie elektrony te nie są zlokalizowane i
mogą przemieszczać się swobodnie w strukturze materiału,
tworząc tak zwany gaz elektronów swobodnych. Metale są
zarówno dobrymi przewodnikami elektrycznymi, jak i
przewodnikami ciepła, ponieważ elektrony nie tylko przenoszą
ładunek elektryczny, ale także na skutek zderzeń
przekazywana jest energia.
Siła wiązania metalicznego zależy m.in. od liczby elektronów
walencyjnych atomów oraz stopnia upakowania struktury.
Typowym przykładem są tutaj metale z jednym elektronem
Strona 212
Podstawy Fizyki II
walencyjnym (metale alkaliczne), które mają stosunkowo
niskie temperatury topnienia nieprzekraczające 200 OC. W
wielu metalach wiązania mają charakter mieszany,
kowalencyjno-jonowy.
Metale odkształcają się sprężyście, ale przy odpowiednio
dużym naprężeniu mogą odkształcać się również plastycznie –
metale są kowalne. Pozbawione elektronów walencyjnych
atomy (rdzenie atomowe) tworzą warstwy, które pod wpływem
naprężenia
mogą
się
przemieszczać
bez
powstania
makroskopowych pęknięć, w czym wydatnie pomaga
znajdujący
się
pomiędzy
atomami
gaz
elektronów
walencyjnych.
Wiązanie wodorowe
W przypadku, w którym atom wodoru jest związany z silnie
elektroujemnym atomem wiązaniem kowalencyjnym, elektron
należący do atomu wodoru zostaje prawie całkowicie
przeniesiony na drugi atom. W efekcie atom wodoru staje się
protonem i może przyciągać znajdujące się w pobliżu atomy
naładowane ujemnie. Ze względu na niewielkie rozmiary
protonu, oddziaływanie może zachodzić maksymalnie z dwoma
takimi atomami. Wiązanie wodorowe jest znacznie słabsze niż
wiązanie
kowalencyjne
i
jest
podstawowym
typem
oddziaływania występującego pomiędzy cząsteczkami wody, a
także pojawia się w wielu związkach organicznych i
strukturach biologicznych (oddziaływanie łańcuchów DNA).
Powoduje także skłonność materiałów do tworzenia
makrocząsteczek – polimeryzacji. Szczególne właściwości wody,
takie jak większa gęstość fazy ciekłej niż fazy stałej czy ujemny
współczynnik rozszerzalności cieplnej fazy ciekłej w pobliżu
temperatury topnienia, wynikają właśnie z właściwości
wiązania wodorowego.
Strona
213
Wiązanie van der Waalsa
Fluktuacje ładunku w atomach i cząsteczkach mogą prowadzić
do chwilowego powstania momentów dipolowych. Taki moment
dipolowy, mimo że jest nietrwały, może oddziaływać na
sąsiednie atomy lub cząsteczki indukując w nich moment
dipolowy. W ten sposób atomy, które nie są trwałymi dipolami,
oddziałują ze swoimi sąsiadami siłami oddziaływania
elektrostatycznego.
Oddziaływania takie, nazywane wiązaniem van der Waalsa
występują dla wszystkich ciał stałych. Są jednak słabe i nie
zawsze efekt z nimi związany jest dostrzegalny, ponieważ może
łatwo zostać zdominowany przez wielokrotnie silniejsze
oddziaływania innego typu. Z tego względu odgrywają ważną
rolę przede wszystkim w przypadkach, kiedy niemożliwe jest
utworzenie wiązań innego typu, czyli dla atomów o
zamkniętych powłokach (gazów szlachetnych – np. helu,
argonu) oraz obojętnych cząsteczek. W tym drugim przypadku
im większą będzie liczba elektronów tym większy będzie
całkowity momentem dipolowy cząsteczki i w efekcie tym
silniejsze staje się wiązanie van der Waalsa.
21.2. Struktury krystaliczne
Ważną cechą ciał stałych jest występowanie w nich
uporządkowania dalekiego zasięgu. W kryształach atomy są
rozmieszczone w regularnych odstępach tak, że znając
położenie jednego z nich oraz strukturę sieci krystalicznej
możemy dokładnie określić położenie wszystkich pozostałych.
Rozpatrzmy prosty przykład podłogi, która została wyłożona
prostokątnymi płytkami o identycznych wymiarach. Jeśli
wyobrazimy sobie, że w narożach prostokątów znajdują się
atomy, mamy przykład dwuwymiarowej sieci krystalicznej.
Znając położenie jednego z naroży, wymiary płytki oraz kąt,
pod jakim ułożony jest bok płytki do wyznaczonego kierunku
możemy wyliczyć położenia wszystkich pozostałych naroży
Strona 214
Podstawy Fizyki II
(atomów). Gdybyśmy ułożyli podłogę używając płytek o
kształcie rombu, również moglibyśmy zastosować podobny opis.
Jednak w tym przypadku oprócz wymiarów płytki musimy
podać dodatkowo kąt tworzący rombu.
Najmniejszy fragment sieci krystalicznej, za pomocą którego
możemy odtworzyć całą strukturę będziemy nazywać komórką
elementarną.
Dla sieci krystalicznej dwuwymiarowej komórkę elementarną
można opisać za pomocą dwóch wektorów skierowanych wzdłuż


jej krawędzi, a i b (Rysunek 21.3). W podanym przykładzie
komórką elementarną jest pojedyncza płytka. Naroża płytek
będą odpowiadały węzłom sieci krystalicznej. Współrzędne
węzłów sieci dwuwymiarowej, której komórka elementarna jest


określona przez wektory a i b , możemy zapisać w następujący
sposób:



rn  n1a  n2b
(21.1),

gdzie n1 i n2 są liczbami całkowitymi, a długości wektorów a i

b
(a i b) są stałymi sieci. Rozpatrzmy teraz układ
współrzędnych związany z komórką elementarną taki, że
jednostki długości są równe stałym sieci a i b. Wówczas
położenia węzłowe będą miały współrzędne (0,0), (0,1), (1,0),
(1,1) itd. Jeśli na środku rozpatrywanej płytki znajdować się
będzie dekoracja, to jej współrzędne w tym układzie
współrzędnych będą miały wartości (½,½) (Rysunek 21.3). W
ten sposób możemy dokonać opisu struktury złożonej z wielu
rodzajów atomów. Warto zaznaczyć, że przy takim zapisie
atomy znajdujące się w położeniu węzłowym o współrzędnej „1”
np. (1,0) czy (0,1) mogą być również opisane jako atomy o
współrzędnej (0,0) w sąsiedniej komórce elementarnej.
Strona
215
Rysunek 21.3. Sieć dwuwymiarowa prostokątna (z lewej), skośna (pośrodku) i
prostokątna z atomami dwóch różnych typów w położeniach (0,0) i (½,½) (z
prawej). Dla sieci prostokątnej zaznaczono komórkę elementarną.
Należy pamiętać, że sieć krystaliczna stanowi jedynie
geometryczny zapis struktury. W zapisie tym atomy nie muszą
znajdować się w węzłach sieci, jednakże staramy się tak
dobierać komórkę elementarną, aby opis struktury
krystalicznej był jak najbardziej wygodny i jak najłatwiejszy w
zapisie matematycznym.
Dla struktury dwuwymiarowej złożonej z jednego rodzaju
atomów opisu sieci krystalicznej możemy dokonać przy użyciu
5 typów sieci: kwadratowej, prostokątnej, ukośnokątnej (kąt
między krawędziami komórki jest różny od 90º), prostokątnej
centrowanej (jeden z atomów znajduje się na przecięciu
przekątnych prostokąta) oraz heksagonalnej.
W strukturach trójwymiarowych opis sieci krystalicznej jest
nieco bardziej złożony. Komórkami elementarnymi są
równoległościany. Do opisu komórki elementarnej potrzebne są
długości trzech wektorów odpowiadających krawędziom
równoległościanu (oznaczane umownie jako a, b, c ) oraz 3 kąty
występujące pomiędzy nimi (oznaczane jako , , ). Podobnie
jak w przypadku sieci dwuwymiarowych, aby ułatwić opis
matematyczny sieci stosuje się komórki centrowane. Mogą to
być komórki centrowane powierzchniowo (położenia na
przekątnych ścianek) albo centrowane objętościowo (położenia
na przecięciu głównych przekątnych bryły). Wszystkie możliwe
trójwymiarowe struktury krystaliczne można opisać za pomocą
Strona 216
Podstawy Fizyki II
14 typów sieci – tak zwanych sieci Bravais. W niniejszym
opracowaniu nie będziemy przedstawiać poszczególnych typów
sieci a podamy jedynie kilka przykładów ważnych lub
ciekawych z fizycznego punktu widzenia.
Współczynnik upakowania
Jednym z ważnych parametrów opisujących strukturę
krystaliczną jest współczynnik upakowania oznaczany często
jako APF od angielskiego Atomic Packing Factor. Jeśli atomy
potraktujemy jako sztywne kule, to współczynnik upakowania
możemy wyrazić jako stosunek objętości tych kul do objętości
całego kryształu:
APF 
VA N A

A
VK
(21.2)
W powyższym wzorze VA oznacza objętość pojedynczego atomu,
NA ilość atomów danego typu zawartą wewnątrz kryształu, a
VK objętość całego kryształu. Współczynnik upakowania można
wyliczyć również znając komórkę elementarną danej struktury.
W tym celu należy określić, jaki wycinek kul reprezentujących
atomy znajduje się wewnątrz komórki. Przyjmujemy przy tym
założenie, że komórka elementarna zbudowana jest tak, by
kule odpowiadające atomom mogły się stykać ze sobą, ale nie
nakładać na siebie. Jako promień kul modelujących atomy
przyjmuje się promień jonowy. Jest to odległość od środka
atomu do zewnętrznych elektronów, wyznaczana na podstawie
pomiarów struktur krystalicznych o wiązaniu typu jonowego,
jakie tworzy atom danego pierwiastka. Promień jonowy
uzyskujemy w tym przypadku poprzez uśrednienie danych
uzyskanych na podstawie pomiarów wielu różnych struktur. W
wielu przypadkach posługujemy się również promieniem van
der Waalsa (odległością pomiędzy środkiem atomu a skrajem
chmury elektronowej elektronów ostatniej powłoki).
Maksymalny współczynnik upakowania jednakowych kul
wynosi 0.74 i jest możliwy do osiągnięcia w dwóch strukturach:
regularnej centrowanej powierzchniowo oraz w tak zwanej
strukturze heksagonalnej gęstego upakowania (HCP).
Strona
217
Rysunek. 21.4. Komórka elementarna struktury regularnej centrowanej
powierzchniowo wypełniona ciasno upakowanymi kulami reprezentującymi atomy.
Komórką elementarną struktury regularnej centrowanej
powierzchniowo jest sześcian, a atomy umieszczone są w
narożach i na przecięciu przekątnych ścian bocznych. Kule
modelujące atomy stykają się ze sobą tak, że na przekątnej
ściany o długości a 2 znajdują się cztery promienie r kuli jak
zaznaczono na Rysunku 21.4. Stąd możemy znaleźć zależność
między promieniem kul atomowych i długością a boku
sześcianu. Wówczas objętość komórki elementarnej wynosi:
4r 
V K  

 2 
3
(21.3)
Sprawdźmy teraz, ile pełnych kul mieści się w komórce
elementarnej. Z kul znajdujących się na wierzchołkach tylko
1/8 każdej kuli znajduje się wewnątrz danej komórki – reszta
należy do sąsiednich komórek. Mamy 8 wierzchołków, czyli w
komórce elementarnej mieści się 1 pełna kula „narożna”.
Policzmy teraz atomy znajdujące się na ściankach: jest ich 6, a
każda ścianka „przecina” kulę na pół – zatem wewnątrz
komórki mieści się 6/2 kuli. Stąd możemy wyznaczyć
współczynnik upakowania:
Strona 218
Podstawy Fizyki II
4 3
r  1  3
APF  3
 0.74
8 2r 3
(21.4)
Struktury gęstego upakowania
Najwyższy współczynnik upakowania otrzymamy również dla
heksagonalnej struktury gęstego upakowania. Jako model
takiej struktury możemy rozpatrzeć układ jednakowych piłek.
Pierwszą warstwę układamy tak, żeby w sąsiadujących
rzędach środki piłek były ustawione naprzemiennie (warstwa A
na Rysunku 21.5).
Rysunek 21.5. Schemat ułożenia warstw w strukturze heksagonalnej gęstego
upakowania (na górze) i regularnej centrowanej powierzchniowo (na dole).
Kolejną warstwę nakładamy tak, by środki piłek znalazły się
nad „pustymi” miejscami warstwy dolnej (warstwa B na
Rysunku 21.5). Trzecią warstwę C układamy dokładnie nad
warstwą A i otrzymujemy w ten sposób strukturę
heksagonalną gęstego upakowania. Trzecią warstwę C kulek
możemy umieścić również w taki sposób, że atomy C będą
znajdowały się nad „pustymi” miejscami warstwy B, ale nie
nad atomami warstwy A. Otrzymujemy w ten sposób strukturę
regularną powierzchniowo centrowaną (Rysunek 21.5).
Strukturę taką obserwuje się dla szeregu metali, np. złota,
miedzi czy srebra. W metalach tych warstwy atomów
Strona
219
stosunkowo łatwo przemieszczają się względem siebie się pod
wpływem przyłożonego naprężenia. Istotne jest przy tym, że
powstała w wyniku takiego przemieszczenia struktura nadal
charakteryzuje się gęstym upakowaniem i niską energią.
Dlatego też wspomniane metale stosunkowo łatwo ulegają
odkształceniom plastycznym. W podobnej strukturze może
krystalizować także żelazo w dobrze kowalnej fazie zwanej
austenitem. Jeśli natomiast w wyniku przemian fazowych
(obróbki termicznej) struktura będzie miała formę tzw.
martenzytu, dla którego stopień upakowania jest mniejszy,
otrzymamy materiał znacznie twardszy.
21.3. Model pasmowy ciał
stałych
Powstawanie pasm
Zgodnie z zakazem Pauliego w atomie nie mogą znajdować się
dwa elektrony w tym samym stanie kwantowym (o tym samym
zestawie liczb kwantowych). Ze stanem kwantowym elektronu
powiązana jest również energia tego elektronu w atomie. Kiedy
zbliżamy do siebie atomy, funkcje falowe elektronów tych
atomów zaczynają nachodzić na siebie. Aby nie doszło do
złamania zakazu Pauliego, stany kwantowe elektronów muszą
się zmienić a w konsekwencji energie elektronów muszą ulec
zróżnicowaniu. W ten sposób dochodzi do rozszczepienia
poziomów
energetycznych.
Zgodnie
z
powyższym
rozumowaniem w cząsteczce dwuatomowej poziomów
energetycznych, na których znajdują się elektrony będzie dwa
razy więcej niż w pojedynczym atomie.
W krysztale dochodzi do nakładania się funkcji falowych wielu
elektronów. Zgodnie z powyższym rozumowaniem każdy z
elektronów zajmuje poziom energetyczny o energii zbliżonej,
ale różniącej się nieznacznie od pozostałych elektronów w
krysztale. W ten sposób poziom energetyczny określany dla
Strona 220
Podstawy Fizyki II
pojedynczego
atomu
w
przypadku
kryształu
ulega
rozszczepieniu na zestaw energii, które mogą przyjmować
elektrony – powstają pasma energetyczne. Jeśli mamy do
czynienia z liczbą N sąsiadujących ze sobą atomów to nałożenie
się funkcji falowych elektronów spowoduje, że 2 poziomy
energetyczne podpowłoki s ulegną rozszczepieniu na pasmo
zawierające 2N poziomów. W analogiczny sposób z
rozszczepienia podpowłoki p powstanie pasmo zawierające 6N
poziomów a z podpowłoki d pasmo o 10N poziomów. Dla dużej
liczby N rzędu liczby Avogadro pasmo energetyczne składa się
będzie z tak wielu dyskretnych poziomów, że można przyjąć, że
jest ono ciągłe. Na osi energii pasmo energetyczne
charakteryzowane jest przez położenie (związane z położeniem
pierwotnego poziomu energetycznego)
oraz
szerokość
(określającą przedział wartości energii, jaką mogą mieć
elektrony z danego pasma). Pasmo może być całkowicie
zapełnione (wszystkie możliwe poziomy energii wchodzące w
skład danego pasma są obsadzone), częściowo zapełnione
(elektrony zajmują wtedy w ramach pasma poziomy o
najniższej możliwej energii, przy czym dwa elektrony nie mogą
zająć tego samego poziomu) lub nieobsadzone (żaden elektron
nie posiada wystarczającej energii by znaleźć się na najniższym
poziomie pasma). Pomiędzy pasmami, na osi energii, znajduje
się zakres energii wzbronionych. Oznacza to, że elektrony nie
mogą przyjmować energii z obszaru przerwy energetycznej.
Energia Fermiego
Wspominaliśmy już, że elektrony obsadzają poziomy
energetyczne o najniższej możliwej energii, przy czym
spełniona musi być zasada Pauliego i żadne dwa elektrony nie
mogą być w tym samym stanie kwantowym.
W temperaturze zera bezwzględnego, energię ostatniego
obsadzonego poziomu energetycznego określamy mianem
energii Fermiego - EF.
W temperaturze wyższej od zera bezwzględnego elektrony
posiadają dodatkową energię termiczną, dzięki której elektrony
mogą obsadzać poziomy o energii wyższej niż energia
Strona
221
Fermiego. Poziomy energetyczne mogą zmieniać przede
wszystkim elektrony o energii bliskiej energii Fermiego, jeśli
dostępne są niezapełnione poziomy energetyczne o
odpowiedniej energii. Elektrony o energii znacznie mniejszej
niż energia Fermiego, znajdujące się na dnie pasma
przewodnictwa, do przeskoku na najbliższy nieobsadzony
poziom energetyczny potrzebują energii znacznie większej niż
energia drgań termicznych, dlatego przejścia takie nie są
obserwowane. Poziomy, z których nastąpił przeskok pozostają
chwilowo nieobsadzone.
Opisywane zmiany poziomów energetycznych elektronów w
kryształach pod wpływem temperatury mają charakter
statystyczny i dlatego w opisie tych zjawisk stosuje się pojęcia
statystyczne jak na przykład prawdopodobieństwo obsadzenia.
Dla poziomów energetycznych z dna pasma przewodnictwa
prawdopodobieństwo obsadzenia wynosi 1 (są one zawsze
obsadzone), ale dla poziomów bliskich energii Fermiego będzie
zależeć od temperatury. Im wyższa temperatura, tym większa
jest energia termiczna elektronów i tym większe jest
prawdopodobieństwo obsadzenia poziomów powyżej energii
Fermiego. Pamiętamy jednak, że poziomy, z których nastąpił
przeskok pozostają chwilowo nieobsadzone, a więc wraz ze
wzrostem
temperatury
zwiększać
się
będzie
także
prawdopodobieństwo wystąpienia poziomów nieobsadzonych
poniżej energii Fermiego. Prawdopodobieństwo obsadzenia
przez elektrony poziomu o energii E w temperaturze T określa
funkcja Fermiego-Diraca:
f E  
1
 E  EF
exp
 k BT

  1

(21.5),
gdzie EF jest energią Fermiego. Kształt funkcji FermiegoDiraca dla kilku temperatur przedstawiony jest na Rysunku
21.6. Funkcja ta przyjmuje wartość ½ dla energii Fermiego. W
związku z tym dla temperatur wyższych od zera bezwzględnego
energię Fermiego możemy zdefiniować, jako energię
odpowiadającą poziomowi, prawdopodobieństwo obsadzenia
którego wynosi ½. Ta definicja może być także stosowana w
Strona 222
Podstawy Fizyki II
przypadku, kiedy pasmo jest całkowicie zapełnione, a pasmo o
energii wyższej, oddzielone obszarem wzbronionym, całkowicie
nieobsadzone.
Rysunek 21.6. Wykres prawdopodobieństwa obsadzenia poziomów
energetycznych przez elektrony dla różnych temperatur. EF oznacza energię
Fermiego.
Metale, półprzewodniki i izolatory
W strukturze pasm energetycznych szczególną rolę odgrywa
ostatnie (położone najwyżej na osi energii) obsadzone przez
elektrony walencyjne pasmo walencyjne. Jeśli wszystkie
poziomy tego pasma są obsadzone, w materiale brak jest
swobodnych nośników ładunku. Aby elektron mógł stać się
nośnikiem ładunku jego energia musiałaby ulec zmianie –
jednak ponieważ wszystkie poziomy energetyczne są już
obsadzone, nie jest to możliwe.
Kolejne, znajdujące się wyżej w skali energii, pasmo nazywane
jest pasmem przewodnictwa. Elektrony, które znajdą się na
jednym z poziomów energetycznych tego pasma są swobodnymi
nośnikami ładunku. Jeśli elektron walencyjny znajdzie się w
paśmie przewodnictwa, w paśmie walencyjnym wytwarza się
„pusty” poziom, który również umożliwia transport ładunku
elektrycznego pod wpływem zewnętrznego pola. Taki poziom
Strona
223
nazywamy dziurą. Ładunek dziury jest identyczny, co do
wartości, jak ładunek elektronu, ale ma przeciwny znak.
Metale
Pasmo walencyjne i pasmo przewodnictwa mogą być
rozdzielone przerwą energetyczną, bądź mogą nakładać się na
siebie. Jeśli pasma nie są rozdzielone obszarem wzbronionym,
wszystkie elektrony walencyjne mogą uczestniczyć w
transporcie ładunku. Taką strukturę pasm spotykamy w
metalach. W materiałach tych liczba nośników ładunku jest
stała, a ponieważ swobodne nośniki ładunku w wyższych
temperaturach są silniej rozpraszane na drganiach sieci
krystalicznej, to w efekcie ich przewodność elektryczna maleje
ze wzrostem temperatury.
Rysunek 21.7. Schemat układu pasm energetycznych dla metali, półprzewodników
samoistnych oraz izolatorów.
Izolatory
W izolatorach i półprzewodnikach pomiędzy pasmem
przewodnictwa i pasmem walencyjnym istnieje przerwa
energetyczna. Prawdopodobieństwo przeskoku elektronu z
pasma walencyjnego do pasma przewodnictwa zależy od jego
energii, a więc w efekcie od temperatury. W temperaturze zera
Strona 224
Podstawy Fizyki II
bezwzględnego przeskok taki nie jest możliwy. W
temperaturach wyższych prawdopodobieństwo zależy od
energii elektronu i szerokości przerwy wzbronionej. Im wyższa
temperatura, tym większe prawdopodobieństwo przeskoku,
zatem tym więcej nośników ładunku pojawia się w paśmie
przewodnictwa.
Umownie przyjmuje się, że materiały, w których szerokość
przerwy wzbronionej na skali energii wynosi powyżej 3 eV,
nazywamy
izolatorami.
W
temperaturze
pokojowej
prawdopodobieństwo przeskoku elektronu jest na tyle małe, że
w materiałach tych istnieje niewiele swobodnych nośników
ładunku i słabo przewodzą one prąd elektryczny.
Półprzewodniki samoistne
W półprzewodnikach szerokość przerwy wzbronionej jest
mniejsza od umownej wartości 3 eV. W materiałach tych już w
temperaturze pokojowej istnieje zauważalna ilość nośników
ładunku w paśmie przewodnictwa. Przypomnijmy, że przeskok
elektronu do pasma przewodnictwa oznacza również, że w
pasmie walencyjnym pojawia się dziura elektronowa, która
również może się przemieszczać – jest więc drugim nośnikiem
ładunku. Całkowitą przewodność półprzewodnika można zatem
zapisać jako:
σ  ne e e  nh e h
(21.6),
gdzie ne oraz nh oznaczają koncentrację (liczbę nośników w
jednostce objętości) odpowiednio elektronów oraz dziur,
natomiast μe oraz μh – ruchliwość elektronów i dziur
odpowiednio. Nośniki ładunku powstające na skutek
przeskoków termicznych elektronów noszą nazwę nośników
samoistnych. Koncentracja swobodnych elektronów i dziur
wzrasta wykładniczo z temperaturą:
  Eg 

ne ~ exp 
 2k B T 
(21.7)
Strona
225
We wzorze tym Eg oznacza szerokość przerwy wzbronionej, a kB
jest stałą Boltzmanna. Można w tym miejscu zauważyć, że
skoro
przeskok
elektronu zawsze wytwarza dziurę
wprowadzanie dwóch różnych koncentracji nośników wydaje
się z pozoru zbędne. W dalszej części rozdziału przekonamy się
jednak, że jest możliwe wytworzenie w materiale dodatkowych
nośników tylko jednego rodzaju i wówczas powyższy zapis staje
się uzasadniony.
Wraz ze wzrostem temperatury przewodność półprzewodników
wzrasta. Wykładniczy wzrost liczby nośników ładunku jest w
tym przypadku znacznie silniejszy niż spadek ruchliwości
wywołany drganiami sieci krystalicznej. W efekcie zależność
temperaturowa przewodności ma charakter zbliżony do
wykładniczego.
Dla półprzewodników samoistnych energia Fermiego znajduje
się w obszarze przerwy energetycznej w połowie odległości
pomiędzy najwyższym poziomem pasma walencyjnego a
najniższym poziomem pasma przewodnictwa.
Półprzewodniki domieszkowane typu n
Oprócz nośników samoistnych w półprzewodnikach mogą
również istnieć intencjonalnie wytworzone nośniki ładunku.
Powstają one w wyniku wbudowania w strukturę
półprzewodnika atomów, które stają się źródłem swobodnych
elektronów bądź dziur elektronowych. Proces taki nazywamy
domieszkowaniem. Istotne jest przy tym, aby proces
domieszkowania wpływał na koncentrację nośników nie
zmieniając jednocześnie w zasadniczy sposób struktury
krystalicznej półprzewodnika. W związku z tym ilość atomów
domieszki powinna być nieduża.
Wpływ domieszkowania na właściwości fizyczne, w tym także
na strukturę pasmową półprzewodników omówimy na
przykładzie
krzemu.
Krzem
jest
podstawowym
półprzewodnikiem stosowanym we współczesnej elektronice.
Znajduje się w IV grupie układu okresowego, zatem posiada 4
elektrony walencyjne. W czystym krzemie każdy atom jest
związany z czterema sąsiadami wiązaniem kowalencyjnym.
Jeśli w trakcie wzrostu kryształów krzemu dodamy niewielką
Strona 226
Podstawy Fizyki II
ilość pierwiastka należącego do V grupy, na przykład fosfor,
antymon, arsen lub bizmut, to atom tego pierwiastka ulegnie
wbudowaniu w strukturę krystaliczną krzemu zamiast atomu
krzemu. Cztery elektrony należące do atomu domieszki
utworzą wiązania kowalencyjne z atomami krzemu. Piąty
elektron walencyjny będzie natomiast słabo związany z
atomem domieszki i może stać się swobodnym nośnikiem
ładunku.
Rysunek 21.8. Schemat układu pasm w półprzewodniku domieszkowanym typu n
(z lewej) i typu p (z prawej)
Energia jonizacji tego elektronu jest stosunkowo niewielka –
dla domieszkowania krzemu fosforem wynosi ona około
0.045 eV. Dla porównania, szerokość przerwy energetycznej dla
krzemu wynosi 1.1 eV. Na wykresie obrazującym układ pasm
półprzewodnika domieszkowanego (Rysunek 21.8) występuje
dodatkowy poziom energetyczny odpowiadający elektronom
domieszki. Ponieważ atomy domieszki są rozmieszczone daleko
od siebie, efekt nakładania się funkcji falowych pochodzących
od ich elektronów można w tym przypadku zaniedbać – nie
obserwuje się rozszczepienia poziomu energetycznego
związanego z domieszką. Poziom ten jest położony w obszarze
przerwy energetycznej blisko dna pasma przewodnictwa –
Strona
227
odległość od dna pasma przewodnictwa odpowiada energii
jonizacji.
Domieszki, które stają się źródłem swobodnych elektronów w
półprzewodniku nazywamy donorami. W półprzewodniku
domieszkowanym
donorami
nośnikami
większościowymi
ładunku są elektrony a półprzewodnik taki nazywamy
półprzewodnikiem typu n (ang. negative).
Półprzewodniki domieszkowane typu p
Atomy pierwiastków z III grupy np. bor, glin lub gal na
powłoce walencyjnej posiadają trzy elektrony i w związku z
tym mogą wytworzyć tylko trzy wiązania kowalencyjne.
Energetycznie korzystnie jest jednak dla tych atomów przyjęcie
dodatkowego elektronu i zapełnienie powłoki walencyjnej. W
efekcie atomy domieszki trójwartościowej podstawione w
miejsce krzemu będą się starały wychwycić elektron z
sąsiadujących wiązań i uzupełnić swoje czwarte wiązanie. W
ten sposób wytworzy jednak dziurę elektronową w innym
miejscu sieci krystalicznej. Mechanizm ten może się powtarzać,
a dziura elektronowa o ładunku dodatnim stanie się
swobodnym nośnikiem ładunku i będzie przemieszczała się pod
wpływem zewnętrznego pola elektrycznego. W rozważanym
przypadku domieszka o niższej wartościowości wprowadza
dodatkowy poziom energetyczny, położony w obszarze przerwy
energetycznej krzemu w pobliżu wierzchołka pasma
walencyjnego. W przypadku galu (Ga) poziom ten ma energię o
0.06 eV większą niż wierzchołek pasma walencyjnego krzemu.
Domieszki, które stają się źródłem dziur elektronowych w
półprzewodniku nazywamy akceptorami. W półprzewodniku
domieszkowanym akceptorami nośnikami większościowymi
ładunku są dziury i półprzewodnik taki nazywamy typu p (ang.
positive).
Przewodność elektryczna półprzewodników
Ponieważ domieszkowanie zmienia koncentrację nośników
ładunku, więc zgodnie ze wzorem 21.6 wpływa na wartość
przewodności elektrycznej. Przypomnijmy, że zgodnie ze
wzorem 21.6 koncentracja nośników w pasmie przewodnictwa
zmienia się wykładniczo z temperaturą. Ruchliwość nośników
Strona 228
Podstawy Fizyki II
ładunku słabo zależy od temperatury, więc w efekcie zależność
przewodności od temperatury można opisać zależnością:
  Ea 


k
T
B


   0 exp
(21.8),
gdzie Ea oznacza energię aktywacji przewodnictwa i w
przypadku półprzewodników samoistnych wynosi ona Ea=Eg/2.
Jeśli powyższą zależność zlogarytmujemy to otrzymujemy
E 1
równanie postaci ln   ln 0   a . Z zależności tej wynika,
kB T
że na wykresie logarytmu przewodności w funkcji odwrotności
temperatury (1/T) powinniśmy obserwować linie proste o kącie
nachylenia zależnym od energii Ea niezbędnej do wytworzenia
swobodnych nośników. Jak pokazano na Rysunku 21.9 w
przypadku półprzewodników domieszkowych obserwować
będziemy dwa obszary liniowej zależności logarytmu
przewodności od odwrotności temperatury. W niskich
temperaturach (duże 1/T) źródłem nośników ładunku są atomy
domieszki, a nachylenie prostej odpowiada energii potrzebnej
do jonizacji lub przyłączenia elektronu atomu domieszki. Jeśli
koncentracja atomów domieszki jest niewielka, w pewnej
temperaturze może dojść do aktywacji wszystkich nośników
domieszkowych i dalszy wzrost temperatury nie powoduje
znaczącego wzrostu przewodności, a w niektórych przypadkach
obserwuje się nawet jej nieznaczny spadek związany ze
spadkiem ruchliwości nośników ładunku. W obszarze wysokich
temperatur (małe wartości 1/T – lewa strona wykresu) istotny
staje się udział nośników samoistnych. Do ich aktywacji
(wytworzenia) niezbędna jest wysoka temperatura (zależna od
szerokości przerwy wzbronionej) i dlatego ich udział w
przewodnictwie całkowitym zaczyna dominować dopiero w
wysokich temperaturach. Należy jednocześnie pamiętać, że
koncentracja nośników samoistnych może o wiele rzędów
wielkości przekroczyć koncentrację nośników domieszkowych.
Z tego względu w wysokich temperaturach na Rysunku 21.9
ponownie obserwujemy zależność liniową, a nachylenie prostej
Strona
229
powiązane jest z wartością
energetycznej półprzewodnika.
połowy
szerokości
przerwy
Rysunek 21.9. Zależność temperaturowa przewodności dla półprzewodnika
domieszkowanego.
Półprzewodniki domieszkowane są szeroko stosowane w
elektronice. Kontrola procesu domieszkowania pozwala
otrzymywać materiały o różnorodnych właściwościach, które
powszechnie stosowane są w urządzeniach elektronicznych.
Strona 230
Podstawy Fizyki II
21.4. Urządzenia
półprzewodnikowe
Złącze p-n
W
półprzewodnikowych
urządzeniach
elektronicznych
wykorzystuje się półprzewodniki domieszkowane typu n i typu
p oraz układy powstałe w wyniku ich połączenia.
Podstawowym elementem jest tutaj złącze p-n, które powstaje,
jeśli w jednym krysztale półprzewodnika wytworzymy
sąsiadujące ze sobą obszary typu n i typu p. Schemat układu
pasm energetycznych w obszarze takiego złącza p-n
przedstawiony jest na Rysunku 21.10. Przypomnijmy, że dla
półprzewodnika typu p poziom Fermiego leży pomiędzy
pasmem walencyjnym a poziomem domieszki, a dla
półprzewodnika typu n pomiędzy dnem pasma przewodnictwa
a pasmem domieszki. W obszarze złącza, w stanie
równowagowym, energie Fermiego obu materiałów wyrównują
się. W efekcie pasma walencyjne i przewodnictwa w obszarze
złącza p-n ulegają zagięciu jak pokazano na Rysunku 21.10.
Rysunek 21.10. Schemat układu pasm energetycznych na złączu p-n. Obszary
oznaczone jako dn i dp odpowiadają strefom zubożonym.
Strona
231
Rozważmy teraz jakościowo zjawiska fizyczne zachodzące w
obszarze złącza p-n. W momencie wytworzenia złącza, część
elektronów swobodnych znajdujących się w pobliżu złącza, po
stronie n przejdą na stronę p. Po stronie p ulegać będą tak
zwanej rekombinacji z dziurami – zapełnią wolne poziomy, w
których dotychczas znajdowały się dziury elektronowe.
Przypomnijmy, że każdy z półprzewodników przed zetknięciem
był obojętny elektrycznie. W wyniku przejścia elektronów z
materiału typu n do p na pewnym obszarze półprzewodnika
typu n występować będzie niedobór elektronów. W efekcie po
stronie n złącza p-n obserwuje się dodatni potencjał
elektryczny. Obszar uboższy w elektrony nazywamy strefą
zubożoną (dn). Podobnie, w wyniku przejścia elektronów przez
złącze p-n po stronie półprzewodnika typu p obserwować
będziemy nadmiar elektronów albo innymi słowy niedobór
nośników dziurowych. Powstanie tam więc również obszar
zubożony (dp) charakteryzujący się potencjałem ujemnym.
Występowanie stref zubożonych po obu stronach złącza i
związana z nimi różnica potencjałów w znacznym stopniu
ogranicza dalsze przechodzenie elektronów na stronę p oraz
dalszą ich rekombinację prowadząc do wytworzenia się stanu
równowagi.
Zgodnie
z
powyższym
rozumowaniem
przedstawione na Rysunku 21.10 zagięcie pasm obrazuje zatem
powstanie pewnej bariery potencjału, która utrudnia transport
nośników ładunku przez złącze. Należy przy tym zaznaczyć, że
pomimo istnienia takiej bariery potencjału część elektronów
potrafi ją pokonać i ulega rekombinacji po stronie p. Prąd
elektryczny związany z elektronami, które przechodzą z
obszaru n do p nazywamy prądem rekombinacji. Jednocześnie
obszarze typu p występują aktywowane termicznie przeskoki
elektronów z pasma walencyjnego do przewodnictwa, w wyniku
których generowane są nowe swobodne elektrony w pasmie
przewodnictwa. Elektrony, znajdujące się w pobliżu złącza p-n
są przyciągane przez dodatni potencjał strefy zubożonej po
stronie n i przechodzą na tą stronę złącza a prąd elektryczny z
tym związany nazywamy prądem generacji. W sytuacji
równowagowej prąd rekombinacji płynący ze strony n na stronę
p jest równy prądowi generacji płynącemu w przeciwną stronę.
Podobne jak opisane powyżej mechanizmy rekombinacji i
Strona 232
Podstawy Fizyki II
generacji elektronów obserwowane są również dla nośników
dziurowych.
Polaryzacja złącza p-n
Przepływ elektronów ze strony n na stronę p złącza p-n będzie
przebiegał łatwiej, jeżeli do złącza przyłożymy napięcie, które
częściowo skompensuje barierę potencjału wytwarzaną przez
strefę zubożoną. Aby tak się stało, biegun dodatni źródła musi
być przyłożony do strony p, a ujemny do strony n złącza
(Rysunek 21.11). Wówczas złącze p-n zaczyna przewodzić, gdyż
wartość prądu rekombinacji wzrasta wykładniczo w funkcji
przyłożonego napięcia U a wartość prądu generacji w ustalonej
temperaturze nie ulega zmianie. Mówimy wówczas o
polaryzacji złącza p-n w kierunku przewodzenia.
Rysunek 21.11. Schemat układu pasm dla złącza p-n spolaryzowanego w kierunku
przewodzenia (z lewej) i w kierunku zaporowym (z prawej).
Jeśli przyłożymy napięcie w przeciwną stronę, nośniki
znajdujące się po stronie n, aby przejść na stronę p muszą
pokonać jeszcze wyższą barierę potencjału, niż miało to miejsce
w sytuacji równowagowej (Rysunek 21.11). Prąd rekombinacji
jest wówczas mniejszy od prądu generacji i mówimy, że złącze
p-n jest spolaryzowane w kierunku zaporowym.
Złącze p-n ma zatem niesymetryczną charakterystykę
napięciową i w związku z tym nazywane jest również diodą.
Dla dodatniego napięcia przyłożonego do półprzewodnika typu
p dobrze przewodzi prąd (kierunek przewodzenia), natomiast
Strona
233
dla polaryzacji przeciwnej prąd płynący przez złącze jest bardzo
mały (kierunek zaporowy).
Rysunek 21.12. Charakterystyka prądowo-napięciowa idealnego złącza typu p-n.
Świecąca dioda półprzewodnikowa LED
Spolaryzowanie diody w kierunku przewodzenia powoduje, że
przez obszar złącza przepływają zarówno elektrony jak i dziury
elektronowe. W obszarze złącza elektrony mogą ulegać
rekombinacji. Zjawisko rekombinacji związane jest z
przeskokiem elektronu z wyższego poziomu energetycznego na
niższy
nieobsadzony
poziom,
odpowiadający
dziurze
elektronowej. W wyniku przeskoku elektronu emitowany jest
kwant światła o energii równej w przybliżeniu szerokości
przerwy wzbronionej półprzewodnika. Ponieważ rekombinacji
mogą ulegać elektrony znajdujące się na różnych poziomach
energetycznych
pasma
przewodnictwa
z
dziurami
elektronowymi znajdującymi się również na różnych poziomach
energetycznych pasma walencyjnego, wiec w efekcie emitowane
przez złącze promieniowanie nie jest ściśle monochromatyczne,
ale ma zwykle pewien wąski zakres długości fali. Wykonując
złącza p-n z różnych materiałów półprzewodnikowych o
różnych przerwach wzbronionych możemy wytwarzać
promieniowanie o różnych długościach fali a taką diodę
świecącą nazywamy LED od angielskiego Light Emitting
Diode.
Po spolaryzowaniu diody w kierunku przewodzenia prąd
narasta wykładniczo w funkcji przyłożonego napięcia U.
Wykładniczo narastać również będzie prawdopodobieństwo
Strona 234
Podstawy Fizyki II
rekombinacji a więc liczba fotonów emitowanych w jednostce
czasu. Należy przy tym pamiętać, że przy przepływie zbyt
dużego prądu ciepło wytworzone na bardzo cienkim obszarze
złącza może doprowadzić do uszkodzenia diody. Dlatego nie
należy przekraczać napięcia polaryzacji diody podanego przez
producenta. Natężenie prądu zależy od szerokości bariery
potencjału i dlatego diody wykonane z półprzewodników o
szerszej przerwie energetycznej wymagają zwykle wyższego
napięcia pracy.
We współczesnych urządzeniach elektronicznych stosowanych
jest wiele rodzajów diod świecących. Diody wykonane z
półprzewodników o niewielkiej szerokości przerwy wzbronionej
świecą w zakresie podczerwieni i są z powodzeniem
wykorzystywane w pilotach sterujących urządzeniami
elektronicznymi oraz kamerach termowizyjnych. Diody z
zakresu światła widzialnego są wykorzystywane zarówno w
panelach kontrolnych, jak i w ekranach świetlnych. Tak zwane
diody białe często wykorzystują do emisji światła warstwę
luminoforu. W diodach tych w złączu wytwarzane jest
monochromatyczne promieniowanie o dużej energii fotonów,
które w wyniku oddziaływania z warstwą luminoforu
zamieniane na światło o szerokim zakresie widmowym
(zakresie długości fali), które odbierane jest przez nasze oko
jako światło białe. W celu uzyskania światła białego możliwe
jest również złożenie trzech barw podstawowych światła
widzialnego – czerwonej, zielonej i niebieskiej.
Warto podkreślić, że w przeciwieństwie do zwykłych żarówek
diody świecące charakteryzują się wysoką sprawnością
zamiany energii elektrycznej na energię emitowanego
promieniowania. Ponadto diody charakteryzuje także
długowieczność i odporność na niekorzystne warunki
zewnętrzne i dlatego są chętnie wykorzystywane w oświetleniu
pomieszczeń czy w przemyśle motoryzacyjnym.
Fotodiody
Złącze p-n może również działać jako element czuły na światło
czyli tzw. fotodioda. W tym celu złącze p-n jest polaryzowane w
kierunku zaporowym. Wówczas w obwodzie elektrycznym nie
Strona
235
płynie prąd. Jednakże, w wyniku oświetlania diody foton może
przekazać swoją energię elektronowi w paśmie walencyjnym,
pozwalając mu na przeskok do pasma przewodnictwa. W
obszarze typu p w pobliżu złącza powstaje wówczas para
nośników – elektron i dziura. Swobodny elektron jest
przyciągany przez potencjał wytworzony w obszarze złącza i
przechodzi ze strony p na stronę n. Zmierzony prąd, nazywany
fotoprądem, zależeć będzie od natężenia padającego światła.
Fotodiody są czułe na promieniowanie o energii większej niż
szerokość przerwy energetycznej półprzewodnika.
Ogniwa fotowoltaiczne
Oddziaływanie fotonów z elektronami możemy wykorzystać nie
tylko do detekcji promieniowania, ale również jako źródło
energii elektrycznej. Foton zaabsorbowany w obszarze
niespolaryzowanego złącza p-n powoduje wytworzenie prądu
generacji związanego z przepływem elektronów ze strony p na
stronę n. Powstaje w ten sposób różnica potencjałów, a więc
foton
ten
przyczynia
się
do
wytworzenia
siły
elektromotorycznej między stroną n (biegun ujemny), a stroną
p (biegun dodatni) - tak zwanego fotoogniwa.
Rysunek 21.13. Schemat przekroju i działania fotoogniwa.
W najczęściej stosowanych fotoogniwach opartych na
polikrystalicznym krzemie na powierzchni ogniwa znajduje się
Strona 236
Podstawy Fizyki II
warstwa antyodblaskowa, której zadaniem jest skierowanie jak
największej ilości fotonów do warstw znajdujących się poniżej
(Rysunek 21.13). Następnie fotony przechodzą przez cienką
warstwę typu n i trafiają do znacznie grubszego obszaru typu
p, w którym są absorbowane. Elektrony powstałe w wyniku
absorpcji fotonów wędrują w kierunku złącza, z którego są
zbierane przez rozmieszczone w równych odstępach metalowe
elektrody. Nośniki dziurowe natomiast wędrują w kierunku
znajdującej się pod obszarem typu p płaskiej elektrody
metalowej.
Sprawność konwersji energii słonecznej na elektryczną
typowych fotoogniw krzemowych jest rzędu 25% a najwyższa
uzyskana przekracza 40%. Masowość produkcji ogniw opartych
na krzemie sprawia, że zaczynają one stanowić poważną
alternatywę dla innych źródeł energii. Ogniwa słoneczne
sprawdzają się w urządzeniach przenośnych o niewielkiej
mocy, takich jak kalkulatory, lub w regionach, w których
dostęp do innych źródeł energii jest utrudniony. Elektrownie
oparte na fotoogniwach, tak zwane farmy słoneczne, buduje się
w regionach o znacznym nasłonecznieniu. Ogniwa słoneczne
stanowią także podstawowe źródło zasilania dla satelitów i
stacji kosmicznych. Podstawową barierą w większym
upowszechnieniu fotoogniw jest ich wciąż wysoka cena.
Tranzystor
Tranzystor jest elementem elektronicznym, składającym się z
elementów półprzewodnikowych typu p i n (Rysunek 21.14) tak
połączonych, że za pomocą przyłożenia potencjału do jednej z
trzech elektrod możemy sterować przepływem nośników
pomiędzy dwoma pozostałymi elektrodami. W zależności od
znaku i wartości przyłożonego potencjału tranzystor może
realizować różne funkcje np. działać jako wzmacniacz napięcia
(o charakterystyce liniowej lub wykładniczej), lub jako
sterowany przełącznik typu włącz-wyłącz. Warto zaznaczyć, że
w
tranzystorach
typu
MOSFET,
którego
schemat
przedstawiony jest na Rysunku 21.14 obserwuje się zjawisko
tunelowania elektronów przez cienką warstwę izolatora.
Strona
237
Rysunek 21.14. Schemat budowy tranzystora typu MOSFET
Złącze metal-metal
Napięcie kontaktowe
Omawiając charakterystykę złącza p-n w półprzewodnikach
pokazaliśmy, że w momencie zetknięcia ze sobą materiałów o
różnej strukturze pasmowej następuje taki przepływ nośników,
żeby poziomy Fermiego obu półprzewodników się wyrównały.
Również w przypadku metali po zetknięciu ze sobą dwóch
różnych metali, o różnej strukturze elektronowej, obserwować
będziemy taki przepływ elektronów, żeby poziomy Fermiego w
obu metalach się wyrównały (Rysunek 21.15). Przepływ
elektronów z metalu, w którym energia Fermiego ma wyższą
wartość (EF1) na stronę metalu, w którym energia Fermiego
jest niższa (EF2) jest korzystne energetycznie. Elektrony z
metalu 1 przeskakując na wcześniej nieobsadzone poziomy
energetyczne metalu 2 uzyskują niższą energię. W wyniku tego
procesu energia Fermiego w pierwszym metalu ulega
obniżeniu, zaś energia Fermiego w drugim metalu podnosi się,
aż poziomy Fermiego w obu metalach wyrównają się. Jednak
na skutek tego przepływu wytwarza się różnica potencjałów
między materiałami – metal, z którego elektrony wychodzą
uzyskuje ładunek dodatni, a metal, na stronę którego
przechodzą – ujemny. Na diagramie obrazującym strukturę
pasmową odpowiada to przesunięciu całego układu pasm w
Strona 238
Podstawy Fizyki II
stronę wyższych energii po stronie metalu 2, dla którego
wartość energii Fermiego była niższa (Rysunek 21.15).
Rysunek 21.15. Schemat układu pasm na złączu dwóch różnych metali: z lewej
przez zetknięciem, z prawej w sytuacji równowagowej po zetknięciu.
W stanie równowagi między metalami istnieje zarówno różnica
potencjałów wynikająca z przejścia elektronów z jednego
metalu do drugiego (nazywamy ją napięciem kontaktowym
Galvaniego) jak i różnica potencjałów wynikająca z różnych
wartości pracy wyjścia (nazywamy ją napięciem Volty)
(Rysunek 21.15).
Przypomnijmy, że praca wyjścia określa energię, jaka jest
niezbędna, aby elektron mógł opuścić metal. Pracę wyjścia
oznaczamy symbolem φ i wspominaliśmy już o niej, gdy
omawialiśmy efekt fotoelektryczny zewnętrzny (Rozdział 18).
Pracę wyjścia można również zdefiniować jako różnicę energii
między poziomem Fermiego, a energią odpowiadającą krawędzi
studni potencjału wytworzonej przez dodanie rdzenie atomowe.
Przykładowe wartości pracy wyjścia wynoszą: dla litu 2.9 eV,
cezu 1.8 eV a dla platyny 5.3 eV.
Termopara
W termoparach wykorzystywane jest zjawisko Seebecka,
polegające na powstawaniu różnicy potencjałów pomiędzy
dwoma punktami metalu znajdującymi się w różnych
temperaturach. Nośniki z „gorącego” końca elementu
metalowego, posiadające większą energię, migrują w kierunku
„zimnego” końca. W efekcie pomiędzy tymi końcami metalu
obserwuje się różnicę koncentracji nośników. Związana z nią
różnica potencjałów, siła termoelektryczna, jest proporcjonalna
do różnicy temperatur między badanymi punktami. Wartość
różnicy potencjałów pomiędzy końcami drutu zależy także od
Strona
239
metalu (stopu metalicznego), z którego wykonany jest ten drut.
Układ pomiarowy termopary składa się z drutów wykonanych z
dwóch różnych metali, tworzących obwód zamknięty. Jedno
złącze drutów metalowych znajduje się w badanej
temperaturze a drugie w temperaturze odniesienia. W efekcie
każdy z drutów doznaje tej samej różnicy temperatur, ale
ponieważ zbudowane są z różnych materiałów w obwodzie
obserwuje się siłę termoelektryczną, na podstawie której
można wyznaczyć różnicę temperatur pomiędzy dwoma
złączami:
ε
kB
n
T1 T 2  ln 1
e
n2
(21.9)
W laboratorium złącze referencyjne może być umieszczone np.
w wodzie z lodem o temperaturze 0 0C. W przenośnych
miernikach elektronicznych pomiaru referencyjnego dokonuje
się inną metodą. Przeliczenia siły elektromotorycznej na
temperaturę dokonują obecnie układy elektroniczne, w których
zaprogramowane zostały parametry charakteryzujące dany typ
termopary. W zależności od zakresu interesujących nas
temperatur stosowane mogą być różne stopy metali – w
najczęściej stosowanych termoparach typu K są to stopy
chromelu i alumelu) a w termoparach typu J żelazo i stop
miedzi i niklu o nazwie konstantan.
Zjawisko Peltiera
Skoro w układzie termopary różnica temperatur na dwóch
złączach obwodu powoduje powstawanie siły termoelektrycznej
w obwodzie, to należy spodziewać się także wystąpienia
zjawiska odwrotnego – wymuszając przepływ prądu w
obwodzie termopary, wytwarzamy różnicę temperatur
pomiędzy złączami. Zjawisko to nazywamy efektem Peltiera. W
konstrukcji tzw. elementów Peltiera często wykorzystuje się
ułożone naprzemiennie półprzewodniki typu n i typu p. W tym
przypadku wykorzystywana jest znaczna różnica koncentracji
nośników w obszarach o różnym domieszkowaniu. W zależności
od kierunku przepływu prądu w obwodzie element taki może
grzać lub chłodzić. Ze względu na niewielką sprawność (rzędu
kilku %) elementy Peltiera sprawdzają się przede wszystkim
Strona 240
Podstawy Fizyki II
tam, gdzie tradycyjne urządzenia sprężarkowe nie mogą być
zastosowane ze względu na rozmiary lub niekorzystne dla ich
działania środowisko pracy. Ze względu na bezawaryjne
działanie elementy tego typu stosowano również wielokrotnie
w sondach kosmicznych. Elementy Peltiera stosuje się w
przenośnych
lodówkach,
przy
chłodzeniu
elementów
elektronicznych, a w motoryzacji także w układach
klimatyzacji.
21.5. Lasery
W Rozdziale 16 poświęconym optyce omawialiśmy zjawiska
wynikające z falowej natury światła takie jak interferencja czy
dyfrakcja. Wspominaliśmy również o zastosowaniach zjawisk
optycznych w urządzeniach technicznych, takich jak
interferometry i dalmierze. Zaznaczaliśmy wówczas, że aby w
pełni wykorzystać możliwości, jakie daje optyka falowa,
niezbędne jest jednak odpowiednie źródło światła. Światło
powinno być monochromatyczne oraz spójne w czasie i
przestrzeni
a
wiązka
światła
powinna
również
charakteryzować się możliwie małą rozbieżnością. W
przypadku źródeł światła takich jak Słońce czy żarówka
warunki te są trudne do spełnienia. Źródła te charakteryzują
się szerokim zakres długości fali i falowe emitowane w wielu
różnych punktach źródła nie są ze sobą skorelowane.
Przypomnijmy, że przy przejściu elektronu ze stanu
wzbudzonego do stanu podstawowego emitowany jest kwant
promieniowania o długości fali dobrze określonej przez różnicę
energii poziomów, między którymi nastąpił przeskok. Powstałe
w ten sposób promieniowanie jest więc monochromatyczne.
Niestety jednak przeskoki elektronów w poszczególnych
atomach nie są ze sobą powiązane, zatem wyemitowane fotony
mają różne fazy. Taką sytuację obserwujemy, gdy emisja
fotonów przez poszczególne atomy ma charakter spontaniczny.
W swojej pracy z 1917 roku Einstein wskazał na możliwość
Strona
241
występowania drugiego typu emisji – wymuszonej przez kwant
światła o odpowiedniej energii.
Budowa i działanie lasera
Urządzeniem pozwalającym uzyskać monochromatyczne i
spójne światło o niewielkiej średnicy wiązki jest laser. Na
proces wytworzenia wiązki laserowej składa się kilka etapów,
które opiszemy szczegółowo poniżej.
Żeby nastąpiła emisja fotonów niezbędne jest najpierw
przeniesienie atomu ze stanu podstawowego do stanu
wzbudzonego, co wiąże się z przeskokiem elektronu na wyższy
poziom energetyczny. Często wykorzystywane jest do tego celu
promieniowanie świetlne pochodzące z zewnętrznego źródła, a
efekt nazywany jest pompowaniem optycznym. Warto
zaznaczyć tutaj, że takie pompowanie optyczne często odbywa
się dwuetapowo. Elektron trafia najpierw na poziom o wysokiej
energii, z którego następnie szybko spada na niższy poziom o
większej stabilności (Rysunek 21.16). Zgodnie z zasadą
nieoznaczoności Heisenberga nie tylko pęd i położenie obiektu
mogą być wyznaczone tylko z ograniczoną dokładnością.
Również energia i czas są ze sobą powiązane w podobny sposób.
Poziom energetyczny, na którym elektron znajduje się przez
bardzo krótki czas obejmuje pewien zakres energii (W3).
Oznacza to, że pompowanie optyczne występować będzie nie
tylko dla jednej długości fali, ale dla pewnego zakresu wartości.
Przeskoki elektronów z poziomu krótkożyciowego (W3) na
poziom metastabilny (E2) o niższej energii następują szybko w
sposób nieskorelowany, spontaniczny, co nazywamy emisją
spontaniczną. W efekcie pompowanie optyczne prowadzi do
powstania tzw. inwersji obsadzeń. W stanie wzbudzonym (E2)
znajduje się więcej elektronów niż w stanie podstawowym (E1).
Elektron znajdujący się na poziomie metastabilnym (E2) o
długim czasie życia może wykonać spontaniczny przeskok do
poziomu
niższego.
Jeśli
dojdzie
do
oddziaływania
wyemitowanego na skutek tej spontanicznej emisji fotonu z
innym
elektronem
znajdującym
się
na
poziomie
metastabilnym, może on zainicjować (wymusić) przejście
Strona 242
Podstawy Fizyki II
również tego elektronu na niższy poziom energetyczny.
Zjawisko to nazywane jest emisją wymuszoną. Należy przy tym
podkreślić, że w wyniku emisji wymuszonej nie tylko energia
fotonu wyemitowanego jest identyczna jak energia fotonu
wymuszającego. Również paczki falowe odpowiadające obu
fotonom mają identyczną fazę, polaryzację i kierunek
rozchodzenia się. W wyniku oddziaływań z kolejnymi
elektronami znajdującymi się na poziomie metastabilnym,
właściwości „pierwotnego” fotonu ulegają powieleniu.
Otrzymujemy zatem spójne, monochromatyczne źródło światła.
Rysunek 21.16. Schemat działania lasera trójpoziomowego.
Do efektywnego działania lasera konieczne jest, aby jedynie
część strumienia fotonów wydostawała się na zewnątrz
urządzenia w postaci wiązki laserowej, pozostałe zaś
podtrzymywały zjawisko emisji wymuszonej. Z tego względu w
większości rozwiązań konstrukcji laserów ośrodek, w którym
zachodzi emisja wymuszona znajduje się pomiędzy dwoma
zwierciadłami, z których jedno jest półprzepuszczalne.
Zazwyczaj odległość między zwierciadłami dobrana jest tak, by
wewnątrz mieściła się wielokrotność połowy długości fali
emitowanej wiązki. Będziemy wówczas mieli do czynienia z
tzw. rezonatorem optycznym, w którym między zwierciadłami
powstaje fala stojąca.
Strona
243
Zastosowania laserów
Szerokie zastosowanie laserów w różnych dziedzinach techniki
wynika z unikalnych właściwości światła laserowego. Lasery
znajdziemy w urządzeniach do zapisu i odczytu danych z
nośników optycznych, takich jak płyty CD, DVD lub Blu-ray.
Spójność promieniowania jest wykorzystywana do precyzyjnych
pomiarów odległości w technikach interferometrycznych. Za
pomocą nałożenia dwóch wytworzonych przez to samo źródło
wiązek można szybko określić zmiany wzajemnego położenia
obiektów. Umieszczając jedno ze zwierciadeł interferometru na
przęśle mostu lub ścianie budynku jesteśmy w stanie
wyznaczyć jego ruchy z dokładnością do połówki długości fali,
co jest trudne do osiągnięcia innymi technikami. Niewielka
rozbieżność wiązki laserowej w połączeniu ze spójnością
pozwoliła wykorzystać laser do pomiaru zmian odległości
Ziemia-Księżyc. Wykorzystanie szybkich przetworników i
procesorów taktowanych wysoką częstotliwością umożliwia
obecnie również bezpośredni pomiar odległości na podstawie
czasu przelotu światła laserowego między miernikiem a
zwierciadłem. Z tego względu lasery są używane również w
zastosowaniach wojskowych w układach naprowadzania
pocisków na cel.
Innym zastosowaniem wykorzystującym spójność światła
laserowego jest holografia. Rejestracja obrazu holograficznego
polega na zapisie interferencji fali rozproszonej przez
przedmiot z falą niezaburzoną - wiązką odniesienia.
Uzyskujemy rodzaj „modulowanej” siatki dyfrakcyjnej. W celu
odtworzenia hologramu naświetlamy obraz holograficzny
światłem laserowym. W polu za obrazem zostaje odtworzony
przestrzenny obraz światła odbitego od obiektu.
Duża moc światła laserowego i możliwość jego skupienia na
niewielkim obszarze jest wykorzystywana do obróbki
materiałów.
Sterowane
mikroprocesorowo
urządzenia
wyposażone w laser dużej mocy mogą wykonywać precyzyjne
cięcia elementów wykonanych zarówno z twardych metali, jak i
tworzyw sztucznych lub ceramiki. Dzięki zastosowaniu
laserowych technik obróbki stało się możliwe wykonywanie
Strona 244
Podstawy Fizyki II
detali trudnych do uzyskania innymi sposobami. Lasery mogą
służyć także do hartowania, spawania lub znakowania
powierzchni metali. Lasery są również szeroko stosowane w
medycynie, gdzie znajdują zastosowanie m.in. w selektywnym
niszczeniu komórek nowotworowych i korekcji wad wzroku. W
technice wojskowej lasery dużej mocy mogą być używane do
niszczenia rakiet i samolotów, a także „oślepiania” układów
optycznych nieprzyjaciela.
Światło laserowe o wysokiej energii może być użyte do
„skompresowania” materii w stopniu wystarczającym do
zajścia zjawiska fuzji jądrowej. Ale również wiązki laserowe o
odpowiedniej częstotliwości mogą być używane do stopniowego
odbierania energii od atomów, umożliwiając osiągnięcie
temperatur bliskich zera bezwzględnego.
Strona
245

Podobne dokumenty