pobierz plik referatu - BDAS

Transkrypt

pobierz plik referatu - BDAS
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Rozdział 20
w
Statystyczna analiza danych
pobieranych ze szkolnej bazy danych
w
1 Wstęp
da
.b
w
Streszczenie. Szkoła na co dzień gromadzi dużą liczbę danych dotyczących
cząstkowych ocen uczniów; zajęć, na które uczniowie uczęszczają; dni,
w których uczniowie opuścili zajęcia, jak również przechowuje dane związane z miejscem zamieszkania uczniów, ich sytuacją rodzinną itp. Powstaje zatem potrzeba tworzenia baz danych przechowujących takie informacje. Natomiast jeśli taka baza danych już istnieje, wydaje się korzystna możliwość
statystycznej interpretacji tych informacji. Poniżej zostanie opisana aplikacja,
która pozwala w sposób przejrzysty dokonywać podstawowych analiz statystycznych danych zawartych w szkolnej bazie danych.
pl
s.
Patrząc wstecz można zauważyć, iż ostatnie lata charakteryzują się coraz większym zapotrzebowaniem na usługi statystyczne i to w przeróżnych dziedzinach życia, a świadczą
o tym chociażby liczne i powstające bardzo szybko firmy zajmujące się taką działalnością.
Metody statystyczne pozwalają niejednokrotnie na ścisłe i jednoznaczne oddawanie myśli,
opisywanie zjawisk za pomocą liczb oraz służą zwielokrotnieniu siły poznawczej określonej dziedziny. Z uwagi na fakt, iż większość zmian w życiu codziennym ma swoje odbicie
w informatyce, można wywnioskować, że skoro wzrosło zapotrzebowanie na usługi statystyczne, to również prężnie rozwinęła się informatyzacja tej dziedziny, gdyż nie wszyscy,
którzy potrzebują wykonania analiz statystycznych potrafią je wykonać. Taki wniosek
znajduje odzwierciedlenie w rzeczywistości, o czym świadczy znaczna liczba firm informatycznych zajmujących się pisaniem oprogramowania dotyczącego różnych zagadnień związanych z analizą statystyczną. Dotyczy to różnorodnych dziedzin takich jak ubezpieczenia,
finanse, bankowość, ogólnie rozumiany przemysł, usługi, handel, ekonomia, socjologia,
medycyna i wiele innych [1], [5], [2]. Oczywiście poza obszarami, w których już dostrzeżono, jak duże znaczenie może mieć oprogramowanie pozwalające na wykonywanie analiz
statystycznych, istnieją jeszcze takie, które nie zostały dostrzeżone lub nie rozwinęły się
jeszcze mocno i jedną z nich jest na przykład szkolnictwo.
W każdej szkole na co dzień wykonywane są różnorakie proste obliczenia statystyczne,
do których należy najczęściej stosowana średnia arytmetyczna. Jednakże nie jest to pełne
wykorzystanie mechanizmów jakie oferuje statystyka, która może przecież nie tylko dać
Alina Momot, Sylwia Janocha
Politechnika Śląska, Instytut Informatyki, ul. Akademicka 16, 44-100 Gliwice, Polska
email:[email protected]; [email protected]
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
A. Momot, S. Janocha
w
dużą liczbę cennych informacji ilościowych, ale i umożliwia testowanie hipotez, które
można wysunąć, gdy istnieje narzędzie do ich weryfikacji.
Opisywana poniżej aplikacja wspomagająca statystyczną analizę danych powstała po to,
by pomóc nie tylko w sprawnym wykonywaniu czasochłonnych obliczeń statystycznych
potrzebnych na co dzień, ale również po to, by wspomóc proces podejmowania skutecznych decyzji związanych z usuwaniem różnego rodzaju zagrożeń pracy szkoły i by służyć
pomocą w ustalaniu strategii nauczania w danej szkole. Jako główne cele stawiano przed
aplikacją pomoc w analizie postępów uczniów w nauce, analizie zachowania uczniów, jak
również pomoc w procesie szukania zależności pomiędzy pewnymi cechami poddanymi
analizie. Aplikacja została przewidziana do użytkowania przez osoby niekoniecznie posiadające ścisłą wiedzę z zakresu statystyki. Dlatego też w wyniku jej działania, użytkownik
prócz szczegółowych informacji dotyczących przeprowadzanych testów statystycznych,
otrzymuje proste odpowiedzi na pytania często pojawiające się w praktyce szkolnej.
Do stworzenia aplikacji wykorzystano środowisko programistyczne C++Builder oraz
MySQL jako system zarządzania bazą danych [6]. Wykorzystywano również MySQL Query Browser jako graficzne środowisko wspomagające tworzenie, optymalizację i wykonywanie zapytań kierowanych do bazy. Natomiast do kontaktu z bazą danych zostały wykorzystane komponenty zawarte w dostępnej w ramach otwartego projektu Open Source
bibliotece ZeosLib, z których najważniejszymi są ZConnection, który umożliwia połączenie się z bazą danych oraz ZQuery, który umożliwia wysyłanie zapytań do bazy danych.
da
.b
w
w
2 Ogólny opis aplikacji
pl
s.
Bardzo często w szkołach obliczane są średnie ocen uczniów, klas, szkół. Można by się
jeszcze doszukać obliczeń odchylenia standardowego, ale trudno byłoby znaleźć oprogramowanie zajmujące się przeprowadzaniem i interpretacją testów statystycznych, a wbrew
pozorom zapotrzebowanie na tego typu obliczenia istnieje.
Bardzo ważnym elementem nauczania jest bieżąca kontrola wyników uczniów, ale same
wyniki nic jeszcze niestety nie znaczą, ponieważ często na oceny mają wpływ dodatkowe
cechy takie jak na przykład sytuacja rodzinna ucznia. Takiego powiązania średniej ocen
z dodatkową cechą nie można uzyskać obliczając po prostu średnią. Owszem wychowawca
klasy może przeglądając dane ucznia doszukać się powodów na przykład złych ocen. Jest
to jednak niestety proces długotrwały i raczej realizowany w wyjątkowych przypadkach.
A przecież wybór odpowiedniej opcji w aplikacji, która sama pobrałaby dane ucznia z bazy
danych szkoły, obliczyła średnią i jeszcze do tego wskazała odpowiedź na postawioną
hipotezę, byłoby o wiele prostsze.
Takie właśnie potrzeby są realizowane poprzez opisywaną aplikację, która działa we
współpracy z bazą danych przechowującą informacje dotyczące uczniów pewnej szkoły
w Niemczech. Aplikacja łączy się z bazą, pobiera z niej potrzebne dane, dokonuje obliczeń
i wyświetla w czytelnej formie wyniki tych właśnie obliczeń. Zautomatyzowanie prac daje
możliwość wykonywania bardzo dużej liczby testów w krótkim czasie. Aplikacja może
pomóc w analizie m.in. postępów uczniów w nauce, analizie zachowania uczniów, a ponadto pomaga szukać zależności pomiędzy różnymi cechami poddanymi obliczeniom. Należy
tutaj zaznaczyć, iż system nie jest skierowany tylko i wyłącznie w stronę uczniów. Pomaga
on również w analizie pracy nauczycieli, a ten aspekt jest często pomijany. W wielu przypadkach wyciągane są wnioski dotyczące całej klasy i wysuwane są ogólnikowe twierdzenia, że „klasa osiąga najgorsze wyniki w szkole” bez uwzględnienia wpływu uczących tę
klasę nauczycieli na wyniki otrzymywane przez nią.
228
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Statystyczna analiza danych pobieranych ze szkolnej bazy danych
2.1 Przepływ danych w aplikacji
w
Realizacja obliczeń zadanych przez użytkownika przebiega w aplikacji w kilku kolejnych
etapach. Po uruchomieniu aplikacji następuje próba połączenia z bazą danych. W przypadku, gdy będzie ona pomyślna, następuje ładowanie podstawowych danych do list rozwijanych, natomiast gdy program nie znajdzie żądanej bazy danych – sam utworzy przykładową bazę. Następnie program oczekuje na wybór typu wykonywanych obliczeń dokonany
przez użytkownika, tzn. czy będą wykonywane obliczenia z zakresu statystyk opisowych,
czy też z zakresu testów statystycznych oraz wyboru konkretnej opcji obliczeń. Po dokonaniu odpowiednich wyborów następuje przesłanie wybranych przez użytkownika danych do
modułu obliczeń, a przy zakończeniu pracy z aplikacją nastąpi rozłączenie z bazą danych.
Na rysunku 1 zamieszczony jest schemat przepływu danych do aplikacji oraz w aplikacji,
od momentu jej uruchomienia.
da
.b
w
w
2.2 Interfejs użytkownika
pl
s.
Rys. 1. Schemat przepływu danych
Na interfejs użytkownika w opisywanym programie składa się kilka elementów, które zostaną przedstawione szerzej w dalszej części rozdziału. Są nimi:
− główne okno programu,
− okno logowania,
− okno obliczeń dla statystyk opisowych,
− okno obliczeń dla testów statystycznych,
− okno zapisu wykonanych obliczeń do pliku.
Po uruchomieniu aplikacji pojawia się okno logowania, które znika po przeprowadzeniu
poprawnego procesu połączenia się z bazą danych i zalogowania do niej. Po wybraniu
odpowiednich opcji z menu będą otwierały się odpowiednio okna: „Statystyki opisowe” lub
229
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
A. Momot, S. Janocha
„Testy statystyczne”, w których to wyświetlane są pola wyboru opcji programu oraz wyniki
dokonanych obliczeń. Wykonanie wszystkich niezbędnych obliczeń wymaga zastosowania
wzorów statystycznych dostępnych w typowych podręcznikach do nauki statystyki, takich
jak na przykład prace [3] oraz [4].
2.3 Statystyki opisowe
w
da
.b
w
w
W ramach statystyki opisowej aplikacja umożliwia wyznaczenie między innymi:
− średniej oceny (patrz rysunek 2)
− danej klasy,
− danego ucznia w wybranej klasie,
− danego ucznia w wybranej klasie z określonego przedmiotu,
− danego ucznia w wybranej klasie uczonego przez zadanego nauczyciela,
− z zadanego rocznika,
− z zadanego rocznika z podanego przedmiotu;
pl
s.
Rys. 2. Okno do wyznaczania statystyk opisowych
− średniej liczby nagan
− w wybranej klasie,
− w roczniku,
− w roczniku, wystawionych przez zadanego nauczyciela,
− wystawionych przez nauczyciela we wszystkich klasach przez niego uczonych;
− wartości minimum lub maksimum i tym samym odpowiedzi na pytania dotyczące
− najmniej/najbardziej licznej
− klasy,
− rocznika,
230
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Statystyczna analiza danych pobieranych ze szkolnej bazy danych
w
w
− klasy w zadanym roczniku;
− minimum/maksimum liczby dni nieobecności
− uczniów z wybranej klasy,
− uczniów z wybranej klasy i w zadanym miesiącu,
− określonego ucznia z zadanej klasy w kolejnych miesiącach w roku,
− uczniów w zadanym roczniku,
− uczniów w wybranym roczniku i zadanym miesiącu;
− najmniejszej/największej wartości spośród średnich ocen uczniów
− w zadanej klasie,
− w zadanej klasie z wybranego przedmiotu,
− w zadanym roczniku,
− w zadanym roczniku z wybranego przedmiotu.
2.4 Testowanie hipotez statystycznych
w
da
.b
Na etapie projektowania aplikacji zostały postawione pytania, na które aplikacja miała
udzielić odpowiedzi. Jednakże w statystyce nie pytania, a hipotezy są podstawą do przeprowadzenia testów, więc na podstawie zestawu zadanych pytań, zostały wysunięte hipotezy. Hipotezy te były testowane klasycznymi testami statystycznymi na niezależność, na
równość średnich w dwóch populacjach oraz na równość par średnich, a także testem istotności współczynnika korelacji rangowej Spearmana [3], [4].
Przy testowaniu niezależności dwóch cech można zastosować test chi-kwadrat Pearsona.
W tym teście weryfikowana hipoteza zerowa ma postać: H 0 : pij = pi• p• j , natomiast hipoteza alternatywna ma postać H 0 : pij ≠ pi • p• j , gdzie pij jest prawdopodobieństwem łącznego rozkładu empirycznego dwóch cech, zaś pi• , p• j są odpowiednimi prawdopodobieństwami empirycznych rozkładów brzegowych. Zakładając prawdziwość hipotezy zerowej,
statystyka testowa
k
(nij − nˆij ) 2
,
nˆij
j =1
r
χ 2 = ∑∑
(1)
pl
s.
i =1
ma rozkład χ 2 o (k − 1)(r − 1) stopniach swobody, gdzie współczynniki nij oznaczają
liczebności teoretyczne (liczone przy założeniu niezależności rozkładów), natomiast
n̂ij oznaczają liczebności empiryczne. Co dla poziomu istotności α daje obszar krytyczny
)
postaci χ 2 (1 − α , (r − 1)(k − 1) ),+∞ , gdzie χ 2 ( p, m ) jest kwantylem rzędu p rozkładu χ 2
o m stopniach swobody.
Wykonanie odpowiedniego testu na niezależność (patrz rysunek 3) pozwala odpowiedzieć na następujące pytania:
− „Czy na średnią ocen uczniów w klasie ma wpływ miejsce zamieszkania (czy uczeń
mieszka w tej miejscowości, w której jest szkoła czy w innej)?” – przy wykonywaniu
tego testu użytkownik ma możliwość wyboru klasy, która będzie podlegała obliczeniom;
− „Czy istnieje zależność pomiędzy średnimi ocen uczniów w danym roczniku a ich
sytuacją rodzinną (jeden opiekun lub dwoje)?” – przy wykonywaniu tego testu użyt-
231
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
A. Momot, S. Janocha
w
kownik ma możliwość wyboru rocznika (na przykład wszystkich klas piątych), który
będzie podlegał obliczeniom;
− „Czy istnieje zależność pomiędzy średnią ocen uczniów z danego przedmiotu a nauczycielem, który ich uczy powyższego przedmiotu?” – przy wykonywaniu tego testu użytkownik ma możliwość wyboru rocznika, przedmiotu, który będzie podlegał
weryfikacji oraz dwóch nauczycieli, którzy powyższego przedmiotu uczą w wybranym roczniku;
− „Czy istnieje zależność pomiędzy średnią ocen uczniów (w klasie) a liczbą opuszczonych godzin w ciągu roku przez tych uczniów?” – pytanie dotyczy całkowitej
liczby godzin opuszczonych i całkowitej średniej ucznia; przy wykonywaniu tego testu użytkownik ma możliwość wyboru klasy, spośród tych w których uczniowie opuścili jakieś zajęcia;
− „Czy istnieje zależność pomiędzy średnią ocen uczniów (w klasie) a liczbą negatywnych uwag (nagan)?” – przy wykonywaniu tego testu użytkownik ma możliwość
wyboru klasy, która będzie podlegała obliczeniom; należy tutaj zaznaczyć, iż w liście
rozwijanej pojawiają się tylko te klasy, w których przynajmniej jeden uczeń otrzymał
naganę.
da
.b
w
w
pl
s.
Rys. 3. Okno do realizacji testów statystycznych
Test równości wartości średnich dla par obserwacji jest stosowany, gdy zachodzi konieczność porównania dwóch średnich poziomów pewnej cechy przed wykonaniem jakiejś
czynności oraz bezpośrednio po jej wykonaniu. W tym teście weryfikowana hipoteza zerowa ma postać: H 0 : µ przed = µ po , co jest równoważne µ z = 0 , gdzie µ z jest średnią wartością obliczoną z różnic zi = xi − yi par wyników xi (przed) oraz yi (po). Zakładając
prawdziwość hipotezy zerowej, statystyka testowa
232
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Statystyczna analiza danych pobieranych ze szkolnej bazy danych
t=
Z
Sz
n −1 ,
(2)
ma rozkład Studenta o n − 1 stopniach swobody stopniach swobody, gdzie Z oznacza
średnią arytmetyczną przyrostów, zaś S z oznacza odchylenie standardowe przyrostów, dla
danych n wartości xi oraz yi . Co dla poziomu istotności α daje obszary krytyczne:
w
−
−
−
(− ∞,−t (1 − α , n − 1) , gdy hipoteza alternatywna ma postać H : µ < 0 ;
t (1 − α , n − 1),+∞ ) , gdy hipoteza alternatywna ma postać H : µ > 0 ;
(− ∞,−t (1 − 0.5α , n − 1) ∪ t (1 − 0.5α , n − 1),+∞ ) , gdy hipoteza alternatywna ma po1
1
z
z
da
.b
w
w
stać H 1 : µ z ≠ 0 ,
gdzie t ( p, m) jest kwantylem rzędu p rozkładu Studenta o m stopniach swobody.
Wykonanie odpowiedniego testu na równość średnich parami pozwala odpowiedzieć na
następujące pytania:
− „Jak zmienia się średnia ocen klas (z rocznika) w kolejnych semestrach z danego
przedmiotu?” – przy wykonywaniu tego testu użytkownik ma możliwość wyboru
rocznika, z którego będą pobierane klasy oraz przedmiotu, z którego będzie liczona
średnia ocen;
− „Jak zmienia się średnia semestralna ocen w klasach (z danego rocznika ), w kolejnych dwóch semestrach?” – przy wykonywaniu tego testu użytkownik ma możliwość
wyboru rocznika, z którego będą pobierane klasy brane pod uwagę w obliczeniach;
− „Jak zmienia się średnia ocen klas (z danego rocznika) tego samego poziomu uczonych przez tego samego nauczyciela z określonego przedmiotu przez dwa kolejne
semestry?” – ponieważ w zadanym pytaniu jest mowa o konkretnym przedmiocie
oraz nauczycielu, użytkownik ma możliwość sprecyzowania ich; użytkownik powinien również dokonać wyboru rocznika, z którego będzie pobierana lista przedmiotów przedstawionych do wyboru.
C=
X1 − X 2
S12
S2
+ 2
n1 − 1 n2 − 1
,
pl
s.
Gdy pojawia się konieczność porównania dwóch populacji i ich dwóch wartości przeciętnych stosuje się test równości wartości średnich w dwóch populacjach. W tym teście
weryfikowana hipoteza zerowa ma postać: H 0 : µ1 = µ 2 . Zakładając, że badana cecha X ma
w dwóch populacjach rozkłady normalne N ( µ1 ,σ 1 ) oraz N ( µ 2 ,σ 2 ) o nieznanych odchyleniach standardowych oraz zakładając prawdziwość hipotezy zerowej, statystyka testowa
ma postać:
(3)
gdzie X 1 oraz X 2 oznaczają średnie arytmetyczne obserwacji, zaś S12 oraz S 22 oznaczają
wariancje obserwacji, dla danych n1 wartości xi1 oraz n2 wartości xi2 . Co dla poziomu
istotności α daje obszary krytyczne:
− (−∞,−c(1 − α , n1 , n2 ) , gdy hipoteza alternatywna ma postać H 1 : µ1 < µ 2 ;
−
c (1 − α , n1 , n2 ),+∞) , gdy hipoteza alternatywna ma postać H 1 : µ1 > µ 2 ;
233
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
A. Momot, S. Janocha
−
(−∞,−c(1 − 0.5α , n1 , n2 ) ∪ c (1 − 0.5α , n1 , n2 ),+∞) , gdy hipoteza alternatywna ma po-
stać H 1 : µ1 ≠ µ 2 , gdzie
w
S12
S2
t ( p, n1 − 1) + 2 t ( p, n2 − 1)
n −1
n2 − 1
.
c( p, n1 , n2 ) ≅ 1
2
S1
S2
+ 2
n1 − 1 n2 − 1
(4)
w
Wykonanie odpowiedniego testu na równość średnich w dwóch populacjach pozwala
odpowiedzieć na pytanie:
− „Czy nauczyciele danego przedmiotu mają wpływ na średnią ocen uczniów z różnych klas tego samego poziomu?” – użytkownik powinien dokonać wyboru dwóch
nauczycieli poddawanych testom, a także klas, w których ci nauczyciele uczą oraz
przedmiotu, którego uczą.
w
W przypadku gdy istnieje potrzeba zbadania siły korelacji dwóch cech (X oraz Y) o charakterze jakościowym można zastosować test niezależności wykorzystujący współczynnik
korelacji rangowej Spearmana:
n
da
.b
6∑ d i2
rs = 1 −
i =1
n(n 2 − 1)
,
(5)
gdzie d i określa różnice pomiędzy rangami odpowiadających sobie wartości cechy xi oraz
cechy yi ( i ∈ {1,2,..., n} ). Przy założeniu, że rozmiar próby wynosi przynajmniej 10 oraz
zakładając prawdziwość hipotezy zerowej ( H 0 : ρ = 0 – brak korelacji między badanymi
cechami), statystyka testowa:
t = rS
n−2
,
2
1 − rS
(6)
−
−
pl
s.
ma rozkład Studenta o n − 2 stopniach swobody stopniach swobody. Co dla poziomu
istotności α daje obszary krytyczne:
− (− ∞,−t (1 − α , n − 2) , gdy hipoteza alternatywna ma postać H 1 : ρ < 0 ;
t (1 − α , n − 2),+∞ ) , gdy hipoteza alternatywna ma postać H 1 : ρ > 0 ;
(− ∞,−t (1 − 0.5α , n − 2)
∪ t (1 − 0.5α , n − 2),+∞ ) , gdy hipoteza alternatywna ma po-
stać H 1 : ρ ≠ 0 ,
gdzie t ( p, m) jest kwantylem rzędu p rozkładu Studenta o m stopniach swobody.
Wykonanie odpowiedniego testu na niezależność wykorzystującego współczynnik korelacji kolejnościowej (rang) Spearmana pozwala odpowiedzieć na następujące pytanie:
− „Czy istnieje korelacja pomiędzy uczniami (z określonej klasy), którzy osiągają dobre wyniki z dwóch różnych przedmiotów?” – użytkownik ma do wyboru klasę z
której będą pobierani i selekcjonowani uczniowie oraz dwa przedmioty, które będą
brane pod uwagę.
234
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Statystyczna analiza danych pobieranych ze szkolnej bazy danych
2.5 Uwagi o realizacji programu
w
Program jest podzielony na dwie części: jedną realizującą obliczenia statystyki opisowej
oraz drugą – odpowiedzialną za wykonanie testów statystycznych. Zarówno w pierwszej
jak i w drugiej części zostały wykonane bardzo podobne zabezpieczenia. Aplikacja jest
napisana tak, by przeprowadzić użytkownika w sposób intuicyjny poprzez kolejne kroki
niezbędne do wykonania obliczeń. Efekt ten uzyskany jest dzięki selekcji wykonywanej już
na etapie ładowania danych z bazy danych do list rozwijanych, z których użytkownik dokonuje wyboru. We wszystkich przypadkach, kiedy do dokonania danego obliczenia potrzebne jest wybranie kilku danych z list rozwijanych, dane do kolejnych list ładowane są
dopiero po dokonaniu wyboru z opcji poprzedniej. Aby ten proces przebiegał w pełni bezpiecznie, po uaktywnieniu opcji potrzebnej do wykonania obliczeń użytkownik ma dostęp,
tylko do wyboru opcji w pierwszej, z obecnych na danej formatce, list rozwijanych. Pozostałe są nieaktywne. Uaktywnienie następuje dopiero wtedy, gdy użytkownik wybierze coś
z podstawowej listy rozwijanej. Gdyby pojawiła się sytuacja, że mimo, iż użytkownik dokonał wyboru danych z pierwszej listy rozwijanej, druga z list została odblokowana i dane
do niej zostałyby załadowane, a użytkownik nie wybrałby nic – tylko chciał od razu dokonać obliczeń – wyświetli się na ekranie komunikat informujący użytkownika o niemożności
wykonania takiej operacji.
Po wybraniu kolejnych wymaganych opcji do list rozwijanych zostają załadowane odpowiednie dane. Należy zaznaczyć, iż nie są ładowane wszystkie dane, ale tylko te które są
ściśle powiązane z poprzednimi wyborami użytkownika. Tak więc jeśli użytkownik wybierze konkretnego ucznia z klasy 5A, to do listy rozwijanej „Przedmiot” zostaną załadowane
tylko i wyłącznie przedmioty, na które uczęszcza wybrany uczeń. Pozwala to na ograniczenie ilości błędów, które mogłyby powstać na etapie wykonywania obliczeń. Działanie powyższego ograniczenia jest przedstawione na rysunku 3.
da
.b
w
w
pl
s.
Rys. 3. Ładowanie danych do list rozwijanych
W tym przypadku, czyli wyborze pytania „Czy istnieje korelacja pomiędzy uczniami
(z określonej klasy), którzy osiągają dobre wyniki z dwóch różnych przedmiotów?”, gdy
zostanie wybrany na przykład przedmiot biologia z pola „Przedmiot 1”, wśród danych
załadowanych do listy rozwijanej „Przedmiot 2” biologia już się nie pojawi. Pozwala to na
uniknięcie wykonywania obliczeń, które nie miałby sensu logicznego. Ponadto w opisywanym przypadku dane do listy „Przedmiot 2” załadują się dopiero po wybraniu danych z
listy „Przedmiot 1”, dlatego też wybór z listy „Przedmiot 2” nie jest od razu dostępny, ale
jest zablokowany. Przy czym należy zaznaczyć, że dane, które są ładowane do listy „Przedmiot 1” wybierane są na podstawie wybranej przez użytkownika klasy.
235
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
A. Momot, S. Janocha
3 Podsumowanie
w
Głównymi zadaniami jakie zostały postawione przed aplikacją w trakcie procesu ustalania
i analizy wymagań były: wspomaganie pracy dyrekcji szkoły, pomoc przy podejmowaniu
decyzji związanych z kierunkiem nauczania, pomoc przy ustalaniu przyczyn problemów
uczniów w nauce poprzez wykonywanie zadanych obliczeń statystycznych i wyświetlanie
ich wyników w przejrzystej i czytelnej formie. Jako że szkoły gromadzą duże ilości danych
i zarówno grono pedagogiczne, jak i rodzice uczniów zadają każdego dnia mnóstwo pytań
związanych ze sposobem nauczania czy też przyczynami pewnych wydarzeń, powiązanie
opisywanej aplikacji ze szkolnymi bazami danych mogłoby stanowić dużą pomoc dla każdej szkoły, pozwalając na znaczne ułatwienie prac związanych ze statystyczną analizą danych zawartych w szkolnych bazach danych i może stanowić istotną pomoc przy statystycznej weryfikacji pewnych hipotez związanych z codzienną pracą szkoły.
w
1.
2.
6.
Bielecka A.: Statystyka w biznesie i ekonomii. Teoria i praktyka. Wyd. WSPiZ, Warszawa 2005.
Ferguson G. A, Takane Y.: Analiza statystyczna w psychologii i pedagogice. PWN,
Warszawa 1997.
Gajek L., Kałuszka M.: Wnioskowanie statystyczne – modele i metody. WNT, Warszawa 2000.
Sobczyk M.: Statystyka. PWN , Warszawa 2005.
Watała C.: Biostatystyka - wykorzystanie metod statystycznych w pracy badawczej w naukach
biomedycznych. Alfa Medica Press, Bielsko-Biała 2002.
Wybrańczyk M.: C++ Builder 6 i bazy danych. Helion, Gliwice 2005.
da
.b
3.
4.
5.
w
Literatura
pl
s.
236
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008