O primjeni programa Maxima u nastavi predmeta Vjerojatnost i statistika na specijalističkom stručnom studiju graditeljstva
[email protected]
Ključni pojmovi: vjerojatnost, statistika, Maxima, besplatni računalni program
U prvom semestru Politehničkog diplomskog specijalističkog stručnog studija graditeljstva Tehničkog veleučilišta u Zagrebu izvodi se predmet Vjerojatnost i statistika. Cilj tog predmeta je upoznati studente s osnovnim pojmovima vjerojatnosti i metodama za statističku obradu podataka. Fond sati tog predmeta je 15+13+2, od čega je 15 sati predviđeno za predavanja, 13 sati za auditorne vježbe, a 2 sata za laboratorijske vježbe koje se održavaju u računalnom laboratoriju. Teme predviđene nastavnim planom i programom odnose se na: klasičnu definiciju vjerojatnosti, operacije među događajima, uvjetnu i totalnu vjerojatnost, diskretne i kontinuirane slučajne varijable, statističku populaciju i slučajni uzorak, grafičko prikazivanje statističkih podataka, procjenitelje, intervalnu procjenu očekivanja i varijance te testiranje hipoteza. Do ove akademske godine u sklopu laboratorijskih vježbi zadaci su se rješavali pomoću MS Excela. Međutim, kako se od akademske godine 2015./2016. u sklopu predmeta Računarstvo u graditeljstvu, koji se izvodi u prvom semestru preddiplomskog stručnog studija graditeljstva, obrađuje program Maxima, ove akademske godine umjesto MS Excela koristili smo program Maxima. Osim na predmetu Vjerojatnost i statistika Maximu koristimo i u sklopu ostalih matematičkih predmeta koji se izvode na studijima graditeljstva Tehničkog veleučilišta u Zagrebu, o čemu smo pisali u
Računalni program Maxima, besplatni je program koji se može preuzeti na web adresi http://maxima.sourceforge.net/. Općenito, program je pogodan za različite algebarske operacije sa simboličkim i numeričkim izrazima, kao što su deriviranje, integriranje, razvoj u Taylorov red, Laplaceova transformacija, sustavi linearnih jednadžbi, vektori, matrice, statistika itd.
U ovom članku prikazano je kako se pomoću programa Maxima mogu riješiti neki od zadataka koji se obrađuju u sklopu nastave predmeta Vjerojatnost i statistika.
U ovom dijelu rada dan je pregled i opis onih funkcija programa Maxima, koje koristimo u sklopu nastave predmeta Vjerojatnost i statistika. To su funkcije iz paketa descriptive, distrib i stats.
Paket descriptive sadrži funkcije deskriptivne statistike i funkcije za grafički prikaz podataka. Sljedeće funkcije samo su neke od dostupnih funkcija ovog paketa. Njihov argument x može biti lista ili matrica.
\bullet | Funkcija mean(x) računa uzoračku aritmetičku sredinu. |
\bullet | Funkcija var(x) računa uzoračku varijancu. |
\bullet | Funkcija var1(x) računa korigiranu uzoračku varijancu. |
\bullet | Funkcija std(x) računa uzoračku standardnu devijaciju. |
\bullet | Funkcija std1(x) računa korigiranu standardnu devijaciju. |
\bullet | Funkcija histogram(x, opcije) koristi se za izradu histograma. |
Paket distrib sadrži funkcije za izračun vjerojatnosti diskretnih i kontinuiranih univarijatnih modela. Dalje su opisane one funkcije koje se odnose na slučajne varijable s normalnom odnosno binomnom razdiobom.
\bullet |
Za slučajnu varijablu s normalnom razdiobom N\left(m, s\right) funkcija:
|
||||||||||
\bullet |
Za slučajnu varijablu s binomnom razdiobom B\left(n, p\right) funkcija:
|
Paket stats sadrži funkcije za izvođenje zaključaka o populaciji na temelju svojstava uzorka.
\bullet |
Funkcija test_mean(x,opcije) koristi se za testiranje hipoteza i određivanje intervala povjerenja za očekivanje s poznatom ili nepoznatom varijancom. Argument x može biti lista ili stupac matrice, a odnosi se na jednodimenzionalni slučajni uzorak normalno distribuirane slučajne varijable, dok se pod opcijama mogu unijeti sljedeći podaci:
|
||||||||||||||||||||||||
\bullet | Funkcija test_variance(x, opcije) koristi se za testiranje hipoteza te određivanje intervala povjerenja za varijancu. Argument i opcije definiraju se isto kao i kod funkcije test_mean. |
Prije zadavanja bilo koje funkcije iz navedenih paketa potrebno je učitati odgovarajući paket i to jednom od naredbi: load("descriptive")$, load("distrib")$ ili load("stats")$. Unutar jednog radnog lista paket je dovoljno učitati jednom bez obzira koliko se funkcija iz njega poziva. Više o ovim i ostalim funkcijama dostupnim u navedenim paketima može se pronaći u
U ovom poglavlju dani su primjeri zadataka i njihova rješenja koji se rješavaju u sklopu auditornih ("ručnim" putem) i laboratorijskih vježbi (upotrebom računalnog programa) na predmetu Vjerojatnost i statistika. Budući da se zbog ograničena vremena na laboratorijskim vježbama ne stigne u sklopu zadataka ponavljati teorijska podloga, rješavamo iste zadatke kao i na auditornim vježbama. Na taj način ne "trošimo" vrijeme na razumijevanje teksta zadatka i postavljanje problema, već su studenti usmjereni na razumijevanje naredbi programa Maxima i interpretaciju dobivenih rezultata. Najčešći problem s kojim se susrećemo na laboratorijskim vježbama vezan je uz poznavanje sintakse programa odnosno uz ispravan unos početnih podataka i interpretaciju dobivenih rezultata.
Za slučajnu varijablu X \sim N\left(\mu, \sigma^{2}\right), slučajna varijabla sa standardnom normalnom razdiobom je X^{*} =\frac{X-\mu}{\sigma}, a vjerojatnost da normalno distribuirana slučajna varijabla X poprimi vrijednosti unutar segmenta \left[a, b\right] je
Podintegralna funkcija f^{*}(x) je funkciju gustoće vjerojatnosti standardne normalne razdiobe (
Stoga, primjenom formule
U programu Maxima vrijednosti funkcije F^{*}(x) mogu se izračunati, i to nešto preciznije, na sljedeći način. Najprije izračunamo vrijednosti \frac{a-\mu}{\sigma} i \frac{b-\mu}{\sigma} unošenjem naredbi:
Nakon što stisnemo zajedno tipke SHIFT+ENTER Maxima će ispisati:
Za izračun vrijednosti funkcije F^{*} koristimo funkciju cdf_normal(x,m,s), gdje x odgovara vrijednosti \frac{X-\mu}{\sigma}, \texttt{m}=0 i s=1. U novi red unesemo naredbu za učitanje paketa distrib, a potom zadamo odgovarajuću naredbu.
Kao izlaz zadane naredbe Maxima će ispisati:
Za binomno distribuiranu slučajnu varijablu X \sim B\left(n, p\right) funkcija vjerojatnosti dana je izrazom
gdje je n proizvoljan prirodan broj, k\leq n prirodan broj i p(0\lt p\lt 1) realan broj (
Vjerojatnost da se pogodi cilj barem 2 puta, uključuje događaje da se cilj pogodi dva ili tri ili četiri,..., ili deset puta. U ovom slučaju jednostavnije je izračunati vjerojatnost suprotnog događaja, koji uključuje događaje da se cilj nije pogodio te da se pogodio jednom. Stoga, primjenom formule
U programu Maxima ovo možemo izračunati unošenjem sljedećih naredbi:
Izlaz ove naredbe je:
Test-statistika
ima Studentovu t-razdiobu s n-1 stupnjeva slobode. Za određivanje vrijednosti test-statistike potrebno je odrediti aritmetičku sredinu i korigiranu standardnu devijaciju:
Tada test-statistika iznosi:
Digresija: Vrijednosti aritmetičke sredine i standardne devijacije u programu Maxima mogu se izračunati na sljedeći način:
Izlazi ovih naredbi su:
Postavljamo hipoteze
Za ovako postavljene hipoteze kritično područje ili područje odbacivanja hipoteze H_{0} je \left[-\infty,t_{\alpha}\right\rangle. Vrijednost t_{\alpha} odredimo iz tablice Studentove t-razdiobe za n-1=11 stupnjeva slobode (vidjeti tablicu u
odnosno kritično područje je \left\langle -\infty, -1.85955 \right\rangle\,. Kako vrijednost test-statistike t ne upada u kritično područje prihvaćamo hipotezu H_{0}, te odbacujemo hipotezu H_{1}, na razini značajnosti od 5\%. Prema tome, možemo reći da stroj ne proizvodi ploče debljine manje od propisanih 9.5 mm.
Zadatak ćemo u programu Maxima riješiti tako da ćemo prvo učitati paket stats, definirat ćemo skup podataka te potom zadati naredbu za lijevi jednostrani test. To činimo na sljedeći način:
Napomena: 'conflevel=0.95 je razina pouzdanosti i njegova vrijednost jednaka je 1-\alpha.
Maxima će rezultat zadane naredbe ispisati u obliku:
Na temelju dobivenih rezultata odgovor o odbacivanju ili prihvaćanju hipoteze H_{0} dajemo na temelju p-vrijednosti testa. Kako na auditornim vježbama, kao što je prethodno prikazano, odgovor o prihvaćanju hipoteze H_{0} dajemo na temelju vrijednosti test-statistike i kritičnog područja te se pojam p-vrijednosti ne spominje, ovdje je potrebno studentima dodatno pojasniti što ona predstavlja.
U slučaju lijevog jednostranog t-testa p-vrijednost jednaka je p=\mathbb{P}\left(T\leq \left.t \right|H_{0}\right), desnog jednostranog testa jednaka je p=\mathbb{P}\left(T \geq \left.t \right|H_{0}\right), dok je kod dvostranog testa p-vrijednost manja od brojeva 2\cdot \mathbb{P}\left(T\leq \left.t \right|H_{0}\right) i 2\cdot \mathbb{P}\left(T \geq \left.t \right|H_{0}\right). Na temelju p-vrijednosti možemo dati sljedeće zaključke:
\bullet | ako je p \leq \alpha, onda se t nalazi u kritičnom području, pa odbacujemo H_{0} na razini značajnosti \alpha, |
\bullet | ako je p \gt \alpha, onda se t ne nalazi u kritičnom području, pa prihvaćamo H_{0} na razini značajnosti \alpha. |
U našem slučaju je p=0.96\gt 0.05, pa stoga hipotezu H_{0} prihvaćamo na razini značajnosti od 0.05.
Interval povjerenja za očekivanje s nepoznatom varijancom i pouzdanošću \gamma je
gdje je t_{\frac{1+\gamma}{2}} kvantil Studentove t-razdiobe s n-1 stupnjeva slobode.
Vrijednost kvantila t_{\frac{1+\gamma}{2}} odredimo iz tablice Studentove t-razdiobe za n-1=11 stupnjeva slobode (vidjeti tablicu u
Tada je interval povjerenja na temelju formule
U programu Maxima interval povjerenja određuje se pomoću naredbe za određivanje dvostranog t-testa. U novi red unesemo naredbu:
Maxima će rezultat zadane naredbe ispisati u obliku:
Sada je u četvrtom redu ispisan interval povjerenja za očekivanje s nepoznatom varijancom s pouzdanošću od 95\%.
Od akademske godine 2015./2016. na stručnom studiju graditeljstva Tehničkog veleučilišta u Zagrebu računalni program Maxima obrađuje se u sklopu predmeta Računarstvo u graditeljstvu. U posljednje tri godine pokazalo se da ga studenti s lakoćom savladavaju te da ga uspješno primjenjuju u rješavanju zadataka u sklopu ostalih matematičkih predmeta (bilo na nastavi ili samostalno u sklopu seminarskih radova). Iz tog razloga, ali i zato što imamo mali broj sati predviđen za rad na računalu iz predmeta Vjerojatnost i statistika, odlučili smo se koristiti program Maxima, a ne neki, možda, prikladniji program za statističku obradu podataka (R, SPS i sl.).
U ovom trenutku postoje prijedlozi da se broj laboratorijskih vježbi poveća. Na taj način imali bi mogućnost raditi s oba programa, Excelom (kojeg smo do ove godine koristili) i Maximom. Iako se pokazalo da program Maxima u potpunosti zadovoljava sve nastavne potrebe matematičkih predmeta, koji se izvode na studijima graditeljstva, Excel je program koji će studenti u svom budećem poslu koristiti na svakodnevnoj razini i stoga je dobro u što većoj mjeri i u što različitije svrhe koristiti ga u sklopu nastave.