Usporedba knjiga po riječima koje se u njima nalaze
Izvor: KiWi
Cilj: Matematičkim metodama uz pomoć računala odrediti sličnost dvije knjige na temelju riječi koje se u njima pojavljuju
Učenike podijeliti u grupe po 4 učenika
Svaka grupa treba odabrati 2 autora čija će djela uspoređivati. Svaki učenik treba odabrati jednu knjigu i to tako da u svakoj grupi budu po dvije knjige istog autora. Dakle, dvoje učenika obrađuje knjigu prvog autora, a dvoje učenika obrađuje knjige drugog autora.
Može se, radi provjere rezultata, iste knjige dati na obradu učenicima iz različitih grupa.
Za svaku knjigu treba napraviti popis svih riječi koje se u njoj pojavljuju uz broj pojavljivanja u toj knjizi.
Malo matematike
Zamislimo koordinatni sustav kod kojega je svaka koordinatna os imenovana jednom rječju, a broj pojavljivanja neke riječi određuje vrijednost odgovarajuće koordinate. Na taj se način svaka knjiga smješta u koordinatni sustav čija je dimenzija jednaka ukupnom broju različitih riječi korištenih u svim analiziranim djelima (Ovo zahtijeva određenu razinu apstraktnog mišljenja, ali nije nemoguće ostvariti).
Gledano od ishodišta, svaka knjiga se nalazi u nekom smjeru, s time da su knjige u kojima ima više riječi dalje od ishodišta, a one s manje riječi su bliže ishodištu. Postavimo sve knjige na jednaku udaljenost od ishodišta (podsjetimo se Pitagorinog poučka, normiranja vektora i predočimo si to u 2 i 3 dimenzije)
Nakon što smo sve knjige smjestili na udaljenost 1 od ishodišta, sve se one nalaze na sferi radijusa 1 (što je sfera radijusa 1 u slučaju 1-, 2- i 3-dimenzionalnog prostora?)
Za svake dvije knjige izračunamo međusobnu udaljenost uz takvo smještavanje. Koje su knjige najbliže, a koje najudaljenije? Jesu li neke dvije knjige različitih autora bliže od knjiga istog autora?
Smislite još pitanja na koja odgovore možete dati ovakvom analizom.
Plan provedbe
- Odabrati jezik na kojem će knjige biti napisane
- Odrediti učenike koji će obrađivati ista djela (radi kontrole)
- Odabrati autore čija će se djela obrađivati
- Pronaći djela u obliku pogodnom za računalnu obradu (npr na http://lektire.skole.hr/). Djela označiti brojevima 1, 2, 3, ...
- Učenicima objasniti način usporedbe dva književna djela i dati intuitivnu matematičku podlogu
- Prikupiti učeničke ideje o mogućim načinima provedbe (programski jezici, alati, http://easycalculation.com/word-count.php)
- Provesti prvu fazu: pronaći zadano književno djelo, popisati riječi i učestalost. Pri tome svi trebaju pripremiti izlazne podatke u istom formatu. Riječi trebaju biti sortirane po abecedi. Način rada ne mora biti isti (čak je i poželjno da ne bude), ali izlaz MORA biti isti - radi kasnije analize
- Dogovoriti način imenovanja datoteka. Sve datoteke moraju biti na istom mjestu i dostupne svim učenicima za kasniju obradu. Odabrati tehnologiju koja omogućuje najlakše dijeljenje podataka i učenicima je najbliža
- Usporediti rezultate učenika koji su obrađivali ista djela. Rezultati moraju biti isti. Komentirati dobivene razlike i zbog čega je do njih došlo
- Tako dobivene podatke treba obraditi. Prvo treba od vektora frekvencija napraviti normirani vektor. Normirani vektor svi trebaju zapisati u istom dogovorenom obliku i nazvati unaprijed dogovorenim imenima. Prekontrolirati da je suma kvadrata koordinata stvarno jednaka 1. Svatko treba provjeriti datoteku koja je rednom broju iza njegove (osim posljednjega koji provjerava prvu datoteku)
- Svaki učenik uspoređuje svoju datoteku (normirani vektor) s ostale 3 datoteke (vektora) iz svoje grupe i na list papira (rukom) piše: Djelo1-Djelo2, udaljenost - zaokruženo na 6 decimala
- Nakon što je to gotovo, učenici međusobno provjeravaju svoje rezultate i otklanjaju pogreške u računu
- Nakon što su svi rezultati usklađeni (pa prema tome vjerojatno i točni), počinje "licitacija": Koja je udaljenost najmanje? Koja je udaljenost djela istog autora najveća? Koja je najveća vrijednost (normirane) komponente .... Smislite još pitanja.
- Udaljenosti se upisuju u zajedničku tablicu - jedna tablica za svaku grupu
- Svaki učenik ima pravo odabrati jedno djelo iz neke od preostalih grupa i usporediti ga s nekim djelom iz svoje grupe. Tko pronađe dva najsličnija djela, dobiva nagradu (peticu iz zalaganja, plus, ...)