Usporedba knjiga po riječima koje se u njima nalaze

Izvor: KiWi

(Usporedba među inačicama)
Skoči na: orijentacija, traži
(Nova stranica: Cilj: Matematičkim metodama uz pomoć računal odrediti sličnost dvije knjige na temelju riječi koje se u njima pojavljuju Učenike podijeliti u grupe po 4 učenika Svaka grupa t…)
Redak 1: Redak 1:
-
Cilj: Matematičkim metodama uz pomoć računal odrediti sličnost dvije knjige na temelju riječi koje se u njima pojavljuju
+
Cilj: Matematičkim metodama uz pomoć računala odrediti sličnost dvije knjige na temelju riječi koje se u njima pojavljuju
Učenike podijeliti u grupe po 4 učenika
Učenike podijeliti u grupe po 4 učenika

Inačica od 14:30, 21. svibnja 2014.

Cilj: Matematičkim metodama uz pomoć računala odrediti sličnost dvije knjige na temelju riječi koje se u njima pojavljuju

Učenike podijeliti u grupe po 4 učenika

Svaka grupa treba odabrati 2 autora čija će djela uspoređivati. Svaki učenik treba odabrati jednu knjigu i to tako da u svakoj grupi budu po dvije knjige istog autora. Dakle, dvoje učenika obrađuje knjigu prvog autora, a dvoje učenika obrađuje knjige drugog autora.

Može se, radi provjere rezultata, iste knjige dati na obradu učenicima iz različitih grupa.

Za svaku knjigu treba napraviti popis svih riječi koje se u njoj pojavljuju uz broj pojavljivanja u toj knjizi.

Malo matematike

Zamislimo koordinatni sustav kod kojega je svaka koordinatna os imenovana jednom rječju, a broj pojavljivanja neke riječi određuje vrijednost odgovarajuće koordinate. Na taj se način svaka knjiga smješta u koordinatni sustav čija je dimenzija jednaka ukupnom broju različitih riječi korištenih u svim analiziranim djelima (Ovo zahtijeva određenu razinu apstraktnog mišljenja, ali nije nemoguće ostvariti).

Gledano od ishodišta, svaka knjiga se nalazi u nekom smjeru, s time da su knjige u kojima ima više riječi dalje od ishodišta, a one s manje riječi su bliže ishodištu. Postavimo sve knjige na jednaku udaljenost od ishodišta (podsjetimo se Pitagorinog poučka, normiranja vektora i predočimo si to u 2 i 3 dimenzije)

Nakon što smo sve knjige smjestili na udaljenost 1 od ishodišta, sve se one nalaze na sferi radijusa 1 (što je sfera radijusa 1 u slučaju 1-, 2- i 3-dimenzionalnog prostora?)

Za svake dvije knjige izračunamo međusobnu udaljenost uz takvo smještavanje. Koje su knjige najbliže, a koje najudaljenije? Jesu li neke dvije knjige različitih autora bliže od knjiga istog autora?

Smislite još pitanja na koja odgovore možete dati ovakvom analizom.

Plan provedbe

  1. Odabrati jezik na kojem će knjige biti napisane
  2. Odrediti učenike koji će obrađivati ista djela (radi kontrole)
  3. Odabrati autore čija će se djela obrađivati
  4. Pronaći djela u obliku pogodnom za računalnu obradu (npr na http://lektire.skole.hr/). Djela označiti brojevima 1, 2, 3, ...
  5. Učenicima objasniti način usporedbe dva književna djela i dati intuitivnu matematičku podlogu
  6. Prikupiti učeničke ideje o mogućim načinima provedbe (programski jezici, alati, ...)
  7. Provesti prvu fazu: pronaći zadano književno djelo, popisati riječi i učestalost. Pri tome svi trebaju pripremiti izlazne podatke u istom formatu. Riječi trebaju biti sortirane po abecedi. Način rada ne mora biti isti (čak je i poželjno da ne bude), ali izlaz MORA biti isti - radi kasnije analize
  8. Dogovoriti način imenovanja datoteka. Sve datoteke moraju biti na istom mjestu i dostupne svim učenicima za kasniju obradu. Odabrati tehnologiju koja omogućuje najlakše dijeljenje podataka i učenicima je najbliža
  9. Usporediti rezultate učenika koji su obrađivali ista djela. Rezultati moraju biti isti. Komentirati dobivene razlike i zbog čega je do njih došlo
  10. Tako dobivene podatke treba obraditi. Prvo treba od vektora frekvencija napraviti normirani vektor. Normirani vektor svi trebaju zapisati u istom dogovorenom obliku i nazvati unaprijed dogovorenim imenima. Prekontrolirati da je suma kvadrata koordinata stvarno jednaka 1. Svatko treba provjeriti datoteku koja je rednom broju iza njegove (osim posljednjega koji provjerava prvu datoteku)
  11. Svaki učenik uspoređuje svoju datoteku (normirani vektor) s ostale 3 datoteke (vektora) iz svoje grupe i na list papira (rukom) piše: Djelo1-Djelo2, udaljenost - zaokruženo na 6 decimala
  12. Nakon što je to gotovo, učenici međusobno provjeravaju svoje rezultate i otklanjaju pogreške u računu
  13. Nakon što su svi rezultati usklađeni (pa prema tome vjerojatno i točni), počinje "licitacija": Koja je udaljenost najmanje? Koja je udaljenost djela istog autora najveća? Koja je najveća vrijednost (normirane) komponente .... Smislite još pitanja.
  14. Udaljenosti se upisuju u zajedničku tablicu - jedna tablica za svaku grupu
  15. Svaki učenik ima pravo odabrati jedno djelo iz neke od preostalih grupa i usporediti ga s nekim djelom iz svoje grupe. Tko pronađe dva najsličnija djela, dobiva nagradu (peticu iz zalaganja, plus, ...)
Osobni alati