#1: Zadatak s vježbi Autor/ica: venovako, Postano: 21:44 pet, 13. 5. 2011 Popravljeni zadatak s vježbi nalazi se na Fermiju pod
/share/venovako/fro.cu
i na Webu s primjerima
http://web.studenti.math.hr/~venovako/PPR/CUDA/
"Bug" s neispisivanjem rezultat je zbunjenosti asistenta koji je kompajlirao program u a.out, a pokretao fro program
Program je također imao ponešto pravih bugova s indeksacijom, koji bi sad trebali biti počišćeni. Dodani su i makroi radi lakšeg čitanja, te manipulacije CUDA greškama.
Na jednom primjeru (A.dat) program računa parcijalne sume korektno. Finalna redukcija thrustom ima problema (što nije prvi put da ta biblioteka gnjavi), pa ću to još probati utjerati.
Sljedeći put dovršimo zadatak (usporedba s dnrm2 i diskusija oko "pravog" načina računanja).
#2: Autor/ica: venovako, Postano: 21:17 sub, 14. 5. 2011 Sredjena je i redukcija thrustom; potrebno mu je eksplicitno reci da radi na device memoriji.
Za usporedbu, pozvana je i LAPACK funkcija dlange, koja vraca odabranu matricnu normu.
Primjer mozete preuzeti s gore navedenih lokacija, gdje se nalazi i fro.sh skriptica za kompajliranje na Fermiju.