Zadatak s vježbi
Select messages from
# through # FAQ
[/[Print]\]

Forum@DeGiorgi -> Paralelni algoritmi 1 i 2

#1: Zadatak s vježbi Autor/ica: venovako PostPostano: 21:44 pet, 13. 5. 2011
    —
Popravljeni zadatak s vježbi nalazi se na Fermiju pod
/share/venovako/fro.cu
i na Webu s primjerima
http://web.studenti.math.hr/~venovako/PPR/CUDA/

"Bug" s neispisivanjem rezultat je zbunjenosti asistenta koji je kompajlirao program u a.out, a pokretao fro program Blush

Program je također imao ponešto pravih bugova s indeksacijom, koji bi sad trebali biti počišćeni. Dodani su i makroi radi lakšeg čitanja, te manipulacije CUDA greškama.

Na jednom primjeru (A.dat) program računa parcijalne sume korektno. Finalna redukcija thrustom ima problema (što nije prvi put da ta biblioteka gnjavi), pa ću to još probati utjerati.

Sljedeći put dovršimo zadatak (usporedba s dnrm2 i diskusija oko "pravog" načina računanja).

#2:  Autor/ica: venovako PostPostano: 21:17 sub, 14. 5. 2011
    —
Sredjena je i redukcija thrustom; potrebno mu je eksplicitno reci da radi na device memoriji.

Za usporedbu, pozvana je i LAPACK funkcija dlange, koja vraca odabranu matricnu normu.

Primjer mozete preuzeti s gore navedenih lokacija, gdje se nalazi i fro.sh skriptica za kompajliranje na Fermiju.

Dokumentaciju za thrust mozete pogledati ovdje:
http://wiki.thrust.googlecode.com/hg/html/index.html



Forum@DeGiorgi -> Paralelni algoritmi 1 i 2


output generated using printer-friendly topic mod. Vremenska zona: GMT + 01:00.

Stranica 1 / 1.

Powered by phpBB © 2001,2002 phpBB Group
Theme created by Vjacheslav Trushkin