Search
 
 
  Engleski
 
 
 
Open in this window (click to change)
Forum@DeGiorgi: Početna
Forum za podršku nastavi na PMF-MO
Login Registracija FAQ Smajlići Članstvo Pretražnik Forum@DeGiorgi: Početna

Materijali za Primjenu paralelnih računala (informacija)

Moja sarma
 
Započnite novu temu   Odgovorite na temu   printer-friendly view    Forum@DeGiorgi: Početna -> Kolegiji diplomskih i starih studija -> Paralelni algoritmi 1 i 2
Prethodna tema :: Sljedeća tema  
Autor/ica Poruka
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 15:18 čet, 15. 1. 2009    Naslov: Skripta iz Numeričke analize Citirajte i odgovorite

http://web.math.hr/~singer/num_alg/num_anal.pdf
http://web.math.hr/~singer/num_alg/num_anal.pdf


[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 19:22 sri, 3. 6. 2009    Naslov: Materijali za Primjenu paralelnih računala Citirajte i odgovorite

Predavanja prof. Demmela:
http://www.cs.berkeley.edu/~demmel/

Ponešto predavanja na hrvatskom:
http://www.fsb.hr/ssinger/

I, naravno, MPI i OpenMP standardi.
Predavanja prof. Demmela:
http://www.cs.berkeley.edu/~demmel/

Ponešto predavanja na hrvatskom:
http://www.fsb.hr/ssinger/

I, naravno, MPI i OpenMP standardi.


[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 19:42 sri, 2. 3. 2011    Naslov: CUDA literatura Citirajte i odgovorite

Izbor iz CUDA literature:

David B. Kirk and Wen-mei W. Hwu.
Programming Massively Parallel Processors
A Hands-on Approach.
Morgan Kaufmann, 2009.

Wen-mei W. Hwu (Ed.).
GPU Computing Gems
Emerald Edition.
Morgan Kaufmann, 2011.

Jason Sanders and Edward Kandrot.
CUDA by Example
An Introduction to General-Purpose GPU Programming.
Addison-Wesley (Pearson Education), 2010.
Izbor iz CUDA literature:

David B. Kirk and Wen-mei W. Hwu.
Programming Massively Parallel Processors
A Hands-on Approach.
Morgan Kaufmann, 2009.

Wen-mei W. Hwu (Ed.).
GPU Computing Gems
Emerald Edition.
Morgan Kaufmann, 2011.

Jason Sanders and Edward Kandrot.
CUDA by Example
An Introduction to General-Purpose GPU Programming.
Addison-Wesley (Pearson Education), 2010.




Zadnja promjena: venovako; 17:54 čet, 17. 3. 2011; ukupno mijenjano 1 put.
[Vrh]
Korisnički profil Pošaljite privatnu poruku
mhaberl
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 05. 09. 2009. (14:44:26)
Postovi: (2D)16
Spol: muško
Sarma: -

PostPostano: 22:39 sri, 2. 3. 2011    Naslov: Re: CUDA literatura Citirajte i odgovorite

[quote="venovako"]Izbor iz CUDA literature:

David B. Kirk and Wen-mei W. Hwu.
Programming Massively Parallel Processors
A Hands-on Approach.
Morgan Kaufmann, 2009.

Wen-mei W. Hwu (Ed.).
GPU Computing Gems
Emerald Edition.
Morgan Kaufmann, 2011.

Jason Sanders and Edward Kandrot.
CUDA by Example
An Introduction to General-Purpose GPU Programming.
Addison-Wesley (Pearson Education), 2010.[/quote]

mozda ovo bude od koristi:
[url=http://developer.nvidia.com/object/cuda_training.html]nvidia developer zone\CUDA Training[/url] :)
venovako (napisa):
Izbor iz CUDA literature:

David B. Kirk and Wen-mei W. Hwu.
Programming Massively Parallel Processors
A Hands-on Approach.
Morgan Kaufmann, 2009.

Wen-mei W. Hwu (Ed.).
GPU Computing Gems
Emerald Edition.
Morgan Kaufmann, 2011.

Jason Sanders and Edward Kandrot.
CUDA by Example
An Introduction to General-Purpose GPU Programming.
Addison-Wesley (Pearson Education), 2010.


mozda ovo bude od koristi:
nvidia developer zone\CUDA Training Smile
[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 2:34 ned, 6. 3. 2011    Naslov: Citirajte i odgovorite

Thnx, mhaberl, "živa" predavanja su katkad brži način od probijanja kroz knjige.

Usput, korisno je pogledati i [url=http://forums.nvidia.com/]Forum[/url] (CUDA dio) za novosti i savjete oko (nažalost, ne baš rijetkih) problema.
Thnx, mhaberl, "živa" predavanja su katkad brži način od probijanja kroz knjige.

Usput, korisno je pogledati i Forum (CUDA dio) za novosti i savjete oko (nažalost, ne baš rijetkih) problema.


[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 3:31 čet, 1. 3. 2012    Naslov: Citirajte i odgovorite

Mali update sa sličnim (ali ne baš istim) linkom kao mhaberl:
http://developer.nvidia.com/cuda-training
Mali update sa sličnim (ali ne baš istim) linkom kao mhaberl:
http://developer.nvidia.com/cuda-training


[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 0:14 pet, 9. 3. 2012    Naslov: Citirajte i odgovorite

Slajdovi sa zadnjih vježbi i ponešto primjera za sljedeće:
http://titan.fsb.hr/~venovako/nastava/PMF-MO/ParAlg12/2/CUDA
Slajdovi sa zadnjih vježbi i ponešto primjera za sljedeće:
http://titan.fsb.hr/~venovako/nastava/PMF-MO/ParAlg12/2/CUDA


[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 20:33 čet, 15. 3. 2012    Naslov: Citirajte i odgovorite

Za one koji žele dobiti kakvu-takvu predodžbu o (ne)ovisnosti streamova, materijali s webinara:

http://developer.download.nvidia.com/CUDA/training/StreamsAndConcurrencyWebinar.pdf
http://developer.download.nvidia.com/CUDA/training/StreamsAndConcurrency_Jan_2012.mp4

P.S. Primjer s današnjih vježbi je na "očekivanom" mjestu:
http://titan.fsb.hr/~venovako/nastava/PMF-MO/ParAlg12/2/CUDA/fro.cu
Za one koji žele dobiti kakvu-takvu predodžbu o (ne)ovisnosti streamova, materijali s webinara:

http://developer.download.nvidia.com/CUDA/training/StreamsAndConcurrencyWebinar.pdf
http://developer.download.nvidia.com/CUDA/training/StreamsAndConcurrency_Jan_2012.mp4

P.S. Primjer s današnjih vježbi je na "očekivanom" mjestu:
http://titan.fsb.hr/~venovako/nastava/PMF-MO/ParAlg12/2/CUDA/fro.cu


[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 13:51 pon, 26. 3. 2012    Naslov: Citirajte i odgovorite

Mali podsjetnik da postoji jedan beskrajno jednostavan i koristan alat za provjeru tipičnih grešaka memorijskog tipa: [b]cuda-memcheck[/b].

Ako je poziv vašeg programa
[tt]./prog arg1 arg2[/tt]
onda je poziv s provjerom
[tt]cuda-memcheck ./prog arg1 arg2[/tt]
Program će se izvoditi znatno sporije, ali će se uloviti dobar dio memorijskih grešaka.
Mali podsjetnik da postoji jedan beskrajno jednostavan i koristan alat za provjeru tipičnih grešaka memorijskog tipa: cuda-memcheck.

Ako je poziv vašeg programa
./prog arg1 arg2
onda je poziv s provjerom
cuda-memcheck ./prog arg1 arg2
Program će se izvoditi znatno sporije, ali će se uloviti dobar dio memorijskih grešaka.


[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 21:16 uto, 27. 3. 2012    Naslov: Citirajte i odgovorite

Bilo je pitanje čemu služi i je li potreban cudaDeviceSynchronize() na kraju fro.cu primjera.
Odgovor:
Moramo pričekati da se kernel izvrši kako bi pročitali rezultat iz varijable.
Time što je poziv cublas funkcije završio ne mora značiti da je i kernel kojeg ona zove gotov.
U CUBLAS_Library.pdf, sekcija 2.4 Scalar Parameters, stoji da trebamo "proper synchronization" prije čitanja rezultata.
To je objašnjenje dodano u novu verziju fro.cu primjera na Webu.

Također, nisam siguran jesam li vam (korektno) rekao kako se prevodi višedimenzionalni threadIdx u linearni indeks threada unutar bloka.
Iz linearnog indeksa možemo zaključiti kojem warpu thread pripada i koji mu je lokalni indeks unutar tog warpa).
Zamislite to kao pretvaranje iz kordinata u kartezijskom MPI komunikatoru u linearni rank (0..broj_procesa_u_commu), s jednom razlikom:
[color=red]pretvorba [b]nije[/b] C-ovska (row-major), već column-major (kao u Fortranu)[/color].
Točnu formulu imate u CUDA_C_Programming_Guide.pdf, sekcija 2.2 Thread Hierarchy.
Kako je to [i]vrlo važno[/i] za pisanje korektnog i brzog koda, molim da svakako pogledate.
Barem 2 razloga: priča o pravilnom pristupu memoriji podrazumijeva linearne indekse threadova.
Također, bilo kakav algoritam na warp razini krucijalno ovisi o tome koji threadovi se nalaze skupa u warpu.
Bilo je pitanje čemu služi i je li potreban cudaDeviceSynchronize() na kraju fro.cu primjera.
Odgovor:
Moramo pričekati da se kernel izvrši kako bi pročitali rezultat iz varijable.
Time što je poziv cublas funkcije završio ne mora značiti da je i kernel kojeg ona zove gotov.
U CUBLAS_Library.pdf, sekcija 2.4 Scalar Parameters, stoji da trebamo "proper synchronization" prije čitanja rezultata.
To je objašnjenje dodano u novu verziju fro.cu primjera na Webu.

Također, nisam siguran jesam li vam (korektno) rekao kako se prevodi višedimenzionalni threadIdx u linearni indeks threada unutar bloka.
Iz linearnog indeksa možemo zaključiti kojem warpu thread pripada i koji mu je lokalni indeks unutar tog warpa).
Zamislite to kao pretvaranje iz kordinata u kartezijskom MPI komunikatoru u linearni rank (0..broj_procesa_u_commu), s jednom razlikom:
pretvorba nije C-ovska (row-major), već column-major (kao u Fortranu).
Točnu formulu imate u CUDA_C_Programming_Guide.pdf, sekcija 2.2 Thread Hierarchy.
Kako je to vrlo važno za pisanje korektnog i brzog koda, molim da svakako pogledate.
Barem 2 razloga: priča o pravilnom pristupu memoriji podrazumijeva linearne indekse threadova.
Također, bilo kakav algoritam na warp razini krucijalno ovisi o tome koji threadovi se nalaze skupa u warpu.


[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 3:23 pet, 6. 4. 2012    Naslov: Citirajte i odgovorite

Ako želite detaljnije pogledati koji dijelovi vašeg grafičkog koda jedu koliko resursa, to možete CUDA Profiler-om.
Kako na Fermiju nećete lako pokrenuti GUI aplikaciju, pa tako ni [url=http://developer.nvidia.com/nvidia-visual-profiler]CUDA Visual Profiler[/url] (nvpp), preporučam "nevidljivi" ali vrlo korisni komandnolinijski profiler.
Više o njemu [url=http://developer.download.nvidia.com/compute/DevZone/docs/html/C/doc/Compute_Command_Line_Profiler_User_Guide.pdf]ovdje[/url]. Ukratko: postavite jedan fajl i ponešto environment varijabli.

Podsjetnik: varijable postavljate npr. ovako
[tt]export COMPUTE_PROFILE=1[/tt]

Preporučam uključiti CSV output.
Rezultate onda možete analizirati Open (ili Libre) Office Calc-om, Excel-om, ...

Jedina je nevolja ako imate zbilja velik output (više od 1Mi redaka), jer to spreadsheet aplikacije ne vole.
No, to se neće dogoditi za jednostavne primjene.

:OT:

Ako netko zna spreadsheet aplikaciju koja je free, guta CSV i pokoje milionče redaka joj ne predstavlja problem, bit ću vrlo zahvalan (kava...).
Ne tražim "rješenja" tipa [i]promijeni ove konstante u source kodu ogromatičnog office paketa i rekompajliraj ga[/i] jer za to zbilja nemam vremena.
Ako želite detaljnije pogledati koji dijelovi vašeg grafičkog koda jedu koliko resursa, to možete CUDA Profiler-om.
Kako na Fermiju nećete lako pokrenuti GUI aplikaciju, pa tako ni CUDA Visual Profiler (nvpp), preporučam "nevidljivi" ali vrlo korisni komandnolinijski profiler.
Više o njemu ovdje. Ukratko: postavite jedan fajl i ponešto environment varijabli.

Podsjetnik: varijable postavljate npr. ovako
export COMPUTE_PROFILE=1

Preporučam uključiti CSV output.
Rezultate onda možete analizirati Open (ili Libre) Office Calc-om, Excel-om, ...

Jedina je nevolja ako imate zbilja velik output (više od 1Mi redaka), jer to spreadsheet aplikacije ne vole.
No, to se neće dogoditi za jednostavne primjene.

Off-topic

Ako netko zna spreadsheet aplikaciju koja je free, guta CSV i pokoje milionče redaka joj ne predstavlja problem, bit ću vrlo zahvalan (kava...).
Ne tražim "rješenja" tipa promijeni ove konstante u source kodu ogromatičnog office paketa i rekompajliraj ga jer za to zbilja nemam vremena.


[Vrh]
Korisnički profil Pošaljite privatnu poruku
venovako
Forumaš(ica)
Forumaš(ica)


Pridružen/a: 07. 11. 2002. (22:46:38)
Postovi: (2F9)16
Sarma = la pohva - posuda
56 = 65 - 9

PostPostano: 1:46 čet, 7. 3. 2013    Naslov: Citirajte i odgovorite

Podsjetnik za [i]home-made[/i] materijale (za razliku od onih drugih):
http://titan.fsb.hr/~venovako/nastava/PMF-MO/ParAlg12/2/

Direktorij CUDA sadrži slajdove i primjere, a CUDA/scratch programčiće nastale on-line kucanjem na vježbama (i adekvatne "kvalitete").
Podsjetnik za home-made materijale (za razliku od onih drugih):
http://titan.fsb.hr/~venovako/nastava/PMF-MO/ParAlg12/2/

Direktorij CUDA sadrži slajdove i primjere, a CUDA/scratch programčiće nastale on-line kucanjem na vježbama (i adekvatne "kvalitete").


[Vrh]
Korisnički profil Pošaljite privatnu poruku
Prethodni postovi:   
Započnite novu temu   Odgovorite na temu   printer-friendly view    Forum@DeGiorgi: Početna -> Kolegiji diplomskih i starih studija -> Paralelni algoritmi 1 i 2 Vremenska zona: GMT + 01:00.
Stranica 1 / 1.

 
Forum(o)Bir:  
Možete otvarati nove teme.
Možete odgovarati na postove.
Ne možete uređivati Vaše postove.
Ne možete izbrisati Vaše postove.
Ne možete glasovati u anketama.
You cannot attach files in this forum
You can download files in this forum


Powered by phpBB © 2001, 2002 phpBB Group
Theme created by Vjacheslav Trushkin
HR (Cro) by Ančica Sečan