Preporucam pogledati [url=http://www.osl.iu.edu/~brbarret/doc/hpca2005-lam-cr.pdf]ovo[/url] u vezi checkpoint/restart funkcionalnosti MPI aplikacija.
Prica s vjezbi je istinita, ali ne bas siroko upotrebljiva.
Naime, implicitne pretpostavke su da svi cvorovi vrte isti algoritam; preciznije, da se uvijek jamci kako ce lokalni nizovi procesnih blokova svakog MPI procesa u MPI aplikaciji biti jednako dugacki, i da ce posljednji blokovi tih nizova uvijek izmedju sebe odraditi komunikaciju.
Npr. aktivni procesni blok jednog procesa nece izvrsiti blokirajucu komunikacijsku operaciju koja moze biti zadovoljena tek u nekom procesnom bloku nekog drugog procesa koji slijedi iza trenutno aktivnog bloka tog drugog procesa.
No, za vrlo "simetricna" izvrsavanja, kao npr. metodu konjugiranih gradijenata, pristup bi trebao davati rezultate.
Sto se tice sveg ostalog (reprezentacija lokalnog izvrsavanja i stanja), to moze proci.
Preporucam pogledati ovo u vezi checkpoint/restart funkcionalnosti MPI aplikacija.
Prica s vjezbi je istinita, ali ne bas siroko upotrebljiva.
Naime, implicitne pretpostavke su da svi cvorovi vrte isti algoritam; preciznije, da se uvijek jamci kako ce lokalni nizovi procesnih blokova svakog MPI procesa u MPI aplikaciji biti jednako dugacki, i da ce posljednji blokovi tih nizova uvijek izmedju sebe odraditi komunikaciju.
Npr. aktivni procesni blok jednog procesa nece izvrsiti blokirajucu komunikacijsku operaciju koja moze biti zadovoljena tek u nekom procesnom bloku nekog drugog procesa koji slijedi iza trenutno aktivnog bloka tog drugog procesa.
No, za vrlo "simetricna" izvrsavanja, kao npr. metodu konjugiranih gradijenata, pristup bi trebao davati rezultate.
Sto se tice sveg ostalog (reprezentacija lokalnog izvrsavanja i stanja), to moze proci.
|