5. Übung Praxis
Moderator: Graphische Datenverarbeitung 1
5. Übung Praxis
Hallo, wir wollten uns grade zu dem GRIS Poolrechner verbinden. SSH konnte den Host aber nicht finden.
-
- Windoof-User
- Beiträge: 39
- Registriert: 1. Okt 2008 09:28
Re: 5. Übung Praxis
Hallo,
welchen Rechner hast du probiert? Derzeit sollten pcgris-l00{3,4,5}.gris.informatik.tu-darmstadt.de funktionieren, d.h. Login per
ssh team??@pcgris-l00{3,4,5}.gris.informatik.tu-darmstadt.de
sollte funktionieren.
Was mit den anderen beiden Rechnern los ist, versuchen wir gerade herauszufinden.
Viele Gruesse,
Ronny Klowsky
welchen Rechner hast du probiert? Derzeit sollten pcgris-l00{3,4,5}.gris.informatik.tu-darmstadt.de funktionieren, d.h. Login per
ssh team??@pcgris-l00{3,4,5}.gris.informatik.tu-darmstadt.de
sollte funktionieren.
Was mit den anderen beiden Rechnern los ist, versuchen wir gerade herauszufinden.
Viele Gruesse,
Ronny Klowsky
Re: 5. Übung Praxis
Hat sich erledigt. Das kleine L sah nur aus wie eine 1 

- Maradatscha
- Computerversteher
- Beiträge: 353
- Registriert: 2. Okt 2006 18:53
Re: 5. Übung Praxis
Ich probiere gerade ein paar performance Messungen aus.
Macht es überhaupt sinn sich den timer anzusehen?
Ich habe den Aufruf schon mal so geändert, weil ich in einem Beispiel gefunden habe, dass zunächst ein "warm up" durchgeführt werden sollte
edit: habe das ein bisschen angepasst, lasse jetzt 10000 mal den kernel laufen, da merkt man dann schon einen grossen Unterschied!
edit: damit komme ich jetzt unbeschleunigt auf ca 11 s, beschleunigt auf 1.6 s, das sieht doch schon besser aus
Macht es überhaupt sinn sich den timer anzusehen?
Ich habe den Aufruf schon mal so geändert, weil ich in einem Beispiel gefunden habe, dass zunächst ein "warm up" durchgeführt werden sollte
edit: habe das ein bisschen angepasst, lasse jetzt 10000 mal den kernel laufen, da merkt man dann schon einen grossen Unterschied!
Code: Alles auswählen
testKernel<<< grid, threads>>>( device_picData, device_resultPicData);
CUDA_SAFE_CALL(cudaThreadSynchronize() );
timer = 0;
CUT_SAFE_CALL( cutCreateTimer( &timer));
CUT_SAFE_CALL( cutStartTimer( timer));
testKernel<<< grid, threads>>>( device_picData, device_resultPicData);
// check if kernel execution generated and error
CUT_CHECK_ERROR("Kernel execution failed");
CUT_SAFE_CALL( cutStopTimer( timer));
Re: 5. Übung Praxis
Hänge grade ein bisschen an der Praxis 1c).
Benutze ich die Threads dazu, um vom global in den shared-Speicher zu schreiben, oder lade ich am Anfang einen (bzw 3) komplette Blocks in das shared-memory und rechne dann mit den Threads darauf ?
Und wie kann ich sicherstellen, dass gültige Werte im shared-Memory stehen, wenn doch alle Threads parallel laufen.
Bin verwirrt. Hat jemand nen Tipp ?
Benutze ich die Threads dazu, um vom global in den shared-Speicher zu schreiben, oder lade ich am Anfang einen (bzw 3) komplette Blocks in das shared-memory und rechne dann mit den Threads darauf ?
Und wie kann ich sicherstellen, dass gültige Werte im shared-Memory stehen, wenn doch alle Threads parallel laufen.
Bin verwirrt. Hat jemand nen Tipp ?
Re: 5. Übung Praxis
Jeder Thread lädt sein Pixel (+ oberen und unteren Nachbarn) in den shared memory. Danach werden die Threads gesynct.
Ein paar zusätzliche Fragen zur Aufgabenstellung:
Gibt es eine Vorgabe, was wir mit den Pixeln an den Rändern machen müssen?
Können wir immer von Bildern in 512x512 ausgehen?
Ein paar zusätzliche Fragen zur Aufgabenstellung:
Gibt es eine Vorgabe, was wir mit den Pixeln an den Rändern machen müssen?
Können wir immer von Bildern in 512x512 ausgehen?
Re: 5. Übung Praxis
Es ist ihnen ueberlassen, wie sie den Rand behandeln. Sie koennen ihn zum Beispiel einfach auf Schwarz setzen.citta hat geschrieben:Gibt es eine Vorgabe, was wir mit den Pixeln an den Rändern machen müssen?
Können wir immer von Bildern in 512x512 ausgehen?
Re: 5. Übung Praxis
Ahh, musste grad nochmal drüber nachdenken, aber nun hab ichs.citta hat geschrieben:Jeder Thread lädt sein Pixel (+ oberen und unteren Nachbarn) in den shared memory. Danach werden die Threads gesynct.
Laden->Sync->Berechnung.
Danke.
Re: 5. Übung Praxis
Ich wollte mal wissen welche Zeit bei euch rauskommt wenn ihr die c implementiert?
Also bei uns gibt es irgendwie noch keinen segnifikaten Unterschied.
Also bei uns gibt es irgendwie noch keinen segnifikaten Unterschied.