Das oben vorgestellte Programm zur Simulation von Quantentransport-Phänomenen mittels Pfadintegralen wurde mir freundlicherweise von Catrin Schulz-Mirbach zu Performance-Messungen überlassen. Inzwischen wurde allerdings die SPP1000/16 zu einer SPP1600/16 hochgerüstet, so daß ich ihre Ergebnisse nicht mehr verifizieren konnte.
Die zum Zweck der Portierung auf die hydra erstellte MPI-Version lief problemlos auch auf dem Parsytec-Rechner GC64. Wie erwartet zeigte sich, daß der Algorithmus hervorragend mit der Prozessorzahl skaliert und die Zeit für Nachrichten-Übermittlung völlig vernachlässigbar ist. Die folgenden Zahlen stammen daher von Programmläufen auf jeweils einer CPU. Die Zeiten auf der hydra sind mit /bin/time gemessene real-Werte auf einem leeren Subcomplex. Auf dem GC wurde vor und nach Programmlauf mit date die Uhrzeit genommen. Die so gewonnene real-Zeit wurde um 19s reduziert, der Zeit für das Laden und Ausführen eines beliebigen kurzen Programms. Für verschiedene Werte des Parameters t4, der die Anzahl der auszuwertenden Integrale festlegt, ergaben sich folgende Ergebnisse (jeweils in Sekunden):
t4 | t(SPP1600) | t(GC64) | t(GC64)/t(SPP1600) |
100 | 18 | 35 | 1.9 |
1000 | 127 | 231 | 1.8 |
5000 | 603 | 1117 | 1.9 |
Der Vergleich der Peak-Werte beider Prozessoren :
PowerPC/80 MHz | 80 MFLOPS |
PA-RISC 7200/120 MHz | 240 MFLOPS |
zeigt, daß die hohe Peakrate des PA-RISC, die durch zwei arithmetische Operationen pro Takt zustande kommt, hier nicht völlig ausgenutzt wird. Da die erzielte Beschleunigung jedoch deutlich über dem Verhältnis der Taktraten liegt, wurde seine Architektur relativ gut genutzt - jedenfalls verglichen mit der Programmversion für den PowerPC.
Peter Junglas, Tel.: 3193