High Performance Computing
Einfache Beispiele in C zu Vektoren |
|
Einfache Beispiele in C zu Matrizen |
|
Benchmarks und GNUPlot |
|
Einfache Cache-Optimierungen |
|
Cache-Optimierungen durch fused vector operations. |
|
Einfache Cache-Optimierung des Matrix-Matrix Produktes. |
|
Erste Schritte mit C++ |
|
|
|
|
|
Lösungsvorschlag von Session 8 verallgemeinern:
|
|
|
|
Einbinden optimierter Micro-Kernel |
|
Erste Schritte mit Threads in C++ |
|
Design von Matrix-Klassen |
|
Mutex- und Bedingungsvariablen |
|
Thread-Pools (1. Teil) |
|
LU-Zerlegung:
|
|
Thread-Pools (2. Teil) und OpenMP |
|
Vektor-Views und eine High-Level Implementierung der LU-Zerlegung |
|
Erste Schritte mit MPI |
|
Übertragung von Vektoren und Matrizen mit MPI |
|
Verteilen und Zusammenführen von Matrizen |
|
Verteilte Matrizen |
|
Erste Schritte mit CUDA |
|
Matrix-Produkt mit Cuda |