========================== High Performance Computing ========================== +----------------+---------------------------------------------+ | __Session 1__ | Einfache Beispiele in C zu Vektoren | +----------------+---------------------------------------------+ | __Session 2__ | Einfache Beispiele in C zu Matrizen | +----------------+---------------------------------------------+ | __Session 3__ | Benchmarks und GNUPlot | +----------------+---------------------------------------------+ | __Session 4__ | Einfache Cache-Optimierungen | +----------------+---------------------------------------------+ | __Session 5__ | Cache-Optimierungen durch | | | _fused vector operations_. | +----------------+---------------------------------------------+ | __Session 6__ | Einfache Cache-Optimierung des | | | Matrix-Matrix Produktes. | +----------------+---------------------------------------------+ | __Session 7__ | Erste Schritte mit C++ | +----------------+---------------------------------------------+ | __Session 8__ | - Namensräume | | | - Cache-optimiertes Matrix-Produkt | +----------------+---------------------------------------------+ | __Session 9__ | - Generische Klassen | | | - Template-Funktionen | | | - Statischer Polymorphismus | | | - Verschiedene Ausprägungen einer | | | polymorphen Funktion | +----------------+---------------------------------------------+ | __Session 10__ | Lösungsvorschlag von Session 8 | | | verallgemeinern: | | | - Beliebige Typen für Matrixelemente | | | - Verwendung von Matrix-Klassen | | | - Verwendung von optimierten | | | Micro-Kernel | +----------------+---------------------------------------------+ | __Session 11__ | - Funktionsobjekte | | | - Lambda-Ausdrücke | +----------------+---------------------------------------------+ | __Session 12__ | Einbinden optimierter Micro-Kernel | +----------------+---------------------------------------------+ | __Session 13__ | Erste Schritte mit Threads in C++ | +----------------+---------------------------------------------+ | __Session 14__ | Design von Matrix-Klassen | +----------------+---------------------------------------------+ | __Session 15__ | Mutex- und Bedingungsvariablen | +----------------+---------------------------------------------+ | __Session 16__ | Thread-Pools (1. Teil) | +----------------+---------------------------------------------+ | __Session 17__ | LU-Zerlegung: | | | - ungeblockt: `hpc::ulmlapack::getf2` | | | - geblockt: `hpc::ulmlapack::getrf` | +----------------+---------------------------------------------+ | __Session 18__ | Thread-Pools (2. Teil) und OpenMP | +----------------+---------------------------------------------+ | __Session 19__ | Vektor-Views und eine High-Level | | | Implementierung der LU-Zerlegung | +----------------+---------------------------------------------+ | __Session 20__ | Erste Schritte mit MPI | +----------------+---------------------------------------------+ | __Session 21__ | Übertragung von Vektoren und Matrizen mit | | | MPI | +----------------+---------------------------------------------+ | __Session 22__ | Verteilen und Zusammenführen von Matrizen | +----------------+---------------------------------------------+ | __Session 23__ | Verteilte Matrizen | +----------------+---------------------------------------------+ | __Session 24__ | Erste Schritte mit CUDA | +----------------+---------------------------------------------+ | __Session 25__ | Matrix-Produkt mit Cuda | +----------------+---------------------------------------------+ :links: Session (\d) -> doc:session$1/page01 Session (\d\d) -> doc:session$1/page01