======================= Matrix-Produkt mit Cuda ======================= Folgende Vorlage kann zum Testen der Matrix Implementierung benutzt werden: :import: session25/hpc/tests/bench_cugemm.cu Das Vorlesungsprojekt aus Session 24 muss dazu nur um die Implementierung in `hpc/cuda/mm.h` ergänzt werden: :import: session25/hpc/cuda/mm.h Im Verzeichnis `hpc/tests/` kann obiger Test mit ---- CODE ---------------------------------------------------------------------------------- nvcc -I ../../ --gpu-architecture compute_20 -code sm_20 --ptxas-options=-v bench_cugemm.cu -------------------------------------------------------------------------------------------- übersetzt werden.