Complexity analysis and performance evaluation of matrix product on multicore architectures

Abstract : The multicore revolution is underway, bringing new chips introducing more complex memory architectures. Classical algorithms must be revisited in order to take the hierarchical memory layout into account. In this paper, we aim at minimizing the number of cache misses paid during the execution of the matrix product kernel on a multicore processor, and we show how to achieve the best possible tradeoff between shared and distributed caches. Comprehensive simulation results confirm the analytical performance predictions and fully establish the practical significance of our new algorithms.
Type de document :
Pré-publication, Document de travail
RRLIP2009-09. nombre de pages: 25. 2009
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://hal-ens-lyon.archives-ouvertes.fr/ensl-00381458
Contributeur : Mathias Jacquelin <>
Soumis le : mardi 5 mai 2009 - 15:48:26
Dernière modification le : jeudi 8 février 2018 - 11:09:26
Document(s) archivé(s) le : lundi 15 octobre 2012 - 09:56:31

Fichier

rr_lip.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : ensl-00381458, version 1

Collections

Citation

Mathias Jacquelin, Loris Marchal, Yves Robert. Complexity analysis and performance evaluation of matrix product on multicore architectures. RRLIP2009-09. nombre de pages: 25. 2009. 〈ensl-00381458〉

Partager

Métriques

Consultations de la notice

281

Téléchargements de fichiers

106