|
Avec un multiprocesseur MIMD machine avec plusieurs centaines de processeurs, il est important que l'accès mémoire est rapide et disponible. Chacun de la centaine de transformateurs auront accès emplacement mémoire différent pour les données et instructions. Tout accès ou l'autre sera lent à empiéter sur les performances de la machine dans son ensemble. Une mémoire partagée unique avec un seul bus n'effectuera pas que le bus mémoire sera devenue un goulet d'étranglement. Ils sont souvent appelés Mémoire machines accès uniforme (UMAS). Par conséquent, chaque processeur devra accéder à la mémoire de ses propres. Une possibilité est de donner à chaque élément de transformation (PE) de la mémoire locale de ses propres qui peuvent être partagés entre tous les processeurs. Cela est souvent connu sous le nom de la mémoire partagée distribuée MIMD et plus populairement comme des machines à mémoire à accès non uniforme (NUMA). Il est également possible d'utiliser le cache local sur un PE pour la mémoire locale au lieu de mémoire externe: on les appelle Cache-Only Memory Access architectures (COMA). Accès à la mémoire de tous les autres processeurs de la mémoire locale est tellement lent pour le traitement des grains fins qui veulent avoir accès à d'autres données et beaucoup de performances de synchronisation est mauvaise. De performance pour le processus de grain grossier est cependant bien et ce serait une architecture appropriée. Pour tout traitement à grain fin un examen attentif du réseau pour connecter plusieurs processeurs doivent être pris en considération. N'importe quelle distance d'un élément de traitement de contacter un autre élément de traitement doit être aussi courte que possible afin de permettre une communication rapide. Il existe plusieurs interconnexions peut être possible. L'un est un système de maillage simple où chaque élément de transformation (PE) est relié à quatre PE `s autour d'eux et ainsi de suite. Cela permet une communication rapide par rapport aux pires cas d'un transformateur obligatoire de passer par la racine carrée du nombre de PE `s. Hypercube est également populaire, lorsque la distance entre tout PE 2 `s est 'N' où le nombre de processeurs égal à 2n. Une autre façon d'atténuer le problème de processeurs à grains fins sur un grand système MIMD est d'utiliser Cache Coherent NUMA `s. Chaque PE `s cache est une fenêtre sur l'espace de mémoire partagée qui est maintenu cohérent par diverses méthodes telles que snooping accès à la mémoire qu'il mai ont mis en cache. Cela permet un accès rapide aux processeurs actuels tout en permettant un accès rapide aux données partagées. Cela peut devenir un problème si le type de traitement cache l'origine de nombreux accidents. L'interconnexion d'un système MIMD avec plusieurs centaines de processeurs est difficile d'arrêter sans avoir connaissance du type de traitement requis. En raison du nombre de transformateurs en cause la simple mémoire partagée architectures utilisées pour les architectures MIMD plus petits n'est pas extensible. Une nouvelle forme d'interconnexion est nécessaire, qui puisse répondre aux exigences du nombre élevé de processeurs. |



















