1 / 18

ARQUITECTURAS SIMD

ARQUITECTURAS SIMD. TIPOS Los procesadores array que utilizan memoria de acceso aleatorio Los procesadores asociativos que usan memorias direccionables por contenido (o memorias asociativas). Organización de las computadoras SIMD.

Télécharger la présentation

ARQUITECTURAS SIMD

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ARQUITECTURAS SIMD • TIPOS • Los procesadores array que utilizan memoria de acceso aleatorio • Los procesadores asociativos que usan memorias direccionables por contenido • (o memorias asociativas).

  2. Organización de las computadoras SIMD • ILLIAC IV posee 256 PEs distribuidosen cuatro cuadrantes de 8 x 8 PEs • Los PEs de un cuadrante son controlados por una unidad de control común,como • resultado de esto los PEs de dicho cuadrante pueden ejecutar lamismaoperación • simultáneamente. • Cada PE es esencialmente una unidad aritmético y lógica (ALU) con registrosde • trabajo que le pertenecen y una memoria local (PEM) para el almacenamiento de • losdatos distribuidos.

  3. CadaPE se comunica con su vecino, la mayor distancia entre dos PEs no vecinos es 8. • La CU cuenta también con una memoria propia para el almacenamiento deprogramas. • En ella se cargan los programas del usuario desde el almacenamiento principal. • La función de la CU es decodificar todas las instrucciones y determinar dónde • deben ejecutarse las instrucciones decodificadas.

  4. Las memorias locales pertenecientes a cada PE son módulos paralelos de memoria • compartidos por todos los PEs mediante una red(alignement network). • La red de permutación de PEs se reemplaza por una red inter-PE dememoria, • controlado por la CU. • La red (alignement) es una red de caminos conmutables entre los PEs y las • memorias paralelas. • Este tipo de configuración existen n PEs y p módulos de memoria. Ambosnúmeros • no son necesariamente iguales.

  5. Estructura interna de un PE Di indica la dirección asignada al elemento de procesamiento. Si indica si este procesadorestá o no activo pararealizar un cierto cálculo. Ii es un registro índice. Ri es el registro que apuntaa otros procesadores Formalmente un procesadorSIMD se caracteriza por el siguienteconjunto de parámetros :C = { N, F, I, M } Donde, N = el número deprocesadores. F = el conjunto de funcionesde ruteo de datos previstospor la red de interconexión. I = el conjunto de instruccionespara las operacionesescalares vectoriales, de ruteo de datos y manejo de la red. M = conjunto de máscaras que habilitan o deshabilitan a los procesadores.

  6. Ejemplo de funcionamiento de un procesador array

  7. Procesadores Array de estructura Bit-Plane • En las arquitecturas bit-plane los procesadores arrayse colocan en una grilla (mesh) • simétrica (por ej. de 64 * 64) y se asocian con múltiplesplanos de bits en memoria • que se corresponden a las dimensiones de la grilla deprocesadores • El procesador n (Pn) situado en la grilla en la posición (x,y) opera sobre los bits • de memoria ubicados en la posición (x,y) en todos los planos de memoriaasociados. • El Procesador Masivo Paralelo de Loral y el Procesador Array Distribuido deICL • ejemplifican esta clase de arquitecturas utilizadas muy frecuentemente para • aplicaciones de procesamiento de imágenes mapeando pixels desde la estructura • planar de la memoria.

  8. ARQUITECTURA DE PROCESADORES ARRAY DE MEMORIA ASOCIATIVA • Constituyen un tipomuy distintivo de máquinas SIMD, usan una lógica de comparación • para accederen paralelo, de acuerdo al contenido, a los datos almacenados. • La mayoría de los procesadores de memoria asociativa usan unaorganización serial • de bits, la cual implica operaciones concurrentes sobre un solo bitslicepara todas las • palabras en la memoria asociativa.

  9. Una operación OR lógico realizada entre unacolumna de bits y el vector de bits • en el registro A, almacena el resultado en el registro B. • Un cero en el registro de máscara indica que la palabra asociada no debe incluirse • en esta operación.

  10. SYSTOLIC ARRAYS ( SISTÓLICOS) Este tipo de arquitecturas es laapropiada para resolver problemas de alta repetición y muy específicos, o sea se desarrollanpara casos especiales y no se busca la resolución de problemas para procesos conmucho tiempo de cálculo y donde variasoperaciones se realizan en forma repetidasobre un mismo dato. • APLICACIONES • Procesamiento de señales/imágenes y reconocimiento de patrones • Aritmética de matrices • Aplicaciones No-numéricas

  11. Ejemplo 1) Se desea evaluar los polinomios : Yj = S i Wi * Xi+j-1 ; para j de 1 a ¥ o sea : Y1 = W1 * X1 + W2 * X2 + W3 * X3 Y2 = W1 * X2 + W2 * X3 + W3 * X4 Y3 = W1 * X3 + W2 * X4 + W3 * X5 ..... etc ..... 0 + W1*X1 0 + W2*X1 0 + W3*X1 (1) 0 + W1*X2W1*X1+ W2*X2 W2*X1 + W3*X2 (2) 0 + W1*X3W1*X2 + W2*X3 W1*X1 + W2*X2 +W3*X3 (3) 0 + W1*X4W1*X3 + W2*X4 W1*X2 + W2*X3 + W3*X4 (4) 0 + W1*X5W1*X4 + W2*X5 W1*X3 + W2*X4 + W3*X5 (5) -(1) Se obtiene W3*X1, se descarta. -(2) Se obtiene W2*X1 + W3*X2, se descarta. -(3) Se obtiene W1*X1 + W2*X2 + W3*X3, primer resultado válido. -(4) Se obtiene W1*X2 + W2*X3 + W3*X4, segundo resultado válido y así sucesivamente....

  12. Ejemplo 2) Multiplicación de matrices A = a11 a12 B = b11 b12 A * B = C = c11 c12 a21 a22 b21 b22 c21 c22 • Cantidad de celdas procesadoras :3(n2 - n) + 1 • Donde n es el grado de la matriz • La cantidad de períodos o ciclos en los que se obtiene el resultado final responden • a la fórmula :(3n - 1) i) Instante t1

More Related