Arquitectura de Computadores Entrega 1 En el siguiente informe detallamos el proyecto que realizaremos como grupo durante el siguiente semestre. Consi
Story Transcript
HYPERTHREADING TECHNOLOGY IN THE NETBURST MICROARCHITECTURE
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
ÍNDICE 1. Introducción
2. Descripción de necesidades para la implementación de la tecnología: 2.1- Cómo trabaja la tecnología 2.2- Estructuras adicionales 2.3- Área de dado 3. Cambios fundamentales 4. Elección de la política de ‘intercambio’ o ‘compartición’. 4.2.1- Recursos ‘Particionados’, ‘Repartidos’ (Partitioned resources) 4.2.2- ‘Reparto’ umbral (threshold sharing) 4.2.3- ‘Reparto’ completo (full sharing) 5. Mejoras en el rendimiento. Ejemplos. [Lo que se muestra es referente a la primera familia de procesadores Xeon y Pentium 4]
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
1 Introducción a la tecnología del hyperthreading
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Introducción a la arquitectura
Concepto de Tecnología de Hyperthreading: Multithreading simultáneos en la arquitectura de Intel
Procesador
Procesador
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Procesador
Introducción a la arquitectura
¿Qué ventajas tiene el Hyperthreading?
Utilizando más eficientemente los recursos de procesadores ya existentes, la tecnología de Hyperthreading mejora el rendimiento con un bajo coste e incrementando el tamaño del chip en menos de un 5%
Nueva dirección en el desarrollo de la microarquitectura
Importantes cambios en cuanto a la relación coste-beneficios
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
2 Descripción de necesidades para la implementación de la tecnología: 2.1- Cómo trabaja la tecnología 2.2- Estructuras adicionales 2.3- Área de dado
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
Cómo trabaja la tecnología
El diseño del procesador se centra en 4 objetivos: 1. Aumento de la frecuencia de reloj 2. Paralelismo a nivel de instrucción 3. Jerarquía (niveles) de Cache 4. Paralelismo a nivel de ‘hilo’ (thread)
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
1.Aumento de la frecuencia de reloj PIPELINE
t
Aumento t
SUPERPIPELINE Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
2. Paralelismo a nivel de instrucción
EXE
Ejecución
E
de r o n
Fu era
U.E Multi-Paralela
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
de
n
ord e
n
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
3. Niveles de Cache Procesador Cache nivel1
Cache nivel2
Cache nivel3
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Fin: Minimizar los ciclos de espera de datos
Cache nivel4
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
4. Paralelismo a nivel de hilo - Chip multiprocessing (CMP)
- Time-slice multithreading. A
A
B
B
C
C
…
D
…
D
t
Q
- Switch-on-event
- Simultaneus multithreading
A
A
B
B
C
… t
D
t
Q Switch Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
C D
…
t
Descripción de necesidades para la implementación de la tecnología. Estructuras adicionales
Estructuras adicionales SW o Arquitectura Architectural state
SO y Programas Lanzamiento Instrucciones
Execution resources
Ejecución
μ-Arquitectura Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Execution resources
Descripción de necesidades para la implementación de la tecnología. Área de dado
Área de dado
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
3 Cambios fundamentales
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Cambios fundamentales
Teconología Hyperthreadinsg frente a diseño singlethreaded fuera de orden 1º-
3º-
Necesitaban nuevos algoritmos para que ambos procesadores lógicos pudieran compartir la lógica y revisar otros para que establezcan la prioridad de las μ-operaciones para cada procesador lógico.
Derivado del 2º, tenemos un amplísimo espacio de verificación.
2ºGran aumento de la compleji dad.
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
4 Elección de la política de ‘intercambio’ o ‘compartición’ - Recursos ‘Particionados’, ‘Repartidos’ (Partitioned resources) - ‘Reparto’ umbral (threshold sharing) - ‘Reparto’ completo (full sharing)
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Elección de la política de ‘intercambio’ o ‘compartición’.
DEFINICIONES - Particiones. Los mismos recursos a cada uno de ellos.(Partition) - Umbral. Recursos flexibles hasta una cota máxima. (Threshold) - Completamente compartido. Recursos flexibles sin cota máxima de uso. (full sharing)
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Elección de la política de ‘intercambio’ o ‘compartición’.
1. Particiones Completamente Compartida
1 1 0 1 0
Ciclo 0
2 1
2
2 2 1 0 2 1 0
1 2 1 0
2 2 1 0
3 2 1 0
0
1
1 0
2 1 0
3
1 0
1 0
2 1 0
4 3
1 0
1 2 1 0
3 2 1 0
2 1
3 2 1 0
3 2 1 0
1
Ciclo 0
1 2 1 0
1 0
Particiones 10 1 0
0 1 0
3
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
BLOQUEADA! Ciclo 4
2
3 4 1 0
No bloqueada, puede seguir su curso normal Ciclo 4
Elección de la política de ‘intercambio’ o ‘compartición’. Threshold
Una ‘instantánea’ durante un proceso de intercambio de carga
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Elección de la política de ‘intercambio’ o ‘compartición’. Full Shared
Programas de prueba sobre full shared, normalizados a ‘parciones’
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Elección de la política de ‘intercambio’ o ‘compartición’.
Una ejecución del pipeline de la μ-Arquitectura Netburst
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
5 Mejoras
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Mejoras en el rendimiento. Ejemplo.
¿Por qué Hyperthreading mejora el rendimiento total? 1ª- Acelera las aplicaciones que ya ‘poseían’ multithreading.
2ª- Acelera el ‘trabajo’ de las ‘multiaplicaciones’ que viene dadas por multi-tareas
Ejemplo
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez