La Arquitectura von Neumann (Pt. 2)cs.uns.edu.ar/~ags/OC/downloads/Handouts/Módulo 08 - La...El...

45
Organización de Computadoras Organización de Computadoras Depto. Cs. e Ing. de la Comp. Depto. Cs. e Ing. de la Comp. Universidad Nacional del Sur Universidad Nacional del Sur Módulo 08 Módulo 08 La Arquitectura La Arquitectura von Neumann (Pt. 2) von Neumann (Pt. 2)

Transcript of La Arquitectura von Neumann (Pt. 2)cs.uns.edu.ar/~ags/OC/downloads/Handouts/Módulo 08 - La...El...

  • Organización de ComputadorasOrganización de ComputadorasDepto. Cs. e Ing. de la Comp.Depto. Cs. e Ing. de la Comp.Universidad Nacional del SurUniversidad Nacional del Sur

    Módulo 08Módulo 08La ArquitecturaLa Arquitectura

    von Neumann (Pt. 2)von Neumann (Pt. 2)

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 22

    CopyrightCopyrightCopyright © 2011-2020 A. G. StankeviciusSe asegura la libertad para copiar, distribuir y modificar este documento de acuerdo a los términos de la GNU Free Documentation License, Versión 1.2 o cualquiera posterior publicada por la Free Software Foundation, sin secciones invariantes ni textos de cubierta delantera o traseraUna copia de esta licencia está siempre disponible en la página http://www.gnu.org/copyleft/fdl.htmlLa versión transparente de este documento puede ser obtenida de la siguiente dirección:

    http://cs.uns.edu.ar/~ags/teaching

    http://www.gnu.org/copyleft/fdl.htmlhttp://cs.uns.edu.ar/~ags/teaching

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 33

    ContenidosContenidosOrganización multinivelConcepto de máquina virtualNiveles en una máquina contemporáneaEvolución histórica de los nivelesTecnologías de memoria principalOrganización del procesadorArquitecturas de n-direccionesSubsistema de Entrada/Salida

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 44

    Organización de la memoriaOrganización de la memoriaLa memoria se organiza como un arreglode n celdas, cada una de k bits

    Cada celda o locación cuenta conun identificador de log2(n) bits quela caracteriza denominado direcciónDe igual forma, cada locación o celdaalmacena un contenido de k bitsNótese que la menor unidad direccionablees la celda, si bien la unidad básica es el bitEl tamaño en bits de la celda es independientede la cantidad de bits de las direcciones

    011100100000:0001:0010:0011:0100:

    1110:1111:

    11100101000110010111001000100101

    0011100110010110

    … …

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 55

    Organización de la memoriaOrganización de la memoriaLa norma dicta que 8 bits componen un bytey que los bytes se agrupan en palabras

    Una palabra suele tener 8, 16, 32 o 64 bitsLa cantidad de bits por palabra está relacionada con el tamaño en bits de los registros del procesadorLas instrucciones en general operan sobre palabras

    Las operaciones básicas con la memoria son:Leer una palabra de la memoriaEscribir una palabra a la memoria

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 66

    Ordenamiento de los bytesOrdenamiento de los bytesEn caso de que una palabra esté compuesta por múltiples bytes, ¿cómo se deben ordenar?

    El esquema big-endian postula que se debe numerar los bytes de izquierda a derechaEn contraste, el esquema little-endian postula quese deben numerar los bytes derecha a izquierda

    La decisión respecto a qué esquema utilizar poco afecta el desempeño del procesador

    Puede que resulte conflictivo transmitir palabrasentre computadoras que no usen el mismo esquema

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 77

    Ordenamiento de los bytesOrdenamiento de los bytestamaño de palabra: 32 bits

    mensaje original: Hola Mundo! 01/10/2020

    'H' 'o' 'l' 'a'' ' 'M' 'u' 'n''d' 'o' '!' 01 '/' 10 '/'228 7big-endian little-endian

    00 01 10 11 00 01 10 11

    100 011 010 001 000

    100 011

    010 00

    1 000 'H''o''l''a'

    ' ''M''u''n''d''o''!'01'/'10'/'2287

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 88

    Interfaz con la memoriaInterfaz con la memoriaLa unidad controladora de la memoria cuenta esencialmente con dos registros:

    El registro MAR el cual almacena la direcciónde una locación de memoriaEl registro MDR el cual almacena el contenidode una locación de memoria

    unidad controladorade la memoria

    MAR MDR

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 99

    Interfaz con la memoriaInterfaz con la memoriaOperación de lectura (load):

    El procesador escribe la locación que se desea acceder en el registro MAR, luego activa la señalde lectura y finalmente accede a la palabra en cuestión la cual estará disponible en el registro MDR

    Operación de escritura (store):El procesador escribe la locación que se desea acceder en el registro MAR y el contenido quese desea almacenar en el registro MDR y porúltimo activa la señal de escritura

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1010

    Organización físicaOrganización físicacolumnas

    filas

    celdas

    0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 111111 10 01 00

    dirección(110110)

    tamaño: (cant. filas) x (cant. cols) x (bits x celda)tamaño: (cant. filas) x (cant. cols) x (bits x celda)

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1111

    Diagrama lógico de detalleDiagrama lógico de detalle

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1212

    Organización del procesadorOrganización del procesadorEl procesador incluye otros dos componentes básicos de la arquitectura von Neumann:

    La unidad aritmético lógica (ALU)La unidad de control

    El procesador tiene como principal tarea orquestar el adecuado funcionamientode la computadora

    A través de la ALU lleva adelante el procesamientode los datos de la manera en que el programaen ejecución le va indicando

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1313

    Organización del procesadorOrganización del procesadorInternamente el procesador se puede descomponer en cuatro partes:

    La unidad de controlLa unidad aritmético lógicaLos registros del procesadorLas interconexiones entre estoscomponentes

    Nótese la similitud entre laorganización del procesadory de la computadora

    computadora

    bus delsistema

    memoria entradasalida

    procesador

    procesador

    interconexióninterna delprocesador

    unidadd decontrol ALU

    registros

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1414

    Data path vs. control pathData path vs. control path

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1515

    Funciones del procesadorFunciones del procesadorFunciones desempeñadas por el procesador:

    Traer de memoria principal la próxima instruccióndel programa en ejecuciónDeterminar de qué instrucción se trata (decodificar)Obtener todos operandos referidos enla instrucción en cursoLlevar adelante el procesamiento de datossancionado por esa instrucciónAlmacenar dónde corresponda los resultados

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1616

    Ciclo básico del CPUCiclo básico del CPUPara cumplir con las tareas asignadas el procesador repite infinitas veces el siguiente ciclo básico de operación:

    Etapa Fetch: se almacena en el registro IRla instrucción apuntada por el registro PCEtapa Decode: durante esta etapa se determinade qué instrucción se trataEtapa Effective Address: se calcula la dirección efectiva referida por la instrucción (si es que alguna) y/o se recuperan todos los operandos necesariospara comenzar a ejecutar la instrucción en curso

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1717

    Ciclo básico del CPUCiclo básico del CPUContinúa:

    Etapa Execute: conociendo de qué instrucción se trata y contando con los operandos que sean necesarios, durante esta etapa se programa a la ALU para que lleve adelante el procesamiento correspondienteEtapa Memory: las arquitecturas RISC cuentan con una etapa específica donde se accede a memoria para leer o escribir una determinada locaciónEtapa Write-Back: usualmente el resultado obtenido se almacena en alguno de los registros del procesador durante esta etapa

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1818

    Ciclo básico del CPUCiclo básico del CPU

    WRITEBACK

    WRITEBACK

    FETCHFETCH

    MEMORYMEMORY

    DECODEDECODE

    EXECUTEEXECUTE

    EFFECTIVEADDRESS

    EFFECTIVEADDRESS

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 1919

    EjemploEjemplo

    add R1, R2, R3load R3, [R5]bnz fin, R3

    analicemos la evolución dela computadora al ejecutareste fragmento de código

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2020

    EjemploEjemplo

    add R1, R2, R3load R3, [R5]bnz fin, R3

    13

    4

    R2R3

    R12

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2121

    EjemploEjemplo

    add R1, R2, R3load R3, [R5]bnz fin, R3

    13

    2

    4

    R5

    5

    R3

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2222

    EjemploEjemplo

    add R1, R2, R3load R3, [R5]bnz fin, R3

    13

    24

    R3

    fin

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2323

    Direccionamiento simbólicoDireccionamiento simbólicoEn un lenguaje de alto nivel es frecuente ver expresiones simbólicas tales como x = y + zAl bajar de nivel, estas referencias simbólicas deben ser reemplazadas por la dirección en memoria donde se almacenen esas variables

    Debemos tener en cuenta que la dirección deuna locación de memoria es a su vez un número

    x = y + z → 123 = 15 + 83Para diferenciar una dirección de su contenido haremos uso de pares de paréntesis

    (123) = (15) + (83)

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2424

    Registros del procesadorRegistros del procesadorLos registros son un almacenamiento temporario de muy alta velocidad

    Se organizan en un banco de registros, el cual suele contar con múltiples puertos de lectura y/o escritura

    La cantidad de bits de los registros coincidecon el tamaño de palabra del procesador

    El tamaño de palabra nos da una idea aproximadade la capacidad de procesamiento del hardware(en particular, de la ALU)

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2525

    Registros del procesadorRegistros del procesadorLos registros del procesador se clasificanen dos categorías:

    Registros accesibles por el usuario: estos registros puede ser accedidos por el usuario a travésde las distintas instruccionesRegistros internos del procesador: estos registrosson utilizados exclusivamente por la unidad de control durante el desarrollo del ciclo básico del procesador

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2626

    Registros del procesadorRegistros del procesadorLos registros accesibles al usuario se clasifican a su vez en otras dos categorías:

    Registros de propósito general: estos registros están disponibles para que el programador haga un uso discrecional de los mismos (por caso, el registro acumulador EAX o el registro índice ECX)Registros de propósito específico: estos registros usualmente tienen asignado un rol por defecto(por caso, el registro ESP que siempre apuntaal tope de la pila del programa)

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2727

    Registros del procesadorRegistros del procesadorUno de los registros internos del procesador es el PSW (processor status word), el cual codifica el estado actual del procesadorLos registros internos del procesador sólo pueden ser alterados de manera indirecta

    Por caso, el devenir de la ejecución de un programava alterando los registros internos PC e IRDe manera análoga, el resultado de la última operación realizada afectará al registro interno PSW

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2828

    Acceso a los operandosAcceso a los operandosUna de las etapas del ciclo básicodel procesador requiere ganar accesoa los operandos de la instrucción en cursoA lo largo de la evolución de la computación se ensayaron muy diversas formas de especificar la ubicación de estos argumentosEstas marcadas diferencias permiten clasificara las distintas arquitecturas en función cuántas referencias a memoria tienen las instrucciones

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 2929

    Arquitectura 0-addressArquitectura 0-addressLa arquitectura 0-address sólo cuenta con instrucciones que refieren a sus operandosde manera implícita

    También se la conoce como arquitectura pilaLa pila del sistema es origen y destino implícitode todas las operaciones aritmético-lógicasNaturalmente, las instrucciones de acceso a memoria son una excepción, ya que sí explicitan la locación que se está accediendo

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3030

    EjemploEjemploFragmento de código en una arquitectura0-address que evalúa la siguiente expresión:

    A = B + C x D – C / E

    push (B)push (C)push (D)mpypush (C)push (E)divsubaddpop (A)

    se debe acordar el orden de apiladoen las operaciones no conmutativas

    A, B, C, D y E son locaciones de memorialas cuales contienen los valores sobre

    los cuales se desean operar

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3131

    Arquitectura 1-addressArquitectura 1-addressLa arquitectura 1-address cuenta con instrucciones en las que se especificasólo uno de los argumentos

    También se la conoce como arquitecturade acumulador únicoExiste un registro especial llamado acumulador el cual es origen y destino implícito de todas las operaciones aritmético-lógicasPuede contar con registros auxiliares los quese emplean para implementar modosde direccionamiento más complejos

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3232

    EjemploEjemploFragmento de código en una arquitectura1-address que evalúa la siguiente expresión:

    A = B + C x D – C / E

    load Cmpy (D)store tmpload Cdiv (E)store Aload Badd (tmp)sub (A)store A

    tmp es una locación arbitrariade memoria usada para almacenar

    temporalmente un resultado intermedio

    A también puede ser usado comoalmacenamiento intermedio puesto que

    su contenido es destruido por la asignación

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3333

    Arquitectura 1-address + regArquitectura 1-address + regLa arquitectura 1-address + registro cuentacon instrucciones en las que está permitido especificar un registro general a la parde una dirección de memoria

    La arquitectura Intel x86 pertenece a esta categoríaEn las operaciones con dos operandos de entradael registro especificado dentro de la instrucciónse convierte en el destino implícito del resultadoEste tipo de arquitectura cuenta con la instrucciónMOV para mover información desde y hacia memoriay también entre los registros

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3434

    EjemploEjemploFragmento de código en una arquitectura1-address + reg para la siguiente expresión:

    A = B + C x D – C / E

    mov R0, [C]mov R1, R0mul R0, [D]div R1, [E]add R0, [B]sub R0, R1mov [A], R0

    en algunas arquitecturas se utilizancorchetes en lugar de los paréntesis

    asumiremos que el destino delas operaciones se indica primero

    (al igual que en la arquitectura x86)

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3535

    Arquitectura 2-addressesArquitectura 2-addressesLa arquitectura 2-addresses cuenta con instrucciones en las que está permitido especificar hasta dos direcciones de memoria

    En las operaciones con dos operandos de entrada,uno de los argumentos especificado dentro dela instrucción se convierte en el destino implícitoEste tipo de arquitectura también cuenta con la instrucción MOV para mover información libremente entre memoria y registros

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3636

    EjemploEjemploFragmento de código en una arquitectura2-addresses para la siguiente expresión:

    A = B + C x D – C / E

    mov [A], [B]mov R0, [C]mov R1, R0mul R0, [D]div R1, [E]add [A], R0sub [A], R1

    en esta arquitectura tambiénasumiremos que el destino de

    las operaciones se indica primero

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3737

    Arquitectura 3-addressesArquitectura 3-addressesLa arquitectura 3-addresses cuenta con instrucciones en las que está permitido especificar hasta tres direcciones de memoria

    Este tipo de arquitectura evidentemente brindala máxima flexibilidad a los programadoresdel sistema que estén a cargo de implementarlos distintos compiladoresNo obstante, el tamaño de las instrucciones hade variar en gran medida en función de la cantidadde direcciones de memoria que se especifiquen

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3838

    EjemploEjemploFragmento de código en una arquitectura3-addresses para la siguiente expresión:

    A = B + C x D – C / E

    mul [A], [C], [D]div R0, [C], [E]add [A], [B], [A]sub [A], [A], R0

    como se puede apreciar, este tipode arquitectura genera código

    muy compacto... ¿pero a qué precio?

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 3939

    Arquitectura reg. a reg.Arquitectura reg. a reg.La arquitectura registro a registro cuenta con instrucciones que sólo operan sobre registros

    Todas las arquitecturas RISC (por caso, la ARM) adoptan esta configuraciónDe manera análoga a la arquitectura pila, se cuenta con instrucciones especificas de acceso a memorialas cuales permiten especificar usualmentea lo sumo una dirección de memoriaLos modos de direccionamiento más avanzadosse logran combinando esa dirección de memoriacon uno o más registros

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 4040

    EjemploEjemploFragmento de código en una arquitecturaregistro a registro para la siguiente expresión:

    A = B + C x D – C / E

    lda R0, Bload R1, (R0)lda R0, Cload R2, (R0)lda R0, Dload R3, (R0)lda R0, Eload R4, (R0)mul R5, R2, R3div R6, R2, R4add R1, R1, R5sub R1, R1, R6lda R0, Astore (R0), R1

    analizar este fragmento de códigoen busca de alguna posible optimización

    extra en el uso de los registros

    asumiremos que la única instrucción quepermite referir una dirección de memoria

    es la instrucción lda (load address)

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 4141

    Entrada / SalidaEntrada / SalidaEl último componente de la arquitecturavon Neumann que nos resta abordar selo conoce como entrada/salidaLas computadoras rápidamente demandaron almacenar más información de la que se podía almacenar en la memoria principalEn consecuencia, a lo largo del tiempose han ensayado distintas tecnologías para implementar esta memoria secundaria

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 4242

    Bus del sistemaBus del sistemaLa arquitectura von Neumann presenta un serio cuello de botella: el canal de comunicación entre el procesador en resto de la computadoraLas primeras computadoras adoptabanun esquema de bus único

    Por ejemplo, el Omnibus de la PDP-8:

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 4343

    Bus del sistemaBus del sistemaLas arquitecturas másrecientes empezaron ahacer uso de múltiplesbuses independientes

    Por caso, una típica PCde escritorio cuenta congran cantidad de busesde propósito específicoHoy en día las funcionesdel northbridge se hanincorporado al procesador

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 4444

    FSB vs. BSBFSB vs. BSBEn lo que al CPU respecta, cuenta básicamente con dos buses:

    El Front Side Bus (FSB) para interconectarel procesador con el resto de la computadoraEl Back Side Bus (BSB) para interconectarlos componentes internos del procesador entre sí

    bus interface(cache L2)

    core(cache L1)

    core(cache L1)

    core(cache L1)

    core(cache L1)

    Front Side Bus

    Back Side Bus

  • Organización de Computadoras - Mg. A. G. StankeviciusOrganización de Computadoras - Mg. A. G. Stankevicius 4545

    ¿¿Preguntas?Preguntas?

    Slide 1Slide 2Slide 3Slide 4Slide 5Slide 6Slide 7Slide 8Slide 9Slide 10Slide 11Slide 12Slide 13Slide 14Slide 15Slide 16Slide 17Slide 18Slide 19Slide 20Slide 21Slide 22Slide 23Slide 24Slide 25Slide 26Slide 27Slide 28Slide 29Slide 30Slide 31Slide 32Slide 33Slide 34Slide 35Slide 36Slide 37Slide 38Slide 39Slide 40Slide 41Slide 42Slide 43Slide 44Slide 45