Technologischer Nutzen von 64-bit- Architekturen Rudolf Nordhues Unisys Deutschland GmbH.
-
Upload
adalstan-giefer -
Category
Documents
-
view
110 -
download
4
Transcript of Technologischer Nutzen von 64-bit- Architekturen Rudolf Nordhues Unisys Deutschland GmbH.
Technologischer Nutzen von 64-bit-Architekturen
Rudolf Nordhues
Unisys Deutschland GmbH
Unisys Portrait
Weltweit
Unisys Corporation mit Hauptsitz in Blue Bell/Philadelphia, USA
50.000 Kunden in über 100 Ländern, vertreten in allen Regionen der Erde
Ca. 36.500 Mitarbeiter
$5,9 Milliarden Umsatz im Jahr 2003
Gelistet bei NYSE
Ein Fortune 300 Unternehmen
Services76%
Technology 24%
56% Umsatz außerhalb der USA
Server TechnologieImagine it.
Leistungsstarke Enterprise-Server mit Großrechner-Qualitäten und offenem Betriebssystem für die Konsolidierung und für große geschäftskritische Anwendungen.
Done.Die Unisys ES7000-Familie mit Windows Datacenter Edition Betriebssystem: 1000-fach bewährt.
Speichermodell 32-Bit TechnologieStandard Windows 2000 virtueller Adressraum
4 Gigabyte RAM Tuning
Physische Adresserweiterung Intel x86 (PAE)
Address Windowing Extension (AWE)
Large Memory Enabled (LME)
Windows Produkt Optionen
Datenbanken SQL Server / Oracle
Exchange Server 2000
Terminal Services
232 = 4.294.967.296 Bytes= 4 GBytes
32-Bit virtueller Adressraum
this is a footer
.exe CodeGlobale Variablen
Stacks von Threads .dll code
00000000
7FFFFFFF
Kernel und Ausführungsschicht
HAL, Starttreiber
Filesystem CachePaged pool
Nonpaged poolFFFFFFFF
80000000
Prozessseitentabellen,Hyperspace
C0000000
Eindeutig pro Prozess,
Benutzermodus
Systemweit,nur im Kernelmodus
pro Prozess, nur im Kernelmodus
Standard Windows virtueller AdressraumJeder Prozess kann über einen 4GB großen virtuellen Adressraum verfügen
• 2 GB Benutzerbereich
• 2 GB Systembereich
2GB
2GB
Task Manager
Physischer Arbeitsspeicher
Freie Seiten, Null-und Standby-Listen
Systemseiten(z.B. Cache)
Virtueller Speicher ohne Erweiterung der Auslagerungsdatei
Zugesicherter virtueller Speicher
Auslagerungspool
Residenter Pool
Summe Paged + Nonpaged
.exe codeGlobale Variablen
Per-Thread Benutzermodus
Stacks.dll code
Prozess Heaps
Exec, Kernel, HAL,Treiber, etc.
00000000
BFFFFFFF
FFFFFFFF
C0000000 Prozess Seitentabellen,Hyperspace
4Gigabyte RAM Tuning Adressraumauch bekannt als
• Application Memory Tuning oder
• /3GB Tuning
möglich auf x86 mit W2K AS, W2K3 EE und W2K DCE, W2K3 DCE
maximal bis zu 16 GB RAM
3GB
1GB
Eindeutig pro Prozess,
Benutzermodus
pro Prozess, nur im Kernelmodus
Systemweit,nur im Kernelmodus
4 GB RAM Tuningnutzbar durch
1. Aktivierung durch Angabe von /3GB in boot.ini
2. Anwendung benötigt LargeAddressAware
- Linker-Option /LARGEADDRESSAWARE:Yes
- überprüfbar mittels
[boot loader] timeout=30 default=multi(0)disk(0)rdisk(0)partition(1)\WINNT [operating systems] multi(0)disk(0)rdisk(0)partition(1)\WINNT= "W2K DCE 3GB" /3GB
Imagecfg oracle.exe
232 = 4.294.967.296 Bytes= 4 GBytes
Physische Adresserweiterung für x86 (PAE)
232+4 = 68.719.476.736 Bytes
= 64 GBytes
Physische Adresserweiterung für x86 (PAE)
notwendig um mehr als 4 GB RAM zu adressieren
spezieller Kernel
in Kombination mit/3GB max. 16 GB RAM
Aktivierung durch boot.ini
[boot loader] timeout=30 default=multi(0)disk(0)rdisk(0)partition(1)\WINNT [operating systems] multi(0)disk(0)rdisk(0)partition(1)\WINNT= "W2K DCE PAE" /PAE
0 GB
4 GB
32 GB
/PAE Angabe in boot.ini erforderlich
Systemnutzen von PAESystemadressraum bis 32 GB RAM
Benutzertransparent
Reduzierung von Paging
Unterstützung durch LME Hardware
Kernel Speicher
Mapping to Kernel
Mapping to Kernel
2(or 3)GB Prozess
2(or 3)GB Prozess
Mapping to Kernel
2(or 3)GB Prozess
Übersetzung virtueller Adressen ohne PAE
KPROCESS
PFN
PFN Gesuchtes Byte
CR3Register
Byteindex12 Bits
Seitentabellenindex10 Bits
Physischer Adressraum
gesuchte Seite
Seitentabellen(bis zu 512 pro Prozess+ bis zu 512 systemweit,1024 Einträge pro Tabelle
Seitenverzeichnis(1 pro Prozess,1024 Einträge)
Index Index
32 Bit Adresse Seitenverzeichnisindex10 Bits
Physische Adresse
PFN Page Frame NumberPDE Page Directory EntryPTE Page Table Entry
PDE
PTE
32 Bit breit
32 Bit breit
Übersetzung virtueller Adressen mit PAE
KPROCESS
PFN
PFN Gesuchtes Byte
CR3Register
Byteindex12 Bits
Seitentabellenindex9 Bits
Physischer Adressraum
gesuchte Seite
Seitentabellen(512 Einträge pro Tabelle)
Seitenverzeichnis(bis zu 4 pro Prozess,
512 Einträge)
Index Index32 Bit Adresse
Seitenverzeichnisindex9 Bits
Physische Adresse
PDE
PTE
64 Bit breit
64 Bit breit
PFN
Seitenverzeichnis-zeigerindex 2 Bits
PDESeitenverzeichniszeiger
(1 pro Prozess, 4 Einträge)
Index
Address Windowing ExtensionErmöglicht den Zugriff auf mehr als 2 GB bzw. 3GB durch einen Prozess mittels AWE API’s
AWE API Aufrufe
• Reservieren des physischen Speichers; AllocateUserPhysicalPages()
• Erstellen eines Adressierungsfensters auf den physischen Speicher; VirtualAlloc() with the MEM_PHYSICAL FLAG
• Abbildung von physischem Speicher im Adressierungsfenster; MapUserPhysicalPages()
• FreeUserPhysicalPages()
AWE Arbeitsweise 1. Schritt
2 GB bzw. 3 GBBenutzeradressraum
AllocateUserPhysicalPages()
Physischer Speicher
Systemadressraum2GB bzw. 1GB
Virtueller Adressraum des Prozesses
Anwendung
AWE Arbeitsweise 2. Schritt
2 GB bzw. 3 GBBenutzeradressraum
AllocateUserPhysicalPages()
Physischer Speicher
Systemadressraum2GB bzw. 1GB
Virtueller Adressraum des Prozesses
AWE- Fenster VirtualAlloc()
Anwendung
AWE Arbeitsweise 3. Schritt
2 GB bzw. 3 GBBenutzeradressraum
Physischer Speicher
Systemadressraum2GB bzw. 1GB
Virtueller Adressraum des Prozesses
AWE- Fenster VirtualAlloc()
MapUserPhysicalPages()
AWE- Fenster VirtualAlloc()
Anwendung
AWE Arbeitsweise 3. Schritt
2 GB bzw. 3 GBBenutzeradressraum
Physischer Speicher
Systemadressraum2GB bzw. 1GB
Virtueller Adressraum des Prozesses
AWE- Fenster VirtualAlloc()
MapUserPhysicalPages()
AWE- Fenster VirtualAlloc()
Anwendung
AWE EinschränkungenProzesse können keine Seiten gemeinsam nutzen
dieselbe physische Seite kann nicht mehreren virtuellen Adressen im selben Prozess zugeordnet werden
der AWE Bereich kann keinen ausführbaren Programmcode enthalten
der AWE Bereich ist nicht nutzbar als Datenpuffer für Grafik- oder Videoaufrufe
jeder AWE Bereich ist als eine Einheit wieder freizugeben
AWE E/A mit Large Memory Enabled
2 GB bzw. 3 GBBenutzeradressraum
Physischer Speicher
Systemadressraum2GB bzw. 1GB
Virtueller Adressraum des Prozesses
AWE- Fenster VirtualAlloc()
MapUserPhysicalPages()
AWE- Fenster VirtualAlloc()
Network
Network
Disk
direkte E/A
Anwendung
Windows Produkt Optionen
OptionProdukt
/3GB /PAE BS-Limit
Windows 2000 Advanced Server
Yes/NoYes/No
NoYes
4 GB8 GB
Windows 2000 Datacenter Edition
Yes/NoYesNo
NoYesYes
4 GB16 GB32 GB
Windows 2003 Enterprise Edition
Yes/NoYesNo
NoYesYes
4 GB16 GB32 GB
Windows 2003 Datacenter Edition
Yes/NoYesNo
NoYesYes
4 GB16 GB64 GB
232 = 4.294.967.296 Bytes= 4 GBytes
264 = 18.446.744.073.709.551.616 Bytes
= 17.179.869.184 GBytes= 16 ExaBytes
64-Bit virtueller Adressraum
this is a footer
64-Bit / 32-Bit Vergleich AdressraumKenndaten
Adressraum 64-Bit 32-Bit
Virtueller Adressraum 16 TB 4GB
Paging File 512 TB 16 TB
Hyperspace 8 GB 4 MB
Paged Pool 128 GB 470 MB
Non-Paged Pool 128 GB 256 MB
Systemcache 1 TB ~1 GB
System PTE‘s 128 GB 660 MB
this is a footer
Datenbanken mit großen Cachebedarf > 2.7 GB, wie bei DHW Systemen üblich
Oracle Datenbanken mit großen Bedarf an PGAs für interne Sorts
Oracle Datenbanken mit mehr als 2000 Concurrent Datenbankverbindungen
große zentrale SAP Systeme
SAP APO Systeme mit Livecache
Serverkonsolidierung
Systemnutzen von 64-Bit
Datenbank Migration leichter geht’s nicht!
rx2600
virtualized storage system
SAN infrastructure
rp2470IA32 Itanium2
1. Datenbankkopie erstellen
2. Kopie dem Itanium2 System bekanntgeben
3. Starten der Databank auf dem Itanium2 System
4. erledigt in Minuten!
Architekturwechsel ohne Risiko
Performancegewinn
Zukunftssichere Plattform
AgendaUnternehmensdarstellung
32-bit oder 64-bit Technologie, Limits und Benefits
64-bit Hardware Architektur-Ansätze
Implementierungsbeispiel im Zusammenspiel von SAP und Microsoft SQL 2000
Praxisdemo mit Remote-Zugriff auf einen 64-bit Enterprise Server im Unisys SAP Competence Center Walldorf
Summary
Intel Itanium™ 2 Architectural Features
6.4 GB/s6.4 GB/s
1024 TB1024 TB
88
1.5 GHz1.5 GHz
Memory AddressingMemory Addressing
1 2 3 4 5 6 7 8 9 1011
System Bus BandwidthSystem Bus Bandwidth
On-die L3 CacheOn-die L3 Cache
On-die RegistersOn-die Registers
Execution UnitsExecution Units
Core FrequencyCore Frequency
Issue PortsIssue Ports
328 Registers328 Registers
6 Instructions / Cycle6 Instructions / Cycle
3/6/9 MB3/6/9 MB
Instructions / ClkInstructions / Clk
6 Integer, 6 Integer, 3 Branch3 Branch
2 FP, 2 FP, 1 SIMD1 SIMD
2 Load, 2 Load, 2 Store2 Store
Performance via Performance via ParallelismParallelism
Aries Orion Aries Orion
510 520 530 540
64-bit – Itanium 232-bit – Xeon MP
430550 560
Unisys ES7000 Server Familie
410 420
9 Modelle
Heute Heute verfügbar!verfügbar!
Unisys 64-bit ES7000 Architektur
ICH
LA
N
US
B
US
B
US
B
US
B
PC
I
IDE
IDE
PC
I
FLASH
SNCMemory
IA64 CPU
IA64 CPU
IA64 CPU
IA64 CPU
SNCMemory
IA64 CPU
IA64 CPU
IA64 CPU
IA64 CPU
SNC Memory
IA64 CPU
IA64 CPU
IA64 CPU
IA64 CPU
SNC Memory
IA64 CPU
IA64 CPU
IA64 CPU
IA64 CPU
SIOH (IOHM)SIOH (IOHM)P
64
H2
P6
4H
2
P6
4H
2
P6
4H
2
ICH
LA
N
US
B
US
B
US
B
US
B
PC
I
IDE
IDE
PC
I
FLASH
P6
4H
2
P6
4H
2
P6
4H
2
P6
4H
2
SIOH (IOHM)SIOH (IOHM)
SPS (ISPM) SPS (ISPM)
SPS (ISPM)SPS (ISPM)
SIOH-I
Unisys 64-bit ES7000 Architektur
verteilte Shared-Memory Architektur
• Bis zu 4 Prozessor/Memory Knoten
• Jeder Knoten enthält bis zu 4 Prozessoren und 32GB RAM
• Knotenkontroller ermöglichen den Zugriff auf andere Knoten und E/A Hubs
bis zu 16 Itanium2 Prozessoren
• 1.3GHz mit 3MB on-die Cache
• 1.5GHz mit 6MB on-die Cache
bis zu 2 Crossbars
• Interconnect Prozessor/Memory Knoten und E/A Hubs
• Datendurchsatz pro Verbindung bis zu 6.4 GB/sec, non-blocking, Full-Duplex
• Datendurchsatz bis zu 38.4 GB/s pro Crossbar
Unisys 64-bit ES7000 Architektur - MemoryHochleistungsspeicherarchitektur bis zu 128GB RAM
großer, flacher virtueller Adressraum bis zu 16 Terabytes
• 8 TB for Windows kernel
• 8 TB for user processes
• Performance Boost für Windows Kernel und Anwendung
• kein 32-Bit PAE/AWE Mapping/Un-Mapping Aufwand
1. Zuordnung physische Seiten
2. Zuordnung eines virtuellen Adressfensters
3. Mappen der physischen Seiten auf das VA Fenster
• Effektivere Adressumsetzung von virtuell auf physisch, weniger (TLB) Fehlzugriffe
Bis zu 4 Wege Memory Interleave
• erlaubt parallelen Speicherzugriff
AgendaUnternehmensdarstellung
32-Bit oder 64-Bit Technologie, Limits und Benefits
64-Bit Hardware Architektur-Ansätze
Implementierungsbeispiel im Zusammenspiel von SAP und Microsoft SQL 2000
Praxisdemo mit Remote-Zugriff auf einen 64-Bit Enterprise Server im Unisys SAP Competence Center Walldorf
Summary
this is a footer
keine Adressierungslimits mit 64-Bit Technologie (PAE, 3GB, AWE entfällt)
Ideale Plattform für große OLTP Datenbanken und Data Warehouse Datenbanken
Ideale Plattform zur Anwendungskonsolidierung
SAP & Siebel Benchmarks beweisen eine Skalierung über auch für Anwendungen über 8 CPU‘en hinaus
Summary
Precision Thinking.
Vielen Dank
Relentless Execution.