Performance-Faktoren

Auf diesen Seiten dreht sich alles um die einzelnen Faktoren, die für die Systemleistung von Bedeutung sind.

Dear english speaking visitor. We've had no time to translate all the text, so please have a look at our fact boxes and the tables below comparing different systems. We guess there are enough infos to get the picture.

Prozessor-Speed System-Bus Speed/MHz Cache OnBoard Cache Inline Cache Backside
Sämtliche Vergleiche basieren auf Macbench 4.0-Ergebnissen. All comparisons are based on Macbench 4.0 scores.

 

Cache

Ein Cache ist ein Zwischenspeicher, der Daten vorübergehend aufnimmt. Überall dort, wo unterschiedlich schnelle Systemkomponenten zusammenarbeiten, bringt ein Cache erhebliche Geschwindigkeitsvorteile, dies reicht von Zwischenspeichern für die Beschleunigung von Festplattenzugriffen (Disk-Cache) bis zu im Prozessor integriertem Cache (Level 1-Cache, "L1"). Bevor auf langsame Systemteile zugegriffen wird, lohnt sich ein Blick ins Cache, denn sollten sich die benötigten Daten schon da befinden, dann kann der Zugriff auf langsamere Komponenten ausgelassen werden. Je grösser das Cache ist, umso mehr Daten können in ihm zwischengespeichert werden, und umso seltener muss auf langsamere Systemteile wie den Arbeitsspeicher gewartet werden.


Level 1-Cache

Heutige Macintosh-Rechner unterstützen bis zu drei Arten von Cache-Systemen: Level 1-, L2- und L3-Cache. Die dritte Cache-Stufe findet sich allerdings nur in Rechnern, die mit einer G3-Prozessorkarte aufgerüstet worden sind, und deren ursprüngliches L2-Cache auf der Hauptplatine wegen des schnellen Backside-Caches zum L3 degradiert wird. Die PowerMacintosh G3-Reihe besitzt wie die "originalen" PowerMacs nur zwei Cachestufen.

Das L1-Cache befindet ist direkt im Prozessor integriert und arbeitet mit derselben hohen Geschwindigkeit wie der Prozessor, ist deshalb aber auch sehr teuer. Aufgrund seines hohen Preises ist dieses Cache allerdings nicht sehr gross. Das L1 Cache kann nicht ausgetauscht oder erweitert werden.

  Prozessor L1 Cache
PowerPC 601 32k
PowerPC 603 16k
PowerPC 603e 32k
PowerPC 604 32k
PowerPC 604e 64k
PowerPC 740 64k
PowerPC 750 64k

Pentium 16k
Pentium Pro 16k
Pentium MMX 32k
Pentium II 32k
Pentium II Celeron 32k
Pentium II Xeon 32k

 

Level 2-Cache

Das Level 2-Cache befindet sich zwischen Prozessor und Arbeitsspeicher und ist mit Zugriffszeiten von unter 10ns (Nanosekunden) deutlich schneller als der Arbeitsspeicher, welcher mit zur Zeit 60-80ns arbeitet. Je nach Prozessortyp kann dieses Cache unterschiedlich gross sein. Ein PowerPC 604(e) verwaltet beispielsweise bis zu 4MB L2, bisher gibt es aber erst 1MB grosse Module. Die meisten Macs und Clones erlauben den Austausch des bereits vorhandenen Caches, bei einigen Modellen ist es aber fix aufgelötet. So haben z.B. die PowerMacs 9500/9600 und alle Clones, welche dasselbe "Tsunami" Motherboard besitzen (Umax Pulsar, Gravis TT, ...), ein fix aufgelötetes 512k grosses L2-Cache (kein Austausch möglich). Bei den PowerMacs sind L2-Cachegrössen von 256k, 512k oder 1MB üblich. Intels Prozessoren kommen mit Cachegrössen von bisher maximal 512k daher, ausgenommen davon ist der letzte Pentium Pro mit 1MB L2-Cache und der Pentium II Xeon, der 512k oder 1MB 400 MHz schnelles Cache besitzt.
  Prozessor L2 Cache
PowerPC 601 OnBoard
PowerPC 603 OnBoard
PowerPC 603e OnBoard/Inline
PowerPC 604 OnBoard
PowerPC 604e OnBoard/Inline
PowerPC 740 ---
PowerPC 750 Backside

Pentium OnBoard
Pentium Pro Backside
Pentium MMX OnBoard
Pentium II Backside
Pentium II Celeron --- / Backside
Pentium II Xeon Backside

Je schneller der Prozessor arbeitet, umso mehr Stufen werden im Cachesystem eingesetzt, da es aus Kostengründen immer unmöglicher wird, auch alle anderen Systemkomponenten so hoch zu takten. Jede weitere Stufe ist im allgemeinen langsamer und grösser als die vorhergehende. Apples G3-PowerMacs besitzen 64k L1- und 512k oder 1MB L2-Cache. Ältere PowerMacs, die den Austausch der Prozessorkarte erlauben, können ebenfalls mit einem PowerPC 750 (G3) ausgerüstet werden. Lässt man hier das bisherige L2-Cache auf der Hauptplatine installiert, so wird dieses zum L3 degradiert, da der G3-Prozessor sein eigenes, Backside-Cache genanntes L2 besitzt. Das herkömmliche Cache rutscht in der Numerierung einfach eine Stufe tiefer.

Je nach Lage des L2-Caches zu Prozessor und Systembus bezeichnet man es als konventionelles, Inline- oder Backside-Cache:


Konventionelles L2-Cache

Illustration ©1997 Macworld

Aus Kostengründen haben Apples Ingenieure das L2-Cache bei den ersten beiden Generationen der PowerMacs (also vor der G3-Serie) auf der Hauptplatine untergebracht, dirket neben dem RAM (siehe obere Grafik). Das bedeutet, dass die Daten aus dem Cache über den langsamen Datenbus geschickt werden. Bei den meisten dieser Macs und Clones wird der Systembus mit maximal 50 MHz getaktet, die Daten aus dem Cache kriechen daher ebenfalls mit maximal 50 MHz zum Prozessor. Dieser selbst läuft aber meist mit einem Vielfachen der Busgeschwindigkeit, beim PowerMac 6100/30 beispielsweise mit der doppelten (30 MHz Bus), beim PowerTower Pro 250 mit der fünffachen Geschwindigkeit.
Die folgende Tabelle zeigt anhand von Macbench 4.0, welchen Geschwindigkeitsvorteil 1MB konventionelles L2-Cache gegenüber den originalen 256k des PowerMac 8500 bringt. Der 604e/180 erreicht annähernd die Leistung eines 604e/200 (PowerMac 9500/200), welcher zwar nur über 512k L2 verfügt, dafür aber auch über einen 11% schnelleren Bus.
Macbenchs FPU-Test arbeitet mit kleinen Datenmengen, für die bereits 256k ausreichen. Ein grösseres Cache bringt hier keinen Geschwindigkeitsgewinn mehr (wohl aber in anderen Anwendungen).
The following table shows the performance gain a 1MB L2 cache will give over a PowerMac 8500 standard 256k L2. The tested 604e/180 scores almost equal to a 604e/200 (PowerMac 9500/200), which is equipped with only 512k L2 but runs on a 11% faster system bus.
The Macbench FPU test runs with a small amount of data. 256k cache are more than enough, thus a larger L2 will not improve performance here.

Macbench 4.0 Vergleich Längere Balken sind besser Longer bars are better
TYP MHz Bus Multi L2 CPU FPU
PowerMac 8500/180 604e 180 45.0 4.0 256k 333 363
PowerMac 8500/180/1MB 604e 180 45.0 4.0 1024k 406 364
PowerMac 9600/200 604e 200 50.0 4.0 512k 409 403
System: MacOS 7.5.5

Real World Tests Zeit in Sekunden Time in seconds
Cinema 4D POVray NeuroNet PageSpinner StuffIt
8500/180/256k 98sec 627sec 592sec 169sec 343sec
8500/180/1MB 91sec 532sec 577sec 144sec 336sec
Steigerung # Gain -7.7% -17.9% -2.4% -17.4% -2.1%
System: MacOS 8.1
Fakt Nr. 4: Real World Anwendungen profitieren unterschiedlich stark von einem grösseren Cache, je nach Aufgabenbereich und Datenmenge. Bei Aufgaben mit wenigen Daten - wie Macbenchs FPU-Test - bringt ein grösseres Cache keinen Leistungsgewinn. Fact No. 4: Real world applications may benefit more or less from a larger cache, this depends strongly on the task and the amount of data. When dealing with a small amount of data - like Macbenchs FPU test does - a larger cache won't speed up your machine.

Konventionelles L2-Cache bewirkt zwar eine Steigerung der Rechenleistung, ist aber noch lange nicht der beste Weg dafür. Die bessere Lösung ist, das Cache direkt auf der Prozessorkarte anzubringen, weil dann der langsame Systembus umgangen werden kann. Es gibt bereits mehrere Ansätze, die diesen Mangel umgehen: Inline-Cache und Backside-Cache. Die optimalste Lösung wäre allerdings, den gesamten Arbeitsspeicher in Form des L1-Caches direkt im Prozessor zu integrieren - eine Lösung, die aus Hitze-, Platz- und besonders aus Kostengründen unmöglich ist und aufgrund der immer grösser werdenen Arbeitsspeicher wohl nie realisiert werden wird.