Hier könnte Ihre Werbung stehen!

 

Hercules 3D Prophet III / 
ELSA GLADIAC 920 /
GeForce3 - Review (1/46)

" M a c h t   i n   d e r   3 .   G e n e r a t i o n "

Weggefegt

[Von Raphael Auf der Maur, Mai 2000]
57 Millionen Transistoren, 800 Milliarden Operationen pro Sekunde, 3.8 Gigatexel Füllrate  - die Eckdaten des neuen GeForce3 sind überwältigend. 3D Concept verrät nun die kompletten Details zur neuen Chipgeneration. Im Test befanden sich die neuen Pixelraketen von ELSA und Hercules.

NVIDIA blickt auf die erfolgreichsten Phasen der Firmengeschichte zurück. Nach anfänglichen finanziellen Problemen, ausgelöst durch das Desaster mit dem ersten Multimedia-Chip (NV1), folgten die Erfolge Schlag-auf-Schlag. Riva128, Riva128 ZX, TNT, TNT2, GeForce256, GeForce2 GTS und zuletzt GeForce2 ULTRA - so heißen die Erfolgsbringer der Kalifornier, welche in verlässlichem 6-Monats-Zyklus das Licht der Welt erblickten. Speziell mit den neuen GeForce-Beschleunigern fegte NVIDIA den Chipmarkt leer wie kein anderer zuvor. Features en Masse und meist unangefochtene Leistungswerte brachten den Hersteller aber nicht nur finanziellen Erfolg. Diverse Chipschmieden, darunter 3dfx und S3, strichen angesichts des brutal schnellen Entwicklungstempos die Segel. ATI sucht weiterhin nach einer Strategie, wie, wann und ob man denn nun wirklich konsequent gegen NVIDIA antreten soll, und warf dabei die jüngsten High-End Projekte (RADEON MAXX, RADEON SE) wieder über Bord. Matrox seinerseits konzentriert seine Kräfte lieber auf den grösseren und lukrativeren Business-Markt, statt sich mit 20 anderen NVIDIA - Kartenherstellern einen verbitterten Kampf um Retail-Marktanteile zu leisten. 

Dennoch lauert die Konkurrenz, auf der faulen Haut hocken darf selbst der Marktführer nicht. NVIDIA's Image als Performance- und Leistungsträger sowie als einer der Technologieführer am Markt will aber weiterhin verteidigt sein, denn mit dem Erscheinen von ATIs RADEON ist man bezüglich Technologie ins Hintertreffen geraten. Imagination Technologies lauert mit grundsätzlich effizienterer Technologie im Hinterhalt, und die finnischen Bitboys sind mit einem eDRAM-Projekt in einem fortgeschrittenen Stadium. Fortschritt ist somit gefragt, die aktuelle GeForce-Technik lässt sich nicht weiter melken, sie ist mit dem Geforce2 ULTRA bis zum Exzess ausgereizt.

Mit dem neuen GeForce3-Baustein führen die 3D-Spezialisten erstmals seit dem 1999 lancierten GeForce256 eine brandneue Hardware-Architektur ein. Wir trennen für Sie die Spreu vom Technik-Weizen und sagen Ihnen, welchen Hardware-Funktionen des 76 GFLOPS-Chips Sie wirklich Beachtung schenken sollten.

Basisarchitektur

Der GeForce3 integriert 4 parallele Rendering-Pipelines, d.h. pro Taktzyklus kann der Chip 4 Pixel gleichzeitig schattieren und texturieren. Jede Pipeline verfügt über 2 Textureinheiten, pro Taktzyklus und Pipeline werden somit 2 Texturen aufgetragen. Heutige Spiele nutzen mit der Ausnahme von Serious Sam kaum mehr als 2 Texturen pro Dreieck, so dass der GeForce3 in der aktuellen Software-Welt nicht durch zusätzliche Textureinheiten profitieren würde. Bei künftigen Games auf DirectX 8 - Basis kann er jedoch seinen "Rücksprung"-Joker ausspielen. Wird das "Loop-Back"-Feature vom Spiel genutzt, so können bis zu 4 Texturen pro Pixel in einem Renderingdurchgang beklebt werden, womit leistungsminderndes Multipass-Rendering vermieden werden kann. 
Der soeben berechnete Pixelwert wird dabei zurück an den Anfang der Pipeline gefügt und durchläuft sämtliche Rendering-Schritte ein zweites mal, diesmal mit zwei anderen Texturen und Parametern. Erst nach zweimaligem Durchqueren wird das Ergebnis in den Grafikkartenspeicher geschrieben. So verliert der GeForce3 zwar einen Taktzyklus durch das Auftragen der zwei zusätzlichen Texturen, spart sich jedoch mehrere Speicherzugriffe gegenüber den GeForce2-Grafikchips, die generell nur 2 Texturen auftragen können, bevor der Pixel in den Grafikkartenspeicher geschrieben wird.

Bei einer Taktfrequenz von 200 MHz entwickelt der GeForce3 eine Pixelfüllrate von 800 Millionen Pixeln pro Sekunde (4 * 200), oder gemäss alternativer Definition 1'600 GTex/s (4 * 200 * 2). 

Der spezifizierte Speichertakt beträgt 230 MHz. Da der GeForce3 wie seine Vorgänger Double Data Rate-Speicher anspricht, werden pro Takt zwei Datenpakete übertragen. Maximal stehen dem Chip daher 7,3 Gigabyte Speicherbandbreite pro Sekunde zur Seite, ein weiterhin beachtlicher Wert. 

Logik konzentriert

Mit seinen 57 Millionen Transistoren setzt der GeForce3 einsamen Rekord bezüglich der Komplexität von Prozessoren im Consumer-Markt. Der nächst-"einfachere" Grafikprozessor stammt von ATi (RADEON) und ist mit 31 Millionen Transistoren fast halb so komplex. Sogar Intel's Flaggschiff, der Pentium4, ist mit "lediglich" 42 Millionen Transistoren ebenfalls eine Nummer tiefer angesiedelt. Außerdem besteht ein Grossteil der Transistoren im Pentium-Chip aus SRAM, d.h. einfachem Cache-Speicher. Beim GeForce3 dagegen wird mehr als 90% der 12x12mm grossen Fläche für Logik verwendet, eine imposante Zahl, wenn man bedenkt, dass ein einzelner Ingenieur gerade mal 1 Million Transistoren überblicken und entwickeln kann. 

Die hohe Integrationsdichte hat natürlich seine Nachteile. Die Hardwareimplementation eines derart komplexen Chips gestaltet sich äusserst schwierig. NVIDIA geriet angesichts der enorm aufwendigen Entwicklungsarbeit sowie den erstmals mit derartigen Transistormassen eingesetzten Entwicklungstools ins Schleudern, der Chip konnte nicht im anvisierten Zeitfenster fertiggestellt werden.  Probleme bei der Hardware-Implementierung sorgten für eine Verspätung um 8 Monate, welche dank im Vorfeld als Notfallplan initiierten "NV15BR" (ULTRA) jedoch gut überbrückt werden konnten. Zwar konnte man den eigenen Zielsetzungen - alle 6 Monate einen neuen Chip, alle 12 Monate eine neue Architektur - nicht Rechnung tragen, doch ist zumindest der Produkte-Anspruch erfüllt, was OEMs und Kartenhersteller besänftigt. Den NV15BR frühzeitig als Überbrückungslösung einzuplanen, spricht eindeutig für die Weitsichtigkeit und Cleverness von NVIDIA, sich den guten Ruf als termintreuen Partner nicht zu verspielen.

Um einen derart komplexen Baustein überhaupt betreiben zu können, ist NVIDIA auf modernste Fertigungstechnologie angewiesen. Die 0.18µm-Prozesse sind gänzlich ungeeignet, da Stromverbrauch und Hitzeentwicklung bei den geplanten 200-300 MHz ein unlösbares Problem darstellen. Stattdessen setzten die Kalifornier auf den modernsten derzeit verfügbaren Fertigungsprozess. 0.15µm beträgt die Strukturbreite der GeForce3-Transistoren, gefertigt werden die 144 mm2 grossen Dies in den Labors des taiwanesischen Halbleiterherstellers TSMC. Mit modernsten Entwicklungstools sowie top-aktuellem Fertigungsprozess gelang es NVIDIA schließlich, den ersten Prototypen (A0) bereits nach 8 Stunden zum Betrieb zu bewegen, wenn auch noch diverse Überarbeitungen erfordert waren. Die erste stabile Version gelang Ende Dezember und fand gleich den Weg in die ersten Xbox-Entwicklerkits. Eine erste grössere Serie, die unter anderem als Testmuster an die Kartenhersteller ausgeliefert wurde, trug die Bezeichnung A3. Die nun finale Version befindet sich in voller Produktion und trägt die TSMC-Versionsnummer A5. Da üblicherweise das erste Silizium nach dem Tape-Out die Bezeichnung A0 trägt, bedeutete dies, dass NVidia im 6. Anlauf die marktreife Version des neuen Superchips gelang. Eine reife Leistung für einen derart komplexen Chip, wenn man bedenkt, dass die 3dfx-Ingenieure einst 7 Anläufe dazu benötigten, einen vergleichsweise einfachen Banshee mit funktionsfähigem 2D-Teil in die Massenproduktion zu schicken.  

200 statt 250 MHz?

Trotz neuer Fertigungstechnologie reicht die Integrationssteigerung nicht aus, um dieselben Taktfrequenzen wie beim Vorgänger zu erreichen. Während der GeForce2 ULTRA noch mit 250 MHz lief, muss man sich beim GeForce3 mit 200 MHz begnügen, nicht mehr als der vor einem Jahr lancierte GeForce2 GTS. Doch noch mehr als im CPU-Business sind MHz-Zahlen bei Grafikchips alles andere als aussagekräftig. Effizienzsteigernde Maßnahmen in den Rendering-Pipelines, größere Caches und andere Optimierungen im GeForce3 werden dafür sorgen, dass der neue Chip trotz weniger Schwingungen pro Sekunde in der Praxis die besseren Leistungswerte erzielen wird. Lassen Sie sich nicht von MHz-Zahlen in die Irre leiten, diese gelten nur innerhalb desselben Chipmodels als relevant. Wichtig sind die im Endeffekt in der Praxis erzielten Leistungswerte. Die im Zusammenhang mit der Lightspeed Memory Architecture eingebauten Verbesserungen bringen im Normalfall bereits eine Steigerung der effektiven Füllrate um 10-20%. Schonender Umgang mit der Speicherbandbreite sorgt für weiteren Geschwindigkeitsschub in bandbreitenlimitierten Situationen, so dass der GeForce3 im Endeffekt in den meisten Praxistests besser abschneiden dürfte als der schneller getaktete Vorgänger.

Dennoch wird klar, wo NVIDIA als nächstes die Leistungsschraube ansetzen wird. Es dürfte ein leichtes sein, die GeForce3 - Architektur mit einem neuen 0.13µ-Fertigungsprozess oder gar schon in einem verbesserten 0.15µ-Prozess auf höhere Taktfrequenzen und damit höhere Leistungen zu trimmen. Das "Fall-Refresh" dürfte den GeForce3 zu neuen Höchstleistungen treiben, soviel steht fest.

Vertex Shader à la GeForce3

Einer der Hauptgründe für den enormen Transistorzuwachs liegt in der neu hinzugekommenen, programmierbaren Geometrieeinheit. Parallel zur weiterhin vorhandenen, festverdrahteten T&L-Pipeline integriert NVIDIA einen Mini-Prozessor mit eigenem Instruktionssatz in den GeForce3, der vom Spieleentwickler direkt für seine eigenen Transformations- und Beleuchtungsberechnungen genutzt werden kann. Die Details zu dieser Technologie erfahren Sie in unserer Technikanalyse "Vertex Shader - TNL der nächsten Generation", wir beschränken uns hier auf die technischen Einzelheiten der GeForce3-Ausführung.


Fortschritt durch NVIDIA: 
GeForce256 TNL-Techdemo (1999) vs. GeForce3 -Techdemo (2001)

Der Vertex Shader des GeForce3 besitzt eine Ausführungseinheit (ALU), d.h. der SIMD-Prozessor kann genau eine Shader-Instruktion pro Takt ausführen. Bei den spezifizierten 200 MHz Taktfrequenz ist der GeForce3 in der Lage, über die programmierbare Einheit bis zu 50 Millionen Dreiecke pro Sekunde zu transformieren. Was bei einfachen Transformationen über die programmierbare TNL-Einheit noch schneller geht, wird mit aktivierten Hardware-Lichtern schnell deutlich langsamer.

Tabelle 1: GeForce3 - maximale TNL Leistung

  GeForce2 ULTRA GeForce3 DX7 GeForce3 DX8 programmierbar
keine Beleuchtung 31 M 25 M 50 M
1 spekulares Punktlicht  31 M 25 M 10 M
8 spekulare Punktlichter 3,8 M 3.125 M 1.5 M

Bereits mit einem Punktlicht rechnet die festverdrahtete TNL-Einheit 2,5x schneller. Werden 8 spekulare Punktlichter genutzt, fällt die Leistung des programmierbaren Vertex Shaders bereits auf 1,5 Millionen Eckpunkte pro Sekunde. Diese Leistung würde reichen, um 25'000 Dreiecken pro Szene flüssig darzustellen, geplante TNL-Titel werden allerdings mehr Dreiecke nutzen und den Vertex Shader gleichzeitig für weitere Funktionen (Charakteranimation) mit Rechenarbeit belegen, so dass uns die Leistung der programmierbaren TNL-Einheit für diese Zwecke etwas unterdimensioniert erscheint. Die Kernanwendung des Vertex Shaders wird in einer ersten Phase jedoch die Charakteranimation sein, die deutlich weniger aufwendig sein dürfte als komplizierte angepasste Beleuchtungs-Schemen. Wie wir später sehen werden, führt die nFiniteFX-Engine genannte Einheit in der Tat in der Praxis bereits zu einem starken Leistungsschub, der mit kommenden Generationen nur noch grösser ausfallen wird.

Grundgerüst für die Zukunft

Die GeForce3 - Architektur gilt als Grundstein für sämtliche neuen NVIDIA-Grafikchips in den nächsten 1-2 Jahren. Schon bei der NV1x-Serie wurde ersichtlich, dass NVidia größtenteils auf ein Baukasten-System bei der Entwicklung neuer Grafikchips zurückgreift, d.h. es wird ein existierendes Design entweder leicht erweitert (NV10 -> NV15) oder den Bedürfnissen entsprechend zurechtgerupft (NV15 -> NV11 -> GeForce2go -> Crush). Die spart Entwicklungskosten und reduziert das Risiko für Verzögerungen. Das System ist eines der Geheimnisse von NVIDIA's Termintreue und dürfte als offensichtlich bewährte Vorgehensweise beibehalten werden. Ähnliches wird daher auch mit dem Kern des GeForce3 (NV20) geschehen, der zuerst im Xbox-Grafikchip xGPU wiederverwendet wird und später als erweiterte und wieder strangulierte PC-Versionen die verschiedenen Marktsegmente bedienen soll. Was die nächsten PC-Derivate anbelangt, so können auch wir nur spekulieren. Nach einem einfachen Speed-Jump mit dem NV25 mit einigen leichten Detailverbesserungen dürfte auf dieser Basis eine abgespeckte Variante als Ersatz für den GeForce2 MX lanciert werden. Die Anforderungen an DirectX 8 legen nahe, dass NVidia bei diesem Chip Teile der festverdrahteten DirectX 7 TNL-Pipeline sowie 2 Pipelines einsparen könnte, ohne dabei die wesentlichen DX8-Features zu verlieren. Konkreter werden die Pläne beim Derivat für Microsoft's Spielkonsole, der "xGPU" (NV2A):

Die spezifizierten Leistungswerte der Xbox offenbaren, dass NVidia die Ausführungseinheiten der programmierbaren TNL-Einheit (Vertex Shader) bei der XBox doppelt ausgelegt hat. Während der NV20 um die 50 Millionen Eckpunkte transformieren kann, wird die xGPU der Xbox ganze 125 Millionen Dreiecke/s verarbeiten können, mehr als das Doppelte des GeForce3. In der xGPU befindet sich zudem die Northbridge (nicht im Diagramm), die Renderingarchitektur dagegen bleibt unverändert. Die Vermutungen bezüglich Transistoranzahl (GeForce3 57 Millionen, xGPU ca. 65 Millionen) legen nahe, dass NVIDIA Teile der festverdrahteten TNL-Einheit sowie weitere, nicht für die Konsole relevante Features aus der Xbox gekippt hat - der doppelt ausgelegte Vertex Shader macht die DX7-TNL-Einheit nahezu überflüssig (bis auf die Clipping-Einheit, die weiterhin drin bleiben muss).

  GeForce2  ULTRA GeForce3  xGPU 
Taktfrequenz 250 MHz 200 MHz 250 MHz
Fertigungsprozess  0.18 0.15 0.15
Renderpipelines 4 4 4
Vertex Shader ALU  CPU 1 2*
keine Beleuchtung
DX8 TNL
CPU 50 M 125 M

Auch wenn die Details der einzelnen Bausteine noch nicht offengelegt sind, in Umrissen ist relativ klar, womit man von NVIDIA bis zum Erscheinen des NV30 rechnen darf.

Moore's Law Cubed

NVIDIA wirbt seit kurzem damit, dass man das Mooresche Gesetz (doppelte Leistung alle 18 Monate) sogar um die dritte Potenz ("Hoch 3") übertreffe. Nun, in der Tat gilt dies natürlich nur für den Spezialfall der Texelrate mit aktiviertem Full Scene Anti Aliasing, aber dennoch wird klar, dass das Moore'sche Gesetz in seiner Grundversion zumindest für die Fortschritte von NVIDIA keine Gültigkeit mehr hat.

Bei der 'Texelfüllrate', eine gerne genutzte Grösse für die Leistung eines Grafikprozessors, überbietet NVIDIA Moore's Law um den Faktor 10, was knapp der beworbenen 'Kubierung' des Mooreschen Gesetzes entspricht. In den anderen Bereichen gilt dies nicht, aber dennoch wird das alte Gesetz der Halbleiterbranche in allen anderen Kategorien (auch in der hier nicht aufgelisteten Speicherbandbreite) überboten. Bei der integrierten Anzahl Transistoren ist NVIDIA unangefochten an der Spitze. Es gibt zwar einige IBM- und Intel-Spezialprozessoren im Server-Markt, die mit Transistormengen von 100 Millionen aufwarten, doch im PC-Markt hält NVIDIA zum dritten Mal nach dem dem GeForce256 und dem GeForce2 GTS den Spitzenplatz mit den komplexesten Logikprozessoren weltweit. 

Es ist fraglich, ob NVIDIA und generell die Grafikchipschmieden weiter im selben Tempo die Rekorde setzen können. Die mit dem NV20 verbundenen Verzögerungen deuten eigentlich darauf hin, dass es zumindest eine Abflachung in der Entwicklung geben könnte, denn auch bei weitergehendem Fortschritt der Halbleitertechnik stossen sowohl Ingenieure und speziell deren Software-Tools immer mehr an die Grenzen der Leistungsfähigkeit. 

DirectX 8 - Features

Der GeForce3 wurde im Hinblick auf das Feature-Set von DirectX 8 entwickelt, oder DirectX 8 wurde im Hinblick auf die Features des GeForce3 angepasst, je nach Standpunkt kommt man zu einem anderen Schluss. Fakt ist, der GeForce3 unterstützt sehr viele DirectX 8 - Features, namentlich die neuen Pixel Shader sowie eine Vertex Shader-Einheit (programmierbares T&L). 


Vertex Shader-Effekte: dynamische Einschusslöcher oder flatternde Stoffe

Speziell der Vertex Shader ist ein heisses Feature. Mittels Vertex Shadern können die Programmierer erstmals eigene Programme auf dem Grafikchip ausführen lassen. Die Möglichkeit hatten sie bisher nicht, sondern sie waren an die vordefinierten Funktionen der Programmierschnittstelle (DirectX, OpenGL) gebunden. Die neu dazu gewonnene Flexibilität eröffnet viele neue Möglichkeiten, die eigentlich nur durch die Leistungsfähigkeit des Grafikchips begrenzt werden. Besonders entzücken dürften die nun sehr flexiblen Möglichkeiten zur Charakteranimation, indem sehr viele Eckpunkte in die Bewegung einer Spielfigur einfließen können. Auch dynamische LOD-Algorithmen, bei denen der Wechsel der Detail-Stufe nicht mehr aprupt, sondern fliessend mittels Morphing erfolgt, ist nun problemlos möglich. Insgesamt eröffnet der Vertex Shadern den Spieleprogrammierer viele neue Möglichkeiten zum Steigern des Realismus. Dynamikeffekte könnten zum Killerfeature des Vertex Shader mutieren. Flatternde Fahnen und Kleidungsstücke sowie echte Vibrationen im Gelände nach Granateneinschlägen wären Anwendungsbeispiele, die sicherlich in realen Spieleumgebungen hervorragend integriert werden können. Bis dahin ist es jedoch noch ein weiter Weg, sowohl im Hinblick auf die lange Entwicklungszeit moderner Spiele, wie auch auf Seite der 3D-Hardware, welche dafür noch leistungsfähiger werden muss. Doch bereits die einfacheren Funktionen sind ein erster Fortschritt gegenüber dem stur vorgegebenen DirectX7-Hardwarepfad.

Auch bei den Pixel Shadern erfüllt NVIDIA die DirectX8 - Spezifikation, indem bis zu 4 Texturen in die Berechnung mit einfliessen können, im Gegensatz zum RADEON, der selbiges nur mit 3 Texturen schafft. 


Fortschritt: GeForce256 vs. GeForce3 Technologie - Demonstration

In zwei Punkten erfüllt der GeForce3 jedoch (noch) nicht den beworbenen Anspruch eines 100%igen DirectX8-Beschleunigers und ist somit gemäss unserer Auffassung auch nicht DirectX 8 "compliant".

Mit den aktuellen 11.01/12.00 und 12.01-Detonator-Treibern werden beispielsweise 3D Texturen nicht unterstützt, dies obwohl ältere NVIDIA-Unterlagen auf eine Hardware-Unterstützung hindeuten. Auch John Carmack, Spieleentwickler bei id software, spricht in einem seiner berüchtigten .plan-Updates davon, dass NVIDIA im GeForce3 3D Texturen in vollem Umfang in der Hardware integrierte, dies nachdem er bereits mit einem Testmuster beliefert wurde. Dem widerspricht seit einiger Zeit jedoch die offizielle Haltung von NVIDIA. Sowohl David Kirk wie auch Chris Everitt, beides Ingenieure bei NVIDIA, sagten, dass das Feature im GeForce3-Produkt nicht zur Verfügung steht: "3D Texturen waren geplant für den GeForce3, aber wir hatten nicht genug Zeit, um diese fertigzustellen. Wie Sie wissen, wir versuchen unseren Fahrplan einzuhalten (ein neues Killer-Produkt alle 6 Monate!). Daher müssen wir , um etwas fertigzustellen, uns entscheiden, einige Feature wegzulassen, welche zu viel Zeit benötigen. 3D Texturen konnten nicht im GeForce3 integriert werden, sie werden beim nächsten Mal drin sein." . Während der berüchtigte Spieleentwickler behauptet, das Feature sei komplett implementiert, bestätigt NVIDIA selbst das Gegenteil. Auf eine weitere Nachfrage bei NVIDIA, ob 3D Texturen nun im GeForce3-Chip implementiert sind und ob dies eine Treiber- oder Hardware-Angelegenheit sei oder nicht, beschränkte sich CTO David Kirk auf folgendes Statement: "Das GeForce3 Produkt unterstützt keine 3D Texturen. Ich werde Ihnen nicht mehr als dies sagen!". Wir können die Verwirrung auch nicht aufklären, möglicherweise bezog sich John Carmack auf veraltete Spezifikationen, ohne selbst das Feature auszutesten, oder 3D Texturen werden schlicht für spätere Chips als "neues" Feature aufgehoben.

Auch werden derzeit noch nicht alle DirectX8-Multisampling-Funktionen in Hardware geboten, was such im Verlaufe der Treiberentwicklung vielleicht noch ändern könnte, doch derzeit muss man davon ausgehen, dass diese Features auf den GeForce3-Karten nicht unterstützt werden. Festzuhalten bleibt, dass diese beiden (noch nicht komplett) unterstützten DX8-Features bei den Spieleentwicklern auf relativ wenig Echo stossen und die fehlende Unterstützung daher relativ irrelevant erscheint.

Die Produkte: ELSA GLADIAC 920

NVIDIA selbst stellt keine Grafikkarten her und verzichtete diesmal auch auf die Verteilung von Testmustern im deutschsprachigen Raum. Sowohl ELSA wie auch Hercules stellten uns Vorserien-Exemplare zur Verfügung, die auf dem A3-Stepping beruhen.

Die ELSA-Karte wird dabei mit einem stereoskopisch wirkenden Maus-Pad gebundelt. Ebenfalls mit im Retail-Paket eine Treiber-CD, ein DVD-Software-Player (ELSAmovie 2000), der 3DMark 2001 PRO und als besonderes Schmankerl die Vollversion von Giants - Citzen:Kabuto, einem modernen DirectX7-Spiel, welches als eines der wenigen Spiele Dot3 Bump Mapping nutzt. Speziell für ELSA fertigte der Spieleentwickler einen (bisher) exklusiven Patch, so dass das Spiel die neuen Features des GeForce3 nutzen kann. Die mit der GLADIAC 920 gelieferte Version des Spiels ist daher voll auf DirectX 8 ausgerichtet und spielt sich schneller und besser als das im Laden erhältliche DirectX 7-äquivalent. Die ELSA-Version des Spiels nutzt nicht nur für die Charaktere mehr Polygone, sondern sorgt auch dafür, dass die Landschaft fliessender in die Wasserdarstellung übergeht. Letztere wurde um Pixel Shader-Effekte erweitert und daher realistischer gestaltet. ELSA liefert somit mit dem Board das erste Spiel, welches den Vertex- und Pixel-Shader des GeForce3 nutzen kann. 

Die von VisionTek im Auftrag von ELSA gefertigte Platine wird mit 3,8 Nanosekunden DDR-Speicher bestückt, der theoretisch bis 263 MHz (526 MHz "effektiv") innerhalb der Spezifikation betrieben werden kann. Standardmässig wird er gemäss der NVIDIA-Vorgabe mit 230 MHz getaktet.

Das Endblech des Boards ist mit einem VGA-Ausgang (Sub-D-Buchse) bestückt und wird flankiert von einem TV-Anschluss (S-Video), der mittels einem mitgelieferten Adapter zu einem Composite-Anschluss umfunktioniert werden kann. Realisiert wird der TV-Out über einen auf der Platine verlöteten TV-Encoder des Typs Booktree Bt869. ELSA gewährt 6 Jahre Garantie auf die Karte und bietet innerhalb von Deutschland einen 100 Tage Austausch-Service ("ELSA ServiceDirect")

Die Produkte: Hercules 3D Prophet III 

Die Hercules-Platine befriedigt dabei auch das Auge und strahlt im gewohnt coolem Hercules-türkis. Auf dem GeForce3-Chip der 3D Prophet III verbaut der Hersteller, und das dürfte einige Overclocker-Herzen höher schlagen lassen, einen speziellen aktiven Lüfter der Cooling-Spezialisten Thermaltake. Der in speziell flacher Bauweise gefertigte Lüfter entspricht ansonsten den bekannten "BlueOrb"-Lüftermodellen, die normalerweise als teures Overclocking-Zubehör vertrieben werden. 

Wie bei der GLADIAC 920 findet sich auch auf dem Endblech der 3D Prophet III ein VGA- und TV-Anschluss wieder, ein S-Video -> Composite-Adapter liegt in der Verpackung bei. Hercules realisiert den TV-Out über einen Booktree TV-Encoder des Herstellers Conexant. Doch das Anschluss-Repertoire geht bei der 3D Prophet III weiter, Hercules pflanzt auch einen TMDS-Transmitter auf das Board, der den am Endblech angebrachten DVI-Anschluss ansteuert, womit Hercules auch Besitzer von digitalen Flachbildschirmen anspricht. Die maximale Auflösung beträgt dabei 1600x1200 Pixel.


Hübsch: Ein 'BlueOrb' sorgt für die Frischluftzufuhr

Als obligaten DVD-Software-Player bundelt Hercules dabei den PowerDVD inklusive deutschsprachigem Handbuch. Was bei ELSA das Mauspad ist bei Hercules eine Serie Sticker. Mit auf dem Bildschirm oder PC-Gehäuse aufgeklebten Motiven wie "Powered By Hercules", "Powerful 3D" und "High Performance 3D Graphics Card" können Sie nun angeben, ohne das Gehäuse zu öffnen! 

Testsystem

Unser Testsystem besteht aus einem schnellen AMD Athlon 1,1 GHz / 100 MHz SDR SDRAM auf einem ABit KT7-Mainboard. 

  • AMD Athlon Thunderbird 950 bei 1,1 GHz
  • ABit KT7 Mainboard
  • 256 MB SDR SDRAM 100 MHz, PC-100, 2-2-2
  • 40 GB IBM Festplatte
  • Pioneer 4X DVD-ROM Slot-In ATAPI
  • iOmega ZIP-Drive ATAPI
  • Philipps toUCam PRO USB
  • Creative Soundblaster AWE64 Value

  • GeForce2 GTS 32 MB bei 200/166 MHz
  • GeForce2 ULTRA 64 MB bei 250/230 MHz
  • GeForce3 64 MB bei 200/230 MHz

  • Windows ME, DirectX 8.0a
  • GeForce DX7/OGL: Treiber Detonator 6.50 WHQL
  • GeForce DX8: Treiber Detonator 11.01
  • GeForce3: Treiber Detonator 11.01, 12.00, 12.01
  • Desktop auf 1024x768x32bit
  • Double Buffering, VSync aus, S3TC Bugfix an
  • Refresh-Rate auf 100 Hz bis 1024x768
    Refresh-Rate auf 70 Hz bei 1280x1024 & 1600x1200

Testsoftware

Um die Leistungsfähigkeit des GeForce3 umfassend beurteilen zu können, setzen wir dabei nicht nur auf eine handvoll subjektiv ausgewählter Benchmarks, die im schlimmsten Fall nur DirectX8-optimiert sind. Auch den Benchmark 3D Mark 2000 (Direct3D) werden Sie bei uns nicht finden, dessen Resultate wären ohnehin Makulatur, da nie ein Spiel mit der in 3D Mark 2000 verwendeten Engine erscheinen wird.

Wir möchten Ihnen auch zeigen können, wie schnell Ihre Grafikkarte wirklich ist und nicht nur - wie schnell sie sein könnte. Daher ziehen wir es vor, die Karten mit einem breiten Mix von echten Spielen zu testen. Dabei kommen nicht nur Ladenhüter wie Evolva zum Einsatz, sondern auch Verkaufserfolge wie Ultima 9. Die Palette der Quake III - basierenden Spiele umfasst die Referenz Quake III Arena, F.A.K.K. 2, Star Trek Elite Force sowie Alice. Ergänzt wird die Serie von Direct3D-Spielen wie Giants, Test Drive 6, Mercedes-Benz Truck Racing und Motocross Madness 2. 

Alle Benchmarks wurden mit allen gängigen Auflösungen durchgeführt, so dass Sie sich selbst ein Bild machen können, auf welcher Auflösungsstufe sie Ihr Lieblingsspiel fahren möchten. Durch diese Vorgehensweise bei knapp 20 Spielen führen wir auch einen Kompatibilitätscheck durch, d.h. welche Spiele funktionieren, wo gibt es Grafikfehler, welche Auflösungen funktionieren nicht? 

Das Potential bei künftigen Spielen wird anhand von Tech-Demos beurteilt. GLMark 1.1p, Aquamark sowie die X-Isle Demo gehören zum Testprogramm, genauso wie "3D Mark 2001", dessen Engine angeblich in dem für das dritte Quartal erwarteten Max Payne zum Einsatz kommen soll. Ausserdem stellen wir sicher, dass damit auch vermehrt "moderne" 3D-Engines mit T&L und Bump Mapping-Support berücksichtigt werden.

In unserem Benchmarking - Artikel erfahren Sie weitere Details zum Benchmarking und den dazu gehörigen Prozeduren. Folgend die genauen Einstellungen zu den Benchmarkprogrammen:

  • Alice: Demo-Version mit HQ++-Settings, jeweils 16bit bzw. 32bit Farbtiefe und Texturtiefe, aktivierte Texturkompression, "Demo"-Timedemo
  • Q3A: Version 1.16n, Sound an, High Quality Settings, je nach Test mit Änderungen
  • Test Drive 6 Demo, 60s Testlauf
  • MDK2 Testdemo: maximale Texturdetails, MIP Mapping
  • Re-Volt: Maximale Detailsettings
  • Descent 3: Version 1.0g, Sehr hohe Standard - Detail - Genauigkeit, Stufe "Höchste", Alle "Wechselschalter" an, Objektkomplexität niedrig, Geländedetails 18, Renderingtiefe 60, Bilinear, MIP Mapping, kein Sound
  • FAKK2: Siehe Details
  • Microsoft Motocross Madness 2: Siehe Details
  • MBTR: Reflexionen, Anzeigenkorrektur, Hires Texturen, Alpha Texturen, Sound FX, alles Filtern
  • Serious Sam Retail, eigenes Script, S3TC, kein anisotropisches Filtering, VSync aus, Exclusive Mode
  • Ultima 9, Maximale Texturen, maximale Sichtweite, S3TC

Leider konnten nicht alle gewünschten Programme in die Testserie aufgenommen werden. Aufgrund von Treiberinkompatibilitäten fehlt DMZG und 3D Excerziser sowie die Demo von Superbike 2001. 

OpenGL: Quake III Arena

Spiel: Quake III Arena
Entwickler: id software
genutzte Versionen: Retail-Vollversion mit Patch 1.17
Timedemos: Demo001 (integriert), bloodbath, annihilator

"Rocket-Jumps" und "Frags" gehören zu Ihrem Vokabular? Sie sind Quake3-Spieler, wie viele in der Netzgemeinde. Die Engine galt einst als Non-Plus-Ultra, ist mittlerweile jedoch überholt. Trotzdem dient sie weiterhin als Grundlage für viele weitere Spiele. Q3A nutzt Texturdekompression sowie die Hardware-Transformationseinheit. 

Bereits im Standard-Ablauf kann sich der GeForce3 von seinem Vorgänger absetzen. Bis zu 30% beträgt der Vorsprung in der durchschnittlich erzielten Framerate. Demo001 ist auf dem GeForce3 CPU-Limitiert bis 800x600, ab 1024x768 schlägt sich die begrenzte Grafikkartenleistung in den Frameraten nieder.

Im Annihilator-Test zeigt der GeForce3 seine Stärken. In diesem Worst-Case-Szenario arbeitet der Chip bis in hohe Auflösungen am CPU-Limit - besser geht's auf unserem System nicht. Die ideale Quake III - Karte ist gefunden. 

Der Bloodbath zeigt, trotz anderem Szenario, grundsätzlich eine ähnliche Charakteristik wie der Demo001-Ablauf. Der GeForce3 verbucht bis zu 62% höhere Frameraten als ein GeForce2 GTS.

Die KYRO II-Map stammt aus der Küche von Imagination Technologies, um die Vorteile von 8fachem Multitexturing aufzuzeigen. Die Map nutzt bis zu 4 Texturschichten pro Dreieck, im Gegensatz zu den 2 Texturschichten, die Q3A und andere Spiele mit der Q3-Engine nutzen.

Der GeForce3 ist klar im Vorteil und leistet 33% mehr als der Vorgänger GeForce2 ULTRA. Einer der Gründe ist die Fähigkeit des GeForce3, 4 Texturen in einem Rendering-Durchgang aufzutragen, wodurch wertvolle Speicherbandbreite gespart werden kann.

Im (fast ausschließlich) durch die CPU-Leistung begrenzten NVIDIA-Technologie-Level bringt auch ein GeForce3 keine Vorteile. Die T&L-Einheit kann in dieser Engine nur die Transformationen übernehmen, so dass bei vielen Dreiecken die teils aufwendigen Lichtberechnungen auf die Framerate drücken.

Keine Überraschung, der GeForce3 setzt einen neuen Spitzenwert im Demo001-Ablauf.

OpenGL: Alice

Spiel: American McGee's Alice
Publisher: EA Games
genutzte Versionen: Original Demo sowie Retail-Vollversion
Timedemos: curiosity

Alice im Wunderland - oder so ähnlich. Das fantastisch fantasievolle Mistery-Spiel auf Basis der Quake 3 - Engine lässt sich Q3A-konform diversen Benchmarkprozeduren unterziehen. Das OpenGL-Spiel unterstützt die Transformationseinheit der beiden Kontrahenten und wurde mit aktiver Texturdekompression getestet.

Der GeForce3 liegt mit bis zu 37% vor dem GeForce2 ULTRA. Allerdings verliert auch der GeForce3 in höheren Auflösungen sehr viel Leistung, so dass an ein flüssiges Spieleerlebnis bei 1280x1024 bereits nicht mehr zu denken ist. In den relevanten Spieleauflösungen bis 1024x768 liegt der GeForce3 nur wenig vor dem GeForce2 ULTRA. Der GeForce2 GTS wird dagegen bereits um 31% abgehängt.

Auch hier setzt sich der GeForce3 leicht vor den GeForce2 ULTRA. Die Frameraten erreichen das doppelte einer Voodoo 5 5500.

OpenGL: F.A.K.K. 2

Spiel: Heavy Metal F.A.K.K.
genutzte Versionen: Retail-Vollversion mit Patch 1.2
Timedemo: PCGameshardware

In F.A.K.K. 2 steuern Sie eine leicht bekleidete, dafür umso stärker bewaffnete Dame durch verwundene Gänge. Genutzt wird auch hier Texturdekompression und Hardware T (&L) auf Basis einer um Charakteranimationen erweiterten Quake 3 - Engine. Aufwendige Licht- und Explosionseffekte zeichnen dieses Spiel und speziel der vorliegende Benchmarkablauf aus.

Der GeForce3 setzt sich ab. Die neue Karte ist bis zu 30% schneller (1280x1024) als der Vorgänger, der nun bereits 1 Jahr alte GeForce2 GTS wird um bis zu 81% übertroffen (1600x1200).

Der GeForce3 liegt klar vor dem Vorgänger. Deutlich werden die krassen Leistungsunterschiede zwischen der Einsteiger-Klasse (MX / RADEON SDR) und dem High-End.

OpenGL: Star Trek Elite Force

Spiel: Star Trek Voyager: Elite Force
genutzte Versionen: Retail-Vollversion
Timedemo: benchmark

Scotty, Energie! Nicht ganz, aber fast. In gewohnter Star Trek-Kulisse spielt dieser First Person - Shooter auf Basis der Quake3-Engine.

Einmal mehr liegt der GeForce3 in hohen Auflösungen vorne. Der Benchmark ist bis 1280x768 auf unserem System CPU-limitiert. Der GeForce3 ist maximal 19.4% schneller als der Vorgänger und bis zu 57% schneller als eine GeForce2 GTS / 32 MB (1600x1200).

 

Zusammen mit dem GeForce2 ULTRA platziert sich die GeForce3 an der Spitze - am CPU-Limit.

OpenGL: MDK2

Spiel: MDK2
Entwickler: Bioware
genutzte Versionen: Demoversion
Timedemo: integriert

Das Fantasyspiel MDK2 nutzte als eines der ersten Spiele Hardware-Lighting zusätzlich zu den Transformationsfunktionen. Die verwendete OMEN-Engine kann dennoch optisch nicht überzeugen. Die Umgebung wirkt "flach" und die die Spezialeffekte setzen keine neuen Massstäbe.

Der GeForce3 ist bis zu 38% schneller als der GeForce2 ULTRA, eine GeForce2 GTS wird um bis zu 143% übertroffen (1600x1200). 

In der Standard-Auflösung 1024x768x32bit setzt sich der GeForce3 an die Spitze. Die 16bit-Leistung liegt gleichauf mit dem GeForce2 ULTRA, da mit den erzielten 123 fps das CPU-Limit unseres Testsystems erreicht ist. Der 32bit-Leistungsvorsprung gegenüber dem GeForce2 ULTRA beträgt 12%, gegenüber dem GeForce2 GTS 58%. Eine GeForce2 MX wird um 138% übertroffen. Die schnellste rivalisierende Lösung (RADEON 64 MB) liegt 42% zurück.

OpenGL: Serious Sam

Programm: Serious Sam
Entwickler: Croteam
Version: Public Test 2
Timedemo: integriert

Die neue 3D-Engine der kroatischen Entwickler stellt alles andere in den Schatten - Quake III und Unreal Tournament bleiben chancenlos gegen die Serious Sam-Engine, die besonders mit extrem hochauflösenden Texturen zu überzeugen vermag.
Serious Sam nutzt für gewisse Effekte bis zu 5 Texturschichten pro Polygon, so dass Karten wie der GeForce3 (4 Texturen pro Pass) theoretisch davon profitieren könnten.

Leider kann Benchmarking mit der Verkaufsversion von Serious Sam zum Albtraum werden. Das Spiel nutzt ein "Auto-Anpassungs"-Feature, d.h. Karten mit 32 MB werden beispielsweise anders behandelt, als Karten mit 64 MB, so dass bei den vordefinierten Profilen (Quality, Normal, etc.) jeweils für die einzelnen Karten unterschiedliche Settings zum Einsatz kommen. Einziger Ausweg wäre die Wahl von "Extreme Quality", was jedoch den Nachteil mit sich bringt, dass anisotropische Filterung erzwingt wird, welche bekanntlich bei den verschiedenen Grafikchips völlig unterschiedliches Qualitäts- und Leistungsverhalten mit sich bringt. Auch die vertikale Bildsynchronisation wird mit dieser Einstellung automatisch aktiviert, was grundsätzlich zum Benchmarken nicht geeignet ist.

Aus diesem Grunde sahen wir uns veranlasst, externe Scripts zu nutzen, die auf dem "Extreme Quality" basieren, jedoch anisotropische Filtering und VSync deaktivieren, die Texturkompression jedoch grösstenteils aktivieren. Unser Script steht hier zum Download bereit, weitere passende Scripts bietet Beyond3D zum Download an.

Im Karnak-Level liegt der GeForce3 bei den Durchschnittswerten vorn, bei den Tiefstwerten allerdings leicht unter dem GeForce2 ULTRA.

 

Auch beim Memphis-Level kann sich der GeForce3 behaupten und liet bis zu 10 fps vor dem Vorgänger. 

In diesem Level sind dem GeForce3 deutlich bessere Tiefstwerte zu bescheinigen. 

DirectX 7: Ultima 9 

Programm: Ultima 9 
Version: Retail deutsch
Timedemo: fps

Ultima 9 nutzt sehr viele hochauflösende Texturen und stellt grosse Anforderungen an das Texturmanagement der Treiber. 

Der GeForce3 übertrifft seinen schneller getakteten Vorgänger, ohne jedoch flüssige Frameraten zu erreichen. Der GeForce3 leistet in diesem Spiel maximal 19% bessere Frameraten als eine GeForce2 ULTRA. Eine GeForce2 GTS wird um 50% abgehängt (1600x1200).

Im 1024x768-Leistungsvergleich gegen die Konkurrenz platziert sich der GeForce3 im Mittelfeld. NVIDIA-Karten bekunden generell Mühe mit diesem Spiel, selbst 200 Mark-Karten des Typs KYRO liefern hier bessere Leistungswerte als die High-End-Beschleuniger der High-End-Spezialisten. Die GeForce3 ist 23% langsamer als eine Voodoo 5 5500, allerdings auch 17% schneller als eine GeForce2 GTS.

DirectX 7: Evolva

Programm: Evolva
Version: Rolling Demo 944
Timedemo: integriert

Evolva gilt als erstes Spiel mit der Unterstützung von DirectX 7 Pixel Shading (Dot3 Bump Mapping), weshalb NVIDIA dieses Spiel als Technologie-Demonstration während den GeForce2 GTS-Präsentationen nutzte. Sowohl RADEON und GeForce2 GTS integrieren eine Dot3-Einheit, beide Beschleuniger fallen bei deren Nutzung unter DirectX 7 jedoch in einen Multipass-Rendering-Modus zurück. Auch der GeForce3 kann hier sein Loop-Back-Feature zur Auftragung von 4 Texturen in einem Pass nicht nutzen, dazu wäre ein Spielepatch nötig.

In 'flachen' Darstellungsmodus ohne Bump Mapping leistet der GeForce3 sowohl bei den Tiefst- wie auch bei den Durchschnittswerten mehr als sein Vorgänger. Der Vorsprung liegt bei bis zu 29% bei den Durchschnittswerten bzw. 27% bei den Tiefstwerten. Die Leistungswerte einer GeForce2 GTS werden um bis zu 84% bzw. 131% übertroffen. 

Deutlicher sind die Leistungsvorteile, sobald Dot3 Bump Mapping aktiviert wird. Die Effizienz-Vorzüge der Lightspeed Memory Architecture kumulieren sich hier, da der vorgezogene Tiefentest unter Umständen den Zugriff auf 3 Texturen (Base, Light, Bumpmap) ersparen kann.

Der GeForce3 übernimmt locker die Spitzenposition in Evolva. Das Schlusslicht bildet der GeForce2 MX.

DirectX 7: MBTR

Programm: Mercedes-Benz Truck Racing
Entwickler: Syntetic
Version: Retail Version, deutsch, Max. Details, Sichtweite 50%
Timedemo: integriert

Mercedes-Benz Truck Racing nutzt sowohl hoch detaillierte Fahrzeugmodelle wie auch viele hochauflösende Texturen.

Am CPU-Limiter arbeitet MBTR mit dem GeForce3. Besser geht's auf diesem System nicht, d.h. überflüssige Leistung kann hier ohne weiteres in bessere Optik wie anisotropisches Filtering und Full Scene Anti Aliasing investiert werden.

DirectX 7: Test Drive 6

Programm: Test Drive 6
Version: Demoversion
Timedemo: integriert

Test Drive 6 nutzte als eines der ersten DirectX-Spiele TNL. Trotzdem macht das Spiel einen tristen und wenig anschaulichen Eindruck.

Leider treten hier Mängel der GeForce-Treiber zu Tage. Der Treiber versagt bereits ab einer Auflösung von 1024x768 und zeigt Leistungsschwächen unterhalb dieser Auflösung. Es ist zu hoffen, dass dies beim nächsten Treiber nicht mehr der Fall sein wird und auch die hier noch messbaren Leistungsdefizite des GeForce3 beseitigt sein werden.

DirectX 7: Motocross Madness 2

Programm: Motocross Madness 2
Entwickler: Microsoft
Version: Demoversion
Timedemo: Arizona

Das Motorrad-Rally-Spiel Motocross Madness 2 erlaubt nur die Nutzung des 16bit High Color-Modus. Die von uns genutzte Benchmark - Sequenz zeigt ein offenes Steppen-Feld. Der dreiecksbasierte Overdraw dieser Szenerie dürfte sehr gering sein.

Der GeForce3 kann sich hier in höheren Auflösungen vom GeForce2 ULTRA absetzen. Bei 1280x1024 beträgt der Vorsprung 10%. Eine GeForce2 GTS wird um bis zu 26% übertroffen.

Ein GeForce3 ist bei 1024x768 um 5% schneller als eine GF2 ULTRA, 15% schneller als eine GF2 GTS und 54% schneller als eine GeForce2 MX.

Hier muss klar festgehalten werden, dass in diesem Spiel nur High-End-Grafikkarten flüssige Frameraten liefern können. GeForce2 MX-, KYRO- und RADEON-Karten erreichen in diesem Szenario keine durchschnittlichen 30 fps in den gewählten Einstellungen. Ausserdem sei zu berücksichtigen, dass das hier vermessene Szenario eher einen Idealfall für das Spiel darstellt.

DirectX 7: Unreal Tournament

Programm: Unreal Tournament
Entwickler: EPIC Megagames
Version: Vollversion 4.35
Timedemo: UTbench

Unreal Tournament stellt das Grundgerüst vieler weiterer Spiele dar, sowohl das beliebte Deus Ex wie auch Rune und Undying basieren auf dieser Engine, die ursprünglich als First Person Shooter Premiere feierte, mittlerweile aber auch in "zivilen" Programmen eingesetzt wird. Unreal Tournament zeichnet sich durch den Einsatz von vielen Texturen aus und stellt hohe Anforderungen an das Texturmanagement. TNL wird nicht unterstützt.

Der GeForce3 erreicht hier nicht ganz die Leistungswerte des GeForce2 ULTRA, was wir auf noch nicht fertig optimierte Treiber zurückführen. Eine GeForce2 GTS wird jedoch bei 1024x768 übertroffen, speziell bei den tiefstwerten leidet das 32 MB-Modell durch die vielen Texturzugriffe.

Nicht Top, aber auch kein Flopp. Der GeForce3 leistet in Unreal Tournament gute Dienste, speziell die Tiefstwerte liegen über jenen der meisten 32 MB - Modelle. Dass der GeForce2 ULTRA nicht geschlagen wird, dürfte an noch nicht fertig optimierten Treibern liegen.

DirectX 7: GIANTS: CITIZEN KABUTO

Programm: Giants Vollversion
Entwickler: Planet Moon Studios
Version: 1.396 BETA
Timedemo: Gamegauge (integriert)

Giants war nach Evolva das zweite Spiel mit Unterstützung für DirectX 7 Pixel Shading (Dot3 Bump Mapping). Im Unterschied zu Evolva wird Giants auch gespielt, weswegen die Benchmarkwerte dieses Spiel interessanter sein dürften. 

Mit maximalen Qualitätssettings und Dot3 Bump Mapping arbeitet der GeForce3 praktisch bis zur maximalen Auflösung am CPU-Limit, könnte man meinen, wenn man den Tiefstwert ausser Acht lässt. Dieser fällt mit steigender Auflösung, so dass Giants auf auf dem GeForce3 nur bis 1280x1024 durchgängig spielbare Frameraten liefert.

Locker an der Spitze: Der GeForce3 ist schneller als ULTRA und GTS.

DirectX 7: The Need for Speed: Porsche

Programm: The Need for Speed: Porsche
Entwickler: Electronic Arts
Version: German Retail
Timedemo: 3DConceptNormandie + FRAPS 1.3

The Need for Speed - selbst regelmäßige Benützer von öffentlichen Verkehrsmitteln werden den Bleifuss nicht mehr lösen wollen, nachdem sie sich an den immer schneller vorbeiflitzenden Landschaften dieses herrlichen Spiels ergötzt haben. The Need for Speed setzt graphisch Maßstäbe unter den Fun-Rennspielen. Zwar wird weder TNL noch Cube Environment Mapping noch Bump Mapping eingesetzt, sondern für die graphische Pracht setzen die Entwickler auf eigene und hochkarätige Algorithmen und Multitexturing-Technologie.

Beim GeForce3 wurden wir hier mit Treiberproblemen konfrontiert, es liessen sich nur Auflösungen bis 1280x960 einstellen. In dieser Auflösung übernimmt der GeForce3 auch die Führung vor dem GeForce2 ULTRA, der Verlauf der Kurve deutet an, dass er diese in höheren Auflösungen noch ausbauen würde, sofern denn die Treiber funktionieren würden.

Nur wenige Grafikkarten erreichen hier durchschnittliche 60 fps bei 1024x768x32bit. Der GeForce3 gehört dazu.

DirectX 7: Colin McRae Rally 2.0

Programm: Colin McRae Rally 2.0
Version: öffentliche Demoversion
+ FRAPS 1.3
Timedemo: keines, Arcade-Strecke Italien, 15 Sekunden warten, FPS-Logging starten, 30 Sekunden Strecke abfahren, FPS-Logging stoppen 

Wer sagt, neue Features werden nicht genutzt? Colin McRae Rally nutzt als erstes Spiel überhaupt dynamisches Cube Environment Mapping zur realistischen Generierung von Scheibenreflexionen. Alternativ wird herkömmliches Environment Mapping oder Environmental Bump Mapping angeboten. Das Spiel nutzt TNL.

Mit gewöhnlichem Environmental Mapping bleibt der Geforce3 interessanterweise hinter dem GeForce2 ULTRA zurück. Der Geforce3 beherrscht hier zudem Environmental Bump Mapping. Die Frameraten mit EMBM entsprachen dabei den normalen Environment Mapping-Resultaten. 

Auch mit aktiviertem Cube Environmental Bump Mapping gewinnt man mit dem GeForce3 keinen Blumentopf, sofern FRAPS die Resultate zwischen den GeForce-Boards nicht verzerrt. Der GeForce3 ist langsamer als der GeForce2 ULTRA. 

Der GeForce3 wird flankiert von GeForce2 PRO und GeForce2 GTS. Neuere Treiber könnten die Reihenfolge vielleicht schnell wieder ändern und den GeForce3 an die Spitze hieven. 

DirectX 6: Expendable

Programm: Expendable
Entwickler: RAGE
Version: Demo
Timedemo: Timedemo 2 (integriert)

Expendable galt einst als Vorzeigespiel bezüglich der Unterstützung neuer Features. Stencil Buffers, EMBM und Texturdekompression gehören zu den Kernmerkmalen der verwendeten Engine.

Würden wir Ihnen die Tiefstwerte vorenthalten, so hätte man den Eindruck, der GeForce3 sei für Expendable die schlechtere Lösung als eine billigere GeForce2 ULTRA. Dem ist nicht so. Dank Overdraw-Reduktion liegen die Tiefstwerte deutlich über dem Vorgänger, was sich in einer besseren Spielbarkeit bemerkbar machen sollte. 

Es ist nicht auszuschliessen, dass auch andere Spieleengines ähnliches Verhalten zeigen. Leider bieten die meisten Benchmarks keine oder nur unbrauchbare Tiefstwert-Angaben. 

Auch hier sei bemerkt: Obwohl der GeForce3 noch nicht die schnellsten Durchschnittswerte liefern kann ist er dennoch die beste 3D-Lösung für dieses Spiel, da die wichtigen (durch die Füllrate limitierte) Tiefstwerte viel höher Liegen als bei allen anderen Grafikkarten.

DirectX 6: Revolt

Programm: Revolt
Version: Retail-Vollversion
Timedemo: integriert

Re-Volt ist ein auf Action getrimmtes Spielzeugautorennen. Die 3D-Engine nutzt keine besonderen modernen Features.

Der GeForce3 ist in tiefen Auflösungen langsamer als ein GeForce2 GTS oder ein GeForce2 ULTRA. Bei hohen Auflösungen übertrifft der GeForce3 wieder die Leistungswerte der anderen 3D-Beschleuniger. Bis 1280x1024 liegt seine Leistung am CPU- bzw. Treiber-Limit, während eine GeForce2 ULTRA bereits Füllratenlimitierungen zeigt.

Aus den erwähnten Gründen übernimmt der GeForce3 bei diesem Leistungsvergleich (noch?) nicht die Leistungskrone.

DirectX 6: Descent 3

Programm: Descent3
Entwickler: Interplay
Version: Retail
Timedemo: Secret2

Etwas veraltet, aber dennoch interessant zur Analyse der Worst-Case-Szenarios: Die Descent3-Engine.

Obwohl es sich hier um einen 16bit-Benchmark handelt, übertrifft der GeForce3 seine Rivalen um 40 bzw. 38% (Durchschnitts- / Tiefstwerte). GTS-Karten werden um bis zu 60 bzw. 64% abgehängt.

Der GeForce3 übernimmt bei 1024x768 problemlos die Führung bei den Tiefstwerten. Der Vorsprung auf die Mitbewerber beträgt 4% (RADEON) bzw. 13% (ULTRA) bzw. 70% (MX). Nur bei den Durchschnittswerten muss er dem Voodoo 5 (Glide) den Vorzug geben.

Zukunft? Künftige Spieleengines auf dem Prüfstand

Die letzten 15 Spiele gaben Ihnen einen Eindruck von der Leistung, welche sie in heute verfügbaren Spielen erwarten können. Die nun folgenden Benchmarkwerte sollten einen Ausblick geben, wie sich eine GeForce3 in zukünftigen Spielen verhalten könnte. Wir können nicht beurteilen, wann und ob überhaupt jemals Spiele mit diesen Engines im PC-Handel erhältlich sein werden, noch ob die hier ermittelten Benchmarkwerte auf die finalen Produkte übertragbar sind, dennoch möchten wir Ihnen einen Eindruck des Potentials vermitteln, welches in einer solch modernen Karte wie der GLADIAC 920 oder der Prophet III stecken kann.


Ballistics

Incoming Forces

Aquanox
Fertigstellung: unbekannt Fertigstellung: Ende 2001 Fertigstellung: Ende 2001
Polygonmenge: 20-110 K Polygonmenge: bis 150 K Polygonmenge: ~100 K
Shader-Effekte: EMBM, Dynamic Bump Mapped Lighting, Blinn Bump Mapped Reflections Spezialeffekte: dynamic LOD, Morphing, Blinn Reflection Mapping

Spezialeffekte: dynamic LOD, eigenes Lighting, höhenabhängiger Nebel

Derzeit mehren sich die Hinweise, dass Pixel- und speziell Vertex Shader nicht derselbe Rohrkrepierer werden, wie festverdrahtetes TNL. Die Shader geben den Programmierer endlich jene Freiheit zurück, damit sie eigene Effekte-Kreationen in die Spiele einfließen lassen können.

 
v.l.n.r: non-GeForce, GeForce256/2, GeForce3 (FUEL, OpenGL) 

Speziell auch neue Lighting-Schemen scheinen es den Entwicklern angetan zu haben, Lighting-Schemen, welche von dem für die Profi-Welt gedachten OpenGL-Lighting abweichen. Neue Möglichkeiten bieten die Shader auch im Bereich der Reflexionen, wie oft und gerne anhand von Screenshots demonstriert wird.

Zukunft? GL Mark v1.1

Programm: GLMark 1.1
Entwickler: Vulpine.de
Version: Version 1.1
Timedemo: integriert

GL Mark basiert auf der hochmodernen Vupline-Vision - Engine aus deutschem Hause. Der OpenGL-Benchmark nutzt TNL sowie, falls vorhanden, proprietäre OpenGL-Erweiterungen zur Beschleunigung von TNL und zum Bump Mapping. Der Benchmark bietet ausserdem einen speziellen GeForce3-Modus, bei dem die Vulpine-Engine die neuen Pixel- und Vertex-Shader-Features nutzen kann.

Bei den Durchschnittswerten übertrifft der GeForce3 seinen Vorgänger GeForce2 ULTRA um bis zu 60%. Bei den Tiefstwerten ist der neue Hochleistungschip sogar 73% schneller, obwohl der Vorgänger schneller getaktet ist. 

Der GeForce2 bricht ab 1024x768 etwas stärker ein, was wohl auf den kleineren OnBoard-Speicher zurückzuführen ist. Dies, der schnellere Speicher sowie die LMA führen dazu, dass der GeForce3 den jährigen Vorgänger bis zum 5fachen in den Durchschnittswerten und bis zum 8fachen bei den Tiefstwerten übertrifft.

Der Füllratengraph illustriert das Potential deutlich. Der Geforce3 skaliert mit steigender Auflösung weiter, während bereits der GeForce2 ULTRA eine abflachende Kurve zeigt - die Speicherbandbreite geht dem aufgeborten GeForce2 zur Neige. Die reale Füllrate des GeForce2 GTS bricht mit steigender Auflösung ein - Texturzugriffe bremsen den Beschleuniger ab.

Zukunft? 3D Mark 2001

Programm: 3D Mark 2000
Entwickler: Madonion
Version: Version 1.0
Timedemo: integriert

Der 3D Mark 2001 basiert auf der MaxFX-3D-Engine der Spieleschmiede von Remedy. Seit 1997 versprechen die finnischen Spieleentwickler, ein Spiel basierend auf dieser Engine (Max Payne) auf den Markt zu bringen, bisher gelang dies nicht, sondern die Firmen finanzieren sich über 40US$ teure Benchmark-Lizenzgebühren. Wir werfen dennoch einen Blick auf die erzielten Leistungswerte des GeForce3.

Car Chase

Der erste Spieletest zeigt eine Fahrzeugsimulation, bei der die Federung des Fahrzeugs angeblich gemäss realen Physikberechnungen erfolgen soll. Die 3D-Features der hier vermessenen High-Detail-Szene umfassen dynamische Schatten (mittels Rendering in Texturen), 3 Texturschichten auf dem Gelände, 3 Texturschichten auf den Fahrzeugen (Basis, Light, Glossmap), 2 Texturschichten auf Wracks und 2 Texturschichten auf den Gebäuden. Die für die Schattenberechnung benötigten Dreiecke werden aus unbekannten Gründen mittels Vertex Shadern transformiert. Sollte sich herausstellen, dass Madonion nur des Vertex Shaders wegen auf diese Transformationen mit DX7 TNL verzichtet, disqualifiziert sich das Entwicklerteam damit selbst. Mit etwas Phantasie hätte man wohl sinnvollere (und realistischere) Anwendungszwecke gefunden, um DX8-Boards mittels Vertex Shadern zu bevorteilen.

Durchschnittlich zeigt diese Szene 68'000 Polygone und 16.4 MB komprimierte Texturen. 

Der GeForce3 ist klar schneller und dies erfreulicherweise auch bei den CPU - limitierten tiefen Auflösungen. Da die über die Vertex Shader transformierten Schatten-Dreiecke auf GeForce2 - Karten von der CPU berechnet werden, kann sich der GeForce3 hier absetzen, da er über eine in Hardware integrierte Vertex Shader-Einheit besitzt. Die Frameraten sind allerdings auch auf dem GeForce3 recht tief und liegen unterhalb der 30 fps. Ab 1280x1024 erreicht die Karte zudem bereits das Füllratenlimit, da die Frameraten weiter fallen.

Dragothic

Die nächste sehr schöne Szene zeigt eine auf einem fein modellierten Drachen reitende Kämpferin, welche eine mittelalterliche Stadt angreift. 

In dieser Szene wird ein neues, spezielles globales Beleuchtungsschema benutzt, bei dem nicht nur eine multiplikative Light Map zum Abdunkeln der darunterliegenden Textur, sondern eine zusätzliche adaptive Lightmap zum Aufhellen der Farben genutzt wird. Die Charakteranimationen des Drachens, der Spielfigur sowie der vom Angriff fliehenden Stadtbewohner wurden mittels Vertex Shadern (Morphing) erstellt und laufen daher auf der GeForce3 hardwarebeschleunigt.

Der Drachen wird mit 2 Texturen überzogen, auch diese Szene nutzt dynamische Schatten mittels Rendering in Texturen, die Gebäude der Stadt nutzen 3 Texturschichten. Im Durchschnitt sind in der von uns vermessenen High-Detail-Sequenz 100'000 Polygone sichtbar, wobei 15 MB komprimierte Texturen angezeigt werden.

 

Auch hier wird der massive Leistungsvorsprung des GeForce3 gegenüber seinen Rivalen deutlich. Nur der GeForce3 erreicht in diesem Modus flüssige 35 fps-Frameraten, da er sowohl die CPU- wie auch das eigene Speicherinterface durch den Vertex Shader und effizienteres Rendering entlasten kann. Aber auch hier wird deutlich, dass der GeForce3 bereits bei 800x600 bei 35 fps sein Füllratenlimit erreicht hat, die Frameraten beginnen zu sinken.

Lobby

Die eigentlich zuerst nur für die Szenen-Demo vorgesehene "Lobby"-Sequenz (eine Imitation der Schiesserei aus der Schalterhalle des Hollywood-Streifens Matrix) nutzt Charaktere, die einst in Max Payne zum Einsatz kommen sollen.

Die Bewegung der Charaktere wird mittels DirectX 8 Vertex Shadern erzeugt und wird daher vom GeForce3 hardwarebeschleunigt. Auf DirectX7-Beschleunigern (GeForce2) wird die Charakteranimation nicht über DirectX, sondern über eigenen, handoptimierten Code vorgenommen. Die Patronenhülsen fliegen mit in Echtzeit berechneten Physikauswertungen davon. Die von uns genutzte High-Details-Szene nutzt Reflexionen auf dem Hallenboden sowie dynamische Schatten. Die Charaktere werden mit einer Texturschicht, die Wände mit 2 Texturschichten dargestellt. Die Reflexionen werden erzeugt, in dem alles spiegelverkehrt nochmals gerendert wird.

Die Szene zeigt durchschnittlich 42'000 Polygone und nutzt 9.3 MB komprimierte Texturen.

Der GeForce3 ist seinem Vorgänger in allen Belangen überlegen. Durch die CPU-Entlastung bei der Charakteranimation sind die Werte in tiefen Auflösungen höher, durch die effizientere Speicherarchitektur sowie den vorgezogenen Tiefentest leistet der GeForce3 bei hohen Auflösungen behr. Dennoch erreicht die Karte bereits bei 1024x1024 bei 35 fps das oft Füllraten-/Bandbreitenlimit.

Nature

Die folgende Sequenz nutzt DirectX 8 Pixel Shader, ohne dass Madonion an die Implementierung einer zu DX7 rückwertskompatiblen Technik gedacht hat. Daher lässt sich die Sequenz nur auf DirectX8-Beschleunigern wie dem GeForce3 benchmarken.

Die Szene zeigt eine wunderschön dargestellte Naturszene, bei der die Gräser sowie die Blätter der Pflanzen und Bäume sich im Wind wiegen. Das Wasser kräuselt sich vom Wind realistisch. Letzteres wurde mit DX8 Pixel Shadern sowie Cube Environment Mapping mit 4 Texturquellen realisiert, die im Wind wogenden Blätter werden mit Vertex Shadern in Dynamik versetzt. Die Bewegungen der in der Sequenz sichtbaren Spielfigur sind ebenfalls mit Vertex Shadern realisiert.

Landschaft, Brücke und Haus nutzen je 2 Texturschichten, Blätter, Grass und die Spielfigur eine. Im Durchschnitt sind in dieser Szene 82'000 Dreiecke sichtbar, die Grösse aller sichtbaren komprimierten Texturen beträgt im Durchschnitt 34 MB.

Die Szene ist herrlich und zeigt deutlich, welch realistische Darstellungen mit den Technologien des GeForce3 möglich wären. Leider wird die Szene viel zu langsam dargestellt. Der GeForce3 erreicht keine flüssigen Frameraten - die Szene ruckelt mit 25 fps über den Bildschirm. Ausserdem fällt die Framerate kontinuierlich, die Speicherleistung des GeForce3 reicht nicht, um Geometrie-, Textur- und Framebufferzugriffe schnell genug bewältigen zu können.

Uns ist leider nicht bekannt, wieviele Vertex Shader-Instruktionen Madonion für die Dymanik der Szenerie verwendet, Auskunft erteilte der Benchmark-Hersteller keine. Die erzielten Leistungsdaten verdeutlichen jedoch dass der GeForce3 mit derart intensiver Vertex Shader-Nutzung nur ca. 2,1 Millionen Polygone pro Sekunde verarbeiten kann. Um diese Szene flüssig (60 fps) darzustellen, wäre jedoch eine Leistung von 4,9 Millionen Polygonen pro Sekunde nötig, d.h. die Vertex Shader-Einheit müsste 2,3x schneller arbeiten können als jene des GeForce3. Eigentlich könnte  diese Szene dazu prädestiniert sein, auf der Xbox flüssig dargestellt zu werden. Die Geometrieleistung der Xbox liegt beträgt theoretisch das 2,5fache des GeForce3. 

Zukunft? Aquamark

Programm: Aquamark
Entwickler: Massive
Version: Version 1.1
Timedemo: integriert

Aquamark basiert auf der krass-Engine, welche im kommenden Unterwasser-Spektakel Aquanox zum Einsatz kommt. Die Grafik von Aquamark ist schlicht herrlich. Die speziellen Lichteffekte und die gefüllt wirkende Szenerie zeigt, welch tolle Möglichkeiten T&L, Pixel und Vertex Shadern den Entwicklern bieten, um atemberaubende 3D-Grafik in Echtzeit darstellen zu können. Aquamark veranstaltet eine regelrechte Polygonschwemme, die Polygonanzahl pro Frame schwankt zwischen 80'000 und 120'000, neuer Rekord für einen Spielebenchmark. Das Gelände und die Objekte werden mittels dynamischem LoD (Level of Detail) dargestellt, d.h. die Objektmodelle morphen sich von einem Detail-Grad zum nächsten, ohne dass Wechsel für den Spieler sichtbar ist. Andere moderne Engines können dies noch nicht. Nicht zuletzt nutzt die krass-Engine ausgefeilte Charakteranimations-Algorithmen (Skeletal-Animations), was realistischere und lebendiger wirkende Bewegungen der Charaktere erlaubt. Zuguterletzt versinken Teile der Landschaft in höhenabhängigem Nebel, der mittels Vertex Shadern realisiert wird. 

Die Aquanox-Macher sind dabei kein unbeschriebenes Blatt. Der Unterwasser-Klassiker "Schleichfahrt" stammt aus derselben Spieleschmiede.

Die Leistungsunterschiede zwischen dem Vorgänger GeForce2 ULTRA und dem neuen GeForce3 sind frapant! Nur der GeForce3 erreicht bei 640x480 annähernd die 60 fps, während sich GeForce2 ULTRA-Boards noch mit langsamen durchschnittichen 30 fps begnügen müssen. Interessant ist aber auch, dass die Engine bei den vorgegebenen Qualitätseinstellungen auch Bandbreiten-Limitiert ist. Die Framerate des GeForce3 fällt kontinuierlich von knapp 60 auf 30 fps.

Dass die GeForce2-Boards so schlecht abschneiden liegt daran, dass die krass-Engine für die Geometrieberechnungen (T&L) keine DX7 - Funktionen nutzt, sondern ausschliesslich CPU und Vertex Shader. D.h. die GeForce- und RADEON-Karten können ihre TNL-Einheiten nicht nutzen, die ganze Arbeit fällt an die CPU, während die DX8-TNL-Einheit des GeForce3 das Spiel in Hardware beschleunigt. Für die deutschen Entwicker waren die DX7 - Funktionen gemäss Unternehmenssprecher Alexander Jorias zuwenig flexibel und damit für Aquanox nutzlos. Zwar besänftigt Massive im FAQ zum Spiel, über die Aquamark-Benchmarkwerte liessen sich nicht unbedingt Rückschlüsse auf die Leistungsfähigkeit oder die Geschwindigkeit der krass-engine ziehen ("Der AquaMark ist ein Benchmark und keine AquaNox-Demo. Aus seinen Benchmarkwerten auf die Geschwindigkeit oder Leistungsfähigkeit der 3D-Engine zu schließen ist etwa so sinnvoll wie der Schluss von der Anzahl der Menschen in einem Fußballstadion auf deren Intelligenz."), doch dürften, auch wenn die Frameraten absolut vielleicht nicht die im Spiel erzielten Werte wiederspiegeln, die Verhältnisse bei den hier gewählten Qualitätseinstellungen (die sich im Benchmark nicht verändern lassen) ungefähr dieselben bleiben.

Wie erwartet, der GeForce3 übernimmt locker die Spitzenposition in diesem DirectX8-Benchmark. 

Zukunft? Dronez

Programm: Dronez
Entwickler: Zetha Games
Version: Version 1.0
Timedemo: integriert

Dronez ist ein modernes OpenGL-Spiel in Anlehnung an die virtuellen Diskus-Kämpfe im Klassiker Tron, dem ersten grösstenteils im Computer generierten Kinofilm. Dronez nutzt diverse NVIDIA-spezifische OpenGL-Extensions, wie beispielsweise Vertex Array Range beim GeForce2 sowie Vertex Program beim GeForce3. Ausserdem kann Dronez beim GeForce3 4 Texturen pro Pass auftragen.

Wir haben die von Zetha vordefinierten Profile zum Benchmarken geändert, da es nicht unser primäres Ziel ist, "die Vorteile der nFiniteFX Engine" aufzuzeigen, wie die Anleitung von Zetha Games beschreibt. Wir wählten überall die maximal möglichen Qualitätseinstellungen (32bit Texturen) und aktivierten die Texturkompression sowie trilineares Filtering.

Hässlich an diesem Spiel sind einzig die ewig dauernden Ladezeiten. Die uns vorliegende Rolling Demo von Dronez benötigt derzeit 256 MB Hauptspeicher, um die Unmengen an Texturen unterzubringen. Soll das Spiel wie geplant auf der Xbox erscheinen, steht den Entwicklern noch einiges Arbeit bevor.

Auch in den Maximal-Einstellungen wird klar, wo die Vorteile der nFiniteFX Engine liegen. Die CPU-Last wird deutlich reduziert, indem die GPU Berechnungen zur Charakteranimation sowie Vorberechnungen zum Bump Mapping übernehmen kann. Die Frameraten aller GeForce-Beschleuniger sind sehr gut, nur der GeForce2 GTS bricht wegen der hohen Texturlast ab 1024x768 massiv ein. Der GeForce3 bleibt immer schneller als sein Vorgänger, allerdings sind die Leistungsvorteile bei hohen Auflösungen gering. 

Zukunft? X-Isle

Programm: X-Isle Demo
Entwickler: Crytek.de
Version: Version 1.0
Timedemo: integriert

Die Crytek X-Isle - Demo basiert auf einer älteren Version, mittlerweile integrierten die Entwickler GeForce3-Support und nutzen neuere Features wie Pixel- und Vertex-Shader. Leider liegt uns die neue Version nicht vor. Die hier genutzte Demo nutzt aber dennoch GeForce3-Pixel Shading sowie Hardware TNL und Polygonmengen im Bereich von 80'000 pro Szene. Es ist fraglich wie aussagekräftig diese Resultate für das geplante Spiel "X-Isle: Dinosaur Island" sein werden. Gemäss Crytek ist die 3D-Engine noch mehrere Monate vor der Fertigstellung entfernt.

Der GeForce3 setzt sich um 14 bis 24% vom GeForce2 ULTRA ab. Der GeForce2 GTS wird in hohen Auflösungen noch stärker abgehängt, da die höhere Texturlast überproportional auf die Framerate drückt.

Profi-OpenGL: SPEC ViewPerf

Programm: ViewPerf 6.1.2
Entwickler: SPEC

Das OpenGL-API wird nicht nur für Spiele genutzt, sämtliche "professionelle" Applikationen basieren auf dieser Programmierschnittstelle. SPEC's ViewPerf nutzt einige Real-World-Daten zur Simulation der Leistung in CAD/CAM-Tools wie 3D Studio MAX oder Maya. Gemäss SPEC-Spezifikation wurden folgende Ergebnisse bei 1280x1024x32bit Desktop-Auflösung ermittelt. Nebst den erzielten Leistungen gilt der ViewPerf auch als guter Funktionscheck für den OpenGL ICD der Grafikkarte.

Der GeForce3 leistet als "Gamerboard" überall sehr gute Werte, wenn auch der GeForce2 ULTRA im Allgemeinen nicht übertroffen wird. 

Profi-OpenGL: Cinebench 2000

Programm: Cinema4D Cinebench 2000
Entwickler: Maxxon

Cinebench 2000 testet die Leistung mit der im Modellierungs-Programm Cinema4D enthaltenen 3D-Engine. Der Benchmark umfasst einen Wireframe-, Shading- und Texturing-Test.

Die Werte wurden bei einer eingestellten Desktop-Auflösung von 1024x768x32bit ermittelt.

Die Leistungsunterschiede zwischen den T&L-Karten sind hier eigentlich vernachlässigbar. Der GeForce3 ist nur minim schneller als eine GeForce2 GTS. 

Tech-Demo: Village Mark

Programm: Village Mark 1.15
Entwickler: Imagination Technologies

Village Mark gilt als Overdraw-Stresstest, indem neben enorm hoher Tiefenkomplexität auf Dreiecksebene auch diverse Texturlagen übereinandergelegt sind. Die 3 Textureinheiten des GeForce3 werden hier genutzt. Das Programm wurde von Imagination Technologies entwickelt, um die Vorzüge des KYRO zu demonstrieren. Entsprechend fehlt den Resultaten der Bezug zu realen Spieleengines.

Obwohl der GeForce3 tiefer getaktet ist als der GeForce2 ULTRA, kann er den GeForce2 ULTRA dank Lightspeed Memory Architecture (versucht, Overdraw zu reduzieren)  übertrumpfen. Bei gleichem Takt ist der GeForce3 bis zu 17% schneller.

Markant deutlicher sind die Vorteile beim Einsatz von TrueColor (32bit) - Rendering. Der GeForce3 liegt bis zu 32% vor dem GeForce2 ULTRA, bei gleichem Takt sogar bis zu 36%. Konsequenz: Die Lightspeed Memory Architecture bringt bis zu 40% Leistungsgewinn!

Im 1024x768er-Vergleich platziert sich der GeForce3 an die Spitze der traditionellen Rendering-Architekturen. Nur die KYRO - Beschleuniger liegt dank 8fachem Multitexturing sowie 100%iger Overdraw-Reduktion an der Spitze.

Tech-Demo: Treemark

Der Treemark ist eine von NVIDIA veröffentlichte Technologie-Demo zur Demonstration des Nutzens von DirectX 7 TNL. Die Demo wurde zeitgleich mit dem GeForce256 veröffentlicht und zeigt einen fein modellierten Baum mit einer variablen Anzahl Lichtquellen.

Die TNL-Leistung des GeForce3 in DirectX7 liegt ungefähr auf GeForce2 GTS-Niveau. Dies erstaunt nicht weiter, die DX7 TNL-Einheit des GeForce3 wurde von seinem Vorgänger übernommen.

Tech-Demo: 3D Mark 2001 High Poly Count

Der 3D Mark 2001 - Benchmark bietet auch einige ausgefeilte Feature-Tests, so beispielsweise der High Poly Count - Test, bei dem eine Million Polygone (!!!) pro Szene dargestellt werden. Im HighDetail-Modus werden 8 Lichtquellen genutzt, 1 gerichtetes Licht und 7 aufwendige Punktlichter für spekulare Beleuchtung.

Die Leistungswerte sind verständlicherweise unabhängig von der gewählten Auflösung, da keine Texturen eingesetzt werden und daher nur ein Rendering-Pass anfällt. Interessant aber erwartet war die Tatsache, dass die Beleuchtungseinheit des GeForce3 schwächer ausgelegt ist als jene des GeForce2 ULTRA. Durch den tieferen Takt und der unveränderten DX7-TNL-Einheit kann der GeForce3 in diesem Spezialfall die Leistung des Vorgängers nicht erreichen.

Tech-Demo: 3D Mark 2001 Vertex Shader

Speziell zur Vermessung der Vertex Shader-Leistung bietet der 3D Mark 2001 einen speziellen Modus an, in dem 100 mittels Vertex Shader animierte Spielfiguren dargestellt werden. Die Funktionen des Vertex Shader können im Gegensatz zu jenen des Pixel Shaders von der CPU übernommen werden.

Da die GeForce2-Grafikkarten keinen in Hardware integrierten Vertex Shader besitzen, übertrifft der GeForce3 hier wieder die Leistung seiner Vorgänger. Obwohl sich die 1,1 GHz-CPU zu 100% den Vertex Shader-Berechnungen widmen kann (was in echten Spieleszenarios nicht der Fall ist), setzt sich der GeForce3 um bis zu 14% ab. Die Hardware-Lösung ist somit ca. 15% schneller als die Softwareemulation auf einem 1,1 GHz Athlon. 

Killer-Feature Full Scene Anti Aliasing

Dass Full Scene Anti Aliasing ein Killer-Feature darstellt, mussten wir bereits in unserem Review der Voodoo 5 5500  feststellen. Massenweise CPU-limitierte Spiele, Flugsimulatoren, Autorennspiele sowie Weltraumballereien erfahren durch Full Scene Anti Aliasing einen enormen Optikboost, indem die hässlichen und meist über den ganzen Bildbereich wandernde Treppenstufen abgeschwächt oder fast gänzlich eliminiert werden können. Mittlerweile schlägt auch NVIDIA in diese Bresche und präsentiert mit dem GeForce3 ein herausragendes Full Scene Anti Aliasing-Verfahren, welches bezüglich Effizienz den bisherigen Supersampling-Verfahren überlegen ist. 

Obwohl aktuelle FSAA-Lösungen bezüglich der erreichten Qualität durchaus überzeugen, offenbaren sich speziell bei modernen Spielen die Leistungs-Defizite. 4faches FSAA bringt einen Leistungsverlust von bis zu 75% mit sich, flüssige Frameraten waren daher leider nicht immer möglich und beschränkten sich auf tiefe Auflösungen und 16bit Farbtiefe. Mit dem bisher verwendeten Supersampling sind bis auf weiteres keine leistungsmässigen Quantensprünge zu erwarten, schon gar nicht mit traditionellen Renderingarchitekturen. Das Zauberwort des GeForce3 heisst daher High Resolution Anti Aliasing. Dahinter steckt Multisampling-Technologie, ein kompliziertes und bisher nur auf teuren Workstation-Boards genutztes Verfahren, welches auch in hohen Auflösungen flüssige Frameraten zu liefern vermag.

Wie funktioniert Multisampling?

Im Gegensatz zum Supersampling des Voodoo 5, KYRO, RADEON und GeForce256/2 werden beim Multisampling nicht alle Subpixel mit unterschiedlichen Texturwerten versehen, sondern pro Pixel 1 Texturwert auf alle Teilpixel angewandt. 4faches Supersampling erforderte das Rendering von 4 kompletten Pixeln, inklusive Texturierung und Filtering jener Texturstellen. Das Multisampling-Verfahren beschränkt sich auf die Nutzung eines einzelnen Texturwertes für alle 4 Subpixel, die "Anti-Aliasing"-Wirkung beschränkt sich daher auf die Kantenglättung. Texturflimmern, welches bei Supersampling ebenfalls reduziert wird, bleibt mit Multisampling grundsätzlich unangetastet und muss für dieselbe Gesamtqualität durch besseres Texturfiltering kompensiert werden.

Der GeForce3 generiert für jedes Bild mehrere "Samples", d.h. jedes Pixel wird intern an mehreren Stellen abgetastet und geprüft, ob das Dreieck in den entsprechenden Bereich fällt. Der GeForce3-Chip kann dabei ohne Füllratenverlust pro Pixel bis zu 4 Samples erzeugen, d.h. bei aktiviertem 4X FSAA leistet der GeForce3 weiterhin theoretisch maximale 800 Millionen Pixel pro Sekunde, im Gegensatz zu anderen Grafikchips, deren Leistung mit FSAA sinkt. Jedes Subpixel wird dabei individuell schattiert (basierend auf der Dreiecksfarbe und Vertex Lighting), nutzt allerdings denselben Texturwert.

Folgende Illustration die Auswirkung einer unterschiedlichen Positionierung der Abtastpunkte: (2X)



fahren Sie mit der Maus über das Bild und sehen Sie das Resultat zweier unterschiedlicher Sampling-Positionen

Die beiden unterschiedlichen Positionen entsprechen dem GeForce3-Abtastungsmuster bei 2fachem Full Scene Anti Aliasing, d.h. das zweite Subpixel wird diagonal nach links oben verschoben (RG, Rotated Grid) erzeugt. Beachten Sie die unterschiedlichen Treppenstufen je nach Sample-Position.

Folgend die Wirkungsweise auf einem kompletten 3D-Bild



fahren Sie mit der Maus über das Bild und sehen Sie das Resultat zweier unterschiedlicher Sampling-Positionen (erzeugt mit FSAASim, Fullon3D)

Beachten Sie, dass die Texturwerte in dem Bild nicht verändert werden (gut zu sehen am Asphalt), nur die Kanten werden behandelt. Folgendes Differenz-Bild verdeutlicht, dass sich das Bild nur an den Rändern hat.

Überlagert man die beiden Teilbilder wird klar, dass das Dreieck an den Rändern in seiner echten Form besser erfasst wird, die Kante wird glatter und nähert die echte, schwarze Kante besser an. 

Die generierten Subsamples werden miteinander vermischt und erzeugen das neue, kantengeglättete Bild. Jedes Teilbild fliesst dabei zu 50% in die Vermischung mit ein, so dass schlussendlich ein neues Bild mit geglätteten Kanten resultiert. Wie genau diese Vermischung im GeForce3 implementiert ist, bleibt vorläufig unklar. Möglich wären "T-Buffer"-ähnliche Realisierungen mit dem Speichern mehrerer Teilbilder in derselben Auflösung - oder ein höher aufgelöstes Zwischenbild, wie es beim GeForce2 zum Einsatz kommt.



fahren Sie mit der Maus über das Bild und sehen Sie das Resultat der Vermischung zweier Bilder mit leicht unterschiedlichen Sampling-Positionen (erzeugt mit FSAASim)

Klar ist bisher lediglich, dass der GeForce3 für alle Subsamples die Bild- und Tiefeninformationen im Speicher ablegen muss, d.h. der GeForce3 benötigt gleich viel z-Buffer- und Framebuffer-Bandbreite und Speicherplatz wie der GeForce2, bei der Texturspeicherbandbreite wird jedoch nur die Hälfte (2X FSAA) bzw. nur ein Viertel (4X FSAA) davon benötigt, womit die deutlich gesteigerte FSAA-Leistung des GeForce3 begründet ist.

Positionierungsdurcheinander 

Bei der Kantenglättungsqualität von Full Scene Antialiasing ist nicht nur die Anzahl Subpixel, sondern insbesondere deren Positionierung enorm wichtig für das Endresultat. 3dfx erreichte mit 2 Subpixeln dank gedrehtem Positionierungsraster (Rotated Grid; ab jetzt "RG") in vielen Fällen die Qualität von 4fachem Anti Aliasing mit regulärem Abtastungsgitter. Denselben Weg geht NVIDIA mit dem Multisampling Full Scene Anti Aliasing, indem das Abtastungsgitter um 45° gedreht wird.

An den roten Punkten wird jeweils auch ein Texturwert gelesen und gefiltert. Beim GeForce3 wird der in der Mitte gelesene Texturwert auch für das blaue Subpixel genutzt, während Geforce2 und Voodoo 5 jeweils zwei verschiedene Texturwerte lesen (müssen). 

Während beim GeForce2 die beiden Abtastungspunkte auf einer horizontalen Gerade liegen (und dadurch annähernd horizontale Kanten nur sehr schlecht glätten), sind die Subpixel beim Voodoo 5 und beim GeForce3 in der Achse leicht verschoben. Beim Voodoo 5 liegen sie ca. 35° geneigt innerhalb des Pixels, beim GeForce3 wird ein Subpixel im Zentrum des Pixels generiert und ein weiteres an der oberen linken Ecke. Die GeForce3-Positionierung ergibt eine Drehung des Rasters um 45°, was zwar für 2 Subsamples nicht ganz ideal ist, sich in der Praxis aber kaum von den 35° des Voodoo 5 unterscheiden dürfte.

Folgende Grafik konkretisiert die Wichtigkeit der Positionierung der Samples innerhalb des Pixels. 

Die erste Illustration zeigt, wie das Dreieck auf dem Bildschirm aussehen würde, wenn kein FSAA aktiviert ist. Plötzlich wechselt die Farbe abrupt vom einen Pixel zum nächsten, der bekannte und störende Treppeneffekt.

Während das 2x FSAA des GeForce2 bei dieser Kante gerade mal einen Pixel mit einer Mischfarbe einfärben kann, gelingt dies dem GeForce3 bereits mit 5 Pixeln, was zu einer natürlicheren und besseren Glättung der Kante führt. Beim GF2 fallen fast alle Subpixel entweder in den schwarzen Bereich, oder dann abrupt in den weissen Bereich, so dass eine sinnvolle Interpolation kaum möglich ist. Beispiele dieser Art lassen sich sehr einfach konstruieren und beobachten, da diese Fälle bei allen Kanten auftreten, die annähernd horizontal bzw. vertikal liegen. Bei stark geneigten Kanten ist die Positionierung weniger relevant, da bei diesen Kanten wegen den kürzeren Treppenabständen sowieso weniger Pixel zur Interpolation zur Verfügung stehen.

Festzuhalten bleibt an dieser Stelle, dass nur ein gedrehtes Abtastungsmuster eine optimale Verteilung der Schattierungen erlaubt. Um die Qualität nun weiter zu verbessern, müssen weitere Subpixels genutzt werden, so dass mehr als nur 1 Zwischenschattierungsfarbe möglich wird.

Qunincux™, der Wischi-Waschi-Modus 

Interessant ist nun der spezielle Quincunx™-Modus, der für das Endbild 5 Subpixel miteinander vermischt, jedoch immer noch nur 2 eigene Subpixel pro Pixel berechnet und daher weiterhin in die Kategorie des 2X FSAA gehört.

Für 2X Quincunx™ Full Scene Anti Aliasing (der komische Name stammt vom Muster, welches tatsächlich so heißt und auch auf jedem Würfel zu finden ist) mit einem 5tab Filter werden die Randsubpixel der benachbarten Pixel mit in die Filtering-Berechnung für den Endpixel mit einbezogen. Da hier 3 der 5 Subpixel recycelt werden, führt dieses Verfahren zu einem Überfiltern ("Blurring" im Klartext) der Kanten sowie der Texturen. Man kann argumentieren wie man will, generell gilt Überfilterung als unschöne Lösung. Da keine neue Information über das Bild berechnet wird, kann das Bild theoretisch  auch nicht besser aussehen. Allerdings können solche Filter unter gewissen Umständen trotz der Nebenwirkung des "verwaschenen Look" auch zu einem positiveren Endergebnis führen, wie beispielsweise der nachgeschaltete "22bit"-Filter des Voodoo 3 belegt. Auch auf Kantenebene kann das überfilterte Quincunx™-2X RGMS des GeForce3 unter Umständen besser aussehen als gewöhnliches 2X RGMS. Mit dem 5tab-Filter werden jedoch auch die Texturen überfiltert, was gemeinhin nicht sehr beliebt ist. Wer sich an diesem Blurring stört, kann sich auf den zuvor beschriebenen 2X Kantenglättungsmodus mit 2tab-Filter beschränken, NVIDIA bietet beide Betriebsmodi in den Treibern an.


NVIDIA - Treibermenü: Quincunx = 2x + Filter

Qualitätsmäßig liegt NVIDIA's 2X und 2X Quincunx Anti Aliasing recht nahe an der Kantenglättungsqualität des üblichen 2x2-Modus (4X) des GeForce2, der Leistungseinbruch liegt jedoch noch unterhalb jenes des 1x2-Modus (2X) des GeForce2. Die Leistung des Quincunx™-Modus ist dabei etwas schlechter als jene des reinen 2X-Modus, da der Chip für die Vermischung 3 zusätzliche Pixel aus dem Speicher lesen muss, bevor das neue Pixel generiert werden kann. 

4faches Full Scene Anti Aliasing 

Ältere, weniger fordernde Spiele erlauben auch den Einsatz von 4fachem Full Scene Anti Aliasing, ohne dass die Spielepartie dabei zur Ruckelorgie verkommt. Der GeForce3 bietet gemäss Marketingdokumentation auch 4faches Multisampling an, jeweils ohne Blurring mit einem 4tab-Filter sowie mit Blurring mit einem nachgeschalteten 9fach-Filter. Letzteres ist zum Testzeitpunkt mit den vorliegenden Detonator-Treibern noch nicht in den Treibermenüs implementiert.

Im Gegensatz zum 2X - Modus ist das 4X FSAA des GeForce3 nicht mehr "Rotated Grid", sondern lediglich "Moved Grid" und daher qualitativ auf Kantenebene nicht besser als das 4fache FSAA des GeForce2. 

Wie die Grafik zeigt, bringt der Wechsel zu 4X bei dieser Kante kaum etwas, gerade mal ein zusätzlich anders schattierter Pixel wird eingefügt, wobei die doppelte Arbeit anfällt. Besser wäre 4faches FSAA mit gedrehtem Abtastungsmuster.

Wie beim 2X-Modus bietet der GeForce3 auch bei der 4X-Variante einen "Quincunx"-Mode an, der einen 9tab-Filter nutzt.

Beim Berechnen des Endpixels werden jeweils die Randsubpixel der benachbarten (zuvor berechneten) Pixel mit eingerechnet, d.h. im 4X Quincunx-Mode werden pro Pixel 9 Subpixel gelesen und 4 Subpixel berechnet. Pro Pixel wird dabei nur 1 Texturwert gelesen und gefiltert. Dieser wird auf alle 4 berechneten Subpixel angewandt. Durch das zusätzliche Blurring kann wie bei der 2X-Methode der subjektive Eindruck besserer Kantenglättung entstehen, in Wirklichkeit sind im Bild jedoch nicht mehr Informationen enthalten als im normalen 4X-Modus. 

Und was ist mit Texturflimmern? 

Der Vorteil von Multisampling ist zugleich sein Nachteil. Da das Verfahren denselben Texturwert auf alle Subpixel anwendet, erreicht man damit trotz gleichbleibender Kantenglättungsqualität massiv höhere Frameraten. Texturspeicherbandbreite wird gespart, was sich speziell bei TrueColor-Rendering enorm positiv bemerkbar macht. Gleichzeitig werden jedoch gewisse Aliasing-Artefakte, welche beim Supersampling reduziert werden, nicht behoben.

So hat das Multisampling des GeForce3 keinen Einfluss auf die Texturen, d.h. das speziell in Spielen mit weiten Sichtfeldern (z.B. Flugsimulationen) das lästige Texturflimmern nicht verbessert wird. Dieses Manko lässt sich individuell durch den Einsatz besserer anisotropischer Filterung (8tab, 16tab, ...) kompensieren, doch dann muss man weitere Leistungseinbrüche akzeptieren. 

Generell finden wir Multisampling-Lösungen den heute üblichen Supersampling - Verfahren überlegen, sofern der Chip gleichzeitig gute Filtering-Algorithmen zur Wahl stellt. Durch die getrennte Einstellungsmöglichkeit von Texturfiltering und Kantenglättungsqualität lassen sich die Features individueller auf die eigenen Bedürfnisse und die jeweiligen Erfordernisse der Spiele anpassen. 

Qualitätsrangliste

Die erzielte Qualität der verschiedenen Full Scene Anti Aliasing ist immer wieder Anlass für längere Diskussionen. Dabei wird meist auf Screenshots zurückgegriffen, wobei diese auch durch unterschiedliche Texturfilter verfälscht sein können. 

Grundsätzlich lässt sich die FSAA-Qualität in zwei Bereiche unterteilen:

a) Kantenglättungs-Qualität 
und

b) Reduktion von Pixelflimmern

Die Rangliste in den einzelnen Teilsegmenten gestaltet sich wie folgt:

a) Kantenglättung

1) 16X SuperScene Multisampling (3D Labs)
2) 4X T-Buffer Rotated Grid Supersamling (V5) 
3) 4X Quincunx Multisampling (GeForce3)
    4X Ordered Grid Super Sampling 2x2 (GeForce2, KYRO, RADEON)
4) 2X T-Buffer Rotated Grid Supersampling (V5) und 2X / 2X Quincunx Full Scene Anti Aliasing (GeForce3)
5) 2X Ordered Grid Super Sampling 1x2 (GeForce2, KYRO, RADEON)

Ob "Blurring" von Szenen nun gut oder schlecht ist, möchten wir an dieser Stelle nicht weiter erörtern, weshalb wir die verschiedenen 2X und 4X-Varianten von NVIDIA nicht weiter unterschieden haben.

b) Texturflimmern

1) 4X T-Buffer Rotated Grid Supersamling (V5) und 4X Ordered Grid Super Sampling 2x2 (GeForce2, KYRO, RADEON)
2) 2X T-Buffer Rotated Grid Super Sampling (V5) und 2X Ordered Grid Super Sampling 1x2 (GeForce2, KYRO, RADEON)
3)
16X SuperScene Multisampling (3D Labs), 
    2X/4X Full Scene Anti Aliasing  (GeForce3)

FSAA mit MDK2

Das erste Spiel, welches wir dem umfassenden FSAA-Test unterzogen, ist MDK2. 

Der GeForce3 verliert mit 4X OGMS bis zu 93% seiner Leistung. Interessant ist hier eindeutig der 2X RGMS-Modus, der optisch kaum vom 4X-Modus zu unterscheiden ist. Bei 1024x786 verliert der GeForce3 nur 11% seiner Leistung, wobei die erzielte Kantenqualität vergleichbar mit jener bei einer Auflösung von 2048x1532 ist.

Deutlich auch zu sehen, dass der Quincunx-Filter bei 1024x768x32 weitere 22% der Leistung kostet, Leistung, die unserer Meinung besser in anisotropisches Filtering investiert wird.

Deutlich zu sehen die krassen Leistungsunterschiede mit aktiviertem FSAA. Multisampling ist deutlich schneller als Supersampling, bei ähnlicher Kantenglättungsqualität.

FSAA mit MBTR

Rennspiele gelten seit jeher als ideales Einsatzgebiet für Full Scene Anti Aliasing, da die am Horizont und an den Karossen sichtbaren Kantenstrukturen stark störend wirken. Entsprechend vermassen wir MBTR mit dem neuen GeForce3-Feature:

Schön zu sehen, dass er GeForce3 bis 1024x786 kaum Leistung verliert, mit keinem der FSAA-Modi. Leider liefert MBTR keinen (angeglichenen) Tiefstwert zurück, denn der Eindruck bei den höheren Auflösungen täuscht klar. Trotz durchschnittlichen 40 fps bei 1280x1024 gibt es während dem Benchmarkablauf immer wieder entscheidende Ruckler, welche bei 1024x768 nicht auftreten. Spielen mit FSAA bleibt daher bis und mit 1024x768 eine Option.

Ähnliches Leistungsverhalten zeigt sich mit aktiviertere 16bit-Grafik, wobei der GeForce3 noch weniger Leistung verliert. Doch auch hier zeigen sich in den höchsten Auflösungsstufen teilweise starke Ruckler, möglicherweise verursacht durch Texturswapping.

Speziell beim Einsatz von TrueColor gewinnt der GeForce3 das Rennen gegen die Supersampling-Konkurrenz.


Vergleichen Sie selbst! (PNG, 5120x768)
(v.l.n.r: 2X RGMX, 2X Quincunx, 4X OGMS, 4X OGSS, 2X RGSS, 4X RGSS)

Sehen Sie die Wirkung der Modi auf die Texturen im Detail (4X ZOOM aus 1024x768x32bit):

Qunincux verschmiert als einziges Verfahren die hochauflösenden Texturen der Trucks. 

Sehen Sie nun die Wirkung der einzelnen Verfahren auf die Kanten:

Die 2X RG-Verfahren (Rotated Grid) erreichen fast die Qualität der 4X - Methoden. 

FSAA mit NASCAR Heat

NASCAR Heat arbeitet beim GeForce3 ohne FSAA vollständig am CPU-Limit - ein ideales Szenario, FSAA und bessere Texturfilter dazuzuschalten.

Die 2X-Modi lassen sich ohne Geschwindigkeitsverlust betreiben, der 4X-Modus macht sich erst bei 1280x1024 bemerkbar (-30%), die Frameraten bleiben jedoch über 40 fps.

FSAA scheint mit allen Boards möglich, bei denen mehr als durchschnittliche 40 fps geboten werden. Der GeForce3 liefert diese Leistung in allen Qualitätsstufen.


Vergleichen Sie selbst! (PNG, 5120x768)
(v.l.n.r: 2X RGMX, 2X Quincunx, 4X OGMS, 2X RGSS, 4X RGSS)

Damit Sie die Qualität der Verfahren etwas besser einschätzen können, folgend einige gezoomte (4fach) Ausschnitte aus dem Spiel:

Im 4fach-Zoom wird die Unschärfe des Quincunx ersichtlich. Doch auch beim Voodoo 5 sind die Texturen unschärfer, was auf standardmässig konservative LOD-Settings zurückzuführen ist.

Die Kantenglättung der einzelnen Verfahren ist ähnlich, das 4fache OGMS scheint kaum besser als das 2X RGMS-Verfahren. 4X RGSS hebt sich vom Rest allerdings ab. 

FSAA mit Descent3

Descent3 ist ein älteres DirectX6-Spiel, welches ohne FSAA Frameraten im 150 fps-Bereich liefert. Das ist im Normalfall "zu viel", da selbst die Tiefstwerte über den 60 fps liegen. Der Einsatz von FSAA bietet sich an.

Hier verliert der GeForce3 überraschend viel seiner Leistung, bleibt aber dennoch bis 1024x768 über den 60 fps. Interessanterweise ist der 2X Quincunx - Modus langsamer als der 4X-Modus, offenbar kostet das Filtering der 5 Pixel hier mehr Leistung als das Schreiben von 4 Subpixeln ohne Filtering.

Fast an der Spitze: Der GeForce3 liefert mehr als 60 fps mit 2X FSAA, die Tiefstwerte liegen um die 40 fps.

FSAA mit Need for Speed: Prosche

Rennspeile wie The Need for Speed profitieren viel mehr von Full Scene Anti Aliasing als schnelle Action-Shooter des Typs Quake 3. Mit FRAPS vermassen wir den Rennspielknüller NFS Porsche mit den verschiedenen FSAA-Modi.

Auch hier zeigt sich, dass der Quincunx-Filter mehr Leistung verschlingt als erwartet. 2x Quincunx ist gleich schnell wie 4X FSAA. Probehalber aktivierten wir in der Registry den 4x Quincunx-Modus, der noch nochmal deutlich langsamer ist, aber keinen optischen Vorteil mehr bietet.

Der NVIDIA-Beschleuniger liefert die besten Frameraten mit aktivertem FSAA. Optisch ist die erreichte Qualität der einzelnen Chips jedoch nicht ganz vergleichbar. 


Vergleichen Sie selbst! (PNG, 5120x768)
(v.l.n.r: 2X RGMX, 2X Quincunx, 4X OGMS, 2X RGSS, 4X RGSS)

Um 4faches Quincuxx in der Praxis von 2fachen Quincuxx zu unterscheiden, braucht man schon sehr gute Augen - der nachgeschaltete Filter dominiert die Wirkung und verwischt die wenigen Zusatzstufen, welche 4X OGMS gegenüber 2X RGMS einfügt. 

Anisotropisches Filtering

Texturfiltering stellt weiterhin ein wichtiges Feature in der 3D-Grafik dar. Während die ersten 3D-Boliden anno 1995 noch mit bilinearem Filtering aufwarteten, gehört einfaches anisotropisches Filtering mit 8 Texturwerten mittlerweile zum State-of-the-Art. 

Im GeForce3 implementierte NVIDIA nun erstmals fortgeschrittenes anisotropisches Filtering, das seinem Namen auch gerecht werden kann. Der GeForce3 kann bis zu 64 Texturwerte lesen (64tab). Die Zugriffe erfolgen dabei aus verschiedenen MIP-Maps ("anisotropisch trilinear") im Gegensatz zum RADEON, der zwar auch 64 Texel lesen kann, jedoch trilineares Filtering nicht im Zusammenhang mit anisotropischem Filtering nutzen kann.

Das Problem mit dem anisotropischen Filtering des GeForce3 ist, dass es sich nicht in allen Treibern aktivieren lässt und wenn, dann nur über einen Registry-Hack. In der Treiber-Version 11.01 findet sich im Registry-Pfad für das erzwingen des anisotropischen Texturfilters unter OpenGL unter:

HKEY_LOCAL_MACHINE \ System \ CurrentControlSet \ Services \ Class \ DISPLAY \ 0000 \ NVidia \ OpenGL

der Schlüssel "DefaultLogAniso"=dword:0000000X, wobei "X" für einen Wert zwischen 0 und 3 steht und die Potenz ausdrückt, welche die Anzahl Texturwerte ergibt, welche gelesen werden (2x=Anzahl Texel pro Textur).

X-Wert Anzahl Texel
0 8 (kein anisotropisches Filtering, trilineares Filtering)
1 16 (8fach anisotropisch pro MIP MAP)
2 32  (16fach anisotropisch pro MIP MAP)
3 64  (32fach anisotropisch pro MIP MAP)

Auch unter Direct3D lässt sich anisotropisches Filtering aktivieren, allerdings nur bei den Treibern der Version 11.01 erzwingen. Der Schlüssel zum Erzwingen des Filters findet sich unter:

HKEY_LOCAL_MACHINE \  System \ CurrentControlSet \ Services \ Class \ DISPLAY \ 0000 \ NVidia \ Direct3D

und lautet:

"FORCEANISOTROPICLEVEL"=dword:0000000X

Für X gelten dieselben Regeln wie unter OpenGL.

Hoffentlich behebt NVIDIA demnächst die mangelnden Optionen in den Treibern, diese Einstellungsmöglichkeiten dürften sich vom Treiberteam innert wenigen Stunden in die Treiber integrieren lassen  und würden obigen Murks über die Registry ersparen. 

Klar wird, dass der GeForce3 beim Einsatz von anisotropischem Filtering viel seiner Leistung verlieren kann. Mit 64tab anisotropischem Filtering ist das Boards nur halb so schnell wie mit trilinearem Filtering. Es ist nicht ganz klar, wie anisotropisches Filtering beim GeForce3 implementiert ist, wir vermuten, der Baustein benötigt zusätzliche Taktzyklen für jede weitere Stufe. Dies kumuliert sich mit der zusätzlich benötigten Speicherbandbreite und ergibt einen deutlich höheren Leistungsverlust, als beispielsweise beim RADEON messbar ist. Allerdings ist das anisotropische Filtering des GeForce3 eine Augenweide, speziell das 32tab- und 64tab-anisotropische Filtering. 


Klicken für Vollbild (4096x768, PNG) 

Im Detail-Zomm wird ersichtlich, wieso dieses GeForce3-Feature die Bildqualität derart massiv verbessern kann.


Anisotropisches Filtering: Wie aus einem Pixelbrei plötzlich Strukturen sichtbar werden

Statt langweiligem Pixelbrei liefert der GeForce3 hochwertige Texturstrukturen. Der Baustein ist der erste Consumer-Chip, der hochwertiges und korrekt funktionierendes anisotropisches Filtering implementiert. Interessanterweise bleibt dieses Feature beim NVIDIA-Marketing aussen vor und wird wohl daher auch kaum in den Testberichten beachtet.

Optik-Verwöhnte werden anisotropisches Filtering zusammen mit FSAA einsetzen wollen. Ist der GeForce3 dafür schnell genug?

 

Die den maximalen anisotropischen Filter gehen bis zu 56% der Leistung verloren. 2X RGMS kostet weitere 10% Leistung, dennoch liefert der GeForce3 in MDK2 satte 60 fps. Mit 4X OGMS und 64tab anisotropic Filtering bricht die Leistung um ca. 73% ein, womit wir bei einem Leistungsverlust wären, der ungefähr dem 4X Supersampling entspricht.

Overclocking

Zum Schluss gaben wir den Boards noch die Sporen - Overclocking! Da beide Boards Vorserienmuster sind, lassen sich noch keine Angaben über das endgültige Overclocking-Potential geben.

Wenn auch die Gewinne sind bei MDK2 relativ bescheiden ausfallen, der erhöhte Speichertakt setzt sich hier zu 100% um. Bei 250 MHz Core-Takt (+25%) und 265 MHz Speichertakt (+15%) gewinnt man 15% Leistung. 

Der ultimative Stress-Test - die 3D Mark Nature-Szene - gewinnt insbesondere durch die Erhöhung des Chiptakts, wodurch die Geometrieleistung in die Höhe getrieben wird. Eine Erhöhung des Chiptakts um 20% ergab hier bis zu 19,2% bessere Frameraten.

Fazit

NVIDIA did it again. Nach dem GeForce256, dem GeForce2 GTS, dem GeForce2 ULTRA wirft man mit dem GeForce3 einmal mehr ein unangefochtenes Spitzenprodukt auf den Markt, das allen anderen Mitbewerbern bezüglich Features und vor allem Leistungsfähigkeit überlegen ist. Erfreulich dabei ist, dass die in den vergangenen Jahren steil nach oben gerichtete Preiskurve für High-End-Beschleuniger nun endlich wieder nach unten zeigt, auch wenn die geforderten 900 Mark (Strassenpreis Mai 2001) für einen derartigen High-End-Beschleuniger immer noch für viele unerschwinglich bleiben werden. Das bessere Preis-/Leistungsverhältnis wurde diesmal durch effizientsteigernde Massnahmen (Lightspeed Memory Architecture) ermöglicht, so dass für die Steigerung der Leistung auf noch exotischeren und teureren Speicher verzichtet werden konnte. 

May Payne, Unreal 2 und X-Isle: Dinosaur Island sollen einst die neuen Features nutzen - wann und ob diese Spiele erscheinen, ist noch unklar

Dem Vorurteil, man könne das Potential des GeForce3 mangels DX8-Spielen nicht nutzen, stimmen wird dagegen überhaupt nicht zu, im Gegenteil. Der GeForce3 ist das NVIDIA-Produkt, mit dem bei seiner Einführung bisher grössten Praxisnutzen. Damit ist weder einer der integrierten  Shader-Prozessoren angesprochen, noch andere hippige DirectX8-Features. Das Multisampling des GeForce3 ist eines der besten Features des Bausteins, da es direkten Nutzwert für den Endkunden liefert. Kantenglättung gilt als eines der wichtigsten Features zur Verbesserung der 3D-Optik, schön zu sehen, dass NVIDIA dieses Problem gezielt mit dem GeForce3 angegangen ist. Im Gegensatz zu Vertex Shadern, Freiformflächen und Pixel Shadern benötigt das Full Scene Anti Aliasing keinerlei Spieleunterstützung und lässt sich bei den meisten Spielen sofort aktivieren, oft sogar ohne Leistungseinbruch. Besonders der 2X-Modus dieses "High Resolution Anti Aliasing" erscheint uns interessant, bietet dieser dank der Drehung des Abtastungsrasters annähernd "4X"-Qualität bei einem Leistungseinbruch, der weit unter jenem des üblichen 2X Supersampling liegt. Die 4X-Verfahren sind durch den schnelleren Multisampling-Ansatz zwar ebenfalls interessant, bieten dabei aber, wenn überhaupt, nur geringfügig bessere Qualität gegenüber dem 2X-Verfahren. 


4x4 Evoluiton: Spezialeffekte mit Pixel- und Vertexshader

Vor allem, da das Anti Aliasing des GeForce3 seine Wirkung nicht innerhalb der Dreiecke entfaltet, würde auch das qualitativ hochwertige und wichtige anisotropische Filtering den GeForce3 auszeichnen. Damit liessen sich sowohl Texturflimmern wie auch verwaschener Look aus den Spielen verbannen, doch angesichts des mangelhaften Treiberkomforts zum aktuellen Zeitpunkt muss NVIDIA diesbezüglich ganz klar nachbessern. Steinzeitromantik mit Windows-Registry-Hacks sind sicher nicht das, was der Käufer von einer 900-Mark-Grafikkarte erwartet und uns erscheint schleierhaft, wieso NVIDIA dieses wichtige Feature nicht in die Treibertabs integriert, denn die Features funktionieren, sie werden dem 0815-Kunden jedoch komischerweise vorenthalten. Die Treiberoptionen schlagen das Produkt klar unter dem Wert, mit nur geringem Aufwand (1 Nachmittag?) seitens des Treiberteams ließe sich aus einer GeForce3-Karte deutlich mehr herausholen, so zum Beispiel erzwingbares anisotropisches Filtering unter Direct3D, optionales Supersampling statt Multisampling, standardmässig aktivierter S3TCQuality-Fix und generell bequemere Benutzerführung in den doch immer noch etwas fummeligen Menüs. 

Insgesamt scheint der GeForce3-Chip jedoch gelungen und ausgewogen. Zwar existiert generell Verbesserungspotential bei Leistungsfähigkeit des Vertex Shaders und der Effizienz des anisotropischen Filtering, doch die allgemeine Effizienzverbesserung durch die Lightspeed Memory Architecture, die neuen Features und den angesprochenen Nutzwert durch FSAA machen den GeForce3 deutlich attraktiver und abgerundeter als beispielsweise den GeForce2 ULTRA, der nur durch seine Basis-Geschwindigkeit in älteren Spielen überzeugen kann. 

Die beiden hier vorgestellten GeForce3-Produkte decken bereits die meisten Bedürfnisse ab. Einen TV-Ausgang bieten die Karten aller Hersteller, die Unterschiede liegen in der weiteren Hard- und Softwareausstattung. Spielevollversion oder DVI-Anschluss und BlueOrb-Lüfter, so lautet die Qual der Wahl zwischen der 3D Prophet III und der GLADIAC 920. Leistungsmäßig sind beide Karten ansonsten gleichwertig einzustufen. 

Links

 

Grafikkarten mit GeForce3-Baustein

Produkt Hersteller  Speicher TV-Out DVI Besonderes
GLADIAC 920 ELSA 64 MB DDR 3.8 ns + - Mouse Pad, Giants Vollversion
3D Prophet III Hercules 64 MB DDR, 3.8 ns  + + Blaues PCB, Blue Orb, Sticker
GeForce3 Visiontek 64 MB DDR 3.8 ns + -  
GF-3000 Gigabyte 64 MB DDR + -  
Pixelview XX-Player Prolink 64 MB DDR, 3.8 ns + -  
Winfast GeForce3 Leadtek 64 MB DDR, 4ns + + silberne Kühlkörper, Mouse Pad, Handauflage, Spiel
GeForce3 PowerPack III Gainward 64 MB DDR 3.8 ns + + rotes PCB / Kühler
Starforce 822 MSI 64 MB DDR + -  

nächste Seite

nächste Seite

Inhaltsverzeichnis
Teil 1: Weggefegt
Teil 2: Die Basisarchitektur
Teil 3: Logik konzentriert
Teil 4: 200 statt 250 MHz
Teil 5: Vertex Shader à la GeForce3
Teil 6: Grundgerüst für die Zukunft
Teil 7: Moore's Law Cubed
Teil 8: DirectX 8 Features
Teil 9: Die Produkte: ELSA GLADIAC 920
Teil 10: Die Produkte: Hercules 3D Prophet III
Teil 11: Testsystem
Teil 12: DirectX 7: Ultima 9
Teil 13: DirectX 7: Evolva
Teil 14: DirectX 7: MBTR
Teil 15: DirectX 7: Test Drive 6
Teil 16: DirectX 7: Motocross Madness 2
Teil 17: DirectX 7: Unreal Tournament
Teil 18: DirectX 7: Giants: Citzen:Kabuto
Teil 19: DirectX 7: Need for Speed: Porsche
Teil 20: DirectX 7: Colin McRae Rally 2.0 Demo
Teil 21: DirectX 6: Expendable
Teil 22: DirectX 6: Re-Volt
Teil 23: DirectX 6: Descent 3
Teil 24: Zukunft? GLMark v1.1
Teil 25: Zukunft? 3D Mark 2001
Teil 26: Zukunft? Aquamark
Teil 27: Zukunft? Dronez
Teil 28: Zukunft? X-Isle Demo
Teil 29: Profi-OpenGL: SPEC ViewPerf 6.1.2
Teil 30: Profi-OpenGL: Cinebench 2000
Teil 31: Tech-Demo: Village Mark 1.17
Teil 32: Tech-Demos TreeMark / 3D Mark High Poly / Vertex Shader
Teil 33: Killerfeature Full Scene Anti Aliasing
Teil 34: Wie funktioniert Multisampling
Teil 35: Positionierungsdurcheinander
Teil 36: Quincunx, der Wischi-Waschi-Modus
Teil 37: 4faches FSAA
Teil 38: Was ist mit Texturflimmern / Qualitätsrangliste
Teil 39: FSAA mit MDK2
Teil 40: FSAA mit MBTR
Teil 41: FSAA mit NASCAR Heat
Teil 42: FSAA mit Descent3
Teil 43: FSAA mit Need for Speed Porsche
Teil 44: anisotropisches Filtering

Teil 45: Overclocking

Teil 46: Fazit, Links & Liste mit Karten mit GeForce3 - Chip


Hier könnte Ihre Werbung stehen!

Click Here!


Alle bei 3D Concept erscheinenden Newsmeldungen und Artikel sind urheberrechtlich geschützt. Die Weiterverarbeitung und Verbreitung ist nur mit ausdrücklicher Genehmigung von 3D Concept erlaubt. Die jeweiligen Produktenamen sind eingeschriebene Wahrenzeichen und Handelsmarken der jeweiligen Hersteller. Copyright © by 3D Concept. Letzte Änderung 13. Mai 2001