| Hercules 3D Prophet III
/
ELSA
GLADIAC 920 /
GeForce3 - Review (1/46)
" M a c h t
i n d e r 3 . G e n e r a t i
o n "
Weggefegt
[Von Raphael Auf der Maur, Mai 2000]
57 Millionen
Transistoren, 800 Milliarden Operationen pro Sekunde, 3.8
Gigatexel Füllrate - die Eckdaten des neuen GeForce3 sind
überwältigend. 3D Concept verrät nun die kompletten Details zur
neuen Chipgeneration. Im Test befanden sich die neuen Pixelraketen
von ELSA und Hercules.
NVIDIA
blickt auf
die
erfolgreichsten Phasen der Firmengeschichte zurück. Nach
anfänglichen finanziellen Problemen, ausgelöst durch das Desaster mit dem
ersten Multimedia-Chip (NV1), folgten die Erfolge Schlag-auf-Schlag. Riva128,
Riva128 ZX, TNT, TNT2, GeForce256, GeForce2 GTS und zuletzt
GeForce2 ULTRA - so heißen die Erfolgsbringer der Kalifornier,
welche in verlässlichem 6-Monats-Zyklus das Licht der Welt
erblickten.
Speziell mit den neuen GeForce-Beschleunigern fegte NVIDIA den
Chipmarkt leer wie kein anderer zuvor. Features en Masse und meist
unangefochtene Leistungswerte brachten den Hersteller aber nicht nur
finanziellen Erfolg. Diverse Chipschmieden, darunter 3dfx und S3,
strichen angesichts des brutal schnellen Entwicklungstempos die
Segel. ATI sucht weiterhin nach einer Strategie, wie, wann und ob man denn nun
wirklich konsequent gegen NVIDIA antreten soll, und warf dabei die jüngsten
High-End Projekte (RADEON MAXX, RADEON SE) wieder über Bord. Matrox
seinerseits konzentriert seine Kräfte lieber auf den grösseren und
lukrativeren Business-Markt, statt sich mit 20 anderen NVIDIA -
Kartenherstellern einen verbitterten Kampf um Retail-Marktanteile
zu leisten.
Dennoch lauert die
Konkurrenz, auf der faulen Haut hocken darf selbst der
Marktführer nicht. NVIDIA's Image als Performance- und
Leistungsträger sowie als einer der Technologieführer am Markt
will aber weiterhin verteidigt sein, denn mit dem Erscheinen von
ATIs RADEON ist man bezüglich Technologie ins Hintertreffen
geraten. Imagination Technologies lauert mit grundsätzlich
effizienterer Technologie im Hinterhalt, und die finnischen Bitboys sind mit
einem eDRAM-Projekt in einem fortgeschrittenen Stadium.
Fortschritt ist somit gefragt, die aktuelle GeForce-Technik lässt
sich nicht weiter melken, sie ist mit dem Geforce2 ULTRA bis
zum Exzess ausgereizt.
Mit dem neuen GeForce3-Baustein
führen die 3D-Spezialisten erstmals seit dem 1999 lancierten GeForce256 eine
brandneue Hardware-Architektur ein. Wir trennen für Sie die Spreu
vom Technik-Weizen und sagen Ihnen, welchen Hardware-Funktionen des 76
GFLOPS-Chips Sie wirklich Beachtung schenken sollten.
Basisarchitektur
Der GeForce3 integriert 4
parallele Rendering-Pipelines, d.h. pro Taktzyklus kann der Chip 4 Pixel
gleichzeitig schattieren und texturieren. Jede Pipeline
verfügt über 2 Textureinheiten, pro Taktzyklus und Pipeline
werden somit 2 Texturen aufgetragen. Heutige Spiele nutzen
mit der Ausnahme von Serious Sam kaum mehr als 2 Texturen pro Dreieck, so dass der GeForce3 in der
aktuellen Software-Welt nicht durch zusätzliche Textureinheiten
profitieren würde. Bei künftigen Games auf DirectX 8 - Basis
kann er jedoch seinen "Rücksprung"-Joker ausspielen.
Wird das "Loop-Back"-Feature vom Spiel genutzt, so
können bis zu 4 Texturen pro Pixel in einem Renderingdurchgang beklebt werden, womit
leistungsminderndes Multipass-Rendering vermieden werden
kann.
Der soeben berechnete Pixelwert wird dabei zurück an den Anfang
der Pipeline gefügt und durchläuft sämtliche Rendering-Schritte
ein zweites mal, diesmal mit zwei anderen Texturen und Parametern.
Erst nach zweimaligem Durchqueren wird das Ergebnis in den
Grafikkartenspeicher geschrieben. So verliert der GeForce3 zwar
einen Taktzyklus durch das Auftragen der zwei zusätzlichen
Texturen, spart sich jedoch mehrere Speicherzugriffe gegenüber den
GeForce2-Grafikchips, die generell nur 2 Texturen auftragen
können, bevor der Pixel in den Grafikkartenspeicher geschrieben
wird.
Bei einer Taktfrequenz von
200 MHz entwickelt der GeForce3 eine Pixelfüllrate von 800
Millionen Pixeln pro Sekunde (4 * 200), oder gemäss alternativer
Definition 1'600 GTex/s (4 * 200 * 2).
Der spezifizierte
Speichertakt beträgt 230 MHz. Da der GeForce3 wie seine
Vorgänger Double Data Rate-Speicher anspricht, werden pro Takt
zwei Datenpakete übertragen. Maximal stehen dem Chip daher 7,3
Gigabyte Speicherbandbreite pro Sekunde zur Seite, ein weiterhin
beachtlicher Wert.
Logik
konzentriert
Mit seinen 57 Millionen
Transistoren setzt der GeForce3 einsamen Rekord bezüglich der
Komplexität von Prozessoren im Consumer-Markt. Der
nächst-"einfachere" Grafikprozessor stammt von ATi (RADEON)
und ist mit 31 Millionen Transistoren fast halb so komplex. Sogar
Intel's Flaggschiff, der Pentium4, ist mit "lediglich"
42 Millionen Transistoren ebenfalls eine Nummer tiefer
angesiedelt. Außerdem besteht ein Grossteil der Transistoren im
Pentium-Chip aus SRAM, d.h. einfachem Cache-Speicher. Beim GeForce3
dagegen wird mehr als 90% der 12x12mm grossen Fläche für Logik
verwendet, eine imposante Zahl, wenn man bedenkt, dass ein
einzelner Ingenieur gerade mal 1 Million Transistoren überblicken
und entwickeln kann.
Die hohe
Integrationsdichte hat natürlich seine Nachteile. Die
Hardwareimplementation eines derart komplexen Chips gestaltet sich
äusserst schwierig. NVIDIA geriet angesichts der enorm
aufwendigen Entwicklungsarbeit sowie den erstmals mit derartigen
Transistormassen eingesetzten Entwicklungstools ins Schleudern,
der Chip konnte nicht
im anvisierten Zeitfenster fertiggestellt werden. Probleme
bei der Hardware-Implementierung sorgten für eine Verspätung
um 8 Monate, welche dank im Vorfeld als Notfallplan
initiierten "NV15BR" (ULTRA) jedoch gut überbrückt
werden konnten. Zwar konnte man den eigenen Zielsetzungen - alle
6 Monate einen neuen Chip, alle 12 Monate eine neue Architektur
- nicht Rechnung tragen, doch ist zumindest der Produkte-Anspruch
erfüllt, was OEMs und Kartenhersteller besänftigt. Den NV15BR frühzeitig als Überbrückungslösung
einzuplanen, spricht eindeutig für die Weitsichtigkeit und
Cleverness von NVIDIA, sich den guten Ruf als termintreuen Partner
nicht zu verspielen.
Um einen derart komplexen
Baustein überhaupt betreiben zu können, ist NVIDIA auf modernste
Fertigungstechnologie angewiesen. Die 0.18µm-Prozesse
sind gänzlich ungeeignet, da Stromverbrauch und Hitzeentwicklung
bei den geplanten 200-300 MHz ein unlösbares Problem darstellen.
Stattdessen setzten die Kalifornier auf den modernsten derzeit verfügbaren
Fertigungsprozess. 0.15µm beträgt die Strukturbreite der
GeForce3-Transistoren, gefertigt werden die 144 mm2 grossen Dies
in den Labors des taiwanesischen Halbleiterherstellers TSMC. Mit
modernsten
Entwicklungstools sowie top-aktuellem
Fertigungsprozess gelang es NVIDIA schließlich, den ersten
Prototypen (A0) bereits nach
8 Stunden zum Betrieb zu bewegen, wenn auch noch diverse Überarbeitungen
erfordert waren. Die erste stabile
Version gelang Ende Dezember und fand
gleich den Weg in die ersten Xbox-Entwicklerkits. Eine erste
grössere Serie, die unter anderem als Testmuster an die
Kartenhersteller ausgeliefert wurde, trug die Bezeichnung A3. Die nun
finale Version befindet sich in
voller Produktion und trägt die TSMC-Versionsnummer A5. Da
üblicherweise das erste Silizium nach dem Tape-Out die Bezeichnung A0 trägt,
bedeutete dies, dass NVidia im 6. Anlauf die marktreife Version des
neuen Superchips gelang. Eine reife Leistung für einen derart
komplexen Chip, wenn man
bedenkt, dass die 3dfx-Ingenieure einst 7 Anläufe dazu
benötigten, einen vergleichsweise einfachen Banshee mit
funktionsfähigem 2D-Teil in die Massenproduktion zu schicken.
200 statt
250 MHz?
Trotz neuer
Fertigungstechnologie reicht die Integrationssteigerung nicht aus,
um dieselben Taktfrequenzen wie beim Vorgänger zu erreichen.
Während der GeForce2 ULTRA noch mit 250 MHz lief, muss man sich
beim GeForce3 mit 200 MHz begnügen, nicht mehr als der vor einem
Jahr lancierte GeForce2 GTS. Doch noch mehr als im CPU-Business
sind MHz-Zahlen bei Grafikchips alles andere als aussagekräftig.
Effizienzsteigernde Maßnahmen in den Rendering-Pipelines, größere
Caches und andere Optimierungen im GeForce3 werden dafür sorgen,
dass der neue Chip trotz weniger Schwingungen pro Sekunde in der
Praxis die besseren Leistungswerte erzielen wird. Lassen Sie sich
nicht von MHz-Zahlen in die Irre leiten, diese gelten nur
innerhalb desselben Chipmodels als relevant. Wichtig sind die im
Endeffekt in der Praxis erzielten Leistungswerte. Die im Zusammenhang mit der Lightspeed
Memory Architecture eingebauten Verbesserungen bringen im
Normalfall bereits eine Steigerung der effektiven Füllrate
um 10-20%. Schonender Umgang mit der Speicherbandbreite sorgt für
weiteren Geschwindigkeitsschub in bandbreitenlimitierten
Situationen, so dass der GeForce3 im Endeffekt in den meisten
Praxistests besser abschneiden dürfte als der schneller getaktete
Vorgänger.
Dennoch wird klar, wo
NVIDIA als nächstes die Leistungsschraube ansetzen wird. Es
dürfte ein leichtes sein, die GeForce3 - Architektur mit einem
neuen 0.13µ-Fertigungsprozess oder gar schon in einem verbesserten 0.15µ-Prozess
auf höhere Taktfrequenzen und damit höhere Leistungen zu
trimmen. Das "Fall-Refresh" dürfte den GeForce3 zu
neuen Höchstleistungen treiben, soviel steht fest.
Vertex
Shader à la GeForce3
Einer der Hauptgründe
für den enormen Transistorzuwachs liegt in der neu
hinzugekommenen, programmierbaren Geometrieeinheit. Parallel zur
weiterhin vorhandenen, festverdrahteten T&L-Pipeline
integriert NVIDIA einen Mini-Prozessor mit eigenem
Instruktionssatz in den GeForce3, der vom
Spieleentwickler direkt für seine eigenen Transformations- und
Beleuchtungsberechnungen genutzt werden kann. Die Details zu
dieser Technologie erfahren Sie in unserer Technikanalyse "Vertex
Shader - TNL der nächsten Generation", wir beschränken
uns hier auf die technischen Einzelheiten der
GeForce3-Ausführung.

Fortschritt durch NVIDIA:
GeForce256 TNL-Techdemo (1999) vs. GeForce3 -Techdemo (2001)
Der Vertex Shader des
GeForce3 besitzt eine Ausführungseinheit (ALU), d.h. der
SIMD-Prozessor kann genau eine Shader-Instruktion pro Takt
ausführen. Bei den spezifizierten 200 MHz Taktfrequenz ist der
GeForce3 in der Lage, über die programmierbare Einheit bis zu 50
Millionen Dreiecke pro Sekunde zu transformieren. Was bei
einfachen Transformationen über die programmierbare TNL-Einheit
noch schneller geht, wird mit aktivierten Hardware-Lichtern
schnell deutlich langsamer.
Tabelle 1:
GeForce3 - maximale TNL Leistung
| |
GeForce2
ULTRA |
GeForce3
DX7 |
GeForce3
DX8 programmierbar |
| keine
Beleuchtung |
31
M |
25
M |
50
M |
| 1
spekulares Punktlicht |
31
M |
25
M |
10
M |
| 8
spekulare Punktlichter |
3,8
M |
3.125
M |
1.5
M |
Bereits mit einem
Punktlicht rechnet die festverdrahtete TNL-Einheit 2,5x schneller.
Werden 8 spekulare Punktlichter genutzt, fällt die Leistung des
programmierbaren Vertex Shaders bereits auf 1,5 Millionen
Eckpunkte pro Sekunde. Diese Leistung würde reichen, um 25'000
Dreiecken pro Szene flüssig darzustellen, geplante TNL-Titel
werden allerdings mehr Dreiecke nutzen und den Vertex Shader
gleichzeitig für weitere Funktionen (Charakteranimation) mit
Rechenarbeit belegen, so dass uns die Leistung der
programmierbaren TNL-Einheit für diese Zwecke etwas unterdimensioniert
erscheint. Die Kernanwendung des Vertex Shaders wird in einer
ersten Phase jedoch die Charakteranimation sein, die deutlich
weniger aufwendig sein dürfte als komplizierte angepasste
Beleuchtungs-Schemen. Wie wir später sehen werden, führt die
nFiniteFX-Engine genannte Einheit in der Tat in der Praxis bereits
zu
einem starken Leistungsschub, der mit kommenden
Generationen nur noch grösser ausfallen wird.
Grundgerüst
für die Zukunft
Die GeForce3 - Architektur
gilt als Grundstein für sämtliche neuen NVIDIA-Grafikchips in
den nächsten 1-2 Jahren. Schon bei der NV1x-Serie wurde
ersichtlich, dass NVidia größtenteils auf ein Baukasten-System
bei der Entwicklung neuer Grafikchips zurückgreift, d.h. es wird
ein existierendes Design entweder leicht erweitert (NV10
-> NV15)
oder den Bedürfnissen entsprechend zurechtgerupft (NV15
-> NV11
-> GeForce2go -> Crush). Die spart Entwicklungskosten und
reduziert das Risiko für Verzögerungen. Das System ist eines der
Geheimnisse von NVIDIA's Termintreue und dürfte als
offensichtlich bewährte Vorgehensweise beibehalten werden.
Ähnliches wird daher auch
mit dem Kern des GeForce3 (NV20) geschehen, der zuerst im Xbox-Grafikchip
xGPU wiederverwendet wird und später als erweiterte und wieder
strangulierte PC-Versionen die verschiedenen Marktsegmente
bedienen soll. Was die nächsten PC-Derivate anbelangt, so können
auch wir nur spekulieren. Nach einem einfachen Speed-Jump mit dem
NV25 mit einigen leichten Detailverbesserungen dürfte auf dieser
Basis eine abgespeckte Variante als Ersatz für den GeForce2 MX
lanciert werden. Die Anforderungen an DirectX 8 legen nahe, dass
NVidia bei diesem Chip Teile der festverdrahteten DirectX 7 TNL-Pipeline
sowie 2 Pipelines einsparen könnte, ohne dabei die wesentlichen
DX8-Features zu verlieren. Konkreter werden die Pläne beim
Derivat für Microsoft's Spielkonsole, der "xGPU"
(NV2A):

Die
spezifizierten Leistungswerte der Xbox offenbaren, dass NVidia die Ausführungseinheiten
der programmierbaren TNL-Einheit (Vertex Shader) bei der XBox doppelt
ausgelegt hat. Während der NV20 um die 50 Millionen
Eckpunkte transformieren kann, wird die xGPU der Xbox ganze 125
Millionen Dreiecke/s verarbeiten können, mehr als das Doppelte des
GeForce3. In der xGPU befindet sich zudem die Northbridge (nicht im
Diagramm), die Renderingarchitektur dagegen bleibt unverändert. Die
Vermutungen bezüglich Transistoranzahl (GeForce3 57 Millionen, xGPU
ca. 65 Millionen) legen nahe, dass NVIDIA Teile der festverdrahteten
TNL-Einheit sowie weitere, nicht für die Konsole relevante Features
aus der Xbox gekippt hat - der doppelt ausgelegte Vertex
Shader macht die DX7-TNL-Einheit nahezu überflüssig (bis auf die
Clipping-Einheit, die weiterhin drin bleiben muss).
| |
GeForce2
ULTRA |
GeForce3 |
xGPU |
| Taktfrequenz |
250
MHz |
200
MHz |
250
MHz |
| Fertigungsprozess |
0.18 |
0.15 |
0.15 |
| Renderpipelines |
4 |
4 |
4 |
| Vertex
Shader ALU |
CPU |
1 |
2* |
keine
Beleuchtung
DX8 TNL |
CPU |
50
M |
125
M |
Auch wenn die
Details der einzelnen Bausteine noch nicht offengelegt sind, in Umrissen
ist relativ klar, womit man von NVIDIA bis zum Erscheinen
des NV30 rechnen darf.
Moore's
Law Cubed
NVIDIA wirbt
seit kurzem damit, dass man das Mooresche Gesetz (doppelte Leistung
alle 18 Monate) sogar um die dritte Potenz ("Hoch 3") übertreffe.
Nun, in der Tat gilt dies natürlich nur für den Spezialfall der
Texelrate mit aktiviertem Full Scene Anti Aliasing, aber dennoch
wird klar, dass das Moore'sche Gesetz in seiner Grundversion
zumindest für die Fortschritte von NVIDIA keine Gültigkeit mehr
hat.

Bei der 'Texelfüllrate', eine gerne genutzte Grösse für die Leistung
eines Grafikprozessors, überbietet NVIDIA Moore's Law um den Faktor
10, was knapp der beworbenen 'Kubierung' des Mooreschen Gesetzes
entspricht. In den anderen Bereichen gilt dies nicht, aber dennoch
wird das alte Gesetz der Halbleiterbranche in allen anderen
Kategorien (auch in der hier nicht aufgelisteten Speicherbandbreite)
überboten. Bei der
integrierten Anzahl Transistoren ist NVIDIA unangefochten an der
Spitze. Es gibt zwar einige IBM- und Intel-Spezialprozessoren im
Server-Markt, die mit Transistormengen von 100 Millionen aufwarten,
doch im PC-Markt hält NVIDIA zum dritten Mal nach dem dem GeForce256
und dem GeForce2 GTS den
Spitzenplatz mit den komplexesten Logikprozessoren weltweit.
Es ist
fraglich, ob NVIDIA und generell die Grafikchipschmieden weiter im
selben Tempo die Rekorde setzen können. Die mit dem NV20
verbundenen Verzögerungen deuten eigentlich darauf hin, dass es
zumindest eine Abflachung in der Entwicklung geben könnte, denn
auch bei weitergehendem Fortschritt der Halbleitertechnik stossen sowohl
Ingenieure und speziell deren Software-Tools immer mehr an die Grenzen der
Leistungsfähigkeit.
DirectX 8 - Features
Der GeForce3
wurde im Hinblick auf das Feature-Set von DirectX 8 entwickelt, oder
DirectX 8 wurde im Hinblick auf die Features des GeForce3 angepasst,
je nach Standpunkt kommt man zu einem anderen Schluss. Fakt ist, der
GeForce3 unterstützt sehr viele DirectX 8 - Features, namentlich
die neuen Pixel Shader sowie eine Vertex Shader-Einheit
(programmierbares T&L).

Vertex Shader-Effekte:
dynamische Einschusslöcher oder flatternde Stoffe
Speziell der
Vertex Shader ist ein heisses Feature. Mittels Vertex Shadern
können die Programmierer erstmals eigene Programme auf dem
Grafikchip ausführen lassen. Die Möglichkeit hatten sie bisher
nicht, sondern sie waren an die vordefinierten Funktionen der
Programmierschnittstelle (DirectX, OpenGL) gebunden. Die neu dazu
gewonnene Flexibilität eröffnet viele neue Möglichkeiten, die
eigentlich nur durch die Leistungsfähigkeit des Grafikchips
begrenzt werden. Besonders entzücken dürften die nun sehr
flexiblen Möglichkeiten zur Charakteranimation, indem sehr
viele Eckpunkte in die Bewegung einer Spielfigur einfließen
können. Auch dynamische LOD-Algorithmen, bei denen der Wechsel
der Detail-Stufe nicht mehr aprupt, sondern fliessend mittels
Morphing erfolgt, ist nun problemlos möglich. Insgesamt eröffnet
der Vertex Shadern den Spieleprogrammierer viele neue Möglichkeiten
zum Steigern des Realismus. Dynamikeffekte könnten zum
Killerfeature des Vertex Shader mutieren. Flatternde Fahnen und
Kleidungsstücke sowie echte Vibrationen im Gelände nach
Granateneinschlägen wären Anwendungsbeispiele, die sicherlich in
realen Spieleumgebungen hervorragend integriert werden können. Bis
dahin ist es jedoch noch ein weiter Weg, sowohl im Hinblick auf die
lange Entwicklungszeit moderner Spiele, wie auch auf Seite der
3D-Hardware, welche dafür noch leistungsfähiger werden muss. Doch
bereits die einfacheren Funktionen sind ein erster Fortschritt gegenüber dem stur vorgegebenen DirectX7-Hardwarepfad.
Auch bei den
Pixel Shadern erfüllt NVIDIA die DirectX8 - Spezifikation, indem
bis zu 4 Texturen in die Berechnung mit einfliessen können, im
Gegensatz zum RADEON, der selbiges nur mit 3 Texturen schafft.

Fortschritt: GeForce256 vs.
GeForce3 Technologie - Demonstration
In zwei Punkten
erfüllt der GeForce3 jedoch (noch) nicht den beworbenen Anspruch
eines 100%igen DirectX8-Beschleunigers und ist somit gemäss unserer
Auffassung auch nicht DirectX 8 "compliant".
Mit den aktuellen
11.01/12.00 und 12.01-Detonator-Treibern werden beispielsweise 3D Texturen nicht
unterstützt, dies obwohl ältere NVIDIA-Unterlagen auf eine
Hardware-Unterstützung hindeuten. Auch John Carmack,
Spieleentwickler bei id software, spricht in einem seiner berüchtigten
.plan-Updates
davon, dass NVIDIA im GeForce3 3D
Texturen in vollem Umfang in der Hardware integrierte, dies
nachdem er bereits mit einem Testmuster beliefert wurde. Dem
widerspricht seit einiger Zeit jedoch die offizielle Haltung von
NVIDIA. Sowohl David
Kirk wie auch Chris
Everitt, beides Ingenieure bei NVIDIA, sagten, dass das Feature
im GeForce3-Produkt nicht zur Verfügung steht: "3D
Texturen waren geplant für den GeForce3, aber wir hatten nicht
genug Zeit, um diese fertigzustellen. Wie Sie wissen, wir versuchen
unseren Fahrplan einzuhalten (ein neues Killer-Produkt alle 6
Monate!). Daher müssen wir , um etwas fertigzustellen, uns
entscheiden, einige Feature wegzulassen, welche zu viel Zeit
benötigen. 3D Texturen konnten nicht im GeForce3 integriert werden,
sie werden beim nächsten Mal drin sein." . Während
der berüchtigte
Spieleentwickler behauptet, das Feature sei komplett implementiert,
bestätigt NVIDIA selbst das Gegenteil. Auf eine weitere
Nachfrage bei NVIDIA, ob 3D Texturen nun im GeForce3-Chip
implementiert sind und ob dies eine Treiber- oder
Hardware-Angelegenheit sei oder nicht, beschränkte sich CTO David
Kirk auf folgendes Statement: "Das
GeForce3 Produkt unterstützt keine 3D Texturen. Ich werde Ihnen
nicht mehr als dies sagen!". Wir
können die Verwirrung auch nicht aufklären, möglicherweise bezog
sich John Carmack auf veraltete Spezifikationen, ohne selbst das
Feature auszutesten, oder 3D Texturen werden schlicht für spätere
Chips als "neues" Feature aufgehoben.
Auch werden
derzeit noch nicht alle DirectX8-Multisampling-Funktionen in Hardware geboten, was such im Verlaufe der Treiberentwicklung vielleicht
noch ändern könnte, doch derzeit muss man davon ausgehen, dass
diese Features auf den GeForce3-Karten nicht unterstützt
werden. Festzuhalten bleibt, dass diese beiden (noch nicht komplett)
unterstützten DX8-Features bei den Spieleentwicklern auf relativ wenig Echo
stossen und die fehlende Unterstützung daher relativ irrelevant
erscheint.
Die Produkte: ELSA
GLADIAC 920
NVIDIA selbst stellt keine
Grafikkarten her und verzichtete diesmal auch auf die Verteilung von
Testmustern im deutschsprachigen Raum. Sowohl ELSA
wie auch Hercules stellten uns
Vorserien-Exemplare zur Verfügung, die auf dem A3-Stepping
beruhen.
Die
ELSA-Karte wird dabei mit einem stereoskopisch wirkenden Maus-Pad
gebundelt. Ebenfalls mit im Retail-Paket eine Treiber-CD, ein
DVD-Software-Player (ELSAmovie 2000), der 3DMark 2001 PRO und als
besonderes Schmankerl die Vollversion
von Giants - Citzen:Kabuto, einem modernen
DirectX7-Spiel, welches als eines der wenigen Spiele Dot3 Bump
Mapping nutzt. Speziell für ELSA fertigte der Spieleentwickler
einen (bisher) exklusiven Patch, so dass das Spiel die neuen
Features des GeForce3 nutzen kann. Die mit der GLADIAC
920 gelieferte Version des Spiels ist daher voll
auf DirectX 8 ausgerichtet und spielt sich schneller und besser
als das im Laden erhältliche DirectX 7-äquivalent. Die
ELSA-Version des Spiels nutzt nicht nur für die Charaktere mehr
Polygone, sondern sorgt auch dafür, dass die Landschaft fliessender
in die Wasserdarstellung übergeht. Letztere wurde um Pixel
Shader-Effekte erweitert und daher realistischer gestaltet. ELSA
liefert somit mit dem Board das erste Spiel, welches den Vertex-
und Pixel-Shader des GeForce3 nutzen kann.

Die von VisionTek im Auftrag
von ELSA gefertigte Platine wird mit 3,8 Nanosekunden DDR-Speicher
bestückt, der theoretisch bis 263 MHz (526 MHz
"effektiv") innerhalb der Spezifikation betrieben werden
kann. Standardmässig wird er gemäss der NVIDIA-Vorgabe mit 230 MHz
getaktet.
Das Endblech des Boards ist
mit einem VGA-Ausgang (Sub-D-Buchse) bestückt und wird flankiert
von einem TV-Anschluss (S-Video), der mittels einem mitgelieferten
Adapter zu einem Composite-Anschluss umfunktioniert werden kann.
Realisiert wird der TV-Out über einen auf der Platine verlöteten
TV-Encoder des Typs Booktree Bt869. ELSA gewährt 6 Jahre Garantie
auf die Karte und bietet innerhalb von Deutschland einen 100 Tage
Austausch-Service ("ELSA ServiceDirect")
Die Produkte:
Hercules 3D Prophet III
Die Hercules-Platine
befriedigt dabei auch das Auge und strahlt im gewohnt coolem
Hercules-türkis. Auf dem GeForce3-Chip der 3D
Prophet III verbaut der
Hersteller, und das dürfte einige Overclocker-Herzen höher
schlagen lassen, einen speziellen aktiven Lüfter der
Cooling-Spezialisten Thermaltake.
Der in speziell flacher Bauweise gefertigte Lüfter entspricht
ansonsten den bekannten "BlueOrb"-Lüftermodellen, die
normalerweise als teures Overclocking-Zubehör vertrieben
werden.
Wie bei der GLADIAC 920
findet sich auch auf dem Endblech der 3D Prophet III ein VGA- und
TV-Anschluss wieder, ein S-Video -> Composite-Adapter liegt in
der Verpackung bei. Hercules realisiert den TV-Out über einen
Booktree TV-Encoder des Herstellers Conexant. Doch das
Anschluss-Repertoire geht bei der 3D Prophet III weiter, Hercules
pflanzt auch einen TMDS-Transmitter auf das Board, der den am
Endblech angebrachten DVI-Anschluss ansteuert, womit Hercules auch
Besitzer von digitalen Flachbildschirmen anspricht. Die maximale
Auflösung beträgt dabei 1600x1200 Pixel.

Hübsch: Ein 'BlueOrb' sorgt für die
Frischluftzufuhr
Als obligaten
DVD-Software-Player bundelt Hercules dabei den PowerDVD inklusive
deutschsprachigem Handbuch. Was bei ELSA das Mauspad ist bei
Hercules eine Serie Sticker. Mit auf dem Bildschirm oder PC-Gehäuse
aufgeklebten Motiven wie "Powered By Hercules", "Powerful
3D" und "High Performance 3D Graphics Card" können
Sie nun angeben, ohne das Gehäuse zu öffnen!
Testsystem
Unser Testsystem besteht aus
einem schnellen AMD Athlon 1,1 GHz / 100 MHz SDR SDRAM auf einem
ABit KT7-Mainboard.
- AMD
Athlon Thunderbird 950 bei 1,1 GHz
- ABit KT7 Mainboard
- 256 MB SDR SDRAM 100 MHz,
PC-100, 2-2-2
- 40 GB IBM Festplatte
- Pioneer 4X DVD-ROM
Slot-In ATAPI
- iOmega ZIP-Drive ATAPI
- Philipps toUCam PRO USB
- Creative Soundblaster
AWE64 Value
- GeForce2 GTS 32 MB bei
200/166 MHz
- GeForce2 ULTRA 64 MB bei
250/230 MHz
- GeForce3 64 MB bei
200/230 MHz
- Windows ME, DirectX 8.0a
- GeForce DX7/OGL:
Treiber
Detonator 6.50 WHQL
- GeForce DX8: Treiber
Detonator 11.01
- GeForce3: Treiber Detonator
11.01, 12.00, 12.01
- Desktop auf
1024x768x32bit
- Double Buffering, VSync aus,
S3TC Bugfix an
- Refresh-Rate auf 100 Hz bis
1024x768
Refresh-Rate auf 70 Hz bei 1280x1024 & 1600x1200
Testsoftware
Um die
Leistungsfähigkeit des GeForce3 umfassend beurteilen zu können,
setzen wir dabei nicht nur auf eine handvoll subjektiv ausgewählter
Benchmarks, die im schlimmsten Fall nur DirectX8-optimiert sind.
Auch den Benchmark 3D Mark
2000 (Direct3D) werden Sie bei uns nicht finden, dessen Resultate
wären ohnehin Makulatur, da nie ein Spiel mit der in 3D Mark 2000
verwendeten Engine erscheinen wird.
Wir möchten
Ihnen auch zeigen können, wie schnell Ihre Grafikkarte wirklich ist
und nicht nur - wie schnell sie sein könnte. Daher ziehen
wir es vor, die Karten mit einem breiten Mix von echten Spielen zu
testen. Dabei kommen nicht nur Ladenhüter wie Evolva zum Einsatz,
sondern auch Verkaufserfolge wie Ultima 9. Die Palette der Quake III
- basierenden Spiele umfasst die Referenz Quake III Arena, F.A.K.K.
2, Star Trek Elite Force sowie Alice. Ergänzt wird die Serie von
Direct3D-Spielen wie Giants, Test Drive 6, Mercedes-Benz Truck
Racing und Motocross Madness 2.
Alle Benchmarks
wurden mit allen gängigen Auflösungen durchgeführt, so
dass Sie sich selbst ein Bild machen können, auf welcher Auflösungsstufe
sie Ihr Lieblingsspiel fahren möchten. Durch diese Vorgehensweise
bei knapp 20 Spielen führen wir auch einen Kompatibilitätscheck
durch, d.h. welche Spiele funktionieren, wo gibt es Grafikfehler,
welche Auflösungen funktionieren nicht?
Das Potential
bei künftigen Spielen wird anhand von Tech-Demos beurteilt. GLMark
1.1p, Aquamark sowie die X-Isle Demo gehören zum Testprogramm,
genauso wie "3D Mark 2001", dessen Engine angeblich in dem für das
dritte Quartal erwarteten Max Payne zum Einsatz kommen soll.
Ausserdem stellen wir sicher, dass damit auch vermehrt "moderne" 3D-Engines mit
T&L und Bump Mapping-Support berücksichtigt werden.
In unserem Benchmarking
- Artikel erfahren Sie weitere Details zum Benchmarking und den
dazu gehörigen Prozeduren. Folgend die genauen Einstellungen zu den
Benchmarkprogrammen:
- Alice:
Demo-Version mit HQ++-Settings, jeweils 16bit bzw. 32bit
Farbtiefe und Texturtiefe, aktivierte Texturkompression, "Demo"-Timedemo
- Q3A:
Version 1.16n, Sound an, High Quality Settings, je nach Test mit
Änderungen
- Test
Drive 6 Demo, 60s Testlauf
- MDK2
Testdemo: maximale Texturdetails, MIP Mapping
- Re-Volt:
Maximale Detailsettings
- Descent
3: Version 1.0g, Sehr hohe Standard - Detail -
Genauigkeit, Stufe "Höchste", Alle
"Wechselschalter" an, Objektkomplexität niedrig, Geländedetails
18, Renderingtiefe 60, Bilinear, MIP Mapping, kein Sound
- FAKK2:
Siehe Details
- Microsoft
Motocross Madness 2: Siehe Details
- MBTR:
Reflexionen, Anzeigenkorrektur, Hires Texturen, Alpha Texturen,
Sound FX, alles Filtern
- Serious
Sam Retail, eigenes Script, S3TC, kein anisotropisches
Filtering, VSync aus, Exclusive Mode
- Ultima
9, Maximale Texturen, maximale Sichtweite, S3TC
Leider konnten nicht alle
gewünschten Programme in die Testserie aufgenommen werden. Aufgrund
von Treiberinkompatibilitäten fehlt DMZG und 3D Excerziser sowie
die Demo von Superbike 2001.
OpenGL: Quake III Arena
Spiel: Quake III Arena
Entwickler: id software
genutzte Versionen: Retail-Vollversion mit Patch 1.17
Timedemos: Demo001 (integriert), bloodbath,
annihilator

"Rocket-Jumps" und
"Frags" gehören zu Ihrem Vokabular? Sie sind
Quake3-Spieler, wie viele in der Netzgemeinde. Die Engine galt einst
als Non-Plus-Ultra, ist mittlerweile jedoch überholt. Trotzdem dient
sie weiterhin als Grundlage für viele weitere Spiele.
Q3A nutzt
Texturdekompression sowie die Hardware-Transformationseinheit.

Bereits im Standard-Ablauf
kann sich der GeForce3 von seinem Vorgänger absetzen. Bis zu 30%
beträgt der Vorsprung in der durchschnittlich erzielten Framerate.
Demo001 ist auf dem GeForce3 CPU-Limitiert bis 800x600, ab 1024x768
schlägt sich die begrenzte Grafikkartenleistung in den Frameraten
nieder.

Im Annihilator-Test zeigt
der GeForce3 seine Stärken. In diesem Worst-Case-Szenario arbeitet
der Chip bis in hohe Auflösungen am CPU-Limit - besser geht's auf
unserem System nicht. Die ideale Quake III - Karte ist
gefunden.

Der Bloodbath zeigt, trotz
anderem Szenario, grundsätzlich eine ähnliche Charakteristik wie
der Demo001-Ablauf. Der GeForce3 verbucht bis zu 62% höhere
Frameraten als ein GeForce2 GTS.

Die KYRO II-Map stammt aus
der Küche von Imagination Technologies, um die Vorteile von 8fachem
Multitexturing aufzuzeigen. Die Map nutzt bis zu 4 Texturschichten
pro Dreieck, im Gegensatz zu den 2 Texturschichten, die Q3A und
andere Spiele mit der Q3-Engine nutzen.
Der GeForce3 ist klar im
Vorteil und leistet 33% mehr als der Vorgänger GeForce2 ULTRA.
Einer der Gründe ist die Fähigkeit des GeForce3, 4 Texturen in
einem Rendering-Durchgang aufzutragen, wodurch wertvolle
Speicherbandbreite gespart werden kann.

Im (fast ausschließlich)
durch die CPU-Leistung begrenzten NVIDIA-Technologie-Level bringt
auch ein GeForce3 keine Vorteile. Die T&L-Einheit kann in dieser
Engine nur die Transformationen übernehmen, so dass bei vielen
Dreiecken die teils aufwendigen Lichtberechnungen auf die Framerate
drücken.

Keine
Überraschung, der GeForce3 setzt einen neuen Spitzenwert im
Demo001-Ablauf.
OpenGL: Alice
Spiel: American McGee's
Alice
Publisher: EA Games
genutzte Versionen: Original Demo sowie Retail-Vollversion
Timedemos: curiosity

Alice im Wunderland - oder
so ähnlich. Das fantastisch fantasievolle Mistery-Spiel auf Basis
der Quake 3 - Engine lässt sich Q3A-konform diversen
Benchmarkprozeduren unterziehen. Das OpenGL-Spiel unterstützt die
Transformationseinheit der beiden Kontrahenten und wurde mit aktiver
Texturdekompression getestet.

Der GeForce3
liegt mit bis zu 37% vor dem GeForce2 ULTRA. Allerdings verliert
auch der GeForce3 in höheren Auflösungen sehr viel Leistung, so
dass an ein flüssiges Spieleerlebnis bei 1280x1024 bereits nicht
mehr zu denken ist. In den relevanten Spieleauflösungen bis
1024x768 liegt der GeForce3 nur wenig vor dem GeForce2 ULTRA. Der
GeForce2 GTS wird dagegen bereits um 31% abgehängt.

Auch hier setzt
sich der GeForce3 leicht vor den GeForce2 ULTRA. Die Frameraten
erreichen das doppelte einer Voodoo 5 5500.
OpenGL: F.A.K.K. 2
Spiel: Heavy Metal F.A.K.K.
genutzte Versionen: Retail-Vollversion mit Patch 1.2
Timedemo: PCGameshardware

In F.A.K.K. 2 steuern Sie eine leicht bekleidete, dafür umso
stärker bewaffnete Dame durch verwundene Gänge. Genutzt wird auch
hier Texturdekompression und Hardware T (&L) auf Basis einer um
Charakteranimationen erweiterten Quake 3 - Engine. Aufwendige Licht-
und Explosionseffekte zeichnen dieses Spiel und speziel der
vorliegende Benchmarkablauf aus.

Der GeForce3 setzt sich
ab. Die neue Karte ist bis zu 30% schneller (1280x1024) als der
Vorgänger, der nun bereits 1 Jahr alte GeForce2 GTS wird um bis zu
81% übertroffen (1600x1200).

Der GeForce3
liegt klar vor dem Vorgänger. Deutlich werden die krassen
Leistungsunterschiede zwischen der Einsteiger-Klasse (MX / RADEON
SDR) und dem High-End.
OpenGL: Star Trek Elite Force
Spiel: Star Trek Voyager:
Elite Force
genutzte Versionen: Retail-Vollversion
Timedemo: benchmark

Scotty, Energie! Nicht ganz,
aber fast. In gewohnter Star Trek-Kulisse spielt dieser First Person
- Shooter auf Basis der Quake3-Engine.

Einmal mehr liegt der
GeForce3 in hohen Auflösungen vorne. Der Benchmark ist bis 1280x768
auf unserem System CPU-limitiert. Der GeForce3 ist maximal 19.4%
schneller als der Vorgänger und bis zu 57% schneller als eine
GeForce2 GTS / 32 MB (1600x1200).

Zusammen mit dem GeForce2
ULTRA platziert sich die GeForce3 an der Spitze - am CPU-Limit.
OpenGL: MDK2
Spiel: MDK2
Entwickler: Bioware
genutzte Versionen: Demoversion
Timedemo: integriert

Das Fantasyspiel MDK2 nutzte
als eines der ersten Spiele Hardware-Lighting zusätzlich zu den
Transformationsfunktionen. Die verwendete OMEN-Engine kann dennoch
optisch nicht überzeugen. Die Umgebung wirkt "flach" und
die die Spezialeffekte setzen keine neuen Massstäbe.

Der GeForce3 ist bis zu 38%
schneller als der GeForce2 ULTRA, eine GeForce2 GTS wird um bis zu
143% übertroffen (1600x1200).

In der Standard-Auflösung
1024x768x32bit setzt sich der GeForce3 an die Spitze. Die
16bit-Leistung liegt gleichauf mit dem GeForce2 ULTRA, da mit den
erzielten 123 fps das CPU-Limit unseres Testsystems erreicht ist.
Der 32bit-Leistungsvorsprung gegenüber dem GeForce2 ULTRA beträgt
12%, gegenüber dem GeForce2 GTS 58%. Eine GeForce2 MX wird um 138%
übertroffen. Die schnellste rivalisierende Lösung (RADEON 64 MB)
liegt 42% zurück.
OpenGL: Serious Sam
Programm: Serious Sam
Entwickler: Croteam
Version: Public Test 2
Timedemo: integriert

Die neue 3D-Engine der
kroatischen Entwickler stellt alles andere in den Schatten - Quake
III und Unreal Tournament bleiben chancenlos gegen die Serious
Sam-Engine, die besonders mit extrem hochauflösenden Texturen zu
überzeugen vermag.
Serious Sam nutzt für gewisse Effekte bis zu 5 Texturschichten pro
Polygon, so dass Karten wie der GeForce3 (4 Texturen pro Pass)
theoretisch davon profitieren könnten.
Leider kann Benchmarking mit
der Verkaufsversion von Serious Sam zum Albtraum werden. Das Spiel
nutzt ein "Auto-Anpassungs"-Feature, d.h. Karten mit 32 MB
werden beispielsweise anders behandelt, als Karten mit 64 MB, so
dass bei den vordefinierten Profilen (Quality, Normal, etc.) jeweils
für die einzelnen Karten unterschiedliche Settings zum Einsatz
kommen. Einziger Ausweg wäre die Wahl von "Extreme Quality",
was jedoch den Nachteil mit sich bringt, dass anisotropische
Filterung erzwingt wird, welche bekanntlich bei den verschiedenen
Grafikchips völlig unterschiedliches Qualitäts- und
Leistungsverhalten mit sich bringt. Auch die vertikale
Bildsynchronisation wird mit dieser
Einstellung automatisch aktiviert, was grundsätzlich zum
Benchmarken nicht geeignet ist.
Aus diesem Grunde sahen wir uns veranlasst,
externe Scripts zu nutzen, die auf dem
"Extreme Quality" basieren, jedoch anisotropische
Filtering und VSync deaktivieren, die Texturkompression jedoch
grösstenteils aktivieren. Unser Script steht hier zum Download
bereit, weitere passende Scripts bietet
Beyond3D zum Download an.


Im Karnak-Level
liegt der GeForce3 bei den Durchschnittswerten vorn, bei den
Tiefstwerten allerdings leicht unter dem GeForce2 ULTRA.
Auch beim
Memphis-Level kann sich der GeForce3 behaupten und liet bis zu 10
fps vor dem Vorgänger.

In diesem Level
sind dem GeForce3 deutlich bessere Tiefstwerte zu bescheinigen.
DirectX 7: Ultima 9
Programm: Ultima 9
Version: Retail deutsch
Timedemo: fps

Ultima 9 nutzt sehr viele
hochauflösende Texturen und stellt grosse Anforderungen an das
Texturmanagement der Treiber.

Der GeForce3 übertrifft
seinen schneller getakteten Vorgänger, ohne jedoch flüssige
Frameraten zu erreichen. Der GeForce3 leistet in diesem Spiel
maximal 19% bessere Frameraten als eine GeForce2 ULTRA. Eine
GeForce2 GTS wird um 50% abgehängt (1600x1200).

Im
1024x768-Leistungsvergleich gegen die Konkurrenz platziert sich der
GeForce3 im Mittelfeld. NVIDIA-Karten bekunden generell Mühe mit
diesem Spiel, selbst 200 Mark-Karten des Typs KYRO liefern hier
bessere Leistungswerte als die High-End-Beschleuniger der
High-End-Spezialisten. Die GeForce3 ist
23% langsamer als eine Voodoo 5 5500, allerdings auch 17% schneller als eine GeForce2 GTS.
DirectX 7: Evolva
Programm: Evolva
Version: Rolling Demo 944
Timedemo: integriert

Evolva gilt als erstes Spiel
mit der Unterstützung von DirectX 7 Pixel Shading (Dot3 Bump
Mapping), weshalb NVIDIA dieses Spiel als Technologie-Demonstration
während den GeForce2 GTS-Präsentationen nutzte. Sowohl RADEON und
GeForce2 GTS integrieren eine Dot3-Einheit, beide Beschleuniger
fallen bei deren Nutzung unter DirectX 7 jedoch in einen
Multipass-Rendering-Modus zurück. Auch der GeForce3 kann hier sein
Loop-Back-Feature zur Auftragung von 4 Texturen in einem Pass nicht
nutzen, dazu wäre ein Spielepatch nötig.


In 'flachen'
Darstellungsmodus ohne Bump Mapping leistet der GeForce3 sowohl bei
den Tiefst- wie auch bei den Durchschnittswerten mehr als sein
Vorgänger. Der Vorsprung liegt bei bis zu 29% bei den
Durchschnittswerten bzw. 27% bei den Tiefstwerten. Die Leistungswerte
einer GeForce2 GTS werden um bis zu 84% bzw. 131%
übertroffen.


Deutlicher sind die
Leistungsvorteile, sobald Dot3 Bump Mapping aktiviert wird. Die
Effizienz-Vorzüge der Lightspeed Memory Architecture kumulieren
sich hier, da der vorgezogene Tiefentest unter Umständen den
Zugriff auf 3 Texturen (Base, Light, Bumpmap) ersparen kann.

Der GeForce3 übernimmt
locker die Spitzenposition in Evolva. Das Schlusslicht bildet der
GeForce2 MX.
DirectX 7: MBTR
Programm: Mercedes-Benz
Truck Racing
Entwickler: Syntetic
Version: Retail Version, deutsch, Max. Details, Sichtweite 50%
Timedemo: integriert

Mercedes-Benz Truck Racing
nutzt sowohl hoch detaillierte Fahrzeugmodelle wie auch viele
hochauflösende Texturen.

Am CPU-Limiter arbeitet MBTR
mit dem GeForce3. Besser geht's auf diesem System nicht, d.h.
überflüssige Leistung kann hier ohne weiteres in bessere Optik wie
anisotropisches Filtering und Full Scene Anti Aliasing investiert
werden.
DirectX 7: Test Drive 6
Programm: Test Drive 6
Version: Demoversion
Timedemo: integriert

Test Drive 6 nutzte als
eines der ersten DirectX-Spiele TNL. Trotzdem macht das Spiel einen
tristen und wenig anschaulichen Eindruck.

Leider treten hier
Mängel der GeForce-Treiber zu Tage. Der Treiber versagt bereits ab einer Auflösung von
1024x768 und zeigt Leistungsschwächen unterhalb dieser Auflösung. Es ist zu
hoffen, dass dies beim nächsten Treiber nicht mehr der Fall sein wird
und auch die hier noch messbaren Leistungsdefizite des GeForce3
beseitigt sein werden.
DirectX 7: Motocross Madness 2
Programm: Motocross Madness
2
Entwickler: Microsoft
Version: Demoversion
Timedemo: Arizona

Das Motorrad-Rally-Spiel
Motocross Madness 2 erlaubt nur die Nutzung des 16bit High
Color-Modus. Die von uns genutzte Benchmark - Sequenz zeigt ein
offenes Steppen-Feld. Der dreiecksbasierte Overdraw dieser Szenerie
dürfte sehr gering sein.

Der GeForce3 kann sich hier
in höheren Auflösungen vom GeForce2 ULTRA absetzen. Bei 1280x1024
beträgt der Vorsprung 10%. Eine GeForce2 GTS wird um bis zu 26%
übertroffen.

Ein GeForce3
ist bei 1024x768 um 5% schneller als eine GF2 ULTRA, 15% schneller
als eine GF2 GTS und 54% schneller als eine GeForce2 MX.
Hier muss klar
festgehalten werden, dass in diesem Spiel nur High-End-Grafikkarten
flüssige Frameraten liefern können. GeForce2 MX-, KYRO- und
RADEON-Karten erreichen in diesem Szenario keine durchschnittlichen
30 fps in den gewählten Einstellungen. Ausserdem sei zu berücksichtigen, dass das hier vermessene
Szenario eher einen Idealfall für das Spiel darstellt.
DirectX 7: Unreal Tournament
Programm: Unreal Tournament
Entwickler: EPIC Megagames
Version: Vollversion 4.35
Timedemo: UTbench

Unreal Tournament stellt das
Grundgerüst vieler weiterer Spiele dar, sowohl das beliebte Deus Ex
wie auch Rune und Undying basieren auf dieser Engine, die ursprünglich als
First Person Shooter Premiere feierte, mittlerweile aber auch in
"zivilen" Programmen eingesetzt wird. Unreal Tournament
zeichnet sich durch den Einsatz von vielen Texturen aus und stellt
hohe Anforderungen an das Texturmanagement. TNL wird nicht
unterstützt.


Der GeForce3 erreicht hier
nicht ganz die Leistungswerte des GeForce2 ULTRA, was wir auf noch
nicht fertig optimierte Treiber zurückführen. Eine GeForce2 GTS
wird jedoch bei 1024x768 übertroffen, speziell bei den tiefstwerten
leidet das 32 MB-Modell durch die vielen Texturzugriffe.

Nicht Top, aber
auch kein Flopp. Der GeForce3 leistet in Unreal Tournament gute
Dienste, speziell die Tiefstwerte liegen über jenen der meisten 32
MB - Modelle. Dass der GeForce2 ULTRA nicht geschlagen wird,
dürfte an noch nicht fertig optimierten Treibern liegen.
DirectX 7: GIANTS: CITIZEN KABUTO
Programm: Giants Vollversion
Entwickler: Planet Moon Studios
Version: 1.396 BETA
Timedemo: Gamegauge (integriert)

Giants war nach
Evolva das zweite Spiel mit Unterstützung für DirectX 7 Pixel
Shading (Dot3 Bump Mapping). Im Unterschied zu Evolva wird Giants
auch gespielt, weswegen die Benchmarkwerte dieses Spiel
interessanter sein dürften.


Mit maximalen
Qualitätssettings und Dot3 Bump Mapping arbeitet der GeForce3
praktisch bis zur maximalen Auflösung am CPU-Limit, könnte man
meinen, wenn man den Tiefstwert ausser Acht lässt. Dieser fällt
mit steigender Auflösung, so dass Giants auf auf dem GeForce3 nur
bis 1280x1024 durchgängig spielbare Frameraten liefert.

Locker an der
Spitze: Der GeForce3 ist schneller als ULTRA und GTS.
DirectX 7: The Need for
Speed: Porsche
Programm: The Need for Speed:
Porsche
Entwickler: Electronic Arts
Version: German Retail
Timedemo: 3DConceptNormandie
+ FRAPS 1.3

The Need for
Speed - selbst regelmäßige Benützer von öffentlichen
Verkehrsmitteln werden den Bleifuss nicht mehr lösen wollen,
nachdem sie sich an den immer schneller vorbeiflitzenden
Landschaften dieses herrlichen Spiels ergötzt haben. The Need for
Speed setzt graphisch Maßstäbe unter den Fun-Rennspielen. Zwar
wird weder TNL noch Cube Environment Mapping noch Bump Mapping
eingesetzt, sondern für die graphische Pracht setzen die Entwickler
auf eigene und hochkarätige Algorithmen und
Multitexturing-Technologie.

Beim GeForce3
wurden wir hier mit Treiberproblemen konfrontiert, es liessen sich
nur Auflösungen bis 1280x960 einstellen. In dieser Auflösung
übernimmt der GeForce3 auch die Führung vor dem GeForce2
ULTRA, der Verlauf der Kurve deutet an, dass er diese in höheren
Auflösungen noch ausbauen würde, sofern denn die Treiber
funktionieren würden.

Nur wenige
Grafikkarten erreichen hier durchschnittliche 60 fps bei
1024x768x32bit. Der GeForce3 gehört dazu.
DirectX 7: Colin
McRae Rally 2.0
Programm: Colin McRae Rally
2.0
Version: öffentliche Demoversion
+ FRAPS 1.3
Timedemo: keines, Arcade-Strecke Italien, 15 Sekunden warten,
FPS-Logging starten, 30 Sekunden Strecke abfahren, FPS-Logging
stoppen

Wer sagt, neue
Features werden nicht genutzt? Colin McRae Rally nutzt als erstes
Spiel überhaupt dynamisches Cube Environment Mapping zur
realistischen Generierung von Scheibenreflexionen. Alternativ wird
herkömmliches Environment Mapping oder Environmental Bump Mapping
angeboten. Das Spiel nutzt TNL.

Mit
gewöhnlichem Environmental Mapping bleibt der Geforce3
interessanterweise hinter dem GeForce2 ULTRA zurück. Der Geforce3
beherrscht hier zudem Environmental Bump Mapping. Die Frameraten mit
EMBM entsprachen dabei den normalen Environment Mapping-Resultaten.

Auch mit
aktiviertem Cube Environmental Bump Mapping gewinnt man mit dem
GeForce3 keinen Blumentopf, sofern FRAPS die Resultate zwischen den
GeForce-Boards nicht verzerrt. Der GeForce3 ist langsamer als der
GeForce2 ULTRA.

Der GeForce3
wird flankiert von GeForce2 PRO und GeForce2 GTS. Neuere Treiber
könnten die Reihenfolge vielleicht schnell wieder ändern und den
GeForce3 an die Spitze hieven.
DirectX 6: Expendable
Programm: Expendable
Entwickler: RAGE
Version: Demo
Timedemo: Timedemo 2 (integriert)

Expendable galt einst als
Vorzeigespiel bezüglich der Unterstützung neuer Features. Stencil
Buffers, EMBM und Texturdekompression gehören zu den Kernmerkmalen
der verwendeten Engine.


Würden wir Ihnen die
Tiefstwerte vorenthalten, so hätte man den Eindruck, der GeForce3
sei für Expendable die schlechtere Lösung als eine billigere
GeForce2 ULTRA. Dem ist nicht so. Dank Overdraw-Reduktion liegen die
Tiefstwerte deutlich über dem Vorgänger, was sich in einer
besseren Spielbarkeit bemerkbar machen sollte.
Es ist nicht auszuschliessen,
dass auch andere Spieleengines ähnliches Verhalten zeigen. Leider
bieten die meisten Benchmarks keine oder nur unbrauchbare
Tiefstwert-Angaben.

Auch hier sei bemerkt:
Obwohl der GeForce3 noch nicht
die schnellsten Durchschnittswerte liefern kann ist er dennoch die
beste 3D-Lösung für dieses Spiel, da die wichtigen (durch die
Füllrate limitierte) Tiefstwerte
viel höher Liegen als bei allen anderen Grafikkarten.
DirectX 6: Revolt
Programm: Revolt
Version: Retail-Vollversion
Timedemo: integriert

Re-Volt ist ein auf Action
getrimmtes Spielzeugautorennen. Die 3D-Engine nutzt keine besonderen
modernen Features.


Der GeForce3 ist in tiefen
Auflösungen langsamer als ein GeForce2 GTS oder ein GeForce2 ULTRA. Bei hohen Auflösungen übertrifft der
GeForce3 wieder die Leistungswerte der anderen 3D-Beschleuniger. Bis
1280x1024 liegt seine Leistung am CPU- bzw. Treiber-Limit, während
eine GeForce2 ULTRA bereits Füllratenlimitierungen zeigt.

Aus den
erwähnten Gründen übernimmt der GeForce3 bei diesem
Leistungsvergleich (noch?) nicht die Leistungskrone.
DirectX 6: Descent 3
Programm: Descent3
Entwickler: Interplay
Version: Retail
Timedemo: Secret2

Etwas veraltet, aber dennoch
interessant zur Analyse der Worst-Case-Szenarios: Die
Descent3-Engine.


Obwohl es sich hier um einen
16bit-Benchmark handelt, übertrifft der GeForce3 seine Rivalen um
40 bzw. 38% (Durchschnitts- / Tiefstwerte). GTS-Karten werden um bis
zu 60 bzw. 64% abgehängt.

Der GeForce3
übernimmt bei 1024x768 problemlos die Führung bei den Tiefstwerten. Der Vorsprung auf
die Mitbewerber beträgt 4% (RADEON) bzw. 13% (ULTRA) bzw. 70% (MX).
Nur bei den Durchschnittswerten muss er dem Voodoo 5 (Glide) den
Vorzug geben.
Zukunft? Künftige
Spieleengines auf dem Prüfstand
Die letzten 15
Spiele gaben Ihnen einen Eindruck von der Leistung, welche sie in
heute verfügbaren Spielen erwarten können. Die nun folgenden
Benchmarkwerte sollten einen Ausblick geben, wie sich eine
GeForce3 in zukünftigen Spielen verhalten könnte. Wir
können nicht beurteilen, wann und ob überhaupt jemals Spiele mit
diesen Engines im PC-Handel erhältlich sein werden, noch ob die
hier ermittelten Benchmarkwerte auf die finalen Produkte
übertragbar sind, dennoch möchten wir Ihnen einen Eindruck des
Potentials vermitteln, welches in einer solch modernen Karte wie der
GLADIAC 920 oder der Prophet III stecken kann.
Derzeit mehren
sich die Hinweise, dass Pixel- und speziell Vertex Shader nicht
derselbe Rohrkrepierer werden, wie festverdrahtetes TNL. Die Shader
geben den Programmierer endlich jene Freiheit zurück, damit sie eigene
Effekte-Kreationen in die Spiele einfließen lassen können.
v.l.n.r: non-GeForce,
GeForce256/2, GeForce3 (FUEL, OpenGL)
Speziell auch neue
Lighting-Schemen scheinen es den Entwicklern angetan zu haben,
Lighting-Schemen, welche von dem für die Profi-Welt gedachten
OpenGL-Lighting abweichen. Neue Möglichkeiten bieten die Shader
auch im Bereich der Reflexionen, wie oft und gerne anhand von
Screenshots demonstriert wird.
Zukunft? GL Mark v1.1
Programm: GLMark 1.1
Entwickler: Vulpine.de
Version: Version 1.1
Timedemo: integriert

GL Mark basiert auf der
hochmodernen Vupline-Vision - Engine aus deutschem Hause. Der
OpenGL-Benchmark nutzt TNL sowie, falls vorhanden, proprietäre
OpenGL-Erweiterungen zur Beschleunigung von TNL und zum Bump Mapping. Der Benchmark bietet ausserdem einen
speziellen GeForce3-Modus, bei dem die Vulpine-Engine die neuen
Pixel- und Vertex-Shader-Features nutzen kann.


Bei den Durchschnittswerten
übertrifft der GeForce3 seinen Vorgänger GeForce2 ULTRA um bis zu
60%. Bei den Tiefstwerten ist der neue Hochleistungschip sogar 73%
schneller, obwohl der Vorgänger schneller getaktet ist.
Der GeForce2 bricht ab
1024x768 etwas stärker ein, was wohl auf den kleineren OnBoard-Speicher
zurückzuführen ist. Dies, der schnellere Speicher sowie die LMA
führen dazu, dass der GeForce3 den jährigen Vorgänger bis zum
5fachen in den Durchschnittswerten und bis zum 8fachen bei den
Tiefstwerten übertrifft.

Der
Füllratengraph illustriert das Potential deutlich. Der Geforce3
skaliert mit steigender Auflösung weiter, während bereits der
GeForce2 ULTRA eine abflachende Kurve zeigt - die Speicherbandbreite
geht dem aufgeborten GeForce2 zur Neige. Die reale Füllrate des
GeForce2 GTS bricht mit steigender Auflösung ein - Texturzugriffe
bremsen den Beschleuniger ab.
Zukunft? 3D Mark 2001
Programm: 3D Mark 2000
Entwickler: Madonion
Version: Version 1.0
Timedemo: integriert

Der 3D Mark 2001 basiert auf
der MaxFX-3D-Engine der Spieleschmiede von Remedy. Seit 1997
versprechen die finnischen Spieleentwickler, ein Spiel basierend auf
dieser Engine (Max Payne) auf den Markt zu bringen, bisher gelang
dies nicht, sondern die Firmen finanzieren sich über 40US$ teure
Benchmark-Lizenzgebühren. Wir werfen dennoch einen Blick auf die
erzielten Leistungswerte des GeForce3.
Car Chase
Der erste
Spieletest zeigt eine Fahrzeugsimulation, bei der die Federung des
Fahrzeugs angeblich gemäss realen
Physikberechnungen erfolgen soll. Die 3D-Features der hier
vermessenen High-Detail-Szene umfassen dynamische Schatten (mittels
Rendering in Texturen), 3 Texturschichten auf dem Gelände, 3
Texturschichten auf den Fahrzeugen (Basis, Light, Glossmap), 2
Texturschichten auf Wracks und 2 Texturschichten auf den Gebäuden.
Die für die Schattenberechnung benötigten Dreiecke werden aus
unbekannten Gründen mittels Vertex Shadern transformiert. Sollte
sich herausstellen, dass Madonion nur des Vertex Shaders wegen auf
diese Transformationen mit DX7 TNL verzichtet, disqualifiziert sich
das Entwicklerteam damit selbst. Mit etwas Phantasie hätte man wohl
sinnvollere (und realistischere) Anwendungszwecke gefunden, um
DX8-Boards mittels Vertex Shadern zu bevorteilen.
Durchschnittlich
zeigt diese Szene 68'000 Polygone und 16.4 MB komprimierte
Texturen.

Der GeForce3
ist klar schneller und dies erfreulicherweise auch bei den CPU -
limitierten tiefen Auflösungen. Da die über die Vertex Shader
transformierten Schatten-Dreiecke auf GeForce2 - Karten von der CPU
berechnet werden, kann sich der GeForce3 hier absetzen, da er über
eine in Hardware integrierte Vertex Shader-Einheit besitzt. Die
Frameraten sind allerdings auch auf dem GeForce3 recht tief und
liegen unterhalb der 30 fps. Ab 1280x1024 erreicht die Karte zudem
bereits das Füllratenlimit, da die Frameraten weiter fallen.
Dragothic
Die nächste
sehr schöne Szene zeigt eine auf einem fein modellierten Drachen
reitende Kämpferin, welche eine mittelalterliche Stadt
angreift.
In dieser Szene
wird ein neues, spezielles globales Beleuchtungsschema benutzt, bei
dem nicht nur eine multiplikative Light Map zum Abdunkeln der
darunterliegenden Textur, sondern eine zusätzliche adaptive
Lightmap zum Aufhellen der Farben genutzt wird. Die
Charakteranimationen des Drachens, der Spielfigur sowie der vom
Angriff fliehenden Stadtbewohner wurden mittels Vertex Shadern (Morphing)
erstellt und laufen daher auf der GeForce3 hardwarebeschleunigt.
Der Drachen
wird mit 2 Texturen überzogen, auch diese Szene nutzt dynamische
Schatten mittels Rendering in Texturen, die Gebäude der Stadt
nutzen 3 Texturschichten. Im Durchschnitt sind in der von uns
vermessenen High-Detail-Sequenz 100'000 Polygone sichtbar, wobei 15
MB komprimierte Texturen angezeigt werden.
Auch hier wird
der massive Leistungsvorsprung des GeForce3 gegenüber seinen
Rivalen deutlich. Nur der GeForce3 erreicht in diesem Modus
flüssige 35 fps-Frameraten, da er sowohl die CPU- wie auch das
eigene Speicherinterface durch den Vertex Shader und effizienteres
Rendering entlasten kann. Aber auch hier wird deutlich, dass der
GeForce3 bereits bei 800x600 bei 35 fps sein Füllratenlimit
erreicht hat, die Frameraten beginnen zu sinken.
Lobby
Die eigentlich
zuerst nur für die Szenen-Demo vorgesehene "Lobby"-Sequenz
(eine Imitation der Schiesserei aus der Schalterhalle des
Hollywood-Streifens Matrix) nutzt Charaktere, die einst in Max Payne
zum Einsatz kommen sollen.
Die Bewegung
der Charaktere wird mittels DirectX 8 Vertex Shadern erzeugt und
wird daher vom GeForce3 hardwarebeschleunigt. Auf
DirectX7-Beschleunigern (GeForce2) wird die Charakteranimation nicht
über DirectX, sondern über eigenen, handoptimierten Code
vorgenommen. Die Patronenhülsen fliegen mit in Echtzeit berechneten
Physikauswertungen davon. Die von uns genutzte High-Details-Szene
nutzt Reflexionen auf dem Hallenboden sowie dynamische Schatten. Die
Charaktere werden mit einer Texturschicht, die Wände mit 2
Texturschichten dargestellt. Die Reflexionen werden erzeugt, in dem
alles spiegelverkehrt nochmals gerendert wird.
Die Szene zeigt
durchschnittlich 42'000 Polygone und nutzt 9.3 MB komprimierte
Texturen.

Der GeForce3
ist seinem Vorgänger in allen Belangen überlegen. Durch die
CPU-Entlastung bei der Charakteranimation sind die Werte in tiefen
Auflösungen höher, durch die effizientere Speicherarchitektur
sowie den vorgezogenen Tiefentest leistet der GeForce3 bei hohen
Auflösungen behr. Dennoch erreicht die Karte bereits bei 1024x1024
bei 35 fps das oft Füllraten-/Bandbreitenlimit.
Nature
Die folgende
Sequenz nutzt DirectX 8 Pixel Shader, ohne dass Madonion an die
Implementierung einer zu DX7 rückwertskompatiblen Technik gedacht
hat. Daher lässt sich die Sequenz nur auf DirectX8-Beschleunigern
wie dem GeForce3 benchmarken.
Die Szene zeigt
eine wunderschön dargestellte Naturszene, bei der die Gräser sowie
die Blätter der Pflanzen und Bäume sich im Wind wiegen. Das Wasser
kräuselt sich vom Wind realistisch. Letzteres wurde mit DX8 Pixel
Shadern sowie Cube Environment Mapping mit 4 Texturquellen
realisiert, die im Wind wogenden Blätter werden mit Vertex Shadern
in Dynamik versetzt. Die Bewegungen der in der Sequenz sichtbaren
Spielfigur sind ebenfalls mit Vertex Shadern realisiert.

Landschaft,
Brücke und Haus nutzen je 2 Texturschichten, Blätter, Grass und
die Spielfigur eine. Im Durchschnitt sind in dieser Szene 82'000
Dreiecke sichtbar, die Grösse aller sichtbaren komprimierten
Texturen beträgt im Durchschnitt 34 MB.

Die Szene ist
herrlich und zeigt deutlich, welch realistische Darstellungen mit
den Technologien des GeForce3 möglich wären. Leider wird die Szene
viel zu langsam dargestellt. Der GeForce3 erreicht keine flüssigen
Frameraten - die Szene ruckelt mit 25 fps über den Bildschirm.
Ausserdem fällt die Framerate kontinuierlich, die Speicherleistung
des GeForce3 reicht nicht, um Geometrie-, Textur- und
Framebufferzugriffe schnell genug bewältigen zu können.
Uns ist leider
nicht bekannt, wieviele Vertex Shader-Instruktionen Madonion für
die Dymanik der Szenerie verwendet, Auskunft erteilte der
Benchmark-Hersteller keine. Die erzielten Leistungsdaten
verdeutlichen jedoch dass der GeForce3 mit derart intensiver Vertex
Shader-Nutzung nur ca. 2,1 Millionen Polygone pro Sekunde
verarbeiten kann. Um diese Szene flüssig (60 fps) darzustellen,
wäre jedoch eine Leistung von 4,9 Millionen Polygonen pro Sekunde
nötig, d.h. die Vertex Shader-Einheit müsste 2,3x schneller
arbeiten können als jene des GeForce3. Eigentlich könnte diese Szene dazu
prädestiniert sein, auf der Xbox flüssig dargestellt zu werden. Die
Geometrieleistung der Xbox liegt beträgt theoretisch das 2,5fache des GeForce3.
Zukunft? Aquamark
Programm: Aquamark
Entwickler: Massive
Version: Version 1.1
Timedemo: integriert

Aquamark basiert auf der krass-Engine,
welche im kommenden Unterwasser-Spektakel Aquanox zum Einsatz
kommt. Die Grafik von Aquamark ist schlicht herrlich. Die speziellen
Lichteffekte und die gefüllt wirkende Szenerie zeigt, welch tolle
Möglichkeiten T&L, Pixel und Vertex Shadern den Entwicklern
bieten, um atemberaubende 3D-Grafik in Echtzeit darstellen zu
können. Aquamark veranstaltet eine regelrechte Polygonschwemme, die
Polygonanzahl pro Frame schwankt zwischen 80'000 und 120'000, neuer
Rekord für einen Spielebenchmark. Das Gelände und die Objekte
werden mittels dynamischem LoD (Level of Detail) dargestellt, d.h.
die Objektmodelle morphen sich von einem Detail-Grad zum nächsten,
ohne dass Wechsel für den Spieler sichtbar ist. Andere moderne
Engines können dies noch nicht. Nicht zuletzt nutzt die
krass-Engine ausgefeilte Charakteranimations-Algorithmen (Skeletal-Animations),
was realistischere und lebendiger wirkende Bewegungen der Charaktere
erlaubt. Zuguterletzt versinken Teile der Landschaft in
höhenabhängigem Nebel, der mittels Vertex Shadern realisiert
wird.
Die Aquanox-Macher sind
dabei kein unbeschriebenes
Blatt. Der Unterwasser-Klassiker
"Schleichfahrt" stammt aus derselben Spieleschmiede.

Die Leistungsunterschiede
zwischen dem Vorgänger GeForce2 ULTRA und dem neuen GeForce3 sind
frapant! Nur der GeForce3 erreicht bei 640x480 annähernd die 60 fps,
während sich GeForce2 ULTRA-Boards noch mit langsamen
durchschnittichen 30 fps begnügen müssen. Interessant ist aber
auch, dass die Engine bei den vorgegebenen Qualitätseinstellungen
auch Bandbreiten-Limitiert ist. Die Framerate des GeForce3 fällt
kontinuierlich von knapp 60 auf 30 fps.
Dass die GeForce2-Boards so
schlecht abschneiden liegt daran, dass die krass-Engine für die
Geometrieberechnungen (T&L) keine DX7 - Funktionen nutzt,
sondern ausschliesslich CPU und Vertex Shader. D.h. die GeForce- und
RADEON-Karten können ihre TNL-Einheiten nicht nutzen, die ganze
Arbeit fällt an die CPU, während die DX8-TNL-Einheit des GeForce3
das Spiel in Hardware beschleunigt. Für die deutschen Entwicker
waren die DX7 - Funktionen gemäss
Unternehmenssprecher Alexander Jorias zuwenig flexibel und damit
für Aquanox nutzlos. Zwar besänftigt Massive
im FAQ zum Spiel, über die Aquamark-Benchmarkwerte liessen sich
nicht unbedingt Rückschlüsse auf die Leistungsfähigkeit oder die
Geschwindigkeit der krass-engine ziehen ("Der
AquaMark ist ein Benchmark und keine AquaNox-Demo. Aus seinen
Benchmarkwerten auf die Geschwindigkeit oder Leistungsfähigkeit der
3D-Engine zu schließen ist etwa so sinnvoll wie der Schluss von der
Anzahl der Menschen in einem Fußballstadion auf deren Intelligenz."),
doch dürften, auch wenn die
Frameraten absolut vielleicht nicht die im Spiel erzielten Werte
wiederspiegeln, die Verhältnisse bei den hier gewählten
Qualitätseinstellungen (die sich im Benchmark nicht verändern
lassen) ungefähr dieselben bleiben.

Wie erwartet, der GeForce3
übernimmt locker die Spitzenposition in diesem
DirectX8-Benchmark.
Zukunft? Dronez
Programm: Dronez
Entwickler: Zetha Games
Version: Version 1.0
Timedemo: integriert
Dronez ist ein modernes
OpenGL-Spiel in Anlehnung an die virtuellen Diskus-Kämpfe im Klassiker
Tron, dem ersten grösstenteils im Computer generierten Kinofilm.
Dronez nutzt diverse NVIDIA-spezifische OpenGL-Extensions, wie
beispielsweise Vertex Array Range beim GeForce2 sowie Vertex Program
beim GeForce3. Ausserdem kann Dronez beim GeForce3 4 Texturen pro
Pass auftragen.
Wir haben die von Zetha
vordefinierten Profile zum Benchmarken geändert, da es nicht unser
primäres Ziel ist, "die Vorteile der nFiniteFX Engine"
aufzuzeigen, wie die Anleitung von Zetha Games beschreibt. Wir
wählten überall die maximal möglichen Qualitätseinstellungen
(32bit Texturen) und aktivierten die Texturkompression sowie
trilineares Filtering.
Hässlich an diesem Spiel
sind einzig die ewig dauernden Ladezeiten. Die uns vorliegende
Rolling Demo von Dronez benötigt derzeit 256 MB Hauptspeicher, um
die Unmengen an Texturen unterzubringen. Soll das Spiel wie geplant
auf der Xbox erscheinen, steht den Entwicklern noch einiges Arbeit
bevor.

Auch in den
Maximal-Einstellungen wird klar, wo die Vorteile der nFiniteFX Engine
liegen. Die CPU-Last wird deutlich reduziert, indem die GPU
Berechnungen zur Charakteranimation sowie Vorberechnungen zum Bump
Mapping übernehmen kann. Die Frameraten aller GeForce-Beschleuniger
sind sehr gut, nur der GeForce2 GTS bricht wegen der hohen
Texturlast ab 1024x768 massiv ein. Der GeForce3 bleibt immer
schneller als sein Vorgänger, allerdings sind die Leistungsvorteile
bei hohen Auflösungen gering.
Zukunft? X-Isle
Programm: X-Isle Demo
Entwickler: Crytek.de
Version: Version 1.0
Timedemo: integriert

Die Crytek X-Isle - Demo
basiert auf einer älteren Version, mittlerweile integrierten die
Entwickler GeForce3-Support und nutzen
neuere Features wie Pixel- und Vertex-Shader. Leider liegt uns die
neue Version nicht vor. Die hier genutzte Demo nutzt aber dennoch
GeForce3-Pixel Shading sowie Hardware TNL und Polygonmengen im
Bereich von 80'000 pro Szene. Es ist fraglich wie aussagekräftig
diese Resultate für das geplante Spiel "X-Isle: Dinosaur
Island" sein werden. Gemäss Crytek ist die 3D-Engine noch
mehrere Monate vor der Fertigstellung entfernt.


Der GeForce3 setzt sich um
14 bis 24% vom GeForce2 ULTRA ab. Der GeForce2 GTS wird in hohen
Auflösungen noch stärker abgehängt, da die höhere Texturlast
überproportional auf die Framerate drückt.
Profi-OpenGL: SPEC ViewPerf
Programm: ViewPerf 6.1.2
Entwickler: SPEC

Das OpenGL-API wird nicht
nur für Spiele genutzt, sämtliche "professionelle"
Applikationen basieren auf dieser Programmierschnittstelle. SPEC's
ViewPerf nutzt einige Real-World-Daten zur Simulation der Leistung
in CAD/CAM-Tools wie 3D Studio MAX oder Maya. Gemäss
SPEC-Spezifikation wurden folgende Ergebnisse bei 1280x1024x32bit
Desktop-Auflösung ermittelt. Nebst den erzielten Leistungen gilt
der ViewPerf auch als guter Funktionscheck für den OpenGL ICD der
Grafikkarte.





Der GeForce3 leistet als
"Gamerboard" überall sehr gute Werte, wenn auch der
GeForce2 ULTRA im Allgemeinen nicht übertroffen wird.
Profi-OpenGL: Cinebench 2000
Programm: Cinema4D Cinebench
2000
Entwickler: Maxxon

Cinebench 2000 testet die
Leistung mit der im Modellierungs-Programm Cinema4D enthaltenen
3D-Engine. Der Benchmark umfasst einen Wireframe-, Shading- und
Texturing-Test.
Die Werte wurden bei einer
eingestellten Desktop-Auflösung von 1024x768x32bit ermittelt.

Die Leistungsunterschiede
zwischen den T&L-Karten sind hier eigentlich vernachlässigbar.
Der GeForce3 ist nur minim schneller als eine GeForce2 GTS.
Tech-Demo: Village Mark
Programm: Village Mark 1.15
Entwickler: Imagination Technologies

Village Mark gilt als
Overdraw-Stresstest, indem neben enorm hoher Tiefenkomplexität auf
Dreiecksebene auch diverse Texturlagen übereinandergelegt sind. Die
3 Textureinheiten des GeForce3 werden hier genutzt. Das Programm
wurde von Imagination Technologies entwickelt, um die Vorzüge des
KYRO zu demonstrieren. Entsprechend fehlt den Resultaten der Bezug
zu realen Spieleengines.

Obwohl der GeForce3 tiefer
getaktet ist als der GeForce2 ULTRA, kann er den GeForce2 ULTRA dank
Lightspeed
Memory Architecture (versucht, Overdraw zu reduzieren)
übertrumpfen. Bei gleichem Takt ist der GeForce3 bis zu 17%
schneller.

Markant deutlicher sind die
Vorteile beim Einsatz von TrueColor (32bit) - Rendering. Der
GeForce3 liegt bis zu 32% vor dem GeForce2 ULTRA, bei gleichem Takt
sogar bis zu 36%. Konsequenz: Die Lightspeed Memory Architecture
bringt bis zu 40% Leistungsgewinn!

Im
1024x768er-Vergleich platziert sich der GeForce3 an die Spitze der
traditionellen Rendering-Architekturen. Nur die KYRO - Beschleuniger
liegt dank
8fachem Multitexturing sowie 100%iger Overdraw-Reduktion an der
Spitze.
Tech-Demo: Treemark
Der Treemark
ist eine von NVIDIA veröffentlichte Technologie-Demo zur
Demonstration des Nutzens von DirectX 7 TNL. Die Demo wurde
zeitgleich mit dem GeForce256 veröffentlicht und zeigt einen fein
modellierten Baum mit einer variablen Anzahl Lichtquellen.

Die
TNL-Leistung des GeForce3 in DirectX7 liegt ungefähr auf GeForce2
GTS-Niveau. Dies erstaunt nicht weiter, die DX7 TNL-Einheit des
GeForce3 wurde von seinem Vorgänger übernommen.
Tech-Demo: 3D Mark
2001 High Poly Count
Der 3D Mark
2001 - Benchmark bietet auch einige ausgefeilte Feature-Tests, so
beispielsweise der High Poly Count - Test, bei dem eine Million
Polygone (!!!) pro Szene dargestellt werden. Im HighDetail-Modus
werden 8 Lichtquellen genutzt, 1 gerichtetes Licht und 7 aufwendige
Punktlichter für spekulare Beleuchtung.

Die
Leistungswerte sind verständlicherweise unabhängig von der
gewählten Auflösung, da keine Texturen eingesetzt werden und daher
nur ein Rendering-Pass anfällt. Interessant aber erwartet war die
Tatsache, dass die Beleuchtungseinheit des GeForce3 schwächer
ausgelegt ist als jene des GeForce2 ULTRA. Durch den tieferen Takt
und der unveränderten DX7-TNL-Einheit kann der GeForce3 in diesem
Spezialfall die Leistung des Vorgängers nicht erreichen.
Tech-Demo: 3D Mark
2001 Vertex Shader
Speziell zur
Vermessung der Vertex Shader-Leistung bietet der 3D Mark 2001 einen
speziellen Modus an, in dem 100 mittels Vertex Shader animierte
Spielfiguren dargestellt werden. Die Funktionen des Vertex Shader
können im Gegensatz zu jenen des Pixel Shaders von der CPU
übernommen werden.

Da die
GeForce2-Grafikkarten keinen in Hardware integrierten Vertex Shader
besitzen, übertrifft der GeForce3 hier wieder die Leistung seiner
Vorgänger. Obwohl sich die 1,1 GHz-CPU zu 100% den Vertex
Shader-Berechnungen widmen kann (was in echten Spieleszenarios nicht
der Fall ist), setzt sich der GeForce3 um bis zu 14% ab. Die
Hardware-Lösung ist somit ca. 15% schneller als die
Softwareemulation auf einem 1,1 GHz Athlon.
Killer-Feature
Full Scene Anti Aliasing
Dass Full Scene
Anti Aliasing ein Killer-Feature darstellt, mussten wir bereits in
unserem Review der Voodoo
5 5500 feststellen. Massenweise CPU-limitierte Spiele,
Flugsimulatoren, Autorennspiele sowie Weltraumballereien erfahren
durch Full Scene Anti Aliasing einen enormen Optikboost, indem die hässlichen
und meist über den ganzen Bildbereich wandernde Treppenstufen
abgeschwächt oder fast gänzlich eliminiert werden können.
Mittlerweile schlägt auch NVIDIA in diese Bresche und präsentiert
mit dem GeForce3 ein herausragendes Full Scene Anti
Aliasing-Verfahren, welches bezüglich Effizienz den bisherigen
Supersampling-Verfahren überlegen ist.
Obwohl aktuelle
FSAA-Lösungen bezüglich der erreichten Qualität durchaus
überzeugen, offenbaren sich speziell bei modernen Spielen die
Leistungs-Defizite. 4faches FSAA bringt einen Leistungsverlust von
bis zu 75% mit sich, flüssige Frameraten waren daher leider nicht
immer möglich und beschränkten sich auf tiefe Auflösungen und
16bit Farbtiefe. Mit dem bisher verwendeten Supersampling sind bis
auf weiteres keine leistungsmässigen Quantensprünge zu erwarten,
schon gar nicht mit traditionellen Renderingarchitekturen. Das
Zauberwort des GeForce3 heisst daher High Resolution Anti Aliasing.
Dahinter steckt Multisampling-Technologie, ein kompliziertes und bisher nur auf teuren
Workstation-Boards genutztes Verfahren, welches auch in hohen
Auflösungen flüssige Frameraten
zu liefern vermag.
Wie funktioniert
Multisampling?
Im Gegensatz zum
Supersampling des Voodoo 5, KYRO, RADEON und GeForce256/2 werden
beim Multisampling nicht alle Subpixel mit unterschiedlichen
Texturwerten versehen, sondern pro Pixel 1 Texturwert auf alle
Teilpixel angewandt. 4faches Supersampling erforderte das Rendering
von 4 kompletten Pixeln, inklusive Texturierung und Filtering jener
Texturstellen. Das Multisampling-Verfahren beschränkt sich auf die
Nutzung eines einzelnen Texturwertes für alle 4 Subpixel, die "Anti-Aliasing"-Wirkung
beschränkt sich daher auf die Kantenglättung. Texturflimmern,
welches bei Supersampling ebenfalls reduziert wird, bleibt mit
Multisampling grundsätzlich unangetastet und muss für dieselbe
Gesamtqualität durch besseres Texturfiltering kompensiert werden.
Der GeForce3
generiert für jedes Bild mehrere "Samples", d.h. jedes
Pixel wird intern an mehreren Stellen abgetastet und geprüft, ob
das Dreieck in den entsprechenden Bereich fällt. Der GeForce3-Chip
kann dabei ohne Füllratenverlust pro Pixel bis zu 4 Samples
erzeugen, d.h. bei aktiviertem 4X FSAA leistet der GeForce3
weiterhin theoretisch maximale 800 Millionen Pixel pro Sekunde, im
Gegensatz zu anderen Grafikchips, deren Leistung mit FSAA sinkt.
Jedes Subpixel wird dabei individuell schattiert (basierend auf der
Dreiecksfarbe und Vertex Lighting), nutzt allerdings denselben
Texturwert.
Folgende
Illustration die Auswirkung einer unterschiedlichen Positionierung
der Abtastpunkte: (2X)

fahren Sie mit der Maus über das Bild und sehen
Sie das Resultat zweier unterschiedlicher Sampling-Positionen
Die beiden
unterschiedlichen Positionen entsprechen dem
GeForce3-Abtastungsmuster bei 2fachem Full Scene Anti Aliasing, d.h.
das zweite Subpixel wird diagonal nach links oben verschoben (RG,
Rotated Grid) erzeugt. Beachten Sie die unterschiedlichen Treppenstufen je nach
Sample-Position.
Folgend die
Wirkungsweise auf einem kompletten 3D-Bild

fahren Sie mit der Maus über das Bild und sehen
Sie das Resultat zweier unterschiedlicher Sampling-Positionen (erzeugt mit FSAASim,
Fullon3D)
Beachten Sie, dass die
Texturwerte in dem Bild nicht verändert werden (gut zu sehen am Asphalt), nur die Kanten werden
behandelt. Folgendes Differenz-Bild verdeutlicht, dass sich das Bild nur
an den Rändern hat.
Überlagert man
die beiden Teilbilder wird klar, dass das Dreieck an den Rändern in
seiner echten Form besser erfasst wird, die Kante wird glatter und
nähert die echte, schwarze Kante besser an.

Die generierten
Subsamples werden miteinander vermischt und erzeugen das neue,
kantengeglättete Bild. Jedes Teilbild fliesst dabei zu 50% in die
Vermischung mit ein, so dass schlussendlich ein neues Bild mit
geglätteten Kanten resultiert. Wie genau diese Vermischung im GeForce3
implementiert ist, bleibt vorläufig unklar. Möglich wären "T-Buffer"-ähnliche
Realisierungen mit dem Speichern mehrerer Teilbilder in derselben
Auflösung - oder ein höher aufgelöstes Zwischenbild, wie es beim
GeForce2 zum Einsatz kommt.

fahren Sie mit der Maus über das Bild und sehen
Sie das Resultat der Vermischung zweier Bilder mit leicht unterschiedlichen Sampling-Positionen (erzeugt mit
FSAASim)
Klar ist bisher
lediglich, dass der GeForce3 für alle Subsamples die Bild- und
Tiefeninformationen im Speicher ablegen muss, d.h. der GeForce3
benötigt gleich viel z-Buffer- und Framebuffer-Bandbreite und
Speicherplatz wie der GeForce2, bei der Texturspeicherbandbreite
wird jedoch nur die Hälfte (2X FSAA) bzw. nur ein Viertel (4X FSAA)
davon benötigt, womit die deutlich gesteigerte FSAA-Leistung des
GeForce3 begründet ist.
Positionierungsdurcheinander
Bei der
Kantenglättungsqualität von Full Scene Antialiasing ist nicht nur
die Anzahl Subpixel, sondern insbesondere deren Positionierung enorm
wichtig für das Endresultat. 3dfx erreichte mit 2 Subpixeln dank
gedrehtem Positionierungsraster (Rotated Grid; ab jetzt "RG") in vielen Fällen die
Qualität von 4fachem Anti Aliasing mit regulärem Abtastungsgitter.
Denselben Weg geht NVIDIA mit dem Multisampling Full Scene Anti
Aliasing, indem das Abtastungsgitter um 45° gedreht wird.

An den roten
Punkten wird jeweils auch ein Texturwert gelesen und gefiltert. Beim
GeForce3 wird der in der Mitte gelesene Texturwert auch für das
blaue Subpixel genutzt, während Geforce2 und Voodoo 5 jeweils zwei
verschiedene Texturwerte lesen (müssen).
Während beim
GeForce2 die beiden Abtastungspunkte auf einer horizontalen Gerade
liegen (und dadurch annähernd horizontale Kanten nur sehr schlecht
glätten), sind die Subpixel beim Voodoo 5 und beim GeForce3 in der
Achse leicht verschoben. Beim Voodoo 5 liegen sie ca. 35° geneigt
innerhalb des Pixels, beim GeForce3 wird ein Subpixel im Zentrum des
Pixels generiert und ein weiteres an der oberen linken Ecke. Die
GeForce3-Positionierung ergibt eine Drehung des Rasters um 45°, was
zwar für 2 Subsamples nicht ganz ideal ist, sich in der Praxis aber
kaum von den 35° des Voodoo 5 unterscheiden dürfte.
Folgende Grafik
konkretisiert die Wichtigkeit der Positionierung der Samples
innerhalb des Pixels.

Die erste
Illustration zeigt, wie das Dreieck auf dem Bildschirm aussehen
würde, wenn kein FSAA aktiviert ist. Plötzlich wechselt die Farbe abrupt
vom einen Pixel zum nächsten, der bekannte und störende
Treppeneffekt.
Während das 2x
FSAA des GeForce2 bei dieser Kante gerade mal einen Pixel mit einer
Mischfarbe einfärben kann, gelingt dies dem GeForce3 bereits mit 5
Pixeln, was zu einer natürlicheren und besseren Glättung der Kante
führt. Beim GF2 fallen fast alle Subpixel entweder in den schwarzen
Bereich, oder dann abrupt in den weissen Bereich, so dass eine
sinnvolle Interpolation kaum möglich ist. Beispiele dieser Art
lassen sich sehr einfach konstruieren und beobachten, da diese
Fälle bei allen Kanten auftreten, die annähernd horizontal bzw.
vertikal liegen. Bei stark geneigten Kanten ist die
Positionierung weniger relevant, da bei diesen Kanten wegen den
kürzeren Treppenabständen sowieso weniger Pixel zur Interpolation
zur Verfügung stehen.
Festzuhalten
bleibt an dieser Stelle, dass nur ein gedrehtes
Abtastungsmuster eine optimale Verteilung der Schattierungen
erlaubt. Um die Qualität nun weiter zu verbessern, müssen weitere
Subpixels genutzt werden, so dass mehr als nur 1
Zwischenschattierungsfarbe möglich wird.
Qunincux™, der
Wischi-Waschi-Modus
Interessant ist
nun der spezielle Quincunx™-Modus, der für das Endbild 5 Subpixel
miteinander vermischt, jedoch immer noch nur 2 eigene Subpixel pro Pixel
berechnet und daher weiterhin in die Kategorie des 2X FSAA gehört.

Für 2X
Quincunx™ Full Scene Anti Aliasing (der komische Name stammt vom
Muster, welches tatsächlich so heißt und auch auf jedem Würfel zu
finden ist) mit einem 5tab Filter werden
die Randsubpixel der benachbarten Pixel mit in die
Filtering-Berechnung für den Endpixel mit einbezogen. Da hier 3 der
5 Subpixel recycelt werden, führt dieses Verfahren zu
einem Überfiltern ("Blurring" im Klartext) der Kanten sowie
der Texturen. Man kann argumentieren wie man will, generell gilt Überfilterung
als unschöne Lösung. Da keine neue Information über das Bild
berechnet wird, kann das Bild theoretisch auch nicht besser
aussehen. Allerdings können solche Filter unter
gewissen Umständen trotz der Nebenwirkung des "verwaschenen
Look" auch zu einem positiveren Endergebnis führen, wie
beispielsweise der nachgeschaltete "22bit"-Filter des
Voodoo 3 belegt. Auch auf Kantenebene
kann das überfilterte Quincunx™-2X RGMS des GeForce3 unter Umständen
besser aussehen als gewöhnliches 2X RGMS. Mit dem 5tab-Filter
werden jedoch auch die Texturen überfiltert, was gemeinhin nicht
sehr beliebt ist. Wer sich an diesem Blurring stört, kann sich auf
den zuvor beschriebenen 2X Kantenglättungsmodus mit 2tab-Filter
beschränken, NVIDIA bietet beide Betriebsmodi in den Treibern an.

NVIDIA - Treibermenü: Quincunx = 2x + Filter
Qualitätsmäßig
liegt NVIDIA's 2X und 2X Quincunx Anti Aliasing recht nahe an der
Kantenglättungsqualität des üblichen 2x2-Modus (4X) des GeForce2,
der Leistungseinbruch liegt jedoch noch unterhalb jenes des
1x2-Modus (2X) des GeForce2. Die Leistung des Quincunx™-Modus
ist dabei etwas schlechter als jene des reinen 2X-Modus, da der Chip
für die Vermischung 3 zusätzliche Pixel aus dem Speicher lesen
muss, bevor das neue Pixel generiert werden kann.
4faches Full Scene
Anti Aliasing
Ältere,
weniger fordernde
Spiele erlauben auch den Einsatz von 4fachem Full Scene Anti
Aliasing, ohne dass die Spielepartie dabei zur Ruckelorgie verkommt.
Der GeForce3 bietet gemäss Marketingdokumentation auch 4faches
Multisampling an, jeweils ohne Blurring mit einem 4tab-Filter sowie
mit Blurring mit einem nachgeschalteten 9fach-Filter. Letzteres ist
zum Testzeitpunkt mit den vorliegenden Detonator-Treibern noch nicht
in den Treibermenüs implementiert.

Im Gegensatz
zum 2X - Modus ist das 4X FSAA des GeForce3 nicht mehr "Rotated
Grid", sondern lediglich "Moved
Grid" und daher qualitativ auf Kantenebene nicht besser als
das 4fache FSAA des GeForce2.

Wie die Grafik
zeigt, bringt der Wechsel zu 4X bei dieser Kante kaum etwas, gerade
mal ein zusätzlich anders schattierter Pixel wird eingefügt, wobei
die doppelte Arbeit anfällt. Besser wäre 4faches FSAA mit
gedrehtem Abtastungsmuster.
Wie beim
2X-Modus bietet der GeForce3 auch bei der 4X-Variante einen "Quincunx"-Mode
an, der einen 9tab-Filter nutzt.

Beim Berechnen
des Endpixels werden jeweils die Randsubpixel der benachbarten
(zuvor berechneten) Pixel
mit eingerechnet, d.h. im 4X Quincunx-Mode werden pro Pixel 9
Subpixel gelesen und 4 Subpixel berechnet. Pro Pixel wird dabei nur
1 Texturwert gelesen und gefiltert. Dieser wird auf alle 4
berechneten Subpixel angewandt. Durch das
zusätzliche Blurring kann wie bei der 2X-Methode der subjektive Eindruck
besserer Kantenglättung entstehen, in Wirklichkeit sind im Bild
jedoch nicht mehr Informationen enthalten als im normalen
4X-Modus.
Und was ist mit
Texturflimmern?
Der Vorteil von
Multisampling ist zugleich sein Nachteil. Da das Verfahren denselben
Texturwert auf alle Subpixel anwendet, erreicht man damit trotz
gleichbleibender Kantenglättungsqualität massiv höhere Frameraten.
Texturspeicherbandbreite wird gespart, was sich speziell bei
TrueColor-Rendering enorm positiv bemerkbar macht. Gleichzeitig
werden jedoch gewisse Aliasing-Artefakte, welche beim Supersampling
reduziert werden, nicht behoben.
So hat das
Multisampling des GeForce3 keinen Einfluss auf die Texturen, d.h.
das speziell in Spielen mit weiten Sichtfeldern (z.B.
Flugsimulationen) das lästige Texturflimmern nicht verbessert wird.
Dieses Manko lässt sich individuell durch
den Einsatz besserer anisotropischer Filterung (8tab, 16tab,
...) kompensieren, doch dann muss man weitere Leistungseinbrüche
akzeptieren.
Generell finden
wir Multisampling-Lösungen den heute üblichen Supersampling -
Verfahren überlegen, sofern der Chip gleichzeitig gute
Filtering-Algorithmen zur Wahl stellt. Durch die getrennte
Einstellungsmöglichkeit von Texturfiltering und Kantenglättungsqualität
lassen sich die Features individueller auf die eigenen Bedürfnisse
und die jeweiligen Erfordernisse der Spiele anpassen.
Qualitätsrangliste
Die erzielte
Qualität der verschiedenen Full Scene Anti Aliasing ist immer
wieder Anlass für längere Diskussionen. Dabei wird meist auf
Screenshots zurückgegriffen, wobei diese auch durch
unterschiedliche Texturfilter verfälscht sein können.
Grundsätzlich
lässt sich die FSAA-Qualität in zwei Bereiche unterteilen:
a) Kantenglättungs-Qualität
und
b) Reduktion von Pixelflimmern
Die Rangliste
in den einzelnen Teilsegmenten gestaltet sich wie folgt:
a) Kantenglättung
1) 16X
SuperScene Multisampling (3D Labs)
2) 4X T-Buffer Rotated Grid Supersamling (V5)
3) 4X Quincunx Multisampling (GeForce3)
4X Ordered Grid Super Sampling 2x2 (GeForce2,
KYRO, RADEON)
4) 2X T-Buffer Rotated Grid Supersampling (V5) und 2X / 2X Quincunx Full
Scene Anti Aliasing (GeForce3)
5) 2X Ordered Grid Super Sampling 1x2 (GeForce2, KYRO, RADEON)
Ob "Blurring" von Szenen nun gut oder schlecht ist, möchten
wir an dieser Stelle nicht weiter erörtern, weshalb wir die verschiedenen
2X und 4X-Varianten von NVIDIA nicht weiter unterschieden haben.
b)
Texturflimmern
1) 4X T-Buffer Rotated Grid Supersamling (V5) und 4X Ordered Grid
Super Sampling 2x2 (GeForce2, KYRO, RADEON)
2) 2X T-Buffer Rotated Grid Super Sampling (V5) und 2X Ordered Grid
Super Sampling 1x2 (GeForce2, KYRO, RADEON)
3) 16X
SuperScene Multisampling (3D Labs),
2X/4X Full Scene Anti Aliasing (GeForce3)
FSAA mit MDK2
Das erste
Spiel, welches wir dem umfassenden FSAA-Test unterzogen, ist MDK2.

Der GeForce3
verliert mit 4X OGMS bis zu 93% seiner Leistung. Interessant ist
hier eindeutig der 2X RGMS-Modus, der optisch kaum vom 4X-Modus zu
unterscheiden ist. Bei 1024x786 verliert der GeForce3 nur 11% seiner
Leistung, wobei die erzielte Kantenqualität vergleichbar mit jener
bei einer Auflösung von 2048x1532 ist.
Deutlich auch
zu sehen, dass der Quincunx-Filter bei 1024x768x32 weitere 22% der
Leistung kostet, Leistung, die unserer Meinung besser in
anisotropisches Filtering investiert wird.

Deutlich zu
sehen die krassen Leistungsunterschiede mit aktiviertem FSAA.
Multisampling ist deutlich schneller als Supersampling, bei
ähnlicher Kantenglättungsqualität.
FSAA mit MBTR
Rennspiele
gelten seit jeher als ideales Einsatzgebiet für Full Scene Anti
Aliasing, da die am Horizont und an den Karossen sichtbaren
Kantenstrukturen stark störend wirken. Entsprechend vermassen wir
MBTR mit dem neuen GeForce3-Feature:

Schön zu
sehen, dass er GeForce3 bis 1024x786 kaum Leistung verliert, mit
keinem der FSAA-Modi. Leider liefert MBTR keinen (angeglichenen)
Tiefstwert zurück, denn der Eindruck bei den höheren Auflösungen
täuscht klar. Trotz durchschnittlichen 40 fps bei 1280x1024 gibt es
während dem Benchmarkablauf immer wieder entscheidende Ruckler,
welche bei 1024x768 nicht auftreten. Spielen mit FSAA bleibt daher
bis und mit 1024x768 eine Option.

Ähnliches
Leistungsverhalten zeigt sich mit aktiviertere 16bit-Grafik, wobei
der GeForce3 noch weniger Leistung verliert. Doch auch hier zeigen
sich in den höchsten Auflösungsstufen teilweise starke Ruckler,
möglicherweise verursacht durch Texturswapping.

Speziell beim
Einsatz von TrueColor gewinnt der GeForce3 das Rennen gegen die
Supersampling-Konkurrenz.

Vergleichen Sie selbst! (PNG,
5120x768)
(v.l.n.r: 2X RGMX, 2X Quincunx, 4X OGMS, 4X OGSS, 2X RGSS, 4X RGSS)
Sehen Sie die
Wirkung der Modi auf die Texturen im Detail (4X ZOOM aus
1024x768x32bit):

Qunincux
verschmiert als einziges Verfahren die hochauflösenden Texturen der
Trucks.
Sehen Sie nun
die Wirkung der einzelnen Verfahren auf die Kanten:

Die 2X
RG-Verfahren (Rotated Grid) erreichen fast die Qualität der 4X -
Methoden.
FSAA mit NASCAR
Heat
NASCAR Heat
arbeitet beim GeForce3 ohne FSAA vollständig am CPU-Limit - ein
ideales Szenario, FSAA und bessere Texturfilter dazuzuschalten.

Die 2X-Modi
lassen sich ohne Geschwindigkeitsverlust betreiben, der 4X-Modus
macht sich erst bei 1280x1024 bemerkbar (-30%), die Frameraten
bleiben jedoch über 40 fps.

FSAA scheint
mit allen Boards möglich, bei denen mehr als durchschnittliche 40
fps geboten werden. Der GeForce3 liefert diese Leistung in allen
Qualitätsstufen.

Vergleichen Sie selbst! (PNG,
5120x768)
(v.l.n.r: 2X RGMX, 2X Quincunx, 4X OGMS, 2X RGSS, 4X RGSS)
Damit Sie die
Qualität der Verfahren etwas besser einschätzen können, folgend
einige gezoomte (4fach) Ausschnitte aus dem Spiel:

Im 4fach-Zoom
wird die Unschärfe des Quincunx ersichtlich. Doch auch beim Voodoo
5 sind die Texturen unschärfer, was auf standardmässig
konservative LOD-Settings zurückzuführen ist.
Die
Kantenglättung der einzelnen Verfahren ist ähnlich, das 4fache
OGMS scheint kaum besser als das 2X RGMS-Verfahren. 4X RGSS hebt
sich vom Rest allerdings ab.
FSAA mit Descent3
Descent3 ist
ein älteres DirectX6-Spiel, welches ohne FSAA Frameraten im 150
fps-Bereich liefert. Das ist im Normalfall "zu viel", da
selbst die Tiefstwerte über den 60 fps liegen. Der Einsatz von FSAA
bietet sich an.

Hier verliert
der GeForce3 überraschend viel seiner Leistung, bleibt aber dennoch
bis 1024x768 über den 60 fps. Interessanterweise ist der 2X
Quincunx - Modus langsamer als der 4X-Modus, offenbar kostet das
Filtering der 5 Pixel hier mehr Leistung als das Schreiben von 4
Subpixeln ohne Filtering.

Fast an der
Spitze: Der GeForce3 liefert mehr als 60 fps mit 2X FSAA, die
Tiefstwerte liegen um die 40 fps.
FSAA mit Need for
Speed: Prosche
Rennspeile wie
The Need for Speed profitieren viel mehr von Full Scene Anti
Aliasing als schnelle Action-Shooter des Typs Quake 3. Mit FRAPS
vermassen wir den Rennspielknüller NFS Porsche mit den
verschiedenen FSAA-Modi.


Auch hier zeigt
sich, dass der Quincunx-Filter mehr Leistung verschlingt als
erwartet. 2x Quincunx ist gleich schnell wie 4X FSAA. Probehalber
aktivierten wir in der Registry den 4x Quincunx-Modus, der noch
nochmal deutlich langsamer ist, aber keinen optischen Vorteil mehr
bietet.

Der
NVIDIA-Beschleuniger liefert die besten Frameraten mit aktivertem
FSAA. Optisch ist die erreichte Qualität der einzelnen Chips jedoch
nicht ganz vergleichbar.

Vergleichen Sie selbst! (PNG,
5120x768)
(v.l.n.r: 2X RGMX, 2X Quincunx, 4X OGMS, 2X RGSS, 4X RGSS)

Um 4faches
Quincuxx in der Praxis von 2fachen Quincuxx zu unterscheiden, braucht man schon
sehr gute Augen - der nachgeschaltete Filter dominiert die Wirkung
und verwischt die wenigen Zusatzstufen, welche 4X OGMS gegenüber 2X
RGMS einfügt.
Anisotropisches
Filtering
Texturfiltering
stellt weiterhin ein wichtiges Feature in der 3D-Grafik dar.
Während die ersten 3D-Boliden anno 1995 noch mit bilinearem
Filtering aufwarteten, gehört einfaches anisotropisches Filtering
mit 8 Texturwerten mittlerweile zum State-of-the-Art.
Im GeForce3
implementierte NVIDIA nun erstmals fortgeschrittenes anisotropisches
Filtering, das seinem Namen auch gerecht werden kann. Der GeForce3
kann bis zu 64
Texturwerte lesen (64tab). Die Zugriffe erfolgen dabei aus
verschiedenen MIP-Maps ("anisotropisch trilinear") im
Gegensatz zum RADEON, der zwar auch 64 Texel lesen kann, jedoch
trilineares Filtering nicht im Zusammenhang mit anisotropischem
Filtering nutzen kann.
Das Problem mit
dem anisotropischen Filtering des GeForce3 ist, dass es sich nicht
in allen Treibern aktivieren lässt und wenn, dann nur über einen
Registry-Hack. In der Treiber-Version 11.01 findet sich im
Registry-Pfad für das erzwingen des anisotropischen Texturfilters
unter OpenGL unter:
HKEY_LOCAL_MACHINE \
System \ CurrentControlSet \ Services \ Class \ DISPLAY \ 0000 \
NVidia \ OpenGL
der Schlüssel "DefaultLogAniso"=dword:0000000X,
wobei "X" für einen Wert zwischen 0 und 3 steht und die
Potenz ausdrückt, welche die Anzahl Texturwerte ergibt, welche
gelesen werden (2x=Anzahl Texel pro Textur).
| X-Wert |
Anzahl
Texel |
| 0 |
8 (kein
anisotropisches Filtering, trilineares Filtering) |
| 1 |
16 (8fach
anisotropisch pro MIP MAP) |
| 2 |
32 (16fach
anisotropisch pro MIP MAP) |
| 3 |
64 (32fach
anisotropisch pro MIP MAP) |
Auch unter Direct3D
lässt sich anisotropisches Filtering aktivieren, allerdings nur bei
den Treibern der Version 11.01 erzwingen. Der Schlüssel zum
Erzwingen des Filters findet sich unter:
HKEY_LOCAL_MACHINE \
System \ CurrentControlSet \ Services \ Class \ DISPLAY \ 0000 \
NVidia \ Direct3D
und lautet:
"FORCEANISOTROPICLEVEL"=dword:0000000X
Für X gelten
dieselben Regeln wie unter OpenGL.
Hoffentlich behebt
NVIDIA demnächst die mangelnden Optionen in den Treibern, diese
Einstellungsmöglichkeiten dürften sich vom Treiberteam innert
wenigen Stunden in die Treiber integrieren lassen und würden
obigen Murks über die Registry ersparen.

Klar wird, dass der
GeForce3 beim Einsatz von anisotropischem Filtering viel seiner
Leistung verlieren kann. Mit 64tab anisotropischem Filtering ist das
Boards nur halb so schnell wie mit trilinearem Filtering. Es ist
nicht ganz klar, wie anisotropisches Filtering beim GeForce3
implementiert ist, wir vermuten, der Baustein benötigt zusätzliche
Taktzyklen für jede weitere Stufe. Dies kumuliert sich mit der
zusätzlich benötigten Speicherbandbreite und ergibt einen deutlich
höheren Leistungsverlust, als beispielsweise beim RADEON messbar
ist. Allerdings ist das
anisotropische Filtering des GeForce3 eine Augenweide, speziell das
32tab- und 64tab-anisotropische Filtering.

Klicken für Vollbild (4096x768,
PNG)
Im Detail-Zomm wird
ersichtlich, wieso dieses GeForce3-Feature die Bildqualität derart
massiv verbessern kann.

Anisotropisches Filtering: Wie
aus einem Pixelbrei plötzlich Strukturen sichtbar werden
Statt langweiligem
Pixelbrei liefert der GeForce3 hochwertige Texturstrukturen. Der
Baustein ist der erste Consumer-Chip, der hochwertiges und korrekt
funktionierendes anisotropisches Filtering implementiert.
Interessanterweise bleibt dieses Feature beim NVIDIA-Marketing
aussen vor und wird wohl daher auch kaum in den Testberichten
beachtet.
Optik-Verwöhnte
werden anisotropisches Filtering zusammen mit FSAA einsetzen wollen.
Ist der GeForce3 dafür schnell genug?
Die den maximalen
anisotropischen Filter gehen bis zu 56% der Leistung verloren. 2X
RGMS kostet weitere 10% Leistung, dennoch liefert der GeForce3 in
MDK2 satte 60 fps. Mit 4X OGMS und 64tab anisotropic Filtering
bricht die Leistung um ca. 73% ein, womit wir bei einem
Leistungsverlust wären, der ungefähr dem 4X Supersampling
entspricht.
Overclocking
Zum Schluss gaben wir
den Boards noch die Sporen - Overclocking! Da beide Boards
Vorserienmuster sind, lassen sich noch keine Angaben über das
endgültige Overclocking-Potential geben.

Wenn auch die Gewinne
sind bei MDK2 relativ bescheiden ausfallen, der erhöhte
Speichertakt setzt sich hier zu 100% um. Bei 250 MHz Core-Takt
(+25%) und 265 MHz Speichertakt (+15%) gewinnt man 15%
Leistung.

Der ultimative
Stress-Test - die 3D Mark Nature-Szene - gewinnt insbesondere durch
die Erhöhung des Chiptakts, wodurch die Geometrieleistung in die
Höhe getrieben wird. Eine Erhöhung des Chiptakts um 20% ergab hier
bis zu 19,2% bessere Frameraten.
Fazit
NVIDIA did it
again. Nach dem GeForce256, dem GeForce2 GTS, dem GeForce2 ULTRA
wirft man mit dem GeForce3 einmal mehr ein unangefochtenes
Spitzenprodukt auf den Markt, das allen anderen Mitbewerbern
bezüglich Features und vor allem Leistungsfähigkeit überlegen
ist. Erfreulich dabei ist, dass die in den vergangenen Jahren steil
nach oben gerichtete Preiskurve für High-End-Beschleuniger nun
endlich wieder nach unten zeigt, auch wenn die geforderten 900 Mark
(Strassenpreis Mai 2001) für einen derartigen
High-End-Beschleuniger immer noch für viele unerschwinglich bleiben
werden. Das bessere Preis-/Leistungsverhältnis wurde diesmal durch
effizientsteigernde Massnahmen (Lightspeed Memory Architecture)
ermöglicht, so dass für die Steigerung der Leistung auf noch
exotischeren und teureren Speicher verzichtet werden konnte.
 |
 |
 |
| May
Payne, Unreal 2 und X-Isle: Dinosaur Island sollen einst die
neuen Features nutzen - wann und ob diese Spiele erscheinen,
ist noch unklar |
Dem Vorurteil,
man könne das Potential des GeForce3 mangels DX8-Spielen nicht
nutzen, stimmen wird dagegen überhaupt nicht zu, im Gegenteil. Der
GeForce3 ist das NVIDIA-Produkt, mit dem bei seiner Einführung
bisher grössten Praxisnutzen. Damit ist weder einer der
integrierten Shader-Prozessoren angesprochen, noch andere
hippige DirectX8-Features. Das
Multisampling des GeForce3 ist eines der besten Features des
Bausteins, da es direkten Nutzwert für den Endkunden liefert.
Kantenglättung gilt als eines der wichtigsten Features zur
Verbesserung der 3D-Optik, schön zu sehen, dass NVIDIA dieses
Problem gezielt mit dem GeForce3 angegangen ist. Im Gegensatz zu Vertex
Shadern, Freiformflächen und Pixel Shadern benötigt das Full Scene Anti Aliasing keinerlei
Spieleunterstützung und lässt sich bei den meisten
Spielen sofort aktivieren, oft sogar ohne Leistungseinbruch.
Besonders der 2X-Modus dieses "High Resolution Anti Aliasing"
erscheint uns interessant, bietet dieser dank der Drehung des
Abtastungsrasters annähernd "4X"-Qualität bei einem
Leistungseinbruch, der weit unter jenem des üblichen 2X Supersampling
liegt. Die 4X-Verfahren sind durch den schnelleren
Multisampling-Ansatz zwar ebenfalls interessant, bieten dabei aber,
wenn überhaupt, nur geringfügig bessere Qualität gegenüber dem 2X-Verfahren.

4x4 Evoluiton: Spezialeffekte
mit Pixel- und Vertexshader
Vor allem, da
das Anti Aliasing des GeForce3 seine Wirkung nicht innerhalb der
Dreiecke entfaltet, würde auch das qualitativ hochwertige und
wichtige anisotropische Filtering den GeForce3 auszeichnen.
Damit liessen sich sowohl Texturflimmern wie auch verwaschener Look
aus den Spielen verbannen, doch angesichts des mangelhaften
Treiberkomforts zum aktuellen Zeitpunkt muss NVIDIA diesbezüglich
ganz klar nachbessern. Steinzeitromantik mit
Windows-Registry-Hacks sind sicher nicht das, was der Käufer von einer
900-Mark-Grafikkarte erwartet und uns erscheint schleierhaft, wieso
NVIDIA dieses wichtige Feature nicht in die Treibertabs integriert,
denn die Features funktionieren, sie werden dem 0815-Kunden jedoch
komischerweise vorenthalten. Die Treiberoptionen schlagen das Produkt klar unter dem Wert, mit
nur geringem Aufwand (1 Nachmittag?) seitens des Treiberteams ließe sich aus einer
GeForce3-Karte deutlich mehr herausholen, so zum Beispiel erzwingbares
anisotropisches Filtering unter Direct3D, optionales
Supersampling statt Multisampling, standardmässig aktivierter S3TCQuality-Fix und
generell bequemere Benutzerführung in den doch immer noch
etwas fummeligen Menüs.
Insgesamt
scheint der GeForce3-Chip jedoch gelungen und ausgewogen. Zwar existiert generell
Verbesserungspotential bei Leistungsfähigkeit des Vertex Shaders
und der Effizienz des anisotropischen Filtering, doch die allgemeine
Effizienzverbesserung durch die Lightspeed Memory Architecture, die
neuen Features und den angesprochenen Nutzwert durch FSAA
machen den
GeForce3 deutlich attraktiver und abgerundeter als beispielsweise
den GeForce2 ULTRA, der nur durch seine Basis-Geschwindigkeit in
älteren Spielen überzeugen kann.
Die beiden hier
vorgestellten GeForce3-Produkte decken bereits die meisten
Bedürfnisse ab. Einen TV-Ausgang bieten die Karten aller
Hersteller, die Unterschiede liegen in der weiteren Hard- und
Softwareausstattung. Spielevollversion oder DVI-Anschluss und
BlueOrb-Lüfter, so lautet
die Qual der Wahl zwischen der 3D Prophet III und der GLADIAC
920. Leistungsmäßig
sind beide Karten ansonsten gleichwertig einzustufen.
Links
-
3D
Concept: GeForce3 Lightspeed Memory Architecture
-
3D
Concept: GeForce3 Launch Report
-
3D
Concept: Pixel Shader In-Depth
-
3D
Concept: Vertex Shader Preview
-
3D
Concept: Interview mit Massive (Aquamark)
-
ELSA
GLADIAC 920 Test, Hartware, deutsch
-
ELSA
GLADIAC 920 Test, tecchannel, deutsch
-
ELSA
GLADIAC 920 Test, GeForceCenter, deutsch
-
ELSA
GLADIAC 920 Test, Hardwares.de, deutsch
-
MSI
Starforce 822 Test, Rivastation, deutsch
-
MSI
Starforce 822 Test, Chip, deutsch
-
VisionTek
GeForce3 Review, ProCooling, englisch
-
VisionTek
GeForce3 Review, Riva3D, englisch
-
VisionTek
GeForce3 Review, Tech-Zone, englisch
-
VisionTek
GeForce3 Review, AMDMB, englisch
-
VisionTek
GeForce3 Overclocking, xbitlabs, englisch
-
VisionTek
GeForce3 Review, Geek Vortex, englisch
-
VisionTek
GeForce3 Review, Beyond3D, englisch
-
VisionTek
GeForce3 Review, Yoink3D, englisch
-
VisionTek
GeForce3 Review, Hardware Daily, englisch
-
VisionTek
GeForce3 Review, PCRave, englisch
-
VisionTek
GeForce3 Review, Maximum3d, englisch
-
VisionTek
GeForce3 Review, NVNews, englisch
-
NVIDIA
GeForce3 Review, CGO, englisch
-
NVIDIA
GeForce3 Review, Anandtech, englisch
-
NVIDIA
GeForce3 Review, Sharky Extreme, englisch
-
NVIDIA
GeForce3 Review, GamePC, englisch
-
NVIDIA
GeForce3 Review, Gamespot, englisch
-
NVIDIA
GeForce3 Review, Firingsquad, englisch
-
NVIDIA
GeForce3 Review, Avault, englisch
-
NVIDIA
GeForce3 Review, HardOCP, englisch
-
NVIDIA
GeForce3 Review, NVNews, englisch
-
NVIDIA
GeForce3 Review mit P4, Digit-Life, englisch
-
NVIDIA
GeForce3 Review, Digit-Life, englisch
-
NVIDIA
GeForce3 Review, xbitlabs, englisch
-
ELSA
GLADIAC 920 Review, Amazon International, englisch
-
ELSA
GLADIAC 920 Review, Overclockers online, englisch
-
ELSA
GLADIAC 920 Review, EuroGamer, englisch
-
Hercules
3D
Prophet III Review, TBreak, englisch
-
Hercules
3D
Prophet III Review, ActiveWin, englisch
-
Hercules
3D Prophet III Review, 3DGuru, englisch
-
Hercules
3D Prophet III Review, Digit-Life, englisch
-
Hercules
3D Prophet III Review, Overclockers, englisch
-
Gigabyte
GV-GF3000D Review, Electric, englisch
-
Leadtek
Winfast GeForce3, Digit-Life, englisch
-
Prolink
Pixel View XX-Player, Dans Data, englisch
-
NVIDIA
GeForce3 Review, Hardware-France, français
-
ELSA
GLADIAC
920 Review, Clubic.com, français
-
ELSA
GLADIAC 920 Review, NVChips-fr, français
-
ELSA
GLADIAC 920 Review, Puces3D, français
-
The
Theorie of Anti Aliasing, Fullon3D, englisch
-
Multisampling
Anti Aliasing Explained, Firingsquad, englisch
-
Supersampling
Analysed, 3dfx Interactive, englisch
-
KYRO
II & GeForce3 In-Depth Teil 1, Ace Hardware, englisch
-
KYRO
II & GeForce3 In-Depth Teil 2, Ace Hardware, englisch
-
NVIDIA
Werbebroschüre Lightspeed Memory Architecture, pdf,
englisch
-
NVIDIA
Werbebroschüre HRAA, pdf, englisch
-
NVIDIA
Werbebroschüre Pixel Shader, pdf, englisch
-
NVIDIA
Werbebroschüre DX8, pdf, englisch
-
NVIDIA
Werbebroschüre nFinite FX Engine, pdf, englisch
Grafikkarten mit
GeForce3-Baustein
| Produkt |
Hersteller |
Speicher |
TV-Out |
DVI |
Besonderes |
| GLADIAC
920 |
ELSA |
64
MB DDR 3.8 ns |
+ |
- |
Mouse
Pad, Giants Vollversion |
| 3D
Prophet III |
Hercules |
64
MB DDR, 3.8 ns |
+ |
+ |
Blaues
PCB, Blue Orb, Sticker |
| GeForce3 |
Visiontek |
64
MB DDR 3.8 ns |
+ |
- |
|
| GF-3000 |
Gigabyte |
64
MB DDR |
+ |
- |
|
| Pixelview
XX-Player |
Prolink |
64
MB DDR, 3.8 ns |
+ |
- |
|
| Winfast
GeForce3 |
Leadtek |
64
MB DDR, 4ns |
+ |
+ |
silberne
Kühlkörper, Mouse Pad, Handauflage, Spiel |
| GeForce3
PowerPack III |
Gainward |
64
MB DDR 3.8 ns |
+ |
+ |
rotes
PCB / Kühler |
| Starforce
822 |
MSI |
64
MB DDR |
+ |
- |
|
|