Wyniki wydajności na ustawieniach domyślnych Na pierwszy ogień porównanie wydajności przy domyślnych ustawieniach na platformach KT133A i nForce 2 Ultra 400.
(You need to Login or Register to view media files and links) (You need to Login or Register to view media files and links) (You need to Login or Register to view media files and links) (You need to Login or Register to view media files and links) (You need to Login or Register to view media files and links) (You need to Login or Register to view media files and links) Jak widać, im szybszy procesor tym różnica pomiędzy platformami zwiększa się. O ile Duron 750 w 3DMark2001 zyskuje niecałe 5% z przesiadki na szybszą platformę, Athlon XP-M 2500+ notuje ponad 20-procentowy wzrost wydajności. Warto zwrócić uwagę na to, iż więcej zyskują procesory pracujące na szynie FSB taktowanej częstotliwością 133MHz, niż te pracujące z szyną 100MHz.
Wydajność w zależności od platformy Dobra, za nami krótka rozgrzewka. Zobaczmy na przykładzie większej ilości testów, ile zyskuje na wydajności szybki procesor po przesiadce na wydajniejszą platformę.
(You need to Login or Register to view media files and links) Zaczyna robić się ciekawie. Nowsza platforma z lepszym chipsetem udostępnia około dwa razy większą przepustowość pamięci. Programy reagują na tą zmianę w różny sposób, lecz w testach syntetycznych widać przyrosty rzędu 60-90% wydajności! W rzeczywistości jednak, w grach powinniśmy widzieć maksymalnie 20-procentowy wzrost wydajności. Tą wartość potwierdzają testy w Quake 3 Arena i 3DMark2001, a są to testy w których wyniki zależą ściśle od wydajności całej platformy.
Co jednak stanie się, gdy porównamy jeden procesor z dwoma różnymi ustawieniami częstotliwości szyny FSB?
(You need to Login or Register to view media files and links) Porównujemy dokładnie ten sam procesor taktowany tą samą częstotliwością, pracujący na tej samej płycie głównej, jednak z dwoma różnymi ustawieniami - w pierwszym przypadku szyna FSB i pamięć taktowane są zegarem 133MHz, a w drugim - 234MHz. W tym przypadku wzrost przepustowości pamięci jest nieco mniejszy niż poprzednio, lecz znacznie zmniejsza się czas dostępu do pamięci. Nasz testowy Athlon dostaje skrzydeł - pomimo niskiej częstotliwości taktowania, wydajność rośnie o kolejne około 20%. W testach syntetycznych jak na przykład Photoworxx, który jest bardzo zależny od wydajności podsystemu pamięci, szybko taktowana szyna zapewnia 43% wzrost wydajności.
Pójdźmy zatem na całość i porównajmy kombinację najwolniejszą z najszybszą, a zatem zestawmy obok siebie KT133A taktowany zegarem 133MHz z nForce 2 Ultra 400 pracującym na szynie 234MHz!
(You need to Login or Register to view media files and links) Ciężko uwierzyć że jest to ten sam procesor! Dzięki ogromnemu zastrzykowi wydajności podsystemu pamięci, testowana jednostka w najbardziej reprezentatywnych testach (Q3A, SuperPI i 3DMark2001) zyskuje 40-50% wydajności! Testy syntetyczne, silniej zależne od podsystemu pamięci notują blisko 2,5-krotny wzrost wydajności. W teście Photoworxx testowy Athlon osiąga wydajność zbliżoną do Athlona 64 3000+, a przecież jest to procesor ze zintegrowanym kontrolerem pamięci.
Chcąc podsumować tą część testów, należy zwrócić uwagę na fakt, że wykorzystany procesor mobilny pracuje w fabrycznych ustawieniach z niską częstotliwością szyny FSB dzięki czemu może on pracować z domyślnymi ustawieniami na platformie KT133A. Pomimo tego, że nie jest to wyjątkowo szybki reprezentant Bartonów (które w wariantach dla komputerów stacjonarnych pracowały fabrycznie z szyną 166-200MHz), zapewnia 20% wzrost wydajności po przesiadce na szybszą platformę. Gdy jednak podniesiemy częstotliwość szyny FSB, szybsza platforma zapewnia co najmniej 40% wzrost wydajności.
Wydajność wszystkich procesorów Prościutkie wykresy za nami, przejdźmy do porównania które będzie wymagało głębszej analizy: porównane zostaną ze sobą wszystkie procesory na obu platformach w konfiguracji zarówno fabrycznej jak i podkręconej.
(You need to Login or Register to view media files and links) (You need to Login or Register to view media files and links) (You need to Login or Register to view media files and links) Na początek krótka legenda: kolor pomarańczowy to nForce 2, niebieski to KT133A, a szary to KT133E. Blade kolory to ustawienia fabryczne, a intensywne - podkręcone.
Pierwszy wniosek, który rzuca się w oczy, to fakt że podkręcając na platformie KT133A nie jesteśmy odzyskać strat poniesionych w wyniku przesiadki na wolniejszą platformę. Wyjątkiem tutaj jest "Appleton" który dzięki odblokowanemu mnożnikowi i niskiej fabrycznej częstotliwości FSB, procentowo po podkręceniu zyskuje zdecydowanie najwięcej względem ustawień fabrycznych. Taktowany nawet bardzo wysokim zegarem, pozostaje procesorem stosunkowo wolnym, hamowanym przez niską objętość pamięci podręcznej drugiego poziomu.
Kolejną rzeczą wartą odnotowania jest czułość poszczególnych testów na wielkość pamięci podręcznej L2. Quake III Arena jest testem najbardziej czułym, gdzie Duron 750 pracujący z parametrami Athlona 1000 zaledwie się z nim zrównuje pomimo szybszej platformy. Większa pamięć cache zapewnia Athlonowi około 20% przewagę gdy pracuje on na takiej samej płycie głównej. Na szczycie stawki widać tą samą zależność, ale dodatkowo pogłębioną: podkręcony Athlon zapewnia wydajność o 28% wyższą pomimo istotnie niższej częstotliwości taktowania. 3DMark2001SE również zapewnia solidne wzrosty przy przesiadce z Durona na Athlona (8% na korzyść tego drugiego przy porównaniu Athlona 1000 z podkręconym Duronem 750), natomiast SuperPI reaguje przy próbce 1M zdecydowanie najsłabiej na większą objętość pamięci. Zysk przy zmianie podkręconego Durona 750 na fabrycznie taktowanego Athlona 1000 to zaledwie 2%.
Jest to również miejsce w którym możemy odpowiedzieć na pytanie, czy słabszym procesorem jesteśmy w stanie dogonić szybszy wykorzystując nowszą platformę. Jak widać, jest to z całą pewnością możliwe, choć różnice w wydajności poszczególnych procesorów są tak duże, że ciężko wyczytać to z wykresów. Warto zwrócić jednak uwagę, że Athlon XP 1700+ zapewnia na platformie nForce 2 wydajność praktycznie identyczną jak Athlon XP-M 2500+ na platformie KT133A.
Więcej testów! Nie sposób przedstawić na wykresach wszystkich wyników które uzyskałem. Starałem się wybrać najbardziej interesujące porównania i testy, a następnie chciałem je przedstawić w przystępnej formie. Świadomie nie pokazałem na przykład wykresu wydajności wszystkich procesorów w Comanche 4, ponieważ byłby to wykres przedzielony na pół pomiędzy platformę szybką i wolną, z paroma przetasowaniami pomiędzy (Athlon 1000 + NF2 jest prawie tak samo szybki jak podkręcony Athlon XP-M 2500+ + KT133A). Ja osobiście jednak uwielbiam tabelki i dla osób takich jak ja przedstawiam tabelę ze wszystkimi wynikami które uzyskałem:
(You need to Login or Register to view media files and links) Mam parę uwag dotyczących całości testów. Na czerwono zaznaczyłem wyniki, które zwróciły moją uwagę i odbiegają od normy.
Podkręcony Athlon 1000 notuje na platformie nForce niższą wydajność w teście 4 3DMarka03. Jest to test ściśle zależny od karty graficznej, co potwierdzają pozostałe wyniki (wszystkie procesory poza Duronem 750 zapewniają taką samą wydajność), co wskazuje na pewne zmiany w ustawieniach BIOS płyty głównej Abit NF7 przy przejściu na szynę FSB 166MHz. Być może zmienia się jakiś dzielnik? Problem można byłoby próbować diagnozować z innym procesorem, albo testując przy FSB 160, lecz postanowiłem tego nie robić. Sprawę potwierdziłem wykonując testy kilkukrotnie zmieniając ustawienia pomiędzy FSB 133 a 166 - za każdym razem wyniki były powtarzalne, a był to jedyny parametr który zmieniał się pomiędzy restartami komputera.
Drugą anomalią jest wydajność podkręconego "Appletona" na płycie NF7 w teście Zlib. Jest to test bardzo czuły na objętość pamięci cache i tutaj ten procesor nie powinien uzyskiwać tak wysokiej wydajności. Wystarczy porównać jego wydajność na platformie KT133A (w tym teście użyta platforma ma pomijalne znaczenie) by zobaczyć, że coś jest nie tak. W tym przypadku również test wykonywany był kilkukrotnie.
Na koniec pozostawiam pytanie o to, czy Athlony to grzałki. Ze względu na niedoskonałość i wysoką niedokładność czujników zamontowanych na płytach Socket A (tak naprawdę mierzą temperaturę powietrza pod procesorem), a także ze względu na niekontrolowaną temperaturę zewnętrzną (w czasie testów wahała się pomiędzy 16,5*C a 24*C) postanowiłem wykonać pomiary poboru energii. Podkreślam raz jeszcze, że uzyskane wyniki są mocno niedokładne, a parametr CPU power nie uwzględnia strat na zasilaczu i sekcji zasilania płyty głównej, ale daje pewien obraz. Czy około 50W które pobiera Athlon 1000 na platformie KT133A to dużo? Patrząc przez pryzmat dzisiejszych czasów, z całą pewnością nie, ale należy wziąć poprawkę na to, że mamy do czynienia z 18-letnią platformą. Patrząc przez pryzmat ówczesnych procesorów Intela, jest to dość sporo - Tualatin zapewnia 2x niższy pobór energii przy porównywalnej wydajności, a Coppermine również pobiera mniej energii. Nie jest to jednak coś, czego nie dało się rozproszyć ówczesnymi układami chłodzenia. Sprawy przebierają odmienny obrót, gdy uwzględnimy wyniki podkręcania. 135W na platformie która pracuje na linii +5V robi wrażenie, a 154W na NF7 pobierane przez podkręconego Athlona XP 1700+ wykracza poza bezpieczne normy dla platformy Socket A, a pamiętam że ludzie używali takich komputerów na codzień. Uzyskane wyniki pozostawiam jednak do osobistej analizy. Uważam, że wyniki są "wporzo", a procesory są umiarkowanie łakome na prąd.
Podsumowanie Cóż można więcej dodać po takiej dawce testów, tabelek i porównań... Mam nadzieję, że udało mi się odpowiedzieć na zadane we wstępie pytania. Platforma KT133A jest dużym ograniczeniem dla procesorów Socket A, a im szybszy procesor tym większy hamulec. nForce 2 pozwala wykrzesać dodatkowe pokłady mocy nawet ze starszych procesorów na tej platformie. Ciekawe mogłoby być porównanie Tualatina z Thunderbirdem pracującym na platformie nForce2. Należy pamiętać, że Tualatin to bardzo efektywna architektura, która doskonale radzi sobie z pamięciami SDR na stareńkim (z punktu widzenia procesora) chipsecie BX440 i nie notuje wielkich korzyści z użycia pamięci Rambus bądź DDR. Thunderbird z kolei jest proceosorem "głodzonym" przez wolną szynę i niską przepustowość dostępnych ówcześnie pamięci SDR.
Na zakończenie pragnę napisać, że wszystkie testy wydajności, całość tekstu, a także wszystkie wykresy wykonałem sam przy użyciu sprzętu posiadanego przeze mnie. Tekst jest moją własnością i nie zgadzam się na publikowanie go w innych miejscach niż forum 3dfx.pl bez mojej zgody, bądź też przywłaszczanie sobie jego części bądź całości. Tematyka wydała mi się na tyle ciekawa, że poświęciłem na całość wiele godzin swojego czasu i proszę o uszanowanie tego faktu. Mając jednak to na uwadze mam nadzieję, że jest to interesujące źródło informacji i zgadzam się, a nawet zachęcam do cytowania z podaniem źródeł.