<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE html PUBLIC '-//W3C/DTD XHTML+Voice 1.2 /EN' 'http://www.voicexml.org/specs/multimodal/x+v/12/dtd/xhtml+voice12.dtd'>
<html xmlns='http://www.w3.org/1999/xhtml' xmlns:ev='http://www.w3.org/2001/xml-events'>
<head>
<link rel='stylesheet' href='http://pabi3.com/modules/items/voice.css' type='text/css' media='all' />
<form xmlns='http://www.w3.org/2001/vxml' id='title'>
<block>
The article Next-gen Intel is written by Ribi
</block>
</form>
<form xmlns='http://www.w3.org/2001/vxml' id='body'>
<block>
V poslednom case sa neustale stretavame s pojmom next-gen. Ci uz je to v suvislosti s hernymi konzolami alebo v suvislosti s nadchadzajucou generaciou pocitacovych hier, slovko next-gen ma vzdy nieco spolocne s niecim, co by malo byt v urcitom zmysle revolucne, alebo aspon mimoriadne evolucne. Teraz nastava cas, aby next-gen prisiel aj do nasich pocitacov v podobe novych procesorov od Intelu. Po takmer piatich rokoch totiz architekture NetBurst odznele konecna a uz v polovici roku 2006 nas caka nieco uplne nove.</block>
</form>
<form xmlns='http://www.w3.org/2001/vxml' id='full'>
<block>
Historia architektury NetBurst
Vsetko sa zacalo niekedy koncom roka 2000. Vtedy Intel na trh uvidol svoj prvy procesor na baze architektury NetBurst. Dosticka so 423 nozickami a jadrom Willamette skladajucim sa z asi 42 milionov tranzistorov dostala meno Pentium 4. Intel tym spravil hned niekolko zmien.Z nazvu badatelnou je upustenie od cislovania procesorov arabskymi cislicami. Pravdepodobne tak chceli chlapci od Intelu ludom ukazat, ze Pentium 4 je naozaj nieco nove, nieco vynimocne. V urcitom zmysle naozaj bolo. Mnohy boli ohromeny jeho dovtedy nevidanymi frekvenciami. V momente uvedenia na trh sa dostali modely s pracovnimi frekvenciami 1,3, 1,4 a 1,5 GHz. Intelov dovtedy najrychlejsi (aj najvykonnejsi) desktopovy procesor Pentium III sa mohol pisit frekvenciou „len“ 1 GHz. Intel tvrdil, ze vykon novych procesorov bude oproti predchadzajucej generacii 2,5 az 3-nasobne vyssi. Ale uz coskoro sa ukazalo, ze nie je vsetko zlato co sa blisti.Prve benchmarky priniesli velmi rozporuplne vysledky o vykone Pentia 4. Najrychlejsi model podaval obdobne vykony ako najrychlejsie Pentium III, ci Athlon od konkurencneho AMD. Jedine v situaciach ked sa vyuzivala jeho nova instrukcna suprava SSE2 Pentium 4 excelovalo. Takisto spolupraca s pamatou bola zavratna. Efektivne 400 MHz-ova systemova zbernica s pripustnostou vyse 3 GB/s dokazala robit divy. Vykon by sa ale dal s odstupom casu hodnotit ako velmi vysoky, pretoze programy vyuzivajuce SSE2 sa zacali pomerne rychlo mnozit.
Ak nebol problem vykon, tak bol problem cena. K uz tak drahemu Pentiu 4 ste si museli kupit nielen novu zakladnu dosku (to je vsak ale u Intelu uz od dob Pentia II samozrejmost), ale aj nove, nehorazne drahe, pamate RDRAM (napriek tomu, ze ich uz Intel asi tri roky nepodporuje, stale sa vyrabaju a skuste sa preto pozriet do nejakeho cennika) a aj novu skrinu typu ATX 2.0 s novym zdrojom, ktory bol Pentium 4 kompatibilny. Ak teda niekto mal dost penazi a chcel si kupit novy pocitac, bolo vsetko v poriadku. Horsie to uz bolo pre tu ostatnu, myslim si, ze prevazujucu vacsinu ludi.
Intel pomerne rychlo zareagoval a do niekolkych mesiacov zacal dodavat zakladne dosky a cipove supravy poporujuce pamate typu SDRAM.V kombinacii s pamatami SDRAM sa vsak dalo Pentium 4 oznacovat ako Celeron. Cena uz bola viac menej priatelna, ale vykon za to nestal. Pre mnohych vratane mna sa tak stalo prve Pentium 4 sklamanim.
Prisiel rok 2002 a s nim aj frekvencny strop vtedajsieho Pentia 4. Bola nim frekvencia 2 GHz. Napriek vsetkemu co sa napisal sa Pentia 4 predavali pomerne dobre, ale Intel si aj tak nemohol dovolit uplne sa zbavit Pentii III. Urobil jeden vtipny krok a najmodernejsie Pentium III s jadrom Tualatin premenoval na Celeron. Tym padom Pentium III mohlo vypadnut z hry a Celeronovy mohli dosahovat vyssie frekvencie, co drvivu vacsinu uzivatelov uplne uspokojovalo. To vsak este nebolo vsetko a Celerony velmi skoro dostali jadro Willamette. Tymto krokom Intel historiu architektury P6 na cas uzatvara (architektura ale bude veleuspesne znovuzrodena v podobe Pentia M).
Pentia 4 museli nutne dosahovat vyssie frekvencie, pretoze konkurencia nezahalala a AMD svojim novym Athlonom XP velmi usilovne zacalo zadupavat do zeme. Intel nezaspal a vylepsil vtedajsie Pentium 4 novym jadrom Northwood. Malo o 10 milionov tranzistorov viac, malo dvojnasobne mnozstvo pamate cache a efektivna rychlost zbernice sa zvysila na 532 MHz. Konecne pribudla podpora pamati DDR SDRAM. Nove Pentia vsak opat potrebovali novu paticu. Stal sa nou Socket 478.Aby nas Intel este trochu viac zmiatol a oddelil Pentium 4 od Celeronov, rozhodol sa, ze Socket 423 bude urceny len pre Celerony a aj Pentia 4 s jadrom Willamette zacal okamzite vyrabat len pre novy Socket. Jadro Northwood Pentium 4 naozaj omladilo a to teraz mohlo dosahovat frekvencie daleko vyssie. Takisto vykon bol o nieco vyssi a spotreba o nieco nizsia, kedze sa preslo na novy vyrobny proces, s tranzistormi o velkosti 130 nm.Nove Pentia 4 s jadrom Northwood nas sprevadzali az do konca roku 2003. Pocas tohto obdobia presli este jednou zmenou, bolo nou aktivovanie technologie Hyper Threading, vdaka ktorej mohol procesor pracovat s dvoma programovymi vlaknami sucastne a za predpokladu, ze to program umoznoval sa dal dosiahnut vykonnostny narast aj 30% na rovnakej frekvencii. Takisto efektivna rychlost zbernice bola zvysena na 800 MHz a jej priepustnost tym vzrastla na vtedy uctihodnych 6,4 GB/s. Zvysenie rychlosti bolo opodstatnene prichodom dual channel zapojenia pamati DDR SDRAM. Najrychlejsie modely, ktore sa s tymto jadrom predavali bezali na 3,2 GHz. Pentium 4 s jadrom Northwood je, ako sa zachvilu docitate, asi zatial to najpodarenejsie, co nam architektura NetBurst priniesla a Intelu pomohlo vybojovat na pomerne dlhu dobu pomyselnu korunku vykonnostneho krala az do prichodu Athlonov 64, ktoru v drvivej vacsine oblasti neprekonal dodnes.
Prichod roku 2004 sa niesol v znamenin sprav o uvedeni noveho Pentia s jadrom Prescott. Malo niest oznacenie Pentium 5 a byt vykonostne v porovnani s predchodcami niekde uplne inde. Co ine by ste aj ocakavali od procesoru obsahujuceho vyse dvojnasobny pocet tranzistorov ako jeho predchodca, cize zhruba 120 milionov? Histioria sa vcak opat opakovala a napriek vsetkym zmenam vykonanych v jadre sa vykon nezvysil ani nahodou, v niektorych pripadoch dokonca klesol. Vykon sa jednoducho pohyboval v rozmedzi +/- 5%.Prescott vsak mohol dosahovat opat vyssie frekvencie a tym padom by sa akykolvek pokles zotrel. Navyse rozsiril instrukcnu supravu (SSE3), velmi jemne vylepsil Hyper Threading, zdvojnasobil velkost L1 a L2 cache a znizil spotrebu energie pretoze sa s Prescottom preslo na 90 nm-ovy vyrobny proces.Teplotu vsak vyzaroval uctihodnu a prave kvoli tomu don Intel zabudoval teplotny senzor. Kedykolvek by teda teplota presiahla unosnu hranicu zacal procesor generovat prazdne instrukcie (NOP) a tym padom znizil svoj vykon ale aj teplotu naozaj razantne. Teplotny senzor vsak priniesol nejednemu majtelovi Prescotta tazke chvilky, pretoze netusili, ze ich chladic je pren jednoducho nedostacujuci a prehrievajuci procesor musel neustale generovat NOP instrukcie a znizovat tak svoj vykon.
Spociatku nebolo jasne preco ma procesor tolko tranzistorov. Zvysenie mnozstva cache a jemne zmeny v architekture mohli spotrebovat nanajvys 20 milionov tranzistorov (ak sa zohladni ako sa ich pocet zvysoval pri prechode z jadra Willamette na jadro Northwood). Prve Prescotty boli urcene pre Socket 473, ale bolo nam oznamene, ze zanedlho ich vymenia verzie urcene pre Socketu T (opat nove zakladne dosky). Tym zacali aj prve spekulacie ohladom poctu tranzistorov, ktore sa casom ukazali ako pravdive.
Athlon 64 dokazal vykonavat 64-bitovy kod rovnako efektivne ako 32-bitovy a tych 64 bitov v nazve bol velmi mudry marketingovy tah. Vsetci totiz vedia, ze 64 bitov je viac ako 32 a podla toho sa aj zariadovali. Intel videl, ze 64 bitov ma velky potencial a napriek tomu, ze AMD za tento tah kritizoval a odsudzoval sa sam uchylil k tomu co oni.Nanestasite pre Intel vsak Prescott v dobe vyvoja nebol zamyslany ako 64-bitovy procesor a tak sa rozhodli, ze zduplikuju vsetky funkcne obvody, registre a priznaky a procesor tak teda dokaze spracovat aj instrukcie s dvojnasobnou, v tomto pripade 64-bitovou velkostou. Prave tento fakt mal za nasledok zdvojnasobenie poctu tranzistorov a predlzenie pipeline.
Pentium 4 sa tak casom dockalo moznosti vykonavat 64-bitove instrukcie a bolo obdarovane dalsimi technologiami ako Intel NX bit, Enhanced Speed Step a podobne a v poslednych mesiacoch aj o dvojnasobkom L2 cache.Neustale sa zvysujuci model numbering procesorov Athlon 64 prinutil Intel ukoncit indexovanie procesorov podla frekvencie a aj on presiel na sposob ich oznacovania urcitou sadou cislic. Pentium 4 ale uz narazilo na hrananice svojich moznosti a skoncilo pri frekvencii 3,8 GHz. Procesory by uz pri vyssej teplote naozaj "piekli" a bolo by ich mimoriadne tazke uchladit.Po strucnom uvode sa ale teraz uz prenesme k novej architekture.
Intel’s Next Generation Micro-Architecture
Nebyva zvykom, ze si vyrobca svoj produkt nepomenuje. Intel tak urobil a nova architektura jeho procesorov zatial nesie „oznacenie“ z titulku tohto odseku. Co ale architektura prinesie?
Intel tvrdi, ze si vezme to najlepsie z Pentia 4 a Pentia M. To znamena, ze od Pentia 4 dostane do vienka Quad Pumped zbernicu (prenasa data 4 krat za takt, preto je jej efetivna pracovna frekvencia jej fyzicka nasobena styrmi), podporu 64-bitovych instrukci (tento krat bude zabudovane od zakladu a pojde teda o architekturu typu x86-64), microOPs (mikroinstrukcie) dodavane priamo z dekoderov a podobne. Pentium M ho bude inspirovat pravdepodobne vsetkym, pretoze vykonovo je na tom asi rovnako ako Athlony 64. Samozrejmnostou bude zabudovanie jeho energiu setriacich technologii. Podla sucastneho trendu budu procesory navrhnute ako dual core, to znamena s dvoma jadrami. Vyrobna technologia 65 nm uz od zaciatku vyroby je samozrejma takisto.
Nova architektura je samozrejme uplne nova, to znamena, ze nevychadza zo ziadneho z predchodcov. Inzinieri (a mozno aj inzinierky) Intelu na nej pracuju usilovne uz takmer tri roky. Pravdepodobne aj to je dovod preco Intel ponechaval vykonne Pentia M len pre mobilny trh a nedovolil im nastupit na trh desktopovych systemov. Chce totiz to zlucit mobline a desktopove systemy (to znamena rovnaka architektura) a Pentium M by mu svojimi vlastnostami odobralo mnoho noviniek, ktorymi by mohol najvacsiu cast trhu obdarovat.Dlzka pipeline sa zmensi na 14 stupnov (Prescott ma 31). Vdaka tomu sa vyrazne znizi riziko nespravneho predpovedania a nehrozi tak, ze by procesor za 31 (resp., 14) hodinovych cyklov nic nevykonal. Riziko bude navyse este vyrazne obmedzene vylepsenym mechanizmom predpovedania udalosti preocesorov Pentium M.
Pocet jednotiek ALU (staraju sa o vypocty s celymi cislami) a FPU (cisla s desatinnou ciarkou) je zatial neodhaleny, ale da sa predpokladat, ze bude o nieco vyssi ako u Pentia M, co znamena hruby vykon nad urovnou Athlonov 64 (Pentium 4 ho malo hlboko pod ich urovnou, dokonca aj pod urovnou Pentia III). Uz to znamena, ze z toho budu benefitovat vsetky aplikacie. Co je vsak este lepsie je fakt, ze nove procesory budu zvladat 4 microOPs za takt (Athlon 64 len 3). Ako som uz vyssie spomenul, microOPS budu dodavane priamo z dekoderov, co je trik setriaci cas, ktory pouziva Pentium 4.
Nove procesory budu spracuvat viac Out-of-Order instrukcii (instrukcie mimo poradia). Pentium 4 ich dokazalo vykonat 126, tento pocet bude u novych procesorov zvysny celkom urcite. Navyse od Pentia M dostane schopnost ich spajania nazyvanu MicroOPs Fusion (spajanie mikroinstrukcii). Procesor ich bude moct spajat viac a navyse bude schopny nahradzovat vhodne kombinacie instrukcii uz pred ich dekodovanim. Ako to funguje vysvetlim na priklade. Predstavte si, ze procesor ma spracovat 4 instrukcie. Ak ich ale dokaze nahradit mensim poctom, napriklad jednou s rovnakym vyznamom, tak to spravi. Uvolni tym priestor pre dekodovanie dalsich instrukcii a setria sa tym drahocenne nanosekundy.
Procesory dostanu novu technologiu, tzv. Memory Disambiguation (nieco ako odstranenie dvojzmyselnosti urcitych dat v pamati). Co ma tato technologia znamenat bohuzial este neviem, ale akonahle to zistim, updatnem clanok.
Jadra budu obsahovat 2 alebo 4 MB zdielanej vyrovnavajucej pamate L2 cache. Zdielana cache je v tomto pripade vyhodna, pretoze procesory budu navrhnute od zakladu ako dvojjadrove. Zdielana vsak nebude len L2, ale historicky prvy krat aj L1 cache. To znamena nieco ako jedna pamat a dva mozgy. Nepotrebujete mat dve pamate. Staci vam, ked mozgy dokazu medzi sebou efektivne komunikovat (t. z. tou najrychlejsou cestou) a delit sa o prostriedky a dosiahnutie VELMI vysokeho vykonu nebude len cista teoria. Data z pamate budu du cache dopravovane spekulativne, teda este pred tym ako na ne vznikne realna poziadavka. Doteraz bol tento mechanizmus vyuzivany na dodavanie dat z pamate len do L2 cache, ponovom ale budu dopravovane aj do L1 cache. Tento spekulativny vyber sa bude ale uskutocnovat len za predpokladu, ze cache nebude uplne vytazena. V opacnom pripade by to sposobovalo jej pretazenie a pokles vykonu. Vdaka tomu bude cache neustale zasobovana datami, ktore si uz najdu vyuzitie.
Ocakavalo sa, ze nove procesory budu disponovat integrovanym pamatovym radicom, podobne ako Athlony 64. Nestane sa vsak tak. Nadalej zostane pritomna zbernica FSB, prostrednictvom ktorej procesor komunikuje so systemom. Jej efektivna frekvencia bude zvysena uz od zaciatku na 1 066 MHz a neskor az na 1 333 MHz. Athlony su v operaciach narocnych na pamat mimoriadne rychle prave vdaka integrovanemu radicu. Ten im umoznuje extremne rychlo pristupovat do pamate a navyse s malymi latenciami. O tom sa nam u Intelu zatial moze len snivat (ale samozrejme, ze to nebude az take strasne, ako to mozno z tychto slov vyznelo).  Siria sa aj spekulacie, ze nove procesory Intelu budu mat takychto zbernic FSB viac. Nuz, zda sa mi to trochu pristrihnute za vlasy, ale uvidime.
Spotreba by mala byt podla slov Intelu jednoducho uzastna. Tak ako Pentium M aj jeho nepriami nasledovnici budu schopny vypinat ci uspavat casti cache a funkcne bloky, ktore sa momentalne nebudu pouzivat. Ich normalny stav je „off“, to znamena, ze sa budu zapinat len v pripade potreby. To je na jednej strane velmi pekne, ved procesory s TDP 35W by mali mat v klude spotrebu najviac 2 W, ale na strane druhej som si neni isty, ci to neustale vypnanie a zapinanie nebude stat privela hodinovych cyklov.S najvacsou pravdepodobnostou su vsak moje obavy uplne zbytocne. Funkcne bloky sa asi vypnu naozaj len vtedy, ked to bude potrebne a pocas behu aplikacii, ktore nutia procesor pracovat sa take nieco asi naozaj nestane, takze ostatne dve vety, ktore som napisal su vlastne zbytocne ?.
Urcenie
Procesory zalozene na next-gen architekture Intelu budu mat uplne rovnake vlastnosti, budu vsak optimalizovane pre svoje pole posobnosti. Takto vzniknu tri rady procesorov. Tie ktore budu smerovat do desktopov (Conroe), tie ktore budu smerovat do notebookov (Merom) a tie, ktore budu urcene pre servery (Woodcrest a Whitefield).
Zatial nie je jasne, ci sa dockame odlahsenej vezie Meromu,  nasledovnika Pentia M, cize niecoho ako Celeronu M. Oficialne roadmapy zatial nic ani len nenaznacuju, takze mobilny sektor asi bude vyhradeny len pre jeden typ procesoru. Mozeme teda ocakavat, ze ulohy toho slabsieho sa zhosti procesor Yonah, cize vylepsene, tentokrat uz dvojjadrove Pentium M. Platforma sa bude v tak pripade Yonahu, ako aj v pripade Meromu nazyvat Napa, takze moje predpoklady asi budu spravne. Cielove TDP prvych modelov Meromu bude 35W.
V pripade procesorov Conroe uz je situacia jasna. Delenie typu Pentium 4 / Celeron asi zostane nadalej, kedze sa budu vyrabat verzie s 2 a 4 MB pamate cache. Procesory budu nadalej urcene do Socketu T, ale zatial nie je iste, ci ich sucastne cipove supravy prijmu. Ak ano, bola by to doslova bomba! Ak nie, budeme musiet pokracovat v Intel-rituale novy procesor, nova doska. V suvislosti s Conroeom sa hovori o TDP 65 W.
V serverovom prostredi bude na vyber z procesorov Woodrest a Celeron. Woodcrest bude obdobou Conroe pre servery, dve jadra zostavaju, L2 cache sa ale rozsiri na velkost 4 MB. Cielove TDP bude 80W.
Procesory Whitefield budu asi to „najbrutalnejsie“, co si mozeme predstavit. Budu quad core (4 jadra) a budu obsahovat 16 MB (!) pamate druhej urovne. Budu jednoznacne urcene do viacprocesorovych serverovych zostav.O TDP Intel pochopitelne mlci, i ked je v tom velky dovod nevidim. Keby uviedol, ze bude mat hodnotu povedzme 150W, tak to ludi, pre ktorych je urceny rozhodne neposadi na zadok. Takyto procesor si nebude kupovat ziadny lammer do svojej hracskej masiny, ale clovek, ci skor velka skupina ludi, alebo v pripade viacprocesoroveho pouzitia aj organizacie, ktore vedia, ze ich procesor najde vyuzitie a bude ich jeho prevadzkovanie stat omnoho menej, akoby mali prevadzkovat viacero pazravych dvojjadrovych procesorov, pretoze im v konecnom dosledku ponukne vyssi vykon a ak im doteraz nevadilo, ze ich dvojjadrovy Xeon spotreboval rovnako vela, nebude im to vadit ani teraz.

Zaver
Intel si kladie velke ciele a vyzera to tak, ze ked sa mu podari ich splnit sa na svet dostatne z jeho dielne konecne produkt, ktory bude konecne pre AMD konkurencie schopny. Ta ale tiez nezaspava na vavrinoch a jej inziniery urcite velmi usilovne pracuju na vylepseni sucastnych Athlonov 64. Uz onedlho budu vsetky dvojjadrove a budu obsahovat pamatovy radic typu pre pamate DDR2 SDRAM.V pripade, ze budu nove procesory Intelu od procesorov AMD vykonnejsie hoci aj o 10% percent a ze Intel nastavi procesorom rozumne ceny, mohlo by to pre AMD znamenat vyrazny uder pod pas. Intel totiz neustale vladne trhu (jeho zisk bol este par kvartalov dozadu asi taky vysoky ako cely obrat AMD!) a ten kto ma vacsinu moze lepsie presviedcat zakaznikov o kvalite svojich produktov. Ako sa cely suboj vyvinie ale odhali az cas...</block>
</form>
<base href='http://pabi3.com/' />
<title>Next-gen Intel</title>
</head>
<body ev:event='load' ev:handler='#title'>
<a href='http://pabi3.com/blog/next-gen-intel/' title='Návrat'>Návrat</a>
<h1 style='padding:0.5em;'>Next-gen Intel</h1>
<ul>
<li ev:event='click' ev:handler='#body'>Speak introduction</li>
<li ev:event='click' ev:handler='#full'>Speak full</li>
</ul>
</body>
</html>
