Sandy Bridge – Timpul pentru „Tock” – Arhitectura

de: Radu Neagu
08 01. 2011

Dupa cum a mentionat intr-un articol mai devreme colegul meu, Intel a lansat Sandy Bridge la inceputul acestui an, o serie complet noua de procesoare ce folosesc o noua arhitectura, sunt fabricate intr-un proces nou si vin cu o multime de elemente revolutionare pentru lumea PC-urilor, fie ele desktop cat si de laptop. Vom vedea pe parcursul acestui articol care este situatia cu aceste noi procesoare si de ce sunt ele capabile nu-i asa?

Sincer asteptam de mult Sandy Bridge, poate de prea mult timp circula informatii pe internet legate de noua arhitectura, noile performante, noile socket-uri…..aaa….stai putin….poftim? Noile socketuri? Pai abia incepusem sa ne obisnuim cu vechiul LGA atat 1156 cat si 1366. Ei bine intel s-a gandit ca e vremea pentru „Tock”! Pentru cei care nu isi mai aduc aminte intel a adoptat o politica numita „tick-tock” in functie de care lanseaza procesoare si tehnologii noi in acest domeniu.

Acum aproape doi ani asistam la lansarea procesoarelor Core i7 si a platformei X58, (socket LGA1366), high-end-ul la momentul respectiv. Cu ceva mai putin timp in urma intel a adus utilizatorilor o platforma ceva mai accesibila numita P55, cea cu socket LGA 1156, care avea ca diferente memorii dual-channel fata de tri-channel de asemenea si posibilitatea de a instala procesoare mai ieftine decat cele pentru LGA 1366. De asemenea pretul platformei era ceva mai accesibila si permitea un cost mai redus al sistemului conceput cu aceasta precum si niste performante foarte bune. Anul acesta intel s-a decis dupa cum mentionasem mai devreme sa schimbe din nou configuratia socket-ului, ei bine noul socket detine nu mai putin de 1155 pini!!! Adica cu unul mai putin. Probabil unii dintre cititori zambesc acum cu gandul la procesoarele AMD socket AM2+ si AM3 intre care exista o compatibilitate foarte buna. Ei bine ne pare rau sa va anuntam ca aici nu e cazul, procesoarele LGA1155 nu sunt compatibile cu socketul LGA1156, nu vrea intel pur si simplu sa pastreze putina compatibilitate intre platformele lor si decide de fiecare data daca vrem sa ne schimbam procesorul trebuie sa o facem cu tot cu placa de baza, ei bine nu prea avem ce comenta, la urma urmei oricat ne-am stresa noi pe aceasta tema intel decide deocamdata piata, AMD il concureaza mai mult la pret decat la performante si pana va mai aparea un producator de procesoare pe piata vom mai avea poate de asteptat.

Sandy Bridge vine de altfel cu multe surprize care pentru unii nu vor fi atat de placute. In primul rand overclockerii, mai ales cei care folosesc solutii de racire non standard vor avea ceva de comentat, apoi exista o atentie destul de mare indreptata asupra graficii integrate pe care Intel vrea sa o transforme intr-o alternativa la grafica dedicata, cel putin la desktopuri nu va fi cazul din fericire. Pe de alta parte codarea/decodarea video este un subiect la care noile procesoare exceleaza, o mica palma data producatorilor de placi grafice, iar procesul de fabricatie pe 32nm al noilor procesoare deblocate („Unlocked & Unleashed”) dupa cum scrie pe cutie permite o marja ceva mai ridicata de overclocking.

Tehnologia Clarckdale beneficia de cipuri diferite in acelasi pachet de siliciu. Unul dintre ele continea nucleele propriu -zise, interfata MCP (Multi Core Processing) si cache-ul, iar celalalt grafica integrata, controllerul PCI, PCI Express si de memorie.

Sandy Bridge ofera insa in acelasi pachet de siliciu toate functionalitatile unui procesor complex.

Sandy Bridge Core i7 2600K si Core i5 2500K

De la distanda tehnologia pare sa fie un castig de cauza imediat fata de vechiul predecesor. Ce mai trebuie mentionat este ca al doilea cip de la Clarckdale era pe 45 nm. Cu fiecare din procesoarele de generatie noua producatorul a avut in minte in singur lucru, integrarea a cat mai multe capabilitati intr-un singur cip, bineinteles si a cat mai multi tranzistori. Astfel maximul atinge aproape un miliard (995 de milioane ca sa fim cat mai la obiect) de tranzistori. La lansare exista deja mai multe modele de CPU-uri din nou putin diferit fata de aparitia procesoarelor LGA1156. Astfel avem varianta Quad-Core cu o suprafata de 216 mm patrati si cei 995 milioane de tranzistori, un dual-core cu 624 milioane de tranzistori si o suprafata a cipului de 149 mm patrati si varaintele mai ieftine cu o suprafata de doar 131 mm patrati ce contine doar 504 milioane de tranzistori. Atentie ne referim aici la dimensiunea interna a cipului nu a pastilei procesorului ce intra in contact cu sistemul de racire.

[table id=49 /]

Arhitectii de la Intel demonstreaza astfel cat de multi tranzistori au reusit sa inghesuiasca in noua arhitectura folosind si un spatiu ceva mai redus.

Nucleele lui Sandy Bridge

– Cred ca daca e sa caute cineva in acest articol de cate ori am folosit numele producatorului si al noii arhitecturi va ramane surprins, astfel voi folosi pentru arhitectura de acum incolo doar Sandy. Exista diferente si din punct de vedere al nucleelor fata de vechea generatie. Sandy dispune de 4 sau de 2 nuclee. Variantele cu 4 nuclee pot avea sau nu functia HyperThreading activa pe cand cele cu 2 nuclee o vor avea activata implicit. Pastrand nivelul de cache de 32KB L1 precum si cei 256 KB L2, de asemenea cache-ul L3, Sandy incorproreaza si un L0 care poate „tine minte” aproximativ 1500 de instructiuni. Acest L0 are rolul de a economisi energie si de a imbunatati viteza cu care CPU-ul se ocupa de instructiuni. Cache-ul are un rol foarte important in modul cum procesorul preia si executa aceste informatii. Fiecare nucleu al variantelor mai vechi de procesoare detinea acces separat la cache-ul L3. Seria de procesoare Xeon pentru servere foloseau alt tip de legaturi asemanator unui inel, care a fost preluat si de catre tehnologia Sandy Bridge. Astfel grafica integrata a procesorului foloseste de asemenea acelasi sistem. Latentele sunt foarte importante in acest caz insa cu alocarea accesului intr-un sistem de tip inel aceasta este foarte mica, fiecare nucleu putand lua cea mai scurta cale pana la cache-ul ce contine informatia dorita. Sper ca schema de mai jos sa va lumineze mai mult decat am incercat eu sa o fac.

Noua Functie Turbo Boost

Bine, nu este oficial noua sau nu poarta o altfel de denumire doar ca functioneaza putin altfel. La nucleele Lynnfield, dealtfel ca si la Sandy Bridge Turbo Boost profita de resursele nefolosite si le aloca altui proces in derulare pentru a termina task-urile mai repede. Acesta foloseste nivelul termic maxim programat pentru acel nucleu pentru a il accelera pana la acea limita. Diferenta insa este ca in lumea reala exista o diferenta de timp pana cand procesorul se incalzeste fizic si ajunge la maximul specificat, diferenta care acum este exploatata la maxim prin introducerea unui nou concept de rezistenta termica ce este mult mai precisa.

Diferenta astfel intre Lynnfield si noua generatie este ca la Sandy Bridge acest Turbo Boost va ramane mai mult activ pana cand se va atinge rezistenta termina maxima specificata, procesorul reducand apoi voltajul  pentru a scadea temperatura. Avantajele nu sunt vizibile cu ochiul liber, cel putin nu la desktopuri, insa pentru segmentul de laptopuri poate fi o idee destul de apreciata, pe acel segment contand mai mult temperatura si viteza de raspuns. Ingenios este ca inginerii nu au facut rabat de la modificarea niciuneia din tehnologiile acestui procesor.

Extensiile AVX (Advanced Vector Extensions) este un lucru nou. Acest tip de instructiuni pe 256 biti vor fi suportate de asemenea de urmatoarele procesoare AMD (Bulldozer). In calculele cu virgula mobila acest tip de instructiuni sunt cele care conteaza, problema este ca aplicatiile din ziua de astazi nu suporta inca aceste instructiuni AVX, sau poate foarte putine programe destinate mediului industrial pot beneficia de ele. Producatorul are un scop insa bine definit, el stie ca pe viidor aplicatiile de grafica precum si cele de codare/decodare audio/video vor beneficia de acestea asa ca momentan este cu un pas inaintea competitorilor. Pam…pam pam pam pam.

Sandy Bridge Quick Sync

Da, stiu ca suna a program de sincronizare a smartphone-ului cu PC-ul insa nu la asta ma refeream. Tehnologia QuickSync nu este gandita de curand, mai exact in vara anului 2005!!! Mda, asta da secret bine tinut. Aceasta tehnologie a fost creata pe vremea in care Blu-Ray-ul isi facea aparitia pe scena IT-ului iar producatorii de film treceau si ei de pe SD pe HD. Tehnlogia la momentul respectiv era destul de slaba pentru editare HD iar intel si-a dat seama ca singura platforma de editare va fi computerul. La fel cum si producatorii de placi grafice au implemetat tehnologii de procesare precum CUDA si Stream (acum e numeste APP-Advanced Parallel Processing) insa ambele companii au incercat adaptarea tehnologiei paralele de procesare pentru codarea/decodarea video, insa nici una dintre ele nu au creat hardware nou dedicat pentru acest scop.

QuickSync este de fapt un procesor dedicat codarii/decodarii video pe care intel l-a inclus pe noile procesoare Sandy Bridge.

IMaginea de mai sus reprezinta diferentele din procesul de decodare intre Lynnfield si Sandy Bridge. Intel oricum avea o pozitie destul de buna in acest segment de piata insa numai pe partea de decodare video 1080p. Noul cip aduce de asemenea si suport pentru BluRay 3D. Astfel decizia producatorului de a aduce performanta pe segmentul de decodare video HD este mult mai inteleapta decat sa „ingroape” alte milioane de tranzistori dedicati procesorului grafic pentru a oferi cat mai multa performanta segmentului de gaming.

Pe partea de codare lucrurile stau din nou putin diferit. Dupa cum puteti observa in imaginea de mai sus avantajul cipului dedicat din Sandy Bridge este clar. Acesta se ocupa exclusiv de postprocesarea si codarea filmului. Capabilitatile acestuia vor fi destul de mult folosite de catre producatorii de software video si poate mai putin de catre altii. Spre exemplu cei care creeaza programe de codare vor fi mai avantajati de aceste inovatii decat cei care creaza doar playere pentru continut HD. Veti vedea mai jos si de ce.

[table id=50 /]CyberLink MediaEspresso este unul din programele care au implementat deja suportul pentru cipul dedicat pentru video din noul procesor. Se pot vedea cred ca diferentele intre CUDA de la nvidia si Stream-ul de la ATI. Testul a fost facut cu un fisier de 1 GB 1080 convertit in format mov la o rezolutie de 1024×768. Rezultatele sunt absolut uimitoare. Cei doi producatori de placi video sigur s-au apucat de treaba si au inceput sa dezvolte un raspuns la QuickSync-ul lui intel pentru a nu pierde aceasta piata, insa in mod sigur va mai dura ceva pana vor veni cu ceva inovator.

Va asteptam in scurt timp sa cititi si urmatoarele articole despre arhitectura Sandy Bridge, testele efectuate pe multiple platforme si discutia despre cele doua tipuri de procesoare grafice integrate ale acestei noi tehnologii.