Paralelný počítač s architektúrou budúcnosti

 Na ško­le A. Ja­mes Clark School prid­ru­že­nej ku Uni­ver­si­ty of Ma­ry­land po­čí­ta­čo­ví in­ži­nie­ri vy­vi­nu­li pro­to­typ po­čí­ta­ča, kto­rý sa mož­no sta­ne zá­kla­dom pre ďal­šiu ge­ne­rá­ciu osob­ných po­čí­ta­čov. Je­ho ma­sív­ne pa­ra­lel­ná ar­chi­tek­tú­ra mu do­vo­ľu­je do­siah­nuť vý­poč­to­vé rých­los­ti až 100× väč­šie, než ma­jú sú­čas­né des­kto­po­vé po­čí­ta­če. Je­ho zá­kla­dom je in­teg­ro­va­ná dos­ka, na kto­rej sa na­chá­dza 64 pa­ra­lel­ných pro­ce­so­rov. Ved­ci tú­to ar­chi­tek­tú­ru na­zý­va­jú eXpli­cit Mul­ti-Threa­ding (XMT).

Pa­ra­lel­né vý­poč­to­vé stro­je za­lo­že­né na pre­po­je­ní množ­stva mik­ro­či­pov bo­li pri konštruo­va­ní su­per­po­čí­ta­čov pou­ží­va­né už pred rok­mi. Ap­li­ká­cia tej­to konštruk­čnej ar­chi­tek­tú­ry bo­la však pri im­ple­men­tá­cii do osob­ných po­čí­ta­čov prob­lé­mom, vzhľa­dom na zlo­ži­tosť prog­ra­mo­va­nia stro­ja ta­kej­to ar­chi­tek­tú­ry. Tím ved­cov však pod­ľa svo­jich vy­hlá­se­ní pri­šiel na spô­sob, akým tie­to ťaž­kos­ti pre­ko­nať po­mo­cou špe­ciál­nych al­go­rit­mov.

Od ro­ku 1979 sa pro­fe­sor Uzi Vis­hkin za­obe­ral teóriou pa­ra­lel­ných al­go­rit­mov. Tie bo­li za­lo­že­né na ma­te­ma­tic­kom mo­de­li pa­ra­lel­né­ho po­čí­ta­ča, čo však eš­te neexis­to­val. V ro­ku 1997 mu však pok­rok v tech­no­ló­gii do­vo­lil vy­ví­jať za­ria­de­nie, na kto­rom by svo­ju teóriu mo­hol otes­to­vať; spo­lu s tí­mom to­to za­ria­de­nie do­kon­či­li v de­cem­bri 2006. Fy­zic­ké at­ri­bú­ty toh­to za­ria­de­nia sú až príl­iš bež­né: tvo­rí ho 64 FPGA pro­ce­so­rov bež­iacich na tak­to­va­cej frek­ven­cii 75 Mhz, so spo­loč­ným 1 GB DDR2 RAM s pre­no­so­vou rých­los­ťou 2,4 GB/s. Je to však prá­ve XMT, pa­ra­lel­ná ar­chi­tek­tú­ra pro­to­ty­pu, čo umož­ňu­je ľah­kosť prog­ra­mo­va­nia a vý­kon­nosť na mi­ni­mál­nej tak­to­va­cej frek­ven­cii, kto­ré naj­viac za­uja­li.

Pri tes­to­va­ní toh­to špe­ciál­ne­ho po­čí­ta­ča ved­ci pod­ľa svo­jich pred­pok­la­dov zis­ti­li, že op­ro­ti bež­ným po­čí­ta­čom sú­čas­nos­ti je rých­lej­ší v pa­ra­lel­ných vý­poč­toch a o nie­čo po­mal­ší v sé­rio­vých vý­poč­toch. Po­rov­ná­va­ný bol pro­to­typ XMT za­ria­de­nia so sys­té­mom za­lo­že­nom na Op­te­ro­ne 2,6 GHz, s 1MB L2 me­dzi­pa­mä­ti, pa­mä­ťo­vou prie­pus­tnos­ťou 6,4 GB/s. Pou­ži­li na to Red­Hat Li­nux En­terpri­se 3 s GCC. Bo­li tes­to­va­né dve ap­li­ká­cie: ná­so­be­nie ce­lo­čí­sel­nej ma­ti­ce o veľ­kos­ti 2000 x 2000 a ran­do­mi­zo­va­né rých­le trie­de­nie s veľ­kos­ťou vstu­pu 20 mi­lió­nov ce­lo­čí­sel­ných pr­vkov. Do­siah­nu­té ča­sy bo­li pri ná­so­be­ní ma­ti­ce oko­lo 80 se­kúnd pri ar­chi­tek­tú­re XMT a 113 se­kúnd s ar­chi­tek­tú­rou za­lo­že­nou na Op­te­ro­ne. Pri trie­de­ní po­ľa bo­li vý­sled­ky opač­né: 7,5 se­kun­dy s ar­chi­tek­tú­rou XMT a 2,6 s ar­chi­tek­tú­rou Op­te­ron.

Pro­to­typ XMT je pri­tom len jed­ným z dô­le­ži­tých kro­kov v pro­jek­te PRAM-on-Chip na Uni­ver­si­ty of Ma­ry­land. Vir­tuál­ny mo­del tej­to vý­poč­to­vej tech­ni­ky pred­pok­la­dá, že aké­koľ­vek množ­stvo sú­čas­ných prís­tu­pov do zdie­ľa­nej pa­mä­ti za­be­rie ten is­tý čas, ako je­di­ný prís­tup. Al­go­rit­my, kto­ré ta­ký­to po­čí­tač s ar­chi­tek­tú­rou XMT spra­co­vá­va, sú vy­ví­ja­né v špe­ciál­nom roz­ší­re­ní ja­zy­ka C s náz­vom XMTC. V bu­dúc­nos­ti bu­de ok­rem XMTC dos­tup­ných ove­ľa viac prog­ra­mo­va­cích roz­hra­ní (API): VHDL/Ve­ri­log, MAT­LAB, či OpenGL.

Zdroj: TS PCR



Ohodnoťte článok:
   

Váš názor:

 
 
  • Avatar Ted: nevidim vyznam tohoto vsetkeho. este mozno nejaky docasny, ale v dobe miniaturizacie je otazka casu ked budu procaky mat tolko jadier, ze toto bude uple zbytocne. 06.07.2007 21:05  
    • Avatar oddo: ale predstav si dosku s tolkymi procakmi a takou architekturou?! :) 10.07.2007 01:48  
    • Avatar cuker: no mozno je to zbytocne, ale hobby je hobby... niekto proste potrebuje stale vymyslat nieco nove a nove... 10.10.2007 19:53  
    •  
       
  • Avatar jj: citam.. citam.. a nic. Snazim sa pochopit co sa v tom clanku pise? Prevratna architektura, bombasticka sprava, 100x vacsi vykon.
    .
    Paralelnych systemov je celkom dost. Uplne sa staci pozret na serverove vybavenie trosku vacsej firmy.
    .
    Autora by som odporucil na zakladny kurz paralelnych a distribuovanych vypoctov. Vyhoda paralelizmu je v tom, ze cast prace mozu robit viacere procaky sucasne. Pri pouziti optimalneho algoritmu na paralelnej architekture moze byt maximalne zrychlenie programu X/P kde X je cas behu sekvencneho algoritmu a P je pocet procakov. (aj to len za situacie ze naozaj uplne kazdy krok algoritmu sa da paralelizovat; pri pouziti 1 procaku dostaneme optimalny cas sekvencneho algoritmu). V uvedenej architekture bolo pouzitych konstantne vela procakov = 64. Tj max 64nasobne teoreticke zrychlenie. Tj v tomto pripade mal byt max vykon celeho systemu radovo 4800 MHz (a to bez rezie okolo rozdelovania prace na procaky)- Este raz uvediem, ze len za pouziti optimalneho paralelneho algoritmu.
    (ani zdaleka mi to nepripomina 100x rychlost bezneho desktopu)
    .
    Univerzalny prepis optimalneho sekvencneho algoritmu na optimalny paralelny neexistuje a zrejeme ani nemoze.
    .
    Osobne dufam, ze v blizkej dobe sa uchytia paralelne prog. jazyky, tj. kusy kodu sa budu vykonavat paralelne automaticky a nebude potrebne program delit program rucne na procesy a thready.
    04.07.2007 08:18
     
    • Avatar radino: ze si ty chodil na FMFI ;) 07.07.2007 18:41  
    •  
       
  • Avatar ch.: tym rychlym triedenim sa myslel quick sort? 03.07.2007 10:30  
    • Avatar Meno a priezvisko: no pozor, ale "randomizovane" ! :-D

      nepise sudruh tyler aj spravicky na roote?
      03.07.2007 11:43
       
    • Avatar tyta: zachvilu tu sudruhovia vymyslia novy jazyk a budu pisat ze Processorsy solvovali randomizovanu matrixu :D
      a vobec naucte sa poriadne prekladat!
      06.07.2007 11:19
       
    •  
       
  • Avatar zxcv: Podla mna 80% osobnych pocitacov nepotrebuje vyssi vykon ...
    Myslim si skor ze buduca generacia PC bude orientovana na nizsiu spotrebu
    03.07.2007 09:37
     
    • Avatar Fabio: Urcite dalsia generacia osobnych pocitacov nepotrebuje vyssi vykon...Pri tomto si treba uvedomit,ze novsie generacie pocitacov nie su vyvijane pre domace pouzitie,ale hlavne na vedecke ucely,kde je sucasny vykon nedostacujuci... 03.07.2007 11:54  
    • Avatar burizon: " Pri tomto si treba uvedomit,ze novsie generacie pocitacov nie su vyvijane pre domace pouzitie,ale hlavne na vedecke ucely,kde je sucasny vykon nedostacujuci..."

      - hehe - ty si ale vtipalek. Podla mna uz dobrych par rokov na PC-ckach nejde o nic ine, nez o nove gamesy. Na vedecke vypocty boli a su UNIXove masiny. Ostatne aplikacie snad okrem zvuku a videa davno nepotrebuju nic viac.
      Cize iba games (95% vsetkeho "IT businessu")!!! Ostatne si vynutil iba neefektivny kod (napr. MS Office a ...celý príspevok
      03.07.2007 16:06
       
    • Avatar Pjetro: Vedecke vypocty bezia na UNIXovych systemoch? No pri uvazovani nad superpocitacmi hej, ale pri uvazovani nad distribuovanymi vypoctami podla mojho skromneho nazoru nie. A kumulovana paralelna vypoctova sila vsetkych tych "suchtavych" PCciek s Wokienkami zapojenych do vsetkych distrubucnych vypoctov niekolko krat prevysuje silu vsetkych Top500 supecpocitacov spolu (teraz cca 3-4 PetaFlops)... 03.07.2007 20:03  
    • Avatar sn4pb4r: no tak ty si jasny... 03.07.2007 20:53  
    • Avatar tommy: urcite ? ktore vypoctove centra pouzivaju na clusteroch win? 04.07.2007 09:19  
    • Avatar Roman Kanala: Jasny - nejasny, ma pravdu. 04.07.2007 10:39  
    • Avatar Roman Kanala: On to mozno myslel tak, ze kumulativny pocitacovy vykon potrebny na zobrazenie sto siestich milionov psikov vo Worde, ako vrtia chvostom za sucasnej redukcie poctu cyklov na jednu aplikaciu ako prostriedok proti virusom, zavedene v experimentalom MS-DOS XP SP2. 04.07.2007 10:40  
    • Avatar Martin: Skor si myslim, ze mal na mysli seti@home a podobne... 04.07.2007 11:27  
    • Avatar Pjetro: Mal som na mysli BOINC zastresujuci vyse 30 projektov (najznamejsie Seti@Home, Einstein@Home, Predictor@Home ...) www.boinc.sk napovie - alebo si staci vygooglit nejake anglicky hovoriace stranky. Takisto GIMPS Prime95 a desiatky dalsich matematickych neBOINC projektov ... 04.07.2007 12:17  
    • Avatar louise: Povedal by som, ze o sucasnych trendoch vyuzitia PC nevies absolutne nic a tym padom Ti vysvetlovat preco potrebuju vyssi vykon nema vyznam. Linux na 386 sice mozno bezi ale to je vsetko. Applikacie pod Linuxom potrebuju viac. Bez problemov polozim na kolena ~3GHz PC s 2G pamati beziace Linux. Staci pootvarat zopar stranok v ff, zopar xterm okien a nejake tie dokumenty v OO. Z celkom sluzneho PC sa stane razom pomala sunka. A to som este nespomenul ziadne firemne applikacie na zdielanie dokumentov a video. ...celý príspevok 05.07.2007 05:53  
    • Avatar oddo: mal som tu cest pracovat s jablckami a poviem vam nikdy viac. neda sa tam prestavit ani taka drobnost ako rychlost pohybu mysou a tak casto my pocitac nepadal od dob w95. hovorim pracovat a to myslim nie prezeranie webstranok... 10.07.2007 01:52  
    •  
       
 

Najviac vás zaujalo

24 hodín

týždeň

mesiac

 
 

Najnovšie články

Bez­drô­to­vý pre­nos dát rých­los­ťou 3 Gb/s, ďal­ším cie­ľom je 100 Gb/s
(Publikované pred 4 dňami) Vedci v snahe zvýšiť rýchlosť dátového prenosu experimentujú s elektromagnetickým vlnením s frekvenciou nad 300 GHz, čo už je oblasť infračerveného žiarenia. čítať »
 
Elek­tri­na po­mo­cou ví­ru­sov
(Publikované pred 5 dňami) Americkí vedci našli spôsob, ako vyrobiť elektrickú energiu pomocou vírusov. Výskumníci vytvorili generátor s elektródou veľkosti poštovej známky, ktorá sa nachádzala na malom poťahu zo špeciálne upravených vírusov. čítať »
 
Te­le­Hu­man – ho­log­ra­fic­ký 3D vi­deo­kon­fe­renč­ný sys­tém ako zo Star Tre­ku
(Publikované pred 5 dňami) Vedci z Human Media Lab na Queen's University (Kanada) vyvinuli zariadenie s názvom TeleHuman, umožňujúce premietanie holografických 3D reprezentácií ľudí v ich životnej veľkosti. čítať »
 
Poz­ri­te si úžas­nú 121-me­ga­pixelo­vú fo­tog­ra­fiu Ze­me
(Publikované pred 6 dňami) Ruský satelit Elektro-L No.1 získal fotografiu Zeme z výšky 36 000 km. Ide o jednu ucelenú snímku, ktorá v rozlíšení 121 megapixelov pokrýva celú zemeguľu. čítať »
 
Py­ra­mí­dy v Gí­ze sú na inter­ne­te v 3D
(Publikované pred týžňom) Vášniví cestovatelia či milovníci histórie môžu virtuálne navštíviť egyptské pyramídy. Prechádzku po Gízskej plošine prináša nový internetový 3D projekt, ktorý vytvorili na základe materiálov z archívov bostonského Múzea umení. čítať »