Spekulationer om NVIDIA Volta GPU ramper op i forventning om 2017 -debut | TOP500, NVIDIA lancerer Revolutionary Volta GPU -platform, brænder næste æra med AI og High Performance Computing | NVIDIA NYHEDSRUM

NVIDIA lancerer Revolutionary Volta GPU -platform, der brænder næste æra med AI og High Performance Computing

Volta, Nvidias syvende generation af GPU-arkitektur, er bygget med 21 milliarder transistorer og leverer den ækvivalente ydelse på 100 CPU’er til dyb læring.

Spekulationer om NVIDIA Volta GPU ramper op i forventning om 2017 -debut

Ingen

Indførelsen af ​​Nvidias Volta GPU -arkitektur forventes meget af Supercomputing -samfundet. Som vi rapporterede i juli sidste år, da rygterne om en tidligere forventet Volta-udgivelse sprang rundt på Internettet, synes en lancering af den næste generation. Den seneste spekulation er, at disse første Volta -dele vil være baseret på en ny 12nm FinFET -teknologi, der for nylig er udtænkt af Taiwan Semiconductor Manufacturing Company (TSMC).

Inden vi går videre, skal det bemærkes, at rygtet om krympningen til 12nm er temmelig tyndt, baseret på et indlæg i et Beyond3D -forum, selvom banden på WCCFTech har spekuleret i en 12nm Volta siden mindst oktober sidste år. For hvad det er værd, er TSMCs 12nm -teknologi blevet karakteriseret som en forfining af deres 16nm -proces, den samme, der blev brugt til at fremstille NVIDIAs nuværende Pascal GPU’er. TSMCs næste store procesnode er 10nm, som angiveligt vil være klar tidligt i år, i det mindste for mindre muskulære chips end for high-end GPU’er.

10nm -teknologien var bestemt den procesnode, som Nvidia ville have ønsket at bruge til sin kommende Voltas, i det omfang TSMC lover en 20 procents præstation denne teknologi sammenlignet med sin 16nm -proces. 12nm -noden ville sandsynligvis kun opnå omkring halvdelen af ​​det. Under alle.

Selvfølgelig handler Volta ikke alt om silicium krympning. Den nye arkitektur er også på linje for et omarbejdet design med hensyn til sin streaming multiprocessor (SM), den beregningsmotor, der driver alle NVIDIAs GPU’er. SM -opdateringen formodes at levere bedre ydelse og magteffektivitet end dens Pascal -forgænger, uanset transistorstørrelse. Og ifølge mindst en rapport vil designforskellen mellem Pascal og Volta være meget mere markant end den mellem Maxwell og Pascal.

Det er ganske vist alle spekulationer. Årsagen til, at vi føler behov for at diskutere dette nu, er, at Volta GPU vil være arkitekturen, som Nvidia vil stole på i de følgende to år for at afværge den kommende MANGECORE -konkurrence fra både Intel og AMD. I tilfælde af Intel vil Volta Tesla GPU være den rival til den fremtidige “Knights Hill” -processor, som skulle være klar til at gå i 2018, såvel som den dybe læringsoptimerede “Knights Mill” Xeon Phi-processor, som er formodes at være tilgængelig senere på året. I mellemtiden vil AMD felt sin Vega GPU’er i hele 2017, som vil omfatte den nye Radeon Instinct -linje til dyb læring, og sandsynligvis også en opgraderet FirePro GPGPU. Ikke overraskende vil både Intel og AMD fremstille disse chips med mindre transistorer for at hjælpe dem i præstationsafdelingen.

En mere øjeblikkelig bekymring er, at Volta GPU vil være det beregningsmæssige hjerte af topmødet og Sierra, to af de kommende før-exascale supercomputers, som det amerikanske energiministerium udsætter under agenturets koral (samarbejde om Oak Ridge, Argonne og Lawrence Livermore) program. Så vidt vi ved, er begge systemer på vej til at blive installeret inden udgangen af ​​2017 og gå i produktion i begyndelsen af ​​2018. Selvom værten GPU for disse to systemer er Power9 CPU, vil ca. 90 procent af deres flydende punktydelse sandsynligvis blive leveret af Volta Coprocessors. Derfor vil ydeevnen og Sierra primært være afledt af kapaciteterne i Volta Silicon.

Summit Supercomputer vil især modtage en hel del kontrol, da det forventes at levere et sted mellem 150 og 300 Peak Petaflops of Performance, når de blev indsat på Oak Ridge National Lab mod slutningen af ​​året. Det kan være nok til, at USA kan genvinde det første sted på Top500 -listen for første gang siden 2012, forudsat at det bliver installeret i tide til en Linpack -kørsel inden november 2017. Det antager også, at Kina ikke kommer med et system endnu større end topmødet i mellemtiden. Som vi rapporterede i sidste uge, er Tianhe-2a-systemet nu for sent for sin implementering og vil sandsynligvis blive installeret i 2017 med en høj kapacitet godt nord for 100 petaflops.

Meget mere af Volta -historien skulle udfolde sig i begyndelsen af ​​maj under NVIDIAs GPU Technology Conference (GTC), hvor den nye arkitektur forventes at blive introduceret. Vi får måske endda et højdepunkt på det, der kommer efter Volta på GTC. Men lad os ikke komme foran os selv.

NVIDIA lancerer Revolutionary Volta GPU -platform, der brænder næste æra med AI og High Performance Computing

NVIDIA lancerer Revolutionary Volta GPU -platform, der brænder næste æra med AI og High Performance Computing

Nvidia lancerede i dag Volta – verdens mest kraftfulde GPU -computerarkitektur, skabt til at drive den næste bølge af fremskridt inden for kunstig intelligens og høj ydeevne computing.

Virksomheden annoncerede også sin første Volta-baserede processor, NVIDIA® Tesla® V100 Data Center GPU, som bringer ekstraordinær hastighed og skalerbarhed til AI-inferencing og træning samt til at fremskynde HPC og Graphics-arbejdsbelastninger.

“Kunstig intelligens driver de største teknologiske fremskridt i menneskets historie,” sagde Jensen Huang, grundlægger og administrerende direktør for Nvidia, der afslørede Volta ved sin GTC -keynote. “Det vil automatisere intelligens og anspore til en bølge af sociale fremskridt, der er uovertruffen siden den industrielle revolution.

“Deep Learning, en banebrydende AI -tilgang, der skaber computersoftware, der lærer, har umættelig efterspørgsel efter behandlingskraft. Tusinder af NVIDIA-ingeniører brugte over tre år på at udforme Volta for at hjælpe med at imødekomme dette behov, hvilket gør det muligt for industrien at realisere AIs livsændrende potentiale, ”sagde han.

Volta, Nvidias syvende generation af GPU-arkitektur, er bygget med 21 milliarder transistorer og leverer den ækvivalente ydelse på 100 CPU’er til dyb læring.

Det giver en 5X-forbedring i forhold til Pascal ™, den nuværende generation af NVIDIA GPU-arkitektur, i Peak Teraflops og 15x over Maxwell ™ -arkitekturen, lanceret for to år siden for to år siden. Denne præstation overgår med 4x de forbedringer, som Moores lov ville have forudsagt.

Efterspørgslen efter at fremskynde AI har aldrig været større. Udviklere, dataforskere og forskere stoler i stigende grad på neurale netværk for at drive deres næste fremskridt inden for bekæmpelse af kræft, hvilket gør transport mere sikker med selvkørende køretøjer, giver nye intelligente kundeoplevelser og mere.

Datacentre er nødt til at levere eksponentielt større behandlingskraft, da disse netværk bliver mere komplekse. Og de er nødt til effektivt at skalere for at støtte den hurtige vedtagelse af meget nøjagtige AI-baserede tjenester, såsom virtuelle sprogassistenter og personaliserede søgnings- og anbefalingssystemer.

Volta bliver den nye standard til høj ydeevne computing. Det tilbyder en platform for HPC -systemer at udmærke sig i både computervidenskab og datavidenskab for at opdage indsigt. Ved at parre CUDA® -kerner og den nye Volta Tensor -kerne inden for en samlet arkitektur, kan en enkelt server med Tesla V100 GPU’er erstatte hundreder af råvare CPU’er til traditionel HPC.

Gennembrudsteknologier
Tesla V100 GPU springer tidligere generationer af NVIDIA GPU’er med banebrydende teknologier, der gør det muligt for det. De omfatter:

  • Tensorkerner Designet til at fremskynde AI -arbejdsbelastninger. Udstyret med 640 tensorkerner leverer V100 120 teraflops af dyb læringspræstation, svarende til ydelsen af ​​100 CPU’er.
  • Ny GPU -arkitektur med over 21 milliarder transistorer. Det parrer CUDA -kerner og tensorkerner inden for en samlet arkitektur, hvilket giver ydelsen af ​​en AI -supercomputer i en enkelt GPU.
  • NVLINK ™ Tilvejebringer den næste generation af højhastighedsforbindelser, der forbinder GPU’er og GPU’er til CPU’er, med op til 2x gennemstrømningen af ​​den tidligere generation af NVLink.
  • 900 GB/SEC HBM2 DRAM, Udviklet i samarbejde med Samsung opnår 50 procent mere hukommelsesbåndbredde end tidligere generations GPU’er, der er vigtigt for at understøtte den ekstraordinære computergennemstrømning af Volta.
  • Volta-optimeret software, inklusive CUDA, CUDNN og Tensorrt ™ -software, som førende rammer og applikationer let kan udnytte for at fremskynde AI og forskning.

Økosystemstøtte til Volta
Volta har modtaget bred branche -støtte fra førende virksomheder og organisationer over hele verden:

“Nvidia og AWS har arbejdet sammen i lang tid for at hjælpe kunder med at køre beregnende-intensive AI-arbejdsbelastninger i skyen. Vi lancerede den første GPU-optimerede Cloud-instans i 2010 og introducerede sidste år den mest kraftfulde GPU-forekomst, der var tilgængelig i skyen. AWS er ​​hjemsted for nogle af dagens mest innovative og kreative AI-applikationer, og vi ser frem til at hjælpe kunder med at fortsætte med at opbygge utrolige nye applikationer med den næste generation af vores generelle GPU-forekomstfamilie, når Volta bliver tilgængelig senere på året.”
— Matt Garman, vicepræsident for Compute Services, Amazon Web Services

“Vi udtrykker vores lykønskninger til Nvidias seneste udgivelse af Volta. Fra Baidu Cloud til intelligent kørsel har Baidu styrket sin indsats for at opbygge en åben AI -platform. Sammen med Nvidia tror vi, at vi vil fremskynde udviklingen og anvendelsen af ​​den globale AI -teknologi og skabe flere muligheder for hele samfundet.”
— Yaqin Zhang, præsident, Baidu

“Nvidia og Facebook har været gode partnere, og vi er begejstrede for de bidrag, som Nvidia har ydet til Facebooks Caffe2 og Pytorch. Vi ser frem til AI Advances Nvidias nye højtydende Volta-grafikarkitektur vil muliggøre.”
— Mike Schroepfer, Chief Technology Officer, Facebook

“Nvidias GPU’er leverer betydelige ydelsesforøgelser for Google Cloud -platformkunder. GPU’er er en vigtig del af vores infrastruktur, der tilbyder Google og vores Enterprise -kunder ekstra computerkraft til maskinlæring eller høj ydeevne computing og dataanalyse. Voltas præstationsforbedringer vil gøre GPU’er endnu mere kraftfulde, og vi planlægger at tilbyde Volta GPU’er på GCP.”
— Brad Calder, vicepræsident for Engineering for Google Cloud Platform, Google

“Microsoft og Nvidia har samarbejdet i årevis om AI-teknologier, herunder Microsoft Azure N-Series, Project Olympus og Cognitive Toolkit. Den nye Volta -arkitektur låser op for ekstraordinære nye muligheder for Microsoft -kunder.”
— Harry Shum, administrerende vicepræsident for Microsoft AI og forskningsgruppe, Microsoft

“Oak Ridge National Laboratory vil begynde at samle vores næste generations ledelsescomputersystem, Summit, denne sommer. Topmødet drives af Volta GPU’er og vil være den øverste supercomputer i U.S. Til videnskabelig opdagelse, når den er afsluttet i 2018. Det vil holde u.S. I spidsen for videnskabelig forskning og hjælper Department of Energy Adresse komplekse udfordringer med beregningsvidenskab og AI-assisteret opdagelse.”
— Jeff Nichols, associeret laboratoriedirektør for Computing and Computational Sciences Directorate, Oak Ridge National Laboratory

“En lang række af vores produkter, herunder stemmeteknologi i WeChat, foto/videoteknologi i QQ og Qzone og den dybe læringsplatform baseret på Tencent Cloud, der allerede er afhængig af AI. Vi tror, ​​Volta vil give hidtil uset computerkraft til vores AI -udviklere, og vi er glade for at åbne disse muligheder snart fra Tencent Cloud til flere klienter.”
— Dowson Tong, Senior Executive Vice President, Tencent

Hold aktuelle på NVIDIA
Abonner på NVIDIA -bloggen, følg os på Facebook, Google+, Twitter, LinkedIn og Instagram, og se NVIDIA -videoer på YouTube og billeder på Flickr.

Om Nvidia
Nvidias (NASDAQ: NVDA) opfindelse af GPU i 1999 udløste væksten af ​​pc -spilmarkedet, omdefineret moderne computergrafik og revolutioneret parallel computing. For nylig antændte GPU Deep Learning moderne AI-den næste æra med computing-med GPU, der fungerer som hjernen til computere, robotter og selvkørende biler, der kan opfatte og forstå verden. Mere information på http: // nvidianews.Nvidia.com/.

Visse udsagn i denne pressemeddelelse, herunder, men ikke begrænset til, udsagn om: virkningen, ydelsen og fordele ved Volta -arkitekturen og Nvidia Tesla V100 Data Center GPU; virkningen af ​​kunstig intelligens og dyb læring; Og efterspørgslen efter at fremskynde AI er fremadrettede udsagn, der er underlagt risici og usikkerheder, der kan medføre, at resultaterne er væsentligt forskellige end forventningerne. Vigtige faktorer, der kan medføre, at faktiske resultater adskiller sig væsentligt, inkluderer: globale økonomiske forhold; Vores afhængighed af tredjepart til at fremstille, samle, pakke og teste vores produkter; virkningen af ​​teknologisk udvikling og konkurrence; udvikling af nye produkter og teknologier eller forbedringer til vores eksisterende produkt og teknologier; markedsaccept af vores produkter eller vores partners produkter; design, fremstilling eller softwarefejl; ændringer i forbrugerpræferencer eller krav; ændringer i industristandarder og grænseflader; uventet tab af ydeevne af vores produkter eller teknologier, når de integreres i systemer; såvel som andre faktorer, der fra tid til anden er beskrevet i rapporterne NVIDIA-filer med Securities and Exchange Commission, eller SEC, inklusive dens formular 10-K for regnskabsperioden, der sluttede den 29. januar 2017. Kopier af rapporter, der er indgivet til SEC, er lagt ud på virksomhedens websted og er tilgængelige fra Nvidia uden beregning. Disse fremadrettede udsagn er ikke garantier for fremtidig præstation og taler kun fra datoen herfor, og undtagen som krævet i loven fraskriver NVIDIA enhver forpligtelse til at opdatere disse fremadrettede udsagn for at afspejle fremtidige begivenheder eller omstændigheder.

© 2017 NVIDIA Corporation. Alle rettigheder forbeholdes. NVIDIA, NVIDIA -logoet, Tesla, Cuda, Maxwell, Nvlink, Pascal, Tensorrt og Volta er varemærker og/eller registrerede varemærker til NVIDIA Corporation i U.S. og andre lande. Andre firma- og produktnavne kan være varemærker til de respektive virksomheder, som de er tilknyttet. Funktioner, prisfastsættelse, tilgængelighed og specifikationer kan ændres uden varsel.

Volta GPU -frigivelse

Volta ankommer: NVIDIA annoncerer Titan v Graphics Card Specs [Update]

Af Steve Burke udgivet 7. december 2017 kl. 23:17

Volta ankommer: NVIDIA annoncerer Titan v Graphics Card Specs [Update]

Nvidia introducerede sin nye Titan V GPU, som virksomheden indvarsler som ”verdens mest kraftfulde GPU til pc’en.”Titan V -grafikkortet er målrettet mod videnskabelige beregninger og simulering, og falder meget tydeligt på enhver“ GTX ”eller“ Gaming ”-branding.

Titan v er vært for 21.1b transistorer (perspektiv: 1080 Ti har 12b, p100 har 15.3b), er i stand til at køre 110 tflops af tensor -beregning og bruger Volta GPU -arkitekturen. Vi er usikre på specs på lavere niveau og har i øjeblikket ikke et blokdiagram til kortet. Vi har bedt om begge datasæt.

Titan V er et supercomputing -kort, en god pasform til det nuværende maskinlæringsfokus for Volta. Titan mod bruger det samme Tensor Core -design som beskrevet med V100 -meddelelsen, og bevæger sig også for at kombinere L1 -cache og delt hukommelse, hvilket bør gøre udviklingen (især CUDA/Tensor -software) lettere at påtage sig.

NVIDIA TITANV PCB VRM

NVIDIAs Titan V er bygget på 12nm FFN Silicon, ledsaget af 12 GB HBM2 på interposeren.

Kortet er tilgængeligt til $ 3000 til direkte køb. Det skal selvfølgelig sige, at du ikke skulle købe dette til spil – det vil ikke være meget godt til det, da kortet er bygget til at føre i maskinlæring og videnskabelig udvikling.

Vi frigiver mere information, da de modtages.

NVIDIA TITAN V SPECS

NVIDIA PASCAL SPECS -sammenligning
Titan v Tesla v100 Tesla P100 GTX 1080 TI GTX 1080
GPU GV100 GV100 GP100 Cut-Down Pascal GP102 Pascal GP104-400 Pascal
Transistor tælling 21.1b 21.1b 15.3b 12b 7.2b
FAB -proces 12nm ffn 12nm ffn 16nm Finfet 16nm Finfet 16nm Finfet
CUDA -kerner / tensorkerner 5120 /640 5120 /640 3584 /0 3584 /0 2560 /0
Tmus 320 224 224 160
Rops ? 96 (?) 88 64
Kerneur 1200MHz 1328MHz 1607MHz
Boost Clock 1455MHz 1370MHz 1480MHz 1600MHz 1733MHz
FP32 TFLOPS 15tflops 14tflops 10.6tflops ~ 11.4tflops 9tflops
Hukommelsestype HBM2 HBM2 HBM2 GDDR5X GDDR5X
Hukommelseskapacitet 12 GB 16 GB 16 GB 11 GB 8 GB
Hukommelsesur 1.7Gbps HBM2 1.75 Gbps HBM2 ? 11 Gbps 10 Gbps GDDR5X
Hukommelsesgrænseflade 3072-bit 4096-bit 4096-bit 352-bit 256-bit
Hukommelsesbåndbredde 653 GB/s 900 GB/s ? ~ 484 GBS 320.32 GB/s
Samlet strømbudget (“TDP”) 250W 250W 300W 250W 180W
Strømforbindelser 1x 8-pin
1x 6-pin
? 1x 8-pin
1x 6-pin
1x 8-pin
Udgivelses dato 12/07/2017 4Q16-1Q17 Tbd 5/27/2016
Udgivelsespris $ 3000 $ 10000 $ 700 Reference: $ 700
MSRP: $ 600
Nu: $ 500

Opdateringer

Titan v Reference PCB-formodentlig den eneste PCB, der vil eksistere-bruger en 16-fase DRMOS VRM. Køleopløsningen er den samme som brugt på GTX 10 -serien med kort, inklusive 1080 Ti, og bruger derfor et dampkammer med radial blæserventilator. Dette matcher 250W TDP, som yderligere forstærket med 1x 8-polet + 1x 6-polet strømforbindelser. Køleren kan ikke tage meget mere end det alligevel. Hvad angår NVIDIA TITAN V SPECS, bruger kort. Kortet er også vært for 320 tmus. Her er blokdiagrammet fra den originale Volta -meddelelse:

Nvidia Volta Block Diagram

Og her er V100 SM -blokdiagrammet fra dette års Volta -afsløring i maj: