Вольта nvidia: Архитектура NVIDIA Volta | NVIDIA

Содержание

Видеокарты NVIDIA на базе архитектуры Volta получат поддержку технологии трассировки лучей в реальном времени

Прошло 5 лет с тех пор, как компания NVIDIA анонсировала графическую архитектуру нового поколения под названием Volta. И пока что компания не торопится выпускать потребительские видеокарты на базе GPU с этой архитектурой (недавно анонсированная модель Titan V с ценой $3000 хоть и позиционируется в качестве потребительской, но всё же ориентирована на моделирование научных экспериментов и работу с системами искусственного интеллекта). Зато NVIDIA охотно рассказывает, что видеокарты на базе архитектуры Volta получат поддержку новых эксклюзивных игровых функций GameWorks.

Новые функции являются частью технологии RTX, которая, по заверениям NVIDIA, открывает новую эру в трассировке лучей в реальном времени. При этом RTX совместима с DXR – API трассировки лучей в рамках Microsoft DirectX. Технология RTX будет доступна для видеокарт на базе Volta и GPU будущих поколений.

Трассировка лучей является одной из наиболее передовых техник рендеринга изображений. Она основана на том, как человек видит окружающий мир. Фактически, прежде чем попасть в глаз человека, лучи света отражаются от различных предметов и на основании этого передают нам визуальную информацию о свойствах этих объектов (форме, цвете). Технология построения изображения трёхмерных моделей методом трассировки лучей в компьютерных программах отслеживает обратную траекторию распространения лучей от камеры к экрану. Когда лучи света пересекаются с каким-то объектом, происходит проверка свойств объекта, чтобы рассчитать точный цвет каждого пикселя для вывода на экран. Благодаря этому обеспечивается более высокая реалистичность создаваемых сцен. Создание CGI эффектов для фильмов также основано на трассировке лучей. Но применение этой технологии в играх было крайне ограниченным из-за высоких системных требований.

Теперь же, судя по всему, видеокарты на базе Volta наконец получат необходимый уровень производительности для более широкого применения трассировки лучей в игровых проектах. И, как заверяет NVIDIA, различные разработчики покажут свои решения в сфере трассировки лучей уже на этой неделе во время проведения конференции Game Developers Conference. Среди них упоминаются как создатели игровых движков (Epic Games (Unreal Engine), EA (Frostbite) и Unity), так и разработчики игровых проектов (EA, 4A Games и Remedy).

Пока не сообщается, когда же состоится анонс более доступных версий видеокарт на базе архитектуры Volta. Предыдущие слухи даже утверждали, что следующее поколение видеокарт NVIDIA будет основано не на Volta, а на промежуточной архитектуре Ampere. Но сейчас это выглядит маловероятным, учитывая анонс функций, специфических именно для Volta.

Источник: Engadget

Google добавляет Nvidia Volta к своим облачным платформам

  1. Проекты
  2. Новости
  3. Google добавляет Nvidia Volta к своим облачным платформам

С недавними новостями о том, что облачный TPU Google более экономичен, чем Volta от Nvidia, вы можете подумать, что Google будет готовиться к замене графических процессоров конкурентов своим собственным оборудованием. Вместо этого компания расширяет свои предложения GPU для Volta Nvidia и развертывает GPU в более широком диапазоне двигателей. Более того, это говорит о широком спектре поддержки различных типов машинного обучения, рабочих нагрузок AI и общей вычислительной производительности, доступной теперь через облачные сервисы.

Согласно последнему сообщению в блоге Google, графические процессоры Nvidia V100 Tesla теперь доступны как для вычислительного двигателя, так и для Kubernetes Engines. Kupernetes обычно используется для масштабирования приложений в контейнерах в облаке, в то время как Compute Engine Google — это облако серверов, которое используется для запуска рабочих нагрузок, которые могут быть выгружены для обработки и вычисления. И теперь, любезно предоставленное этим последним обновлением, вы можете складывать восемь графических процессоров Tesla V100, 96vCPU (термин Google для виртуализованного ядра процессора) и 624 ГБ памяти в одной виртуальной машине, которая, как правило, немного больше мощности, чем ваш типичный отдельный сервер может собрать. NVLink следующего поколения предлагает до 300 ГБ / с пропускной способности GPU-GPU, и преимущества, по-видимому, хорошо масштабируются — Google утверждает, что это повышает производительность при глубоком обучении и нагрузках HPC на 40%.

Google пишет, что «NVIDIA V100s доступны сразу в следующих регионах: us-west1, us-central1 и europe-west4. Каждый графический процессор V100 стоит всего 2,48 долл. США в час для виртуальных машин по требованию и 1,24 долл. США в час для превентивных ВМ. Как и наши другие графические процессоры, V100 также оплачивается вторым, и применяются скидки на постоянное использование ».

Компания также дает небольшую информацию о рабочей нагрузке. Он рекомендует использовать графические процессоры N100 Nvidia на базе Pascal для рабочих нагрузок, требующих баланса между ценой и производительностью, в то время как графические процессоры K80 (Kepler) по-прежнему доступны для еще менее трудоемких рабочих нагрузок.

Эта диаграмма косвенно подчеркивает, почему облачные вычисления могут иметь финансовый смысл как для компаний, так и для пользователей. В потребительском выражении K80 является древним. Это часть с двумя GPU с 2,496 ядрами и 2x 12 ГБ GDDR5. Он полностью превзойден и превосходит графические процессоры, такие как V100, но он также доступен всего за 45 центов в час. Если бы вы сравнивали такую ​​почасовую ставку со стоимостью покупки всего сервера, когда K80 был новым, вы, очевидно, сэкономили бы огромную сумму, просто нажав на облако для рабочих нагрузок, которые вам нужно обработать.

Исходя из цены, которую мы видим для базовых серверов и самого K80, точка безубыточности между стоимостью нового K80 и использованием вычислительного двигателя Google составляет около 10 000 часов. Поэтому, если вы считаете, что вам потребуется эквивалент 416 дней времени GPU для обработки рабочей нагрузки, может быть, лучше просто купить карту. И Nvidia, конечно, не заботится о разнице между продажей карты исследовательскому учреждению, которое будет развертывать его на своих собственных серверах, и продавать его Google или Amazon или Microsoft для интеграции в рамках облачного сервера , Nvidia просто хочет продать карту.

Интересно, что на той же странице есть намек на то, что Google может скоро расширить свои предложения облаков, чтобы охватить более дешевые карты. Один читатель, Сет Прайс, пишет: «Мне не нужен графический процессор на верхней полке для моей работы; Мне нужны только дешевые FLOPS / $. Будем ли мы когда-либо видеть графические процессоры на потребительском уровне, предлагаемые на GCP, которые стоят менее 1000 долларов США каждый … Я просто ищу быстрый, эффективный, графический процессор с низкой стоимостью. Мне не нужны они, чтобы быть лучшими коробками CUDA. Мне не нужна точность двойного с плавающей точкой на уровне научного уровня. Мне не нужны смешные количества VRAM. Мне не выгодно платить 100 раз больше за час для экземпляра GPU, чем экземпляр CPU, и я действительно не хочу создавать свои собственные коробки. Смогут ли GCP выполнить эти требования? »

На что Адриан Грэхем, архитектор облачных решений в Google, ответил: «Мы слышим вас. Следите за обновлениями.

Читать далее

[Слухи] Ускорители на базе Nvidia Volta и видеокарты 2000 серии Pascal Refresh выйдут уже в этом году,

Портал FoxBusiness опубликовал слух, судя по которому ускорители на базе архитектуры Nvidia Volta заменят аналогичные решения Pascal для комплексных вычислений, искусственного интеллекта и машинного обучения уже в этом году.
Чипы данных решений будут изготовлены по специальной технологии на 12-нм техпроцессе от компании TSMC.

Что же касается видеокарт для игровых ПК и рабочих станций, тут новости от портала Wccftech не утешительны — новые игровые видеокарты Nvidia GeForce GTX 2000 серии буду выпущены на обновленной архитектуре Pascal Refresh, которая обеспечит то же количество блоков и памяти, но будет работать на более высокой частоте. Также будет представлено флагманское решение из серии Titanium — GTX 2080 Ti на чипе GP102 GPU (как в Titan X Pascal), которое займет нишу между GTX 1080/2080 и GTX Titan X (Pascal).

Представители новой линейки будут отличаться от предшественников не только частотами и обновленной архитектурой (новым техпроцессом), но и другими параметрами. Например, обе новые карты на чипе GP104 — GTX 2070 и 2080 будут использовать 8 GB GDDR5X памяти с шиной 256-bit и пропускной способностью 320GB/s, в отличии от более дешевой памяти GDDR5 в GTX 1070. Слухи также говорят о работе над видеокартами Nvidia GeForce GTX 2060 Ti, 2060 и 2050, которые заменят свои старые аналоги из 1000 серии. Но они скорее всего, увидят свет только в конце 2017 или начале 2018.

Что же касается будущего поколения десктопных видеокарт на базе Volta — они заменят карты Pascal refresh в 2018. Новая архитектура сделает карты не только быстрее, но и энергоэффективнее, а среди нововведений — поддержка памяти GDDR6 и HBM2. Память GDDR6 обеспечит пропускную способность в 16Gbps, что на 60% больше, чем возможности памяти GDDR5X, используемой в флагманах Nvidia сейчас.

Ваше мнение по данным слухам? Смогут ли новые видеоадаптеры на базе AMD Vega конкурировать с текущими и будущими моделями Nvidia? Или подобные слухи заставят вас ждать 2018 года?

(c) Goha.ru

первые 12-нм GPU выйдут уже в этом году

Противостояние NVIDIA и AMD на рубеже 14/16 нм пока складывается в пользу «зелёных». Возможно, с выходом видеокарт на чипах Vega 10 и GP102 (GeForce GTX 1080 Ti) соперничество в high-end сегменте обострится, но это не отменит того факта, что уже более полугода модели GeForce GTX 1080, GTX 1070 и GTX 1060 остаются выбором «хардкорных» геймеров, что, в частности, подтверждается статистикой Steam.

Как утверждает ресурс Fox Business, NVIDIA не собирается почивать на лаврах и —помимо выпуска адаптера GeForce GTX 1080 Ti — намерена представить в этом году первые карты с микроархитектурой Volta. С ними связано более активное использование типов памяти HBM2 и GDDR5X, а также переход на новую технологическую норму. Ключевые релизы эры Pascal (упомянуты выше) ассоциированы с 16-нанометровым техпроцессом TSMC, и только последние на сегодняшний день модели — GeForce GTX 1050 Ti и GTX 1050 (GP107) — базируются на 14-нм норме Samsung. По предварительным данным, вывод на рынок Volta будет проходить по той же схеме: топовые карты будут основываться на 12-нанометровых GPU, после чего в Санта-Кларе примут решение относительно выпуска оставшихся кристаллов по 10-нм техпроцессу.

12-нм норма TSMC представляет собой развитие нынешней 16-нм технологии. Благодаря стараниям инженеров тайваньского полупроводникового гиганта, размеры транзисторов и энергопотребление чипов должны значительно уменьшиться.

Упомянутый 10-нм техпроцесс также станет результатом усилий специалистов TSMC. В NVIDIA его могут использовать для самых скромных GPU и SoC.

Дебютным видеоадаптером Volta, скорее всего, станет новый NVIDIA Titan или серверная модель Tesla. Старшие продукты, похоже, будут единственными в текущем году. До игровых карт GeForce на чипах Volta в 2017-м дело может не дойти, хотя в Санта-Кларе постараются изменить график анонсов, если почувствуют угрозу со стороны AMD.

Что касается возможности выпуска NVIDIA Volta по 7-нм техпроцессу, то, учитывая малое время, оставшееся до первого релиза, такой сценарий маловероятен. Переход на 7 нм в кратчайшие сроки будет иметь смысл только в случае, если он будет экономически обоснован. И это не только процент выхода годных рабочих чипов, но и их тактовая частота, энергопотребление, тепловыделение и т. д. Время 7-нм технологии, вероятно, придёт в середине или в конце 2018 года. Как следует из более ранних сообщений, во второй половине следующего года дебютирует первый 7-нм продукт AMD — Vega 20.

NVIDIA VOLTA: renodo — LiveJournal

Новая архитектура графических процессоров, призванная внедрить искусственный интеллект во все отрасли.

ЯДРО TENSOR

Экспоненциальный рост производительности

Все индустрии испытывают потребность в технологиях искусственного интеллекта, а благодаря огромному росту производительности вычислительных платформ, искусственный интеллект теперь можно внедрить везде.  У графического процессора Volta 43 тыс. ядер Tensor, что обеспечивает производительность задач глубокого обучения более 100 Терфлопс в секунду. Это превышает производительность архитектуры предыдущего поколения Pascal более чем в 5 раз.

https://www.nvidia.ru/data-center/volta-gpu-architecture/

Здесь есть интересная презентация по NVIDIA
http://ailev.livejournal.com/1348698.html


Amazon уже предлагает решения на Nvidia GPU
https://aws.amazon.com/ru/ec2/instance-types/p2/

Название

ГПУ

Виртуальные ЦПУ

RAM (ГиБ)

Пропускная
способность

Цена за час*

Цена за час (зарезервированные инстансы)**

p2. xlarge

1

4

61

Высокая

0,9 USD

0,425 USD

p2.8xlarge

8

32

488

10 Гбит/с

7,2 USD

3,400 USD

p2.16xlarge

16

64

732

20 Гбит/с

14,4 USD

6,800 USD


Любопытно, как благодаря любителям компьютерных игр, а точнее постоянному спросу на мощные видеокарты, процессорная компания Nvidia выжила и стала лидером по производству вычислительных карт, в частности для глубокого обучения и ИИ-технологий. Фактически захватит новый огромный рынок с большим отрывом от Intel и AMD, и других производителей.

Получается, что Intel и AMD прозевали опять новые рынки — до этого процессоры для мобильных, а теперь процессоры для параллельных вычислений, и, наверное, сюда же можно приписать — рынок процессоров для блокчейн-вычислений. Сейчас хэши в блокчейн все считаются на спецустройствах или GPU. Процессоры далеко позади, отстают на 10-100 раз и более.

Получается, что часто инновации и новые рынки приходят сбоку, исподтишка, там где их совсем не ждут крупные сторожилы рынка.

Полагаю, пройдет еще 3-5 лет и огромную часть вычислений по базам данных возьмут на себя GPU. Уже есть первые ласточки, которые показывают в 100 большую производительность, чем key/value база данных в памяти Memcache. 

5 вещей, которые нужно знать геймерам на ПК

Спустя семь долгих месяцев после того, как графическая архитектура следующего поколения «Volta» дебютировала в Tesla V100 для центров обработки данных, Nvidia Titan V наконец-то привносит передовые технологии в ПК в виде традиционной видеокарты. Но не заблуждайтесь: этот монстр в золотом облачении нацелен на специалистов по обработке данных с аппаратной конфигурацией с тензорным ядром, предназначенной для оптимизации задач глубокого обучения. Вы не захотите покупать этот графический процессор за 3000 долларов, чтобы играть в Destiny 2 .

Но это не значит, что мы, скромные компьютерные геймеры, не можем черпать информацию из текущих воплощений Volta, ориентированных на искусственный интеллект. Вот пять ключевых вещей, которые вам нужно знать о Titan V и графическом процессоре Nvidia Volta.

Примечание редактора: эта статья была первоначально опубликована 11 мая 2017 года, но была обновлена ​​8 декабря, чтобы включить информацию с Titan V.

1. Это не для вас, а

Nvidia

Если вы ищете горячие подробности о будущем видеокарт GeForce, что ж, ждите.Как и архитектура графического процессора Pascal до него, Volta представляет собой грандиозный графический процессор Tesla V100, созданный для центров обработки данных, а готовый к ПК Titan V придерживается той же конфигурации графического процессора с немного уменьшенной системой памяти. Генеральный директор Джен-Хсун Хуанг сосредоточился на аппаратном искусственном интеллекте и анонсировал новую систему глубокого обучения DGX-1 стоимостью 149 000 долларов с восемью процессорами Volta внутри во время запуска V100.

Крупные спонсоры получают первую трещину в Volta, в то время как потребительские видеокарты серии GTX 10 все еще улетают с полок благодаря майнерам криптовалюты.Тем не менее, подробности, которые Nvidia опубликовала о Volta, намекают на то, что мы можем ожидать от неизбежных карт GeForce следующего поколения.

2. Volta превосходит Pascal

Titan V и Tesla V100 содержат 21 миллиард транзисторов и 5120 ядер CUDA, работающих на частоте 1455 МГц. Этот превосходит флагманский графический процессор Pascal для центров обработки данных, Tesla P100, который содержит 15 миллиардов транзисторов и 3 840 ядер CUDA, работающих на немного более высокой максимальной тактовой частоте 1480 МГц.

Nvidia

Графический процессор Volta Tesla V100.

Невозможно узнать, как будут выглядеть видеокарты GeForce на базе Volta, но Titan Xp стал полноценной реализацией графического процессора Pascal от Tesla P100, и это самый быстрый игровой графический процессор в мире. Черт возьми, GeForce GTX 1080 Ti имеет слегка ослабленную версию с 3584 ядрами CUDA, и она все еще может играть с разрешением 4K, не беспокоясь.

Nvidia заявляет, что Tesla V100 предлагает в 1,5 раза более высокую производительность в терафлопсах, чем его предшественник на Pascal.Еще одна точка отсчета: Titan V содержит в четыре раза больше ядер CUDA, чем GeForce GTX 1060, вдвое больше, чем чудовищный GTX 1080, и 320 текстурных блоков по сравнению с GTX 1080 Ti 224.

3. Витрина передовых технологий

Nvidia не пожалела средств на подготовку флагмана Volta. Графический процессор GV100 внутри Titan V и Tesla V100 использует новый 12-нанометровый производственный процесс TSMC «FFN», усовершенствованный по сравнению с 16-нанометровой технологией, на которой полагаются графические процессоры серии GTX 10. Транзисторы меньшего размера означают лучшую производительность и энергоэффективность.

Он также включает 640 «тензорных ядер», предназначенных для значительного ускорения машинного обучения, а Tesla V100 поддерживает версию второго поколения технологии NVLink от Nvidia, которая, по заявлению компании, в десять раз превосходит скорость передачи данных через PCIe.

Nvidia

Подробный обзор технических характеристик Tesla V100.

Но для компьютерных геймеров все это не имеет значения. Что может иметь значение, так это память. Как и видеокарты AMD Radeon Fury и Radeon Vega, этот графический процессор для центра обработки данных включает технологию памяти с высокой пропускной способностью — фактически, 16 ГБ HBM2 второго поколения в Tesla V100 с пиковой скоростью 900 ГБ / с.Это чертовски быстро . Titan V имеет аналогичную настройку с немного уменьшенной емкостью и скоростью.

Но нет никакой гарантии, что HBM2 попадет в карты GeForce на базе архитектуры Volta. Серия GTX 10 полагается на традиционную оперативную память GDDR5 и GDDR5X, несмотря на запуск после AMD Fury, и из-за этого она не хуже изнашивается. Nvidia, скорее всего, откажется от HBM2 и останется с памятью, которую мы знаем, по крайней мере, для или неизбежных видеокарт GeForce на базе Volta, учитывая высокую цену HBM.

4. Вольта

массивная

Втиснуть всю эту технологию в графический процессор — непростая задача. Графический процессор Volta, установленный в Tesla V100, имеет массивных , что составляет колоссальные 815 мм в квадрате — буквально пределы используемого процесса изготовления графического процессора. Для сравнения: графические процессоры большого размера, которые можно найти в картах Radeon Fury и последние чипы GeForce высокого класса, имеют тактовую частоту примерно 600 мм.

Nvidia

Графический процессор Volta внутри Tesla V100 — GARGANTUAN.

В любом случае, в потребительской видеокарте еще никогда не было графического процессора такого размера. Появится ли эта гигантская версия Volta в линейке GeForce завтра, зависит от готовности Nvidia открыть новые горизонты. Урожайность может быть лучше сейчас, когда у TSMC и Nvidia есть столько месяцев производства Volta за плечами, но потребители не будут платить даже близко к той премии, которую компании будут платить за что-то столь радикальное.

5. Но GV100 подходит к видеокартам

Появление Titan V доказывает, что Nvidia действительно может встроить массивный графический процессор GV100 в традиционную двухслотовую видеокарту, что действительно впечатляет.Огромная экономия места, обеспечиваемая HBM2, вероятно, играет в этом роль.

Если Nvidia решит отказаться от варианта полнофункционального графического процессора с ядром 5120 CUDA в GeForce GTX 1180 Ti (или что-то еще), я бы ожидал, что они сохранят 8 ГБ HBM2 на борту, в результате чего передовая память станет доступной. линейка GeForce впервые. Традиционная видеопамять могла бы полностью не поместиться в , а не в видеокарту с таким массивным графическим процессором.

Nvidia

Производители памяти уже объявили, что GDDR6 появится на видеокартах в 2018 году.Неизвестно, будут ли карты GeForce следующего поколения включать это, но, учитывая, насколько хорошо работает GDDR5 и GDDR5X VRAM в серии GTX 10, можно ожидать, что не флагманские карты GeForce Volta будут придерживаться традиционных конфигураций памяти.

Карты

Consumer Volta почти наверняка откажутся от безжалостно ориентированных на вычисления тензорных ядер, которые есть в Titan V. Это может дать Nvidia больше возможностей для внедрения технологий, ускоряющих игру. Также обратите внимание, что полноценный графический процессор GP102 «Pascal» получил дополнительные 100 МГц тактовой частоты при переходе с карты центра обработки данных Tesla на GTX 1080 Ti.

Когда Volta выйдет на карты GeForce?

Но настоящий вопрос заключается в том, когда мы можем ожидать появления видеокарт GeForce на базе Volta. Серия GTX 10 была выпущена всего через месяц после выпуска Pascal на GTC 2016. Прошло уже семь изнурительных месяцев с тех пор, как Nvidia представила Volta, и мы не слышали ни слова о предложениях GeForce.

Теперь, когда Titan V в дикой природе, я бы хотел увидеть, как Nvidia выпустит мощный преемник GTX 1080 Ti на базе Volta во время своего выступления на выставке CES.Но ничто на рынке не подталкивает Nvidia к выпуску карт Volta GeForce прямо сейчас . Широко разрекламированные карты AMD Radeon Vega оказались неспособными превзойти GTX 1080 — не версию Ti, а ванильную GTX 1080 — в большинстве сценариев, а текущие карты серии GTX 10 все еще улетают с полок благодаря майнерам криптовалюты. Черт, многие варианты GTX 10-й серии сейчас продаются дороже, чем когда они были выпущены полтора года назад.

Когда-нибудь мы узнаем больше о линейке GeForce следующего поколения, но вопрос о том, будет ли это раньше или позже, очень неясен.А пока ознакомьтесь с руководством PCWorld по лучшим видеокартам, чтобы найти наиболее подходящие для вашего бюджета сегодня.

NVIDIA запускает революционную платформу Volta GPU, заправляя

САН-ХОСЕ, Калифорния — (Marketwired — 10 мая 2017 г.) — Конференция по технологиям графических процессоров — NVIDIA (NASDAQ: NVDA) сегодня представила Volta ™ — самую мощную в мире вычислительную архитектуру на основе графических процессоров, созданную для следующей волны прогресса. в области искусственного интеллекта и высокопроизводительных вычислений.

Компания также анонсировала свой первый процессор на базе Volta — графический процессор для центров обработки данных NVIDIA® Tesla® V100, который обеспечивает исключительную скорость и масштабируемость для обработки и обучения ИИ, а также для ускорения рабочих нагрузок высокопроизводительных вычислений и графики.

«Искусственный интеллект является движущей силой величайших технологических достижений в истории человечества», — сказал Дженсен Хуанг, основатель и генеральный директор NVIDIA, представивший Volta на своем выступлении на GTC. «Это автоматизирует интеллект и подстегнет волну социального прогресса, не имеющую себе равных со времен промышленной революции.

«Глубокое обучение, новаторский подход ИИ, который создает компьютерное программное обеспечение, которое обучается, имеет ненасытный спрос на вычислительную мощность. Тысячи инженеров NVIDIA потратили более трех лет на создание Volta, чтобы удовлетворить эту потребность, позволив отрасли реализовать потенциал ИИ, который изменит жизнь, » он сказал.

Volta, архитектура графического процессора NVIDIA седьмого поколения, построена на 21 миллиард транзисторов и обеспечивает производительность, эквивалентную 100 процессорам для глубокого обучения.

Он обеспечивает 5-кратное улучшение по сравнению с Pascal ™, архитектурой NVIDIA GPU текущего поколения, в пиковых терафлопсах и в 15 раз по сравнению с архитектурой Maxwell ™, выпущенной два года назад. Эта производительность в 4 раза превосходит улучшения, предсказанные законом Мура.

Спрос на ускорение ИИ никогда не был таким большим.Разработчики, специалисты по обработке данных и исследователи все чаще полагаются на нейронные сети в своих следующих достижениях в борьбе с раком, повышении безопасности транспорта с помощью беспилотных транспортных средств, обеспечении нового интеллектуального обслуживания клиентов и многом другом.

Центры обработки данных

должны обеспечивать экспоненциально большую вычислительную мощность по мере того, как эти сети становятся более сложными. И им необходимо эффективно масштабироваться, чтобы поддерживать быстрое внедрение высокоточных сервисов на основе искусственного интеллекта, таких как виртуальные помощники на естественном языке и персонализированные системы поиска и рекомендаций.

Volta станет новым стандартом высокопроизводительных вычислений. Он предлагает платформу для систем высокопроизводительных вычислений, позволяющую преуспевать как в области вычислений, так и в области науки о данных, чтобы находить новые идеи. Благодаря объединению ядер CUDA® и нового Volta Tensor Core в рамках единой архитектуры один сервер с графическими процессорами Tesla V100 может заменить сотни стандартных процессоров для традиционных высокопроизводительных вычислений.

Прорывные технологии
Графический процессор Tesla V100 перескакивает через предыдущие поколения графических процессоров NVIDIA с новаторскими технологиями, которые позволяют ему преодолеть барьер в 100 терафлопс для производительности глубокого обучения.В их числе:

  • Тензорные ядра предназначены для ускорения рабочих нагрузок ИИ. Оснащенный 640 тензорными ядрами, V100 обеспечивает производительность глубокого обучения 120 терафлопс, что эквивалентно производительности 100 процессоров.
  • Новая архитектура графического процессора с более чем 21 миллиардом транзисторов. Он объединяет ядра CUDA и тензорные ядра в единую архитектуру, обеспечивая производительность суперкомпьютера AI в одном графическом процессоре.
  • NVLink ™ обеспечивает следующее поколение высокоскоростных межсоединений, связывающих графические процессоры и графические процессоры с центральными процессорами, с пропускной способностью до 2 раз выше, чем у NVLink предыдущего поколения.
  • 900 ГБ / с HBM2 DRAM , разработанный в сотрудничестве с Samsung, обеспечивает на 50 процентов большую пропускную способность памяти, чем графические процессоры предыдущего поколения, что необходимо для поддержки исключительной вычислительной пропускной способности Volta.
  • Программное обеспечение, оптимизированное для Volta , в том числе программное обеспечение CUDA, cuDNN и TensorRT ™, которое ведущие платформы и приложения могут легко использовать для ускорения ИИ и исследований.

Экосистемная поддержка Volta
Volta получила широкую отраслевую поддержку от ведущих компаний и организаций по всему миру:

«NVIDIA и AWS долгое время работали вместе, чтобы помочь клиентам выполнять ресурсоемкие рабочие нагрузки ИИ в облаке.Мы запустили первый облачный экземпляр, оптимизированный для графических процессоров, в 2010 году, а в прошлом году представили самый мощный экземпляр графического процессора, доступный в облаке. AWS является домом для некоторых из самых инновационных и креативных приложений ИИ на сегодняшний день, и мы с нетерпением ждем возможности помочь клиентам в продолжении создания невероятных новых приложений с помощью следующего поколения нашего семейства универсальных экземпляров графических процессоров, когда Volta станет доступным позже в этом году ».
— Мэтт Гарман, вице-президент по вычислительным сервисам, Amazon Web Services

«Мы поздравляем NVIDIA с последним выпуском Volta.От Baidu Cloud до интеллектуального вождения Baidu усиливает свои усилия по созданию открытой платформы искусственного интеллекта. Мы верим, что вместе с NVIDIA ускорим разработку и применение глобальной технологии искусственного интеллекта и создадим больше возможностей для всего общества ».
— Яцинь Чжан, президент Baidu

«NVIDIA и Facebook были отличными партнерами, и мы очень рады тому вкладу, который NVIDIA внесла в Facebook Caffe2 и PyTorch. Мы с нетерпением ждем достижений искусственного интеллекта, которые обеспечит новая высокопроизводительная графическая архитектура NVIDIA Volta.»
— Майк Шрёпфер, технический директор Facebook

.

«Графические процессоры NVIDIA обеспечивают значительное повышение производительности для клиентов Google Cloud Platform. Графические процессоры являются важной частью нашей инфраструктуры, предлагая Google и нашим корпоративным клиентам дополнительные вычислительные мощности для машинного обучения или высокопроизводительных вычислений и анализа данных. Улучшения производительности Volta сделают графические процессоры даже более мощные, и мы планируем предлагать графические процессоры Volta на GCP ».
— Брэд Колдер, вице-президент по разработке Google Cloud Platform, Google

«Microsoft и NVIDIA уже много лет сотрудничают в области технологий искусственного интеллекта, включая Microsoft Azure серии N, Project Olympus и Cognitive Toolkit.Новая архитектура Volta откроет новые невероятные возможности для клиентов Microsoft ».
— Гарри Шум, исполнительный вице-президент Microsoft AI and Research Group, Microsoft

«Национальная лаборатория Ок-Ридж этим летом начнет сборку нашей ведущей вычислительной системы следующего поколения, Summit. Summit работает на графических процессорах Volta и станет лучшим суперкомпьютером в США для научных открытий после завершения в 2018 году. находится в авангарде научных исследований и помогает Министерству энергетики решать сложные задачи с помощью вычислительной науки и открытий с помощью искусственного интеллекта.»
— Джефф Николс, заместитель директора лаборатории Вычислительного управления и вычислительных наук, Национальная лаборатория Окриджа

.

«Большое разнообразие наших продуктов, включая голосовые технологии в WeChat, фото / видео технологии в QQ и Qzone, а также платформу глубокого обучения на основе Tencent Cloud, уже полагаются на ИИ. Мы считаем, что Volta обеспечит беспрецедентную вычислительную мощность для нашего ИИ. разработчиков, и мы рады вскоре открыть эти возможности Tencent Cloud большему количеству клиентов.«
— Доусон Тонг, старший исполнительный вице-президент, Tencent

Будьте в курсе событий на NVIDIA
Подпишитесь на блог NVIDIA, подпишитесь на нас в Facebook, Google+, Twitter, LinkedIn и Instagram, а также просматривайте видео NVIDIA на YouTube и изображения на Flickr.

О NVIDIA
Изобретение NVIDIA (NASDAQ: NVDA) графического процессора в 1999 году вызвало рост рынка компьютерных игр, изменило определение современной компьютерной графики и произвело революцию в параллельных вычислениях.Совсем недавно глубокое обучение с помощью графических процессоров положило начало современному искусственному интеллекту — следующей эре вычислений — с графическим процессором, выступающим в качестве мозга компьютеров, роботов и беспилотных автомобилей, которые могут воспринимать и понимать мир. Дополнительная информация на http://nvidianews.nvidia.com/.

Некоторые заявления в этом пресс-релизе, включая, но не ограничиваясь, заявления относительно: влияния, производительности и преимуществ архитектуры Volta и графического процессора центра обработки данных NVIDIA Tesla V100; влияние искусственного интеллекта и глубокого обучения; и потребность в ускорении ИИ — это заявления прогнозного характера, подверженные рискам и неопределенностям, которые могут привести к тому, что результаты будут существенно отличаться от ожиданий.Важные факторы, которые могут привести к тому, что фактические результаты могут существенно отличаться, включают: глобальные экономические условия; наша зависимость от третьих сторон в производстве, сборке, упаковке и тестировании нашей продукции; влияние технологического развития и конкуренции; разработка новых продуктов и технологий или усовершенствования существующих продуктов и технологий; признание рынком нашей продукции или продукции наших партнеров; дефекты конструкции, изготовления или программного обеспечения; изменения потребительских предпочтений или требований; изменения в отраслевых стандартах и ​​интерфейсах; неожиданная потеря производительности наших продуктов или технологий при интеграции в системы; а также другие факторы, которые время от времени подробно описываются в отчетах, которые NVIDIA подает в Комиссию по ценным бумагам и биржам или SEC, включая форму 10-K за финансовый период, закончившийся 29 января 2017 года.Копии отчетов, поданных в SEC, размещаются на сайте компании и доступны в NVIDIA бесплатно. Эти прогнозные заявления не являются гарантиями будущих результатов и действительны только на дату настоящего документа, и, за исключением случаев, предусмотренных законом, NVIDIA отказывается от каких-либо обязательств по обновлению этих прогнозных заявлений для отражения будущих событий или обстоятельств.

© 2017 Корпорация NVIDIA. Все права защищены. NVIDIA, логотип NVIDIA, Tesla, CUDA, Maxwell, NVLink, Pascal, TensorRT и Volta являются товарными знаками и / или зарегистрированными товарными знаками NVIDIA Corporation в США.С. и др. Страны. Другие названия компаний и продуктов могут быть товарными знаками соответствующих компаний, с которыми они связаны. Возможности, цены, доступность и технические характеристики могут быть изменены без предварительного уведомления.

За дополнительной информацией обращайтесь:
Кристин Брайсон
Директор по связям с общественностью AI / DL и центра обработки данных
NVIDIA Corp.
(203) 241-9190
[email protected]

Google добавляет Nvidia Volta в свои облачные платформы

Этот сайт может получать партнерские комиссии за ссылки на этой странице.Условия эксплуатации.

Учитывая недавние новости о том, что Cloud TPU от Google более экономичен, чем Volta от Nvidia, можно подумать, что Google готовится заменить графические процессоры конкурентов собственным оборудованием. Вместо этого компания расширяет свои предложения GPU до Volta от Nvidia и развертывает GPU в более широком диапазоне движков.Больше всего это говорит о широком спектре поддержки различных типов машинного обучения, рабочих нагрузок ИИ и общей производительности вычислений, которые теперь доступны через облачные сервисы.

Согласно последнему сообщению в блоге Google, графические процессоры Nvidia V100 Tesla теперь доступны как для Compute Engine, так и для Kubernetes Engines. Kupernetes обычно используется для масштабирования контейнерных приложений в облаке, а Google Compute Engine — это облако серверов, которые используются для выполнения рабочих нагрузок, которые можно выгружать для обработки и вычислений.И теперь, благодаря этому последнему обновлению, вы можете объединить восемь графических процессоров Tesla V100, 96 виртуальных ЦП (термин Google для виртуализированного ядра ЦП) и 624 ГБ памяти в одной виртуальной машине, что, как правило, немного больше мощности, чем ваш типичный отдельный сервер. можно собрать. NVLink следующего поколения предлагает до 300 ГБ / с пропускной способности между графическими процессорами, и преимущества, очевидно, хорошо масштабируются — Google утверждает, что это повышает производительность при глубоком обучении и рабочих нагрузках высокопроизводительных вычислений до 40 процентов.

Google пишет, что «NVIDIA V100 уже доступны в следующих регионах: us-west1, us-central1 и europe-west4.Стоимость каждого графического процессора V100 составляет всего 2,48 доллара в час для виртуальных машин по запросу и 1,24 доллара в час для вытесняемых виртуальных машин. Как и другие наши графические процессоры, V100 также оплачивается вторым, и на него распространяются скидки за длительное использование ».

Компания также дает небольшие рекомендации по рабочей нагрузке. Он рекомендует графические процессоры Nvidia P100, основанные на Pascal, для рабочих нагрузок, требующих баланса между ценой и производительностью, в то время как графические процессоры K80 (Kepler) по-прежнему доступны для даже менее требовательных рабочих нагрузок.

Эта диаграмма косвенно показывает, почему облачные вычисления могут иметь финансовый смысл как для компаний, так и для пользователей.Говоря языком потребителя, K80 — это древний продукт. Это двухъядерный процессор с 2496 ядрами и двумя 12 ГБ памяти GDDR5. Он полностью превосходит и превосходит графические процессоры, такие как V100, но он также доступен всего за 45 центов в час. Если бы вы сравнивали такую ​​почасовую ставку со стоимостью покупки всего сервера, когда K80 был новым, вы, очевидно, сэкономили бы огромную сумму денег, используя облако только для рабочих нагрузок, которые вам нужно обрабатывать.

Исходя из цены, которую мы видим для базовых серверов и самого K80, точка безубыточности между стоимостью нового K80 и использованием Google Compute Engine составляет около 10 000 часов.Поэтому, если вы думаете, что для обработки рабочей нагрузки вам понадобится эквивалент 416 дней графического процессора, возможно, лучше просто купить карту. И Nvidia, конечно, не особо заботится о разнице между продажей карты исследовательскому учреждению, которое развернет ее на своих собственных серверах, и продажей карты Google, Amazon или Microsoft для интеграции в рамках предложения облачного сервера. . Nvidia просто хочет продать карту.

Интересно, что на той же странице есть намек на то, что Google вскоре может расширить свои облачные предложения, включив в них более дешевые карты.Один читатель, Сет Прайс, пишет: «Мне не нужен высококлассный графический процессор для той работы, которую я выполняю; Мне нужны только дешевые FLOPS / $. Увидим ли мы когда-либо предлагаемые на GCP графические процессоры потребительского уровня стоимостью менее 1000 долларов каждый… Я просто ищу быструю и эффективную обработку на графическом процессоре по невысокой цене. Мне не нужно, чтобы они были лучшими доступными модулями CUDA. Мне не нужна двойная точность с плавающей запятой научного уровня. Мне не нужно огромное количество VRAM. Для меня нецелесообразно платить в 100 раз больше за час за экземпляр GPU, чем за экземпляр CPU, и я действительно не хочу создавать свои собственные боксы.Сможет ли GCP когда-нибудь удовлетворить эти требования? »

На что Адриан Грэм, архитектор облачных решений Google, ответил: «Мы вас слышим. Следите за обновлениями ».

Big Volta выходит на Quadro: NVIDIA представляет Quadro GV100

Наряду с сегодняшним увеличением объема памяти для существующих карт Tesla V100, NVIDIA также выпускает новую карту на базе Volta для семейства Quadro. Удачно названный Quadro GV100, он является преемником прошлогодней Quadro GP100 и знаменует введение архитектуры Volta в семейство Quadro.

Вследствие того, что графические процессоры NVIDIA раздваиваются между графикой и вычислениями, в последние пару лет семейство Quadro оказалось в странном положении, когда оно расположилось между ними двумя. Раньше король всех карт NVIDIA, вместо этого само семейство Quadro было немного раздвоено между вычислительными картами на базе GPU, такими как Quadro GP100 и теперь GV100, и более чистыми видеокартами, такими как серия P. Представление Quadro GV100, в свою очередь, призвано сохранить здесь статус-кво, предлагая еще более мощную карту Quadro с превосходной графической производительностью, а также мощное вычислительное наследие графического процессора GV100.

Сравнение спецификаций NVIDIA Quadro
GV100 GP100 P6000 M6000
Ядра CUDA 5120 3584 3840 3072
Тензорные ядра 640 НЕТ НЕТ НЕТ
Текстурные блоки 320 224 240 192
ROP 128 128 96 96
Часы с ускорением ~ 1450 МГц ~ 1430 МГц ~ 1560 МГц ~ 1140 МГц
Часы памяти 1.7 Гбит / с HBM2 1,4 Гбит / с HBM2 9 Гбит / с GDDR5X 6,6 Гбит / с GDDR5
Ширина шины памяти 4096 бит 4096 бит 384-бит 384-бит
VRAM 32 ГБ 16 ГБ 24 ГБ 24 ГБ
ECC Полный Полный Частично Частично
половинная точность 29.6 терафлопс? 21,5 терафлопс НЕТ НЕТ
одинарной точности 14,8 терафлопс 10,3 терафлопс 12 терафлопс 7 терафлопс
Двойная точность 7,4 терафлопс 5,2 терафлопс 0,38 терафлопс 0,22 терафлопс
Производительность тензора 118.5 TLFOP НЕТ НЕТ НЕТ
Расчетная мощность 250 Вт 235 Вт 250 Вт 250 Вт
Графический процессор GV100 GP100 GP102 GM200
Архитектура Вольта Паскаль Паскаль Максвелл 2
Производственный процесс TSMC 12 нм FFN TSMC 16 нм TSMC 16 нм TSMC 28 нм
Дата выпуска Март 2018 Март 2017 Октябрь 2016 Март 2016

Хотя в предварительном анонсе NVIDIA не упоминается, прекращается ли выпуск Quadro GP100, Quadro GV100 тем не менее является фактической заменой последней карты NVIDIA Big Pascal текущего поколения.В официальных спецификациях карты указано, что производительность одинарной точности составляет 14,8 терафлопс, что соответствует полностью включенному графическому процессору GV100 с тактовой частотой около 1,45 ГГц. Это всего лишь на волосок ниже мезонина Tesla V100 и впереди варианта PCIe. Как и карты Tesla с увеличенной емкостью, Quadro GV100 поставляется с 32 ГБ HBM2 с исходной ECC-защитой. Это, наконец, дает карту профессиональной визуализации NVIDIA до 32 ГБ; GP100 был ограничен 16 ГБ, а Quadro P6000 — 24 ГБ.

Что касается функций, карта также поставляется с полностью задействованными тензорными ядрами NVIDIA, а производительность снова находится на уровне Tesla V100.Как и вычислительные возможности Quadro GP100, тензорные ядра не будут применимы ко всем ситуациям, но есть некоторые сценарии профессиональной визуализации, где NVIDIA ожидает, что это будет полезно. Что еще более важно, Quadro GV100 продолжает новую традицию поставки с двумя разъемами NVLink, что означает, что пара карт может быть установлена ​​в системе и пользоваться всеми преимуществами интерфейса, в частности передачей данных с низкой задержкой, удаленным доступом к памяти и пул памяти.

На высоком уровне, Quadro GV100 легко должна быть самой быстрой картой Quadro, отличие GP100 от своих собратьев по чистой графике не всегда было отличием, и одно это, несомненно, сдвинет карты. Как мы уже видели на примере Titan V на рынке потребительских товаров — NVIDIA уклоняется от ожиданий, выпуская сначала карту Prosumer Volta, а затем карту ProViz — Titan V может быть намного быстрее, чем любая из карт Pascal, если предположить, что программное обеспечение либо разработан для использования преимуществ архитектуры или, по крайней мере, хорошо сочетается с архитектурными обновлениями NVIDIA.Помимо прочего, в этом году NVIDIA снова активно занимается виртуальной реальностью, поэтому GV100 только что стала их флагманской картой виртуальной реальности — удобный момент для тех, кто ищет быструю карту для управления только что выпущенным HTC Vive Pro.

Однако более важным вызовом GV100 в экосистеме NVIDIA является то, что теперь это единственная карта Quadro, использующая архитектуру Volta, то есть единственная карта, поддерживающая аппаратное ускорение трассировки лучей по сравнению с технологией NVIDIA RTX. Анонсированный на прошлой неделе на конференции разработчиков игр 2018 года, RTX — это довольно плохо определенная система аппаратного ускорения NVIDIA для трассировки лучей в реальном времени.И хотя объявление GDC было сосредоточено на использовании этой технологии в играх и разработке игр, в GTC компания сосредоточена на ее профессиональном использовании, включая разработку новых игр, а также создание профессиональных медиа. Не то чтобы NVIDIA ожидала, что продюсеры фильмов внезапно начнут готовить финальную версию в реальном времени на графических процессорах, но, как и в случае со сценарием создания игровых ресурсов, идея состоит в том, чтобы значительно улучшить реализм во время подготовки к производству, дав художникам лучшее представление о том, что будет в финальной сцене. выглядит как.

Наряду с новым API трассировки лучей Microsoft DirectX, оборудование RTX будет также доступно в движке трассировки лучей NVIDIA OptiX — который почти наверняка больше подходит для пользователей ProViz — в то время как NVIDIA также заявляет, что поддержка Vulkan будет доступна в будущем. И, как и в сценарии разработки игры, NVIDIA также будет стремиться использовать здесь свои тензорные ядра, чтобы использовать их для шумоподавления AI. Что, учитывая все еще ограниченную производительность трассировки лучей текущего оборудования, все чаще становится критически важным компонентом для обеспечения жизнеспособности трассировки лучей в реальном времени в 2018 году.

В остальном Quadro GV100 выглядит вполне стандартной картой Quadro. TDP немного вырос по сравнению с Quadro GP100 — с 235 Вт до 250 Вт — поэтому, хотя он, как правило, должен быть заменяемым, он не является полностью идентичным. Выходы дисплея также не идентичны; Quadro GV100 отказался от единственного порта DVI GP100, оставив его с чистой настройкой 4x DisplayPort 1.4. Карта также имеет стандартные разъемы Quadro Sync и Stereo для синхронизированного обновления и стерео с четырехкратной буферизацией соответственно.

Подводя итог, Quadro GV100 поступает от NVIDIA немедленно, а OEM-производители начнут включать его в свои системы в июне. Официальная цена не была объявлена, но, как и на GP100 до этого, я ожидал, что эта карта будет стоить к северу от 5000 долларов. Также объявлена ​​официальная цена карты; Самый быстрый Quadro от NVIDIA будет стоить 9000 долларов.

Nvidia’s Volta: изменит правила игры для ИИ? | синхронизировано | SyncedReview

По мере того, как все более сложные исследования в области искусственного интеллекта предъявляют повышенные требования к вычислительной мощности компьютеров, все больше и больше технологических компаний ищут способы повышения производительности оборудования.Последняя игра Nvidia — Volta.

Каждый год в мае Nvidia проводит GTC (Конференцию по технологиям графических процессоров) в Сан-Хосе. На конференции будут представлены технологические достижения и новые продукты, а также представлены прикладные и программные решения. В этом году на GTC Nvidia сделала огромный шаг в расширении границ искусственного интеллекта.

В своем программном выступлении генеральный директор и основатель Nvidia Дженсен Хуанг представил архитектуру графического процессора нового поколения под названием Volta , процессор Tesla V100 на базе Volta и облако графических процессоров Nvidia (NGC).

Дженсен Хуанг, генеральный директор Nvidia, выступил с программной речью в конференц-центре Сан-Хосе, 10 мая

Очевидно, Хуанг и Nvidia серьезно настроены произвести революцию в вычислениях искусственного интеллекта и с этой целью стремятся продолжать продвигать свои технологии графических процессоров к следующему. уровень. Volta считается самой мощной вычислительной архитектурой на базе GPU. Он содержит не менее 21 миллиарда транзисторов, обеспечивая производительность, эквивалентную 100 процессорам для глубокого обучения. Он в пять раз мощнее своего предшественника Паскаль.

«Я только что положил в карман три миллиарда долларов», — пошутил Хуанг, говоря об инвестициях Nvidia в Tesla V100. Nvidia делает большую ставку на Volta, и если посмотреть на характеристики производительности, можно предположить, что у них есть веские причины для этого.

Графический процессор Nvidia GV100, любезно предоставлен Nvidia

Volta прибыла через год после выпуска Паскаля — обычно между поколениями архитектуры графического процессора существует двухлетний период. Это свидетельствует о стремлении Nvidia идти в ногу с растущими потребностями ИИ, поскольку все больше продуктов, приложений и решений на базе ИИ появляется в таких отраслях, как финансы, медицина, здравоохранение, транспорт и робототехника.

Хотя Паскаль хорошо проявил себя в глубоком обучении, Volta намного превосходит его, поскольку он объединяет ядра CUDA и тензорные ядра. Тензорные ядра — это революционная технология, разработанная для ускорения рабочих нагрузок ИИ. Тензорные ядра Volta могут генерировать в 12 раз большую пропускную способность, чем Паскаль, что позволяет Tesla V100 обеспечивать производительность глубокого обучения в 120 терафлопс (мера мощности графического процессора).

Визуализация тензорных ядер Паскаля и Вольта, любезно предоставлена ​​Nvidia

Другие инновации Tesla V100 включают улучшенную производительность NVLink и интерфейс HBM2 DRAM со скоростью 900 ГБ / с, разработанный в сотрудничестве с Samsung.

Хотя Tesla V100 не будет выпущен до осени 2017 года, его достижения уже повлияли на стратегию развертывания искусственного интеллекта Nvidia.

В прошлом году Nvidia выпустила систему DGX-1 на основе Pascal, используемую в центрах обработки данных для исследований в области искусственного интеллекта. DGX-1 первого поколения, суперкомпьютер с искусственным интеллектом в коробке, отличался небольшими размерами и большими возможностями, эквивалентными сотням процессоров.

DGX-1, любезно предоставлено Nvidia

Выпуск системы DGX-1 оказался чрезвычайно успешным в продвижении широкого спектра развертываний ИИ для предприятий, исследовательских организаций и поставщиков облачных услуг.Всего за три месяца доля центров обработки данных в выручке Nvidia выросла более чем на 30% — с 296 до 409 миллионов долларов.

Volta будет улучшать и расширять семейство продуктов Nvidia, включая суперкомпьютеры DGX-1 и DGX на базе Volta, Hyperscale Inference на основе Volta, облако графических процессоров Nvidia и HGX-1 для облачных вычислений на графических процессорах.

Новый DGX-1 с питанием от Volta превосходит свою предыдущую версию со значительными улучшениями в TFLOPS (от 170 до 960), ядрах CUDA (от 28 672 до 40 960), тензорных ядрах (от 0 до 5120), увеличении скорости NVLink по сравнению с PCIe (от 5X до 10X) и скорость обучения глубокому обучению (от 1X до 3X).

Nvidia рекламирует свою станцию ​​DGX — нового брата DGX-1 — как первый в мире суперкомпьютер с искусственным интеллектом, разработанный для исследовательских лабораторий и офисов. Включает в себя четыре Tesla V100, водяное охлаждение, соединение NVLink нового поколения, процессор INTEL XEON и три порта дисплея, DGX Station предоставляет пользователям простоту экспериментов и низкий уровень шума.

DGX Station, любезно предоставлено Nvidia

Система Nvidia, специально предназначенная для компаний, предоставляющих веб-услуги, называется Hyperscale. Последняя версия Tesla V100 Hyperscale обеспечивает ускорение вывода в 15–25 раз по сравнению с Intel Skylake.

Еще одна интересная разработка — это Nvidia GPU Cloud (NGC), чего уже давно ждали клиенты Nvidia. Облачная платформа позволит разработчикам обучать модели глубокого обучения на ПК (оборудованных TITAN X или GeForce GTX 1080 Ti), системах NVIDIA DGX или в облаке.

Тем временем HGX-1 нацелен на облачные вычисления для глубокого обучения, графики или вычислений CUDA. HGX-1 оснащен восемью Tesla V100, гибридным кубом NVLink и тремя конфигурациями процессоров и графических процессоров (2C: 8G, 2C: 4G, 1C: 2G).

HGX-1, любезно предоставлено Nvidia

Nvidia была ведущей компанией в области вычислений искусственного интеллекта во многом благодаря росту числа графических процессоров с тех пор, как AlexNet выиграла ImageNet в 2012 году. вывод. Графические процессоры хороши в обучении, но не так конкурентоспособны.

Вот почему Volta может быть ответом. В своем программном выступлении Хуанг сказал: «Volta — новаторская работа, невероятно хороша в обучении и невероятно хороша в логических выводах.

Huang также представил TensorRT (Run Time) для TensorFlow, который ускоряет обучение в 12 раз и вывод в 6 раз. Он описал производительность логического вывода с точки зрения пропускной способности и задержки в ResNet-50, измеренной в единицах изображений в секунду. V100 может обрабатывать более 5000 изображений в секунду, тогда как P100 может обрабатывать только 600, а процессор Intel Broadwell — только 100.

На диаграмме сравнивается производительность K80, P100 и V100 в сервисах, критичных к задержке в реальном времени, любезно предоставлено Nvidia.

Еще одна ключевая особенность Volta — энергоэффективность, которая имеет решающее значение для неподключенных устройств, таких как автомобили.

В прошлом году Nvidia представила суперкомпьютер с искусственным интеллектом для автономных автомобилей, получивший название Xavier, — процессор, объединяющий ЦП, графический процессор CUDA и ускорители глубокого обучения. После дебюта Volta, Xavier модернизировал ядро ​​своего графического процессора с Pascal до CUDA Volta, значительно снизив затраты на электроэнергию.

Xavier SOC, любезно предоставлено Nvidia

«Очевидно, что Nvidia очень заботится об энергоэффективности в нейронных сетях.Я думаю, что Ксавье будет действительно интересно управлять сложными нейронными сетями с меньшей задержкой и лучшими устройствами », — сказал вице-президент Nvidia Брайан Катандзаро.

Еще одним захватывающим объявлением стало решение Nvidia открыть DLA Xavier с открытым исходным кодом: ранний доступ появится в июне 2017 года, а полный — в сентябре.

Volta управляет ИИ с точки зрения развертывания, улучшения логических выводов и снижения затрат на электроэнергию. Вместо обновленного Паскаля Volta представляет собой революционную архитектуру графического процессора.В этом свете мы можем увидеть другие инновации, которые могут принести миру Volta и GPU на базе Volta.

Катандзаро сказал, что он рад увидеть, как Volta повлияет на алгоритмы в AI. «Я ожидаю, что с искусственным интеллектом произойдет то, что люди будут пробовать модели, которые они не могли пробовать раньше, что потребует гораздо больше (тера) провалов. Я лично ожидаю, что мы увидим немного сдвигов в архитектуре, чтобы воспользоваться теми провалами, которые у нас есть. Это может изменить способ, которым люди проектируют свои модели.«

HPC (высокопроизводительные вычисления) — еще один хороший пример потенциала Volta. Ожидается, что благодаря мощным вычислительным возможностям Volta ученые создадут больше приложений искусственного интеллекта для решения проблем в HPC.

Как отмечают Хуанг и технологические гиганты, мир приближается к тому моменту, когда закон Мура — теория удвоения возможностей, которая позволяла миру развивать архитектуру микропроцессоров на протяжении десятилетий — вступает в конфликт с законами физики. Что касается процессоров.В эпоху, наступившую после закона Мура, все ищут новые решения. Nividia делает ставку на графические процессоры, которые, по-видимому, не подпадают под действие закона Мура. Более того, если графические процессоры перейдут в облако, отпадет необходимость учитывать ограничения на количество ядер в одном физическом пространстве. У графических процессоров будет неограниченное пространство для роста.

Никто не знает, станут ли графические процессоры окончательным ответом, но, по крайней мере, в краткосрочной перспективе они станут главной силой, ускоряющей вычисления с использованием ИИ. И Вольта идет в авангарде.

Сравнение архитектуры графических процессоров Nvidia Turing и Volta v Pascal

проводит сравнение трех современных архитектур графических процессоров Nvidia, а именно Pascal, Volta и Turing, на основе их спецификаций, производительности, использования и приложений в графической индустрии.

Графический процессор

является сердцем видеокарты, его работа и производительность определяются архитектурой, известной как архитектура графического процессора. Каждое семейство графических карт имеет свою собственную архитектуру графического процессора, и каждое новое семейство или серия графических карт имеет более совершенную и мощную архитектуру графического процессора.

Каждый производитель графических процессоров разрабатывает свою собственную архитектуру графических процессоров, а архитектуры графических процессоров для видеокарт от Nvidia и AMD полностью различаются по работе, работе и именованию. Примерами архитектур графических процессоров Nvidia являются Fermi, Kepler, Pascal, Volta, Turing, тогда как от AMD у нас есть GCN (1.0, 2.0, 3.0), Polaris (GCN 4.0) и Vega. Также две архитектуры графических процессоров от одного производителя графических процессоров различаются по работе, эффективности и производительности, например Ферми отличается от Кеплера, Паскаль отличается от Келпера и так далее. Но здесь я собираюсь провести сравнение трех современных архитектур графических процессоров Nvidia, а именно Pascal, Volta и Turing, на основе их спецификаций, производительности, использования и приложений в графической индустрии.

Архитектура графического процессора

Pascal

Pascal — одна из самых популярных архитектур графических процессоров от Nvidia и преемница архитектуры графического процессора Maxwell.Видеокарты серий GeForce 10 и Quadro P построены на архитектуре графического процессора Pascal. Графические процессоры Pascal созданы на основе процесса производства 16/14 нм и используют ядра CUDA в качестве основных блоков обработки пикселей и для растеризации. GeForce GTX 1050, GTX 1050 Ti и GT 1030 построены по 14-нм технологии FinFET, а другие — по 16-нм техпроцессу. Архитектура графического процессора Pascal обеспечивает значительные улучшения по сравнению со старыми архитектурами с точки зрения производительности, энергопотребления (TDP) и тепловыделения.

Архитектура графического процессора

Pascal поддерживает память GDDR5, GDDR5X и HBM2. Nvidia Quadro GP100 — это только видеокарта более высокого уровня для рабочих станций, которая оснащена памятью HBM2 с высокой пропускной способностью. Архитектура графического процессора Nvidia Pascal поддерживает DirectX 12, OpenGL 4.6, Vulkan, OpenCL, SLI (для высокопроизводительных видеокарт GeForce), NVLink (только для топовых графических процессоров рабочих станций), NVENC, G-Sync, GPU Boost 3.0, DisplayPort 1.4, HDMI 2.0b , CUDA Compute Capability 6.0 / 6.1 и поддерживает VR. Графические процессоры на основе Pascal также можно найти в ноутбуках или ноутбуках.

Обязательно к прочтению: GDDR5 vs GDDR5X vs HBM2 vs GDDR6 Сравнение

Архитектура графического процессора

Volta

Volta является преемником архитектуры графического процессора Pascal и построена по 12-нм техпроцессу. Он поддерживает высокоскоростную память HBM2 с высокой пропускной способностью. Архитектура Volta предназначена только для удовлетворения потребностей рабочих станций и центров обработки данных. На данный момент нет игровых видеокарт на архитектуре Volta. Эта архитектура графического процессора основана на ядрах CUDA и тензорных ядрах.Тензорные ядра используются для искусственного интеллекта (AI), глубокого обучения, машинного обучения, сложных арифметических вычислений и обеспечивают более чем 5-кратное увеличение производительности по сравнению с архитектурой Nvidia Pascal.

Графические карты, использующие архитектуру Volta GPU, включают Nvidia Titan V, Nvidia Titan V CEO Edition и Nvidia Quadro GV100. Архитектура Volta поддерживает технологию NVLink 2.0, которая намного быстрее, чем предыдущий NVLink, и обеспечивает гораздо более высокую скорость передачи данных — 25 Гбит / с на канал данных в каждом направлении.Возможно, мы сможем увидеть больше видеокарт, использующих архитектуру Volta, но я думаю, что это будет только в категории видеокарт для рабочих станций.

Отъезд: Сравнение архитектуры графических процессоров Volta и Pascal

Архитектура графического процессора Turing

Turing является преемником архитектуры графического процессора Volta. Это одна из самых передовых архитектур графических процессоров из когда-либо созданных. Графические процессоры Turing построены по 12-нм производственному процессу FinFET и поддерживают память GDDR6, которая работает на очень высокой скорости, может обеспечить гораздо более высокую пропускную способность по сравнению с предыдущими модулями памяти GDDR5X и GDDR5.Эта передовая архитектура графического процессора включает ядра CUDA, тензорные ядра и ядра RT . Turing — первая архитектура графического процессора, поддерживающая Real Time Ray Tracing для создания реалистичного освещения, теней, отражений, преломлений и других продвинутых световых эффектов. Эта трассировка лучей в реальном времени обрабатывается ядрами RT, и ее производительность оценивается в новой метрике, которая называется гига-лучей в секунду .

Тензорные ядра

в графических процессорах Turing разработаны специально для искусственного интеллекта (AI) и глубокого обучения для выполнения различных типов сложных вычислений.Он также используется для метода под названием Deep Learning Super-Sampling (DLSS) или (Deep Learning Anti-aliasing) для сглаживания краев в играх и для шумоподавления, масштабирования разрешения и повторного тайминга видео.

ядер CUDA используются для стандартных задач обработки на основе пикселей или растеризации, но в Turing они имеют новую многопроцессорную потоковую архитектуру (SM), которая поддерживает до 16 триллионов операций с плавающей запятой параллельно с 16 триллионами целочисленных операций в секунду. Теперь это может позволить разработчикам создавать сложные симуляции, такие как частицы или гидродинамика, для научной визуализации, виртуальных сред и специальных эффектов.Согласно Nvidia, графические процессоры Turing обеспечивают до 6 раз производительность по сравнению с графическими процессорами

на основе Pascal.

Существуют видеокарты как для рабочих станций, так и для игровых, основанные на архитектуре Turing GPU. Графические карты Turing Workstation включают Quadro RTX 8000, Quadro RTX 6000, Quadro RTX 5000, а игровые видеокарты состоят из серии GeForce RTX 20, в которую входят GeForce RTX 2080 Ti, RTX 2080, RTX 2070, а также могучий Nvidia TITAN RTX. Turing поддерживает настройку нескольких графических процессоров для видеокарт Quadro RTX и GeForce RTX с помощью NVLink для удвоения или утроения их вычислительной производительности.Видеокарты GeForce RTX также поддерживают VirtualLink через разъем USB Type-C для подключения гарнитуры VR через порт USB Type-C для получения потрясающих впечатлений от виртуальной реальности. С другой стороны, графические процессоры Quadro RTX способны обрабатывать видео 8K в реальном времени, что демонстрирует мощь этой новой архитектуры.

Обновление : Видеокарты Turing серии GTX 16 не поставляются с ядрами RT и тензорными ядрами. В их число входят GTX 1660 Ti, GTX 1660.

.

Pascal vs Volta vs Turing Comparison

Быстрое и краткое сравнение архитектур Pascal, Volta и Turing GPU от Nvidia.

Архитектура графического процессора -> Паскаль Вольта Тьюринг
Производитель графического процессора Nvidia Nvidia Nvidia
Процесс изготовления 14 нм / 16 нм 12 нм 12 нм
Ядра CUDA Есть Есть Есть
Тензорные ядра NA Есть Есть
Ядра RT NA NA Есть
Поддержка памяти DDR4, GDDR5, GDDR5X, HBM2 HBM2 GDDR6
VR Готов Есть Есть Есть
VirtualLink (USB Type-C) NA NA Есть
Поддержка нескольких графических процессоров Да (в картах высокого класса), SLI и NVLink NVLink 2 NVLink 2 / NVLink SLI
Графические карты GeForce 10 series, Nvidia Titan X, Nvidia Titan Xp, видеокарты для рабочих станций серии Quadro P, Quadro GP100 Nvidia Titan V, Quadro GV100 Видеокарты серий Quadro RTX 8000, Quadro RTX 6000, Quadro RTX 5000 / RTX
Приложения Игры, Рабочая станция Искусственный интеллект (AI), рабочая станция, центр обработки данных Искусственный интеллект (AI), рабочая станция, игры

Последние мысли

Что ж, нельзя отрицать тот факт, что Turing является самой продвинутой архитектурой GPU и опережает Pascal и Volta с точки зрения технологий.Turing — это скорее многоцелевая архитектура графического процессора, которая может выполнять все три задачи одновременно: обработку пикселей, искусственный интеллект (AI) и трассировку лучей в реальном времени. Pascal — очень долгоживущая и успешная архитектура GPU, но теперь она показывает свой возраст из-за отсутствия расширенных функций AI и Ray Tracing. Volta — это действительно вопросительный знак для нас, потому что до сих пор от него было всего несколько видеокарт, и, по моему мнению, он был полностью заменен более новой и лучшей архитектурой Turing GPU.Будущее графики определенно принадлежит архитектуре Тьюринга, поскольку архитектуры предыдущих поколений постепенно исчезают. Если вам есть что сказать, оставьте комментарий ниже.

文 为 转载 , 原文 链接 : Сравнение архитектуры графических процессоров Nvidia Turing и Volta v Pascal

Прибытие

Volta: nVidia объявляет о технических характеристиках видеокарты Titan V [ОБНОВЛЕНИЕ] | ГеймерыNexus

NVidia представила свой новый графический процессор Titan V, который компания объявляет «самым мощным графическим процессором в мире для ПК».«Графическая карта Titan V предназначена для научных расчетов и моделирования и очень четко лишена всяких без исключения обозначений« GTX »или« игровых ».

Titan V содержит транзисторы 21,1 Б (перспектива: 1080 Ti — 12 Б, P100 — 15,3 Б), способен управлять 110 Тфлопс вычислений Tensor и использует архитектуру графического процессора Volta. Мы не уверены в спецификациях нижнего уровня, и в настоящее время у нас нет блок-схемы карты. Мы запросили оба набора данных.

Titan V — это суперкомпьютерная карта, хорошо подходящая для нынешнего внимания Volta к машинному обучению.Titan V использует тот же дизайн Tensor Core, который подробно описан в анонсе V100, а также объединяет кеш-память L1 и разделяемую память, что должно упростить разработку (особенно программного обеспечения CUDA / тензор).

NVidia Titan V построен на 12-нм кремнии FFN с 12 ГБ HBM2 на переходнике.

Карта доступна по цене 3000 долларов США для прямой покупки. Само собой разумеется, что вы не должны покупать это для игр — это будет не очень хорошо, поскольку карта создана для того, чтобы лидировать в машинном обучении и научных разработках.

Мы опубликуем дополнительную информацию по мере ее поступления.

Характеристики NVIDIA Titan V

Сравнение характеристик NVIDIA Pascal
Титан V Тесла V100 Тесла P100 GTX 1080 Ti GTX 1080
Графический процессор GV100 GV100 GP100 Cut-Down Pascal GP102 Паскаль GP104-400 Паскаль
Количество транзисторов 21.1Б 21.1B 15,3B 12B 7.2B
Fab процесс 12 нм FFN 12 нм FFN 16 нм FinFET 16 нм FinFET 16 нм FinFET
Ядра CUDA / Тензорные ядра 5120/640 5120/640 3584/0 3584/0 2560/0
TMU 320 224 224 160
ROP ? 96 (?) 88 64
Частота ядра 1200 МГц 1328 МГц 1607 МГц
Часы с ускорением 1455 МГц 1370 МГц 1480 МГц 1600 МГц 1733 МГц
FP32 TFLOP 15TFLOPs 14 тфлопс 10.6ТФЛОПс ~ 11,4 тфлопс 9ТФЛОПс
Тип памяти HBM2 HBM2 HBM2 GDDR5X GDDR5X
Объем памяти 12 ГБ 16 ГБ 16 ГБ 11 ГБ 8 ГБ
Часы памяти 1.7 Гбит / с HBM2 1,75 Гбит / с HBM2? 11 Гбит / с 10 Гбит / с GDDR5X
Интерфейс памяти 3072-бит 4096 бит 4096 бит 352-бит 256 бит
Пропускная способность памяти 653 ГБ / с 900 ГБ / с? ~ 484 ГБ 320.32 ГБ / с
Общий бюджет мощности (TDP) 250 Вт 250 Вт 300 Вт 250 Вт 180 Вт
Разъемы питания 1x 8-контактный
1x 6-контактный
? 1x 8-контактный
1x 6-контактный
1x 8-контактный
Дата выпуска 07.12.2017 4Q16-1Q17 TBD 27.05.2016
отпускная цена $ 3000 $ 10000 $ 700 Артикул: 700 $
Рекомендуемая цена: 600 $
Сейчас: 500 $

ОБНОВЛЕНИЯ

Эталонная печатная плата Titan V — предположительно единственная печатная плата, которая будет существовать — использует 16-фазный VRM DrMOS.Охлаждающее решение такое же, как и в видеокартах серии GTX 10, включая 1080 Ti, поэтому используется паровая камера с радиальным нагнетательным вентилятором. Это соответствует TDP 250 Вт, что дополнительно усилено разъемами питания 1x 8-контактный + 1x 6-контактный. В любом случае кулер не выдержит большего. Что касается спецификаций NVIDIA Titan V, карта использует графический процессор GV100 с 5120 ядрами CUDA и 640 тензорными ядрами с тактовой частотой до 1200 МГц / 1455 МГц на ядрах CUDA. На карте также размещено 320 блоков TMU.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *