Видеокарты энергопотребление: Страница не найдена — COMPSECURITY

Содержание

Энергопотребление видеокарт: сколько электроэнергии потребляют видеокарты, таблица энергопотребления видеокарт NVIDIA

Криптовалюта

22.01.2021

Комментариев: 0

Просмотров: 4408

Читать: 16 мин

При выборе видеокарты необходимо обращать внимание на количество потребляемой электроэнергии. Ниже представлена таблица потребления энергии карт TITAN и GeForce. Данные взяты из официальных источников NVIDIA. Потребление электричества указано в пиковом значении и при максимальной нагрузке.

Модель видеокарты

Энергопотребление, Вт

Мощность блока питания, Вт

GeForce RTX 3090

350

750

GeForce RTX 3080

320

750

GeForce RTX 3070

220

650

GeForce RTX 3060 Ti

200

600

NVIDIA TITAN RTX

280

650

GeForce RTX 2080 Ti

260

650

GeForce RTX 2080 Super

250

650

GeForce RTX 2080

225

650

GeForce RTX 2070 Super

215

650

GeForce RTX 2070

175

550

GeForce RTX 2060 Super

175

550

GeForce RTX 2060

160

500

GeForce GTX 1660 Ti

120

450

GeForce GTX 1660 Super

125

450

GeForce GTX 1660

120

450

GeForce GTX 1650 Super

100

350

GeForce GTX 1650

75

300

NVIDIA TITAN V

250

600

NVIDIA TITAN Xp

250

600

GeForce GTX 1080 Ti

250

600

GeForce GTX 1080

180

500

GeForce GTX 1070 Ti

180

500

GeForce GTX 1070

150

500

GeForce GTX 1060

120

400

GeForce GTX 1050 Ti

75

300

GeForce GTX 1050

75

300

GeForce GT 1030

30

300

NVIDIA TITAN X (Pascal)

250

600

GeForce GTX TITAN X

250

600

GeForce GTX TITAN Black

250

600

GeForce GTX TITAN

250

600

GeForce GTX 980 Ti

250

600

GeForce GTX 980

165

500

GeForce GTX 970

145

500

GeForce GTX 960

120

400

GeForce GTX 950

90

350

GeForce GTX 780 Ti

250

600

GeForce GTX 780

250

600

GeForce GTX 770

230

600

GeForce GTX 760

170

500

GeForce GTX 750 Ti

60

300

GeForce GTX 750

55

300

GeForce GTX 690

300

650

GeForce GTX 680

195

550

GeForce GTX 670

170

500

GeForce GTX 660 Ti

150

450

GeForce GTX 660

140

450

GeForce GTX 650 Ti Boost

134

450

GeForce GTX 650 Ti

110

400

GeForce GTX 650

64

400

GeForce GTX 645

130

450

GeForce GT 640 (GDDR5)

49

300

GeForce GT 640 (DDR3)

65

350

GeForce GT 630

65

300

GeForce GT 620

49

300

GeForce GTX 590

365

700

GeForce GTX 580

244

600

GeForce GTX 570

219

550

GeForce GTX 560 Ti

170

500

GeForce GTX 560

150

450

GeForce GTX 550 Ti

116

400

GeForce GT 520

29

300

GeForce GTX 480

250

600

GeForce GTX 470

220

550

GeForce GTX 465

200

550

GeForce GTX 460

160

450

GeForce GTS 450

106

400

Как правило, информация о технических характеристиках карт сопровождается следующими понятиями:

  1. Thermal Design Parameter (TDP) – тепловой расчетный параметр, относится к потреблению видеопроцессора.
  2. GPU Power – потребляемая мощность видеопроцессора.
  3. Total Board Power (TBP) – общая потребляемая мощность платы.
  4. Total Graphics Power (TGP) – общая потребляемая мощность графического ускорителя, аналог TBP. TGP всегда больше TDP.
  5. Maximum Power Consumption (MPC) – максимальная потребляемая мощность.

Для питания процессора и памяти видеокарты используются понижающие преобразователи входного постоянного напряжения +12 вольт. Карты также потребляют ток по линии +3,3 вольта через райзер. Разработчики AMD и NVIDIA применяют разные подходы при разработке продукции. Это можно отследить по разнице цепи VRM.

Разница в подходах к измерению потребляемой мощности видеокарт AMD и NVIDIA

Информация от производителей о потреблении электроэнергии видеокарт, как правило, сопровождается сокращениями TDR,  либо TBP/TGP, в Вт. Значения видеокарт NVIDIA внесены в BIOS. Они определяют лимит потребляемой по умолчанию мощности и максимально потребляемую мощность. Если значения равны, разогнать карты будет достаточно сложно. В картах NVIDIA специальный чип производит замер напряжения на входе и выходе специального шунта с разным сопротивлением. Измерение падения напряжения на шунте позволяет узнать потребляемый картой Nvidia ток по линии 12 вольт. Поскольку основное потребление зеленых видеокарт осуществляется именно по этой линии, точность информации относительно общего потребления электричества получается точной.

Значение максимальной потребляемой мощности картами NVIDIA практически никогда не превышает указанных в BIOS значений. Это достигается за счет контроля потребления по линии 12 вольт и оперативному изменению режима работы ШИМ-контроллера VRM. 

К общему потреблению энергии видеокарты NVIDIA относится не только мощность, которая потребляется процессором и видеопамятью, но и RGB-подсветка, вентиляторы системы охлаждения. Разгонный потенциал карт значительно увеличится, если отключить подсветку и установить более эффективные вентиляторы той же мощности.   

Контроллер видеокарт AMD обеспечивает потребление через питание видеопроцессора. Потребление других компонентов при расчете TBP/TGP у видеокарт AMD обычно не учитывается. По этой причине видеокарты AMD обычно потребляют больше энергии при одинаковых значениях.

Потери постоянного напряжения 

Эффективность работы цепей видеокарт значительно ниже, чем у импульсных блоков питания. Это связано с ограничениями, связанными с размером деталей на платах, а также с потерями, связанными с согласованием работы множества фаз. Среди основных компонентов, которые снижают КПД – фильтрация и сглаживание напряжения. При выборе видеокарт рекомендуем обращать внимание на количество фаз питания видеопроцессора. Чем больше их количество, тем меньше пульсаций выходного напряжения. 

Для повышения качества выходного напряжения можно поставить параллельные сглаживающие конденсаторы на каждую фазу. Увеличение емкости сглаживающего конденсатора в два раза уменьшает амплитуду пульсаций на выходе преобразователя почти в вдвое. Это благотворно сказывается на стабильности работы GPU и его разгонном потенциале. 

Миниатюризация компонентов ухудшает условия их охлаждения. Это негативно влияет на общую эффективность работы цепей питания. Производители NVIDIA отказались от использования виртуальных фаз питания в устройствах.  

Для улучшения балансировки работы фаз питания карт NVIDIA используются смарт-контроллеры DCR (Direct Current Resistance). В режиме реального времени они корректируют работы фаз в зависимости от температуры и проходящего тока. 

Балансировка работы фаз карт Nvidia достигается за счет постоянного отслеживания и регулировки тока затвора полевых транзисторов каждой фазы. Измерения производятся не с помощью отслеживания тока на шунте или на выходе сглаживающего фильтра, а с помощью цепей DCR. 

У большинства видеокарт AMD дешевого и среднего ценового сегмента для балансировки фаз используются цепи, связанные с катушками индуктивности LC-фильтров. Они отличаются в худшую сторону наличием больших погрешностей. В дорогих видеокартах AMD используются более совершенные способы контроля и балансировки работы фаз.  

Контроллеры питания памяти видеокарт

Контроллер памяти находится в чипе GPU и генерирует тепло, которое должно учитываться при подсчете TDP. Однако ни AMD, ни NVIDIA не учитывают его в общем потреблении. В видеокартах Nvidia питание памяти осуществляется через фазы MVDD и storage-контроллер. В видеокартах AMD Radeon VII питание памяти идет по цепям VDDRC HBM и VDDCI, у Vega – по линиям MVDD и VDDCI. Основной ток в цепях питания памяти поступает по линии MVDD (VDDRC). Напряжение VDDCI используется на шине I/O между GPU Core и чипами памяти. 

Как узнать текущее электропотребление видеокарт?

Как правило, на официальном сайте производителя указывается рекомендованная мощность блока питания, с которым видеоадаптер будет хорошо работать. С помощью диагностической утилиты AIDA64 можно проверить, какое количество энергии уходит в определенный момент. Необходимая информация находится в разделе «Общее — Датчики». В правой части открывшегося окна будет значение мощности для CPU и графического процессора.

Энергопотребление видеокарт игровых компьютеров, мощность БП

Для того, чтобы подобрать блок питания компьютера очень важно знать энергопотребление видеокарт и процессоров.

Приводим таблицу энергопотребления видеокарт.

ВидеокартаМаксимальное потребление
NVIDIA GeForce GTX 550 Ti 1Gb116, рекомендованный ист. пит. min 400W
NVIDIA GeForce GTX 650 1Gb65W, рекомендованный ист. пит. min 400W
NVIDIA GeForce GTX 650 Ti 1Gb110W, рекомендованный ист. пит. min 400W
NVIDIA GeForce GTX 660 2 Gb140W, рекомендованный ист. пит. min 450W
NVIDIA GeForce GTX 660 Ti 1Gb150W, рекомендованный ист. пит. min 450W
NVIDIA GeForce GTX 670 2Gb170W, рекомендованный ист. пит. min 500W
NVIDIA GeForce GTX 680 2Gb300W, рекомендованный ист. пит. min 650W
AMD Radeon HD 5750 1Gb86W, , рекомендованный ист. пит. min 450W
AMD Radeon HD 5770 1Gb108W, рекомендованный ист. пит. min 450W
GeForce GTS 450 1Gb106, рекомендованный ист. пит. min 400W
AMD Radeon HD 5850 1Gb151W, рекомендованный ист. пит. min 500W
AMD Radeon HD 6850 1Gb127, рекомендованный ист. пит. min 500W
AMD Radeon HD 6870 1Gb151, рекомендованный ист. пит. min 500W
GeForce GTX 460 1Gb160, рекомендованный ист. пит. min 450W
AMD Radeon HD 6950 2Gb200W, рекомендованный ист. пит. min 500W
AMD Radeon HD 5870 1Gb188W, рекомендованный ист. пит. min 500W
GeForce GTX 560 1Gb170, рекомендованный ист. пит. min 500W
GeForce GTX 560 Ti 1Gb210, рекомендованный ист. пит. min 550W
GeForce GTX 570 Ti 1.3Gb219W, рекомендованный ист. пит. min 550W
AMD Radeon HD 6970 2Gb250W, рекомендованный ист. пит. min 550W
GeForce GTX 470 1.3Gb300, рекомендованный ист. пит. min 550W
AMD Radeon HD 5970 2Gb294W, , рекомендованный ист. пит. min 650W
GeForce GTX 580 1.5Gb405, рекомендованный ист. пит. min 600W
GeForce GTX 480 1.5Gb407W, рекомендованный ист. пит. min 600W
GeForce GTX 590 3Gb365W, рекомендованный ист. пит. min 700W
AMD Radeon HD 6990375, рекомендованный ист. пит. min 700W
AMD Radeon HD 7970250W,рекомендованный ист. пит. min 500W
GeForce GTX 760170W,рекомендованный ист. пит. min 500W
GeForce GTX 770230W,рекомендованный ист. пит. min 600W
GeForce GTX 780250W,рекомендованный ист. пит. min 600W
GeForce GTX 780 Ti250W,рекомендованный ист. пит. min 600W
GeForce GTX Titan250W,рекомендованный ист. пит. min 600W
GeForce GTX 95090W,рекомендованный ист. пит. min 350W
GeForce GTX 960120W,рекомендованный ист. пит. min 400W
GeForce GTX 970145W,рекомендованный ист. пит. min 500W
GeForce GTX 980165W,рекомендованный ист. пит. min 500W
GeForce GTX 1060120W,рекомендованный ист. пит. min 450W
GeForce GTX 1070150W,рекомендованный ист. пит. min 500W
GeForce GTX 1080180W,рекомендованный ист. пит. min 550W
GeForce GTX 165075W,рекомендованный ист. пит. min 300W
GeForce GTX 1660120W,рекомендованный ист. пит. min 450W
GeForce GTX 1660 Ti120W,рекомендованный ист. пит. min 450W
GeForce RTX 2060160W,рекомендованный ист. пит. min 500W
GeForce RTX 2070175W,рекомендованный ист. пит. min 550W
GeForce RTX 2080225W,рекомендованный ист. пит. min 650W
GeForce RTX 2080 Ti260W,рекомендованный ист. пит. min 650W

Эти данные помогут вам правильно рассчитать необходимую мощность блока питания при сборке компьютера.

В мощных видеокартах для питания используются дополнительные разъемы питания. Как правильно рассчитать необходимую мощность дополнительных контактов?

1. PCI-express обеспечивает для видеокарты до 75 Вт.

2. Через 6-контактный разъем дополнительно поступают до 75 Вт мощности.

3. Через 8-контактный разъем дополнительно поступают 150 Вт.

Основное правило. Общая мощность через PCI-express и разъемы питания должна быть больше максимальной мощности потребления видеокарты.

Энергопотребление Видеокарт, Майнинг Ферм и ASICов: сравнительная таблица потребления электричества 2021

Приходит середина месяца, майнер получает чек за электричество, а там ЖЭК требует уплатить за двух соседей сверху, снизу и еще в довесок за предполагаемую контрафактную Теслу. Получится, что без настроек ферма намотает на добрую половину от своей же прибыльности.

А что вообще можно сделать с энергопотреблением фермы? Как его измерить? Как сэкономить на электроэнергии для фермы? Вот давайте и разберемся — эксель в зубы, считаем потребление Асиков и майнинговых ферм.

Как рассчитать потребление майнинг фермы

В майнинговой ферме задействованы несколько видеокарт сразу, плюс работа материнской платы, ЦПУ и БП, которые вносят свою лепту.

Прежде чем начать нарезать алюминиевые брусья для рига, следует посчитать, сколько теоретически ферма должна потреблять при добыче. Здесь и далее все цифры будут в контексте алгоритма Ethash, ориентированного для добычи ETH.

Данные получены из веток на майнинговых форумах, видеообзоров с тестами видеокарт и разборами случаев по даунвольтингу. Потребление конкретной фермы рекомендуется подсчитывать по двум методам — с розетки вольтметром и перед сборкой в экселе на основе открытых данных.

Почему потребление при майнинге отличается от энергопотребления в играх

Или почему номинальный ТДП и потребление карты из обзоров на Оверклокерах не даст реальной картины.

Рендер игровых моделей идет рывками, кадр за кадром, где-то больше деталей, где-то волосы и листья на деревьях сжирают ФПС. Нагрузка распределена неравномерно — сначала идет плато посильной нагрузки, затем пик.

В условном Ведьмаке 3 потребление видеокартой электроэнергии будет выглядеть следующим образом:

Выходит из номинальных ТДП, например в 180 Ватт, карта за час съест только треть от общего питания. Моментами видеокарта будет потреблять 100 Ватт, моментами она успокоится и будет погрызивать 55 Ватт.

При майнинге нагрузка идет монотонно, всегда на одном уровне. Выходит, карта работает на пиковом или около-пиковом уровне, потребляя в среднем одно и то же количество электроэнергии.

Схематический график потребления видеокарты во время майнинга будет выглядит так:

 

Удобство потребления видеокартой электричества при майнинге в его стабильности — можно посчитать сколько ферма будет потреблять за месяц. Пусть цена на криптовалюту и меняется, но стоимость одного киловатта стабильнее дедушкиного подвала.

Энергопотребление видеокарт Nvidia при майнинге

Видеокарты от Nvidia имеют свой набор алгоритмов, с которыми они способны работать. Но нас интересует Ethash.

Рассмотрим уровень потребления популярных видеокарт 10-й линейки: 1050, 1060, 1070, 1080 и TI-версий.

Видеокарты от Зеленых
По Ethash1050 Ti1060 (6 Gb)10701070 Ti10801080 Ti
Номинальный TDP75120150180180250
Ватт/Час в стоке75100125120214220
При снижении PowerLimit558090100190190

Потребление электричества видеокартами AMD

Народные видеокарты с быстрой окупаемостью: RX 470, 480, 570, 580 и 5500, 5600, 5700.

Майнеры отмечают большое количество телодвижений для настройки АМД и требовательное к ТО железо.

Не все видеокарты из линейки 5000-серии подойдут для добычи криптовалюты. Например, видеокарты ряда 5700 XT добывают столько же, сколько младшие собратья, но стоят дороже и потребляют больше. При даунвольтинге 5700 XT какой-либо пользы от деятельности не наблюдалось, в связи с чем эта процедура сочтена бесполезной.

Видеокарты от Красных
По EthashRX 470RX 480RX 570RX 580RX 5500RX 5600RX 5700RX 5700 XT
Номинальный TDP120150150185130150180225
Ватт/Час в стоке120135130140110116130219
При даунвольтинге~75119110899094103Бесполезно.

Сколько потребляют АСИКи

АСИКи есть для добычи Биткоина и Эфира, ограничимся исследованием прибыльности добычи Эфириевых асиков. Сами устройства не поддаются ручной модификации БИОСа и не обладают инструментами для настройки питания. По умолчанию АСИК потребляет по уровню своего ТДП.

Однако, компании вроде Hive выпускают кастомные прошивки для асиков, которые должны снизить потребление и повысить частоты. Крайне экспериментальная сфера, открытых данных для сравнения не найдено.

Antminer E3PandaMiner B3 ProInnosilicon A10 Pro+ 6GInnosilicon A10 Pro 5G
Потребление760W1250W1300W750W
Хешрейт190.0 MH/s230. 0 MH/s720 Mh/s500 Mh\s
Расценки400 — 1400$1900 — 2200$5800 — 6000$4500 — 5000$
КомментарииОтмечают, что тихий.Имеет OS: Windows 10Рекомендуют розетку на 10А

Почему Асики потребляют много?

ASIC это компактная ферма с платами, на которых расположены кристаллы силикона, приспособленные для решения узкого набора задач.

Поскольку они оптимизированы для одной задачи, то решают её на предельном уровне расчетной мощности. Каждый АСИК это такой себе камикадзе — он майнит валюту пока не сгорит или не сломается, на это они и рассчитаны. Поэтому потребление АСИКА строго высокое, как и прибыльность.

Что еще в ферме потребляет электричество

Из всех компонентов фермы выделим процессор, материнскую плату и оперативную память. В 2008 году при полной нагрузке процессоры могли кушать даже больше, чем номинально должны были потреблять.

С появлением новых техпроцессов и нанометров, появилась возможность ставить в фермы процессоры, которые номинально и по факту потребляют до 35 Ватт. Оптимальным народным вариантом считается ферма на Селеронах, но ничего не мешает собрать её на Атлонах с ядром Зен.

Поскольку лишние Киловатты в майнинге обойдутся расходами на электричество, то рекомендуется подбирать процессоры с ТДП до 35 Ватт, без разгона. Роль процессора в ферме посредственная — нагрузки на него нет, значит и приобретать дорогой ЦПУ нет смысла.

Сколько электричества потребляет ферма для майнинга?

Рассчитываем. Берем за основу известные данные.

Один сферический риг в вакууме на 5 карточек RX 580 с подшитым биосом на снижение потребления. Итого пять карт, каждая по 90 Ватт. Материнская плата, совместно с жестким диском и ЦПУ потребляет до 35 Ватт.

Выходит, что за сутки, ферма будет кушать 12 000 Ватт-часов, или 12 Квт-час.

Как уменьшить энергопотребление майнинг фермы?

Когда ригов становится много, потребление растет вместе с количеством майнинговых установок. Выше хешрейт — длиннее счёт за электричество, но есть несколько хитростей.

Опытные майнеры используют два основных метода, для снижения потребления фермы: даунвольтинг и перепрошивка БИОСА видеокарты. Есть и третий метод — использование Таблетки для увеличения хешрейта на видеокартах с памятью GDDR5X, который в купе с даунвольтингом может дать второе дыхание старой ферме на 1060 или 1080 Ti.

Ограничение Power Limit через MSI Afterburner

Опишем два метода по снижению потребления электроэнергии у видеокарты.

Метод снижение потребления видеокарт первый — грубый. Подходит для любых видеокарт, вне зависимости от конфигурации, количества памяти, типа GPU и его компоновки.

Скачиваем MSI Afterburner, открываем панель настроек видеокарты, снижаем Power Limit до 75%. После снижения лимита по питанию тестируем хешрейт карты в любом майнере, если результат удовлетворительный, то оставляем всё как есть.

Понижать питание видеокарты можно до посинения — это ей не навредит. Минимальный уровень, на котором карта сможет продолжать добычу без потерь в прибыльности и будет результатом.

Удовлетворительный результат это потеря не более 10% от хешрейта карты в стоке. Например, если карта добывала 30 MH/s и потеряла 5, то это не есть хорошо. Чтобы не терять хешрейт при ограничении питания практикуют повышение частот GPU и видеопамяти в большую сторону.

На скриншоте — Power Limit понижен до 65% для карты P106-100. Потребление ядра стало 800 миливольт. 

Метод снижения потребление видеокартой второй — тонкий. Называется этот метод даунвольтинг и состоит в подборе оптимального напряжения на видеоядро вручную. В ряде случаев потребуется ручная модификация БИОСа видеокарты — система питания не всегда даст карте работать по пониженному вольтажу постоянно.

После тестирования, выгружается родной биос видеокарты и прошиваются все состояния под нужный вольтаж.

Даунвольтинг подразумевает перепрошив БИОС-а видеокарты.

Строго на свой страх и риск. Карту с отредактированным биосом могут не принять в сервисных центрах на ремонт. При поступлении карты на ремонт ее проверяют на износ и поднимают последнюю конфигурацию биоса — если она будет отличаться от стандартной, то видеокарта считается необслуживаемой.

Общий принцип даунвольтинга следующий — снижаете питание на ядро, повышаете частоту памяти или ядра, в зависимости от алгоритма.

Чтобы сделать корректный даунвольтинг видеокарты следует подобрать уровень напряжения на GPU при котором он едва может дышать. При постоянной нагрузке видеоядро может посчитать, что оно в бусте и скинуть частоты и вольтаж на несколько часов — это неприятный сценарий при майнинге.

Чтобы обойти ограничения от производителя, вшитые в биос, требуется подобрать уровень напряжения при котором ядро будет считать, что ему нормально и не станет заниматься троттлингом или сбросом частот.

Редактирование BIOS: для видеокарт от AMD

Прошивать BIOS необходимо только в одном случае — видеокарта не способна удерживать свой Power Limit из Afterburner-а дольше двух часов. 

Чтобы выгрузить биос из видеокарты на жесткий диск используют ATIFLASH. Используя кнопку «Save» можно сохранить файл прошивки на жесткий диск. Файлу следует дать разрешение .ROM, чтобы его было легче открыть в дальнейшем.

Редактирование БИОСа видеокарт от АМД производится через SRBPollaris от D0kt0r. Открываете файл формата .ROM, во вкладке Powerplay меняете данные по своему усмотрению. Во вкладке «Voltages» можно изменить условный PowerLimit как в MSI на уровне биоса. После прошития карта будет работать на отступе от заводского напряжения на ядро.

На скриншоте выше на карте доступна регулировка напряжения на GPU и выбран оступ +25 Mv. При прошивке видеокарта будет работать на «Обычный вольтаж +25Mv» уровне.

Через вкладку PowerTune можно отредактировать ограничения по питанию для видеокарты. Например, выставить ей 90 Ватт и пусть делает, что хочет, но должна будет ужаться в это.

Альтернатива — Polaris Bios Editor. Интерфейс другой, суть та же.

Выбираете поле, прописываете желаемое значение возле кнопки APPLY CHG, нажимаете её и сохраняете.

Редактирование BIOS: для видеокарт от Nvidia

Прошивку биоса на Nvidia выполняют через NVFlash. Это консольная утилита, предназначенная для редактирования БИОС-файла. Для Нвидия не найдено ПО для выгрузки биоса прямо из карты.

Перед прошивкой следует скачать биос видеокарты из общей базы. Перед скачиванием, убедитесь, что модель вашей видеокарты совпадает с показателями в биосе.

Разберем как определить, подходит ли BIOS для видеокарты.

На скриншоте выше биос для видеокарты 1080 Ti с памятью GDDR5X фирмы Микрон. Такой не подойдет для карты с Самсунгом или Хайниксом.

А вот показатели биоса для 1060, который поддерживает работу с Samsung, Micron и Hynix. Карточка донор — Asus GTX 1060 6 GB

По умолчанию, биосы обратно совместимы друг с другом, но внимательно смотрите на память — берите Bios для своей: Elpida, Hynix, Samsung. Узнать тип памяти можно разобрав видеокарту и исследовав надпись на чипах или через утилиту GPU-z во вкладке «Дополнительно», где будет выпадающий список выберите раздел BIOS.

Порядок действий после скачивания NVFlash и подбора биоса.

  1. Создаем папку в корне диска C: Называем ее к примеру NV Распаковываем скачанный прошивальщик в созданную папку NV.
  2. Запускаем командную строку от имени Администратора из меню «Пуск».
  3. В окне командной строки переходим в папку с прошивальщиком: cd C:/NV
  4. Разблокируем видеокарту для прошивки: nvflash64 —protectoff По завершении услышим характерный тональный сигнал.
  5. Прошиваем командой nvflash64 -6 [имя прошивки.rom] Система запросит подтверждение — нажимаем «Y» и ждем окончания прошивки.

Прошивка

  1. Перезагружаем компьютер. Новый BIOS вступит в силу только после перезагрузки системы.
  2. С помощью GPU-Z убеждаемся, что требуемая прошивка установлена.

Оптимальные показатели даунвольтинга для видеокарт RX 4xx и RX 5xx версии

Учитывайте, что референсные видеокарты имеют свои собственные настройки и в некоторых моделях придется подбирать значения вручную.

Видеокарты линейки RX 4xx хорошо себя чувствуют с показателями 800 — 880 Mv на ядро, RX 5xx будут работать с тем же показателем. Рекомендуется начинать с 800 Mv при даунвольтинге и понижать напряжение до отвала изображения с видеокарты. Это будет означать, что ниже GPU спуститься не способен. Видеокарта не будет повреждена в процессе снижения напряжения.

Можно ли сэкономить на охлаждении 

Охлаждение условно входит в общее потребление майнинговой фермы, поскольку считается «Обвесом» или доп.оборудованием. В майнинге охлаждение можно регулировать через HiveOS или MSI Afterburner, но удаленно. Подробнее об этом — в отдельной статье.

Оптимальной считается конфигурация, при которой одно окно в помещении переделывается под вентиляцию. Детальнее об этом в нашем лонгриде про постройку фермы.

Регистрируйтесь на нашем майнинг-пуле Hashalot, если вы готовы майнить уже сейчас.

Энергопотребление видеокарт NVIDIA GeForce GTX и RTX (таблица)

Написать эту статью я задумал в августе этого года — в преддверии выхода в продажу видеокарты Radeon RX 6600 XT, ставшей, по мнению AMD, полноценным ответом GeForce RTX 3060 и возродившей ближе к концу 2021 года конкуренцию в среднем ценовом диапазоне (хотя бы на бумаге). Но дефицит никуда не делся и осенью, а потому под «видеокартами среднего ценового диапазона» подразумеваются устройства, стоимость которых еще недавно считалась обоснованной (и то с большой натяжкой) только для флагманов AMD и NVIDIA, таких как GeForce RTX 2080 Ti. Ну что же, давайте оглянемся назад и посмотрим на новый виток конкуренции между «красными» и «зелеными» с, так сказать, небольшим историческим уклоном — вспомним, какими были крепкие середнячки GeForce и Radeon разных лет и какие именно модели действительно достойны называться народными.

Таблица энергопотребления видеокарт

В таблице приведено два значения, «Энергопотребление» и «Рекомендуемая мощность БП».

  • Энергопотребление – это потребляемая мощность видеокарты, которая будет затребована с блока питания, этот параметр можно использовать для оценки общего энергопотребления всего компьютера.
  • Рекомендуемая мощность БП – это мощность блока питания для компьютера с данной видеокартой по рекомендации NVIDIA. Рекомендуемая мощность блока питания рассчитывается с учетом типичных комплектующих и в большинстве случаев является достаточной для стабильной работы компьютера.

Для большинства рабочих и игровых компьютеров с процессорами среднего уровня и без разгона вполне будет достаточно блока питания с мощностью, которую рекомендует NVIDIA. Но, если вы используете флагманский процессор, планируете разгон комплектующих или апгрейд системы, то необходимо подобрать более мощный БП. Обычно в таких случаях 100-150 Вт свыше рекомендуемого значения будет более чем достаточно.

Тестовая система

  • Intel Core i9-9900K
  • Corsair h250i Pro RGB
  • MSI MEG Z390 Ace
  • Corsair 32GB DDR4-3200 (2x 16 Гб)
  • XPG SX8200 Pro 2 Тб
  • Windows 10 Pro (1909)

Тестирование выполнялось в играх Borderlands 3, The Division 2, Far Cry 5, Final Fantasy XIV, Forza Horizon 4, Metro Exodus, Red Dead Redemption 2, Shadow of the Tomb Raider, Strange Brigade. Это 9 игр, 6 настроек и более 40 карт от разных производителей нынешнего и прошлого поколения.

Предлагается сочетание разных игровых жанров и интерфейсов, а также продвигаемые AMD и Nvidia игры, чтобы результаты получились более достоверными. Поскольку сюда входят и карты прошлого поколения, не используется трассировка лучей и DLSS. Это немного портит результаты Nvidia RTX и RX 6800.

Энергопотребление видеокарт NVIDIA TITAN

Название моделиЭнергопотребление (Вт)Рекомендуемая мощность БП (Вт)
NVIDIA TITAN RTX280650
NVIDIA TITAN V250600
NVIDIA TITAN Xp250600
NVIDIA TITAN X (Pascal)250600
NVIDIA GeForce GTX TITAN X250600
NVIDIA GeForce GTX TITAN Black250600
NVIDIA GeForce GTX TITAN250600

Как рассчитать потребление майнинг фермы

В майнинговой ферме задействованы несколько видеокарт сразу, плюс работа материнской платы, ЦПУ и БП, которые вносят свою лепту.

Прежде чем начать нарезать алюминиевые брусья для рига, следует посчитать, сколько теоретически ферма должна потреблять при добыче. Здесь и далее все цифры будут в контексте алгоритма Ethash, ориентированного для добычи ETH.

Данные получены из веток на майнинговых форумах, видеообзоров с тестами видеокарт и разборами случаев по даунвольтингу. Потребление конкретной фермы рекомендуется подсчитывать по двум методам — с розетки вольтметром и перед сборкой в экселе на основе открытых данных.

Энергопотребление видеокарт RTX 2060, 2070, 2080 (Super)

Название моделиЭнергопотребление (Вт)Рекомендуемая мощность БП (Вт)
NVIDIA GeForce RTX 2080 Ti260650
NVIDIA GeForce RTX 2080 Super250650
NVIDIA GeForce RTX 2080225650
NVIDIA GeForce RTX 2070 Super215650
NVIDIA GeForce RTX 2070175550
NVIDIA GeForce RTX 2060 Super175550
NVIDIA GeForce RTX 2060160500

Что еще в ферме потребляет электричество

Из всех компонентов фермы выделим процессор, материнскую плату и оперативную память. В 2008 году при полной нагрузке процессоры могли кушать даже больше, чем номинально должны были потреблять.

С появлением новых техпроцессов и нанометров, появилась возможность ставить в фермы процессоры, которые номинально и по факту потребляют до 35 Ватт. Оптимальным народным вариантом считается ферма на Селеронах, но ничего не мешает собрать её на Атлонах с ядром Зен.

Поскольку лишние Киловатты в майнинге обойдутся расходами на электричество, то рекомендуется подбирать процессоры с ТДП до 35 Ватт, без разгона. Роль процессора в ферме посредственная — нагрузки на него нет, значит и приобретать дорогой ЦПУ нет смысла.

Энергопотребление видеокарт GTX 1050, 1060, 1070, 1080 (Ti)

Название моделиЭнергопотребление (Вт)Рекомендуемая мощность БП (Вт)
NVIDIA GeForce GTX 1080 Ti250600
NVIDIA GeForce GTX 1080180500
NVIDIA GeForce GTX 1070 Ti180500
NVIDIA GeForce GTX 1070150500
NVIDIA GeForce GTX 1060120400
NVIDIA GeForce GTX 1050 Ti75300
NVIDIA GeForce GTX 105075300
NVIDIA GeForce GT 103030300

Можно ли сэкономить на охлаждении

Охлаждение условно входит в общее потребление майнинговой фермы, поскольку считается «Обвесом» или доп.оборудованием. В майнинге охлаждение можно регулировать через HiveOS или MSI Afterburner, но удаленно. Подробнее об этом — в отдельной статье.

Оптимальной считается конфигурация, при которой одно окно в помещении переделывается под вентиляцию. Детальнее об этом в нашем лонгриде про постройку фермы.

Регистрируйтесь на нашем майнинг-пуле Hashalot, если вы готовы майнить уже сейчас.

Энергопотребление видеокарт GTX 750, 760, 770, 780 (Ti)

Название моделиЭнергопотребление (Вт)Рекомендуемая мощность БП (Вт)
NVIDIA GeForce GTX 780 Ti250600
NVIDIA GeForce GTX 780250600
NVIDIA GeForce GTX 770230600
NVIDIA GeForce GTX 760170500
NVIDIA GeForce GTX 750 Ti60300
NVIDIA GeForce GTX 75055300

Энергопотребление видеокарт GTX 650, 660, 670, 680, 690 (Ti, Ti Boost)

Название моделиЭнергопотребление (Вт)Рекомендуемая мощность БП (Вт)
NVIDIA GeForce GTX 690300650
NVIDIA GeForce GTX 680195550
NVIDIA GeForce GTX 670170500
NVIDIA GeForce GTX 660 Ti150450
NVIDIA GeForce GTX 660140450
NVIDIA GeForce GTX 650 Ti Boost134450
NVIDIA GeForce GTX 650 Ti110400
NVIDIA GeForce GTX 65064400
NVIDIA GeForce GTX 645130450
NVIDIA GeForce GT 640 (GDDR5)49300
NVIDIA GeForce GT 640 (DDR3)65350
NVIDIA GeForce GT 63065300
NVIDIA GeForce GT 62049300

Сайт для пользователей персональных компьютеров

Рекомендованная производителем мощность блока питания относится ко всей системе, включая процессор, видеокарту, мат. плату, SSD, HDD, вентиляторы и прочие комплектующие ПК. Часто она кажется избыточной, но это страховка от использования низкокачественных БП, фактическая мощность которых заметно ниже номинала

Актуальные видеокарты AMD

Видеокарты от AMD, которые еще продаются в магазинах.

RDNA2 (Big Navi)

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon RX 68002508+8650
Radeon RX 6800 XT3008+8750
Radeon RX 6900 XT3008+8850

RDNA (Navi 10)

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon RX 55001508550
Radeon RX 5500 XT1308450
Radeon RX 56001508550
Radeon RX 5600 XT1508550
Radeon RX 57001808+6600
Radeon RX 5700 XT2258+6600

GCN 5th gen (Vega20)

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon VII3008+8750

GCN 5th gen (Vega10)

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon RX Vega 562108+6650
Radeon RX Vega 642958+8750

GCN 1.3 (Arсtic Islands) RX 500

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon RX 55050нет400
Radeon RX 550X50нет400
Radeon RX 560806450
Radeon RX 5701508450
Radeon RX 5801858+6500
Radeon RX 5902258+6500

Широкий ассортимент матриц на https://optnb.ru/ в наличии! Лучшие цены на рынке по многим позициям за счет прямых поставок!

Актуальные видеокарты NVIDIA

Видеокарты от NVIDIA, которые еще продаются в магазинах.

Ampere

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce RTX 3060 Ti2008600
GeForce RTX 30702208650
GeForce RTX 30803208+8750
GeForce RTX 30903508+8750

Turing

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce GTX 1650756300
GeForce GTX 1650 Super1006350
GeForce GTX 16601208450
GeForce GTX 1660 Super1258450
GeForce GTX 1660 Ti1208450
GeForce RTX 20601608500
GeForce RTX 2060 Super1758550
GeForce RTX 20701758550
GeForce RTX 2070 Super2158+6650
GeForce RTX 20802158+6650
GeForce RTX 2080 Super2508+6650
GeForce RTX 2080 Ti2508+8650
Titan RTX2808+8650

Pascal

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce GT 103030нет300
GeForce GTX 105075нет300
GeForce GTX 1050 Ti75нет300
GeForce GTX 10601206400
GeForce GTX 10701508500
GeForce GTX 1070 Ti1808500
GeForce GTX 10801808500
GeForce GTX 1080 Ti2508+6600
GeForce Titan X2508+6600

Далее идут таблицы с данными на устаревшие видеокарты, которые уже сняты с продажи и не производятся. Но возможно информация пригодится тем, кто покупает комплектующие на вторичке или подбирают новые блоки питания к своим системам.

Устаревшие видеокарты AMD

Видеокарты от AMD, которые сняты с производства и не продаются в магазинах.

GCN 1.3 (Arсtic Islands) RX 400

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon RX 46075нет400
Radeon RX 4701206450
Radeon RX 4801506500

Caribbean Islands RX 300

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon R7 35055нет400
Radeon R7 3601006500
Radeon R7 3701106500
Radeon R9 3801906+6500
Radeon R9 380X1906+6500
Radeon R9 3902758+6600
Radeon R9 390X2758+6600
Radeon R9 Nano1758600
Radeon R9 Fury2758+8 600
Radeon R9 Fury X2758+8 750

Volcanic Islands RX 200

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon R7 24030нет350
Radeon R7 25065нет400
Radeon R7 250X956400
Radeon R7 260956450
Radeon R7 260X1156450
Radeon R7 2651506500
Radeon R9 2701506500
Radeon R9 270X1806+6500
Radeon R9 2802508+6550
Radeon R9 2851906+6500
Radeon R9 280X2508+6600
Radeon R9 2902758+6600
Radeon R9 290X2758+6600
Radeon R9 290X25008+81000

Southern Islands HD 7xxx

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon HD 773047нет350
Radeon HD 775055нет350
Radeon HD 7770806400
Radeon HD 7790856450
Radeon HD 78501306500
Radeon HD 78701756+6500
Radeon HD 79502006+6500
Radeon HD 79702508+6550
Radeon HD 7970 GHz Edition2508+6600
Radeon HD 79903758+8750

Northern Islands HD 6xxx

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon HD 645030нет350
Radeon HD 657060нет350
Radeon HD 667066нет400
Radeon HD 6750866450
Radeon HD 67701086450
Radeon HD 67901506+6500
Radeon HD 68501276500
Radeon HD 68701516+6500
Radeon HD 69301866+6500
Radeon HD 69502006+6500
Radeon HD 69702508+6550
Radeon HD 69903758+8750

R800 Evergreen HD 5xxx

Графический процессор AMDTDP, ВтРазъемы, PINРекомендуемый БП, Вт
Radeon HD 545019нет350
Radeon HD 555039нет350
Radeon HD 557043нет350
Radeon HD 567064нет400
Radeon HD 5750866450
Radeon HD 57701086450
Radeon HD 58301756+6500
Radeon HD 58501516+6500
Radeon HD 58701886+6500
Radeon HD 59702948+6600

Устаревшие видеокарты NVIDIA

Видеокарты от NVIDIA, которые сняты с производства и не продаются в магазинах.

Maxwell

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce GTX 950906350
GeForce GTX 9601206400
GeForce GTX 9701458500
GeForce GTX 9801658500
GeForce GTX 980 Ti2508+8600

Kepler 700

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce GT 71019нет300
GeForce GT 72023нет300
GeForce GT 73049нет300
GeForce GT 740646400
GeForce GTX 75055нет300
GeForce GTX 750 Ti60нет300
GeForce GTX 7601706+6500
GeForce GTX 7702308+6600
GeForce GTX 7802508+6600
GeForce GTX 780 Ti2508+6600
GeForce GTX Titan2508+6600
GeForce GTX Titan Z3758+8700

Kepler 600

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce GT 61029нет300
GeForce GT 62049нет300
GeForce GT 63065нет300
GeForce GT 64065нет300
GeForce GTX 650646400
GeForce GTX 650 Ti1106400
GeForce GTX 6601406450
GeForce GTX 660 Ti1506+6450
GeForce GTX 6701706+6500
GeForce GTX 6801956+6550
GeForce GTX 6903008+8650

Fermi 500

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce GT 52029нет300
GeForce GTX 550 Ti1166400
GeForce GTX 5601506450
GeForce GTX 560 Ti1706+6500
GeForce GTX 5702196+6550
GeForce GTX 5802448+6600
GeForce GTX 5903658+8700

Fermi 400

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce GT 43049нет300
GeForce GT 44065нет300
GeForce GTS 4501066400
GeForce GTX 4601606+6450
GeForce GTX 4652006+6550
GeForce GTX 4702156+6550
GeForce GTX 4802508+6600

Серия 200

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce GT 21030нет300
GeForce GT 22058нет300
GeForce GT 24069нет300
GeForce GTS 2501506450
GeForce GTX 2601826+6500
GeForce GTX 2752196+6550
GeForce GTX 2802368+6550
GeForce GTX 2852046+6550
GeForce GTX 2952898+6680

Серия 9

Графический процессор NVIDIATDP, ВтРазъемы, PINРекомендуемый БП, Вт
GeForce 9400 GT50нет300
GeForce 9500 GT50нет350
GeForce 9600 GT966400
GeForce 9800 GT1056+6400
GeForce 9800 GTX1406+6450
GeForce 9800 GX21978+6580

Статья обновлена 01.12.2020

Энергопотребление видеокарт GTX 550, 560, 570, 580, 590 (Ti)

Название моделиЭнергопотребление (Вт)Рекомендуемая мощность БП (Вт)
NVIDIA GeForce GTX 590365700
NVIDIA GeForce GTX 580244600
NVIDIA GeForce GTX 570219550
NVIDIA GeForce GTX 560 Ti170500
NVIDIA GeForce GTX 560150450
NVIDIA GeForce GTX 550 Ti116400
NVIDIA GeForce GT 52029300

Измеряем правильное потребление видеокарт. | MiningClub.info

Многим думаю будет интересно, сколько потребляет электроэнергии тушка в простое и как это более-менее правильно измерять, поэтому решил создать наглядную тему.

Многие делают так, вставил ваттметр в розетку, собрал ферму и высчитал сколько потребление в простое, а после дал полную нагрузку на видеокарты и отнял от общего потребления то, что было в простое. Вроде как всё правильно, но здесь 90% людей ошибаються, они не учитывают, что вставленная в слот видеокарта, что-то потребляет, 10-15 бывает даже и 20 ватт может потреблять в простое вставленная всего одна видеокарта.

Самое правильное измерять конечно же так, установил 7 видеокарт в майнинг ферму, посмотрел на ваттметр и разделил на 7, вот и получим наше среднее потребление каждой карты с точностью до каждого ватта.

Ниже наглядный пример на примере компьютера и одной видеокарты RX 5700.

Характеристики системника.
Процессор: Ryzen 2400G (Есть встроенная графика)
Материнская плата: Gigabyte GA-AX370M-DS3H
Оперативная память: Corsair Vengeance RGB CMR16GX4M2C3000C15 8GB x2
SSD M2 накопитель: 120 GB Goodram S400u
Блок питания: Блок питания Corsair HX1000i

В простое без видеокарты потребление вижу в районе 40 Ватт.
Посмотреть вложение 139790
В простое с вставленной в слот видеокартой я наблюдаю 55 Ватт.
Посмотреть вложение 139791
Итого видим разницу в 15 Ватт.

А если майнить тот же эфир, то мы видим общее потребление в районе 195 Ватт. То есть потребление видеокарты с более менее ундервольтом у меня выходит около 155 Ватт. В лучшем случае это 140-145 Ватт на памяти микроне. и 125-130 Ватт на самсунг, но не как не 100 и не 110 Ватт как многие думают.

Посмотреть вложение 139795 Посмотреть вложение 139794

P.S если у видеокарты память самсунг то какая бы это видеокарта не была, она действительно потребляет меньше, ватт на 10-20 хоть то будет AMD или Nvidia. Мне удалось покорить 125-130 Ватт из розетки на RX 5700 XT MSI MECH с аптаймом месяц, ниже ну никак, то вылет в течении суток двух. Возможно если все 6 слотов в ферме заполнить видеокартами, то каждая добавленная видеокарта будет потреблять не 15, а 10 ватт, тогда выйдет совсем другая картина, но я тестил по одной видеокартой.

Энергопотребление видеокарт — Страница 14

Содержание материала

Страница 14 из 16

Расшифровка обозначений на диаграммах:

  • AMD Radeon R7 250 1024Mb (GPU 1050; RAM 1150) — AMD Radeon R7 250 номинал;
  • AMD Radeon R7 250 1024Mb (GPU 1250; RAM 1400) — AMD Radeon R7 250 разгон;
  • AMD Radeon HD 7750 1024Mb (GPU 800; RAM 1125) — AMD Radeon HD 7750 номинал;
  • AMD Radeon HD 7770 1024Mb (GPU 1000; RAM 1125) — AMD Radeon HD 7770 номинал;
  • Nvidia GeForce GTX 650 Ti 1024Mb (GPU 928; RAM 1350) — Nvidia GeForce GTX 650 Ti номинал;
  • Nvidia GeForce GTX 650 Ti 1024Mb (GPU 1108; RAM 1425) — Nvidia GeForce GTX 650 Ti разгон;
  • AMD Radeon R7 260 1024Mb (GPU 1000; RAM 1500) — номинал;
  • AMD Radeon R7 260 1024Mb (GPU 1150; RAM 1675) — с разгоном;
  • AMD Radeon HD 7790 1024Mb (GPU 1075; RAM 1600) — Sapphire Radeon HD 7790 DUAL-X OC;
  • AMD Radeon R7 260X 2048Mb (GPU 1100; RAM 1625) — номинал;
  • AMD Radeon R7 260X 2048Mb (GPU 1200; RAM 1800) — с разгоном;
  • AMD Radeon HD 7850 2048Mb (GPU 920; RAM 1250) — Sapphire Radeon HD 7850 OC;
  • AMD Radeon HD 7870 2048Mb (GPU 1050; RAM 1250) — Sapphire Radeon HD 7870 GHz Edition OC;
  • AMD Radeon HD 7950 3072Mb (GPU 800; RAM 1250) — AMD Radeon HD 7950 номинал;
  • AMD Radeon R9 270 2048Mb (GPU 925; RAM 1400) — номинал;
  • AMD Radeon R9 270 2048Mb (GPU 1025; RAM 1450) — с разгоном;
  • Nvidia GeForce GTX 760 2048Mb (GPU 980; RAM 1500) — Inno3D iChill GeForce GTX 760 номинал;
  • Nvidia GeForce GTX 760 2048Mb (GPU 1059; RAM 1553) — Inno3D iChill GeForce GTX 760 с разгоном;
  • AMD Radeon R9 270X 2048Mb (GPU 1050; RAM 1450) — SAPPHIRE VAPOR-X R9 270X 2GB GDDR5 OC WITH BOOST номинал;
  • AMD Radeon R9 270X 2048Mb (GPU 1150; RAM 1500) — SAPPHIRE VAPOR-X R9 270X 2GB GDDR5 OC WITH BOOST с разгоном;
  • AMD Radeon HD 7970 3072Mb (GPU 925; RAM 1375) — AMD Radeon HD 7970 номинал;
  • Nvidia GeForce GTX 770 2048Mb (GPU 1046; RAM 1750) — Zotac GeForce GTX 770 AMP! номинал;
  • Nvidia GeForce GTX 770 2048Mb (GPU 1150; RAM 1800) — Zotac GeForce GTX 770 AMP! с заводским разгоном;
  • AMD Radeon R9 280X 3072Mb (GPU 1050; RAM 1500) — AMD Radeon R9 280X номинал;
  • AMD Radeon R9 280X 3072Mb (GPU 1150; RAM 1600) — с заводским разгоном;
  • AMD Radeon R9 290 4096Mb (GPU 947; RAM 1250) — номинал;
  • AMD Radeon R9 290 4096Mb (GPU 1100; RAM 1350) — с разгоном;
  • AMD Radeon R9 290X 4096Mb (GPU 1000; RAM 1250) — AMD Radeon R9 290X – Гавайский вулкан номинал;
  • AMD Radeon R9 290X 4096Mb (GPU 1100; RAM 1400) — с заводским разгоном;
  • Nvidia GeForce GTX 780 3072Mb (GPU 863; RAM 1502) — Nvidia GeForce GTX 780 номинал;
  • Nvidia GeForce GTX 780 3072Mb (GPU 1013; RAM 1652) — Nvidia GeForce GTX 780 с разгоном;
  • Nvidia GeForce GTX 780 Ti 3072Mb (GPU 915; RAM 1750) — номинал;
  • Nvidia GeForce GTX 780 Ti 3072Mb (GPU 1020; RAM 1750) — с заводским разгоном.

 

Энергопотребление видеокарт

Энергопотребление и шум видеокарт замеряются в Furmark (подробнее — в методике тестирования).

Так как мы перевели наш стенд на цифровой блок питания, то это позволило замерять нагрузку по каждой шине. Говоря простым языком, теперь мы можем анализировать как потребление системного блока, так и определенных компонентов — процессора, видеокарты.

Важный момент: так как некоторые карты использовались с заводским разгоном и их частоты приходилось снижать, это не могло не отразиться на уменьшении TDP карт, что мы и проделали.

Полная информация по Power Limit:

Видеокарта PowerLimit
AMD Radeon R9 290
4096Mb (GPU 1100; RAM 1350)
150
AMD Radeon R9 290
4096Mb (GPU 947; RAM 1250)
95
AMD Radeon R9 280X
3072Mb (GPU 1150; RAM 1600)
100
Nvidia GeForce GTX 780 Ti
3072Mb (GPU 1020; RAM 1750)
100
Nvidia GeForce GTX 780 Ti
3072Mb (GPU 915; RAM 1750)
90
AMD Radeon R9 290X
4096Mb (GPU 1100; RAM 1400)
150
AMD Radeon R9 290X
4096Mb (GPU 1000; RAM 1250)
96
Nvidia GeForce GTX 780
3072Mb (GPU 1013; RAM 1652)
106
Nvidia GeForce GTX 780
3072Mb (GPU 863; RAM 1502)
100
Nvidia GeForce GTX 770
2048Mb (GPU 1150; RAM 1800)
100
AMD Radeon HD 7970
3072Mb (GPU 925; RAM 1375)
100
AMD Radeon R9 270X
2048Mb (GPU 1150; RAM 1500)
120
Nvidia GeForce GTX 770
2048Mb (GPU 1046; RAM 1750)
91
Nvidia GeForce GTX 760
2048Mb (GPU 1059; RAM 1553)
100
AMD Radeon R9 280X
3072Mb (GPU 1050; RAM 1500)
91
Nvidia GeForce GTX 760
2048Mb (GPU 980; RAM 1500)
93
AMD Radeon R9 270X
2048Mb (GPU 1050; RAM 1450)
95
AMD Radeon HD 7870
2048Mb (GPU 1050; RAM 1250)
100
AMD Radeon R9 270
2048Mb (GPU 1025; RAM 1450)
120
AMD Radeon HD 7950
3072Mb (GPU 800; RAM 1250)
100
AMD Radeon HD 7850
2048Mb (GPU 920; RAM 1250)
100
AMD Radeon R9 270
2048Mb (GPU 925; RAM 1400)
100
Nvidia GeForce GTX 650 Ti
1024Mb (GPU 1108; RAM 1425)
100
AMD Radeon R7 260X
2048Mb (GPU 1200; RAM 1800)
120
AMD Radeon HD 7790
1024Mb (GPU 1075; RAM 1600)
100
AMD Radeon R7 260X
2048Mb (GPU 1100; RAM 1625)
96
Nvidia GeForce GTX 650 Ti
1024Mb (GPU 928; RAM 1350)
100
AMD Radeon R7 260
1024Mb (GPU 1150; RAM 1675)
120
AMD Radeon R7 260
1024Mb (GPU 1000; RAM 1500)
100
AMD Radeon R7 250
1024Mb (GPU 1250; RAM 1400)
120
AMD Radeon HD 7770
1024Mb (GPU 1000; RAM 1125)
100
AMD Radeon R7 250
1024Mb (GPU 1050; RAM 1150)
95
AMD Radeon HD 7750
1024Mb (GPU 800; RAM 1125)
100

Для вычисления процента, на который мы должны были снизить TDP видеокарты с заводским разгоном, мы использовали формулу:

TDP=нужная частота/(зашитая на карте/100)

Рассмотрим на примере AMD Radeon HD 290. Номинальная частота для 290 — 947МГц, а наш образец имеет частоту ядра 1000МГц. Осталось вычислить:

947/(1000/100)=95%.

Потребление системного блока:

Первое, что прослеживается — шаг потребления 4Вт. Это минимальный шаг при анализе потребления всей системы.

Второе, что вы, конечно же, заметили: энергопотребление системы с AMD Radeon HD 290X оказалось меньше, чем с AMD Radeon HD 290. Здесь нет ошибки.

Напомним, что AMD Radeon HD 290 представлена розничным образцом ASUS, а AMD Radeon HD 290X предоставлена Sapphire. AMD Radeon HD 290 не уходит в троттлинг в Furmark, а AMD Radeon HD 290X – уходит в троттлинг до 897МГц по ядру. При этом это не влияет на производительность AMD Radeon HD 290X в играх — там все нормально. Хотя запаса по TDP хотелось бы побольше для топ карты производителя. Что же касается видеокарт с GPU Nvidia, то они все уходили в троттлинг в Furmark.

Теперь посмотрим чистое потребление видеокарт.

Особенно интересен вопрос потребления энергии через слот PCI-E.

Как вы знаете, стандарт PCI-E регламентирует подачу энергии по слоту до 75Вт включительно. Однако, если карта не оснащена дополнительным питанием и ей нужно больше, чем 75Вт энергии — она ее вытянет из слота, если только там не сработает защита.

Для некоторых видеокарт мы не смогли заметить потребление из слота — в основном это топовые выдеокарты с парой 8-пиновых коннекторов PCI-E 2.0. Хотя референсная Radeon HD 7970 обладает 6-пин и 8-пин коннекторами, но энергию из слота не тянет, в отличие от 7950 с парой 6-пин коннекторов.

Видеокарты. Видеокарты Hd 7970 энергопотребление

Карта имеет 3072 МБ памяти GDDR5 SDRAM, размещенной в 12 микросхемах на лицевой сторонe PCB.

За неимением собственных синтетических тестов DirectX 11 мы снова воспользовались примерами из пакетов SDK Microsoft и AMD и демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) .

Также мы взяли приложения обоих производителей: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11 (автор — Тимофей Чеблоков, известный специалист по 3D-графике).

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 7970 HD 7970 )
  • Radeon HD 6990 со стандартными параметрами (далее HD 6990 )
  • Radeon HD 6970 со стандартными параметрами (далее HD 6970 )
  • Radeon HD 5870 со стандартными параметрами (далее HD 5870 )
  • Geforce GTX 590 со стандартными параметрами (далее GTX 590 )
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580 )

Для сравнения результатов новейшей видеокарты Radeon HD 7970 именно эти модели были выбраны по разным причинам. Radeon HD 6970 была взята, как прямой предшественник топового сегмента, HD 6990 — как сильнейшее (пусть и двухчиповое) решение на GPU предыдущей архитектуры, HD 5870 мы добавили, чтобы оценить прирост между двумя разными обновлениями архитектур и как GPU ровно вдвое меньшей сложности, чем Tahiti.

Выбранные решения Nvidia взяты потому, что Geforce GTX 580 — быстрейшая одночиповая модель этой компании, основанная на GPU последнего поколения. Хотя она не является конкурентом представленной видеокарты AMD по цене, её результаты интересны как максимальные для нынешних одночиповых решений Nvidia. А двухчиповая GTX 590 является экстремальным вариантом этой компании с более высокой ценой. В тестах DirectX 11 мы использовали ещё и Geforce GTX 560 Ti, которая нужна для того, чтобы оценить увеличенную геометрическую производительность нового графического процессора AMD.

Direct3D 9: тесты Pixel Filling

В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В нашем устаревшем тесте фильтрации 32-битных текстур из RightMark большинство видеокарт показывает цифры, далёкие от теоретически возможных. Вот и результаты текстурной синтетики в случае видеоплаты Radeon HD 7970 не дотянули до пикового значения, поэтому мы ещё раз рассмотрим скорость текстурирования по цифрам из теста 3DMark Vantage, в котором всегда получаются более реалистичные цифры.

У нас же получилось, что HD 7970 выбирает лишь до 80 текселей за такт из 32-битных текстур при билинейной фильтрации, что значительно ниже теоретической цифры в 128 отфильтрованных текселей. В остальном, всё получилось предсказуемо — все платы производства AMD показали более высокую производительность и опережают видеокарты компании Nvidia. Ведь даже топовая одночиповая Geforce GTX 580 имеет лишь 64 TMU и поэтому сильно уступает модели на базе чипа Tahiti, имеющем 128 TMU, работающих на более высокой частоте. Поэтому и разница более чем двукратная. Ну а двухчиповый GTX 590 в этом тесте показывает явно неадекватный результат.

Вариант платы на двух GPU от компании AMD также явно некорректно работает в нашем тесте, ведь HD 7970 обгоняет почти всегда даже его. Ну а своего предшественника новая модель обогнала примерно на 30%, что чуть хуже теоретически возможного значений. Впрочем, в случаях с малым количеством текстур, когда больше всего сказывается пропускная способность памяти, результат ещё ниже — порядка 25%.

Рассмотрим эти же результаты в тесте филлрейта:

Цифры показывают скорость заполнения, и в них мы видим всё то же самое, разве что с учетом количества записанных в буфер кадра пикселей. Максимальный результат почти всегда остаётся за новой топовой видеокартой из семейства Radeon HD 7900. Она имеет рекордное количество TMU, работающих на более высокой частоте и более эффективных в нашем синтетическом тесте. Переходим к текстам простых пиксельных шейдеров.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Эти тесты слишком просты для современных GPU и в основном ограничены производительностью текстурирования и иногда филлрейтом. Поэтому они показывают далеко не все возможности современных видеочипов, но интересны с точки зрения устаревших игровых приложений. В двух самых простых тестах новый Radeon HD 7970 почти догнал даже двухчиповый HD 6990, но в более сложных занял позицию между HD 6990 и HD 6970. Интересно, как отличается поведение тестов на GPU разных архитектур. И тут Tahiti несколько ближе к GF110, чем к предшественнику. Естественно, не по абсолютным цифрам, разница в них весьма велика — от полутора до двух раз.

Производительность в других тестах ограничена по большей части скоростью текстурных модулей и филлрейтом, поэтому новый Radeon HD 7970 получился быстрее предшествующего HD 6970 примерно на 30-40%, что соответствует теории. Все платы AMD опережают обе топовые модели Geforce, разве что в сравнении HD 5870 и GTX 590 всё не так однозначно. В неудачах Nvidia в этих тестах явно виноват недостаток скорости текстурирования. Но даже пиксельный шейдер освещения тремя источниками по Фонгу, больше зависящий от математической производительности GPU, при запуске на GF110 сильно уступает и Cayman и уж тем более Tahiti.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Вот и в этот раз получилось примерно то же самое, HD 7970 расположился примерно между одночиповой и двухчиповой моделями на базе Cayman из серии HD 6900. Тест Cook-Torrance более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте. Поэтому данный тест лучше подходит для архитектуры AMD, чипы которой имеют большее количество математических блоков, и Tahiti тут не исключение.

Интересно, что в этом тесте HD 5870 обгоняет HD 6970, и похоже, что так получилось из-за худшей эффективности исполнения этого шейдера на более новом чипе с VLIW4 архитектурой. Так что, хотя новый Radeon HD 7970 и обошёл HD 6970, он оказался быстрее HD 5870 в этом тесте лишь на 20%.

Во втором, сильнее зависящем от скорости текстурирования, тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и видеокарты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU. В этом тесте у решений компании AMD всегда всё прекрасно, и HD 7970 обеспечивает очень хороший результат, хотя и хуже, чем у двухчиповой HD 6990, но гораздо лучший, чем у предшественника на Cayman. Топовая одночиповая плата Nvidia отстала более чем в 2,5 раза!

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье .
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа, а также эффективность исполнения сложных программ. И производительность новой видеокарты AMD в тесте «Frozen Glass» оказалась не просто хорошей, но отличной! Вот что значит повышенная эффективность нового GPU. Radeon HD 7970 в первом тесте оказалась заметно быстрее даже чем двухчиповая HD 6990. А даже двухчиповая плата Nvidia осталась далеко позади, не говоря уже о Geforce GTX 580.

Вот во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя немного лучше, и GTX 580 почти достаёт HD 6970. А вот до представленной сегодня HD 7970 очень далеко — новинка AMD опережает лучшую плату Nvidia на 80%, что явно говорит о влиянии и математических расчётов и скорости текстурирования. Интересно, что совсем старая HD 5870 снова быстрее, чем HD 6970. Да и новая HD 7970 обогнала предшественницу на 60%, что явно не оправдать сухими теоретическими цифрами. Тут сказалась заметно большая эффективность скалярной архитектуры, по сравнению с VLIW.

Впрочем, в случае видеокарт AMD всё очень сложно из-за PowerTune. Ведь синтетические тесты очень сильно «грузят» GPU расчётами и энергопотребление плат с поддержкой PowerTune в синтетике вполне может выходить за рамки выставленного ограничения. Следовательно, может снижаться и тактовая частота GPU, а вместе с ней и результаты будут показаны ниже, чем ожидалось. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для обеих видеоплат Nvidia ситуация стала ещё печальнее, так как со скоростью текстурирования у всех современных чипов AMD всё намного лучше, и в этих тестах они лишь наращивают своё бесспорное преимущество. Даже двухчиповая GTX 590 не может соперничать с одночиповым HD 6970 в обоих тестах с упором на текстурирование, не говоря о GTX 580. Ну а представленная сегодня плата из семейства Radeon HD 7900 оказалась быстрейшей среди одночиповых карт, уступив только HD 6990. Разница между HD 7970 и HD 6970 оказалась равна 26-28%, что хорошо объяснимо теоретически, так как разница в скорости текстурирования у новинки немногим больше.

Но это были устаревшие задачи, в основном с упором в текстурирование, и иногда в филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики .
  • Fur — процедурный шейдер, визуализирующий мех.

В самых сложных DX9-тестах из RightMark видеокарты производства Nvidia всегда выступают очень сильно, в противоположность всем предыдущим испытаниям нашего обзора. Эти тесты не ограничены производительностью текстурных выборок, а зависят скорее от эффективности исполнения шейдерного кода. И ранее Radeon HD 6970 явно улучшил позиции AMD в данном тесте, увеличив эффективность при переходе от архитектуры VLIW5 к VLIW4.

Ну а сегодня мы увидели очередной скачок в производительности решений компании, Radeon HD 7970 поднял их на недосягаемый уровень — новая одночиповая видеоплата обошла даже двухчиповый HD 6990 в обоих тестах! Эти задачи — отличный пример улучшения реальной производительности сложных вычислений при переходе от VLIW к скалярному исполнению.

Итак, в тестах сложных пиксельных шейдеров версии 3.0 новая топовая видеокарта AMD смогла не только догнать конкурентов, но и опередить со значительным запасом, чего не было очень давно. Скорость в обоих тестах PS 3.0 слабо зависит от ПСП и текстурирования, зато код отличается сложностью, с чем очень неплохо справляется и архитектура Nvidia и новейшая скалярная архитектура AMD. Эти тесты одни из первых, где мы отмечаем явное улучшение эффективности и наибольшую положительную разницу между предыдущей и новейшей архитектурами компании AMD по скорости.

Но приведём цифры, чтобы не быть голословными. Представленная новинка Radeon HD 7970 быстрее предшественницы более чем вдвое, и на 60-70% быстрее Geforce GTX 580, о чём совсем недавно мы даже и подумать бы не решились. Ведь решения Nvidia всегда были неоспоримыми лидерами в этой паре тестовых задач, но видеокарты на Cayman смогли к ним приблизиться, а быстрейший из Tahiti наконец-то опередил конкурента.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, и от эффективности выполнения сложных программ. В варианте без суперсэмплинга дополнительное влияние на производительность оказывает эффективный филлрейт (производительность ROP) и пропускная способность памяти. Результаты при детализации уровня «High» получаются примерно в полтора раза ниже, чем при «Low», как и должно быть по теории, но для быстрейших решений разница несколько ниже.

Ранее в тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia были заметно сильнее, но начиная с предыдущего поколения компании AMD, разница начала сокращаться. Что же получилось у Radeon HD 7970? Отличный результат — новинка AMD снова оказалась быстрее двухчиповой платы предыдущего поколения, а одночиповая HD 6970 отстала вдвое, что явно говорит об увеличении эффективности новой архитектуры Southern Islands. Да и решения компании Nvidia остались позади, даже двухчиповая GTX 590 уступила представленной сегодня топовой модели Radeon HD 7970.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза, и результаты решений Nvidia всегда падают, по сравнению с показателями видеокарт AMD. Теперь разница в эффективности выполнения данной задачи ещё более очевидна, и новая модель HD 7970 быстрее HD 6970 в 2,5 раза! Примерно столько же новинке уступила и Geforce GTX 580. Вполне естественно, что даже HD 6990 осталась далеко позади, а новая плата укрепила лидерство, да какое…

Второй шейдерный DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Эта диаграмма похожа на предыдущую без включения SSAA, но позиции Nvidia ещё немного ослабли, да и Radeon HD 6990 почти догнала представленную сегодня модель. В обновленном D3D10-варианте теста без суперсэмплинга HD 7970 показывает отличный результат, значительно опережая и HD 6970 и GTX 580 и даже GTX 590. Лидерство делят HD 7970 и HD 6990, а две старые видеокарты производства AMD показывают схожие результаты и сильно (в два и более раза медленнее новой модели) отстают. Посмотрим, что изменит включение суперсэмплинга, он может вызвать сильное падение скорости на платах Nvidia.

При включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — карты производства AMD улучшили свои показатели относительно решений Nvidia.

И теперь Radeon HD 7970 снова становится единоличным лидером сравнения, показывая результаты выше, чем у HD 6990. Более старые одночиповые платы компании далеко позади, вместе с ними и Geforce GTX 580. И лишь более дорогие двухчиповые варианты от AMD и Nvidia способны хоть как-то приблизиться к свежей видеоплате. В общем, по двум шейдерным D3D10 тестам можно сделать вывод, что новая архитектура AMD и её представитель на чипе Tahiti великолепно справляется с «шейдерными» задачами, даже лучше традиционно сильных в них конкурентов от Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов обычно соответствуют разнице в частотах и количестве исполнительных блоков, но с некоторым влиянием разной эффективности их использования. Все последние архитектуры AMD в таких случаях имеют подавляющее преимущество перед конкурирующими видеокартами Nvidia, и это объясняет результаты тестов, в которых решения AMD снова оказываются значительно более производительными.

Решения расположились примерно соответственно теории, но за некоторыми исключениями. На практике открылись некоторые нюансы, связанные с различной эффективностью. Теоретически, Geforce GTX 580 должна быть более чем вдвое (2,4 раза) медленнее, чем новая модель Radeon HD 7970, на практике же разница составляет лишь 80%, что значительно меньше. Да и при сравнении с HD 6970 возникают вопросы оптимизации новой архитектуры и драйверов для неё к этому тесту. При теоретическом превосходстве по вычислениям в 40%, новая плата AMD лишь на 28% быстрее предыдущей — HD 6970, а ещё меньше дистанция между ней и совсем старой HD 5870, основанной на VLIW5-архитектуре. То ли тест действительно лучше подходит для VLIW (особенно для VLIW5), то ли виноваты ещё сырые драйверы.

Есть и ещё одно объяснение — возможно, на результаты плат HD 7970 HD 6970 в этом тесте повлияла технология PowerTune, снизившая частоты при достижении предела энергопотребления. Впрочем, всё это мало что меняет при сравнении с конкурентом, ведь даже дорогущая двухчиповая плата Geforce GTX 590 лишь достигла уровня HD 6970 и HD 5870. А уж одночиповая GTX 580 так и вовсе далеко позади.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Мы видим почти идентичную предыдущей диаграмму, за исключением абсолютных цифр. В этот раз все GPU остались примерно на тех же позициях, ну разве что видеоплаты на базе Cayman и Cypress поменялись местами — теперь чуть-чуть быстрее более новая модель, но совсем незначительно. Хотя строгого соответствия теоретическим цифрам пиковой производительности всё так же нет, но их результаты всё-таки близки к сухой теории. Разница между HD 7990 и HD 6970 немного увеличилась.

В остальном, мы не нашли на графике ничего нового. Скорость рендеринга в этом тесте ограничена исключительно производительностью шейдерных блоков и их эффективностью, поэтому двухчиповая HD 6990 снова стала явным лидером, а за ней на приличном отдалении следует сегодняшняя новинка от AMD. Обе платы Geforce уступают даже устаревшей модели из семейства Radeon HD 5800, но и в этот раз преимущество решений AMD остаётся несколько меньшим, чем при сравнении теоретических цифр, и это снова говорит о худшей оптимизации или влиянии PowerTune.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не слишком сложная, и производительность ограничена в основном скоростью обработки геометрии, но ещё и пропускной способностью памяти/филлрейтом (в рамках решений одного производителя).

В этом тесте должны были проявиться улучшенные возможности Southern Islands по обработке геометрии, вот они и проявились. Новая видеокарта AMD действительно гораздо быстрее выполняет геометрические расчёты, по сравнению со всеми предыдущими решениями компании. Хотя AMD дала цифры прироста до 4 раз, но в этом тесте геометрическая производительность выросла примерно в 1,5-2 раза. В итоге, одночиповая видеокарта оказалась примерно на том же уровне, что и двухчиповая модель Radeon HD 6990 на GPU предыдущего поколения.

Столь значительное улучшение привело к тому, что Tahiti практически догнала топовую видеокарту Nvidia, хотя выполнение геометрических шейдеров у той в некоторых условиях должно быть ещё эффективнее. Ранее видеокарты Nvidia справлялись с работой примерно вдвое быстрее аналогичных видеокарт конкурента, а теперь разницы совсем нет. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры почти не изменились для решений Nvidia и большинства плат AMD. Лишь новая видеокарта из семейства HD 7900 в данном тесте слабо отреагировала на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер. Поэтому плата показала результат чуть выше, чем на предыдущей диаграмме. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. То есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте скорость рендеринга должна быть ограничена геометрической производительностью, и новая архитектура от компании AMD показывает себя просто отлично, даже немного обгоняя конкурента в лице Geforce GTX 580! Обе двухчиповые платы тут показали некорректные результаты, поэтому с ними сравнения не получится. Зато HD 7970 на 40-50% быстрее своей предшественницы — модели HD 6970, что явно объясняется архитектурными изменениями в GPU. Отличные результаты карты на Tahiti явно свидетельствуют о проведённой оптимизаций в блоках обработки геометрических данных в новом чипе.

Цифры должны сильно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот тут рекорда у Radeon HD 7970 не получилось, всё-таки разница между чипами AMD с традиционным графическим конвейером (в т. ч. и Cayman с Tahiti с двумя растеризаторами) и чипами с архитектурой Fermi, имеющей распараллеленную обработку геометрии, хорошо заметна. И результаты Geforce GTX 580, имеющей в своей основе чип GF110, хороши настолько, что она обгоняет лучшее из решений компании AMD (а это анонсированная сегодня модель) на 35-40%.

Хотя возможности новенького топового чипа AMD по обработке геометрии и скорости исполнения геометрических шейдеров явно выросли по сравнению с предыдущими видеокартами компании, и первое решение на чипе Tahiti показывают в этих тестах результаты на 22-28% выше, чем решения на базе Cayman. Вероятно, инженеры AMD решили, что такой оптимизации блоков установки треугольников и обработки геометрии будет вполне достаточно.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет сразу многое: и скорость текстурирования и пропускная способность памяти. И результаты видеокарт часто ограничены некоей преградой — посмотрите хотя бы на сравнение двухчиповой GTX 590 и одночипового аналога — между ними почти нет разницы. Хотя HD 6990 вдвое быстрее HD 6970.

Да и новая плата AMD из семейства Radeon HD 7970 показала очень хорошие результаты, почти догнав лидирующую HD 6990. Что касается одночиповых конкурентов, то она лучшая во всех трёх режимах. Преимущество над HD 6970 составило от 25% до 75%, в зависимости от режима. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

А вот в этот раз взаимное расположение карт на диаграмме заметно изменилось, и особенно это касается тяжёлого режима. При малом количестве полигонов скорость рендеринга в этом тесте упирается в ПСП, поэтому платы AMD и были так сильны на предыдущей диаграмме.

А вот в тяжёлых режимах разница между одночиповой картой Nvidia и новинкой AMD сократилась, и они соперничают между собой в довольно плотной борьбе. Старшая двухчиповая видеокарта семейства Radeon HD 6900 обгоняет все остальные решения и является лучшей в сравнении, хотя в тяжёлом режиме к ней подбирается и Geforce GTX 590. Новая же одночиповая HD 7970 выигрывает у предшественницы снова до 70%, что может говорить о сильном влиянии ПСП.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» абсолютно не похожи на то, что мы видели на предыдущих диаграммах. В этом тесте видеокарты AMD и Nvidia, кроме HD 6990 и HD 7970, показывают очень близкие результаты, что снова можно списать на ограничение пропускной способностью видеопамяти, так как этот показатель у всех представленных видеокарт близок.

А вот новая модель из семейства Southern Islands смогла выделиться, в сложных условиях сравнения почти догнав двухчиповую HD 6990, которая стала лучшей среди всех видеокарт. Разница между картами на базе графических процессоров Cayman и Tahiti снова составила 25-70% в пользу более нового решения. Рассмотрим второй вариант этого же теста:

И тут произошли изменения, аналогичные тем, что мы видели ранее — видеокарты Nvidia «просели» только в лёгком режиме, а большинство решений AMD — сразу во всех. Впрочем, это не позволило платам калифорнийской компании догнать новинку семейства Radeon 7900. Которая, кстати, обогнала всех в среднем и тяжёлом режимах, уступив двухчиповой HD 6990 только один раз.

В режиме с малым количеством полигонов разница между решениями не такая большая, а вот в среднем и тяжёлом старые решения AMD уступают, затем идут платы Nvidia (двухчиповая лишь немного быстрее одночиповой GTX 580), HD 6990 и HD 7970. Анонсированная сегодня плата семейства HD 7900 в тестах вершинных выборок показала себя отлично, с запасом обогнав и конкурирующие видеокарты Nvidia и предшественников от того же производителя.

3DMark Vantage: тесты Feature

Как всегда, синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы ранее упустили. Тесты Feature этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших. При анализе результатов новой видеокарты Radeon HD 7970 в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Хотя тест компании Futuremark всё так же не показывает теоретически возможного уровня скорости текстурных выборок, но всё же эффективность видеокарт и AMD и Nvidia в нём заметно выше, чем в нашем из RightMark. Поэтому в данном текстурном тесте получается несколько иное соотношение результатов, которое ближе к истине.

Первая видеокарта из нового семейства компании AMD показывает результат, близкий к соответствующему теоретическому параметру, и она справляется с работой эффективнее предыдущего поколения. Radeon HD 7970 опережает HD 6970 более чем на 50%, хотя по теории разница составляет лишь 40%. Вероятнее всего, текстурные модули Tahiti используются эффективнее из-за улучшений в системе памяти и кэширования, что и вызвало повышенный результат.

Конечно, новая одночиповая модель не дотянула до лидера — двухчиповой HD 6990, но это и не ожидалось. И всё же, хорошо видно, что текстурная производительность графического чипа Tahiti заметно выросла по сравнению с Cayman. Ну а GTX 580 проигрывает новинке по скорости текстурирования целых 2,3 раза. Даже двухчиповая карта Nvidia догоняет лишь HD 6970.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Ситуация в тесте производительности блоков ROP серьёзно отличается от теста текстурирования. Цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP, но с влиянием величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»). И тут новая модель HD 7970 показывает отличный результат, отстав лишь от двух топовых видеокарт AMD и Nvidia из предыдущих поколений, имеющих по два GPU на борту.

А что же с эффективностью использования блоков ROP, которой хвалились AMD? Действительно, лишь 32 блока ROP в новом чипе Tahiti совсем не ограничивают скорость рендеринга даже в специализированном тесте. И мы отмечаем несколько бо́льшую эффективность блоков ROP и более высокую скорость заполнения у новой видеокарты компании AMD по сравнению со старыми моделями. Разница между HD 7970 и HD 6970 более чем 50%, что явно говорит о большем влиянии уже ПСП, а не чистой производительности блоков ROP.

Что касается сравнения с Nvidia, то и тут разница по скорости (35%) соответствует теоретической разнице в ПСП (36%), а не чистой скорости блоков ROP. Получается, что 32 таких блока в Cayman просто были лишними и их возможности никогда не использовались полностью.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. Для достижения высокой скорости тут важен баланс блоков GPU, также весьма заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт AMD на диаграмме в целом похожи на то, что мы видели в тесте текстурной производительности из 3DMark Vantage, кроме того, что новый Radeon HD 7970 явно эффективнее и в этой задаче, ведь он снова почти догнал двухчиповую HD 6990 — отличный результат! Платы Nvidia в данном случае получили некоторое увеличение производительности, что подтверждает вывод о том, что не только текстурная производительность влияет на результаты этого теста.

Итак, новая модель компании AMD отлично выступила, совсем немного уступив двухчиповой плате на базе двух Cayman. Одночипового предшественника она обогнала на 66%. Эта цифра не соответствует ускорению от Cayman к Tahiti ни по одному из теоретических параметров и может означать улучшение эффективности исполнения сложных вычислений с ветвлениями. Даже считавшийся ранее неплохим результат Geforce GTX 580 вдвое хуже, чем у новинки AMD. Собственно, все видеокарты этого производителя оказались быстрее топовой модели линейки Geforce GTX 500 на базе одного чипа.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит от многих параметров, но уже других. Основными факторами тут являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Так что вполне логично, что именно видеокарты производства Nvidia чувствуют себя в этом приложении отлично, значительно опережая конкурентов.

И даже представленная сегодня Radeon HD 7970, несмотря на явное улучшение производительности, по сравнению с HD 6970, не смогла тут составить конкуренцию одночиповой Geforce GTX 580 и немного уступила ей. Это один из тех геометрических тестов, в которых видно преимущество у недавно видеокарт HD 6900 перед предыдущими линейками, в которых увеличили скорость обработки геометрии и выполнения геометрических шейдеров. Radeon HD 7970 улучшила результат ещё на 35%, но этого оказалось мало — решения Nvidia продолжают лидировать в этом тесте. Хотя отметим, что новая модель всё же значительно улучшила позиции компании AMD в геометрических тестах.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты очередного теста из пакета 3DMark Vantage похожи на те, что мы видели на предыдущей диаграмме, но скорость обработки геометрии в нём стала ещё важнее. И поэтому видеокарты Nvidia вывались вперёд ещё дальше, оставив позади даже двухчипового монстра — Radeon HD 6990. Увы, но это факт — даже GTX 580 обогнала все платы AMD, в том числе и новёхонькую модель на базе графического процессора Tahiti.

Увы, но хотя плата, основанная на новом чипе, и показала более сильный результат, по сравнению с решениями на базе Cayman и Cypress, но от Geforce отстало. Разница между HD 7970 и HD 6970 в этом сравнении составила чуть больше 30%, что указывает на явное влияние скорости ALU. В синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, решения AMD продолжают отставать от конкурирующих видеокарт соперника, имеющих весьма высокую скорость обработки геометрии.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует очень много математических расчётов.

Интересно, что в математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы увидели совершенно иную картину, по сравнению с аналогичными тестами из нашего тестового пакета. Показанная на диаграмме производительность решений лишь очень примерно соответствует тому, что должно получаться по теории, а также расходится и с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0. Например, явно видно, что новая видеокарта в этом тесте подобралась гораздо ближе к теоретической скорости, по сравнению с картами на GPU с VLIW-архитектурой.

Давайте разберёмся в причинах. В своё время, HD 6970 не усилила пиковую производительность математических вычислений по сравнению с HD 5870, но одним этим отставания Cayman не объяснить. Причиной могла быть как меньшая эффективность архитектуры VLIW4, так и умная система управления питанием, «зарезавшая» тактовую частоту и производительность решений при достижении установленного порога энергопотребления.

Но ведь на HD 7970 она не сказалась. Скорее всего, причина как раз в скалярной архитектуре нового чипа. Потому что соотношение цифр производительности в тесте и теоретических на это явно указывает. По теории, HD 6970 обладает 0,7 математической мощи новой карты, но по этому тесту получилось лишь 0,56. Примерно такая же разница получилась и для других плат AMD. А вот при сравнении GTX 580 и HD 7970, имеющих скалярные архитектуры, теоретическое соотношение равно 0,42 (Tahiti более чем вдвое быстрее), и практическое тоже 0,42. То есть, эффективность использования имеющихся ALU у этих чипов разных производителей абсолютно одинаковая! В отличие от Cayman и Cypress, имеющих VLIW архитектуру.

В любом случае, обеих своих конкурентов от Nvidia новая плата AMD обходит с огромным запасом, и Nvidia явно нужно резко усилить математическую мощь в будущих решениях. А пока что получается привычная картина — видеокарты Geforce показывают низкие результаты в таких случаях, когда простая и интенсивная математика выполняется на платах Radeon значительно быстрее. И выход Southern Island только усугубил ситуацию.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новые решения компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Возможно, это и не самый удачный пример для вычислительных шейдеров, но разницу в производительности показывает довольно чётко. Разницы между расчётами в вычислительном и пиксельном шейдерах для видеокарт AMD почти нет, а на Nvidia немного быстрее выполняется пиксельный.

AMD Radeon HD 6970 оказалась быстрее предшественницы HD 5870, и выступила на уровне Geforce GTX 580, но представленная сегодня модель HD 7970 значительно опережает их все и становится лидером (двухчиповые видеокарты в этой синтетике мы решили не использовать). GTX 560 Ti взята в основном для тестов геометрии, ну и для того, чтобы оценить разницу между решениями из разных ценовых сегментов.

Итак, анонсированные плата на новом чипе Tahiti опережает аналог на базе Cayman на 40%, что полностью соответствует разнице в теоретической производительности вычислительных блоков. В свою очередь, преимущество над конкурирующей GTX 580 равно 30-40% (в зависимости от типа шейдерной программы), что явно ниже теоретически возможного. GTX 560 Ti отстаёт очень сильно, более чем вдвое.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

Результаты в этом тесте весьма необычные, для устаревших решений AMD похожие на цифры из математического теста 3DMark Vantage — Cypress оказался быстрее Cayman. Несмотря на большое теоретическое превосходство в пиковых цифрах, быстрейшая видеокарта AMD — представленная сегодня новинка Radeon HD 7970 — лишь на 21% опережает топовое решение Nvidia. И даже GTX 560 Ti не так уж сильно отстаёт. Старые модели семейств HD 6900 и HD 5800 показывают результаты, близкие к показателям Geforce GTX 580.

Больше всего нам интересна разница между результатами решений на Cayman и Tahiti, и в этом случае мы видим преимущество свежей модели, равное 36%. Это чуть меньше теоретической разницы между данными моделями, но всё-таки близко к ней. Почему же обе карты не очень ярко выступили на фоне очень старой HD 5870? Возможно, виновата сниженная PowerTune частота или недостаток оптимизации драйверов под новую архитектуру. Посмотрим, может в тестах тесселяции Tahiti наконец-то покажет значительное ускорение.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но главным нововведением в Direct3D 11 всё же считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Интересно, что parallax occlusion mapping (средние столбики на диаграмме) на видеокартах от обоих производителей выполняется гораздо менее эффективно, чем тесселяция (нижние столбики), а умеренная тесселяция не даёт большого падения производительности — сравните верхние и нижние столбцы. То есть качественная имитация геометрии при помощи пиксельных расчётов обеспечивает даже меньшую производительность, чем оттесселированная геометрия с displacement mapping.

Что касается производительности видеокарт относительно друг друга, то давайте рассмотрим сначала попиксельные техники. В тесте простого бампмаппинга лидирует новая видеокарта AMD, она опережает и HD 6970 и GTX 580 на 27% и 36% соответственно. А вот в подтесте сложных попиксельных расчётов (вспоминаем тесты parallax mapping выше по тексту) до выхода Cayman видеокарты Geforce были быстрее решений AMD, равно как и при включенной тесселяции. С выходом Radeon HD 6970 в подтесте с тесселяцией оказались заметно быстрее HD 5870, и в тесте с небольшим коэффициентом разбиения треугольников HD 6970 обогнала даже GTX 580.

Гораздо интереснее то, что мы увидели на графике с меткой Radeon HD 7970. Тесселяция тут не слишком сложная, поэтому новая видеокарта выиграла у предшествующей модели не так уж много — около 30%. Другое дело — тест POM. В этом подтесте новая HD 7970 просто разорвала все остальные решения в клочья. Преимущество перед HD 6970 и GTX 580 лишь немного не дотягивает до двукратного. Очередной суперрезультат в тесте parallax mapping, говорящий о высокой эффективности исполнения сложных шейдерных программ.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

А вот в этом примере мы видим уже полноценное сравнение геометрической мощи решений AMD и Nvidia в разных условиях. И оно получилось весьма интересным, на наш взгляд. Сильно выделяется графическая архитектура Fermi, да и чип новой архитектуры Tahiti от AMD. Конечно, это чисто синтетический тест и экстремальные коэффициенты разбиения вряд ли будут использоваться в играх ближайшего времени, особенно учитывая тотальную мультиплатформенность. Нам интересен архитектурный потенциал, для чего и нужна «синтетика».

Если в лёгких условиях новая Radeon HD 7970 успешно конкурирует с Geforce GTX 580, опережая её в самых лёгких режимах и идёт наравне в третьем, но в самых тяжёлых условиях с очень большим количеством треугольников с видеокартой Nvidia Geforce на чипе GF110 конкурировать просто невозможно — в задачах экстремальной тесселяции она значительно быстрее даже неоднократно улучшенных чипов AMD. Новый GPU хотя и ещё раз сократил отставание от конкурента в задачах обработки геометрии, но до распараллеленной работы 16 блоков тесселяции в GF110 всё ещё очень далеко. И даже GF114 при максимальном коэффициенте разбиения оказался быстрее Tahiti.

Тем не менее, несмотря на проигрыш в наиболее суровых условиях с максимальным коэффициентом разбиения, в остальном HD 7970 на базе Tahiti выступила просто отлично, особенно по сравнению с Cayman и Cypress. Новая модель компании AMD в режимах лёгкой и средней нагрузки показывает впечатляющий прирост в скорости, и разница по сравнению с и так не медленной HD 6970 достигает 2,8 раза. Но такой прирост мы видим только в экстремальном случае, а чаще всего получается от 30 до 70%. Обещанной четырёхкратной разницы мы не увидели, по крайней мере пока.

Но максимальная разница между решениями компаний достигается в условиях экстремальной тесселяции, которых не будет в играх и приближённых к ним бенчмарках. Поэтому мы ожидаем, что Tahiti заметно улучшит позиции компании AMD в существующих тестах с применением тесселяции, вроде 3DMark11 и Heaven.

Давайте рассмотрим ещё один тест — демонстрационную программу Nvidia Realistic Water Terrain, также известную как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта. Смотрится она просто замечательно, вот чего не хватает в нынешних играх:

Island не является чисто синтетическим тестом для измерения геометрической производительности, он содержит и сложные пиксельные и вычислительные шейдеры, и такая нагрузка ближе к реальным играм, в которых используются сразу все блоки GPU, а не только геометрические, как в предыдущем бенчмарке.

Мы также протестировали программу при четырёх разных коэффициентах тесселяции, эта настройка называется Dynamic Tessellation LOD. И если при самом низком коэффициенте разбиения впереди оказываются все видеокарты компании AMD, то при усложнении работы платы на основе чипов от Nvidia начинают вырываться вперёд. И при увеличении коэффициента разбиения и сложности сцены производительность абсолютно всех Radeon падает сильно, в отличие от конкурирующих решений.

Поведение Radeon HD 7970 в тесте любопытное. Сразу видно, что никаких кардинальных изменений в геометрическом конвейере сделано не было (в общем, это и не обещалось, так что никаких претензий). Если в самом лёгком режиме новая карта быстрее HD 6970 на 35%, а GTX 580 — на 64%, то уже при настройке LOD в значение 25 производительность новинки падает до уровня скорости GTX 560 Ti. Дальше — больше. При максимальном коэффициенте LOD разница между скоростью Geforce GTX 580 и Radeon HD 7970 достигла 3,5 раз!

Проверим, получили ли мы обещанную четырёхкратную разницу между HD 7970 и HD 6970. Нет, максимальное отставание графического процессора Cayman составило менее чем два раза. А чаще всего и вовсе лишь полтора. В общем, нам не очень понятно, где искать четырёхкратное ускорение тесселяции, остаётся верить на слово, что где-то оно есть. Пока же констатируем очередную победу видеочипов от Nvidia — уж очень они хороши в геометрических тестах.

Выводы по синтетическим тестам

По результатам проведённых нами синтетических тестов новейшей видеокарты Radeon HD 7970, основанной на графическом процессоре Tahiti из семейства Southern Islands, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, можно сделать вывод о том, что новинка определённо станет лидером среди одночиповых решений, доступных на рынке. Это просто отличное продолжение удачных линеек Radeon HD 5800 и HD 6900, которое должно серьёзно укрепить позиции компании AMD в ближайшие месяцы.

Графический процессор Tahiti выполнен на основе новой архитектуры с применением самого современного техпроцесса 28 нм, и он очень сильно отличается от всех предыдущих чипов компании. Хотя количество некоторых исполнительных блоков в нём выросло не так значительно (вычислительные блоки ALU и блоки ROP), но новый GPU отличается важными архитектурными изменениями, направленными на увеличение эффективности вычислений на GPU, а также на улучшение позиций в производительности обработки геометрических данных. Многие из наших синтетических тестов показали, что эффективность вычислений в сложных задачах и скорость тесселяции и выполнения геометрических шейдеров серьёзно выросли, хотя и не всегда настолько, насколько нами ожидалось.

С видеочипами AMD случилось то, что обязано было случиться. То самое, что Nvidia уже прошла чуть раньше. При переносе акцента с графических вычислений на вычисления общего назначения, и соответствующем переходе от VLIW к скалярным архитектурам, а также добавлении других важных для GPGPU функций, вроде продвинутого кэширования и добавления планировщиков в каждый вычислительный блок, рост сложности чипа обязательно превысит рост пиковых показателей производительности. То есть, чисто фактически получается, что предыдущие решения могут быть эффективнее — хотя они менее производительны, но достигается это меньшими силами (в виде сложности чипа).

Поясним это на примере. Преимущество Radeon HD 7970 перед тем же Radeon HD 5870 в некоторых синтетических тестах было далеким от разницы в сложности GPU — ведь Cypress имеет ровно вдвое меньше транзисторов (2,15 против 4,3 млрд), а в тестах очень редко отстаёт настолько же сильно. Получается, что старый чип эффективнее нового? Да, но только для устаревающих чисто графических задач! В случае же неграфических вычислений, да и многих сложных 3D-расчётов, Tahiti оказался даже более чем вдвое мощнее Cypress, и это подтверждается соответствующей синтетикой. За GPGPU будущее, и задачи видеочипов будут усложняться и далее, поэтому иного пути у AMD просто не было.

Зато, благодаря архитектурным изменениям и своим характеристикам, видеокарта новой серии во многих синтетических тестах, которые ранее были «ахиллесовой пятой» решений AMD, стала более чем конкурентоспособной, особенно по сравнению с прямым конкурентом Geforce GTX 580, даже с учётом большей цены. Это отлично видно почти во всех синтетических тестах пакетов RightMark, Vantage, да и примерах из различных SDK.

Но нашлись и потенциально… ну, не то, чтобы слабые, но недостаточно сильные стороны нового GPU. К таким относится не слишком большой рост производительности в некоторых математических тестах, да и по геометрическим возникают вопросы (например, где обещанное четырёхкратное ускорение?). Несмотря на бо́льшую сложность и площадь чипа по сравнению с тем же Cayman, результаты модели HD 7970 иногда ниже ожидаемых, что не всегда можно легко объяснить. Мы предполагаем, что в этом может быть виноват недостаток оптимизации драйверов, ведь для AMD эта архитектура абсолютно новая и требует тщательной и длительной шлифовки. В некоторых тестах могла подвести и система управления питанием PowerTune, которая могла понизить тактовые частоты при достижении максимального энергопотребления в наиболее требовательных синтетических тестах, не позволяя карте показать ожидаемую производительность, исходя из числа исполнительных блоков и их тактовой частоты.

Хотя в целом результаты в синтетике были показаны весьма неплохие, и особенно приятно то, что инженеры AMD подтянули некоторые из своих слабых мест. К сожалению, в текущих играх гораздо сложнее будет добиться столь впечатляющих приростов, по сравнению с продвинутой синтетикой. Сразу по нескольким причинам. Даже просто потому, что производительность в игровых приложениях редко ограничена какой-то одной характеристикой видеокарты, в отличие от синтетики, а при такой радикальной смене графической архитектуры драйверы ещё нужно оптимизировать и оптимизировать. Кроме того, даже современные игры редко используют все возможности топовых видеокарт для ПК. Они часто упираются в скорость текстурных выборок и эффективный филлрейт (пропускную способность видеопамяти), а в таких условиях полностью раскрыться столь сложные чипы не могут. Придётся ждать или мощных ПК-эксклюзивов или следующего поколения игровых консолей.

Предполагаем, что результаты Radeon HD 7970 в синтетических тестах будут подтверждены соответствующими цифрами и в «игровой» части нашего материала. В играх новая HD 7970 должна выступить сильнее всех конкурентов и опередить Geforce GTX 580 хотя бы на 30%, а то и больше. Вероятно, получится как обычно — в некоторых тестах преимущество будет больше, а в других — его почти не будет. В любом случае, HD 7970 обязана стать лучшей среди всех одночиповых моделей AMD и Nvidia, по крайней мере, все предпосылки к этому мы нашли. Так давайте же перейдём к следующей части материала — исследованию скорости в играх.

Сколько энергии фактически потребляют графические процессоры?

Этот сайт может получать партнерские комиссии за ссылки на этой странице. Условия эксплуатации.

Определить, сколько энергии потребляют компоненты ПК, — удивительно сложный вопрос. Легко ответить, сколько энергии система потребляет от стены — базовый счетчик Kill-A-Watt не стоит много, и, хотя он не предлагает таких функций, как отслеживание энергопотребления с течением времени, он все равно обеспечит хороший объем. информацию, если вы отслеживаете ее вручную в течение нескольких минут при постоянной нагрузке.

Отслеживание точного энергопотребления данного компонента, будь то ЦП, графический процессор или что-то вроде ОЗУ, требует паяльника и определенных навыков его использования. В Tom’s Hardware они построили обширный стенд для тестирования графических процессоров и опробовали огромное количество карт, чтобы ответить на один вопрос: сколько энергии на самом деле потребляют графические процессоры?

Как и CPU, графические процессоры определяют рейтинг TDP. Как и в случае с процессорами, этот рейтинг TDP лучше всего рассматривать как метрику для рассеиваемой мощности графического процессора (то есть, сколько тепла должен выдерживать кулер), а не как точную метрику энергопотребления.Ни Nvidia, ни AMD не гарантируют, например, что графический процессор мощностью 150 Вт потребляет ровно 150 Вт.

Существуют программные инструменты для составления отчетов о потребляемой мощности графического процессора, но такие приложения, как GPU-Z, по-прежнему зависят от графического процессора, сообщающего приложению, сколько энергии он потребляет. Графические процессоры Nvidia довольно точно сообщают программе об общем энергопотреблении, но AMD сообщает только фактическое энергопотребление ядра графического процессора, а не влияние остальной части платы. Это не влияет на измерения мощности на уровне системы, проводимые на стене, но скрывает влияние VRM графического процессора и энергопотребления ОЗУ от самого приложения GPU-Z.Новая испытательная установка THG довольно хорошо решает эту проблему.

График и данные THG.

Я ограничиваюсь Metro Exodus — у них есть результаты и по Furmark, если вы хотите увидеть эти данные, — но то, что мы видим здесь, довольно интересно. Если учесть в уравнении HBM / VRAM, семейство AMD Vega 64 показало выдающуюся мощь, а 5700, которая предлагает практически идентичную производительность, стала огромным улучшением. Из этого графика следует, что Radeon 5700 использует примерно 55% мощности Vega RX 64, что почти вдвое больше, чем производительность на ватт.

Это достижение позволяет по-новому взглянуть на повышение энергоэффективности на базе AMD Navi в прошлом году. Хотя это правда, что 7-нанометровая технология AMD по-прежнему конкурирует с 12-нанометровой технологией Nvidia и Ampere, как ожидается, в этом году, AMD все же внесла некоторые существенные улучшения с помощью RDNA. Он утверждает, что сможет повторить этот подвиг с помощью RDNA2, поэтому мы посмотрим, как все это разовьется.

Есть еще один интересный кластер между Asus RTX 2060 Super и GTX 1080 FE (169–180 Вт), показывающий, как производительность и энергопотребление имеют тенденцию сгруппироваться вокруг одной точки, даже между поколениями продуктов.RX 590 и RX 5700 XT — еще одна действительно интересная точка для сравнения, показывающая, насколько производительность иногда может быть улучшена в пределах одного диапазона мощности.

Если вы уже знакомы с общей формой энергопотребления графического процессора ПК, вы не увидите здесь массу удивительной информации, но всегда приятно увидеть эти вещи, разбитые на более мелкие детали.

Читаю :

Лучшая видеокарта с низким энергопотреблением

Собираете свой компьютер и хотите использовать графический процессор с низким энергопотреблением или видеокарты с низким энергопотреблением ? Мы просмотрели несколько видеокарт , которые не нуждаются в блоке питания , и нашли ваш лучший выбор.Это те, которые выделяются и демонстрируют очень хорошие результаты при тестировании и в отзывах пользователей.

Мы разбили их на спецификации, стили, методы установки и многое другое, чтобы увидеть, какие из них стоят вашего времени, а какие нет.

Лучший графический процессор с низким энергопотреблением — что это?

Итак, что мы можем выбрать для лучших видеокарт с низким энергопотреблением , которые не потребляют много энергии?

На рынке больше вариантов, чем вы думаете, поэтому пришлось немного покопаться.Даже в этом случае, когда мы начали исследования, было легко увидеть, какие из них окажутся лучше.

1. EVGA GeForce GT 740 2 Гбайт GDDR5 с супер тактовой частотой 128 бит

Технические характеристики:
  • Тип интерфейса: PCI Express 3.0 x16
  • Максимальное разрешение: 4096 x 2160
  • Интерфейсы: DVI-I; DVI-D; Мини-HDMI; VGA — с переходником
  • Графический процессор
  • : NVIDIA GeForce GT 740
  • Тип шины: PCI Express 3.0 x16
  • Поддерживаемый API: OpenCL, OpenGL 4.4, DirectX 12
  • Ядра CUDA384
  • Частота ядра 1085 МГц
  • Производитель: EVGA

GeForce GT 740 — это видеокарта начального уровня с низким энергопотреблением от NVIDIA. Хотя их больше нет в производстве, вы все равно можете их купить. Он был построен по 28 нм техпроцессу и основан на графическом процессоре GK107.

Он поддерживает DirectX12, но действительно хорошо работает только с некоторыми из старых версий. Графический процессор GK107 представляет собой микросхему среднего размера с общей площадью кристалла 118 мм² и 1270 миллионами транзисторов.

Он имеет 384 блока затенения, 32 блока наложения текстур и 16 блоков ROP. NVIDIA объединила 1024 МБ памяти с GeForce GT 740. Сам чип построен хорошо и из материалов хорошего качества. Он работает на частоте 993 МГц, а память — на 1253 МГц.

Это однослотовая карта, которая получает питание от 1x 6-контактного разъема питания. Максимальная потребляемая мощность составляет 64 Вт. Выходы на дисплей на карте включают 2x DVI и 1x mini-HDMI.

В целом карта имеет длину 145 мм и имеет однослотовую систему охлаждения.В целом, мы считаем, что это хорошая карта с хорошим потенциалом , но есть и другие варианты.

2. XFX Radeon RX 560 1295 МГц

Технические характеристики:
  • Поддержка разрешения 4K Ultra HD: Да
  • Тактовая частота графического процессора: 1295 мегагерц
  • Интерфейс (ы): PCI Express 3.0
  • Система охлаждения: Жидкостная
  • Высота продукта: 4,8 дюйма
  • Графический процессор (GPU): AMD Radeon RX 560

Radeon RX 560 — хорошая производительность , особенно по цене .Это тихая и крутая карта, которая не потребляет много энергии, поэтому она будет работать в уменьшенных сборках. В современных играх он обеспечивает среднюю частоту кадров — 1920 x 1080. Если вы захотите вернуться к среднему или даже низкому качеству, вы получите от этого больше.

К сожалению, при потребляемой мощности около 70 Вт он все же потребляет больше энергии, чем некоторые другие варианты в списке. Вы, , не сможете играть во многие новые игры , и когда вы воспользуетесь этой картой, вы не сможете защитить свой компьютер от будущего.

3. EVGA GeForce GT 1030 SC 2 ГБ GDDR5

Технические характеристики:
  • Память: 2 ГБ GDDR5, 64-битная память
  • Низкопрофильная конструкция: длина карты 150 мм
  • Тактовая частота ядра
  • : 1252 МГц в режиме разгона и 1227 МГц в игровом режиме
  • Тактовая частота с ускорением: 1506 МГц в режиме разгона и 1468 МГц в игровом режиме
  • Совместимость: 1 x Dual-Link DVI-D 1 x HDMI 2.0b
  • Потоковые процессоры: 384
  • Интерфейс: PCI Express 3.0 x4
  • Разгон в один клик с помощью графического ядра AORUS
Обзор:

EVGA GeForce GT — отличная видеокарта с низким энергопотреблением для тех случаев, когда вы играете в соревновательные игры или просто используете свой компьютер для потоковой передачи.В некоторых играх он не будет работать так же хорошо, как в некоторых других, потому что не поддерживает чрезвычайно тяжелые игры , но с учетом более низкой цены и энергосбережения это отличный вариант. Что нам больше всего нравится в этой карте, так это то, что она настолько доступна.

Для некоторых это немного устарело. Однако большинство из этих людей не будут искать карты с низким энергопотреблением. Это хороший вариант для людей, которым нужно что-то подешевле. Если вы можете выставить его на распродаже, сделайте это.

Карта работает хорошо при длительном использовании, что всегда было проблемой для видеокарт с низким энергопотреблением .У него невысокий TDP 30 Вт, и это здорово. Вам не нужно беспокоиться о добавлении собственной системы охлаждения.

EVGA GeForce GT 1030 состоит из 1,8 миллиарда транзисторов, что является более высоким показателем для того, что она делает, но остается небольшим — всего 70 мм². EVGA действительно использовала 14-нм техпроцесс FinFET в производстве.

Плюсы: Доступный; Подходит для киберспорта; Низкопрофильный; однослотовая утилита; Часто поступает в продажу

Минусы: Не работает во всех играх; Часто распродается

4.Gigabyte Geforce GTX 1050 Ti 4 ГБ GDDR5 128 бит

Технические характеристики:
  • Бренд: Gigabyte
  • Графический сопроцессор
  • : NVIDIA GeForce GTX 1050
  • Марка чипсета
  • : Nvidia
  • Скорость памяти: 7008 МГц
  • Тактовая частота ядра: 1404 МГц

Nvidia GTX 1050 — одна из самых дешевых видеокарт с низким энергопотреблением, доступных , и вы действительно можете играть во многие киберспортивные игры в Full HD, когда используете ее. Люди даже будут соревноваться в этом; вы тоже можете, если хотите уменьшить некоторые настройки.

Nvidia GTX 1050 — это модель , которую лучше всего использовать на бюджетных ПК и более старых графических процессорах , не имеющих подключения к внешнему источнику питания, в том числе на старых ноутбуках и игровых ноутбуках. Этот графический процессор использует архитектуру Pascal, которая отлично подходит для энергоэффективности.

Он имеет всего 640 ядер CUDA, тактовую частоту 1455 МГц и 2 ГБ памяти GDDR5. Сама карта имеет длину 145 мм, что также делает ее отличным выбором для игровых устройств. Вы получите DisplayPort 1.4, DVI-D и HDMI 2.0b, которые подходят для выходов RX 460. Видеокарта с низким энергопотреблением потребляет всего 75 Вт энергии, потребляя ее от материнской платы.

Зачем вам нужна видеокарта с низким энергопотреблением?

Если вы ищете видеокарту с низким энергопотреблением , у вас будет много разных причин. Они стали более доступными сейчас, когда люди поняли, что они достаточно сильны для того, что им нужно. Они будут занимать меньше места и с годами производить все более качественные игровые .

То, что что-то меньше, не означает, что оно будет работать хуже. Вам нужно будет провести некоторое исследование и выяснить, какой из них даст вам нужные результаты, но вы сможете найти что-то, что подходит для вашей сборки.

Зачем нужна видеокарта с низким энергопотреблением ? Вот несколько веских причин:

1. Вы будете потреблять гораздо меньше энергии

Самая очевидная причина для приобретения графической карты с низким энергопотреблением — это минимальное потребление энергии во время игры.Если вы сравните меньшую графическую карту с той, которая потребляет среднее количество энергии, вы увидите, что вам нужно гораздо меньше подключений и поддержки со стороны блока питания.

Вместо этого вы сможете работать с вашей системой от питания, подаваемого через слот PCI Express x16 или другой слот. Вам не нужен прежний блок питания, а это значит, что вся ваша сборка будет дешевле, и вам не придется ее охлаждать. С большинством видеокарт с низким энергопотреблением вы сможете использовать ПК средней сборки мощностью 400 Вт.

Конечно, еще одна причина, по которой люди любят видеокарты с низким энергопотреблением , заключается в том, что они производят меньше шума и обеспечивают более плавный игровой процесс.

2. Малый форм-фактор

Графическая карта с низким энергопотреблением обычно также является низкопрофильной. Это означает, что он тоньше и короче по сравнению с видеокартами стандартного размера. Он сможет поместиться в тонкие или низкопрофильные корпуса, что откроет новые возможности. Вы также можете положить их в стандартные футляры для большей вентиляции.

Большинство видеокарт с низким энергопотреблением имеют один слот, но вы также можете получить варианты с двумя слотами. Независимо от того, какой вариант вы выберете, он должен аккуратно вписаться в ваш чехол. Если вы не уверены, подойдет ли ваш выбор, посмотрите размеры маломощной видеокарты , чтобы узнать, была ли она специально разработана для корпуса обычного размера или корпуса малого форм-фактора.

3. Их можно приобрести с ограниченным бюджетом

Видеокарты с низким энергопотреблением, как правило, являются одними из наиболее доступных по цене видеокарт на рынке.Так было не всегда, но цена снижается. Вы можете легко купить маломощную видеокарту менее чем за 100 долларов, и если вы подниметесь выше, вы получите что-то действительно отличное.

На самом деле все зависит от , что вы хотите от своей карты . Лучшее, что вы можете сделать, — это прочитать о карте, которую вы хотите купить, чтобы узнать, стоит ли она такой цены. Не все карты будут иметь справедливую цену, поэтому вам стоит провести небольшое исследование. Помните, что эти карты часто поступают в продажу, поэтому стоит немного отслеживать цену.

4. Низкое энергопотребление против. Стандартная видеокарта

Некоторые люди могут спросить, зачем вам видеокарта с меньшим энергопотреблением. Для этого есть много причин, но самая большая причина заключается в том, что помогает контролировать тепло и шум, исходящие от вашей игровой системы . Большинство людей не будут перегружать свои компьютеры до такой степени, что это даже станет проблемой, но геймеры часто это делают.

Карты

с низким энергопотреблением также идут рука об руку с низкопрофильными картами меньшего размера, которые необходимы для небольших сборок.

Низкопрофильные карты имеют максимальную высоту 2,536 дюйма , но некоторые карты с низким энергопотреблением не являются низкопрофильными, поэтому вам нужно будет прочитать мелкий шрифт.

С видеокартой с низким энергопотреблением вы захотите, чтобы она потребляла около 25 Вт, хотя эти карты могут потреблять до 75 Вт.

5. Имеет ли значение размер?

Графические карты с низким энергопотреблением потребляют дополнительную мощность за счет прямого подключения к источнику питания системы, как и стандартные карты.Они просто потребляют меньше энергии.

Графические процессоры с низким энергопотреблением должны иметь меньшие по размеру вентиляторы по сравнению со стандартными размерами, поскольку они не выделяют столько тепла. Этот ограничивает шум и движущиеся части , а это значит, что на вашем компьютере меньше вещей, которые могут выйти из строя.

Раньше у людей возникали проблемы с подключением видеокарт с низким энергопотреблением к своим компьютерам, потому что они были очень хрупкими, но теперь это уже не проблема. В настоящее время они исправили свои методы, чтобы сделать это стало проще.

Вы можете подключить маломощный или низкопрофильный монтажный кронштейн к карте , а затем работать оттуда. Вы даже можете получить два и выбрать, какой из них лучше всего подходит для ваших нужд.

Часто задаваемые вопросы

Если вы плохо знакомы с , собирая свой собственный ПК , и не знаете, что такое видеокарты с низким энергопотреблением , у вас может возникнуть много вопросов.

  • Что такое видеокарта с низким энергопотреблением?

Видеокарта с низким энергопотреблением обычно меньше стандартной карты и потребляет меньше энергии на определенный процент.Как правило, они будут иметь с одним слотом и подключаться к вашему процессору так же, как и стандартный графический процессор. Помимо более низкой мощности, вам придется пойти на некоторые уступки, в том числе в отношении функций и производительности.

  • Какая видеокарта с низким энергопотреблением самая лучшая?

Лучшая видеокарта с низким энергопотреблением никому не подойдет. Вам нужно будет взвесить плюсы и минусы обоих, чтобы быть уверенным, что вы получаете то, что вам нужно, и можете упустить то, чего не получаете.При более низких ценах вы можете легко их поменять, но требует некоторой работы, и никто не хочет приобретать эту привычку.

Видеокарты с низким энергопотреблением — отличный выбор для многих сборок, и, поскольку на рынке их так много, вы обязательно найдете что-то, что подойдет вам. Если вы хотите построить небольшой ПК или ПК с меньшей мощностью, вам нужно будет рассмотреть свои варианты. Графические карты с низким энергопотреблением были разработаны для максимального увеличения производительности при той мощности, которую они потребляют, поэтому вы получите много преимуществ.

Благодаря более совершенным технологиям, улучшенным деталям и инновациям графические карты с низким энергопотреблением становятся все более надежными и эффективными. К тому же они очень доступны по цене.

Что искать в видеокартах с низким энергопотреблением

Графические карты используются для преобразования чисел, отправленных на компьютер, в изображения , которые вы увидите. В большинство процессоров уже встроена графическая карта, поэтому вам не о чем беспокоиться, если вы не собираете свой собственный компьютер.

Если вы собираете свой собственный компьютер или хотите заменить тот, который входит в стандартную комплектацию, возможно, вы захотите купить компьютер с низким энергопотреблением. Если вы геймер или хотите добавить несколько мониторов, вы можете выбрать вариант с низким энергопотреблением.

Вы должны знать, что графические процессоры являются одними из самых дорогих дополнений к вашему компьютеру. Вы захотите приобрести тот, который соответствует вашим потребностям. Вам нужно будет подумать о нескольких различных аспектах карты, в том числе:

  • Память
  • Космос и охлаждение
  • Шейдерные ядра
  • Пропускная способность
  • Тактовая частота

1.Память

Многие видеокарты будут поставляться с где-то от 2 до 12 гигабайт видеопамяти , чего должно быть достаточно. Вы никогда не ошибетесь, если получите больше памяти, поэтому выбирайте больше, если вы застряли между двумя картами. Некоторые люди скажут вам, что это не имеет значения, но они ошибаются.

Память видеокарты имеет операции сглаживания , которые помогают удалить неровные края на изображениях во время игры и помогают придать изображениям более реалистичный вид.Это то, чего хочет большинство людей, так что вы тоже должны это изучить. Видеопамять также позволит вам играть в игры с более высоким разрешением .

2. Пространство и охлаждение

Как упоминалось ранее, графические процессоры выделяют тепло . Графические процессоры с низким энергопотреблением имеют более низкие значения TDP. Если вы приобретете видеокарту с меньшим энергопотреблением, вам потребуется меньше или менее мощных вентиляторов и, возможно, не потребуется внешняя система охлаждения. Вам следует приобрести видеокарту с низким энергопотреблением , если у вас маленькая башня, потому что вы просто не можете уместить ее в корпус.

3. Шейдерные ядра

На пропускную способность влияют шейдерные ядра в графическом процессоре. Это становится довольно сложным, потому что Nvidia и AMD фактически называют шейдерные ядра разными вещами. Вы увидите «ядра CUDA» от Nvidia и «потоковые процессоры» от AMD.

Шейдерные ядра помогают улучшить внешний вид графики, регулируя вариации света и тени для 3D-объектов. Чем больше ядер шейдеров, тем лучше изображение и быстрее обрабатывается .

Некоторые игры будут работать лучше с меньшим количеством шейдерных ядер, а другие — с большим.

4. Пропускная способность

Некоторые люди любят спорить, является ли пропускная способность важной вещью, о которой нужно думать, когда дело доходит до графических процессоров, но это, безусловно, то, что нужно хотя бы рассмотреть.

Пропускная способность — это объем памяти , к которому ваш графический процессор будет иметь доступ в любое время.

Когда у графического процессора больше пропускной способности, данные передаются в шейдерные ядра с большей скоростью. Графика будет менее четкой, может быть нестабильной, прерывистой или просто двигаться очень медленно.Это может быть очень вредным для вашего игрового процесса .

Чтобы определить, какая пропускная способность вам нужна от видеокарты с низким энергопотреблением , вам нужно будет рассмотреть две разные вещи:

  • Тактовая частота видеокарты
    • Измеряется в МГц и определяет задержку, задержку и частоту кадров.
  • Ширина шины видеокарты
    • Если графический процессор может читать два 64-битных чипа одновременно, он читает 128 бит вместо 64.Это сбивает с толку, потому что ширина шины будет 64 x 2.

В целом найти видеокарту с низким энергопотреблением не составит труда, но вам нужно будет провести некоторое исследование. Начните с карт, которые мы перечислили и о которых говорили, но подумайте также о том, чтобы провести собственное исследование.

Если вы готовы потратить немного больше , у вас будет больше возможностей. Даже в этом случае, возможно, не стоит автоматически покупать опцию с самой высокой ценой только потому, что вы можете.

[Обсуждение] Сколько вам ежегодно обходится энергоемкий GPU в электроэнергии? : buildapc

Некоторое время меня это интересовало, но мне бы очень хотелось, чтобы математика сработала. Я бы сделал это сам, но я недостаточно разбираюсь в этом предмете.

Возьмем гипотетическую, но обычную ситуацию, когда человек выбирает между двумя видеокартами для игровой машины 1080p. В этом примере давайте возьмем GTX 970 и R9 290. Человек предпочитает более высокую производительность GTX 970, и если бы они были той же стоимостью, он бы выбрал его, но это стоит на 70 долларов больше денег, поэтому R9 290 кажется лучше. ценить.Очевидно, что R9 290 потребляет больше энергии, но достаточно ли этого, чтобы компенсировать более низкую стоимость и уменьшить его стоимость?

Предположим, что R9 290 потребляет под нагрузкой на 80-100 Вт больше, чем GTX 970 … что примерно соответствует показателям тестов.

Давайте установим некоторые константы, чтобы упростить задачу:

  • Все остальное в его сборке довольно стандартно для современной игровой машины Intel. Он использует i5-4460, 8 ГБ оперативной памяти, один жесткий диск, один SSD и некоторое количество корпусных вентиляторов.Согласно pcpartpicker, эти другие части будут потреблять мощность 44–188 Вт: http://pcpartpicker.com/parts/partlist/

  • Он уже купил сертифицированный золотой блок питания мощностью 650 Вт. Он знает, что это больше, чем ему нужно, но это было хорошо продано.

  • Его электричество стоит 0,10 доллара за кВтч

  • Он проводит 4 часа в день за играми.

Насколько вырастет его ежемесячный счет за электроэнергию из-за дополнительной потребляемой энергии?

Была еще пара переменных, которые меня интересовали по поводу блока питания:

  • Потребляют ли блоки с более высокой мощностью больше энергии, даже если она не нужна? Или они просто остаются при низкой нагрузке?

  • Я знаю, что сертификация демонстрирует эффективность.Означает ли это, что устройство с более низким номиналом потребляет столько же энергии от линии электропередачи, но обеспечивает меньшую мощность для компьютера? Или это означает, что он не может потреблять энергию с самого начала, и он просто действует так, как будто у него более низкая мощность?

Сколько мощности мне нужно для 3070? — MVOrganizing

Сколько мощности мне нужно для 3070?

Сколько ватт для RTX 3070? RTX 3070 на пике потребляет около 200 Вт. Вот почему ваш блок питания должен иметь как минимум 550 Вт, что более чем вдвое превышает пиковую мощность.

Какой блок питания мне нужен для RTX 3070?

650Вт БП

Какой блок питания мне нужен для GTX 1660?

Минимальная рекомендуемая мощность системы от Nvidia для GTX-1660-TI составляет 450 Вт. Указанная потребляемая мощность карты составляет 120 Вт.

Сколько энергии нужно моей видеокарте?

Топовые модели требуют от блока питания от 110 до 270 Вт; Фактически, мощная видеокарта при полной нагрузке требует столько же энергии, сколько и остальные компоненты системы ПК вместе взятые.

Какому графическому процессору не нужен блок питания?

MSI GeForce GTX 1650 Невероятная частота ядра 1860 МГц обеспечивает бесперебойную работу всех ваших игр уровня AAA при высоком разрешении. MSI GeForce GTX 1650 4GT LP OC — это GTX 1650, которую должен купить каждый пользователь с низким энергопотреблением. Это лучшая видеокарта без подключения внешнего питания от БП.

Можете ли вы запустить видеокарту без 6-контактного разъема?

Видеокарта нуждается в дополнительном питании, и нет, без него она не будет работать.

Все ли видеокарты нуждаются в блоке питания?

Ваша видеокарта не будет работать, пока вы не подключите ее к блоку питания. Для большинства видеокарт игрового уровня требуются дополнительные разъемы питания. Ваша видеокарта не будет работать должным образом без надлежащего питания. Фактически, если вы не подключите эти кабели питания PCI-E, ваш компьютер может не загрузиться.

Какой графический процессор самый энергоэффективный?

Самые эффективные графические процессоры представляют собой сочетание графических процессоров AMD Big Navi и карт Nvidia Ampere, а также некоторых чипов Navi и Nvidia Turing первого поколения.AMD претендует на первое место с RX 6800 на базе Navi 21, а Nvidia занимает второе место с RTX 3070.

Как я могу увеличить предел мощности моего графического процессора?

Во-первых, увеличьте предел температуры до максимума и увеличьте предел мощности на 10%. Это даст вам некоторый запас для первого большого шага в разгоне. Теперь переместите ползунок GPU вправо на +50 МГц. Нажмите кнопку ОК (9).

Насколько точен GPU Z?

Да, запустите GPU-Z в фоновом режиме, чтобы получить правильные показания, потому что температура графического процессора быстро снижается после остановки игры или даже после выхода ALT-Tab.Как только вы запустите GPU-Z и игру одновременно, вы увидите «Более высокие темпы».

Сколько энергии потребляет графический процессор в час?

Таким образом, через час компьютер будет использовать 418,9 Вт · ч, если вы используете его в течение 6 часов, это будет 2,51 кВт · ч. Первоначальный ответ: Сколько электроэнергии потребляет игровой ПК? 50 Вт на другие компоненты = всего 400 Вт.

Как работает GPU Z?

TechPowerUp GPU-Z (или просто GPU-Z) — это облегченная утилита, предназначенная для предоставления информации о видеокартах и ​​графических процессорах.Программа отображает спецификации графического процессора (часто сокращенного до GPU) и его памяти; также отображает температуру, частоту ядра, частоту памяти, нагрузку на графический процессор и скорость вращения вентилятора.

Что такое мощность графического процессора?

Вычисления на GPU — это использование GPU (графического процессора) в качестве сопроцессора для ускорения процессоров для научных и инженерных вычислений общего назначения. С точки зрения пользователя, приложение работает быстрее, потому что оно использует массивно-параллельную вычислительную мощность графического процессора для повышения производительности.

Почему графические процессоры такие дорогие?

Тарифы США на импорт Во время правления администрации Трампа были введены новые тарифы на импорт из-за границы, в том числе тариф, предусматривавший 25-процентный налог на видеокарты, импортируемые из Китая. Эта дополнительная стоимость перекладывается на потребителей в США за счет повышения цен.

Должен ли мой графический процессор работать на 99?

да, как бы вы ни старались, графический процессор nvidia обычно работает при 99% загрузке.

Нормально ли для GPU быть на 100%?

Работа графического процессора на 100% — это нормально.Только убедитесь, что температура нормальная.

Анализ эффективности видеокарты, Часть I — Питание — Чипсы и сыр

В то время как большинство энтузиастов стремятся к максимальной производительности любой ценой, некоторые используют эффективность как критерий привлекательности карты. Можно утверждать, что эффективность дизайна — насколько эффективно он использует доступные ему ресурсы — является лучшим показателем для сравнения различных видеокарт, чем чистая производительность, и может предложить интересный взгляд на достоинства и недостатки любого конкретного дизайна. .Хотя эффективность нечеткая, есть общие способы ее измерения, главный из которых — производительность на ватт. С этой целью в этой статье мы проанализируем массовые потребительские видеокарты, начиная с Turing и Vega 20, чтобы увидеть, как каждая карта подходит к конкурентам. Давайте начнем.

Методология

Показателем эффективности, используемым в этой статье, является количество кадров в секунду на ватт, которое можно упростить до кадров на джоуль (или f / J), которые можно представить как количество кадров, которые данный графический процессор может отобразить в среднем с использованием одного джоуля. энергии.

Показатель «Средний FPS» разделен между тремя разрешениями (1080p, 1440p и 2160p) и представляет собой комбинацию двух наборов результатов. Один взят из обзоров GPU TechPowerUp, а другой — из обзора производительности GPU Tom’s Hardware. Среднее геометрическое этих двух результатов затем принимается за окончательное значение FPS для каждой карты при каждом разрешении.

Кроме того, имейте в виду, что большая часть этих данных использует драйверы дня запуска, потому что эти обзоры сделаны со дня запуска. Таким образом, вполне возможно, что по мере развития драйверов производительность одного графического процессора увеличилась по сравнению с другим.Однако наборы данных TechPowerUp и Тома являются лучшими общедоступными наборами данных, которые у нас есть, потому что у нас нет собственных ресурсов для проведения всего этого тестирования.

Используемая метрика энергопотребления также представляет собой среднее геометрическое, основанное на обзорах GPU TechPowerUp и сводном обзоре энергопотребления Tom’s Hardware. Он представляет собой среднее общее энергопотребление карты при типичной игровой нагрузке. Стоит отметить, что это означает приблизительное потребление энергии для эталонных карт или карт с эталонными тактовыми частотами или около них — карты с заводским разгоном, вероятно, будут иметь энергопотребление выше, чем указанные здесь числа.

Чтобы получить окончательное значение эффективности f / J для каждого разрешения, вычисленное среднее значение FPS для данной карты делится на вычисленное среднее энергопотребление. Четыре карты содержат неполные данные и помечены как оценочные, чтобы избежать путаницы.

Игры с разрешением 1080p

Кадров на Джоуль при разрешении 1080p. См. Источники.

Вместо того, чтобы перечислять каждую карту в этой таблице, мы рассмотрим каждую основную архитектуру и обсудим интересные моменты.

Вега 20 (Radeon VII)

Если начать снизу, Radeon VII ужасающе неэффективен — всего 0.456 кадров на Джоуль. К счастью, с увеличением разрешения все становится лучше, хотя плохая Radeon VII никогда не восстанавливается с нижней части диаграммы, когда дело доходит до игр.

Turing (серии RTX 2000 и GTX 1600)

Переходя к RTX Turing, мы на самом деле получаем довольно последовательный набор результатов. Карты Turing RTX колеблются в районе 0,61 кадра на Джоуль, с единственными отклонениями от RTX 2080 Super с 0,567 кадра на Джоуль (TU104 зашел слишком далеко) и RTX 2070 с 0,588 кадра на Джоуль (может быть, плохая отдача на TU106 с полной матрицей? ).Большая часть RTX Turing настолько близка друг к другу, что это также может быть пределом погрешности, но RTX 2080 одерживает техническую победу, имея наибольшее число в 1080p.

Но что интересно, так это GTX Turing. GTX 1660 и GTX 1650 Super сгруппированы вместе с большей частью RTX Turing на уровне около 0,63 кадра на Джоуль, но GTX 1660 Super и Ti находятся в верхней части диаграммы, даже выше самых эффективных карт RDNA1 и наименее эффективных карт RDNA2. GTX 1660 Super идентичен GTX 1660 во всех отношениях, кроме видеопамяти — базовая модель использует GDDR5, а Super refresh использует GDDR6.Очевидно, что у 1660 было узкое место из-за отсутствия пропускной способности, и простая замена VRAM позволила модели Super достичь 0,674 кадра на Джоуль. Модель Ti находится в аналогичном положении, с ее дополнительными шейдерами и немного более низкими тактовыми частотами, что позволяет ей превосходить производительность на ватт модели Super с 0,701 кадра на Джоуль. Таким образом, GTX 1660 Ti — самый эффективный графический процессор Turing с разрешением 1080p и одна из самых эффективных видеокарт в целом!

RDNA1 (серия RX 5000)

Далее идет RDNA1 с результатами для карт на базе Navi 10 и Navi 14.RX 5500 XT работает особенно плохо — всего 0,549 кадра на Джоуль, что может быть связано с архитектурными недостатками, когда RDNA1 не очень хорошо масштабируется, или с картой, получающей только плохие ячейки матрицы Navi 14. RX 5700 XT также не очень хорош, хотя это явно связано с тем, что карта слишком далеко продвинута на складе. Интересно, что RX 5600 XT — это , а не , самая эффективная карта RDNA1 здесь, хотя она неплохо справляется с 0,652 кадра на Джоуль — корона для RDNA1 фактически достается RX 5700 с 0.671 кадр на Джоуль, сразу за GTX 1660 Super. Однако, учитывая сбой VBIOS с запуском RX 5600 XT, на практике некоторые варианты карты могут быть более эффективными, чем другие. В любом случае, я уступлю RX 5700 в разрешении 1080p RDNA1.

Ампер (серия RTX 3000)

Что касается Ampere, то диаграмма делится пополам по понятной причине: GDDR6X. Карты GDDR6X охватывают нижнюю часть диаграммы при разрешении 1080p, а RTX 3080 Ti оценивается как третья наименее эффективная карта в целом с оценкой всего 0.566 кадров на Джоуль, а RTX 3080 — самая эффективная карта GDDR6X при 0,586 кадрах на Джоуль. Ясно, что это не лучшие результаты, но как насчет карт GDDR6? Что ж, как только меняется тип памяти, эффективность Ampere взлетает до небес. Наименее эффективная карта GDDR6 Ampere при 1080p — это RTX 3060 с 0,657 кадра на Джоуль, но наиболее эффективна RTX 3070 с 0,738 кадров на Джоуль, лучший результат, который мы видели до сих пор (с RTX 3060 Ti не далеко позади). Очевидно, что Ampere может быть чрезвычайно конкурентоспособным по эффективности, если его конфигурация позволяет это.

RDNA2 (серия RX 6000)

Наконец, мы подошли к RDNA2, первой за последние годы действительно конкурентоспособной микроархитектуре графических процессоров AMD и самой эффективной группе в этой диаграмме. RDNA2 — это огромный скачок в эффективности по сравнению с RDNA1 — наименее эффективная карта RDNA2 с разрешением 1080p, RX 6800 XT с 0,665 кадра на Джоуль, лишь немного менее эффективна, чем RX 5700 при том же разрешении. RX 6900 XT на практике демонстрирует очень схожую эффективность, несмотря на идентичный TBP, а RX 6700 XT эффективно соответствует самой эффективной карте Тьюринга при 0.702 кадра на Джоуль. Вторая лучшая карта RDNA2 (и карта в целом) с разрешением 1080p — это RX 6800 с показателем 0,757 кадра на Джоуль, с доступом ко всей кэш-памяти и пропускной способности памяти Navi 21, а также с более низкими тактовыми частотами и меньшим количеством вычислительных блоков.

Однако самой эффективной видеокартой с разрешением 1080p является недавно выпущенная RX 6600 XT. В отличие от RX 6700 XT, который значительно превзошел самые эффективные тактовые частоты, RX 6600 XT сохраняет низкий профиль мощности, сохраняя при этом отличную производительность с приоритетом 0.798 кадров на Джоуль. Есть несколько конструктивных решений, которые способствуют этому, вероятно, сокращение линий PCIe (только x8 на Navi 23) вместе с крошечной 128-битной шиной памяти. Посмотрим, сохранит ли он лидерство в более высоких разрешениях.

Игры при 1440p

Кадров на Джоуль при 1440p. См. Источники.

При разрешении 1440p стек несколько сдвигается, некоторые карты становятся ограниченными по полосе пропускания и опускаются на дно. Сильнее всего страдают карты с меньшей пропускной способностью; Карты на базе Navi 14 и TU116 рассыпаются, в то время как Navi 10, Navi 23 и RTX 2060 получают достойные удары.Как правило, кажется, что чем больше шейдеров на карте, тем лучше она может обрабатывать более высокие разрешения (что неудивительно). В случае RX 6600 XT может показаться, что его 32 МБ кэш-памяти L3 недостаточно, чтобы компенсировать его крошечную шину памяти при разрешениях выше 1080p, хотя он по-прежнему остается одним из лучших в таблице. несмотря на.

Интересно, что как только разрешение увеличивается, производительность GDDR6X Ampere на ватт начинает выглядеть намного привлекательнее.В то время как эти карты были намного ближе к нижней части стека при 1080p, GDDR6X Ampere перескакивает в центр стека при 1440p, а RTX 3080 почти достигает производительности на ватт миниатюрного RTX 3060 (хотя ни одна из них не достигает высот. RTX 3070 и 3060 Ti). Нам кажется очевидным, что карты GDDR6X более ограничены загрузкой шейдеров, чем что-либо еще, из-за их огромного количества FPU, которое не позволяет им полностью раскрыть свой потенциал при более низких разрешениях, но позволяет им сиять в более высоких разрешениях.

Что касается RDNA2, карты на базе Navi 21 неплохо справляются с разрешением 1440p, причем все три находятся ближе к вершине таблицы. Кажется, что их огромного кэша L3 более чем достаточно, чтобы поддерживать почти максимальную производительность при таком разрешении. Между тем, RX 6700 XT сохраняет свои позиции благодаря достаточному количеству ресурсов кэша L3 объемом 96 МБ. Из-за того, что RX 6600 XT сильно упала и уступила свое первое место, RX 6800 сместилась на одну позицию вверх и стала самой эффективной видеокартой с разрешением 1440p в списке.

Игры при 2160p

Кадров на Джоуль при 2160p. См. Источники.

Наконец, при разрешении 2160p (или «4K») мы видим, что карты с ограниченной пропускной способностью падают как камни. GTX 1650 Super и RX 6600 XT пострадали сильнее всего, причем эффективность последнего даже ниже, чем у RTX 3080. RX 5500 XT также значительно упал, вплотную приблизившись к последнему месту в таблице — хотя Radeon VII похоже, полон решимости сохранить свое место. В целом, как мы видели в 1440p, кажется, что карты с меньшим количеством шейдерных ядер сильнее страдают от увеличения разрешения.

Следует отметить, что RX 6600 XT — единственная карта RDNA2, которая сильно пострадала от перехода на 2160p. RX 6700 XT имеет в основном средний удар по эффективности, в то время как карты Navi 21 фактически масштабируются соответственно их количеству шейдеров, что указывает на отсутствие каких-либо значительных ограничений пропускной способности при этом разрешении. Учитывая эти данные, казалось бы, что AMD выбрала разумный размер кэша L3 для этих кристаллов с учетом их целевого разрешения. RX 6900 XT на самом деле является самой масштабируемой картой в этой таблице, кроме…

GDDR6X Ampere наконец-то раздвигает ноги.Хотя использование шейдеров явно было проблемой при предыдущих разрешениях, 2160p позволяет GA104 и GA102 полностью использовать свою пропускную способность, выводя RTX 3090 и RTX 3080 Ti на вершину таблицы с впечатляюще маленьким штрафом в 35% по сравнению с 1440p. Даже RTX 3070 Ti на базе GA104 удается превзойти RX 5700. Теперь, когда шейдерные ядра не просто бездействуют на полных тактовых частотах, мы видим гораздо более эффективное использование энергии.

Итак, при 2160p Ampere намного более конкурентоспособен с RDNA2 по эффективности игровой мощности.Хотя это можно легко предположить, учитывая данные, доступные из других источников, приятно продемонстрировать, как это обстоит дело. Тем не менее, несмотря на это, RX 6800 по-прежнему находится на вершине таблицы, за его плечами две победы.

Заключение

Итак, с учетом всего сказанного, что мы узнали? Если бы я мог почерпнуть что-нибудь из собранных мной данных, так это то, что энергоэффективность не так проста, как можно было бы предположить. Видеокарты — сложные творения, и у каждой отдельной SKU есть свои сильные и слабые стороны.Эффективность меняется в зависимости от разрешения и зависит от рабочей нагрузки. Даже представленные здесь данные, несмотря на все мои усилия, можно рассматривать как чрезмерное упрощение.

Тем не менее, мы можем использовать эти данные, чтобы получить общее представление о том, как энергоэффективность проявляется в зависимости от видеокарты. Например, мы можем эмпирически проверить утверждения AMD о том, что RDNA2 более эффективен, чем RDNA1, и что RDNA1 более эффективен, чем Vega 20. Кроме того, мы можем показать, что Ampere не является неэффективной архитектурой как таковой — RTX 3070 и RTX 3060 Ti делают это. например, очень хорошо с точки зрения энергоэффективности — но использование GDDR6X на высоком уровне приводит к значительному снижению эффективности при более низких разрешениях.Конечно, это не единственные выводы, которые мы можем сделать из этих данных, и вы можете сделать свой собственный.

В части II мы рассмотрим другой показатель эффективности, который не так часто обсуждается, — пропускную способность .

Источники и примечания

Данные, используемые в этой статье, были получены из нескольких источников, в том числе:

Энергопотребление, измеренное Tom’s Hardware для RTX 3080 Ti, казалось ошибочным, оно показывалось лишь немного больше, чем RTX 3070 Ti, поэтому показатель энергопотребления RTX 3080 Ti для набора данных Tom был экстраполирован на основе других карт в линейке Ampere с использованием матрица GA102.

RTX 3060, RTX 3070 Ti, RTX 3080 Ti и RX 6700 XT не имели записей в обзоре тестов Tom’s Hardware, поэтому их средние данные FPS были экстраполированы из данных TechPowerUp и остальных данных Tom’s Hardware.

Особая благодарность TechPowerUp и Tom’s Hardware за предоставление общедоступных наборов данных как среднего FPS, так и энергопотребления, а также остальным сотрудникам Chips and Cheese за участие в дополнительном анализе.

И большое спасибо Fritzchens Fritz за изображение баннера и за всю его тяжелую работу.

Похожие сообщения

(PDF) Энергопотребление графических процессоров с точки зрения программного обеспечения

3

В этой статье мы рассматриваем графический процессор, совместимый со стандартом DirectX 10

, который обеспечивает унифицированную архитектуру, в которой вершинные и пиксельные шейдеры используют один и тот же набор инструкций и обработку

единицы. Чтобы эффективно использовать параллелизм данных

, графические процессоры включают в себя большое количество реплицированных копий этих блоков

, работающих в режиме одной инструкции с множеством данных (SIMD).Графические процессоры обрабатывают

инструкций с высокой задержкой, таких как доступ к памяти, перекрытый тысячами потоков

.

Унифицированная архитектура, предложенная стандартом DirectX 10, была реализована в аппаратном обеспечении с момента выпуска NVIDIA GeForce 8. Пример

таких архитектур показан на рисунке 1. Графический процессор имеет собственную память, которая

обычно на порядок быстрее системной памяти. Графический процессор

показан в виде набора SIMD-блоков.Каждый блок SIMD состоит из множества

обрабатывающих элементов (PE). В каждом тактовом цикле все PE в блоке выполняют

одну и ту же последовательность команд, но работают с разными данными. Эти блоки SIMD

включают в себя различные типы памяти, такие как регистры, установленные для каждого PE, блоки памяти

, совместно используемые всеми PE в блоке SIMD, постоянную память и память текстур

только для чтения. Кроме того, PE могут также читать или записывать глобальную память

, доступную на графической карте.

GeForce 8 имеет общую постоянную память, доступную только в широковещательном режиме

, глобальную память, доступную с объединением (с дополнительными ограничениями выравнивания

напряжений), и общую память, которая позволяет объединять, широковещательную и другие патчи.

крачек. Доступы к памяти, которые не соответствуют этим шаблонам, заменяются необходимым количеством последовательных обращений

, что приводит к снижению производительности. Например,

GeForce 8800 Ultra встраивает 768 МБ глобальной памяти с эталонной пропускной способностью

, равной 103 ГБ / с, что более чем в 10 раз превышает доступную пропускную способность между

процессором и системной памятью.Блоки SIMD объединяют различные вычислительные блоки

для реализации функций, предлагаемых шейдерами: общие блоки вычислений

со встроенными накопителями умножения, текстурирования и фильтра-

блоков, специальный блок для оценки математических функций (например, синусоидальный , косинус,

обратный и квадратный корень, обратный), единицы растеризации, единицы отсечения по оси Z и единицы интерполяции

. Эти блоки могут обрабатывать целочисленные арифметические операции и арифметические операции с плавающей точкой

, и нет никаких накладных расходов, связанных с смешиванием обеих операций.Каждый блок SIMD

в GeForce 8 может выполнять деформацию сложения 32 плавающих точек,

умножений, умножения и сложения или целочисленного сложения, побитовые операции, сравнения

, минимум или максимум 2 числа в 4 тактовых цикла. Поскольку аппаратное обеспечение не поддерживает 32-битное целочисленное умножение

, оценка такой операции требует

16 тактов для деформации. Например, GeForce 8800 GTX, изображенная на

Рис. 1, имеет 16 блоков SIMD, и каждый блок SIMD состоит из 8 PE и

2 функциональных оценочных блока.

3 Измерение и тесты Описание

Мы измеряем энергопотребление некоторых графических карт Nvidia, поддерживающих API

CUDA, описанных в таблице 1. Сюда входит карта Tesla, используемая для научных вычислений

, графическая карта высокого класса с двумя графическими процессорами 9800 GX2 и GT200.

hal-00348672, версия 1 — 5 января 2009 г.

Будет ли видеокарта работать при минимальном энергопотреблении? | Small Business

Многие бизнес-ориентированные компьютеры поставляются без мощных графических систем.В конце концов, вам не нужно много мощности для отображения почтового клиента или электронной таблицы. Однако, если вам нужно выполнять редактирование видео, компьютерное проектирование, сложные инженерные работы или архитектурную визуализацию, вам понадобится дополнительная мощность, которую обеспечивает графическая карта. Вы можете столкнуться со вторым ограничением бизнес-ориентированных компьютеров — относительно невысокой мощностью блоков питания.

Мощность видеокарты

Видеокарта похожа на компьютер в том, что она использует энергию для управления данными.В отличие от компьютера, который является устройством общего назначения, чип видеокарты оптимизирован для одной цели — создания изображений. Видеокарты обычно потребляют много энергии, причем многие из них используют мощность более 75 Вт, доступную через слоты для карт PCI Express x16.

Типовые блоки питания

Глядя на несколько высококлассных бизнес-ПК, можно заметить общую нить — у обычных настольных компьютеров нет мощных блоков питания. Например, Dell поставляет Optiplex 3010 с блоками питания мощностью от 240 до 265 Вт.Lenovo ThinkCentre Edge 71 поставляется с блоком питания на 180 Вт. Для сравнения, рабочая станция бизнес-класса, такая как HP Z420, имеет блок питания мощностью 600 Вт.

Компьютерные силовые нагрузки

Энергия, необходимая вашему компьютеру, может сильно различаться в зависимости от типа используемых компонентов. Например, компьютер с материнской платой, одной картой RAM, одним вентилятором, оптическим приводом, жестким диском и процессором должен потреблять не менее 183 Вт. Однако, поскольку эффективность большинства источников питания и близко не достигает 100 процентов, рекомендуется округлить потребляемую мощность от 30 до 50 процентов, в результате чего реальная потребляемая мощность составляет примерно от 235 до 275 Вт.Имея это в виду, многие настольные компьютеры для бизнеса не обладают достаточной мощностью, чтобы надежно управлять даже небольшой видеокартой.

Обновление блока питания

Если вам нужно установить видеокарту и у вас нет рабочей станции с источником питания высокой мощности, вам, вероятно, потребуется заменить блок питания компьютера на блок питания большей мощности.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *