Зміст

  • Теоретична частина: особливості архітектури
  • Архітектурні особливості
  • Особливості відеокарти
  • Характеристики референс-карти
  • Пам’ять
  • Особливості карти та порівняння з попереднім поколінням
  • Охолодження і нагрівання
  • Шум
  • Комплект поставки та упаковка
  • Синтетичні тести
  • Висновки з теоретичної частини та синтетичних тестів
  • Ігрові тести
  • Конфігурація тестового стенду
  • Список інструментів тестування
  • Рейтинг iXBT.com
  • Рейтинг корисності
  • Висновки

Довідкові матеріали:

  • Керівництво покупця ігрової відеокарти
  • Довідник з AMD Radeon HD 7xxx/Rx
  • Довідник з Nvidia GeForce GTX 6xx/7xx/9xx/1xxx
  • Можливості обробки відеопотоків Full HD

Теоретична частина: особливості архітектури

Разом з топової відеокартою моделі GeForce RTX 2080 Ti, яку ми щойно розглянули, компанія Nvidia одночасно анонсувала та менш потужні варіанти: RTX 2080 і RTX 2070, які традиційно викликають навіть більший інтерес публіки, порівняно з найдорожчою моделлю, з-за кращого співвідношення ціни і продуктивності. Молодшу RTX 2070 доведеться ще почекати якийсь час, а середню ми зараз і розглянемо.

Нагадаємо, що компанія анонсувала свої ігрові рішення лінійки GeForce RTX, засновані на новій архітектурі Тьюринга, ще в серпні. У лінійці GeForce RTX було оголошено відразу три моделі: RTX 2070, RTX 2080 і RTX 2080 Ti, що базуються на трьох графічних процесорах: TU106, TU104 і TU102. Освоєння нового техпроцесу 7 нм все ще не завершено, якщо говорити про масове виробництво таких складних і високопродуктивних чіпів, і що використовується при виробництві графічних процесорів лінійки GeForce RTX техпроцес 12 нм FinFET за характеристиками лише трохи краще 16-нанометрового, відомого по попередньому поколінню Pascal. Тому всі чіпи Тьюринга вийшли досить великими за розміром і дорогими у виробництві, а відеокарти на їх основі відрізняються досить високою ціною.

Основними відмітними особливостями нового сімейства RTX стала підтримка апаратно прискореної трасування променів, що дозволяє використовувати фізично коректні розрахунки променів світла, на відміну від растеризації, лише імітує їх поширення. Для того, щоб не розповідати про основи та особливості трасування в черговий раз, пропонуємо прочитати велику і докладну статтю про неї.

Анонс технології Nvidia RTX і апаратно підтримують її GPU дав розробникам можливість почати впровадження алгоритмів, що використовують трасування променів. З часом вона повністю замінить растеризацію, але це відбудеться поступово. А в перші роки використання трасування передбачається виключно в змішаному вигляді, з поєднанням растеризації і трасування променів для візуалізації деяких ефектів, або занадто складні або неможливих при растеризації.

Крім спеціалізованих ядер для трасування променів, у складі нових GPU є ще апаратні блоки для прискорення завдань глибокого навчання — тензорні ядра, які дісталися Тьюринга у спадок від обчислювальної архітектури Volta. Вони можуть бути корисні як у широкому ряді неграфічних завдань, так і в ігрових застосуваннях: для шумозаглушення результату трасування променів з малою кількістю семплів на піксель, для хитрого повноекранного згладжування методом DLSS, про який ми писали в статті за RTX 2080 Ti, і багато іншого, про який ми поки ще навіть не здогадуємося.

Сьогодні ми спробуємо розібратися в тому, наскільки продуктивна і цікава середня модель лінійки — GeForce RTX 2080 у порівнянні зі старшою модифікацією Ti і рішеннями попереднього покоління. Оскільки розглянута модель відеокарти компанії Nvidia заснована на графічному процесорі архітектури Тьюринга, яка має багато спільного з попередніми архітектурами Pascal і Volta, то перед прочитанням цього матеріалу ми радимо ознайомитися з нашими попередніми статтями по цій темі:

  • [19.09.18] Nvidia GeForce RTX 2080 Ti — огляд флагмана 3D-графіки 2018 року
  • [14.09.18] Ігрові відеокарти Nvidia GeForce RTX — перші думки і враження
  • [06.06.17] Nvidia Volta — нова обчислювальна архітектура
  • [09.03.17] GeForce GTX 1080 Ti — новий король ігровий 3D-графіки
  • [17.05.16] GeForce GTX 1080 — новий лідер ігровий 3D-графіки на ПК
Графічний прискорювач GeForce RTX 2080
Кодове ім’я чіпа TU104
Технологія виробництва 12 нм FinFET
Кількість транзисторів 13,6 млрд. (у TU102 — 18,6 млрд.)
Площа ядра 545 мм2 (у TU102 — 754 мм2)
Архітектура уніфікована, з масивом процесорів для потокової обробки будь-яких видів даних: вершин, пікселів і ін.
Апаратна підтримка DirectX DirectX 12, з підтримкою рівня можливостей Feature Level 12_1
Шина пам’яті 256-бітна: 8 незалежних 32-бітних контролерів пам’яті з підтримкою пам’яті типу GDDR6
Частота графічного процесора 1515 (1710/1800) МГц
Обчислювальні блоки 46 (48 фізично наявних у GPU) потокових мультипроцесорів, що включають 2944 (з 3072) CUDA-ядер для цілочисельних розрахунків INT32 і обчислень з плаваючою комою FP16/FP32
Тензорні блоки 368 (384) тензорних ядер для матричних обчислень INT4/INT8/FP16/FP32
Блоки трасування променів 46 (48) RT-ядер для розрахунку перетину променів з трикутниками і обмежують обсягами BVH
Блоки текстурування 184 (з 192) блоку текстурної адресації і фільтрації з підтримкою FP16/FP32-компонент і підтримкою трилинейної і анізотропної фільтрації для всіх текстурних форматів
Блоки растрових операцій (ROP) 8 широких блоків ROP (64 пікселів) з підтримкою різних режимів згладжування, в тому числі програмованих і при FP16/FP32-форматах буфера кадру
Підтримка моніторів підтримка підключення по інтерфейсу HDMI 2.0 b і DisplayPort 1.4 a
Специфікації референсною відеокарти GeForce RTX 2080
Частота ядра 1515 (1710/1800) МГц
Кількість універсальних процесорів 2944
Кількість текстурних блоків 184
Кількість блоків блендінгу 64
Ефективна частота пам’яті 14 ГГц
Тип пам’яті GDDR6
Шина пам’яті 256-біт
Об’єм пам’яті 8 ГБ
Пропускна здатність пам’яті 448 ГБ/с
Обчислювальна продуктивність (FP16/FP32) до 21,2/10,6 терафлопс
Продуктивність трасування променів 8 гигалучей/с
Теоретична максимальна швидкість зафарбування 109-115 гігапікселів/с
Теоретична швидкість вибірки текстур 315-331 гигатекселей/с
Шина PCI Express 3.0
Роз’єми один HDMI та три DisplayPort
Енергоспоживання до 215/225 Вт
Додаткове живлення один 8-контактний і один 6-контактний роз’єми
Число слотів, займаних в системному корпусі 2
Рекомендована ціна $699/$799 або 63990 руб. (founder’s Edition)

Як це стало звичним для останніх колекцій відеокарт Nvidia, лінійка GeForce RTX пропонує спеціальні продукти самої компанії — так звані founder’s Edition. Цього разу при більш високій вартості ($799 проти $699 для ринку США — ціни без урахування податків) вони володіють і більш привабливими характеристиками. Пристойний фабричний розгін у таких відеокарт є спочатку, а також відеокарти founder’s Edition повинні бути надійними і виглядають солідно завдяки відмінному дизайну і грамотно підібраним матеріалами. А щоб у надійності роботи FE не було сумнівів, кожна відеокарта тестується на стабільність і забезпечується трирічною гарантією.

У відеокартах GeForce RTX founder’s Edition застосовується система охолодження з випарною камерою на всю довжину друкованої плати і з двома вентиляторами для більш ефективного охолодження (порівняно з одним вентилятором в попередніх версіях FE). Довга випарна камера і великий двослотовий алюмінієвий радіатор забезпечують досить велику площу розсіювання тепла, а тихі вентилятори відводять гаряче повітря в різні сторони, а не тільки назовні корпусу.

Система харчування в GeForce RTX 2080 founder’s Edition застосовується досить серйозна: 8-фазна схема iMON DrMOS (навіть у GTX 1080 Ti founder’s Edition була лише 7-фазна dual-FET), що підтримує нову динамічну систему управління живленням з більш тонким контролем, поліпшує розгінні можливості відеокарти (про подробиці, пов’язані з розгоном, ви можете прочитати в огляді RTX 2080 Ti). Для живлення мікросхем високопродуктивної GDDR6-пам’яті встановлена окрема двофазна схема.

Також FE-відеокарти Nvidia відрізняються дещо більшим рівнем енергоспоживання, що обумовлено підвищеними тактовими частотами GPU. В цей раз партнерам компанії буде не так вже просто запропонувати ще більш привабливі варіанти з фабричним розгоном, доведеться робити екстремальні варіанти з трьома роз’ємами додаткового живлення і посиленими системами охолодження.

Архітектурні особливості

У середній моделі відеокарти GeForce RTX 2080 застосовується версія графічного процесору TU104. Цей GPU має площу 545 мм2 (порівняйте з 754 мм2 у TU102 і 610 мм2 у топового чіпа сімейства Pascal — GP100) і містить 13,6 млрд. транзисторів, у порівнянні з 18,6 млрд. транзисторів у TU102 і 15,3 млрд. транзисторів у GP100. Так як нові GPU ускладнилися через появу апаратних блоків, яких не було в Pascal, а техпроцеси застосовуються схожі, то за площею всі нові чіпи збільшилися, якщо порівнювати схожі за найменуванням моделі.

Повний чіп TU104 містить шість кластери Graphics Processing Cluster (GPC), кожен з яких містить чотири кластери Texture Processing Cluster (TPC), що складаються з одного движка PolyMorph Engine і пари мультипроцесорів SM. Відповідно, кожен SM складається з: 64 CUDA-ядер, 256 КБ регістрової пам’яті і 96 КБ конфігурованих L1-кеш і пам’яті, а також чотирьох блоків текстурування TMU. Для потреб апаратної трасування променів кожний мультипроцесор SM має також і по одному RT-ядра. Всього в повному чіпі виходить 48 мультипроцесорів SM, стільки ж RT-ядер, 3072 CUDA-ядер та 384 тензорних ядра.

Але це характеристики саме повного чіпа TU104, різні модифікації якого використовуються в моделях: GeForce RTX 2080, Tesla T4 і Quadro RTX 5000. Зокрема, розглянута сьогодні модель GeForce RTX 2080 заснована на спрощеній версії чіпа з двома апаратно відключеними блоками SM. Відповідно, активними в ній залишилися: 2944 CUDA-ядер, 46 RT-ядра, 368 тензорних ядер і 184 блоки текстурування TMU.

А ось підсистема пам’яті, GeForce RTX 2080 повноцінна, вона містить вісім 32-бітних контролерів пам’яті (256-біт в цілому), за допомогою яких GPU має доступ до 8 ГБ GDDR6-пам’яті, що працює на ефективній частоті до 14 ГГц, що забезпечує пропускну здатність у дуже пристойні 448 ГБ/с в підсумку. До кожного контролера пам’яті прив’язані за вісім блоків ROP і по 512 КБ кеш-пам’яті другого рівня. Тобто, всього в чіпі 64 блоки ROP і 4 МБ L2-кеша.

Що стосується тактових частот нового графічного процесора, то турбо-частота GPU референсної карти дорівнює 1710 МГц. Як і старша модель GeForce RTX 2080 Ti, пропонована компанією зі свого сайту відеокарта RTX 2080 founder’s Edition має заводський розгін до 1800 МГц — на 90 МГц більше, ніж у референсних варіантів (хоча що таке референсні карти тепер — питання цікаве).

За будовою мультипроцесорів SM всі чіпи нової архітектури Тьюринга схожі один з одним, у них з’явилися нові типи обчислювальних блоків: тензорні ядра і ядра прискорення трасування променів, а також були ускладнені самі CUDA-ядер, у яких з’явилася можливість одночасного виконання цілочисельних обчислень і операцій з плаваючою комою. Про всіх архітектурних зміни ми дуже детально повідомляли в огляді GeForce RTX 2080 Ti, і дуже заохочуємо з ним ознайомитися.

Архітектурні зміни в обчислювальних блоках призвели до 50%-ного поліпшення продуктивності шейдерних процесорів при однаковій тактовій частоті в іграх в середньому. Також були покращені технології стиснення інформації без втрат, архітектура Тьюринга підтримує нові техніки компресії, до 50% більш ефективні в порівнянні з алгоритмами в сімействі чіпів Pascal. Разом з застосуванням нового типу пам’яті GDDR6 це дає пристойний приріст ефективної ПСП.

Це ще далеко не весь список нововведень і поліпшень в Тьюринга. Багато зміни в новій архітектурі націлені на майбутнє, начебто mesh shading — нових шейдерів, відповідальних за всю роботу над геометрією, вершинами, теселяцією і т. д., що дозволяють значно знизити залежність від потужності CPU і у багато разів збільшити кількість об’єктів в сцені. Або взяти Variable Rate Shading (VRS) — шейдинг з перемінним кількістю семплів, що дозволяє оптимізувати рендеринг за допомогою змінної кількості семплів зафарбування, спрощуючи шейдинг лише там, де це виправдано.

Відзначимо впровадження високопродуктивного інтерфейсу NVLink другої версії, який використовується для об’єднання GPU в тому числі і для роботи над зображенням в режимі SLI. Топовий чіп TU102 має два порти NVLink другого покоління, а в TU104 є лише один такий порт, але його пропускної спроможності до 50 ГБ/с вистачить для передачі кадрового буфера з роздільною здатністю 8К в режимі багаточіпового візуалізації AFR від одного GPU до іншого. Така швидкість дозволяє використовувати локальну відеопам’ять сусіднього GPU як свою власну повністю автоматично, без складного програмування.

Графічні процесори сімейства Тьюринга також містять новий блок виводу інформації, підтримує дисплеї з високою роздільною здатністю, з HDR і високою частотою оновлення. Зокрема, GeForce RTX мають порти DisplayPort 1.4 a, дозволяють вивести інформацію на 8K-монітор з частотою оновлення 60 Гц з підтримкою технології VESA Display Stream Compression (DSC) 1.2, що забезпечує високу ступінь стиснення.

Плати founder’s Edition містять три таких виходу DisplayPort 1.4 a, один роз’єм HDMI 2.0 b (з підтримкою HDCP 2.2) і один VirtualLink (USB Type-C), призначений для майбутніх шоломів віртуальної реальності. Це новий стандарт підключення VR-шоломів, що забезпечує передачу харчування і високу пропускну здатність по роз’єму USB-C.

Всі рішення сімейства Тьюринга підтримують два 8K-дисплея при 60 Гц (потрібно по одному кабелю на кожен), таке ж дозвіл також можна отримати при підключенні через встановлений USB-C. Крім цього, всі Тьюринга підтримують повноцінний HDR в конвеєрі виведення інформації, включаючи tone mapping для різних моніторів — зі стандартним і розширеним динамічним діапазоном.

Нові GPU не містять покращений кодіровщік відео NVEnc, додає підтримку стиснення даних у форматі H. 265 (HEVC) при вирішенні 8K і 30 FPS. Такий блок NVEnc знижує вимоги до смуги пропускання до 25% при форматі HEVC і до 15% при форматі H. 264. Також був оновлений і декодер відеоданих NVDec, отримав підтримку декодування даних у форматі HEVC YUV444 10-біт/12-біт HDR при 30 FPS, у форматі H. 264 при 8K-дозволі і у форматі VP9 з 10-біт/12-біт даних.

Про всіх інших нових можливостях сімейства Тьюринга читайте в огляді GeForce RTX 2080 Ti, так як їх занадто багато, щоб повторюватися. Чого варті тільки ядра для апаратного прискорення трасування променів і тензорні ядра для прискорення алгоритмів штучного інтелекту, що пропонують користувачам абсолютно нові можливості.

Особливості відеокарти

Об’єкт дослідження: прискорювач тривимірної графіки (відеокарта) Nvidia GeForce RTX 2080 8 ГБ 256-бітної GDDR6 (founder’s Edition)


Відомості про виробника: Компанія Nvidia Corporation (торгова марка Nvidia) заснована в 1993 році в США.Штаб-квартира в Санта-Клара (Каліфорнія). Розробляє графічні процесори, технології. До 1999 року основний маркою була Riva (Riva 128/TNT/TNT2), з 1999 року і по теперішній час — GeForce. У 2000 році були придбані активи 3dfx Interactive, після чого торгові марки 3dfx/Voodoo перейшли до Nvidia. Свого виробництва немає. Загальна чисельність працівників (включаючи регіональні офіси) — близько 5000 чоловік.

Характеристики референс-карти

Nvidia GeForce RTX 2080 8 ГБ 256-бітної GDDR6
Параметр
Номінальне значення (референс)
GPU

Інтерфейс

Частота роботи GPU (ROPs), МГц

Частота роботи пам’яті (фізична (ефективна)), МГц

Ширина шини обміну з пам’яттю, біт

Кількість обчислювальних блоків GPU

Кількість операцій (ALU) в блоці

Сумарна кількість блоків ALU (CUDA)

Число блоків текстурування (BLF/TLF/ANIS)

Кількість блоків растеризації (ROP)

Число блоків Ray Tracing

Число тензорних блоків

Розміри, мм

Кількість слотів в системному блоці, займані відеокартою

Колір текстоліту

Пікове енергоспоживання в 3D, Вт

Енергоспоживання в режимі 2D, Вт

Енергоспоживання в режимі «сну», Вт

Рівень шуму в 3D (максимальне навантаження), дБА

Рівень шуму в 2D (перегляд відео), дБА

Рівень шуму в 2D (просте), дБА

Відеовиходи

Підтримка багатопроцесорної роботи

Максимальна кількість приймачів/моніторів для одночасного виведення зображення

Живлення: 8-контактні роз’єми

Харчування: 6-контактні роз’єми

Максимальна роздільна здатність/частота, Display Port

Максимальна роздільна здатність/частота, HDMI

Максимальна роздільна здатність/частота, Dual-Link DVI

Максимальна роздільна здатність/частота, Single-Link DVI

GeForce RTX 2080 (TU104)
PCI Express x16
Референс: 1515-1800
Founder’s Edition: 1515-1965
3500 (14000)
256
46
64
2944
184
64
46
368
270×100×36
2
чорний
228
29
11
34,7
30,0
30,0
1×HDMI 2.0 b, 3×DisplayPort 1.4, 1×USB-C (VirtualLink)
SLI
4
1
1
3840×[email protected] Гц (7680×[email protected] Гц)
3840×[email protected] Гц
2560×[email protected] Гц (1920×[email protected] Гц)
1920×[email protected] Гц (1280×[email protected] Гц)

Пам’ять

Карта має 8 ГБ пам’яті GDDR6 SDRAM, розміщеної у 8 мікросхемах по 8 Гбіт на лицьовій стороні PCB. Мікросхеми пам’яті Micron (GDDR6) розраховані на номінальну частоту роботи в 3500 (14000) МГц.

Особливості карти та порівняння з попереднім поколінням

Nvidia GeForce RTX 2080 (8 ГБ)
Nvidia GeForce GTX 1080
вид спереду
вигляд ззаду

Як у випадку RTX 2080 Ti, PCB у карт двох поколінь сильно розрізняються. Незважаючи на те, що обидві мають 256-бітну шину обміну з пам’яттю, мікросхеми пам’яті розміщені по-різному (в силу різних типів пам’яті). Також можна побачити кардинальне розходження в розмірі ядер, RTX 2080 (TU104) набагато більші, ніж GTX 1080 (GP104).

Схема живлення побудована на базі 8-фазного цифрового перетворювача iMON DrMOS. Ця динамічна система управління живленням здатна здійснювати моніторинг струму частіше разу на мілісекунду, що дає жорсткий контроль над надходять на ядро харчуванням. Це допомагає GPU довше працювати на підвищених частотах. Той же перетворювач реалізує 2-фазне живлення мікросхем пам’яті.

Як і у випадку RTX 2080 Ti, через утиліту EVGA Precision X1 можна не тільки підвищити частоти роботи, але і запустити Nvidia Scanner, який допоможе визначити безпечний максимум роботи ядра і пам’яті, тобто найшвидший режим роботи в 3D. Зараз вийшла версія 4.6.0 популярної утиліти MSI Afterburner, яка підтримує всю 2000-ю серію.

Ще слід зазначити, що карта оснащується новим роз’ємом USB-C (VirtualLink) спеціально для роботи з пристроями віртуальної реальності наступного покоління.

Охолодження і нагрівання


Головною частиною кулера є велика випарна камера, оборотна частина якої припаяний до масивного радіатору. Поверх встановлений кожух з двома вентиляторами, що працюють на однаковій частоті обертання. Мікросхеми пам’яті і силові транзистори охолоджуються спеціальною пластиною, також жорстко з’єднаної з основним радіатором. З зворотного боку карта прикривається спеціальною пластиною, яка забезпечує не тільки жорсткість друкованої плати, але і додаткове охолодження через спеціальний термоінтерфейс в місцях монтажу мікросхем пам’яті і силових елементів.

Моніторинг температурного режиму за допомогою MSI Afterburner (автор А. Ніколайчук AKA Розмотування):

Після 6-годинного прогону під навантаженням максимальна температура ядра не перевищила 74 градусів, що є відмінним результатом для відеокарти топового рівня


Максимальний нагрів — центральна область з зворотної сторони друкованої плати.

Шум

Методика вимірювання шуму на увазі, що приміщення шумоизолировано і приглушене, знижені реверберації. Системний блок, у якому досліджується шум відеокарт, не має вентиляторів, не є джерелом механічного шуму. Фоновий рівень 18 дБА — це рівень шуму в кімнаті і рівень шумів власне шумоміра. Вимірювання проводяться з відстані 50 см від відеокарти на рівні системи охолодження.

Режими виміру:

  • Режим простою в 2D: завантажений інтернет-браузер з сайтом iXBT.com вікно Microsoft Word, ряд інтернет-комунікаторів
  • Режим 2D з переглядом фільмів: використовується SmoothVideo Project (SVP) — апаратне декодування зі вставкою проміжних кадрів
  • Режим 3D з максимальною навантаженням на прискорювач: використовується тест FurMark

Оцінка градацій рівня шуму виконується за методикою, описаною тут:

  • 28 дБА і менше: шум погано помітний вже на відстані одного метра від джерела, навіть при дуже низькому рівні фонового шуму. Оцінка: шум мінімальний.
  • від 29 до 34 дБА: шум помітний вже з двох метрів від джерела, але не особливо звертає на себе уваги. З таким рівнем шуму цілком можна миритися навіть при довготривалій роботі. Оцінка: шум низький.
  • від 35 до 39 дБА: шум впевнено розрізняється і помітно звертає на себе увагу, особливо в приміщенні з низьким рівнем шуму. Працювати з таким рівнем шуму можна, але спати буде важко. Оцінка: шум середній.
  • 40 дБА і більше: такий постійний рівень шуму вже починає дратувати, від нього швидко втомлюєшся, з’являється бажання вийти з кімнати або вимкнути прилад. Оцінка: високий шум.

У режимі простою в 2D температура становила 30 °C, вентилятори оберталися на частоті приблизно 1500 оборотів в хвилину. Шум був дорівнює 30,0 дБА.

При перегляді фільму з апаратним декодуванням нічого не змінювалося — ні температура ядра, ні частота обертання вентиляторів. Зрозуміло, рівень шуму теж залишався незмінним (30,0 дБА).

У режимі максимального навантаження в 3D температура досягала 74 °C. Вентилятори при цьому розкручувалися до 1830 оборотів в хвилину, шум виростав до 34,7 дБА, так що шум від даної СО є, але він не високий, швидше за середній.

Комплект поставки та упаковка

Базовий комплект поставки серійної карти повинен включати в себе керівництво користувача, диск з драйверами і утилітами. З нашою картою founder’s Edition в комплекті йшли лише керівництво користувача і перехідник з DP на DVI.



Синтетичні тести

Нещодавно ми оновили пакет синтетичних тестів, він все ще експериментальний і може змінюватися. Ми хотіли б додати ще більше прикладів з обчисленнями (compute shaders), але один з поширених таких бенчмарків CompuBench поки що не працює на GeForce RTX. В майбутньому ми постараємося розширити і поліпшити свій набір синтетичних тестів. Якщо у вас є чіткі та обґрунтовані пропозиції — напишіть їх у коментарях до статті, або надішліть поштою авторам.

З раніше використовувалися тестів RightMark3D 2.0 ми залишили лише кілька самих важких тестів. Решта вже неабияк застаріли і на таких потужних GPU впираються в різні обмежувачі, не завантажують роботою блоки графічного процесора і не показують справжню його продуктивність. А от синтетичні Feature-тести з набору 3DMark Vantage ми поки що залишили в повному складі, так як замінити їх просто нічим, хоча і вони вже застаріли.

З більш-менш нових бенчмарків ми почали використовувати кілька прикладів, що входять в DirectX SDK і SDK компанії AMD (скомпільовані приклади застосування D3D11 і D3D12), а також кілька тестів для вимірювання продуктивності трасування променів і один тимчасовий тест для порівняння продуктивності згладжування методами DLSS і TAA. Як напівсинтетичного тесту у нас також використовується і 3DMark Time Spy, допомагає визначити користь від асинхронних обчислень.

Синтетичні тести проводилися на наступних відеокартах:

  • GeForce RTX 2080 зі стандартними параметрами (скорочено RTX 2080)
  • GeForce RTX 2080 Ti зі стандартними параметрами (скорочено RTX 2080 Ti)
  • GeForce GTX 1080 Ti зі стандартними параметрами (скорочено GTX 1080 Ti)
  • GeForce GTX 1080 зі стандартними параметрами (скорочено GTX 1080)
  • Radeon RX Vega 64 зі стандартними параметрами (скорочено RX Vega 64)

Для аналізу продуктивності відеокарти GeForce RTX 2080 ми взяли саме ці рішення з наступних причин. GeForce GTX 1080 є прямим попередником новинки, заснованим на аналогічному по позиціонуванню графічному процесорі з попереднього покоління Pascal. Модель GeForce GTX 1080 Ti більш високого рівня повинна бути приблизно на рівні RTX 2080 продуктивності, порівняння з нею покаже виправданість схожої ціни карт різних поколінь і рівнів. Ну а RTX 2080 Ti представлена як орієнтир GPU максимальної потужності.

У конкуруючої компанії AMD вибирати особливо нема чого. Конкурентоспроможні продукти, здатні виступати на рівні GeForce RTX 2080, навряд чи з’являться і в першій половині наступного року. У підсумку залишається єдина відеокарта Radeon RX Vega 64, яка хоч і не може бути прямим суперником для GeForce RTX 2080, але в будь-якому випадку є найбільш продуктивним рішенням компанії AMD.

Тести Direct3D 10

Ми сильно скоротили склад DirectX 10-тестів з RightMark3D, залишивши тільки шість прикладів з найбільшою навантаженням на GPU. Перша пара тестів вимірює продуктивність виконання відносно простих піксельних шейдерів з циклами при великій кількості текстурних вибірок (до декількох сотень вибірок на піксель) і порівняно невеликий завантаженні ALU. Іншими словами, в них вимірюється швидкість текстурних вибірок і ефективність розгалужень у піксельному шейдере. Обидва приклади включають самозатенение і шейдерний суперсэмплинг, що збільшує навантаження на відеочіпи.

Перший тест піксельних шейдерів — Fur. При максимальних налаштуваннях в ньому використовується від 160 до 320 текстурних вибірок з карти висот і кілька вибірок з основної текстури. Продуктивність в даному тесті залежить від кількості і ефективності блоки TMU, на результат впливає також і ефективність виконання складних програм.

У завданнях процедурної візуалізації хутра з великою кількістю текстурних вибірок, рішення компанії AMD лідирують з часів виходу перших відеочіпів архітектурою GCN, та плати Radeon досі є кращими у цих порівняннях, що говорить про більшу ефективність виконання подібних програм. Висновок підтверджується в черговий раз. Розглянута нова відеокарта моделі GeForce RTX 2080 виступила явно гірше Radeon RX Vega 64, але навіть не це найцікавіше.

Цікаво, що в цьому D3D10-тесті новинка від Nvidia поступилася моделі з попередньої лінійки GeForce GTX 1080 Ti, заснованої на чіпі сімейства Pascal. Більше всього схоже, що тест впирається в ПСП або продуктивність блоків ROP, адже саме за цими параметрами новинка поступається топової попередниці. Відрив від аналогічного по позиціонуванню рішення минулого покоління у вигляді GTX 1080 теж виявився не таким великим, як мало би. Схоже, що в таких простих тестах вся лінійка RTX не занадто сильна, і новим GPU потрібні інші типи навантажень — більш складні шейдери і умови в цілому.

Наступний DX10-тест Steep Parallax Mapping також вимірює продуктивність виконання складних піксельних шейдерів з циклами при великій кількості текстурних вибірок. При максимальних налаштуваннях він використовує від 80 до 400 текстурних вибірок з карти висот і кілька вибірок з базових текстур. Цей шейдерний тест Direct3D 10 трохи цікавіше з практичної точки зору, так як різновиду parallax mapping широко застосовуються в іграх, у тому числі і такі варіанти як steep parallax mapping. Крім того, в нашому тесті ми включили самозатенение, що збільшує навантаження на відеочіп в два рази, і суперсэмплинг, також підвищує вимоги до потужності GPU.

Діаграма дуже схожа на попередню, але в цей раз нова модель відеокарти GeForce RTX 2080 виявилася вже ближче до GTX 1080 Ti з попереднього покоління, і перевагу над GTX 1080 збільшилася. Але все одно ймовірний упор в ПСП або ROP. Якщо порівняти новинку з менш дорогий відеокартою AMD, то вони приблизно рівні, хоча і в разі високої складності новинка від Nvidia виступила краще, але зовсім трохи. Будемо сподіватися, що в більш складних DirectX 11 і 12 тестах вона зможе розкритися повністю.

З пари тестів піксельних шейдерів з мінімальною кількістю текстурних вибірок і відносно великою кількістю арифметичних операцій, ми вибрали більш складний, так як вони вже порядком застаріли і вже не вимірюють суто математичну продуктивність GPU. Та й за останні роки швидкість виконання саме арифметичних інструкцій у піксельному шейдере не так важлива, більшість обчислень перейшли в compute shaders. Отже, тест шейдерних обчислень Fire — текстурна вибірка в ньому лише одна, а кількість інструкцій типу sin і cos одно 130 штук. Втім, для сучасних GPU це насіння.

У математичному тесті з нашого RigthMark ми бачимо результати, далекі від теорії і порівнянь в інших аналогічних бенчмарках. Ймовірно, ці потужні плати обмежує щось, що не відноситься до швидкості обчислювальних блоків, так як GPU при тестуванні навіть не завантажений роботою на 100%. Навіть на ПСП і ROP не спишеш таку різницю. Нова модель GeForce RTX 2080 в тесті трохи випереджає GTX 1080 і відстає від всіх інших, включаючи і GPU конкуруючої компанії. Результат дуже дивний і пояснюється, швидше за все, застарілим тестом.

Переходимо до тесту геометричних шейдерів. У складі пакету RightMark3D 2.0 є два тесту швидкості геометричних шейдерів, але один з них (Hyperlight, що демонструє використання технік: instancing, stream output, buffer load, використовує динамічне створення геометрії та stream output, на всіх відеокартах компанії AMD не працює), тому ми вирішили залишити лише другий — Galaxy. Техніка в цьому тесті аналогічна point sprites з попередніх версій Direct3D. У ньому анимируется система частинок на GPU, геометричний шейдер з кожної точки створює чотири вершини, які утворюють частку. Обчислення проводяться в геометричному шейдере.

Співвідношення швидкостей при різної геометричної складності сцен приблизно однаково для всіх рішень, продуктивність відповідає кількості точок. Завдання для потужних сучасних GPU досить проста, але різниця між різними моделями відеокарт присутній. Нова GeForce RTX 2080 в цьому тесті показала сильний результат, обігнавши всіх умовних конкурентів в найскладніших умовах. Ймовірно, це пов’язано з тактовою частотою GPU, яка перевищує тактову частоту навіть у RTX 2080 Ti.

Відставання кращою з наявних у продажу Radeon у найскладніших умовах майже дворазове. У цьому тесті різниця між відеокартами на чіпах Nvidia і AMD явно на користь рішень каліфорнійської компанії, це обумовлено відмінностями в геометричних конвеєрах GPU. У тестах геометрії плати GeForce завжди конкурентоспроможними Radeon, і топові відеочіпи від Nvidia, які мають порівняно велику кількість блоків по обробці геометрії, завжди виграють з помітною перевагою.

Останнім тестом з Direct3D 10 стане швидкість великої кількості текстурних вибірок з вершинного шейдера. З пари наявних у нас тестів з використанням displacement mapping на підставі даних з текстур, ми обрали тест Waves, має умовні переходи в шейдере і тому більш складний і сучасний. Кількість білінійних текстурних вибірок в даному випадку становить 24 штуки на кожну вершину.

Результати в тесті вершинного текстурування Waves знову показали якийсь дивний акцент нової GeForce RTX 2080 у щось незрозуміле. Але в самих складних умовах продуктивність нової моделі GPU вище, ніж у всіх рішень, крім верхньої моделі RTX. Обидві відеокарти попереднього покоління Pascal залишилися далеко позаду, якщо не брати в розрахунок легкий режим. Якщо ж порівнювати новинку з єдиною Radeon, то остання також помітно відстає в складних умовах і виходить вперед в легенях.

Тести з 3DMark Vantage

Ми традиційно розглядаємо також і синтетичні тести з пакету 3DMark Vantage, адже вони іноді показують нам те, що ми втратили в тестах власного виробництва. Feature тести з цього тестового пакета також володіють підтримкою DirectX 10, вони досі більш-менш актуальні і при аналізі результатів новітньої відеокарти GeForce RTX 2080 Ti ми зробимо якісь корисні висновки, ускользнувшие від нас у тестах пакета RightMark 2.0.

Feature Test 1: Texture Fill

Перший тест вимірює продуктивність текстурних блоків вибірок. Використовується заповнення прямокутника значеннями, зчитуваними з маленької текстури з використанням численних текстурних координат, які змінюються кожен кадр.

Ефективність роботи відеокарт AMD і Nvidia в текстурних тесті компанії Futuremark досить висока, тест показує результати, близькі до відповідним теоретичним параметрами. Крім GeForce RTX, як не дивно. Різниця в швидкості між GeForce RTX 2080 і GTX 1080 Ti виявилася на користь старого рішення більш високого рівня, хоча за теорією вони близькі, а ось GTX 1080 залишилася далеко позаду.

На жаль, якщо порівнювати швидкість текстурування нового відеоадаптера Nvidia з кращою з наявних на ринку відеокартою від конкурента, то новинка поступилася відеокарті компанії AMD. Radeon RX Vega 64 має досить велику кількість блоків TMU і з текстурированием справляється досить непогано.

Feature Test 2: Color Fill

Друге завдання — тест швидкості заповнення. У ньому використовується дуже простий піксельний шейдер, не обмежує продуктивність. Интерполированное значення кольору записується у внеэкранный буфер (render target) з використанням альфа-блендінгу. Використовується 16-бітний внеэкранный буфер формату FP16, найбільш часто використовується в іграх, які застосовують HDR рендеринг, тому такий тест є цілком сучасним.

Цифри з другого подтеста 3DMark Vantage показують продуктивність блоків ROP, без урахування величини пропускної здатності відеопам’яті, тому тест вимірює саме продуктивність підсистеми ROP. Але тут бачимо те ж саме — 20% різниці теорією не пояснити. Розглянута сьогодні плата GeForce RTX 2080 не змогла навіть випередити свою пряму попередницю у вигляді GTX 1080! Не кажучи вже про GTX 1080 Ti.

Якщо порівнювати швидкість заповнення сцени новою відеокартою GeForce RTX 2080 з кращим з рішень компанії AMD, то розглянута сьогодні плата показала в цьому тесті трохи більш високу швидкість заповнення сцени у порівнянні з Radeon RX Vega 64. На результатах позначається як велика кількість блоків ROP у новинки, так і досить ефективні оптимізації стиснення даних (але недостатньо ефективні, щоб випередити GTX 1080).

Feature Test 3: Parallax Occlusion Mapping

Один з найцікавіших feature-тестів, так як подібна техніка давно використовується в іграх. У ньому малюється один чотирикутник (точніше, два трикутника) із застосуванням спеціальної техніки Parallax Occlusion Mapping, що імітує складну геометрію. Використовуються досить ресурсомісткі операції по трасуванні променів і карта глибини великого дозволу. Також ця поверхня затінюється за допомогою важкого алгоритму Strauss. Це тест дуже складного і важкого для відеочіпа піксельного шейдера, містить численні текстурні вибірки при трасуванні променів, динамічні розгалуження та складні розрахунки освітлення по Strauss.

Результати цього тесту з пакету 3DMark Vantage не залежать винятково від швидкості математичних обчислень, ефективності виконання розгалужень або швидкості текстурних вибірок, а від декількох параметрів одночасно. Для досягнення високої швидкості у цій задачі важливий правильний баланс GPU, а також ефективність виконання складних шейдерів.

В даному випадку, важливі і математична і рисунок продуктивність, і в цій «синтетиці» з 3DMark Vantage нова плата GeForce RTX 2080 показала хороший результат, опинившись на одному рівні з моделлю більш високого позиціонування з минулого покоління Pascal, і це відповідає теорії в цей раз. Також новинка від Nvidia сильно випередила і GTX 1080 і виявилася значно швидше Vega 64. Втім, ця плата від компанії AMD їй явно не конкурент.

Feature Test 4: GPU Cloth

Четвертий тест цікавий тим, що розраховує фізичні взаємодії (імітація тканини) за допомогою відеочіпа. Використовується вершинна симуляція, за допомогою комбінованої роботи вершинного і геометричних шейдерів, з декількома проходами. Використовується stream out для перенесення вершин з одного проходу симуляції до іншого. Таким чином, тестується продуктивність виконання верхових і геометричних шейдерів і швидкість stream out.

Швидкість рендеринга в цьому тесті також залежить відразу від декількох параметрів, основними факторами впливу повинні бути продуктивність обробки геометрії і ефективність виконання геометричних шейдерів. Сильні сторони чіпів Nvidia повинні були проявитися, але ми постійно наголошуємо дивні результати в цьому тесті, в якому чергова нова відеокарта GeForce показала вельми низьку швидкість точно на рівні свого прямого попередника GeForce GTX 1080 і топової RTX 2080 Ti. C цим тестом явно щось не так, логічного пояснення таких результатів немає.

Не дивно, що в таких умовах порівняння з єдиним Radeon RX Vega 64 в цьому тесті для GeForce RTX 2080 нічого доброго не приносить. Незважаючи на теоретично меншу кількість геометричних виконавчих блоків і відставання по геометричній продуктивності у чіпів AMD, плати Radeon у цьому тесті працюють помітно ефективніше, вдвічі випереджаючи майже всі відеокарти GeForce, представлені в нашому порівнянні.

Feature Test 5: GPU Particles

Тест фізичної симуляції ефектів на базі систем частинок, розраховуються за допомогою графічного процесора. Використовується вершинна симуляція, де кожна вершина являє одиночну частку. Stream out використовується з тією ж метою, що і в попередньому тесті. Розраховується кілька сотень тисяч частинок, всі анімуються окремо, також розраховуються їх зіткнення з картою висот. Частинки відмальовує за допомогою геометричних шейдерів, що з кожної точки створює чотири вершини, які утворюють частку. Найбільше завантажує шейдерні блоки верховими розрахунками, також тестується stream out.

Дивно, але і в цьому геометричному тесті з 3DMark Vantage нова GeForce RTX 2080 не показує результат, відповідний теорії. Вона виявилася на рівні своєї попередниці архітектури Pascal у вигляді GTX 1080, чого з теорії просто бути не повинно. Порівняння новинки з відеокартою AMD приносить також аналогічний висновок — чергова відеокарта сімейства Тьюринга показала результат лише на рівні якнайшвидшої одночіпової відеокарти конкурента.

Feature Test 6: Perlin Noise

Останній feature-тест пакету Vantage є математично-інтенсивним тестом GPU, він розраховує кілька октав алгоритму Perlin noise в піксельному шейдере. Кожен колірний канал використовує власну функцію шуму для більшого навантаження на відеочіп. Perlin noise — це стандартний алгоритм, часто вживаний у процедурному текстурировании, він використовує багато математичних обчислень.

У цьому математичному тесті продуктивність рішень також не зовсім відповідає теорії, хоча і ближче до пікової продуктивності відеочіпів в граничних задачах. Схоже, що в цьому тесті використовуються в основному операції з плаваючою комою, і нова архітектура Тьюринга просто не може показати результат помітно вище, ніж кращі представники сімейства Pascal. GeForce RTX 2080 в цьому тесті опинилася між GTX 1080 Ti і GTX 1080.

Відеочіпи компанії AMD з архітектурою GCN справляються з подібними завданнями явно краще рішень конкурента у випадках, коли виконується інтенсивна «математика» у граничних режимах. Звичайно, Vega 64 не наздогнала топову RTX 2080 Ti, але зате легко обійшла розглядається сьогодні RTX 2080. Адже ці GPU дуже сильно відрізняються по складності і ціною. Розглянемо більш сучасні тести, що використовують більш складну навантаження — можливо, показники Тьюринга в них будуть краще.

Тести Direct3D 11

Переходимо до Direct3D11-тестів з пакету розробників SDK Radeon. Першим на черзі буде тест під назвою FluidCS11, в якому моделюється фізика рідин, для чого розраховується поведінку безлічі частинок у двомірному просторі. Для симуляції рідин у цьому прикладі використовується гідродинаміка згладжених частинок. Число частинок в тесті встановлюємо максимально можливе — 64000 штук.

Тест явно не розкриває нових можливостей архітектури Тьюринга, і всі відеокарти GeForce показують близькі результати. Новинка навіть не випередила топове рішення сімейства Pascal, а єдиний умовний конкурент у вигляді Radeon RX Vega 64 виявився навіть трохи швидше відеокарт Nvidia. Швидше за все, обчислення в цьому прикладі SDK не дуже складні, тому потужні GPU і не можуть показати свої здібності. Подальше використання тесту під питанням, потрібно буде подивитися на показники чіпів більш низького рівня.

Другий D3D11-тест називається InstancingFX11, у цьому прикладі з SDK використовуються DrawIndexedInstanced-виклики для відображення безлічі однакових моделей об’єктів у кадрі, а їх різноманітність досягається за допомогою використання текстурних масивів з різними текстурами для дерев і трави. Для збільшення навантаження на GPU ми використовували максимальні параметри: число дерев і щільність трави.

Продуктивність рендеринга в цьому тесті залежить від оптимізації драйвера і командного процесора GPU. І з цим у Nvidia все в порядку, так як всі відеокарти GeForce випередили кращу з Radeon. Що стосується порівняння сьогоднішньої новинки з кращою з відеокарт минулого покоління, то GeForce RTX 2080 пристойно випередила GTX 1080 Ti, опинившись рівно між нею і топової RTX 2080 Ti. Схоже, що новий графічний процесор розкривається саме в таких складних умовах.

Ну і останній D3D11-приклад — VarianceShadows11. В цьому тесті з SDK від AMD використовуються тіньові карти (shadow maps) з трьома каскадами (рівнями деталізації). Динамічні каскадні карти тіней зараз широко застосовуються в іграх з прастеризацией, тому тест досить цікавий. При тестуванні ми використовували налаштування за замовчуванням.

Продуктивність в цьому прикладі SDK залежить як від швидкості блоків растеризації, так і від пропускної здатності пам’яті. Добре видно, що за цими параметрами відеокарти Nvidia хоч і виграють у Radeon RX Vega 64, але перевага не така вже й велика, враховуючи ціну і складність вже далеко не нового GPU конкурента. В цей раз GeForce RTX 2080 не обігнала попередницю з сімейства Pascal, але була близька до неї — відповідно теорії. Адже по продуктивності блоків ROP і ПСП вона навіть трохи поступається GTX 1080 Ti, так що тут все в порядку.

Тести Direct3D 12

Direct3D11-тести з SDK компанії AMD скінчилися, переходимо до прикладів з DirectX SDK від компанії Microsoft — всі вони використовують останню версію графічного API — Direct3D12. Першим тестом став Dynamic Indexing (D3D12DynamicIndexing), використовує нові функції шейдерної моделі Shader Model 5.1. Зокрема — динамічне індексування і необмежені масиви (unbounded arrays) для відтворення однієї моделі об’єкта кілька разів, при цьому матеріал об’єкта вибирається динамічно за індексом.

Цей приклад активно використовує цілочисельні операції для індексації, тому особливо цікавий нам для тестування графічного процесора Тьюринга. Для збільшення навантаження на GPU ми модифікували приклад, збільшивши число моделей в кадрі щодо оригінальних налаштувань в 100 разів.

Загальна продуктивність рендеринга в цьому тесті залежить від відеодрайвера, командного процесора і мультипроцесорів GPU. Результати показують, що рішення Nvidia в цілому явно краще справляються з цими операціями, а одночасне виконання INT32 – і FP32-операцій на графічному процесорі TU104 дозволило розглянутої новинці з запасом обігнати краще ігрове рішення на основі архітектури Pascal. Вона виявилася посередині між GTX 1080 Ti і RTX 2080 Ti, що дуже непогано. Radeon RX Vega 64 десь далеко позаду.

Черговий приклад з Direct3D12 SDK — Execute Indirect Sample, він створює велику кількість викликів відтворення за допомогою ExecuteIndirect API, з можливістю модифікації параметрів відтворення в обчислювальному шейдере. У тесті використовується два режиму. У першому на GPU виконується обчислювальний шейдер для визначення видимих трикутників, після чого виклики відтворення видимих трикутників записуються в UAV-буфер, звідки запускаються за допомогою ExecuteIndirect-команд, таким чином на малювання відправляються тільки видимі трикутники. Другий режим малює всі трикутники поспіль без відкидання невидимих. Для збільшення навантаження на GPU число об’єктів в кадрі збільшено з 1024 до 1048576 штук.

Продуктивність в цьому тесті залежить від драйвера, командного процесора і мультипроцесорів GPU. Обидві відеокарти компанії Nvidia впоралися із завданням добре (з урахуванням великої кількості оброблюваної геометрії) і абсолютно однаково, що говорить скоріше про упорі в можливості драйвера, а ось Radeon RX Vega 64 дуже серйозно відстала від них. Ймовірно, справа тут в недостатній оптимізації саме драйверів компанії AMD.

Ну і останній приклад з підтримкою D3D12 — вже відомий нам nBody Gravity тест, але в іншому варіанті. У цьому прикладі з SDK показана розрахункова задача гравітації N-тіл (N-body) — симуляція динамічної системи частинок, на яку впливають такі фізичні сили, як гравітація. Для збільшення навантаження на GPU число N-тіл у кадрі було збільшено з 10000 до 128000.

За кількістю кадрів у секунду навіть на найпотужніших відеокартах видно, що ця обчислювальна задача складна, адже навіть на топовій GeForce RTX 2080 Ti вийшло всього лише 30 FPS. При цьому, менш дорога новинка на графічному процесорі TU104 обійшла топове рішення з попереднього відеокарт сімейства GeForce, і значно випередила кращу відеокарт з конкуруючої компанії. Знову бачимо відмінний результат у GPU нової архітектури.

В якості додаткового синтетичного тесту з підтримкою Direct3D12 ми взяли відомий тест Time Spy з бенчмарка 3DMark. У ньому нам цікаво не тільки загальне порівняння GPU по потужності, але і різниця в продуктивності з включеною і відключеній можливістю асинхронних обчислень, що з’явилися в DirectX 12. Так ми зрозуміємо, чи змінилося щось у підтримці async compute в Тьюринга. Для вірності ми протестували дві відеокарти Nvidia в двох дозволах екрану і двох графічних тестах.


З двох діаграм добре видно, що приріст від включення асинхронних обчислень в Time Spy не змінився, у Pascal і Тьюрінга він приблизно однаковий і становить від 3% до 7%, в залежності від режиму. Але нам відомо, що в нових GPU ця можливість була покращена, на одному і тому ж шейдерном мультипроцесорі Тьюринга може запускати і графічні та обчислювальні шейдери. На жаль, але Time Spy не використовує такі можливості, ми постараємося знайти інший тест для async compute, а поки дивимося те, що є.

Якщо розглянути продуктивність GeForce RTX 2080 у цій задачі, то вона досить непогана — новинка впевнено випереджає модель GTX 1080 Ti у двох протестованих дозволах, хоча до RTX 2080 Ti їм обом дуже далеко. Це цілком відповідає заявам Nvidia про зміни в обчислювальних CUDA-ядер, пов’язаних з поліпшенням кешування і появою можливості одночасного виконання цілочисельних операцій та обчислень з плаваючою комою.

Тести трасування променів

З появою DXR API стало можливо як апаратне прискорення трасування променів на спеціалізованих RT-ядрах, наявних в чіпах архітектури Тьюринга, так і програмне — що виконується на універсальних CUDA-ядер. Так як відеокарти сімейства Pascal теж підтримують DXR API, хоча спочатку Nvidia не планувала робити його підтримку на своїх рішеннях нижче архітектури Volta, ми можемо порівняти продуктивність трасування на різних сімействах GeForce.

Таких тестів і демок поки що небагато. Добре вже те, що у нас є демо-програма Reflections від компанії Epic Games, які спільно з ILMxLAB і Nvidia зробили свій варіант демонстрації можливостей трасування променів в реальному часі з використанням движка Unreal Engine 4 і технологію Nvidia RTX. Для побудови цієї 3D-сцени розробники використовували реальні ресурси з фільмів серії Star Wars.

Ця технологічна демонстрація відрізняється якісним динамічним освітленням, а також ефектами, отриманими за допомогою трасування променів, включаючи якісні м’які тіні від площинних джерел світла (area lights), імітацію глобального затінювання Ambient Occlusion і фотореалістичні відображення — все це отрісовиваємих в режимі реального часу з дуже високою якістю. Також використовується якісне шумозаглушення результату трасування з пакету Nvidia GameWorks. Подивимося, що виходить з продуктивністю:

Це одна з найбільш вражаючих презентацій можливостей трасування променів і навесні її показували на робочій станції DGX Station, включає аж чотири графічних процесора архітектури Volta. Але потім виявилося, що вона запрацювала і на одній GeForce GTX 1080 Ti, нехай і з явним недоліком продуктивності, але 6-10 FPS — це точно краще наших очікувань.

А вже нові відеокарти сімейства GeForce RTX можуть впоратися з трасуванням в реальному часі з дуже хорошою продуктивністю при умові роботи над нею всього лише єдиного GPU. Ось і друга модель сімейства Тьюринга в цій задачі виявилася помітно швидше попередниці сімейства Pascal — в 4-5 разів, так і від топової RTX 2080 Ti вона хоч і серйозно відстала, але показала при цьому цілком прийнятну швидкість рендеринга.

Ще одним тестом продуктивності трасування променів могла б стати технологічна демонстрація 3DMark Ray Tracing Tech Demo від творців відомих бенчмарків серії 3DMark, але поки що вона занадто сира, і викладати такі ранні результати заборонено. Демонстрація також працює на всіх графічних процесорах з підтримкою DXR API, для чого потрібно квітневе офіційне оновлення Windows 10 з включеним у налаштуваннях режимом розробника ну або жовтневе оновлення операційної системи.

Демонстрація ця суто технологічна, вона призначена лише для показу деяких можливостей трасування променів через DXR API, в ній поки що використовується менша кількість ефектів з трасуванням променів (відображення) з ще не такою якістю, яке буде в повноцінному бенчмарку компанії, вона в цілому ще не оптимізована і взагалі не дозволена для порівняння продуктивності різних GPU в трасуванні променів, тому ми не можемо навести конкретні цифри з цієї демки.

Ми можемо поділитися виключно особистими враженнями, без зазначення точної продуктивності. Зазначимо порівняно непоганий результат навіть для GeForce GTX 1080 Ti — за відчуттями, нехай це і був не візуалізації реального часу, але не слайд-шоу навіть з урахуванням неоптимизированного коду. Новий графічний процесор TU104 з апаратними блоками трасування променів, показує значно (в рази) більш високу продуктивність у цій, ще зовсім не оптимізованої технологічної демонстрації. Але для остаточних висновків давайте почекаємо повноцінного тесту 3DMark з трасуванням променів, поява якого очікується ближче до кінця поточного року.

Обчислювальні тести

Ми хотіли включити у склад нашого пакету синтетичних тестів зручний бенчмарк CompuBench, який використовує OpenCL і в який входить кілька цікавих обчислювальних тестів, але він поки що не запрацював на GeForce RTX 2080 Ti з-за недопрацьованих драйверів або ПО. Тому нам довелося шукати інші варіанти. Зокрема — досить старий вже і не дуже оптимізований тест трасування променів, але не апаратної LuxMark 3.1. Цей багатоплатформовий тест заснований на LuxRender і також використовує OpenCL.

Ми порівняли три різних GPU компанії Nvidia в цьому тесті і вийшло, що нова GeForce RTX 2080 значно швидше у цій задачі, ніж GTX 1080 Ti з попереднього сімейства. Такий сильний результат новинки став наслідком значно поліпшеного кешування і більшого об’єму кеш-пам’яті в більшій мірі. Різниця між RTX 2080 і RTX 2080 Ti також досить велика, чи не півтораразова — топовий GPU і в цілому швидше і кеша має більше.

Розглянемо ще один тест продуктивності поліпшення зображення методом DLSS, який використовує можливості спеціалізованих тензорних ядер, прискорюють завдання глибокого навчання. Натренована нейромережа використовує тензорні ядра, наявні в чіпах архітектури Тьюринга для того, щоб «домальовувати» зображення, поліпшуючи його якість вище рівня поширеного методу згладжування TAA.

При тестуванні ми використовували бенчмарк Final Fantasy XV Benchmark, який був оновлений для підтримки DLSS-згладжування. Оновлений тест продуктивності на базі ігрового движка розкриває явні переваги DLSS, що забезпечує якість картинки не гірше, ніж із застосуванням TAA при рендерінгу в 4K-дозволі, і показує приблизно на третину більш високу продуктивність при цьому:

Тут нам цікаво порівняння GeForce RTX 2080 і GTX 1080 Ti. Якщо при використанні згладжування методом TAA їх швидкість дуже близька, що майже повністю відповідає теорії (без урахування переваг від одночасного виконання FP32 і INT32, наприклад), то при використанні алгоритму DLSS у архітектури Тьюринга проявляється явна перевага в додаткові 40% до швидкості рендеринга над Pascal. Ось такі тести і показують можливості GPU нового покоління, що мають спеціалізовані блоки.

Висновки з теоретичної частини та синтетичних тестів

Судячи з теорії та проведеним нами синтетичних тестів, відеокарта моделі GeForce RTX 2080, заснована на новому графічному процесорі TU104 архітектури Тьюринга, займе на ринку ігрових відеокарт місце відразу під RTX 2080 Ti, незважаючи на суперечливі результати в деяких бенчмарках. Так, зі старими синтетичними тестами у нових GPU все не дуже добре, і цілком можливо, що в деяких з існуючих ігор вплив численних архітектурних поліпшень буде не дуже помітно, і топове рішення сімейства Pascal у вигляді GeForce GTX 1080 Ti майже не поступиться новинці, як було в чималої частини наших синтетичних тестів.

Справа в тому, що не всі існуючі ігри зможуть отримати перевагу за рахунок поліпшених блоків CUDA, адже кількість цих блоків GPU нового покоління виросло не так вже сильно. Те ж саме стосується і текстурних блоків і блоків ROP. Не кажучи вже про те, що навіть нинішні GeForce GTX 1080 Ti часто впираються в CPU в дозволах 1920×1080 і 2560×1440. Так що існує чимала ймовірність того, що в поточних додатках приріст продуктивності не виправдає очікувань деяких користувачів.

Але ми в черговий раз нагадуємо, що в цьому поколінні GPU компанія Nvidia зробила ставку на абсолютно нові типи виконавчих блоків, додавши спеціалізовані RT-ядра і тензорні ядра для прискорення трасування променів і задач штучного інтелекту. Поки що в іграх ці технології майже не застосовуються, так що і переваг сімейства Тьюринга вони зараз не дають, але в найближчому майбутньому підтримка трасування променів з’явиться в іграх, так і згладжування методом DLSS отримає більш широке поширення. Як з такими завданнями впорається новинка, можна подивитися по тесту трасування променів і оновленим бенчмарку Final Fantasy XV.

Крім цього, синтетику завжди потрібно переносити на ігри з певним розумінням причин і наслідків. Розібравшись в яких, стає зрозуміло, що у GeForce RTX 2080 є і дуже сильні, і слабкі сторони. Навіть в існуючих ігрових додатках GeForce RTX 2080 повинна показати досить високу швидкість приблизно на рівні GeForce GTX 1080 Ti або навіть трохи вище. Це, правда, не порадує всіх, так як ціни на ці рішення відрізняються не на користь новинки. Втім, зате у неї є і певний заділ на майбутнє і потенціал для зниження ціни.

Ми вже писали, що ціна — головний спірний момент покоління GeForce RTX. Ціни на новинки поки що дійсно високі, і хоча цього є купа пояснень (відсутність конкуренції, висока собівартість тощо), але при ціні на GeForce RTX 2080 вище, ніж у GTX 1080 Ti, багато хто задумається — а чи потрібні їм взагалі нові можливості, які ще навіть не розкриті в іграх? І будуть по-своєму праві. Звичайно, багато відеокарти RTX будуть у будь-якому випадку куплені ентузіастами, які завжди купують краще і нове, але таких людей обмежена кількість.

У свою чергу, ми будемо сподіватися і на зниження цін з часом, і на великі тиражі і продажу сімейства GeForce RTX, так як воно дійсно інноваційне з багатьох причин. Мало того, що RTX 2080 дасть відмінну продуктивність в широкому колі завдань на рівні топової моделі попереднього покоління чи трохи вище, так ще й запропонує цікаві нові можливості, які будуть розкриті в ігрових проектах наступних місяців і років. Для того, щоб полегшити ваше рішення, перейдемо до тестів продуктивності в існуючих іграх.

Ігрові тести

Конфігурація тестового стенду

  • Комп’ютер на базі процесора AMD Ryzen 7 1800X (Socket AM4):
    • процесор AMD Ryzen 7 1800X (o/c 4 ГГц);
    • З Antec Kuhler H2O 920;
    • системна плата Asus ROG Crosshair VI Hero на чіпсеті AMD X370;
    • оперативна пам’ять 16 ГБ (2×8 ГБ) DDR4 AMD Radeon R9 UDIMM 3200 МГц (16-18-18-39);
    • жорсткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • блок живлення Seasonic Prime 1000 W Titanium (1000 Вт);
  • операційна система Windows 10 Pro 64-бітна; DirectX 12;
  • монітор Asus PG27UQ (27″);
  • драйвери AMD версії Adrenalin Edition 18.9.3;
  • драйвери Nvidia версії 416.16;
  • VSync відключений.

Список інструментів тестування

У всіх іграх використовувалося максимальну якість графіки в налаштуваннях.

  • Darkness II: The New Colossus (Bethesda Softworks/MachineGames)
  • Tom clancy’s Ghost Recon Wildlands (Ubisoft/Ubisoft)
  • Assassin’ Creed: Origins (Ubisoft/Ubisoft)
  • BattleField 1 (EA Digital Illusions CE/Electronic Arts)
  • Far Cry 5 (Ubisoft/Ubisoft)
  • Shadow Of The Tomb Raider (Eidos Montreal/Square Enix) — HDR включений
  • Total War: Warhammer II (Creative Assembly/Sega)
  • Ashes Of The Singularity (Oxide Games, Stardock Entertainment/Stardock Entertainment)

Слід зазначити, що в самій новій грі Shadow Of The Tomb Raider ми використовували HDR як ключове розширення функціональності. Дослідження показало, що активація HDR чинить незначну дію на продуктивність. Візуально ж ми можемо побачити деякі відмінності.

Візуальне наявність HDR в грі Shadow Of The Tomb Raider



HDR вимкнено

HDR включений

HDR вимкнено

HDR включений

HDR вимкнено

HDR включений

HDR вимкнено

HDR включений

Відеоролик demo1, HDR вимкнений:

Відеоролик demo1, HDR включений:

Відеоролик demo2, HDR вимкнений:

Відеоролик demo2, HDR включений:

Результати тестування.

Darkness II: The New Colossus

Різниця в продуктивності, %

Досліджувана карта
Карта, з якої йде порівняння
2560×1440
3840×2160
GeForce RTX 2080 GeForce GTX 1080 +36,7 +36,8
GeForce RTX 2080 GeForce GTX 1080 Ti +6,3 +4,0
GeForce RTX 2080 Radeon RX Vega 64 +17,5 +25,8




Tom clancy’s Ghost Recon Wildlands

Різниця в продуктивності, %

Досліджувана карта
Карта, з якої йде порівняння
2560×1440
3840×2160
GeForce RTX 2080 GeForce GTX 1080 +42,0 +39,1
GeForce RTX 2080 GeForce GTX 1080 Ti +29,2 +14,3
GeForce RTX 2080 Radeon RX Vega 64 +33,7 +25,5




Assassin’ Creed: Origins

Різниця в продуктивності, %

Досліджувана карта
Карта, з якої йде порівняння
2560×1440
3840×2160
GeForce RTX 2080 GeForce GTX 1080 +46,0 +48,6
GeForce RTX 2080 GeForce GTX 1080 Ti +17,9 +10,0
GeForce RTX 2080 Radeon RX Vega 64 +41,5 +31,0




BattleField 1

Різниця в продуктивності, %

Досліджувана карта
Карта, з якої йде порівняння
2560×1440
3840×2160
GeForce RTX 2080 GeForce GTX 1080 +41,3 +40,8
GeForce RTX 2080 GeForce GTX 1080 Ti +4,7 +1,5
GeForce RTX 2080 Radeon RX Vega 64 +32,9 +21,1




Far Cry 5

Різниця в продуктивності, %

Досліджувана карта
Карта, з якої йде порівняння
2560×1440
3840×2160
GeForce RTX 2080 GeForce GTX 1080 +36,3 +46,3
GeForce RTX 2080 GeForce GTX 1080 Ti +11,2 +15,4
GeForce RTX 2080 Radeon RX Vega 64 +16,0 +22,4




Shadow Of The Tomb Raider

Різниця в продуктивності, %

Досліджувана карта
Карта, з якої йде порівняння
2560×1440
3840×2160
GeForce RTX 2080 GeForce GTX 1080 +45,5 +46,9
GeForce RTX 2080 GeForce GTX 1080 Ti +16,4 +9,3
GeForce RTX 2080 Radeon RX Vega 64 +39,1 +34,3




Total War: Warhammer II

Різниця в продуктивності, %

Досліджувана карта
Карта, з якої йде порівняння
2560×1440
3840×2160
GeForce RTX 2080 GeForce GTX 1080 +46,9 +48,1
GeForce RTX 2080 GeForce GTX 1080 Ti +2,9 +8,1
GeForce RTX 2080 Radeon RX Vega 64 +60,0 +81,8




Ashes Of The Singularity

Різниця в продуктивності, %

Досліджувана карта
Карта, з якої йде порівняння
2560×1440
3840×2160
GeForce RTX 2080 GeForce GTX 1080 +34,8 +49,3
GeForce RTX 2080 GeForce GTX 1080 Ti 0,0 +2,0
GeForce RTX 2080 Radeon RX Vega 64 +25,0 +22,0



Рейтинг iXBT.com

Рейтинг прискорювачів iXBT.com демонструє нам функціональність відеокарт один щодо одного і нормований по самому слабкому прискорювачу — Radeon R7 240 (тобто поєднання швидкості і функцій R7 240 прийняті за 100%). Рейтинги ведуться по 20 щомісяця досліджуваних нами акселераторам в рамках проекту Краща відеокарта місяця. Із загального списку вибирається група карт для аналізу, куди входять RTX 2080 і його конкуренти. Для розрахунку рейтингу корисності використані роздрібні ціни на початок жовтня 2018 року.


Модель прискорювача
Рейтинг iXBT.com
Рейтинг корисності
Ціна, руб.
02 RTX 2080 8 ГБ, 1515-1950/14000 1570 263 59 700
03 GTX 1080 Ti 11 ГБ, 1480-1885/11000 1330 238 56 000
04 RX Vega 64 8 ГБ, 1250-1630/1890 1170 239 49 000
05 GTX 1080 8 ГБ, 1607-1885/10000 1130 297 38 000

Що ми отримали? В середньому по всіх ігор і дозволами приріст щодо GTX 1080 — близько 38%, щодо RX Vega 64 — 31%. Якщо ж вийти за рамки списку офіційних конкурентів новинки (згідно з позиціонуванням самій Nvidia), то RTX 2080 обходить і топовий прискорювач попереднього покоління — GTX 1080 Ti, але вже всього на 10%. Ми бачимо, що нова пара прискорювачів RTX 2080/Ti забезпечила в цілому дуже пристойний приріст продуктивності. Звичайно, прискорювачі рівня RTX 2080 розраховані на використання у дозволах від 2560×1440 і вище, результати навіть в Full HD не дуже цікаві, але і у вирішенні 2.5 ДО RTX 2080 в середньому обходить GTX 1080 Ti на 11%, RX Vega 64 — на 33%, а GTX 1080 — на 41%. Якщо раніше ми могли стверджувати, що GTX 1080 не годиться для дозволу 4K, то тепер його формальний спадкоємець RTX 2080 видає пристойну продуктивність в багатьох іграх навіть у дозволі 4К.

Рейтинг корисності

Рейтинг корисності тих же карт виходить, якщо показники попереднього рейтингу розділити на ціни відповідних прискорювачів. Для прискорювачів топового рівня цей рейтинг не дуже показовим, такі картки не випускаються масовими тиражами і націлені насамперед на ентузіастів, а в рейтингу корисності їх на голову обходять середняки і іноді навіть мало не бюджетні рішення.


Модель прискорювача
Рейтинг корисності
Рейтинг iXBT.com
Ціна, руб.
14 GTX 1080 8 ГБ, 1607-1885/10000 297 1130 38 000
15 RTX 2080 8 ГБ, 1515-1950/14000 263 1570 59 700
17 RX Vega 64 8 ГБ, 1250-1630/1890 239 1170 49 000
18 GTX 1080 Ti 11 ГБ, 1480-1885/11000 238 1330 56 000

Вважаємо, що тут коментарі зайві. Очевидно, що слід почекати наповнення ринку новими продуктами, до того ж серія GTX 1070/1080 вже активно залишає ринок, тому ціни на них можуть сильно коливатися.

Висновки

Nvidia GeForce RTX 2080 на сьогодні другою за швидкістю прискорювач ігрового класу для дозволу 2.5 До (не кажучи вже про Full HD), до того ж він, як і RTX 2080 Ti, найбільш високотехнологічний. Порівняння з рішеннями попереднього покоління в 3D-іграх тут недостатньо, це не GTX, а RTX! Це роки роботи великого колективу над новою архітектурою, це знову позиція біля керма технологій (як у часи GeForce256 в 1999 році). У загальному. в огляді за RTX 2080 Ti ми все це вже писали. Ще раз хочеться висловити надію, що нововведення типу блоку трасування променів, «розумні» тензорні ядра реально допоможуть у найближчому майбутньому розробникам зробити ігри більш захоплюючими в плані графіки (нагадаю про відчуття щирого захвату від картинки при грі в Shadow Of The Tomb Raider з включеним HDR).

Варто ще раз зазначити, що оголошена ціна на нові прискорювачі (в т. ч. і на RTX 2080) багатьох дуже неприємно здивувала, тому що вже багато років зберігалася традиція: ціни нових топових відеокарт плюс-мінус дорівнювали початковим цінами попередніх флагманів. Ми вже писали, що, на жаль, компанія AMD поки взяла тайм-аут в області дискретної графіки, і наступні їх вирішення очікуються не раніше 2019 року, тому у Nvidia в принципі немає обмежувача у вигляді цін на конкуруючі продукти. Однак такими цінами можна швидко «відбити» багатомільйонні витрати на розробку Тьюринга, а можна і отримати втрату попиту (покупці віддадуть перевагу взяти GTX 1080/Ti, хоч би і на вторинному ринку), а також інтересу розробників/видавців ігор, які ретельно стежать за поширеністю нових відеокарт (який сенс реалізовувати нові технології в іграх, якщо мало хто зможе скористатися ними через незначною поширеністю відповідних 3D-прискорювачів?). Сподіваємося, що Nvidia не помилилися, встановивши такі ціни на момент початку продажів, і любителі 3D-ігор на ПК все ж зможуть придбати якщо і не RTX 2080 Ti, то RTX 2080 або RTX 2070. І ми більш ніж упевнені, що в міру наповнення ринку картами 2000-ї серії ціни підуть вниз, опустившись в кінці кінців до початкових рекомендованих цін на відповідні прискорювачі 1000-ї серії. Ну і скажемо банальне: всі бажання виробників жорстко контролюються ринком, тобто наших з вами попитом. Так що бажаючим пообурюватися ціновою політикою можемо лише порадити просто почекати.

Отже, що ми маємо: RTX 2080 демонструє пристойний приріст продуктивності в старших дозволах навіть у звичайних (без HDR/RT) іграх щодо свого формального предка — GTX 1080, а також обходить на 10% і колишній флагман GTX 1080 Ti (не кажучи вже про найшвидшому на сьогодні продукті AMD — Radeon RX Vega64, який відстає від RTX 2080 мінімум на 30%). Як і у випадку з RTX 2080 Ti, новий антиаліасінг DLSS продемонстрував свою перевагу і за швидкістю, і за якістю. Плюс є величезний заділ для використання розробниками ігор технології трасування променів, а також ІЇ з допомогою тензорних ядер (наочний приклад такої реалізації — як раз DLSS). Новий прискорювач пропонує оновлений інтерфейс VirtualLink для зв’язку з пристроїв віртуальної реальності нового покоління (VR нікуди не подівся, не помер, просто очікується черговий стрибок технологій). Якщо знайдуться фанати, яким буде мало навіть такого прискорювача, вони можуть придбати два і з’єднати їх в SLI (тоді продуктивність у вирішенні 4К повинна стати просто казковою). Варто зауважити, що минулі «містки» SLI тут вже не підійдуть: потрібні нові NVLink.

Ще раз хочеться похвалити оновлений дизайн карти founder’s Edition. Не секрет, що компанія Nvidia вирішила більш активно виводити на ринок карти під власним брендом, створюючи, по суті, конкуренцію своїм партнерам. І тут поки ситуація незрозуміла, оскільки карти founder’s Edition мають частоти, підвищені відносно якогось референса, якого ніхто в очі не бачив. В результаті партнерські карти розігнаних серій, типу Asus Strix і Aorus OC, будуть знаходитися на одному рівні продуктивності з картами Nvidia founder’s Edition, які ми звикли вважати еталоном і як раз референсними.

Варто також відзначити мрію оверклокерів середньої руки (досвідчених, прагнуть до встановлення рекордів з рідким азотом і помиранием «заліза», ми не вважаємо) — Nvidia Scanner. Технологія проста, як пробка: натиснув на кнопку — і чекай, воно саме покрутить коліщатка і видасть вам максимум швидкості в розгоні.

В номінації «Оригінальний дизайн» карта Nvidia GeForce RTX 2080 (founder’s Edition) отримала нагороду:

Дякуємо компанії Nvidia Russia
і особисто Ірину Шеховцову
за надану для тестування відеокарту

Для тестового стенда:
блок живлення Seasonic Prime 1000 W Titanium надано компанією Seasonic