понедельник, 29 ноября 2010 г.

dimson тоже в Stereo истерике...

Добрался до V-Ray RT GPU, вообще я конечно не очень радуюсь всей этой мировой тенденции к так называемому 3D (которое ни черта не 3D), но все же если есть такая возможность создавать свои Стерео шедевры, дак почему бы не воспользоваться ею?
Главная фишка V-Ray RT как CPU так и GPU версии, это поддержка вывода стерео изображения причем сразу в нескольких вариантах.
Этому я посвящу целый раздел своего доклада на CG Event, а пока краткий экскурс в те возможности, что нам дает V-Ray RT.
Первое на что стоит обратить внимание, это параметры визуализатора для визуализации стерео картинки. В V-Ray RT они представлены небольшой группой параметров со списком из предоставленных типов представления изображения.

Параметры визуализации стерео изображения в V-Ray RT GPU.
Как видно, разработчики реализовали практически все самые популярные стерео технологии, используемые сейчас в производстве. Даже есть OpenGL Stereo, но тут требуется наличие специальных очком, и осмелюсь подумать что требуется именно NVIDIA 3D Vision.

Пример визуализации в режиме Normal.
Это пример визуализации стерео изображения в V-Ray RT GPU в режиме Normal, данный режим визуализирует изображение для каждого из глаз по отдельности. При этом так же визуализируется и обычное изображение в ActiveShade Window или в окне проекции.

Пример визуализации в режиме Interlace.
Здесь уже показан пример визуализации в режиме Interlace когда оба изображения накладываются друг на друга и формируется готовый стерео кадр для последующего просмотра и настройки.

Пример визуализации классического режима Anaglyph.
Ну а последний пример уже всем известен, это анаглиф который мы все знаем по убивающим наше зрение сине-красным очкам :).
Лично у меня работает, на удивление О_о, благо анаглифные очки, есть.
Обо всем этом и даже больше будет рассказано на CG Event 2010 STEREO (http://www.cgevent.ru/)

пятница, 29 октября 2010 г.

Как отследить насколько загружен GPU при вычислениях?

Недавно меня озадачили, задав вопрос: -«А как понять, что моя видеокарта вычисляет и насколько она загружена?»
Глупый вопрос, знаю, но пришлось рассказать человеку в деталях. Как средство измерения и анализа я использую GPU-Z, отличная утилита и главное не изобилует излишним функционалом, а для мониторинга загруженности GPU, это идеальная тулза.

Скриншоты GPUZ. Закладки Graphics Card и Sensors (в состоянии без нагрузки) и Sensors (во время вычислений на GPU).
Для нашего примера, воспользуемся скриншотами состояний из GPU-Z, во время визуализации сцены с автомобилем. На что стоит обратить внимание в первую очередь. Сначала узнайте сколько шейдерных ядер у вашей модели GPU (например, у моей Quadro FX 1800 их всего 64), какой объем памяти на борту вашей карты (у Quadro FX 1800 объем графической памяти составляет 768 Мб (не так уж и много)).

Схема архитектуры NVIDIA Fermi.
Основное на что стоит собрать внимание, это с какой максимальной частотой работают шейдерные процессоры (ядра) (в терминологии NVIDIA – CUDA ядра).

Блок с CUDA ядрами в GF100 (“Fermi”)
Итак, во время вычислений нагрузка идет именно на шейдерные процессоры, они как раз и работают с программным обеспечением написанном на CUDA C.
Если взглянуть на картинку из GPU-Z, вы увидите, когда выполняются вычисления на GPU, частота шейдерных процессоров увеличивается до максимального уровня. При этом для экономии энергии и вообще для более аккуратной работы, GPU во время простоя или выполнения несложных задач, просто плавно понижает частоты.
Так же, когда идет работа с CUDA приложениями, все данные которые необходимы для вычислений и могут поместиться в память графического ускорителя, будут находиться в памяти GPU. Это и демонстрирует изображение из GPU-Z в начале этого поста.
И в заключение хочется заметить, если и этого вам мало, то в GPU-Z есть отличный пункт “GPU Load” в котором отображается загруженность GPU, и при вычислениях с помощью CUDA приложений она обычно составляет 97 – 99%.

четверг, 28 октября 2010 г.

Сцена экстерьера для mental ray & iray

Наконец доделал базовую сцену для экстерьера и полностью настроил её для визуализации в mental ray. Изначально хотел сделать с фанатизмом и т.п. прелестями в визуализации, но поняв что времени уже мягко говоря впритык, то не стал издеваться над моделью и шейдерами. Итоговый вариант, визуализированный с помощью mental ray вы видите ниже.

Сцена экстерьера автомобиля для тестов GPU ускоренных визуализаторов.
Сегодня займусь адаптацией шейдеров под iray, т.к. с автомобильными шейдерами у него крайне плохо, и не поддерживается ни один из шейдеров типов CarPaint или Metallic_Paint.
С V-Ray и V-Ray RT все намного легче, притом же создано под них огромное количество материалов и пресетов, что настроить сцену под эти два визуализатора будет гораздо легче.

суббота, 23 октября 2010 г.

Первые впечатления от V-Ray RT GPU...

Итак, прошло буквально пару дней как ко мне приехал для тестов свеженький дистрибутив V-Ray и лицензия на него. После успешной установки и настройки я получил ключ для загрузки на тесты V-Ray RT GPU beta.
Первые впечатления от рендера я сейчас здесь и отпишу.
Первое что хочется заметить, V-Ray RT Это не Production renderer как в случае с iray for 3ds Max. Его основная задача сделать высококачественную Preview визуализацию и обновлять изображение по мере изменения сцены, материалов, освещения и других элементов. Это позволит быстро осуществить настройку сцены и выполнить тестовые визуализации. В предыдущем посте я уже говорил, что со стандартной версией V-Ray RT CPU производительность на этапе настройки шейдеров и освещения повышается 6 раз (хотя у кого как, но главное то что повышение производительности в работе наблюдается).
В первом тесте я взял нашу модель с экстерьером и машиной, зада стандартный V-RayMtl и установил источник света V-RaySun. Визуализация осуществляется из камеры V-RayPhysicalCamera с настроенной экспозицией и балансом белого.
Я пока не стал замерять скорость визуализации сцены и визуализации после внесения изменений, это я сделаю в след. посте, а быстренько пробежался по функционалу и интеграции в 3ds Max.

V-Ray RT визуализирует сцену в режиме ActiveShade в отдельном диалоговом окне.
V-Ray RT может быть использован только в качестве ActiveShade визуализатора, об этом он сообщит если вы выбрали его в качестве Production визуализатора.
В режиме ActiveShade он может быть использован как в отдельном диалоговом окне (см. рисунок выше), так и в качестве окна проекций режима ActiveShade.

V-Ray RT визуализирует сцену в режиме ActiveShade в окне проекции камеры.
Благодаря этому можно спокойно настраивать материалы и освещение, при этом не перегружая рабочее пространство множеством окон. Если требуется изменить положение камеры или объекта, просто перетащите их используя инструменты Move, Rotate & Scale, учтите, что эти операции делать можно только в окнах проекций, а не в окне ActiveShade (ограничения такие).
Другой пример, это применение V-Ray RT как раз для отображения изменений в материале и освещении. Я назначил материал с синим цветом и легкими размытыми отражениями, и далее отвизуализировал сцену с помощью V-Ray RT GPU. Как и было показано в демонстрации Chaos Group после изменения цвета в материале, сцена моментально была пересчитана и был получен новый результат.

V-Ray RT визуализирует сцену в режиме ActiveShade до и после изменения цвета материала.
Теперь же стоит обратить внимание на загрузку GPU при визуализации сцены с помощью V-Ray RT GPU. Все примеры загрузки GPU мы собрали с помощью утилиты GPU-Z 0.4.6.

GPU в не загруженном состоянии.
Все эксперименты я делаю с использованием GPU NVIDIA Quadro FX 1800, у этой модели используется 64 ядра CUDA и 768 Мб памяти. На зиображении выше, показано что GPU практически никак не используется и его память практически пуста.
Когда запущен 3ds Max и загружена сцена, примерно загружается до 140 Мб графической памяти, каждый раз этот показатель может отличаться.

GPU при загруженной трехмерной сцене в 3ds Max.
Когда в дело вступает V-Ray RT GPU, сцена транслируется в формат данных V-Ray и загружается сначала в системную ОЗУ, после чего данные передаются на вычисления и хранение в память GPU.

GPU при загруженной трехмерной сцене в 3ds Max.
Во время использования V-Ray RT GPU, сцена занимает порядка 250 - 320Мб в памяти графической карты. Так как визуализация осуществляется в режиме реального времени, то графический процессор будет постоянно задействован в вычислениях и нагружен, пока мы не закроем окно с V-Ray RT.
Вот здесь то и становится актуальным применение дорогих и производительных GPU с большими объемами памяти. Подробнее об этом я опишу здесь и в своей статье на RENDER.RU, а так же на CG Event 2010 в своем докладе.
В целом, остался очень доволен производительностью V-Ray RT GPU в такой сцене, при этом, по сравнению с iray он не весит полностью работу системы и 3ds Max, и позволяет комфортно оперировать с другими приложениями и ковырянием с трехмерными моделями.

понедельник, 11 октября 2010 г.

И все же он быстрее…

Итак, после предыдущего и первого «разочаровывающего» теста iray, я решил пройтись по документации и протестировать его с аналогичными визуализаторами из той же категории.
Визуализаторы разделены как минимум на две большие категории – biased и unbiased визуализаторы. Первые из них это классические визуализаторы, где все элементы изображения вычисляются отдельно и потом уже на финальном этапе объединяются для получения конечного изображения (или выводятся по слоям). Так же в этом типе визуализаторов для экономии времени разработчики используют упрощенные математические модели освещения и описания свойств поверхностей - для увеличения скорости визуализации.

Визуализаторы второй категории используют более корректные физические модели света и визуализируют сразу все «одним махом». При этом максимально загружая вычислительные ресурсы. На выходе вы получаете изображение, строящееся из множества точек, каждая из которых обладает большим количеством данных основанных на физически корректной модели освещения (это с одной стороны и объясняет шум на изображении), чем больше точек вычисляется, тем лучше результат. Но для того что бы их вычислить необходимо потратить много времени. Обычные процессоры тут как раз и начинают загибаться.

На выручку может прийти применение GPU для ускорения вычислений. Благо используемые в unbiased рендерах алгоритмы отлично поддаются распараллеливанию, это то, что нам как раз нужно.
Какие рендеры сейчас представляют обе категории? Список дается ниже.
Biased визуализаторы (наиболее широко известные):
- mental ray
- RenderMan
- V-Ray
- Brazil
- finalRender
- (NEW) finalRender R4 (GPU Accelerated)
- 3delight (RenderMan compliant)
Unbiased визуализаторы:
- iray from mental images (mental ray compliant* & GPU Accelerated)
- V-Ray RT CPU (V-Ray compliant**)
- V-Ray RT GPU (V-Ray compliant**, GPU Accelerated)
- FryRender
- ARION (FryRender compliant & GPU Accelerated)
- Octane (GPU Accelerated)
- Indigo renderer
Примечание:
* - mental images iray совместим с большинством возможностей mental ray в standalone версии (но существует ряд ограничений (дополнительно можно узнать из документации).
** - V-Ray RT CPU & V-Ray RT GPU интегрированы полностью в среду Autodesk 3ds Max и полностью взаимодействуют с biased версией V-Ray, поддерживают материалы и текстуры V-Ray. Благодаря поддержке интерактивной визуализации, можно ускорить процесс создания материала в несколько раз, по словам знакомых, V-Ray RT CPU ускорил их работу в x6 раз (!!!).
GPU Ray tracing engines
Отдельное направление, которое сейчас продвигается компанией NVIDIA – интерактивный ray tracing с возможностью интеграции в различные приложений. Базируется на применении комплекса инструментов NVIDIA APEX и входящем в него NVIDIA OptiX. Особенность данных инструментов заключается в оптимизации под применение профессиональных решений NVIDIA Quadro.
Теперь перейдем ближе к рассматриваемым визуализаторам. Первый тест был сделан не очень то корректно, mental ray будет считать быстрее чем iray по причине, что он biased рендер, и строит изображение по отдельным этапам, а так же используя упрощенные модели освещения.
Но вот если сравнить iray с аналогичными ему unbiased визуализаторами, то тут станет сразу заметно, что он выполняет визуализацию значительно быстрее.
Сравнение времени визуализации в Maxwell Render, iray for 3ds Max 2011 и ARION.
После первого теста, я как уже упомянул выше, решил сделать тесты с аналогичными визуализаторами. За основу был взят Maxwell Render, как наиболее уже устоявшийся стандарт среди unbiased визуализаторов и с большим набором возможностей.

Модель сцены импортированная и настроенная в Maxwell Studio.
Далее, то же самое было сделано для ARION. Т.к. сцена создавалась изначально в 3ds Max, то в нем я применил Daylight system и шейдеры Arch&Design для визуализации с помощью iray.

Сцена в 3ds Max Design 2011, с открытыми параметрами iray renderer.
Тесты показали следующий результат. Около получаса потребовалось Maxwell Render, что бы визуализировать эту простенькую сценку до приемлемого качества. Но вот совершенно иное время показали GPU Accelerated визуализаторы. Iray потребовалось всего 10 минут что бы получить представленный нижу результат, а вот ARION при затраченных 12 минутах показал еще и не самый лучший результат в картинке.

Финальные рендеры тестовой сцены.
В целом, более чем в 2 раза быстрее, чем Maxwell render оказался именно iray. И это только при использовании NVIDIA Quadro FX 1800. Т.к. это простая сценка и особой сложности в ней нет, по этому результату сложно сказать, что все же он быстрее или лучше. Теперь буду создавать сцены с большим количеством объектов и разными поверхностями.
Главное, это сейчас получить V-Ray и на его основе сделать полностью все тесты со сценами.
Конечно, не хватает интерактивных возможностей iray for 3ds Max, так же не очень корректно он работает в редакторе материалов, при этом программа даже подвисает или некорректно дает результат с разными шейдерами. За это конечно стоит пинать разработчиков, но надеюсь они решат все эти задачи к выходу следующей версии 3ds Max 2012.

четверг, 7 октября 2010 г.

3ds Max Design 2011: iray renderer

Наконец свершилось! Дождался я своего релиза Subscription Advantage Pack для 3ds Max.
Все уже давно ждали, когда же интегрируют iray renderer в 3ds Max, дождались...
...теперь можно использовать GPU в качестве мощного ускорителя для визуализации трехмерных сцен. iray renderer поддерживает практически все CUDA GPU's от NVIDIA. Вы можете использовать практически всех представителей линеек NVIDIA GeForce, NVIDIA Quadro и NVIDIA Tesla.

Я лично использую NVIDIA Quadro. Но стоит вопрос при том, какую модель GPU использовать и на какие её качества стоит обращать внимание. Первое это конечно вычислительные ядра CUDA, чем их больше, тем лучше, далее идет объем памяти, даже можно скзать он один из самых важных показателей, т.к. все данные для вычислений хранятся именно в памяти GPU. Если памяти не так много (меньше 1Гб), то при визуализации больших сцен, используется и основная оперативная память, а это конечно сказывается на производительности. Так же не стоит забывать и о пропускной способности шины графической памяти, чем она больше, тем быстрее будут выполняться вычисления.
Первый тест (блин комом)
Как только я получил свою копию Subscriprion Advantage Pack, я решил провести несколько тестов с экстерьером. Все тесты делались в Autodesk 3ds Max Design 2011 SP 1 Subscription Advantage Pack.

Сцена с экстерьером здания.
В сцене порядка 815 объектов, к каждому из них применены материалы Arch&Design, в сцене достаточно много отражающих и преломляющих поверхностей.
Визуализация выполнялась на моей основной рабочей станции с CPU Intel Core 2 Duo E6600, 6Gb RAM и GPU NVIDIA Quadro FX 1800.
Первый тест мы выполнили визуализатором mental ray 3.8.

Время визуализации этой сцены 6 минут 30 секунд.
Как видно из приведенного выше примера, все достаточно просто классический визуализатор выполнил свою задачу достаточно быстро (рендер кадра Full HD). При этмо качество изображения достаточно высокое.
А вот теперь перейдем к iray. Тут меня ожидал достаточно большой ком и блин.
Первый тест с iray я сделал практически просто указав время визуализации 6 минут 30 секунд. Результат мягко говоря не тот, что я ожидал.

Тест визуализации экстерьера с помощью iray 1.1.
Т.к. данный визуализатор и вообще весь принцип iray очень жестко зависит от времени визуализации, мы получили совершенно отличающийся результат от того, что мы получили в рендере классическим mental ray.
Как видите очень много просто недовизуализированных участков на изображении. Но это не столь печальный результат. Это можно списать на саму модель GPU с всего 64 вычислительными ядрами и 768Мб памяти.
Стоит только чуть изменить настройки и методы вычисления, сразу же можно улучшить результат.
Настройки для третьего теста были заданы вручную (показано на иллюстрации ниже).

Параметры для третьего теста iray.
Третий тест был выполнен чуть дольше по времени, но при этом благодаря вручную выставленных параметрам удалось повысить и качество изображения.

Результаты визуализации с помощью iray и вручную выставленных параметров.
А вот теперь о наболевшем, хоть картинка и считается достаточно быстро (если учесть что чем мощнее GPU тем быстрее и лучше будет получаемый результат), то мы так и не видим пока достаточно качественно реализованного продукта. Не хватает интерактивности в визуализации (об Active Shade вообще можно забыть), совершенно криво реализована поддержка многих шейдеров, и нет толковой реализации в редакторе материалов, из-за чего макс просто виснет и начинает долго думать при открытии редактора материалов.
Дальше мы поиграемся с интерьерами, тут как раз iray может показать высокий результат в визуализации, но при этом, мы поиграемся и с различными шейдерами и материалами.

P.S. Потопаю сегодня к коллегам из комп слонов, клянчить железки для тестов... скоро тесты на разных GPU.

пятница, 10 сентября 2010 г.

В шесть (x6) раз быстрее!!!

Итак, пришло время анонсов. После 2х месяцев простоя, молчания и возвращения из ссылки. Я наконец закончил аж две статьи, и на сегодняшний день, полностью анонсирую первую статью. С сегодняшнего дня я переключаюсь на серию статьей о GPU Accelerated приложениях использующих возможности технологии NVIDIA CUDA или OpenCL.
Первая статья из цикла полностью посвящена уже готовому и долгожданному приложению, Adobe Premiere Pro CS5. А именно новейшему движку воспроизведения\кодирования видео, Adobe Mercury Playback Engine.

Статья опубликована на страницах on-line журнала render.ru. В статье мы рассмотрим некоторые из новых возможностей программы Adobe Premiere Pro, и конечно основной упор сделаем на GPU Accelerated возможностях программы.

Мы провели тест с воспроизведением видео и при кодировании секвенции с помощью Adobe Mercury Playback Engine. Используя современную рабочую станцию от компании FORSITE, мы сравнили, насколько высок прирост при кодировании видео с помощью современного CPU (Core i7-960 3,2GHz) и с помощью GPU NVIDIA Quadro FX 3800 (со 192 ядрами CUDA).

Результат теста вы можете видеть на иллюстрации выше. С применением GPU версии, времени было затрачено в 6 раз меньше, чем, при применении CPU версии и это только на Quadro FX 3800.
Более детально, вы все узнаете из статьи "Обзор нового GPU accelerated движка в Adobe Premiere Pro CS5".

понедельник, 30 августа 2010 г.

Возвращение из ссылки...

Приветствую всех! Наконец вернулся из недельного тура в ссылку на север. Отдохнув и поразмыслив над кучей вопросов, а так же собрав огромное количество различного материала для статей я полностью готов к реализации своих идей.
Куда же я ездил? Все просто на северный Урал, в "Пермь великую" - Чердынь.
Вообще этот казалось бы забытый городок просто не может вызвать какого то интереса у большинства людей, но на деле оказывается все с точностью, да на оборот. Этот город является одним из древнейших городов России и настолько сильно связан с историей нашего государства что там куда не брось свой взгляд да попадется какая нибудь древность значимая для нас с вами и нашей истории.

Вид на город Чердынь с низу по течению реки Колва.
Городу уже более 550 лет. Точно кто основал город до сих пор не могут сказать ни одни историки, но то что на этом месте были поселения еще аж в 1370-х годах это точно. Но в летописях указывается 1451 год когда в первые пришли Русские в эти края и начали обустраиваться.

Берег реки Колва.
Город так же сыграл огромную роль в покорении Сибири и торговых отношениях между существовавшими тогда народами Руси и Сибири.

Старые складские купеческие бараки на берегу реки (примерно конец XVII, начало XVIII веков).
Особую роль здесь занимает и Церковь, ведь в Чердыни одни из самых красивых и очень необычных храмов. Например храм Вознесения представляет собой не только место где проводились службы, но и является отличным местом для наблюдения за огромнейшей территорией.

Храм Вознесения (1750 - 1854 годы).
На Троицком холме в городе Чердынь построен целый большой храмовый комплекс который просто изобилует огромным количеством интересных построек и каждая из них играет свою роль в жизни древней Чердыни.

Комплекс их храмов на Троицкой горе.
Более подробно и полную серию снимков Вы сможете увидеть уже скоро на моей странице вконтакте и facebook. Так же часть из фотоснимков и сделанных видео будет уже использована в ближайшее время в моих статьях.

суббота, 21 августа 2010 г.

В ссылке на севере...

Решил я очередные видео-введения к статьям. Послал себя в ссылку на север Урала точнее Пермского края, первый Русский город на Урале - Чердынь. Карта прилагается. Так что, кто меня потеряет смотрите где искать.

Просмотреть город Чердынь на карте большего размера

Подробнее можно узнать из википедии, но т.к. я там прожил всю свою сознательную молодость (ну до лет этак 15-ти) то мне лучше будет рассказать лично обо всем в кратких видео-введениях к статьям. Ссылка на статью в википедии>>

Вернусь 29 августа с фотками и видео, будет интересно ) не зря городу уже 559 лет.
После возвращения:
- Дописываем статью об SSD накопителе Intel
- Дописываем статью о Adobe Mercury Playback Engine
- Продолжаем работу над статьей о Cerebro (а то столько написано, а дописать то совсем ничего!!! пару разделов и сравнение с другими программами)
- Начинаем статью о mental images iray (наконец то!!!)
- Пишем in-depth review о NVIDIA Quadro (Fermi based architecrure)
В общем мне главное отдохнуть эту недельку а потом мы возьмемся за всех и все. Бугагага (лано, шучу))) ).

воскресенье, 1 августа 2010 г.

Видео презентаций с SIGGRAPH 2010


Итак, как я обещал, выкладываю видео, которые я записал по ходу презентаций с SIGGRAPH 2010.
Первые две презентации, это презентации от Autodesk. Прошу прощения за не совсем большое разрешение и качество, т.к. писалось все с on-line трансляции, которая проводилась ночью на Autodesk AREA.

- Презентация Creative 3D Finishing (о применении в производстве нескольких приложений и объединение их в едином pipelin'e (рассмотрены Autodesk Smoke 2010 for Mac, Autodesk Flame 2010, Autodesk Maya 2010).
Ссылка для загрузки>> (Фал в формате .mp4 res. 800x450, смотреть с помощью QuickTime или аналогичного плеера поддерживающего h.264 кодек, размер 795Мб (!!!))

- Презентация Autodesk, NVIDIA & mental images (разработчики из NVIDIA показали новую версию PhysX и ее интеграцию в Autodesk 3ds Max, а представители mental images продемонстрировали интегрированный в рабочее пространство 3dsMax визуализатор iray).
Ссылка для загрузки>> (Фал в формате .mp4 res. 800x450, смотреть с помощью QuickTime или аналогичного плеера поддерживающего h.264 кодек, размер 276Мб (!!!))


Технологические презентации с SIGGRAPH 2010:
Материал предоставлен компанией NVIDIA и содержит ряд презентаций опубликованных после представления на SIGGRAPH 2010.

- iray and Cloud Computing , Alexander Keller (mental images)
В этой презентации представители mental images рассказывают об основным методах реализации визуализации с помощью GPU в iray, о проблемах с которыми могут столкнуться пользователи и о том, как их решить, так же продемонстрирован новый сервис облачных вычислений и подход к его реализации.
Ссылка для on-line просмотра>>

- Rapid GPU Ray Tracing Development with NVIDIA OptiX, Austin Robison (NVIDIA Corporation)
Эта презентация дана в продолжение темы реализации GPU ускорения для вычислений трассировки луча в приложениях для визуализации. Презентация показывает возможности NVIDIA OptiX и разработку приложений с применением OptiX.
Ссылка для on-line просмотра>>

- OpenGL 4.0 for 2010, Barthold Lichtenbelt and Mark Kilgard (NVIDIA Corporation)
Презентация по возможностям и реализации Open GL 4.0 на NVIDIA GPU's в 2010 году.
Ссылка для on-line просмотра>>

- APEX : Creating scalable immersive game environments, Monier Maher, Hermes Lanker, and Aron Zoellner (NVIDIA Corporation)
Эта презентация так же больше ориентирована на разработчиков приложений, но может быть полезна всем, кто интересуется тем, как работают современные технологии и как их можно применять в разработке приложений и современных игр.
Ссылка для on-line просмотра>>

- Quadro to the Power of Fermi (Scott Fitzpatrick, Product Manager, NVIDIA)
Презентация NVIDIA посвященная новому поколению GPU NVIDIA Quadro на основе архитектуры Fermi.
Ссылка для on-line просмотра>>

Часть из этих вопросов и материалов презентаций мы рассмотрим в следующих статьях, которые будут опубликованы в сентябре - октябре 2010.

воскресенье, 25 июля 2010 г.

Result I - Stress test "Water Fall"

Итак, подвел первый итог месячного тестирования рабочей станции от FORSITE.
Тест заключался в расчете большого массива данных - симуляция динамики с помощью Maya nParticles & Maya Particles и визуализация полученной секвенции в формате HD 720p.
Сцена была создана моим коллегой skif'ом из проекта Last Hunt, поэтому мы вкладываем не всю секвенцию, а только часть (авторские права и т.п.). Но для более полного представления мы предоставим несколько скриншотов.

Сцена с водопадом в Autodesk Maya 2011.
При вычислениях конечно же работал больше всех сам центральный процессор. Тут стоит отметить, что при визуализации как и полагается все возможности процессора были задействованы на 100%. Но, при вычислениях самой динамики подводило больше всего программное обеспечение. Т.к. алгоритмы динамики особенно в nParticles не особо то много-поточные, а наоборот в большинстве своем задействуют только одно ядро. Тут помогла технология Intel TurboBoost используемая в последних моделях процессоров Core i7 и Xeon.

Окно Windows Performance Monitor (Windwos 7 Ultimate x64 RUS)
Ну, хватит о технических моментах, лучше посмотреть видео которое мы собрали из того что было.

Видео Water Fall test.
Стоит так же упомянуть количество частиц на пике симуляции, сцена насчитывает порядка 1064485 частиц, и это далеко не предел.

Сцена с водопадом и число частиц на данном кадре (в Attribute editor).

Теперь о проблемах которые нам предстоит решить.
- Использовать ли сторонние симуляторы, например RealFlow?
- Использовать ли самописные модули, ориентированные на GPU вычисления?
- Использовать ли NVIDIA PhysX? (!)
- Расширить ли возможности NVIDIA PhysX или написать своей симулятор для жидкости с использованием PhysX? (!)
Отмеченные символом (!) вопросы на самом деле уже решаются и достаточно бурно, сейчас мы рассматриваем основательно применение новой версии PhysX. Есть только один момент, нам требуются программисты. Благо энтузиастов хватает. Ну а моя задача представить как это будет реализовано в финале.
Далее: "SSD накопители, о чем будет обзор?"

четверг, 15 июля 2010 г.

Частицы...

На зимнем CG Event 2009, представители компании Intel показывали как работают их современные процессоры, которые могут автоматически увеличивать частоту для повышения производительности в вычислениях.
Ну а так как у меня новая рабочая станция как раз обладает одним из топовых процессоров Core i7, то я не замедлил эту фичу проверить на личном опыте.
Благодаря моим друзьям из проекта Last Hunt мне мне была предоставлена сцена с водопадом. Водопад выполнен с помощью двух систем частиц - nParticles и генерируемые ею стандартные Particles.

Сцена с водопадом из проекта Last Hunt.
Мне же предстояло выполнить визуализацию секвенции кадров, но перед тем как это сделать, я решил предварительно закэшировать частицы для ускорения последующей визуализации.
Но есть один очень важный момент. Это алгоритмы используемые в Maya и её nParticles и Particles. Стандартная система частиц в Maya задействует все доступные процессоры (при условии что они представлены физически - либо несколько процессоров или же несколько ядер на одном кристалле, а так же и то и другое вместе), кроме логических (технология Intel Hyper-Threading). А вот система частиц nParticles способна задействовать только одно ядро, даже в Autodesk Maya 2011.

Окно системного монитора при вычислениях в сцене с водопадом.
На предсталвенном выше изображении видно как задействованы практически все физические ядра процессора Core i7.
Это как раз осуществляются вычисления стандартных частиц. А вот при вычислениях nParticles процессор активирует технологию Intel TurboBoost которая повышает частоту ядра, на котором выполняется больше всего вычислений.

Окно программы CPU-Z 1.55 в котором видна номинальная частота процессора и текущая при применении Intel TurboBoost.
Таким образом можно комбинировать сразу несколько ресурсоемких задач и при этом получать автоматический прирост производительности. Хотя тут стоит поработать самим программистам из Autodesk и сделать в конце концов нормальную поддержку нескольких ядер и потоков как в стандартной системе частиц, так и в nParticles.
Но в целом я остался доволен новыми Core i7. Так же стоит заметить, что при должной комплектации рабочей станции и сбалансированности (как в рабочих станциях FORSITE) мы получаем высокую производительность в самых разных задачах.
После завтра вы увидите готовое видео этой сцены с водопадом.

среда, 14 июля 2010 г.

CUDA accelerated applications & NVIDIA Quadro GPU’s

Наконец добрался до первых тестов и замеров производительности, в приложениях использующих технологию NVIDIA CUDA. На этот раз я пошел достаточно простым путем – взял стандартное приложение из CUDA SDK 3.1 и мой любимый пример N-Body Simulation.
Данный пример отлично показывает производительность GPU при вычислениях с одинарной точностью, а так же значение производительности в GFLOP’s.
Первая была протестирована карта NVIDIA Quadro FX 1800, которая используется в моей рабочей станции уже на протяжении последнего года. Данная модель GPU показала, как и ожидалось производительность в 94 – 99,8 GFLOP’s. Иногда конечно и выскакивала за рубеж в 100 GFLOP’s.

Первый пример на рабочей станции с Quadro FX 1800 768 Mb.
При этом, хочется отдельно заметить, что частота воспроизведения кадров была равна 26 – 34 fps. Что конечно меня впечатлило не только от самой GPU, так и всей системы в целом. Ведь приложение, которое задействовалось, использует и возможности CPU (буквально 40 – 50% @ Intel Core 2 Duo).
На второй станции от компании FORSITE (http://www.forsite-company.ru/) была задействована модель NVIDIA Quadro FX 3800. Она же, в свою очередь, обладая 1Gb GDDR3 памяти, и 192 ядрами CUDA, выдала результат, который я конечно и ожидал, но, хотел убедиться лично, в 240 – 304 GFLOP’s. Это особенно полезно, когда специалистам приходится использовать GPU accelerated средства визуализации, о чем мы погорим ниже.

Пример на рабочей станции FORSITE с Quadro FX 3800 1024 Mb.
Стоит отметить, что станция FORSITE выполнена достаточно качественно, и за счет использования высокоскоростных элементов памяти и накопителей скорость обработки данных, конечно же, возрастает. Процессор же нагружен был максимум на 12 – 20% при этом благодаря наличию в Intel Core i7 технологии Intel TurboBoost, мы получили возможность увеличения производительности.
Но, а как же обстоят дела в приложениях специально ориентированных на применение GPU в качестве мощнейшего сопроцессора? Ответ на этот вопрос наглядно может дать демонстрационное видео, сделанное мною по ходу экспериментов с визуализатором Octane Render.

Сравнение производительности при визуализации в Octane Render на NVIDIA Quadro FX 1800 & NVIDIA Quadro FX 3800. Материал сделан специально для компании FORSITE.
Ну что могу сказать, различия в производительности между этими двумя GPU заметны невооруженным взглядом. Особенно при визуализации на GPU NVIDIA Quadro FX3800. Главное то, что сам GPU практически не превышает свою температуру и справляется с задачей на тех частотах, которые были заданы в спецификации для производителей.
Тут конечно так же заметно, что при применении Quadro FX1800 частота кадров обновления сцены в Octane Render равна порядка 1 – 3 fps, на Quadro FX3800, все намного лучше, обновление сцены и выполнение навигации по ней на этой GPU одно удовольствие. Плюс конечно, достаточно мощная система в целом.
Но на этом всем мы не останавливаемся, и уже скоро здесь будут представлены результаты и других визуализаторов, новый Buckspeed SHOT и легендарный mental ray с технологией iray.

суббота, 10 июля 2010 г.

Запуск.


Итак, наконец пришло время, как мы начали полностью заниматься не только приложениями и их обзорами, но и небольшой исследовательской деятельностью. На этот раз, я запускаю блог посвященный исключительно решениями для параллельных вычислений, основанных на NVIDIA CUDA. Блог я назвал n:PhysX потому как основной объем материала в нем - применение PhysX в CG. Но не одним PhysX мы будем едины. Т.к. мы будем исследовать и другие решения основанные на NVIDIA CUDA, то мы конечно рассмотрим здесь и системы визуализации, использующие возможности GPU для ускорения вычислений.
Первым нашим тестом будет анализ возможности увеличения производительности в CUDA приложениях за счет увеличения количества GPU в системе. Насколько актуально решение, как будет повышаться производительность и многое другое.

Итак, добро пожаловать! :)