Ну я так и понял что есть проблемы при программировании однако писателям шейдеров это не мешает, просто дело в том что существует инертность, консерватизм, можно назвать по разному, но это так, и так всегда было. Вспомнить хотябы переход на 2-х ядерные процессоры хардиндустрия уже вовсю их штампует, а софта еще нет.
Также современные ГПУ уже перешли стадию ускорения графики в играх, осталось подбить софт, хотя и он есть если посмотреть что было реализовано в рамках CUDA (пусть сыро, но всёж) это и рендеринг видео фильмов высокого разрешения, и построение изображений методом трассировки лучей, и расчет физических эффектов в играх, и чисто научные расчеты
[Для просмотра данной ссылки нужно зарегистрироваться] "...По словам основателей проекта Folding@Home, если 1% владельцев видеокарт с поддержкой CUDA примет участие в распределённых вычислениях, то проект сможет выйти на первое место среди суперкомпьютеров с производительностью около 60-80 петафлопс..."
И замечу что ты не прав что "...с точки зрения железа, центральный процессор намного сложнее устроен..." - с точки зрения железа 1 процессор Коре 2 Дуо содержит ок. 280 млн. транзисторов из которых примерно половина приходится на L2 кэш, а чип GT200 видеокарты содержит ок. 1,4 миллиарда транзисторов, большая часть которых приходится на шейдерный домен с 240 универсальными потоковыми процессорами. Если я ничо и не понимаю в программировании, о чем открыто заявляю, однако с железом у меня получше.
[Для просмотра данной ссылки нужно зарегистрироваться] "...С точки зрения производительности и универсальности они, с некоторыми оговорками, все больше напоминали обычные центральные процессоры: максимальная длина и сложность шейдерных программ росла с каждой новой версией DirectX, пока не стала практически неограниченной в Shader Model 3.0..."
И последнее: я не совсем понял - ты хочешь сказать, что вычислительные ресурсы ГПУ не задействуют все свои гигафлопсы? Откуда тогда берется прирост в тех же играх на одинаковых в общем чипах, на одинаковых частотах, но с различным количеством потоковых процессоров? Если вычисления заложены то ты думаешь что существует простой шейдерного домена или он загружен на 5-10%? Допускаю что есть очень старые игры в которых так и есть, но в большинстве своем вычислительной мощи даже недостаточно. Другое дело что оптимизации хромают и всё такое, ведь можно выжать и больше с того же терафлопса, то есть чип то выполняет эти терафлопсы - вопрос только с какой эффектифностью, но опять же причем тут ГПУ, ведь полно кривых неоптимизированных программ исполняющихся на ЦПУ, да ты и лучше меня это знаешь впрочем.