Brick Top, я о том, что распараллелить задачу под 84 процессора и написать ее же решение под GPU это как говорят в Одессе две большие разницы

программируя под видеочип приходится решать огромное количество проблем, связанных не с распараллеливанием задачи, а с особенностями GPU.
да, есть задачи, с которыми видеокарта может справиться гораздо лучше (в общем случае обсчет графики это тысячи НЕЗАВИСИМЫХ потоков). да, написать под видеокарточку можно все что угодно, но Вас устроят те 5-10% производительности от пика?
помню в какой-то статье было очень хорошо описано, что программируя под процессор, человек очень часто не задумывается о его устройстве, а программируя под GPU Вы вынуждены знать все подводные камни...
да и потом.... видеопамять тоже не резиновая.... что если задача требует не только вычислительной мощности, но и огромных кусков памяти?
кстати, давно я уже не слышал о кластерах на х86 процессорах... посмотрите
[Для просмотра данной ссылки нужно зарегистрироваться], все топовые кластеры далеко не на х86
а Вы не задумывались о том, что не просто так производительность GPU превышает производительность процессоров во столько раз? с точки зрения железа, центральный процессор намного сложнее устроен...
возможно за чипами, подобными GPU, будущее, но в настоящий момент... ну.. если Вы найдете информацию о том, что из видюхи удалось выжать хотя бы 50% от пика в какой-либо сложной задаче, я готов признаться в собственной несостоятельности....
а насчет Larrabee... вот когда оно появится, тогда можно будет о нем разговаривать... а сейчас хз... каждая компания говорит, что их поезда самые поездатые

в любом случае видеочипы не смогут с кластерами конкурировать в ближайшее время

даже если будет простой и подходящий инструментарий... просто это было бы совсем неверным маркетинговым ходом