
Сообщение от
101
Все заморочки крутятся вокруг пропускной способности шины снабжающей графическую карту из ОЗУ данными и способностью алгоритма обрабатывать малый объем данных на большом количестве потоковых ядер.
Одним словом, если при тех сотнях потоковых ядер в GPU все данные не влезают в память GPU, а также если требуется частая передача данных по шине памяти, то ускорения не будет.
Плюс все тормозится согласованием единого стандарта языка разработки OpenCL, спецификация которого отстает от тех инструментов, которые каждый из разработчиков видеокарт предлагает для своих железячек.