При всей унификации вычислительных блоков и их инфраструктуры в архитектуре современных процессоров, всеровно от бутылочного горлышка полностью не избавились. И даже в рамках архитектуры одного ядра есть узкие места, чтобы ядро задействовать по полной, нужно исполняемый код оптимизировать. Код неоптимизирован и при видимой диспетчером задачь далеко не 100% загрузке, ядро загружено на 100% в узком месте.
С Вашей видеокартой GTX560 TI разгон должен давать прибавку fps, почему Вы не получили толк, не ясно. Хотя если разгоняли ЦП c GTX460, то возможно, что видюха сразу уперлась.
У Cartoon GTX470, можно посмотреть бенчмарк или установить самостоятельно, при какой частоте ЦП производительность начнет ограничиваться видеокартой, я думаю это гораздо выше номинала, так, что смысл гнать есть.