Ниче не выйдет. Цитирую ридми:
"Звуковые файлы должны быть записаны с частотой оцифровки 11025 Гц, в монорежиме, в 16-битном формате."

Т.е. можно смикшировать в один канал. Но тогда громкостью одного относительно другого управлять нельзя будет.
А кроме того, там под 100 файлов в озвучке. Каждый надо будет переделать...