Потестил еще
Выяснил интересный момент, не очевидный с первого взгляда.
У меня (atom, ssd, fs sync) параметр fifo_batch стоял в 1. Выяснилось, что если его вернуть в дефолтные 16, скорость линейной записи в ОДИН поток возрастает примерно в два раза, а на отзывчивости и на записи в два потока это сказывается несильно - как зависал gedit на 5-10 секунд, так и виснет, скорость двух потоков тоже меняется не более чем на 10%.В общем то нелогичное поведение, учитывая что при тестах в режиме sync количество записанных транзакций в секунду больше 100 было редко - соответственно нагрузка на обсчет этого всего должна быть минимальной (речь идет о линейной записи в один поток).
В общем странно.
Учтите это, если у кого будет похожая конфигурация (sync fs, elevator=deadline).
P.S. nr_requests c дефолтных 128 увеличил до 512, его длины явно не хватало как я понял из iostat. На результатах заметным образом это не сказалось.