>1) какую фс использовать, какие параметры можно или нужно использовать при форматировании,
>чтобы достичь хорошей производительности? Если семейство ext[34], рекомендую статью:
* http://wiki.centos.org/HowTos/Disk_Optimization
Стоит иметь ввиду, что все это, особенно магипуляции кэшем на запись, опасны.
Так же, есть немного маргинальный вариант (боюсь, сейчас начнеться холивар, но я эту ФС видела в production всего один раз) с raiser3, который оптимизирован под маленькие файлы
>2) вопрос оптимизации ядра, может есть какие то функции в ядре, которые
>надо включать отдельно?
Кэширование, в зависимости от объема ОЗУ через sysctl. Я только однажды упиралась в дисковую подсистему на тяжелой системе (XFS, CentOS, сервер под бэкапы, ~24TB, сидел по i/o из-за большой фрагментации ФС, решилось встроенными в XFS средствами для онлайн-дефрагментации), ядерный тюнинг не требовался. Советую погуглить, в том числе по этому ресурсу.
>3) подстройки sysctl. вероятно есть варианты по изменению различных буферов?
См. выше. Я бы поигралась со свапом и дисковыми кэшами на чтение.
>4) может еще есть какие-то варианты оптимизации ОС и самой самбы?
>5) есть ли какие-то утилиты для тестирования шар на самбе? типа там
>последовательное/произвольное чтение/запись в каталоги.
Не использовала Samba на HighLoad системах, возможно, Вам подскажет кто-то еще. А так, обычно используется bonnie++ и iometr для тестов)
Советую Вам обратить большее внимание не на ядерные параметры, а на raid-массив (шпиндели, их количество, очень влияют и на надежность массива, и на его скорость, гораздо больше чем любой тюнинг фс или ядра)
Общие правила:
1. raid1 Самый дорогой(с точки зрения потери гигабайт) быстрый по скорости (очень быстрый на чтение, но медленный, медленнее одиночного диска, на запись), самый надежный (переживает вылет половины дисков из массива, обычно делают из двух дисков)
2. raid5 Самый дешевый, средний по скорости работы (быстрое чтение, тормозная запись), самый ненадежный (при вылете любого диска превращается в тормозной аналог raid0 и русскую рулетку, может развалиться в любой момент, даже во время ребилда массива)
3. raid6 средней дешевости (два диска массива используются для контроля четности, для очень больших массивов это незаметно, а большая надежность удобнее raid5), тормозной в основной жизни, и просто безумный тормоз при вылете одного (молчу о двух) дисках, но самый надежный из всех массивов
4. raid10 самый быстрый, довольно дорогой, более-менее надежный (иногда живет при вылете двух дисков)