The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Opendedup - файловая система с автоматическим объединением д..."
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от opennews (ok) on 28-Мрт-10, 21:41 
В рамках проекта Opendedup (http://www.opendedup.org/) ведется работа по созданию новой распределенной файловой системы SDFS (http://code.google.com/p/opendedup/), специально оптимизированной для использования в качестве хранилища для виртуальных окружений, подобных XEN, KVM или VMware. Главная особенность новой системы заключается в поддержке автоматического объединения дубликатов - для одинаковых блоков данных сохраняется только одна копия, что значительно повышает вместимость файловой системы при хранении похожих по базовой начинке виртуальных окружений.


Максимальный размер общей файловой системы на базе SDFS ограничен 8 Петабайтами, максимальный размер одного файла - 250 Гб, предусмотрена возможность подключения в единый пулл до 256 разных хранилищ, по 32 Терабайта в каждом. Исходные тексты SDFS написаны на языке Java и доступны в рамках лицензии GPLv2. Файловая система реализована через FUSE-модуль и не привязана к конкретной программной платформе (в настоящее время доступен ...

URL: http://www.cio.com.au/article/340870/open_source_deduplicati...
Новость: http://www.opennet.dev/opennews/art.shtml?num=25983

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Opendedup - файловая система с автоматическим объединением д..."  +4 +/
Сообщение от RapteR email(ok) on 28-Мрт-10, 21:41 
Ява через фузи... Куда катится мир... Или я упустил новость, где интел выпустил процессор Intel Sixty-Four-Core с частотой каждого ядра по 20 GHz и L2 кэшем 128 Mb по цене 5$ за камень?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

29. "Opendedup - файловая система с автоматическим объединением д..."  +2 +/
Сообщение от Stocker on 29-Мрт-10, 12:14 
Не, вы упустили новости о выходе java после версии 1.2
О jit-компиляторах, hotspot vm...
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору

3. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от anonymous (??) on 28-Мрт-10, 21:42 
Вместе с same page merge (или как его там назвали) еще больше возможностей для оверселлинга :(
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

16. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от pavlinux (ok) on 29-Мрт-10, 03:30 
KSM - Kernel Same Page.
Тока надо чтоб все софтины умели делать: madvise(new_block->host, size, MADV_MERGEABLE);
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

5. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от devl547 on 28-Мрт-10, 21:47 
Уже давно есть lessfs (http://www.lessfs.com/)
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

7. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от Онаним on 28-Мрт-10, 22:24 
Это бы очень интересно смотрелось в качестве фичи файловой системы, но делать отдельную ФС под одну такую фичу...
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

8. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от sHaggY_caT (ok) on 28-Мрт-10, 22:31 
>Файловая система реализована через FUSE-модуль

И без этого в Xen диски тормозят, они еще и через fuse и на java :(
Жесть вообще какая-то :(

З.Ы. сама и идея и фича очень полезная, особенно если интегрировать ее с, например, централизованной установкой темплейтов, почти с десяток лет применяется многими на проприетарной Virtuozzo(vzfs)

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

9. "Opendedup - файловая система с автоматическим объединением д..."  –3 +/
Сообщение от Tav (ok) on 29-Мрт-10, 00:06 
Как всегда, вместо того, чтобы осуждать как оно работает, все обсуждают на чем оно написано. Просто установите и посмотрите, будет оно тормозить или нет в вашем конкретном случае.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

15. "Opendedup - файловая система с автоматическим объединением д..."  +3 +/
Сообщение от аноним on 29-Мрт-10, 03:17 
Тормозит, на элементарных workload'ах. И жрет немерянно памяти. Вы хотели чуда?
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

10. "Opendedup - файловая система с автоматическим объединением д..."  +2 +/
Сообщение от XoRe (ok) on 29-Мрт-10, 01:04 
> Производительность выполнения операции поиска и объединения дубликатов составляет около 150 Мб/сек.

Интересно, как они её рассчитали.
Может мне потестировать её на моем ноуте с винтами на 5400 об/с ? =)

> Исходные тексты SDFS написаны на языке Java и доступны в рамках лицензии GPLv2.

Наверное тут нужно возрадоваться, что не на JavaScript.

P.S.
Одно радует - в ядро не возьмут.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

11. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от аноним on 29-Мрт-10, 01:45 
> максимальный размер одного файла - 250 Гб

Нахрена в наше время нужна ФС с такими ограничениями?

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

19. "Opendedup - файловая система с автоматическим объединением д..."  +1 +/
Сообщение от аноним on 29-Мрт-10, 06:45 
>> максимальный размер одного файла - 250 Гб
>
>Нахрена в наше время нужна ФС с такими ограничениями?

практически для всего

Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору

31. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от ig0r (??) on 29-Мрт-10, 13:30 
позвольте уточнить, на каких задачах в наше время такого ограничения не достаточно?
Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору

12. "Opendedup - файловая система с автоматическим объединением д..."  –1 +/
Сообщение от аноним on 29-Мрт-10, 01:46 
Дедубликация - приятная фича ФС. Если это самоцель, продукт можно сразу выкинуть, потому что сразу понятно, кто его писал. Не дает линуксоидам покоя мощь ZFS.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

17. "Opendedup - файловая система с автоматическим объединением д..."  +1 +/
Сообщение от минона on 29-Мрт-10, 05:18 
линуксоид никогда бы не писал подобную хрень на java.
вы что-то явно путаете.
на каком-нибудь питоне, перле,.. да и то, в пьяном угаре. и назвал бы типа похмелфс.
да и в zfs есть гораздо более интересные вещи, чем эта дедупликация.
Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

20. "Opendedup - файловая система с автоматическим объединением д..."  –2 +/
Сообщение от mma on 29-Мрт-10, 07:05 
ой, мощь ZFS  таковой является только на бумаге, при практическом использовании этой мощи неожиданно натыкаешся на моменты которые часть этой мощи делают бесполезной.
Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

27. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от Andrew Kolchoogin on 29-Мрт-10, 11:46 
Какие-такие моменты?

Нельзя ли аргументировать свои утверждения?

Ответить | Правка | ^ к родителю #20 | Наверх | Cообщить модератору

46. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от Anonim (??) on 30-Апр-12, 00:14 
Для линукса ее нет )), что автоматически делает бесполезными все ее фичи
Ответить | Правка | ^ к родителю #27 | Наверх | Cообщить модератору

34. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от аноним on 29-Мрт-10, 17:56 
ой, кончайте свистеть или аргументируйте
Ответить | Правка | ^ к родителю #20 | Наверх | Cообщить модератору

13. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от pavlinux (ok) on 29-Мрт-10, 02:59 
> особенность новой системы заключается в поддержке автоматического объединения
> дубликатов - для одинаковых блоков данных сохраняется только одна копия,

Ага....

Имеем, последовательность байт - ABCDE, и два R/W процесса X и Y :
1-ая итерация:
[X]: read() --> [ ABCDE ]  
[Y]: read() --> [ ABCDE ]  

X обновил C

[X]: write() -> [ ABSDE ]  
[Y]: write() -> [ ABS... опа, а должна быть C

Файловая сиcтема: Мля, блоки не равны, надо делать двойника, но с измененной S на C
повтор:
[Y]: write() -> [ ABCDM ] # обновили E

2-ая итерация:

X вернул C, на место S

[X]: write() -> [ ABCDM ... опа, а должна быть E
Файловая сиcтема: Мля, блоки не равны, надо делать двойника, но с измененной M на E
[Y]: read()  -> [ ABCDM ]

Файловая сиcтема: Опа, а они равны, надо объединять?!

Итого: имеем 4 блочных клона вместо двух разных файлов.
Аппроксимируя по времени, эти 4 клона превратятся в 4 полных файла.

А 100 процессов, а 1000, а 10000 ???

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

22. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от edo (ok) on 29-Мрт-10, 08:36 
Вы какой-то странный COW придумали ;)
Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору

32. "Opendedup - файловая система с автоматическим объединением д..."  +1 +/
Сообщение от анонимный аналитик (??) on 29-Мрт-10, 14:22 
гораздо более интересно глянуть на поведение системы, когда на забитом под завязку разделе, с кучей объединенных блоков потребутся внести изменения в один из общих блоков
Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору

38. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от Warhead Wardick on 29-Мрт-10, 18:42 
И что же там "гораздо более интересно"-го? COW придумали лет 40 назад, под него даже есть железная формальная математика (насколько помню MIT-овцы делали). Вот всё тоже, но с блоками памяти (RAM) ядро проделывает и это ни кого не удивляет ...
Читайте паря книжки - оне рулез!(С)FIDO
Ответить | Правка | ^ к родителю #32 | Наверх | Cообщить модератору

14. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от pavlinux (ok) on 29-Мрт-10, 03:15 
У меня была аналогичная ситуация, но когда 4 qemu работали с одним мастер образом.
Даже периодически делая commit-all, в итоге, через неделю на дисках были полные копии образов.

С точки зрения пользователя, даже с точки зрения операционной системы, они равны,
а вот на блочном уровне вообще различны.
Математически, существует такой закон распределения, который удовлетворяет
распределению блоков в этих 4 образах. Но сколько нужно ресурсов, что его найти.
Я так понимаю,  эта ФС будет заниматься не поиском закономерностей, а линейным
по блочным сравнением.

В конце-концов, у них хранилища мета-данных, карты имеющихся дубликатов и хэш-таблицы,
займут столько же места, сколько и сами данные :)

Вижу :) прибавление около 20% к объёму, но сколько это потребует усилий и средств.
А дисковая память нынче практически ничего не стоит.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

18. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от минона on 29-Мрт-10, 05:29 
всё это верно, но и дедупликации есть вполне оправданное применение.
и ты сам даже догадаешься где, если подумаешь - там где дупликатов много и они редко (или никогда) не обновляются.
например почтовые ящики. ни разу не встречал, когда рассылается "всем" одно и тоже?
Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору

26. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от Поросеночек on 29-Мрт-10, 11:37 
Кстати, в русском языке в корне дубль пишется Б
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

33. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от минона on 29-Мрт-10, 14:48 
думаешь это кстати?
но всё равно приятно, что современная молодёжь интересуется русским.
Ответить | Правка | ^ к родителю #26 | Наверх | Cообщить модератору

35. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от Anon Y Mous on 29-Мрт-10, 18:34 
> Кстати, в русском языке в корне дубль пишется Б

Русский язык богат и разнообразен. Что, в слове "дуплет" тоже Б писать прикажете?

Ответить | Правка | ^ к родителю #26 | Наверх | Cообщить модератору

39. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от Михаил (??) on 29-Мрт-10, 18:51 
>> Кстати, в русском языке в корне дубль пишется Б
>
>Русский язык богат и разнообразен. Что, в слове "дуплет" тоже Б писать
>прикажете?

Что интересно, получится "дублет" - тоже существующее слово, но совсем с другим значением.

Ответить | Правка | ^ к родителю #35 | Наверх | Cообщить модератору

41. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от Anon Y Mous on 29-Мрт-10, 19:09 
Пошел посмотрел у Даля - смысл даже тот же самый может быть

Век живи, век учись - все равно дураком помрешь :-)

Ответить | Правка | ^ к родителю #39 | Наверх | Cообщить модератору

40. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от Warhead Wardick on 29-Мрт-10, 18:54 
> ... там где дупликатов много и они редко (или никогда) не обновляются.
>например почтовые ящики. ни разу не встречал, когда рассылается "всем" одно и тоже?

Тьфу блин! Даже Exchange 2000 хранил одну тушку мессэджа и столько линков сколько надо. Опенсорсные почтовики такое тоже давно могут. Если вы до сих пользуете старьё - это только ваши проблемы.

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

42. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от минона on 29-Мрт-10, 21:06 
именно. это только мои проблемы.
если я хочу юзать мэйлбокс и дедупликацию то это ничем не хуже твоего эксченча, который кстати изрядно крошил при сбое хранилище и на восстановление уходил рабочий день.
Ответить | Правка | ^ к родителю #40 | Наверх | Cообщить модератору

21. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от mma on 29-Мрт-10, 07:11 
>А дисковая память нынче практически ничего не стоит.

SSD?  Вот она основная цель этой ФС

Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору

23. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от x on 29-Мрт-10, 08:45 
Чувак, видмо, просто не вкурсе сколько стоит дисковая память на каком-нибудь среднеуровневом массиве от HP или EMC.
Про массивы hi-end уровня и упоминать даже не стоит.
Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору

24. "Opendedup - файловая система с автоматическим объединением д..."  +1 +/
Сообщение от Michael Shigorin email(ok) on 29-Мрт-10, 10:59 
Вы же явно в курсе с тем, как соотносится пропускная способность hi-end массивов с (кажущейся среднепотолочной) цифрой "150Мб/сек"...

PS: спасибо за ссылку на lessfs.

Ответить | Правка | ^ к родителю #23 | Наверх | Cообщить модератору

25. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от pavlinux (ok) on 29-Мрт-10, 11:21 
>Чувак, видмо, просто не вкурсе сколько стоит дисковая память на каком-нибудь среднеуровневом массиве от HP или EMC.
>Про массивы hi-end уровня и упоминать даже не стоит.

Приятно познакомится, меня звать Сертифицированный специалист EMC BURA (EMC Backup, Recovery and Archiving)

Думаш у них у всех EMC Symmetrix_ы стоят...
Хотя если они нашли бабла на Симетриксы найдут и на EMC DiskXtender, и ещё кучу гораздо интересно от EMC

Ответить | Правка | ^ к родителю #23 | Наверх | Cообщить модератору

28. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от zazik (ok) on 29-Мрт-10, 11:48 
А цену на процессоры и ОЗУ для серваков такого уровня не подскажете заодно?
Ответить | Правка | ^ к родителю #23 | Наверх | Cообщить модератору

36. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от otaku (??) on 29-Мрт-10, 18:35 
Не думаю что они отличаются от обычных серверов 8)
Ответить | Правка | ^ к родителю #28 | Наверх | Cообщить модератору

37. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от pavlinux (ok) on 29-Мрт-10, 18:37 
>А цену на процессоры и ОЗУ для серваков такого уровня не подскажете
>заодно?

Какого-такого?

Cерийные в районе 15 стоят.
Блэд корзина ~ 5.000$ + 1.500-2000$ за блейд, домой можно купить.  
А заказные,типа 32 процессорной матери, с 2Тб ОЗУ, на то они и заказные.

Ну а к примеру, блэйд забитый под завязку, - 10 лезвий c 20 штуками Opteron 2439,
примерно по 64Gb ОЗУ стоит в районе 60.000$
Ну и диск EMC CLARiiON CX4-120 в районе 8500-9000$  (расширяемый до 351 Терабайта)

Всё удовольствие, за 70000$.
И можно избавится от трёх админов, которые будут трахать Linux и mdadm.  

Ответить | Правка | ^ к родителю #28 | Наверх | Cообщить модератору

43. "Opendedup - файловая система с автоматическим объединением д..."  +/
Сообщение от zazik (ok) on 29-Мрт-10, 23:48 
>>А цену на процессоры и ОЗУ для серваков такого уровня не подскажете
>>заодно?
>
>Какого-такого?
>

Такого, к которым обычно присобачивают вышеописанные hiend-массивы. Для сравнения, так сказать.


Ответить | Правка | ^ к родителю #37 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру