|
23 | 23 | какой именно раздел -- см. сохранённый вывод ``readlink``.
|
24 | 24 | #. ``partprobe /dev/{journal-disk}``. fdisk не умеет говорить ядру о применении
|
25 | 25 | измененной таблицы разделов если диск используется (например, под другие
|
26 |
| - журналы/бд на этом же диске. |
| 26 | + журналы/бд на этом же диске. Эта тулза из комплекта parted. |
27 | 27 | #. Перед извлечением диска физически на лету выполнить:
|
28 | 28 | ``echo 1 > /sys/block/{data-disk}/device/delete``.
|
29 | 29 |
|
@@ -104,12 +104,19 @@ CephFS
|
104 | 104 | ------------
|
105 | 105 | * Tiering vs bcache vs dm-cache + инструкции по дмкешу.
|
106 | 106 | * почему дедупликация крайне затруднена в архитектуре Ceph
|
107 |
| -* в файлсторе всё полностью пишется в журнал. один врайт превращается в два сисколла врайт |
108 |
| - - один в журнал (с синком) и один в основное хранилище. Но основное хранилище фсинкается |
| 107 | +* В filestore всё полностью пишется в журнал. WAL используется как |
| 108 | + writeback-cache по сути. Один write в rados превращается в два сисколла write |
| 109 | + -- один в журнал (с синком) и один в основное хранилище. Основное хранилище фсинкается |
109 | 110 | время от времени. Запись в журнал линейная, а в основное хранилище рандомная. При записи
|
110 |
| - в хранилище поможет параллельность которую может диск (например, NCQ). при записи в журнал |
111 |
| - параллельность не используется. поэтому для файлстора надо бенчить именно *так*. |
112 |
| - WAL используется как writeback-cache по-сути. |
| 111 | + в хранилище поможет параллельность которую может диск (например, NCQ). При записи в журнал |
| 112 | + параллельность не используется, поэтому диск под журнал для файлстора надо бенчить именно |
| 113 | + так: |
| 114 | + |
| 115 | + .. code-block:: sh |
| 116 | +
|
| 117 | + $ fio --ioengine=libaio --sync 1 --direct=1 --name=test \ |
| 118 | + --bs=4k --iodepth=1 --readwrite=write --runtime 60 --filename=/dev/sdXX |
| 119 | +
|
113 | 120 | * при выносе журнала или БД на отдельный диск теряется возможность перевставлять диски в
|
114 | 121 | другой нод. При старте ОСД (бай дефолт есть параметр) обновляет себя в крушмапе.
|
115 | 122 | * При потере журнала вседиски на него зааттаченные превращаются в труху
|
|
0 commit comments