Некоторое время назад озадачился выбором ColumnStore DB из возможных вариантов MariaDB (CoumnStore) - стоит в продакшене и после долгих мучений был выбран Yandex ClickHouse.
Особенность - очень много INSERT, UPDATE/DELETE - нет, SELECT редкие но затрагивают большое количество строк (в среднем ~42 млн.)
К цифрам:
датасет - 2.656.035.309 записей (360 GB) (для теста, логи за месяц)
импорт:
Maria ColumnStorge (144 мин.)
YCH (157 мин.)
Коэф. сжатия
MCS - 64%
YCH - 82%
SELECT типично необходимая выборка
MCS ~ 2 мин.
YCH ~ 0.01 сек.
Разница значительная, но есть нюанс, MCS нельзя создать индексы, вместо этого у нее есть метаданные (словарь), который она хранит в оперативке. (на тесте было 16 гб. что вполне влияет на время) (отвратительный артефакт - очень большой warming up). У YCH - есть возможность создавать индексы.
Особенность - очень много INSERT, UPDATE/DELETE - нет, SELECT редкие но затрагивают большое количество строк (в среднем ~42 млн.)
К цифрам:
датасет - 2.656.035.309 записей (360 GB) (для теста, логи за месяц)
импорт:
Maria ColumnStorge (144 мин.)
YCH (157 мин.)
Коэф. сжатия
MCS - 64%
YCH - 82%
SELECT типично необходимая выборка
MCS ~ 2 мин.
YCH ~ 0.01 сек.
Разница значительная, но есть нюанс, MCS нельзя создать индексы, вместо этого у нее есть метаданные (словарь), который она хранит в оперативке. (на тесте было 16 гб. что вполне влияет на время) (отвратительный артефакт - очень большой warming up). У YCH - есть возможность создавать индексы.