dblink vs репликация

iceman

говнокодер
Есть 2 машины, в общем одна система размножена 2 на сервера, на одном 1 модуль, на другом - другой. ядро (юзеры, роли т.д.) расположены на сервере 1

загрузка серверов большая...

так вот нужно сделать отчеты в которых данные пересекаются с 2 серверов.

что лучше использовать дблинк или всетаки по ночам агрегировать данные и реплицировать их на другой сервак, где уже делать выборку и подсчеты по агрегированным данным.

минус репликации в том, что сделав одну структуру агрегированных данных и используя в одном отчете, приходится в последующем либо создавать новую реплику, либо менять таблицу - более детализируя, для использования в другом.

а если полностью данные 1 в 1 реплицировать, то место израсходуется да и трафика будет ппц, в таблицах сотни миллионов записей, это все еще и логировать нужно будет =(

а дблинк постоянно будет гонять трафик между серверами.
 

tz-lom

Продвинутый новичок
а в чём проблема выбрать нужные данные с машин по отдельности и свести их уже в коде?
 

iceman

говнокодер
ну отчет запускают часто, сверяют данные за прошлый день. гонять весь трафик тоже не хочется.

причем это не 1 такой отчет, ух уже несколько (для которых уже сделана репликация) и предполагается что еще появятся. для которых возможно еще более детализированная репликация нужна будет, все дойдет до того, что будут передаваться данные - один в один.
 

zerkms

TDD infected
Команда форума
Если можно использовать дблинк - то почему бы его не использовать? :))
 

iceman

говнокодер
ну представь - выборка даже с период за 1 месяц, данных для этого периода уже дохренище, это забивание канала.

если репликация - то ежедневная выборка за прошлый день с логированием реплицированных данных, причем ночью, когда система вообще почти не нагружена (это промышленная система, там люди работают, в рабочие дни)

но в репликации - проблема, сгруппировал по одному признаку 1 раз - склал, появилась новая задача - где нужные данные более детализированные - приходится опять вводить новую таблицу - и добавлять еще одну репликацию.


ПЫСЫ: вернее не репликация - а копирование данных, так будет правильнее
 

zerkms

TDD infected
Команда форума
iceman
Если тебя устраивает дблинк - то зачем вообще думать об любого рода синхронизации?

Кстати для синхронизации можно заюзать materialized views, трафик сэкономится и реализация простая.
 
Сверху