MySQL vs PostgreSQL

WebByte

Проходящий мимо
MySQL vs PostgreSQL

Что лучше выбрать для системы с приблизительно сотней-другой таблиц, часть которых может содержать несколько миллионов записей? Планируется много INSERT и SELECT.

Мускул, конечно, роднее. Но выдержит ли?
 

Фанат

oncle terrible
Команда форума
выбирай, что хочешь.
Хоть текстовый файл.
С таким уровнем постановки задачи и и представлениях о различиях баз данных, тебе будет абсолютно всё равно.

По вопросу "выдержит ли MySQL", воспользуйся, пожалуйста, поиском по форуму.
 

WebByte

Проходящий мимо
Фанат,
ты, конечно, в чем-то прав, но абсолютно не умеешь (или не хочешь) доносить нормально то, что хочешь сказать. Меня абсолютно не интересует твое мнение, как мне разрабатывать и как не разрабатывать систему. Я задал конкретный вопрос — что лучше использовать для системы с большими нагрузками и объемами данных. Сейчас Мускул у меня работает на относительно малых объемах — 2-3 миллиона строк, поэтому я не могу определить, как он себя будет вести на 200-300 миллионах. Поэтому и спросил коллективный разум.

За подсказку, что есть поиск, спасибо, не знал ;)

~~ upd 11:03 ~~

Кстати, кое-что в поиске-то нашел. В деталях и факе — нет.
Если интересуют более точные данные о возможных объемах, то примерно так:

Имеется примерно 1-2 миллиона документов на удаленных серверах, которые минимум раз в день надо забирать, обрабатывать и строить индекс. Что-то вроде миниатюрной поисковой системы. Структурирование документов даст еще примерно 13-17 записей по разным таблицам на каждый из документов. Работа системы планируется на достаточно долгий промежуток времени, поэтому уже в ближайшее время разговор пойдет о нескольких сотнях миллионов записей.
 

clops

Новичок
на мускуле проще строить кластеры СУБД, однако PostgreSQL способен работать с большим пулом данных используя меньше ресурсвов нежели MySQL
 

moxnatiy

Новичок
clops
кластеры на мускуле?
а вы пробовали? и как? стабильно работают?
 

kvf77

Red Devil
WebByte

очередной всезнайка - если ты все знаешь про разработку - зачем задаешь вопросы?

твое кол-во записей это твои фантазии или реальные данные7 боюсь, что фантазии
 

Фанат

oncle terrible
Команда форума
нет, не фантазии.
у него база телефонных звонков
 

kvf77

Red Devil
WebByte

гм - может тут имеет смысл провести какую-то реорганизацию структуры базы? например не хранить все записи в одной таблице, а скажем записи только за месяц, то есть каждый месяц создавать новую таблицу
 

WebByte

Проходящий мимо
Автор оригинала: kvf77
очередной всезнайка - если ты все знаешь про разработку - зачем задаешь вопросы?
Под разработкой в данном контексте я имел ввиду проектирование структуры баз данных, структуру и код программной части итп. Об этом я спрашивать и правда не собираюсь.
Вопрос же в нагрузках на разные СУБД при больших объемах данных до этого передо мной не стоял, поэтому и спросил.

твое кол-во записей это твои фантазии или реальные данные7 боюсь, что фантазии
Боюсь, что нет. Даже в том прототипе, что сейчас работает (специально залез проверил), 3.5 миллиона записей, при том, что это лишь треть системы и не самая основная часть... Поэтому объем и правда будет большой...

гм - может тут имеет смысл провести какую-то реорганизацию структуры базы? например не хранить все записи в одной таблице, а скажем записи только за месяц, то есть каждый месяц создавать новую таблицу
А там и так не одна таблица :) Сейчас 7 баз данных с разной структурой. Тут как раз понятно, что очень желательно прикидывать как часто будут нужны все записи и разносить по таблицам на каждый из периодов.
 

clops

Новичок
Автор оригинала: moxnatiy
clops
кластеры на мускуле?
а вы пробовали? и как? стабильно работают?
да, пробовал, только для каждой задачи отдельный подход, например для нашей ERP/CRM системы простой Master-Slave-...-Slave кластер не прокатил из-за локов. Если же это не притично — то проблем не будет.
 

SID

ReadOnlyТеаm
WebByte
Что мешает на тестовой базе произвести замеры производительности по MySQL и PostgreSQL ?
имхо. в первую очередь нужно самому хоть что то протестить а потом уже идти с вопросами на форум.
 

svetasmirnova

маленький монстрик
SID
Умное замечание. Особенно применительно к порядку записей thread starter-а.
 

WebByte

Проходящий мимо
Автор оригинала: SID
WebByte
Что мешает на тестовой базе произвести замеры производительности по MySQL и PostgreSQL ?
имхо. в первую очередь нужно самому хоть что то протестить а потом уже идти с вопросами на форум.
Гм. Ничего, Вы правы )
 

Mescalito

Новичок
WebByte
раньше можно было бы однозначно сказать, что для таких объемов Postgres лучше, сейчас уже хз...

у меня на postgres'e на старом 7.3, база в день увеличивается на 2 - 2,5 млн. записей - работает вполне сносно и стабильно.
думаю на 8-ом будет еще лучше.

а почему mysql и postgres, почему не oracle например ?

кстати, а какие конкретно задачи, что храница будет ? есле не секрет , конечно.
 

clops

Новичок
нет, не путаю, ибо «NDB is an in-memory storage engine offering high-availability and data-persistence features.» — у нас данных многим больше чем памяти — эта модель не подошла. Взяли модель которую разработала Danga для ЖЖ (data replication over several clusters + memcached)
 

WebByte

Проходящий мимо
Автор оригинала: Mescalito а почему mysql и postgres, почему не oracle например ?
Политика руководства.

а какие конкретно задачи, что храница будет?
Храниться будет много текстовой информации с множеством взаимосвязей.
И вся эта информация будет обрабатываться для выдергивания из нее каких-то фактов.
В общем, аналитика + статистика и все это в больших объемах.
 
Сверху