MySQL vs PostgreSQL

WebByte · 24 Апр 2006

MySQL vs PostgreSQL

Что лучше выбрать для системы с приблизительно сотней-другой таблиц, часть которых может содержать несколько миллионов записей? Планируется много INSERT и SELECT.

Мускул, конечно, роднее. Но выдержит ли?

Фанат · 24 Апр 2006

выбирай, что хочешь.
Хоть текстовый файл.
С таким уровнем постановки задачи и и представлениях о различиях баз данных, тебе будет абсолютно всё равно.

По вопросу "выдержит ли MySQL", воспользуйся, пожалуйста, поиском по форуму.

WebByte · 24 Апр 2006

Фанат,
ты, конечно, в чем-то прав, но абсолютно не умеешь (или не хочешь) доносить нормально то, что хочешь сказать. Меня абсолютно не интересует твое мнение, как мне разрабатывать и как не разрабатывать систему. Я задал конкретный вопрос — что лучше использовать для системы с большими нагрузками и объемами данных. Сейчас Мускул у меня работает на относительно малых объемах — 2-3 миллиона строк, поэтому я не могу определить, как он себя будет вести на 200-300 миллионах. Поэтому и спросил коллективный разум.

За подсказку, что есть поиск, спасибо, не знал

~~ upd 11:03 ~~

Кстати, кое-что в поиске-то нашел. В деталях и факе — нет.
Если интересуют более точные данные о возможных объемах, то примерно так:

Имеется примерно 1-2 миллиона документов на удаленных серверах, которые минимум раз в день надо забирать, обрабатывать и строить индекс. Что-то вроде миниатюрной поисковой системы. Структурирование документов даст еще примерно 13-17 записей по разным таблицам на каждый из документов. Работа системы планируется на достаточно долгий промежуток времени, поэтому уже в ближайшее время разговор пойдет о нескольких сотнях миллионов записей.

clops · 24 Апр 2006

на мускуле проще строить кластеры СУБД, однако PostgreSQL способен работать с большим пулом данных используя меньше ресурсвов нежели MySQL

moxnatiy · 24 Апр 2006

clops
кластеры на мускуле?
а вы пробовали? и как? стабильно работают?

kvf77 · 24 Апр 2006

WebByte

очередной всезнайка - если ты все знаешь про разработку - зачем задаешь вопросы?

твое кол-во записей это твои фантазии или реальные данные7 боюсь, что фантазии

Фанат · 24 Апр 2006

нет, не фантазии.
у него база телефонных звонков

kvf77 · 24 Апр 2006

WebByte

гм - может тут имеет смысл провести какую-то реорганизацию структуры базы? например не хранить все записи в одной таблице, а скажем записи только за месяц, то есть каждый месяц создавать новую таблицу

WebByte · 24 Апр 2006

Автор оригинала: kvf77
очередной всезнайка - если ты все знаешь про разработку - зачем задаешь вопросы?

Под разработкой в данном контексте я имел ввиду проектирование структуры баз данных, структуру и код программной части итп. Об этом я спрашивать и правда не собираюсь.
Вопрос же в нагрузках на разные СУБД при больших объемах данных до этого передо мной не стоял, поэтому и спросил.

твое кол-во записей это твои фантазии или реальные данные7 боюсь, что фантазии

Боюсь, что нет. Даже в том прототипе, что сейчас работает (специально залез проверил), 3.5 миллиона записей, при том, что это лишь треть системы и не самая основная часть... Поэтому объем и правда будет большой...

гм - может тут имеет смысл провести какую-то реорганизацию структуры базы? например не хранить все записи в одной таблице, а скажем записи только за месяц, то есть каждый месяц создавать новую таблицу

А там и так не одна таблица

Сейчас 7 баз данных с разной структурой. Тут как раз понятно, что очень желательно прикидывать как часто будут нужны все записи и разносить по таблицам на каждый из периодов.

clops · 24 Апр 2006

Автор оригинала: moxnatiy
clops
кластеры на мускуле?
а вы пробовали? и как? стабильно работают?

да, пробовал, только для каждой задачи отдельный подход, например для нашей ERP/CRM системы простой Master-Slave-...-Slave кластер не прокатил из-за локов. Если же это не притично — то проблем не будет.

SID · 24 Апр 2006

WebByte
Что мешает на тестовой базе произвести замеры производительности по MySQL и PostgreSQL ?
имхо. в первую очередь нужно самому хоть что то протестить а потом уже идти с вопросами на форум.

svetasmirnova · 24 Апр 2006

SID
Умное замечание. Особенно применительно к порядку записей thread starter-а.

WebByte · 24 Апр 2006

Автор оригинала: SID
WebByte
Что мешает на тестовой базе произвести замеры производительности по MySQL и PostgreSQL ?
имхо. в первую очередь нужно самому хоть что то протестить а потом уже идти с вопросами на форум.

Гм. Ничего, Вы правы )

moxnatiy · 24 Апр 2006

clops
а вы не путаете?
http://dev.mysql.com/doc/refman/5.0/en/mysql-cluster-overview.html
http://dev.mysql.com/doc/refman/5.0/en/replication-implementation.html

Mescalito · 24 Апр 2006

WebByte
раньше можно было бы однозначно сказать, что для таких объемов Postgres лучше, сейчас уже хз...

у меня на postgres'e на старом 7.3, база в день увеличивается на 2 - 2,5 млн. записей - работает вполне сносно и стабильно.
думаю на 8-ом будет еще лучше.

а почему mysql и postgres, почему не oracle например ?

кстати, а какие конкретно задачи, что храница будет ? есле не секрет , конечно.

clops · 25 Апр 2006

Автор оригинала: moxnatiy
clops
а вы не путаете?
http://dev.mysql.com/doc/refman/5.0/en/mysql-cluster-overview.html
http://dev.mysql.com/doc/refman/5.0/en/replication-implementation.html

нет, не путаю, ибо «NDB is an in-memory storage engine offering high-availability and data-persistence features.» — у нас данных многим больше чем памяти — эта модель не подошла. Взяли модель которую разработала Danga для ЖЖ (data replication over several clusters + memcached)

WebByte · 26 Апр 2006

Автор оригинала: Mescalito а почему mysql и postgres, почему не oracle например ?

Политика руководства.

а какие конкретно задачи, что храница будет?

Храниться будет много текстовой информации с множеством взаимосвязей.
И вся эта информация будет обрабатываться для выдергивания из нее каких-то фактов.
В общем, аналитика + статистика и все это в больших объемах.

MySQL vs PostgreSQL

WebByte

Проходящий мимо

Фанат

oncle terrible

WebByte

Проходящий мимо

clops

Новичок

moxnatiy

Новичок

kvf77

Red Devil

Фанат

oncle terrible

kvf77

Red Devil

WebByte

Проходящий мимо

clops

Новичок

SID

ReadOnlyТеаm

svetasmirnova

маленький монстрик

WebByte

Проходящий мимо

moxnatiy

Новичок

Mescalito

Новичок

clops

Новичок

WebByte

Проходящий мимо