Нужны хорошо структурированные данные для личных экспериментов в RDBMS

Rin

*
Подскажите, где взять или поделитесь, если возможно.
Конфиденциальную информацию можно умышленно исказить/удалить (например, цена закупки).
Подойдут дампы БД в SQL, XML/YML/JSON или просто XLS/CSV.
Лучше, если это будут данные из крупного интернет-магазина по товарам, фильмам, музыке или книгам от 10K позиций.
У самого есть 150K статей и новостей (одно известное СМИ), но их использовать не целесообразно, т.к. у документов очень мало свойств это не e-commerce.
 

AmdY

Пью пиво
Команда форума
Rin
нагенерировать самому? у меня каждый рабочий день начинается с запуска подобного скрипта.
 

itprog

Cruftsman
но ведь нагенерированный контент вида "товар 123943" смотрится по-детски %)
На английском можно взять из демки magento дамп, а вот русского аналога не встречал.
 

Rin

*
Спасибо за упоминание Magento.
Каталог товаров там небольшой совсем, как я и ожидал.
Для хранения данных там используется EAV модель, вытаскивать данные с кучей соединений таблиц очень неудобно (привет MongoDB).
 

Фанат

oncle terrible
Команда форума
взаимоисключающие параграфы детектед
у документов очень мало свойств это не e-commerce.
а где в реально e-commerce с кучей данных не используется EAV модель?

Нужны хорошо структурированные данные
Сразу на ум приходит КЛАДР или его замена, о которой писали на хабаре.
 
Сверху