кто пробовал manticoresearch?

WMix

герр M:)ller
Партнер клуба
разбирался со sphinx пытаясь добавить stemmer случайно натолкнулся на https://manticoresearch.com/ (https://github.com/manticoresoftware)
на первый взгляд, ребята вдохнули 2ю жизнь в сфинкса, и docker и новый словарик :) думаю проапгрейтится.

кто пробовал? какие отзывы?
 

fixxxer

К.О.
Партнер клуба
мантикора это и есть единственный поддерживаемый форк сфинкса

если почему-то хочется именно сфинкс, а не еластик, ну бери
 

c0dex

web.dev 2002-...
Команда форума
Партнер клуба
А что, родной сфинкс сдох разве?
 

c0dex

web.dev 2002-...
Команда форума
Партнер клуба
Месяц назад был релизец)
 

fixxxer

К.О.
Партнер клуба
А что, родной сфинкс сдох разве?
ну как сказать, что-то типа зомби

Месяц назад был релизец)
сфинкс 3.х - это производная внутреннего продукта авито, от которого желающим острых ощущений выбрасываются непонятные бинари без сорцов и какого-либо саппорта
 

AmdY

Пью пиво
Команда форума
для тех задач где не слежу за таблицей, но быстренько хочется пойск ускорить сам то, а так да, я за еластик
А быстро ускорить это точно не про колупнуть свою базу данных? А то у меня на одном из проектов налепили очень кривой костыль с эластиком для постгрес, а нужно было всего-то GINиндекс завести.
 

c0dex

web.dev 2002-...
Команда форума
Партнер клуба
ну как сказать, что-то типа зомби

сфинкс 3.х - это производная внутреннего продукта авито, от которого желающим острых ощущений выбрасываются непонятные бинари без сорцов и какого-либо саппорта
Хз на счет саппорта, но у меня на основном проекте оно один раз упало за оооочень долгий срок использования, до сих пор непонятно кстати почему, возможно, что мы слишком много писали в RT индексы и что-то там не учли. Работало несколько лет и все ок было, потом бац - поднимайте меня, ребята, я усё (с) sphinx
 

fixxxer

К.О.
Партнер клуба
Это вопрос адекватной оценки рисков.

Бывают проекты, вокруг которых построен бизнес, бывают (опенсорс) проекты, вокруг которых собралось активное сообщество, ну или смесь первого и второго. В обоих случаях понятно, что делать, если что. Сфинкс когда-то был в первой категории, после того, как Аксенов и остальные его сотрудники разошлись своими дорогами (почему так вышло и кто виноват - мне пофиг, если честно), в первой категории стал Manticore, а сфинкс превратился в хобби-проект одного человека, который его пилит в редкое свободное время, что вкупе с отсутствием исходников делает риски, как по мне, неприемлемыми: если даже ты контачишь с Аксеновым и он всегда готов помочь, всегда есть bus factor.

Лет 15 назад вот сталкивался с такой ситуацией, когда вроде "все работало", а после инфраструктурных изменений перестало, разработчик не оставил исходников и хз куда пропал, в итоге пришлось вооружиться дизассемблером :)
 
Последнее редактирование:

grigori

( ͡° ͜ʖ ͡°)
Команда форума
все работает - это на пару лет, потом надо будет обновлять PHP, OS, ssl, менять ДЦ или облако, и весь старый софт, который не в активной разработке, при этом обычно чем-нибудь накрывается
 

AmdY

Пью пиво
Команда форума
все работает - это на пару лет, потом надо будет обновлять PHP, OS, ssl, менять ДЦ или облако, и весь старый софт, который не в активной разработке, при этом обычно чем-нибудь накрывается
Сложил в докер и пускай там крутится, без всяких обновлений. У меня так один проект на php 4 крутится. У меня больше проблем возникает с проектами, которые активно разрабатываются. Просмотрел проблему с обратной совместимостью, а когда она сама вылезла у тебя уже код на новые версии завязан, привет Тейлору.
 

WMix

герр M:)ller
Партнер клуба
А быстро ускорить это точно не про колупнуть свою базу данных? А то у меня на одном из проектов налепили очень кривой костыль с эластиком для постгрес, а нужно было всего-то GINиндекс завести.
там просто огромное колво артикулов, а если еще денормализировать то пол ярда строк.
таблица постоянно меняется снаружи PIM-тимом. есть много полей номеров типа ean, pzn есть ключевые слова, категории, подгруппы, типы и тд.,
RT делать смысла нет, тк событие не понятно, а пробежаться index по вьюшке происходит быстро. и вроде ничего не изменилось, все тот же mysql но с match командой. далее простой интерфейс, и feature toggle чтоб легко выкинуть и искать через базу.

скорость поиска очень повысилась, с ощутимой секунды до 1/10 и все бы хорошо было, но захотели мультиязычность.
так на stemmer и нарвался, а 3.х перекомпелить --with-libstemmer или как там было не получилось.
 

ivanov77

Новичок
а 3.х перекомпелить --with-libstemmer или как там было не получилось.
Там на англоязычном форуме сидит Барри, от него только и можно получить помощь на всякие "странные" проблемы по Сфинксу.
Про то как закомпилить дополнительные стеммеры.
Разработчик то Сфинкса в астрале.
Мы пока на 2-ом Сфинксе работаем, для надежности.
Но если что переход на Мантикору тоже как вариант.
 

WMix

герр M:)ller
Партнер клуба
нет проблем, как и сорцов. все работает и без стеммера, качество поиска проверить без знания языков не могу, пользователи после напишут. но осознание что проект поставляется только как binar приводит к мысли что надо даунгрейдится на 2.11 или поглядеть на альтернативу.
 

c0dex

web.dev 2002-...
Команда форума
Партнер клуба
Исходники же есть, почему только bin? Вопрос другой, что собрать из - дело такое себе.

Отмена миссии...
 

AmdY

Пью пиво
Команда форума
там просто огромное колво артикулов, а если еще денормализировать то пол ярда строк.
таблица постоянно меняется снаружи PIM-тимом. есть много полей номеров типа ean, pzn есть ключевые слова, категории, подгруппы, типы и тд.,
Вот у меня на проекте тоже влепели эластик потому что лайк тормозил. Хотя данных всего-то 3 ляма записей. С нормальными индексами всё летает из коробки постгреса.
 

fixxxer

К.О.
Партнер клуба
gin/gist это одна из киллер фич постгреса, да. Но тут вроде речь про mysql, там хоть и есть inverted index внутри innodb fts, но когда прямо в официальной документации для модификации поведения парсера предлагается править сорцы innodb, это смешно)
 
Сверху