В корне алгоритма там те же самые словари - имена людей, названия организаций, география.
А релевантность учитывает и частоту слова

Так что "просто по вычленению наиболее встречаемых слов" - есть так же самая релевантность, просто кастрированная.
Сфинкс просто позволит сделать все быстро - построить индекс, получить частотку слов, которую можно посмотреть выкинуть вредные слова... напрмер, в форуме по программированию на PHP имеет смысл добавить в стоп "программирование" и "PHP"

Не спорю, что заточенный на определенную тематику форума словарь может дать лучший результат, но это будет кастомное решение под конкретный форум и весьма трудоемкое (построение словаря). И не будет вообще работать, если в открытой теме нет слов из словаря или их очень мало.