Как обновлять RSS без дублирования новостей ?

kif0rt

Новичок
Как обновлять RSS без дублирования новостей ?

Столкнулся с такой проблемой.
1. Получаю rss ленту -> прогоняю через парсер -> печатаю на страницу, например, 10 новостей.
2. Через 1 час решил обновить ленту -> прогоняю через парсер -> получаю 12 новостей, из которых 2 - новые, остальные - старые.

Вот и получается, что новости дублируются. Есть предложения как можно получать только новые новости ?

Как вариант, можно было бы использовать тег pubDate и по нему проверять на новые новости. Но ведь, далеко не во всех rss-лентах есть этот тег ...
 

kode

never knows best
эта проблема не стоит того чтобы её сюда постить.
Сложно чтоли хеш тайтлов хранить?
 

kif0rt

Новичок
kode

почему не стоит. по-моему проблема интересная с точки зрения оптимального решения. Про хэш я тоже думал, но как-то не очень красиво получается ... Ещё варианты ?
 

джамшут

Новичок
rss лента - это список ссылок на ресурсы с кратким их описанием. соответственно в качестве ключей хэш-таблицы нужно использовать именно их.
 

kode

never knows best
Автор оригинала: kif0rt
kode

почему не стоит. по-моему проблема интересная с точки зрения оптимального решения. Про хэш я тоже думал, но как-то не очень красиво получается ... Ещё варианты ?
А что вы думали, иногда нет красивых альтернатив некрасивым решениям.
 

kif0rt

Новичок
kode

Ясно, значит будем использовать хэш. Интересно было бы узнать, как решает эту проблему google reade например.
 

AP

Новичок
kif0rt
+ можно посылать правильные заголовки!!!
 

Bitterman

Новичок
kif0rt
А может просто не сохранять старые новости? То есть при считывании rss перезаписывать все новости.
 
Сверху