Взять изображение статьи

Vanyakod1

Новичок
Всем привет, никак не могу победить одну проблему как соц сети берут все эти картинки когда вставляешь пост?
Я вот беру картинки вот таким методом preg_match( '/property="og:image" content="(.*?)"/',
Но не всегда так получается ибо не всегда на сайте есть те meta теги и т д

Как еще можно получить адрес изображение картинки ?
 

hell0w0rd

Продвинутый новичок
А нечего регулярками парсить. Ищи библиотеки для парсинга html. Берут из микроразметки, Open Graph, который ты ищешь - только одна из разновидностей.
 

hell0w0rd

Продвинутый новичок
HTML:
<meta property="og:image" content="/img.png">
<meta content="/img.png" property="og:image">
<meta property="og:image" foo="bar" content="/img.png">
<meta property='og:image' content=/img.png>
Это наверное только 10-20% того, как это может быть записано.
 

Vanyakod1

Новичок
HTML:
<meta property="og:image" content="/img.png">
<meta content="/img.png" property="og:image">
<meta property="og:image" foo="bar" content="/img.png">
<meta property='og:image' content=/img.png>
Это наверное только 10-20% того, как это может быть записано.
мне нужно спарсить

<img src="/uploads/posts/2015-09/medium/1442905093_gerashenko.jpeg" alt="'>
Где alt = пустота или вообще нету
 

c0dex

web.dev 2002-...
Команда форума
Партнер клуба
@Vanyakod1, у нас вопросы парсинга и кражи контента редко обсуждаются, это намек.
 

c0dex

web.dev 2002-...
Команда форума
Партнер клуба
Да зачем мне линки. Просто я понимаю, что ты делаешь, но это уже как бы почти на грани.

Писать за тебя твой код никто не будет. Тебе дали направление исследования и возможные варианты ;)
 

Vanyakod1

Новичок
Да зачем мне линки. Просто я понимаю, что ты делаешь, но это уже как бы почти на грани.

Писать за тебя твой код никто не будет. Тебе дали направление исследования и возможные варианты ;)
Я вот один крутой путь нашел, но почему то застопорился на нем
получать всю нужную инфу через api facebook

В общем все получаю, кроме ссылки на карткинку что не так делаю ?
 

Vanyakod1

Новичок
Вот что получаю в ответ от любого сайта, но не могу получить то что мне надо именно изображение через приложение фейсбука да там много чего выдается
{
"og_object": {
"id": "372730729489705",
"description": "cron – программа-демон, предназначенная для выполнения заданий в определенное время, или через определенные промежутки времени. Для редактирования заданий используется утилита crontab.",
"title": "cron | Русскоязычная документация по Ubuntu",
"type": "website",
"updated_time": "2014-06-26T09:59:30+0000",
"url": "http://help.ubuntu.ru/wiki/cron"
},
"share": {
"comment_count": 0,
"share_count": 3
},
"id": "http://help.ubuntu.ru/wiki/cron"
}
 

AnrDaemon

Продвинутый новичок
Напомните, пожалуйста, с каких пор на этом сайте помогают воровать контент?…
 

Vanyakod1

Новичок
Напомните, пожалуйста, с каких пор на этом сайте помогают воровать контент?…
Господи, во-первых вы даже не знаете как устроенная система
Во-вторых, если автор ресурса сам к нам добавляет эти ссылки, как тогда это назвать ?
 

hell0w0rd

Продвинутый новичок
Напомните, пожалуйста, с каких пор на этом сайте помогают воровать контент?…
если автор включит мозг и будет спрашивать про микроразметку - все соответствует правилам. Она создана для того, чтобы ее парсили и показывали на других сайтах.
 

Vanyakod1

Новичок
если автор включит мозг и будет спрашивать про микроразметку - все соответствует правилам. Она создана для того, чтобы ее парсили и показывали на других сайтах.
Я вообще не могу понять вообще, я что только не гугли
Я не могу понять каким образом парсить фейсбук, и vk
Они выбирают фото даже если нету атрибута og:image
 

Adelf

Administrator
Команда форума
Они выбирают фото даже если нету атрибута og:image
Они выбираю первое подходящее по их мнению.
И кстати, если бы ты парсил страницу грамотно, без регулярок, тебе было бы намного проще. Со мноооогими вопросами.

P.S. Проект у него вполне легальный. Так что все ок.
 

hell0w0rd

Продвинутый новичок
@Vanyakod1, тогда они собирают картинки со страницы, и показывают их. Можешь искать, на пример, самую большую картинку. А еще таки посмотри на микроразметку, блин, http://schema.org/image
 

Vanyakod1

Новичок
Они выбираю первое подходящее по их мнению.
И кстати, если бы ты парсил страницу грамотно, без регулярок, тебе было бы намного проще. Со мноооогими вопросами.

P.S. Проект у него вполне легальный. Так что все ок.
У меня там такой ужасный код парсинга )
Все на регулярках )

Вот сейчас ищу другие пути парсинга

Я считаю что мой проект полностью легальный, я не нарушаю авторских прав, и в тоже время помогаю людям так как трафик добавляться к их сайту, и все зависит от того что было добавлено
Мой проект, тоже самое что поделится линком в соц сетях, только более модифицированная версия + некие скрытые плюшки которые помогают людям
 
Сверху