Доброго времени суток.
Пытаюсь настроить ленту но ничего не получается.
После нажатия кнопки "Тест импорта" мне выдает "Найдено ссылок: 0".Думаю проблема в "Шаблон ссылок", но даже прописав "https://newsland\.com/\S{1,}/
Все равно выдает ошибку: "Найдено ссылок: 0".Вот как я заполнил настройку ленты:
Тип ленты: html
URL индексной страницы: https:_//newsland_com/ (конечно без _ в ссылке)
Кодировка HTML-страницы: uyf-8
Шаблон ссылок: https://newsland\.com/user/\S{10}/content/\S{1,}/\S{7}/
Шаблон заголовка: <h1>(.*?)</h1>
Начальная точка полного текста: <div class="post post2">
Конечная точка полного текста: <div class="post-bot blue-block">Прощу помощи у знающих данный грабер, что я делаю не так?
И вам не хварать )))
Начнем стого, что ссылка выглядит так:/user/4296647985/content/krupneishaia-aviakompaniia-mira-otmenila-vse-reisy/5382233
Я видел что ссылка как вы написали.
Под нее и делал шаблон ссылки.
Вроде правильно.
Я понимаю так (разбиваю на куски):
/user/
/user/
--
/4296647985/ - десять знаков
/\S{10}/ - правили которое берет десять знаков.
--
/content/
/content/
--
/krupneishaia-aviakompaniia-mira-otmenila-vse-reisy/ - много чего угодно
/\S{1,}/ - правило, больше одного и не ограницено в количестве знаков
--
/5382233 - семь знаков
/\S{7}/ - правили которое берет семь знаков.Я считаю что правильно написал шаблон ссылок.
Но из за того что не находит новости, я думаю что то не правильно, вот только не понимаю что именно?
Судя по вашему вы сделали совсем не так. Вот ваш:
Шаблон ссылок: https://newsland\.com/user/\S{10}/content/\S{1,}/\S{7}/
А ссылка выглядит так:
/user/4296647985/content/krupneishaia-aviakompaniia-mira-otmenila-vse-reisy/5382233
Загадка: Найти одно отличие )))
Вы говорите за присутствие доменного имени или за слеш на конце?
Других отличий я не вижу.
Браво. Вы даже нашли 2 существенных различия.
Не нужно что то пытаться добавить свое, прежде не сделав соответствующие доп. шаблоны. Как есть в исходнике, так и нужно использовать.
Ну в исходнике есть доменное имя, как же без него.
А вот если убрать (или добавить) слеш в конце, то все равно ни чего не находит.
Я пробовал много разных вариантов шаблона ссылки, но так: https://newsland.com/\S{1,}
Ни находит ни одной ссылки, хотя я думаю так он должен брать абсолютно все ссылки что есть на странице.
Хотя нет, простите, начал находить ссылки, пусть не те что нужно. Но все же заработал.
Спасибо за помощь.
Пошел дальше настраивать ленту.
Не знаю каким образом вы смотрели код страницы, но нет там доменного имени в ссылках на статьи. Используйте CTRL+U для просмотра кода страницы, ну или ПКМ и просмотр кода, но никак не копируя ссылку с индексной страницы.
Большое вам спасибо, теперь понял как надо было делать.
P.S - Ленту получилось настроить.