Автоматический парсер раздач с rutor.info

Started by Virtuoz on 2016-09-17 14:12 — 173 replies, 33049 views

#71
повторные он не парсит?
#72
повторные он не парсит?
нет не парсит
#73
vitalix, помоги плиз сделать выравнение постера по правому краю 😢
#74
у меня так
$text = preg_replace('/<td>.*?<img src="([\s\S]*?)".*?\/>/', '[img=right]$1[/img]', $text);
#75
у меня так
сделал и постеры вообще перестали копироваться ((
#76
у меня так
$text = preg_replace('/<td>.*?<img src="([\s\S]*?)".*?\/>/', '[img=right]$1[/img]', $text);
А так работать и не будет, если файл 228_rutor.php с архива первого поста, потому что контент начинает парсить как раз с <tr><td style=\"vertical-align:top;\"></td><td> , поэтому тег <td> при парсинге не обнаружится и будет искать далее по тексту это совпадение, если оно будет.

А вот так будет работать:
$text = preg_replace('/<br.*?><img src="(.*?)".*?>.*?<br.*?>/', '[img=right]$1[/img]', $text);
При этом обязательно его вставить перед этой строкой:
$text = preg_replace('/<br.*?>/', "", $text);
#77
dexer7, супер, спасибо
#78
Кто угодно может обратиться к файлу, набрав его в адресной строке зная адрес.
Может стоит добавить какой-нибудь параметр к урлу и потом его проверять.
К примеру:
if(!isset($_GET['key']) || $_GET['key'] != 'БЛ-БЛАбла') {
  header($_SERVER['SERVER_PROTOCOL'].' 404 Not Found');
  readfile ('404.shtml');
  exit;
}
а запускать так:
site.ru/228_rutor.php?key=БЛ-БЛАбла
#79
Просто его можно переименовать в любое имя например:

10932184837437_rutor.php

и не придумывать. в свое время я ему сам дал номер 228, не знаю почему.
#80
куда вставлять код который в ajax.php добавлять нужно было