Универсальный парсер

Started by Lektor on 2015-01-15 01:42 — 403 replies, 76419 views

#41
у меня вываливается такое

Notice: Undefined offset: 1 in /var/www/ivan/data/www/torrnada.ru/library/includes/functions_parser.php on line 17 Warning: curl_setopt(): CURLOPT_FOLLOWLOCATION cannot be activated when safe_mode is enabled or an open_basedir is set in /var/www/ivan/data/www/torrnada.ru/library/includes/functions_parser.php on line 134 Warning: curl_setopt(): CURLOPT_FOLLOWLOCATION cannot be activated when safe_mode is enabled or an open_basedir is set in /var/www/ivan/data/www/torrnada.ru/library/includes/functions_parser.php on line 96 Notice: Undefined offset: 1 in /var/www/ivan/data/www/torrnada.ru/library/includes/functions_parser.php on line 17 Warning: curl_setopt(): CURLOPT_FOLLOWLOCATION cannot be activated when safe_mode is enabled or an open_basedir is set in /var/www/ivan/data/www/torrnada.ru/library/includes/functions_parser.php on line 134 Warning: curl_setopt(): CURLOPT_FOLLOWLOCATION cannot be activated when safe_mode is enabled or an open_basedir is set in /var/www/ivan/data/www/torrnada.ru/library/includes/functions_parser.php on line 96
Инструкцию к движку читали? safe_mode включен.
Настраиваем php.
#42
Так будет лучше наверное
preg_match ('#<h1 class="maintitle"><a href=".*?">([\s\S]*?)</a></h1>#', $copy_page, $r_title);
К примеру было так:
Ошибка времени / Time Lapse (Брэдли Кинг / Bradley King) [2014, Фантастика, Триллер, WEB-DLRip] DVO :: RuTracker.org
Чтоб :: RuTracker.org в название темы не брало
будет так:
Ошибка времени / Time Lapse (Брэдли Кинг / Bradley King) [2014, Фантастика, Триллер, WEB-DLRip] DVO
#43
preg_match ('#<h1 class="maintitle"><a href=".*?">([\s\S]*?)</a></h1>#', $copy_page, $r_title);
Подскажи добрый человек это куда надо поставить?
#44
Подскажи добрый человек это куда надо поставить?
вместо этого:
preg_match ("#<title>(.*?)</title>#si", $copy_page, $r_title);
functions_parser.php
#45
@ivanesko261 вместо этой строчки в functions_parser.php
preg_match ("#<title>(.*?)</title>#si", $copy_page, $r_title);
upd: прикольно немножко опередил))
#46
Только что протестил...
Нет все таки так будет лучше
preg_match ("#<title>(.*?):: RuTracker.org</title>#si", $copy_page, $r_title);
пока на рутрекере не поменяют.
#47
Только что протестил...
Нет все таки так будет лучше
preg_match ("#<title>(.*?):: RuTracker.org</title>#si", $copy_page, $r_title);
пока на рутрекере не поменяют.

Все работает огромное спасибо
#48
Заметил, что если парсишь что-то, но не сохраняешь тему, то все равно торрент-файл на серваке сохраняется. Это не очень хорошо, будет захламление бесполезными файлами, по которым потом концов не найдешь.
Подтверждаю есть такое не хорошее действие...
#49
Будет ли продолжение? Хотелось бы чтоб рутор и бабочка тоже работали
рутрекер парсит нормально, вот тока попадаются большие релизы парсер несправляется, но это ерунда
Жду продолжения......
#50
Скиньте ссылочки на большие релизы.
Продолжение будет, следующие рутор и ннм, плюс с торрентами надо разобраться (их нельзя удалить из темы 🙂 )