воскресенье, 15 ноября 2009 г.
Вышла новая версия парсера под номером 1.3.
Эта версия была доработана согласно просьбам пользователей. Теперь можно указывать не только запрос, но и категорию или метку по которой будет искаться статья (при этом поле запрос можно не заполнять, а можно и заполнять). Это поможет получить более качесвенные результаты. Поправил баг, при котором нельзя было искать по всем форумам и блогам сразу. Добавил парсинг по списку url статей. Добавил ограничение на минимальную и максимальную длину статьи. Разделил поля для поиска по сервису и по блогу. Теперь поиск по блогу более качественный. Теперь стоп слова, замены, и список url можно настраивать из программы. Исправил баг с сохранением в rss.
Список функций:
1.Парсинг по заданному слову или выражению. Теперь результаты сортировать можно по дате публикации или по релевантности. При этом при сортировке по дате результаты более тематические.
2. Парсинг статей заданой категории. При этом парсятся только статьи указаной категории или метки.
3.Экспорт в отдельные html файлы, rss ленту или html файл для дальнейшего импорта в zebroid или WPT.
4.Парсить теперь можно популярные блоги, блоги целиком(статьи и комментарии из блогов), записи из блогов, записи из микроблогов, коментарии из блогов и микроблогов, форумы, все блоги и форумы.
5.Можно парсить определенный сервис(livejournal и т.п.) или даже отдельный блог.
6. Функция замены слов в тексте.(Файл replace.txt в папке парсера. Для замены слова "пользователь" на "читатель" добавте туда строку "пользователь=читатель", без кавычек.)
7.Тепероь рядом с каждой функцией есть знак вопроса, при нажатии на который вы получите краткую справку.
8. Удаление повторов. Парсер автоматически удаляет 90% повторных статей в случае если одна статья размещена на нескольких сервисах.(Присутствует с версии 1.1)
9.Добавлены стоп слова.(Файл stop_slova.txt в папке парсера. Писать надо по одному слову в строке. Если одно из этих слов встречается в тексте статьи то статья не сохраняется. Регистр значения не имеет. )
10.Можно парсить по собраному списку url статей.
Это основные изменения. Недеюсь вам понравится.
Скачать : installer
RAR архив (если на installer ругается антивирус).
По всем вопросам пишите на alpha_parser@bk.ru
или в ICQ: 360757423