воскресенье, 1 ноября 2009 г.
Я расскажу, насколько просто использовать alpha parser. Демо версию использовать точно так же, за исключением того момента, что некоторые функции недоступны в ней.
Скорость программы обеспечивается за счет централизованной базы расположенной на нашем сервере.
После запуска окно программы будет выглядеть следующим образом:
Для демо версии и для полной версии соответственно. Если кнопка или опция в демо версии серая-значит она доступна только в полной версии.
Для начала следует указать запрос по которому будут искаться статьи, и страницу базы(это нужно если вы хотите продолжить парсинг, при этом парсинг начнется не с нулевой страницы выдачи базы по запросу, а с указанной).
Затем выставьте опциональные функции, такие как:
"Убирать теги"-эта функция полностью убирает html теги(то есть картинки, скрипты и форматирование) при парсинге.
"Уникализировать"-простая функция уникализации путем подмены символов кириллицы на графически идентичные аналоги из латиницы, если таковые имеются. То есть символ "А" из кириллицы преобразуется в символ "A" латиницы. С точки зрения поисковых систем эти символы различны, а с точки зрения человека-одно и тоже. Символ меняется только если аналог из латиницы идентичен по виду, то есть символ "Ф" меняться на "F" НЕ БУДЕТ.
"Noindex ссылки"- добавлените тега <noindex > ко всем ссылкам в тексте. Уменьшает ссылочную массу на конечном сайте.
После выбора функций следует указать адрес сохранения конечного результата. Если адрес не указан, то парсер будет сохранять результаты в корневую (свою) папку.
Не забудьте указать формат экспорта данных. Агрегаторов rss лент сейчас существует большое множество самых разных. Во многих движках (wordpress к примеру) импорт из rss ленты встроен изначально. Поэтому именно формат rss был выбран для сохранения. Формат html файлов создает файлы, пригодные для дальнейшей ручной обработки.
Теперь надо нажать на "Старт" и подождать пару минут. Очень важно, что выходить из парсера во время работы при использовании rss ТОЛЬКО НАЖАТИЕМ НА КНОПКУ "Выход" И НИКАК ИНАЧЕ. Если этого не сделать то окончание rss записано не будет и это может привести ленту в негодность. Если такое произошло надо вручную дописать в конце файла ленты строки:
</channel>
</rss>
Вот и все.
Именно в НАШЕЙ стране есть все, кроме 11 нормальных футболистов...
Именно в нашей стране с каждой секундой крепнет и вздымается все, что можно...
Ведь именно мы занимаем бОльшую часть Евразии, чем Евразия не очень довольна.
Думаю вам понравится у меня.
[url=http://www.pi7.ru/video/135-kakaya-zh-neopytnaya-dostalas-mne.html]Видео девочек[/url]
[url=http://www.pi7.ru/video/134-igra-do-orgazma.html]видео юных[/url]
Вы продаете сквозные ссылки с сайта? Если да, свяжитесь со мной, плз!