суббота, 13 марта 2010 г.

Технология RSS

Добавил в свои блоги кнопки подписки через RSS и по электронной почте. Сейчас они располагаются справа вверху.
А далее идет перепост статьи про технологию RSS
Really Simple Syndication (RSS 2.x) — очень простой сбор сводной информации. (Wikipedia)


Что такое RSS
Разное16.03.2008
RSS, кратко говоря, это технология, которая позволяет в удобной форме следить за появлением новой информации на различных сайтах и блогах.

До появления RSS было три способа следить за обновлениями любимых сайтов.

Первый способ (ручной)
Заходить ежедневно/еженедельно на интересующие вас сайты и смотреть, не появилось ли чего-то новенького.
Вполне естественный способ для первого времени, пока таких сайтов малое количество. Но как только у вас будет таких сайтов, к примеру, более десяти, этот способ станет очень неудобным, так как будет тратиться масса времени. Есть еще один минус, если вы платите за интернет не фиксированную сумму в месяц, а платите за количество скачанной информации (платите за трафик). При каждом заходе на сайт, вы будете качать излишние объемы информации, при этом, возможно, часто впустую, обнаруживая, что ничего нового не появилось.

Второй способ (рассылка на e-mail)
На многих сайтах есть возможность подписаться на рассылку новостей сайта через e-mail, что дает возможность получать своевременные уведомления на ваш e-mail об обновлении информации на каждом сайте. На данный момент можно сказать, что это классический способ (так как еще очень многие пользуются им), и, в принципе, он достаточно удобный, если не брать во внимание минусы этого способа.
Минусы:
При подписке на новости сайта вы указываете свой e-mail адрес, есть большой шанс, что это так или иначе способствует в будущем тому, что о нем узнают спамеры. Бывают недобросовестные владельцы сайтов, которые сами продают скопившуюся базу e-mail адресов, а бывает, утечка происходит вообще без ведома владельца сайта. В общем, так или иначе, этот минус имеет место быть…

Из-за достаточно ожесточенной борьбы со спамом в интернете почтовые сервера могут просто не пропускать уведомления к вам на почту, и далеко не всегда у них на это есть объективные причины. Просто, как говорится, “лес рубят, щепки летят”, к этому, к сожалению, привела большая активность спамеров, и похоже, что этой войне нет конца. Благодаря этому у вас есть большой шанс просто не получать часть уведомлений об обновлениях на любимых сайтах или получать их только изредка.
Если какие-то сайты, за которыми вы следите, используют для рассылки писем сторонние бесплатные сервисы, вы автоматически будете вынуждены получать вместе с новостями сайта и “прицеп” разнообразной рекламы (причем, иногда ее действительно слишком много). Такова плата владельца сайта за использование им бесплатного сервиса. Но при этом эти письма обычно не имеют проблем с доставкой.
Это основные минусы, которые пришли на ум. Да, существуют способы борьбы с этими минусами, но это опять же лишние телодвижения, все равно не дающие при этом 100% эффекта.

Третий способ (программы для отслеживания измененных страниц)
Существует ряд программ, которые автоматически заходят на заведомо указанный список сайтов и смотрят дату обновления первой/главной страницы каждого сайта (собственно, следить таким образом можно не только за первой страницей). Делают они это с той периодичностью, которую вы им заведомо укажете. Как только программа видит, что дата последнего обновления страницы изменилась, она немедленно сигнализирует вам об этом. После чего вы видите, на каких сайтах произошли изменения. Т.е. по сути это первый способ, когда вы сами заходите на каждый сайт и смотрите, не появилось ли там чего-то нового, но только за вас это делает специальная программа.
Этот способ придумали, очевидно, те, кому надоели предыдущие два способа
В принципе, способ достаточно хороший и он лишен недостатков предыдущих способов.
Но и здесь есть свои минусы
Минусы:
С помощью данного способа вы не можете следить за изменением сайта в глобальном смысле этого слова. Ведь не факт, что произошедшие изменения сайта в каком-то из его разделов будут как-либо отражены на его первой/главной странице. Программа не проверяет изменения на каждой существующей странице сайта. Она то, конечно, может это сделать (если ее “заставить” делать это), но если сайт большой, опрашивание на предмет измененных страниц может занять много времени и, к тому же, при опрашивании каждой страницы вы тратите свой трафик, за который, возможно, вы платите (т.е. за каждую скачанную страницу платите своему провайдеру определенную сумму).
Вы не видите, что именно появилось нового, т.е. нет какого-то человеческого описания, есть только сигнал “Страница изменилась”, и на самом деле, если изменилась дата изменения страницы, не факт, что там появилась какая-то новая информация (может, там, к примеру, просто немного изменился дизайн страницы). Но в целом, это не сильно большой минус.

Стоит отметить, что если хозяин сайта не предусмотрел способа оповещения желающих о новых материалах на своем сайте (рассылка на e-mail, или тот же RSS, но о нем чуть, ниже) то, пожалуй, это единственный способ слежки за сайтом.

В целом складывается не очень радужная перспектива…

Но теперь в нашем распоряжении есть RSS ! Так как это тоже инструмент для слежения за обновлениями на сайтах, это будет нашим четвертым, пожалуй, самым лучшим способом.

RSS
RSS, это нечто, очень похожее на третий способ. Для этого тоже нужна специальная программа, которая следит за определенными файлами на нужных вам сайтах. Разница лишь в том, что в случае RSS, программа не следит за обычными страницами сайта, а следит она за специально подготовленной страницей, которая называется RSS-документом. В этом RSS-документе не выводится никакой лишней информации типа дизайна сайта, меню навигации и т.п., только информация об последних обновлениях на сайте (например, информация, о последних 10-ти новинках сайта) в виде заголовка новости, дополнительного описания новости и ссылки, ведущей на страницу сайта, где изначально предоставлена эта новость, возможно, в более развернутом виде. Бывает, в RSS-документах идут целые статьи, а не их анонсы, что дает вам возможность читать статьи не заходя на сайт.
Такой RSS-документ называют еще RSS-лентой, RSS-потоком или RSS-каналом сайта.
Например, адрес RSS-канала на моем блоге вот такой: http://dev.ezoterik.info/feed/
Не на всех сайтах есть свои RSS-каналы, но в последнее время таких сайтов все меньше и меньше.
Если вы видите на сайте или блоге подобные значки (и призывы подписаться на RSS):



(цвет и форма могут в отличаться, но сам логотип () обычно не видоизменяется)
Они сигнализируют о том, что на сайте/блоге есть RSS-канал, на который можно подписаться.
Так же нужно знать, что на одном сайте не обязательно только один RSS-канал. Частенько бывает, что на сайте помимо главного канала бывает целый ряд дополнительных RSS-каналов, в каждом из которых, к примеру, освещаются новости конкретных разделов сайта, что дает вам более гибкий выбор, если вы не хотите следить за абсолютно всеми новостями сайта.
Так, к примеру, здесь на блоге есть еще отдельный RSS-канал, который позволяет следить исключительно за комментариями в блоге: http://dev.ezoterik.info/comments/feed/
На этом пока все, итак уже размер статьи выходит за рамки приличия . В следующей статье я напишу о том, как пользоваться RSS-каналами.
Если в моем объяснении что-то не понятно, с удовольствием отвечу на ваши уточняющие вопросы в комментариях и дополню статью."

Спасибо за внимание.
Если вам понравилась данная статья вы можете подписаться на обновления блога через RSS или по электронной почте. А также добавить пост в один из сервисов закладок с помощью кнопки ниже.

2 комментария:

  1. спасибо
    толково
    но есть вопрос: по каким причинам (в принципе) rss-подписка может пропускать, т.е. НЕ присылать некоторые новости/объявления
    ?

    Михаил

    ОтветитьУдалить
  2. Скорее всего это настройки источника: например Wordpress можно настроить таким образом что-бы посты из определенной категории (с определенными тегами) не попадали в rss.

    ОтветитьУдалить