Препарируем RSS

Никита Кислицин

Хакер, номер #076, стр. 076-120-1

(nikitoz@real.xakep.ru)

Разбираемся в технологии RSS и пишем свою новостную ленту

В последнее время все популярнее становятся разговоры об унификации и стандартизации информации, распространяемой в web-среде. В самом деле, порой нелегко бывает отыскать что-то нужное среди вороха страниц; пользователи все больше устают от назойливой рекламы и некачественного дизайна. Поэтому в определенный момент появилась технология, которая позволила полностью отделить текстовую информацию от определенного графического представления и легко обмениваться ею, избегая любых конфликтов и противоречивости. Сегодня речь пойдет как раз об этом – о стандарте RSS. Мы напишем свою ленту и подумаем над тем, как импортировать данные из чужих блогов. Вперед!

Для чего?

На самом деле, RSS – это очень популярная технология, которая в силу своего удобства и функциональности пришлась по душе миллионам пользователей. Самые крупные интернет-проекты уже не скупятся на то, чтобы предоставлять информацию в этом формате. За примерами далеко ходить не надо – любой новостной сайт экспортирует свои новости в RSS, Яндекс открыл свою собственную, очень удобную, службу индексирования новостных RSS-лент, и даже в ЖЖ давно уже есть возможность читать дневники в этом формате.

Так что если для тебя аббревиатура RSS не значит ровным счетом ничего, то ты здорово отстал от жизни и надо обязательно изучать новую технологию. Тем более что она проста как два рубля и гениальна как пакет кефира.

Так же присутствие RSS-ленты на любом интернет-проекте делает его весьма солидным и здорово отличает от конкурентов. Поэтому если у тебя есть свой сайт, на котором ты регулярно размещаешь новые материалы, RSS-лента здорово поможет тебе поднять популярность твоего ресурса. И просто сделает его более качественным, современным и удобным.

Что это такое?

RSS - Really Simple Syndication. Какая еще “реально простая синдикация”, что за бред? :) На самом деле, все просто. Последнее слово можно перевести как “приобретение”, а всю аббревиатуру как “чрезвычайно простое приобретение информации”. Это такой формат обмена текстовыми данными в web-среде, который основывается на том факте, что информация на всех сайтах имеет схожую структуру и может быть приведена к единому формату.

Как и следовало бы ожидать, RSS – это язык, являющийся подмножеством XML и поэтому все RSS-документы должны соответствовать стандарту XML 1.0 (www.w3.org/TR/REC-xml). Однако сам стандарт RSS определен на один уровень выше и имеет вполне четкое описание, которое я тебе сейчас и приведу в сжатом виде. За более строгой спецификацией советую тебе обратиться к документации, которую ты найдешь на нашем диске.

Стандарт RSS

В своих статьях я уже неоднократно описывал технологию XML, поэтому сегодня я не буду останавливаться на ее спецификации и стану отталкивать оттого, что ты знаком с ней хотя бы поверхностно и имеешь представление о том, как выглядят xml-документы.

На верхнем уровне любого RSS-документа находится элемент <rss>, который содержит обязательный атрибут version, указывающий на версию документа. В этой статье я буду описывать версию 2.0 и поэтому атрибут version должен иметь соответствующее значение.

Содержание  Вперед на стр. 076-120-2
ttfb: 3.6079883575439 ms