Weblog

RSSファイルのdescriptionを調節

Posted at 2003-10-13T06:40:00+09:00 in RSS

RSSファイルの各itemdescriptioncontent:encodedが、両方ともエントリの内容そのまんまというのはどうも無駄な感じが否めないので、descriptionは最初の段落のみ、content:encodedはこれまで通りエントリの内容のフルコピーというようにしました。

最近のRSSリーダーはcontent:encoded優先というものが多いと思うので、あんまり問題ない(今までどおりとも言う)んじゃないかと思ってます。RSSファイルのサイズがかなり減るという利点も。

実装は単純明快に、

sub make_excerpt {
  my $out = $_[0];

  $out =~ s!\x0D\x0A|\x0D|\x0A!!g;
  $out =~ s!^(.*?)</p>.*$!$1!g;
  $out =~ s!<.*?>!!g;

  return $out;
}

最初のp要素の閉じタグまで抜き出すとしました。substrでうまく切る方法を思いつかなかったので、こんな実装になったのは秘密です。utf8モジュールないしなぁ、ここ。かといって、要約生成するためにJcodeモジュールで一旦EUC-JPに変換して処理するとかもなんか手間がかかるわりに報われないかなと。ざっと自分のエントリを眺めたところ、大体はタイトルと最初の段落で概要はつかめそうだったので、これで良い事にします。

うちで配っているRSS関連スクリプトは、軒並みcontent:encoded非対応だったりするわけですが。そろそろ対応しようかなとか思うんですが、HTML出力限定という作りになっていないので、なかなか対応しづらいんですよね。

もし、descriptionがエントリ内容のフルコピーであるRSSファイルがどうしても必要という場合は、別のflavour作って対応しますので、ヨコセとコメントで要求してください。

Recent entries from same category

同じカテゴリに分類された最近10件のエントリです。

  1. Web Bugをフィードに埋め込む
  2. Bloglinesとlivedoor Readerのアクティブ・ユーザー
  3. 購読者の内訳
  4. livedoor Reader
  5. Bloglinesにホットキーが導入
  6. ITmediaがフィード配信を開始
  7. Feed History
  8. 購読者数の推移
  9. フィード向け広告
  10. VistaのRSSサポート

Comments

JavaScriptに対応または有効な環境の場合、ここにはてなブックマークでのこのエントリに対するコメントが表示されます。

Weblog archives

by Category

This page was last modified on 2003-11-18T19:32:13+09:00 (in 0.106 secs).