Google AdSenseでは広告を最適化するためにセクション・ターゲットという機能が提供されています。このセクション・ターゲットは、コンテンツ部分(またはコンテンツ以外の部分)を明示することが可能なので、いろいろな再利用法が考えられそうかなとかいう感じ(セクション・ターゲットそのものについてはSEO関連のサイトでピックアップされているだろうと思うので触れません)。
セクション・ターゲットの開始タグにつづく文章を255文字目まで切り出すとかいう単純な実装で、かなり自然な概要になるんじゃないかなーとか。
はてなブックマークの概要に利用するというのとほぼ同じですね。単にURLを指定してタグ候補を受け取るよりも、よりコンテンツにマッチしたタグを推薦してくれるでしょう。この場合はこちら側でセクション・ターゲットの範囲を勝手に抜き出してTagyuに渡すという形で良いので、サービス側で実装される必要は無さそう。
もちろんYahoo!のTerm Extraction Web ServiceとかBulkfeedsの特徴後抽出、いしなおさんの奴とかでも利用できるでしょう。
Technoratiのリンク検索は、はてなダイアリーのはてなブックマーク・モジュールによるブックマークの取り込みなど主要なコンテンツ以外からのリンクをガンガン拾ってしまうことが目立つようになり、ちょっと使いづらい感じです。これがセクション・ターゲットの範囲内にあるリンクのみに限定してインデックスしてくれるとかだとかなり素晴らしい検索結果になりそう。
通常のいわゆるblog検索サービス(BulkfeedsやFeedsterなど)はフィードをインデックスの元データにしていると思うので、こういった問題とは無縁のはず。
そのうちセクション・ターゲットと同じ機能をMicroformatsで・・・みたいなのも出てきそう。