$ fastladder-crawler export.opml 'http://url_of_fastladder'
とかコマンドうつとクローラーが起動してガンガンクロールして RPC 経由で更新する感じですかね。
フィードにアクセスしまくらないように CrawlStatus というのが Fastladder 側にあるんだけど、これは無視して自前でなんとかするのがよい感じする。なるべく Fastladder から切り離す。
フィード全文化とかはオプションで選択出来るようにする。広告除去もそんな感じ。
こんなもんか?
ふーむ、どうせならクロールすべきフィードの一覧を返すAPI、があった方がより疎結合になるかな。
(認証の方法は別途考えるとして)
あと記事の更新方法もいくつかアプローチがありますね。
記事一件単位でとにかくPOSTしまくる
pubsubhubbub 風
フィードそのまま or JSONに変換して複数記事一度に投げる
まずlink一覧投げる → digest一覧返す → 更新された記事の分だけ投げる