読者です 読者をやめる 読者になる 読者になる

kimonoからRSS作成(概要含む)

スクレイピング kimono RSS

http://ja.blog.blikk.co/%E3%80%8C%E3%82%B5%E3%82%AF%E3%83%83%E3%81%A8web%E3%83%9A%E3%83%BC%E3%82%B8%E3%81%8B%E3%82%89%E3%83%87%E3%83%BC%E3%82%BF%E5%8F%96%E3%82%8A%E3%81%9F%E3%81%84%E3%80%8D%E3%81%9D%E3%82%93%E3%81%AA/ja.blog.blikk.co

1.リンクがあるページを選んでURLを抽出

2.上のリストから行けるページからタイトル(title)とリンクと概要(description)を抽出

※RSS2.0の名前と同じ以下の項目名にしておく。

名前 内容
title(LINK) タイトルとURL
description 概要説明
author 作成者
category カテゴリ
pubDate 公開日
comments(LINK) コメントとコメントのURL

※1・2それぞれのAPIを作成する。

f:id:imabari_ehime:20150623152643p:plain

3.2の設定画面のCRAWL SETUPのCRAW STARATEGYを「URLs from source API」を選んでSOURCE APIから1の名前、URLを選んだら記事の概要を含むRSSが作成できる。

流れとしては
「1」でリンク抽出し、そのリンクを元に「2」でタイトル・概要を抽出する。

「2」の抽出が同じ場合は「1」のCRAW STARATEGYを「Manual URL list」「Generated URL list」でURLを追加しておけばできます。