# 日本共産党情報 # 三瓶和寿 [FileInfo] Download=http://tudoi.jp/param/ns_jcp.param Author=三瓶和寿 Mail=kz@tudoi.jp Update=2012/01/22 # ニュースソース名とサイトのベースURL(相対リンクのベースとなるURL)の設定 [NewsSource] SourceName=日本共産党情報 BaseURL=http://www.jcp.or.jp/ # カテゴリ名と記事一覧のURLの設定 [Category] Category1=しんぶん赤旗,akahata/index.rdf Category2=新着情報2012,atom.xml Category3=動画2012,web_mov/atom.xml Category4=特集,web_tokusyu/atom.xml Category5=党紹介,web_jcp/atom.xml Category6=申し込み,web_info/atom.xml # 記事URLと記事タイトルと日付を抜き出す正規表現の設定 [NewsURL_RegExp] Category1=([^<]+)\s*(http://www.jcp.or.jp/akahata/[^<]+)\s*([^<]+)\s*([0-9]{4})-([0-9]{2})-([0-9]{2})T([0-9]{2}):([0-9]{2}):[^<]+ Category2=([^<]+)\s+\s+[^<]+\s+([0-9]{4})-([0-9]{2})-([0-9]{2})T([0-9]{2}):([0-9]{2}):([0-9]{2})Z Category3=([^<]+)\s+\s+[^<]+\s+([0-9]{4})-([0-9]{2})-([0-9]{2})T([0-9]{2}):([0-9]{2}):([0-9]{2})Z Category4=([^<]+)\s+\s+tag:www.jcp.or.jp[^<]+\s+([0-9]{4})-([0-9]{2})-([0-9]{2})T([0-9]{2}):([0-9]{2}):([0-9]{2})Z Category5=([^<]+)\s+\s+tag:www.jcp.or.jp[^<]+\s+([0-9]{4})-([0-9]{2})-([0-9]{2})T([0-9]{2}):([0-9]{2}):([0-9]{2})Z Category6=([^<]+)\s+\s+tag:www.jcp.or.jp[^<]+\s+([0-9]{4})-([0-9]{2})-([0-9]{2})T([0-9]{2}):([0-9]{2}):([0-9]{2})Z # 記事URLを正規表現の部分マッチ文字列を使って表現 [NewsURL] AllCategory=$2 # 記事タイトルを正規表現の部分マッチ文字列を使って表現 [NewsTitle] AllCategory=$1 # 日付を正規表現の部分マッチ文字列を使って表現 [NewsDate] AllCategory=$4年$5月$6日$7時$8分更新 Category2=$3年$4月$5日更新 Category3=$3年$4月$5日更新 Category4=$3年$4月$5日更新 Category5=$3年$4月$5日更新 Category6=$3年$4月$5日更新 # 記事本文のはじまりと終わりを示すHTMLタグを定義 [NewsBodyStartEnd] allCategory=, Category1=
, Category2=,感想を書く Category3=,感想を書く Category4=,感想を書く Category5=,感想を書くCategory3=,感想を書く Category6=,感想を書くCategory3=,感想を書く # 記事本文の正規表現による置換の設定 [NewsBodyReplace] AllCategory=