# 毎日新聞ユニバーサロン # 三瓶和寿 [FileInfo] Download=http://tudoi.jp/param/ns_mainiti_yc.param Author=三瓶和寿 Mail=kz@tudoi.jp Update=2012/05/03 # ニュースソース名とサイトのベースURL(相対リンクのベースとなるURL)の設定 [NewsSource] SourceName=毎日新聞ユニバーサロン BaseURL=http://mainichi.jp # カテゴリ名と記事一覧のURLの設定 [Category] Category1=ユニバーサロンリポート,/universalon/report/archive/ Category2=クリッピング,/universalon/clipping/ Category3=クリッピング・アーカイブ,/universalon/clipping/archive/ # 記事URLと記事タイトルと日付を抜き出す正規表現の設定 [NewsURL_RegExp] Category1=
  • \s+\s+([^<]+)\s+
  • Category2=
  • \s+\s+([^<]+) Category3=
    \s+\s+([^<]+) # 記事URLを正規表現の部分マッチ文字列を使って表現 [NewsURL] AllCategory=$1 # 記事タイトルを正規表現の部分マッチ文字列を使って表現 [NewsTitle] AllCategory=$2 # 日付を正規表現の部分マッチ文字列を使って表現 [NewsDate] Category1= # 記事本文のはじまりと終わりを示すHTMLタグを定義 [NewsBodyStartEnd] AllCategory=

    , Category2=, Category3=, # 記事本文の正規表現による置換の設定 [NewsBodyReplace] AllCategory=