igetiの記事に関して,データはどっから持ってくるのか,というご照会が・・・
ちょっと活字中毒気味の私などから見ると,インターネットは暇つぶしの宝庫なんですが・・
まず,基本的なところでは,著作権の切れた古典を有志がアップしている青空ネットや無料でアップされているオンライン小説があります。
次に掲示板などのログ,2chのものはあちこちにアップされています。
探せばいくらでも出てくる・・というより,自分の関心がどこにあるのか,をまず見極めることが先かもしれませんね・・
目先を変えれば,お仕事にも使えます・・
たとえば,国会や諮問会議の議事録などを検索することがお仕事だった時期がありまして,その時は,リンクを根こそぎダウンロードして,委員会名と日付をファイル名にして,grepで検索をかけてタグジャンプで読む(というより,浴びる,というか論旨だけを追っかけていく,ほとんど作業ですな),などということをしていたのですが,財務省の財政制度審議会の議事録などは,意外と勉強になったりします(答申や報告書は,無味乾燥ですが・・)。
あと,質問趣意書もなかなかおもしろいものがありますので,滅多に退屈するわけには参りません・・。
-----------------------------------------------------------------------
http://www.aozora.gr.jp/
青空文庫は、利用に対価を求めない、インターネット電子図書館です。
http://chaosparadise.jp/
ChaosParadise(カオスパラダイス)はネットで読める小説の検索データベース
http://ma-to-me.com/
検索の手間を大幅に省いてくれる、ありがたい「まとめサイト」をさらにまとめたサイトです。
http://www.mof.go.jp/singikai/zaiseseido/zaisei1.htm
財政制度等審議会 議事要旨等
http://www.shugiin.go.jp/index.nsf/html/index_shitsumon.htm
第169回国会の質問の経過、質問本文及び答弁本文を照会することができます。
http://www.vector.co.jp/soft/win95/util/se283383.html
フロッピーディスクやCD-Rなどに入らないような大きなファイルを、分割、結合するためのツールです。
http://www.vector.co.jp/soft/win95/net/se065646.html
HtoX32は、HTMLで書かれたファイルからテキストファイルを生成するフィルタソフトです。