2011-04-01から1ヶ月間の記事一覧

nutch でクローリング

http://wiki.apache.org/nutch/NutchTutorial を参考にbin/nutch crawl urls -dir crawl -depth 1 -topN 1でやってみた。 クローリングは、PCの性能の限界もあるので、絞ってやろうかと思います。あとは、小規模サイトは気をつけよう。 http://slashdot.jp/s…

ronzacapa

ronzacapa ラム酒です。 note:MBP13 keyboard:sk-8835 monitor:G2420HD itunes radio:SkaFreaks.com広く浅くをモットーにいろいろ試してみる 今年の目標:ひとまず何かしらのサイトを立ち上げたい。 長い目標:会社に依存しない実力をつけること。