カラクリサイクル

『輝かしい青春』なんて失かった人の雑記

Data::Cloud released.

概要: Data::Cloudをリリースしました。


タグクラウドやワードクラウドのためのUtility moduleであるData::Cloudをリリースしました。

http://search.cpan.org/perldoc?Data::Cloud

どういうモジュールかって言うと、単語の個数をカウントしたり、 単語の個数を元に等級分けするとかそういう感じのモジュールです。

大体こんな感じ。

use Data::Cloud;
use Perl6::Say;
# インスタンスを作る
my $cloud = Data::Cloud->new;
# 文字列を単語に分解するtokenizer
my $parser = MyTokenizer->new;
# 入力ソース
my $source = q{なんらかの文章};
# テキストを単語に分解して個数を数える
for my $word ( $parser->parse( $source ) ) {
    $cloud->increment( $word );
}
# 単語に等級をつける
my $resource = $cloud->rating( rate => 5 );
require YAML;
print YAML::Dump( $resource );

CPANにはTag Cloudを生成するモジュールが見つけただけで、

  • HTML::TagCloud
  • HTML::TagCloud::Sortrable
  • HTML::TagClouder
  • Data::CloudWeight
  • WWW::CloudCreator

これだけあるんですが、どいつもこいつもHTMLを生成するモジュールばっかりで、 純粋に単語の個数を数えたり、等級分けするためのモジュールがなかったため、 作ってみた次第。(まあ単に見つからなかっただけかも知れなくもないけど)

というか。確かtypesterさんの、

引用元:unknownplace.org - 2007/11/14

いろいろあるけどなんでどれもこれもHTML作っちゃうんだろう。もっとシンプルなのほしい。hashで返してくれればいいよ。

というぼやきがきっかけで作り始めたんだと思った。この辺りうろ覚えだけど。

まあ今日リリースになったのは、作り始めたはいいけど、途中で放置してて、 昨日今日でようやく完成させたんでリリースにいたったという感じ。 放置しすぎです><

まあ何かここをこうした方がいいとかここがおかしいとかあればパッチ送るなりなり連絡なりしてください。 あとcodereposで管理してるんで、一緒に開発するのもありです。