work.log

エンジニアの備忘録的ブログ

「Perl module」の記事一覧

MeCabで漢字が混在する文字を50音順に分類する

MeCab を使って漢字が混在した文字を50音順に分類するメモです。 漢字が混在する人名を50音順に並べたいという事で MeCab を使って人名索引データを作成する事にしました。 例えば「山田太郎」な …

文章の類似度を計測するPerlのString::Trigramモジュールを使ってみる

Perl の String::Trigram モジュールを使って文章の類似度を計測する方法のメモです。 文章Aと文章Bはどれ位似ているかを N-gram という手法を使って機械的に判定しようというモジ …

PerlのXML::FeedPP使い方のメモ(補完)

Perl モジュールの XML::FeedPP の使い方を補完したメモ書きです。 以前に、下記で大体の取得系メソッドをまとめたのですが、「カテゴリ・タグ」の取得がよくわからないままだったのでちょっと補 …

PerlのHTML::TreeBuilderとWeb::Scraperは使い分けが良さそうだ

Perl で Web ページをスクレイピングするメモ書きです。 昨日 Web::Scraper を試してみて「Web::Scraper は最高だ!」と書いたのですが、肝心な事を確認するのを忘れていまし …

PerlのWebページスクレイピング覚書 (Web::Scraper 編)

Perl で Web ページをスクレイピングするメモ書きです。 これまでずーっと HTML::TreeBuilder を使ってスクレイピングしてたのですが、そう言えば Web::Scraper っての …

PerlでRSSを解析して必要なデータを取得するの続き

以下で書いたエントリーの続きです。 RSS からでも結構色々な情報が取れるのですが、一部取得の仕方がわからないものもあったりしたので調べてみました。 PerlでRSSを解析して必要なデータを取得する …

PerlでRSSを解析して必要なデータを取得する

Perl で RSS を取り扱う方法のメモ書きです。 この手のツールは沢山溢れていて今更感が漂いまくってますが、自分用のメモとして残したいと思います。 RSS フィードから、「投稿時間」「タイトル」「 …

PerlのCGI.pmで受け取ったデータを連想配列に一気に変換

Perl モジュール CGI.pm のメモ書きです。 HTML のフォームより送信された GET, POST データを、PHP でいうところの $data = $_POST みたいに一気に取得する方法 …

PerlのWebページスクレイピング覚書

Perl で Web ページをスクレイピングして、必要な情報を取得するための覚書です。 この手のサンプルは沢山あるので今更ですけども自分用のメモとして残しておきます。 スクレイピングスクリプトのサンプ …

JSONPを使うためのPerlとjQueryのサンプルコード

Perl と jQuery で JSONP を使うメモです。 今回、別サーバ上にあるデータを WordPress に表示させたいと思い JSONP を簡単に試してみました。 今回試した内容は以下の順で …

Spreadsheet::WriteExcel で数字の独自フォーマットを描画

みんな大好き Excel ファイルを perl で書くメモ。 数字を 3 桁毎にカンマで区切って表示する方法。 add_format に num_format を設定する。こんな感じに。 フォーマット …

perl のアウトプットを JSON フォーマットで

perl で JSON データを出力するメモ。 perl モジュール JSON を使用。 #!/usr/bin/perl use strict; use warnings; use JSON; my …

Spreadsheet::WriteExcel で Excel 関数を使う

みんな大好き Excel ファイルを perl で書くメモ。 perl モジュール Spreadsheet::WriteExcel で Excel 関数を使いたいと思った ので調べました。 CPAN …