MeCabで漢字が混在する文字を50音順に分類する
MeCab を使って漢字が混在した文字を50音順に分類するメモです。 漢字が混在する人名を50音順に並べたいという事で MeCab を使って人名索引データを作成する事にしました。 例えば「山田太郎」な …
エンジニアの備忘録的ブログ
MeCab を使って漢字が混在した文字を50音順に分類するメモです。 漢字が混在する人名を50音順に並べたいという事で MeCab を使って人名索引データを作成する事にしました。 例えば「山田太郎」な …
Perl の String::Trigram モジュールを使って文章の類似度を計測する方法のメモです。 文章Aと文章Bはどれ位似ているかを N-gram という手法を使って機械的に判定しようというモジ …
Perl モジュールの XML::FeedPP の使い方を補完したメモ書きです。 以前に、下記で大体の取得系メソッドをまとめたのですが、「カテゴリ・タグ」の取得がよくわからないままだったのでちょっと補 …
Perl で Web ページをスクレイピングするメモ書きです。 昨日 Web::Scraper を試してみて「Web::Scraper は最高だ!」と書いたのですが、肝心な事を確認するのを忘れていまし …
Perl で Web ページをスクレイピングするメモ書きです。 これまでずーっと HTML::TreeBuilder を使ってスクレイピングしてたのですが、そう言えば Web::Scraper っての …
以下で書いたエントリーの続きです。 RSS からでも結構色々な情報が取れるのですが、一部取得の仕方がわからないものもあったりしたので調べてみました。 PerlでRSSを解析して必要なデータを取得する …
Perl で RSS を取り扱う方法のメモ書きです。 この手のツールは沢山溢れていて今更感が漂いまくってますが、自分用のメモとして残したいと思います。 RSS フィードから、「投稿時間」「タイトル」「 …
Perl モジュール CGI.pm のメモ書きです。 HTML のフォームより送信された GET, POST データを、PHP でいうところの $data = $_POST みたいに一気に取得する方法 …
Perl で Web ページをスクレイピングして、必要な情報を取得するための覚書です。 この手のサンプルは沢山あるので今更ですけども自分用のメモとして残しておきます。 スクレイピングスクリプトのサンプ …
Perl と jQuery で JSONP を使うメモです。 今回、別サーバ上にあるデータを WordPress に表示させたいと思い JSONP を簡単に試してみました。 今回試した内容は以下の順で …
みんな大好き Excel ファイルを perl で書くメモ。 数字を 3 桁毎にカンマで区切って表示する方法。 add_format に num_format を設定する。こんな感じに。 フォーマット …
perl で JSON データを出力するメモ。 perl モジュール JSON を使用。 #!/usr/bin/perl use strict; use warnings; use JSON; my …
みんな大好き Excel ファイルを perl で書くメモ。 perl モジュール Spreadsheet::WriteExcel で Excel 関数を使いたいと思った ので調べました。 CPAN …