MeCabで漢字が混在する文字を50音順に分類する
MeCab を使って漢字が混在した文字を50音順に分類するメモです。 漢字が混在する人名を50音順に並べたいという事で MeCab を使って人名索引データを作成する事にしました。 例えば「山田太郎」な …
エンジニアの備忘録的ブログ
MeCab を使って漢字が混在した文字を50音順に分類するメモです。 漢字が混在する人名を50音順に並べたいという事で MeCab を使って人名索引データを作成する事にしました。 例えば「山田太郎」な …
コサイン類似度を計算して二つの文章がどれ位似ているのかを判定するメモです。 Perl でこのようなコードを書くとコサイン類似度を計算できます。文章と言いながら今回は名詞レベルで比較しています。 #!/ …
Perl の String::Trigram モジュールを使って文章の類似度を計測する方法のメモです。 文章Aと文章Bはどれ位似ているかを N-gram という手法を使って機械的に判定しようというモジ …
Perl でBasic認証で保護されたページ内容を取得するメモ。 Basic認証はよく利用するのですが、何かを作っている時にこれがネックとなる場合もチラホラと。そういえば Perl でこの認証を突破す …
Perl から PubSubHubBub のサーバに Publish 通知を送る方法です。 下記記事で PubSubHubBub 対応のフィードを作ったので、後はアプリケーションから更新通知を出してこ …
Perl で PubSubHubBub 対応の RSS フィードを作成するメモです。 PubSubHubBub って何だというのはググればわかると思うので割愛。とりあえず Ping の改良版みたいな感 …
Perl の XML::FeedPP モジュールで RSS フィードを作るメモです。 オリジナルの CMS もどきを作ろうとしていて、これに RSS フィードが必要なのでちょっとやってみました。 各種 …
Perl のスクリプト内で PATH 変数を使うメモ。 知らなかったので覚えておく。 #!/usr/bin/perl use strict; use warnings; local $ENV{PATH …
下記記事で書いた更新通知用の Ping サーバのメモ。 Perl で Ping サーバを建てるよー 前回は Perl の XMLRPC::Transport::HTTP モジュールを使って簡単なサーバ …
Perl で Ping サーバを建てるメモです。 ブログ等の更新通知に Ping サーバを設定している人は多いと思いますが、サーバを建てる人ってあまりいないと思います。 とりあえず、WordPress …
Perl モジュール JSON の私的なメモです。 この Perl モジュールは相当愛用しているモジュールで、もうアチラコチラに組み込んで使っていたのですが最近になってメソッドを間違えて使っていた事が …
Perl でページネーション (ページ送り) を作ってみたのでそのメモ。 DB に格納した大量のデータを一覧表示する際になくてはならないページネーションですが、これを自前で用意してみたらわりと面倒だっ …
MeCab のメモ書き。 どうしても MeCab を使わないと出来ない壁にぶち当たったので久しぶりセットアップ。 が、ちょっとメモがアレすぎて思い出すのに時間がかかったのでちゃんとメモをしておこうと思 …