Find Something You’ve Lost

既存DBをRDF化してSPARQLエンドポイントを立ち上げました

第2回LinkedData勉強会に参加して、最近行った略語のアリーのRDF化およびSPARQLエンドポイントの構築について発表してきました。

トリプルストアにはVirtuosoを利用しました。OWLIM-SEも試しましたが、動作の安定性という点から前者を選択しています。

勉強会のページからも発表資料を閲覧出来ますが、こちらにも張っておきます。

第2回LinkedData勉強会@yayamamo

View more presentations from yayamamo @ yayoi

PerlモジュールFile::Findを使うならfind2perlも忘れずに

Posted by yayamamo on 2011年6月21日 No comments

Unix系のOSではおなじみのfindコマンドと同じ振る舞いを簡単にPerlで実現できるモジュールFile::Find。
普段findコマンドを駆使しているなら、find2perlコマンドを使って対応するPerlコードを自動生成させるのが吉。
モジュールのヘルプドキュメントにある通り、

    find2perl / -name .nfs\* -mtime +7 \
        -exec rm -f {} \; -o -fstype nfs -prune

と実行すると、

    sub wanted {
        /^\.nfs.*\z/s &&
        (($dev, $ino, $mode, $nlink, $uid, $gid) = lstat($_)) &&
        int(-M _) > 7 &&
        unlink($_)
        ||
        ($nlink || (($dev, $ino, $mode, $nlink, $uid, $gid) = lstat($_))) &&
        $dev < 0 &&
        ($File::Find::prune = 1);
    }

と生成される。

MySQLで期間ごとに集計したヒストグラムを取得

Posted by yayamamo on 2011年1月13日 No comments

時間(タイムスタンプ)情報付きのデータについて、指定した範囲でまとめた上で、各期間について頻度を取得するコマンドをメモ。
例えば、accessed_at という datetime 型の列があり、その時刻に value 列に納められる情報を取得したことを記録するログテーブル access_log を想定する。
そのとき、月ごとのアクセス数を取得するためには以下のようなコマンドを発行する。
SELECT COUNT(value),YEAR(accessed_at),MONTH(accessed_at) FROM access_log GROUP BY YEAR(accessed_at),MONTH(accessed_at);
以下のような結果が得られる。

+--------------+------------------+-------------------+
| COUNT(value) | YEAR(accessed_at) | MONTH(accessed_at) |
+--------------+------------------+-------------------+
|         1893 |             2009 |                 4 |
|         2197 |             2009 |                 5 |
|         1617 |             2009 |                 6 |
|         2354 |             2009 |                 7 |
|         1836 |             2009 |                 8 |
|         1795 |             2009 |                 9 |
|         1930 |             2009 |                10 |
|         1855 |             2009 |                11 |
|         1757 |             2009 |                12 |
|         2386 |             2010 |                 1 |
|         2844 |             2010 |                 2 |
|         2100 |             2010 |                 3 |
+--------------+------------------+-------------------+

参考ページ

論文執筆支援サービスの紹介

Posted by yayamamo on 2010年12月11日 No comments

すっかり遅くなってしまったけれど、ここに埋め込んでいくことに。
分子生物学会 (BMB2010) のポスター発表でも紹介しました。

生物物理若手夏の学校 TogoDoc inMeXes Allie

View more presentations from yayamamo @ yayoi.

MySQL で日付計算

Posted by yayamamo on 2010年11月8日 No comments

mysql の関数で日付を扱う場合のメモ。

リファレンスマニュアルはコチラ。

日付の計算はいろいろと面倒だから、その辺はしっかりと関数で提供されている。

たとえば、今日の日付は CURRENT_DATE()、あるいは CURDATE() で得られる。

mysql> SELECT CURRENT_DATE();
+—————-+
| CURRENT_DATE() |
+—————-+
| 2010-11-08 |
+—————-+
1 row in set (0.00 sec)

そして、「昨日」は DATE_SUB() を利用して以下のように得られる。

mysql> SELECT DATE_SUB(CURRENT_DATE(), INTERVAL 1 DAY);
+——————————————+
| DATE_SUB(CURRENT_DATE(), INTERVAL 1 DAY) |
+——————————————+
| 2010-11-07 |
+——————————————+
1 row in set (0.00 sec)

「曜日」に関しては以下のような関数群が用意されている。

+——————–+
| DAYNAME(CURDATE()) |
+——————–+
| Monday |
+——————–+
1 row in set (0.00 sec)

mysql> SELECT DAY(CURDATE());
+—————-+
| DAY(CURDATE()) |
+—————-+
| 8 |
+—————-+
1 row in set (0.00 sec)

mysql> SELECT DAYOFWEEK(CURDATE());
+———————-+
| DAYOFWEEK(CURDATE()) |
+———————-+
| 2 |
+———————-+
1 row in set (0.00 sec)

今月は何日までだっけ？という時には LAST_DAY 関数。

mysql> SELECT LAST_DAY(CURDATE());
+———————+
| LAST_DAY(CURDATE()) |
+———————+
| 2010-11-30 |
+———————+
1 row in set (0.00 sec)

などなど。

OpenID で Semantic MediaWiki にログイン

Posted by yayamamo on 2010年7月1日 No comments

今回は以前構築したセマンティック・メディアウィキ (Semantic Media Wiki, SMW、SMW+) に OpenID でログインできるように OpenID extension をインストール。

MediaWikiのバージョンは1.15.3。これに必要なOpenID extensionのバージョンは0.8.2らしい (DownloadページでMediaWikiのバージョンを指定すると自動的に適切なパッケージが得られる)。

これに必要な PHP ライブラリはOpenID Enabledなんだが、それが必要とするライブラリがいろいろとあり、その準備から始める必要があった。

OpenID Enabled

標準エラー出力のリダイレクト

Posted by yayamamo on 2010年6月24日 No comments

UNI* 系OS利用者ならよく使うリダイレクション。
標準出力と標準エラー出力を共にリダイレクトする場合の記法を書いておく。

csh, tcsh, zsh
perl -e 'print "Hello World!\n";warn "Hi There!\n";' | & less perl -e 'print "Hello World!\n";warn "Hi There!\n";' > & /dev/null

sh, bash
perl -e 'print "Hello World!\n";warn "Hi There!\n";' 2>&1 | less perl -e 'print "Hello World!\n";warn "Hi There!\n";' > /dev/null 2>&1 perl -e 'print "Hello World!\n";warn "Hi There!\n";' >& /dev/null

Semantic MediaWikiとSMW+のセットアップ

Posted by yayamamo on 2010年5月20日 No comments

背景

OWL/RDFファイルを参照し、その内容を反映したサイトを自動構築するのに相応しい環境を検討した。
つまり、効率的に「セマンティックコンテンツ管理システム」を実現したい時に適切な環境を知りたかった。
この環境では、統一感があり、ページ間の繋がりが有機的なサイト構成を例えば Protege を利用して検討しOWLファイルとして生成すれば、それを反映したサイトがたちどころに出来上がることになる。
その結果、現時点でオープンソースシステムだけで実現しようとすると、メディアウィキ (MediaWiki) にセマンティック・メディアウィキ (Semantic MediaWiki) と SMW+ (Halo extension) を追加する方法以外には無いという結論に至った。本環境では日本語も問題なく扱えた。

インストール

« Previous page | Next page »

Just another day of Yayamamo

既存DBをRDF化してSPARQLエンドポイントを立ち上げました

SPARQLクエリで検索対象データの特徴を取得

SPARQL and VoID