すずけんメモ

技術メモです

TDB + JosekiでSPARQL endpoint構築

今日はTDBとJosekiでSPARQLのエンドポイントを構築していた。

TDB - Jena Wiki
http://openjena.org/wiki/TDB

Joseki - A SPARQL Server for Jena
http://www.joseki.org/

TDBはJena FrameworkというJava製のSemantic Web Applicationのためのツール群に含まれている。TDBはRDF用のデータベースとしての位置づけである。

Apache Jena - Welcome to Jena
http://incubator.apache.org/jena/

RDF用のデータベースはいくつか存在するが、TDBはそのなかでも軽量でパフォーマンスも良い。200Mトリプル程度なら線形のパフォーマンスを維持してくれる。

JosekiはSPARQLエンドポイントを実現するためのHTTPエンジンだ。いくつかのデータソースに対応しており、TDBもその中に含まれている。Josekiの機能は単純で、RDFをファイル又はデータセットから読み出し、HTTP(GET又はPOST)によってSPARQLによるクエリを行うことができる、というものだ。2012/01/11時点でのJosekiの最新バージョンは3.4.4である。

TDBとJosekiを連携させるには、Josekiの設定を変更する必要がある。以下の記事が参考になる。

Configuring Joseki + Pellet + TDB - Semantic Portal Wiki
http://tw.rpi.edu/portal/Configuring_Joseki_%2B_Pellet_%2B_TDB