TDB + JosekiでSPARQL endpoint構築
今日はTDBとJosekiでSPARQLのエンドポイントを構築していた。
TDB - Jena Wiki
http://openjena.org/wiki/TDB
Joseki - A SPARQL Server for Jena
http://www.joseki.org/
TDBはJena FrameworkというJava製のSemantic Web Applicationのためのツール群に含まれている。TDBはRDF用のデータベースとしての位置づけである。
Apache Jena - Welcome to Jena
http://incubator.apache.org/jena/
RDF用のデータベースはいくつか存在するが、TDBはそのなかでも軽量でパフォーマンスも良い。200Mトリプル程度なら線形のパフォーマンスを維持してくれる。
JosekiはSPARQLエンドポイントを実現するためのHTTPエンジンだ。いくつかのデータソースに対応しており、TDBもその中に含まれている。Josekiの機能は単純で、RDFをファイル又はデータセットから読み出し、HTTP(GET又はPOST)によってSPARQLによるクエリを行うことができる、というものだ。2012/01/11時点でのJosekiの最新バージョンは3.4.4である。
TDBとJosekiを連携させるには、Josekiの設定を変更する必要がある。以下の記事が参考になる。
Configuring Joseki + Pellet + TDB - Semantic Portal Wiki
http://tw.rpi.edu/portal/Configuring_Joseki_%2B_Pellet_%2B_TDB