ハーベスト機能

ハーベスト機能とは

シラサギオープンデータには他サイトに公開されているデータセットをインポートする機能が実装されています。 RSS取り込みのように、他サイトのデータセットおよびリソースを定期的にインポートして公開したい場合に利用できます。 また、登録されているデータセットをAPIにてCKANにエクスポートすることもできます。

連携

シラサギオープンデータもしくはCKANと連携することができます。

シラサギオープンデータ

オープンデータサイトを立ち上げて、フォルダー属性「オープンデータ/API」を1階層目に作成します。
以下のURLにアクセス可能となり、このAPIよりデータセットおよびリソースファイルの連携が可能となります。

CKAN

CKANはオープンデータサイトに広く利用されている、オープンソースのデータカタログソフトフェアです。
https://github.com/ckan/ckan

CKANにはデータセットとリソースの登録機能があり、これらをシラサギにインポートすることができます。
また、シラサギオープンデータからデータセットを登録(エクスポート)することができます。

バージョン2.10 CKANを連携対象として動作確認しています。

連携にActionAPIを使用しており、以下のURLにアクセスします。

設定

ライセンス

データセットとリソースには公開ライセンスを設定して公開します。 取り込み元となるサイトと、取り込み先のサイトでライセンスを一意にする為、ライセンスIDを連携前に設定しておく必要があります。

シラサギオープンデータ

リソースファイル毎にライセンスを登録する仕様になっており、ライセンス一覧に登録されています。
各ライセンスを編集して ハーベスト設定>ライセンスID を連携先のサイトと合わせてください。

CKAN

データセット毎にライセンスを登録する仕様になっています。
CKANと連携する場合は license_list を確認してください。
これらのライセンスの id をCKAN側に合わせる形で、シラサギに設定してください。

インポート

インポート設定を登録して、ジョブを実行することで、他サイトからデータセットを取り込むことができます。
設定はデータセットフォルダーの ハーベスト>インポート にて登録します。

と適宜必要な項目を設定します。

作成した設定を選択し、インポートを実行すると連携処理が開始されます。

エクスポート

エクスポート設定して、ジョブを実行することで、シラサギからCKANにデータセットを登録することができます。
設定はデータセットフォルダーの ハーベスト>エクスポート にて登録します。

作成した設定を選択し、エクスポートを実行すると連携処理が開始されます。