LOD に基づくヘルス情報の表現と可視化システムの設計と開発:ポテンシャルと予備評価

Design and Development of a Linked Open Data-Based Health Information Representation and Visualization System: Potentials and Preliminary Evaluation
Potentials and Preliminary Evaluation’, JMIR Med. Inf. 2(2), pp.196-208, 2014
20151209_kmishima

背景:世界中の医療機関は協調と結果を改善をすることで,より少ないリソースでより多くを提供できるように コスト削減に努めている.これは,効果的な計画や利用可能なデータから重要な情報を生成することによる,証 拠に基づく実践が必要である.したがって,柔軟かつユーザフレンドリーな方法でヘルスデータを表現すること や問い合わせすることがより重要視されてきている.世界保健機関(WHO)のような国際機関は,定期的に公衆 衛生政策と保健サービスの開発のために利用可能で優先的な健康トピックに関する重要なデータを公開している. しかし,ほとんどのポータル内のデータは発見や再利用が困難な形式である Excel や PDF で公開されている.そ のため,異なるデータ間で公開され,それらをリンクするためのベストプラクティスの標準としての新しいセマ ンティックウェブである,LOD(Linked Open Data)はこのような課題を軽減するために公衆衛生レベルのデー タの表示および管理に適用することができる.しかし,ヘルスデータのための LOD システムとその有用性を支え る技術は,また評価する必要がある. 目的:本研究の目的は,リンクトデータの技術はヘルス情報の表現,可視化および検索システムの開発のため に有効かどうかを評価し,利用可能なツールとリンクトデータベースの医療情報システムを構築するための方法 論を特定することである. 方法:我々は,情報可視化のためのデータ表現のために RDF(Resource Description Framework),データス トレージとして Fuseki,情報可視化のために Sgvizler を用いた.さらに,データ問い合わせのための SPARQL ク エリインターフェースを統合した.我々は主にシステムテストの為に WHO ヘルスの観測データセット使用した. 全てのデータは RDF を用いて表現しており,データのウェブ用のリンク発見用フレームワークである Silk を用いてデータのウェブ上のデータセットとリンクさせた.予備ユーザビリティ評価は,システムユーザビリティス ケール(SUS)の方法に従って行った. 結果:我々は,リンクトデータツールを用いて LOD ベースのヘルス情報表現,クエリ,および可視化システム を開発した.我々は,WHO のグローバル・ヘルスの展望データベースから自由に利用可能である死亡率,罹患 率,発生率,および関連する変数の 2 万件以上の HIV 関連データ要素を追加した.さらに,我々は自動的に Slk フレームワークを用いて DBpedia,Bio2RDF および LinkedCT から 5312 のデータ要素をリンクした.システム のユーザは,自分の興味に応じたヘルス情報を取得し,可視化することができる.SPARQL クエリに慣れていな いユーザのために,我々はデータを検索し,閲覧するためにリンクされたデータの検索エンジン・インターフェー スを統合した.我々はデータストアや柔軟なクエリ,様々な種類の視覚化を容易に表現するためにシステムを使用 している.公衆のヘルスデータ管理者とユーザによる予備ユーザ評価スコアが SUS のユーザビリティ測定スケー ルで 82 であった.インターフェースでクエリを作成することは主にエンドユーザに LOD ベースシステムの難し いことがわかった. 結論:本稿では,現在の LOD 技術が知的なクエリを提供し,意思決定を支援することができるように,柔軟で 再利用可能な方法で,異なるヘルスデータを表現するために有望な代替であることを示している.しかし,高度 なテキストベースの検索エンジンの開発は,特に非技術系ユーザのためのユーザビリティを向上させる必要があ る.大規模なデータセットを用いたさらなる研究は,将来の医療情報システム開発のためのセマンティックウェブ とリンクトデータの可能性のために推奨される.