機械学習のアプローチからのオントロジーマッチング

Ontology Matching:A Machine Learning Approach
Handbook on ontologies, Springer Berlin Heidelberg, pp.385-403, 2004

20160406 hwada

ここでは2つの与えられたオントロジー間の意味の対応付けを求めるオントロジーマッチングの研究について記述されている.この問題は多数の情報処理アプリケーションの中心に位置している.複数のオントロジーを含むほとんどのアプリケーションは,相互運用性の確保のために,オントロジー間の意味的な対応付けを確立する必要がある.このようなアプリケーションの例として,電子商取引,知識管理,eラーニング,情報抽出,バイオインフォマティクス,Webサービス,観光を含む無数の分野で発生する.その普及にも関わらず,未だオントロジーマッチングは依然として大部分が大きな労働力を要し,エラーの発生しやすいプロセスの手作業で行われている.手動のマッチングは現在,大規模な情報管理システムを構築する上で重要な障害となっている.このようなWWW,XML,および新しいセマンティックWebなどの技術の登場は,更なる情報共有アプリケーションを刺激し,問題を悪化させる可能性がある.したがって,オントロジーマッチング処理を支援するツールの開発は,情報管理アプリケーションの幅広い成功の重要な鍵となる.上記の要求に対して,我々はGLUE(オントロジー間の意味の対応付けを半自動的に学習技術を使用して作成するシステム)を開発した.我々はセマンティックWebのオントロジーマッチングについて動機の例を用いて章を始める.その後,我々はGLUEの解決策を示す.最後に,我々は実世界のいくつかの分野で行った一連の実験について説明し,GLUEは,高精度なセマンティックの対応付けを提案することを示す.

LOD に基づくヘルス情報の表現と可視化システムの設計と開発:ポテンシャルと予備評価

Design and Development of a Linked Open Data-Based Health Information Representation and Visualization System: Potentials and Preliminary Evaluation
Potentials and Preliminary Evaluation’, JMIR Med. Inf. 2(2), pp.196-208, 2014
20151209_kmishima

背景:世界中の医療機関は協調と結果を改善をすることで,より少ないリソースでより多くを提供できるように コスト削減に努めている.これは,効果的な計画や利用可能なデータから重要な情報を生成することによる,証 拠に基づく実践が必要である.したがって,柔軟かつユーザフレンドリーな方法でヘルスデータを表現すること や問い合わせすることがより重要視されてきている.世界保健機関(WHO)のような国際機関は,定期的に公衆 衛生政策と保健サービスの開発のために利用可能で優先的な健康トピックに関する重要なデータを公開している. しかし,ほとんどのポータル内のデータは発見や再利用が困難な形式である Excel や PDF で公開されている.そ のため,異なるデータ間で公開され,それらをリンクするためのベストプラクティスの標準としての新しいセマ ンティックウェブである,LOD(Linked Open Data)はこのような課題を軽減するために公衆衛生レベルのデー タの表示および管理に適用することができる.しかし,ヘルスデータのための LOD システムとその有用性を支え る技術は,また評価する必要がある. 目的:本研究の目的は,リンクトデータの技術はヘルス情報の表現,可視化および検索システムの開発のため に有効かどうかを評価し,利用可能なツールとリンクトデータベースの医療情報システムを構築するための方法 論を特定することである. 方法:我々は,情報可視化のためのデータ表現のために RDF(Resource Description Framework),データス トレージとして Fuseki,情報可視化のために Sgvizler を用いた.さらに,データ問い合わせのための SPARQL ク エリインターフェースを統合した.我々は主にシステムテストの為に WHO ヘルスの観測データセット使用した. 全てのデータは RDF を用いて表現しており,データのウェブ用のリンク発見用フレームワークである Silk を用いてデータのウェブ上のデータセットとリンクさせた.予備ユーザビリティ評価は,システムユーザビリティス ケール(SUS)の方法に従って行った. 結果:我々は,リンクトデータツールを用いて LOD ベースのヘルス情報表現,クエリ,および可視化システム を開発した.我々は,WHO のグローバル・ヘルスの展望データベースから自由に利用可能である死亡率,罹患 率,発生率,および関連する変数の 2 万件以上の HIV 関連データ要素を追加した.さらに,我々は自動的に Slk フレームワークを用いて DBpedia,Bio2RDF および LinkedCT から 5312 のデータ要素をリンクした.システム のユーザは,自分の興味に応じたヘルス情報を取得し,可視化することができる.SPARQL クエリに慣れていな いユーザのために,我々はデータを検索し,閲覧するためにリンクされたデータの検索エンジン・インターフェー スを統合した.我々はデータストアや柔軟なクエリ,様々な種類の視覚化を容易に表現するためにシステムを使用 している.公衆のヘルスデータ管理者とユーザによる予備ユーザ評価スコアが SUS のユーザビリティ測定スケー ルで 82 であった.インターフェースでクエリを作成することは主にエンドユーザに LOD ベースシステムの難し いことがわかった. 結論:本稿では,現在の LOD 技術が知的なクエリを提供し,意思決定を支援することができるように,柔軟で 再利用可能な方法で,異なるヘルスデータを表現するために有望な代替であることを示している.しかし,高度 なテキストベースの検索エンジンの開発は,特に非技術系ユーザのためのユーザビリティを向上させる必要があ る.大規模なデータセットを用いたさらなる研究は,将来の医療情報システム開発のためのセマンティックウェブ とリンクトデータの可能性のために推奨される.

コンテンツベースの推薦システムのためのLOD

Linked Open Data to support Content-based Recommender Systems
8th International Conference on Semantic Systems, pp.1-8, 2012

20151112_kmishima

ワールド・ワイド・ウェブは,ハイパーリンクされたドキュメントのWebからリンクされたデータのWebに変わってきている.セマンティックウェブの広がりや最近のリンクオープンデータ(LOD)イニシアチブのおかげで,膨大な量のRDFは,自由にアクセス可能なデータセットとして公開されている.これらのデータセットは,いわゆるLODクラウドを形成するように互いに繋がっている.今日の時点で,データのウェブ上で膨大な量のRDFは利用可能であるだけでなく,いくつかのアプリケーションはその潜在的能力を十分に活かしている.本稿では,データのウェブ上にエンコードされた情報のみに依存した推薦システム(RS)の開発に使用することができる方法を示している.我々は,エンドユーザーに映画をお勧めするためにLODデータベース(特にDBpediaやFreebase,LinkedMDB)内で利用可能なデータを活用したコンテンツベースのRSを実装した.我々は,広くアプローチを評価し,実験的に正確さと再現率の精度によりアルゴリズムの有効性を検証した.

セマンティックWeb : XML とRDF の役割

The Semantic Web:The Roles of XML and RDF
Internet Computing, IEEE, Vol. 4, Issue5
20151015 wada
XMLとRDFはWeb上で意味的相互運用性を確立するための現在の標準だが,XMLは唯一の文書構造に対応している.それは洗練されたオントロジーの表現手法に対処するように拡張することができるデータモデルを提供するので,優れたRDFは,相互運用を容易にする.本稿でセマンティックWebの構造におけるオントロジーの役割を説明する.また,簡単に意味的相互運用性のためのツールを使って,長期的に無効になるように,XMLを使用して理由を示すXMLとRDFの重要な要素をまとめる.私たちは,さらに表現と推論層は,Webの現在の階層の上に必要とされていることを主張し,このような階層を確立するために我々はRDFスキーマにオントロジー表現言語をコード化するための一般的な方法を提案する.我々は、オントロジー言語交換,オントロジー表現および推論の言語を用いた拡張方法を示す.

Ontology Interchange Language, RDF,RDF/RDF schema, Resource Description Framework, Semantic Web, XML, data model,document structure, inference layer, ontology representation languages, ontology representation techniques, semantic interoperability

スマートホスピタルのためのオントロジー開発とUML とRDF を使った実装

Development of Ontology for Smart Hospital and Implementation using UML and RDF

IJCSI International Journal of Computer Science Issues, Vol. 7, Issue 5, September 2010, ISSN (Online):
1694-0814
20150918kmishima

患者の情報は,ヘルスケアシステム内の各患者の全体的な品質に基づいた任意のヘルスケアシステムにおける,患者のプライバシーの重要な構成要素である.ヘルスケアシステムの主な取り組みは,患者情報と患者とプライバシーの質を改善することである.病院内には組織単位または部門が多くあり,それらはお互いに最適な調整が必要である.有用なヘルスケア・オートメーション・ソフトウェアでさえも,病院内の組織にや部門にそのような調整を提供してない.これらのソフトウェアは病院の仕事を制限するだけでなく,他の病院や血液バンクなどとの連携をも制限している.したがって,これらの病院は良い施設やサービスを持っているにも関わらず,それらの情報を共有できないでいる.今日では,緊急時を含めどんな時でもどんな場所でも,患者の過去の病歴に基づいた治療を提供できるコンピュータ環境が必要である.パーベイシブとユビキタス環境,セマンティックWebは,このフィールドではとても有益である.このためには,従来の病院環境でのセマンティックWebを用いたユビキタス・ヘルスケア・コンピューティングの開発が必要である.本論文は,病院が近い将来にスマートホスピタルになるためにこれら問題を取り除こうとした,ユビキタスとパーベイシブ・コンピューティング環境とセマンティックWebに基づいている.本稿では,スマートホスピタルのための知識ベースのオントロジー記述を開発するための試みである.

セマンティックWeb 上のLOD からの類似性グラフの導出

pdf
Deriving Similarity Graphs from open Linked Data on
Semantic Web

IEEE International Conference of Information reuse and integration, 2009 Aug, page : 157 – 162,
セマンティックweb 上で公開されているLOD が増えるにつれて,広くリンクされたデータセットから最も類似
した実体を探し出すことは多くのセマンティックアプリケーションで重要視されてきている.従来のアプローチで
は,通常は一方的にオントロジーの分類や関係に依存している.本校では,リンクデータから類似したグラフを
導出するためにノードとリンクタイプとセマンティックグラフのトポロジーを利用した新しいアプローチを提示し
ている.まず,セマンティック類似遷移は二つのリソース間の類似度を計算することを提案している.さらに,シ
ステムは算出された類似度に基づいて類似性グラフを導出し,可視化を可能にしている.我々は医療領域で生成
された現実世界のリンクデータにこのアプローチを適用し,臨床意思決定のユースケースで満足な結果を得るこ
とができた.