尤度のない分子グラフの推論と生成

Likelihood-Free Inference and Generation of Molecular Graphs
Sebastian Polsterl, Christian Wachinger arXiv:1905.10310

新規分子を生成するための近年の手法は,分子のグラフ表現の利用と推論のために様々な形態のグラフ畳み込みニューラルネットワークを採用している.しかしながら,訓練は高度なグラフ同型性問題を解くことを必要とし,これまでのアプローチは問題に対して近似的にしか対処や解決しなかった.本研究では,再構成ロスを明示的に計算することを回避するde novo分子生成のための尤度のないアプローチを用いたLF-MolGANを提案する.我々のアプローチは,暗黙のうちに再構成特性を強化するために敵対的なcycle consistencyロスの計算を含めることにより,敵対的生成ネットワークを拡張した.原子価などの分子固有の特性を捉えるために,Graph Isomorphism Networkをマルチグラフに拡張する.モデルの性能を定量化するために,我々は1-Wasserstein距離を用いて物理化学的特性の分布間の距離を計算することを提案する.我々は,LF-MolGANが全てのベースラインよりも分子の空間上の分布をより正確に学習することを証明します.さらに,分子の連続的な潜在空間表現を用いて分子の空間を効率的に探索することによって創薬に利用することが可能である.

分子グラフ生成のための木分解変分オートエンコーダ

Junction Tree Variational Autoencoder for Molecular Graph Generation
Wengong Jtn, Regina Barzilay, Tommi Jaakola arXiv preprint arXiv:1802.04364

我々は特定の化学的性質に基づいた分子の自動設計を目指す.計算上で,このタスクは分子グラフの生成と連続埋め込みを行う.我々の主な業績は直接分子をグラフとして生成することである.既存研究ではグラフの代わりにSMILES文字列で生成する手法を用いていた.我々の木分解変分オートエンコーダは2段階で分子グラフを生成し,最初に化学物質上に木構造の足場となるグラフを生成する.そして,その時グラフメッセージパッシングネットワークを用いて,分子にそれらを結合させる.この手法により,化学的妥当性を維持しながら,段階的に分子を拡張する事が可能になった.我々のモデルは複数のタスクにより評価される.我々のモデルは既存研究に対して,すべてのタスクにおいて高い性能を上回る結果が得られた.