分布からの複数インスタンス学習

分布からの複数インスタンス学習

Gary Doran,Soumya Ray; 17(128):1-50, 2016.

概要

私たちは、複数インスタンス学習(MIL)設定を分析するための新しい理論的枠組みを提案します。 MILでは、学習例は、ラベル付きセット、またはインスタンスの”バッグ”の形で学習アルゴリズムに提供されます。 MILのアプリケーションは、創薬のための3次元定量的構造-活性関係予測とweb検索のためのコンテンツベースの画像検索が含まれています。 アルゴリズムの目的は、新しいバッグに正しくラベルを付ける関数、または新しいインスタンスに正しくラベルを付ける関数を学習することです。 バッグはサンプルが観察される潜在的な分布として扱われるべきであることを提案した。 この設定では,正確なインスタンスおよびバッグラベリング関数と,弱い仮定の下でバッグまたはインスタンスを正しくランク付けする関数を学習することができることを示した。 さらに、我々の理論的結果は、伝統的でよく研究された”教師付き”学習アプローチを使用して効率的にランク付けすることを学ぶことが可能であることを 新しい枠組みに伴う理論的予測を支持する広範な経験的評価を行った。 提案された理論的枠組みは,MIと標準教師あり学習設定との関係をよりよく理解することをもたらし,既存のMI固有アルゴリズムよりも正確で効率的で理論的性質をよりよく理解したMIデータからの学習のための新しい方法を提供する。

&jmlr2016をコピーします。 (編集、ベータ版)

コメントを残す

メールアドレスが公開されることはありません。