Multiple-Instans Læring Fra Distribusjoner

Multiple-Instans Læring Fra Distribusjoner

Gary Doran, Soumya Ray; 17(128):1-50, 2016.

Sammendrag

vi foreslår et nytt teoretisk rammeverk for å analysere innstillingen for multiple-instance learning (MIL). I MIL er treningseksempler gitt til en læringsalgoritme i form av merkede sett, eller «poser» av forekomster. Anvendelser AV MIL inkluderer 3-D kvantitativ struktur-aktivitet forhold prediksjon for narkotikaoppdagelse og innholdsbasert bildeinnhenting for nettsøk. Målet med en algoritme er å lære en funksjon som korrekt merker nye poser eller en funksjon som korrekt merker nye forekomster. Vi foreslår at poser skal behandles som latente fordelinger fra hvilke prøver blir observert. Vi viser at det er mulig å lære nøyaktige instans – og posemerkingsfunksjoner i denne innstillingen, samt funksjoner som korrekt rangerer poser eller forekomster under svake forutsetninger. I tillegg tyder våre teoretiske resultater på at det er mulig å lære å rangere effektivt ved hjelp av tradisjonelle, godt studerte» veiledet » læringsmetoder. Vi utfører en omfattende empirisk evaluering som støtter de teoretiske forutsigelsene som følger av det nye rammeverket. Den foreslåtte teoretiske rammeverket fører til en bedre forståelse av forholdet MELLOM MI og standard veiledet læring innstillinger, og det gir nye metoder for læring FRA MI data som er mer nøyaktig, mer effektiv, og har bedre forstått teoretiske egenskaper enn eksisterende MI-spesifikke algoritmer.

&kopier JMLR 2016. (rediger, beta)

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.