शोधकर्ताओं ने नियंत्रण, हेरफेर, स्वायत्तता, डेटासेट और सन्निहित नीति हस्तांतरण के लिए सीखने को आधार बनाया।