வலுவூட்டல் கற்றல்

நூலாசிரியர்: Lewis Jackson
உருவாக்கிய தேதி: 11 மே 2021
புதுப்பிப்பு தேதி: 15 மே 2024
Anonim
Reinforcement Learning - வலுவூட்டல் கற்றல் என்றால் என்ன
காணொளி: Reinforcement Learning - வலுவூட்டல் கற்றல் என்றால் என்ன

உள்ளடக்கம்

வரையறை - வலுவூட்டல் கற்றல் என்றால் என்ன?

செயற்கை நுண்ணறிவின் ஒருங்கிணைப்பில், வலுவூட்டல் கற்றல் என்பது ஒரு வகை டைனமிக் புரோகிராமிங் ஆகும், இது வெகுமதி மற்றும் தண்டனை முறையைப் பயன்படுத்தி வழிமுறைகளுக்கு பயிற்சி அளிக்கிறது.


ஒரு வலுவூட்டல் கற்றல் வழிமுறை அல்லது முகவர், அதன் சூழலுடன் தொடர்புகொள்வதன் மூலம் கற்றுக்கொள்கிறது. முகவர் சரியாக செயல்படுவதன் மூலம் வெகுமதிகளையும், தவறாக செயல்படுவதற்கான அபராதங்களையும் பெறுகிறார். முகவர் ஒரு மனிதனின் தலையீடு இல்லாமல் அதன் வெகுமதியை அதிகரிப்பதன் மூலமும் அதன் தண்டனையை குறைப்பதன் மூலமும் கற்றுக்கொள்கிறார்.

மைக்ரோசாஃப்ட் அஸூர் மற்றும் மைக்ரோசாஃப்ட் கிளவுட் | இந்த வழிகாட்டி முழுவதும், கிளவுட் கம்ப்யூட்டிங் எதைப் பற்றியது என்பதையும், கிளவுட் நிறுவனத்திலிருந்து உங்கள் வணிகத்தை நகர்த்தவும் இயக்கவும் மைக்ரோசாஃப்ட் அஸூர் எவ்வாறு உதவும் என்பதை நீங்கள் அறிந்து கொள்வீர்கள்.

டெகோபீடியா வலுவூட்டல் கற்றலை விளக்குகிறது

வலுவூட்டல் கற்றல் என்பது இயந்திரக் கற்றலுக்கான அணுகுமுறையாகும், இது நடத்தை உளவியலால் ஈர்க்கப்படுகிறது. ஒரு குழந்தை ஒரு புதிய பணியை எவ்வாறு செய்ய கற்றுக்கொள்கிறது என்பதைப் போன்றது. வலுவூட்டல் கற்றல் மற்ற இயந்திர கற்றல் அணுகுமுறைகளுடன் முரண்படுகிறது, இதில் ஒரு பணியை எவ்வாறு செய்வது என்று வழிமுறை வெளிப்படையாகக் கூறப்படவில்லை, ஆனால் சிக்கலைத் தானாகவே செயல்படுத்துகிறது.


ஒரு முகவராக, சுய-ஓட்டுநர் கார் அல்லது சதுரங்கம் விளையாடும் ஒரு நிரல், அதன் சூழலுடன் தொடர்புகொள்வது, அது எவ்வாறு செயல்படுகிறது என்பதைப் பொறுத்து வெகுமதி நிலையைப் பெறுகிறது, அதாவது இலக்குக்கு பாதுகாப்பாக வாகனம் ஓட்டுதல் அல்லது ஒரு விளையாட்டை வெல்வது போன்றவை. இதற்கு நேர்மாறாக, சாலையில் இருந்து வெளியேறுவது அல்லது சோதனைக்கு உட்படுத்தப்படுவது போன்ற தவறாக செயல்படுவதற்கு முகவர் அபராதம் பெறுகிறார்.

காலப்போக்கில் முகவர் அதன் வெகுமதியை அதிகரிக்கவும், டைனமிக் நிரலாக்கத்தைப் பயன்படுத்தி அதன் தண்டனையை குறைக்கவும் முடிவுகளை எடுக்கிறார். செயற்கை நுண்ணறிவுக்கான இந்த அணுகுமுறையின் நன்மை என்னவென்றால், ஒரு முகவர் எவ்வாறு பணியைச் செய்ய வேண்டும் என்பதை ஒரு புரோகிராமர் இல்லாமல் ஒரு AI நிரலைக் கற்றுக்கொள்ள அனுமதிக்கிறது.