டேட்டா மைனிங் மற்றும் டேட்டா சயின்ஸ் கற்க 7 படிகள்

நூலாசிரியர்: Eugene Taylor
உருவாக்கிய தேதி: 12 ஆகஸ்ட் 2021
புதுப்பிப்பு தேதி: 22 ஜூன் 2024
Anonim
6 மாதங்களில் தரவு அறிவியலைக் கற்க படிப்படியாக சாலை வரைபடம் | முழுமையான தரவு அறிவியல் சாலை வரைபடம்
காணொளி: 6 மாதங்களில் தரவு அறிவியலைக் கற்க படிப்படியாக சாலை வரைபடம் | முழுமையான தரவு அறிவியல் சாலை வரைபடம்

உள்ளடக்கம்


ஆதாரம்: பால் ஃப்ளீட் / ட்ரீம்ஸ்டைம்.காம்

எடுத்து செல்:

தரவு விஞ்ஞானம் செய்வதன் மூலம் சிறப்பாகக் கற்றுக்கொள்ளப்படுகிறது, ஆனால் புள்ளிவிவரங்கள் மற்றும் இயந்திர கற்றல் விஷயங்களுக்கும் ஒரு நல்ல அடித்தளம்.

தரவு சுரங்க மற்றும் தரவு அறிவியலை எவ்வாறு கற்றுக்கொள்வது என்று நான் அடிக்கடி கேட்கப்படுகிறேன். இங்கே எனது சுருக்கம்.

தரவுச் செயலாக்கம் மற்றும் தரவு அறிவியலைச் செய்வதன் மூலம் நீங்கள் சிறப்பாகக் கற்றுக்கொள்ளலாம், எனவே தரவை விரைவில் பகுப்பாய்வு செய்யத் தொடங்குங்கள்! இருப்பினும், நீங்கள் என்ன செய்கிறீர்கள் என்பதைப் புரிந்துகொள்வதற்கும் பெரிய தரவுகளின் சத்தத்தில் மதிப்பின் உண்மையான நகங்களைக் கண்டுபிடிப்பதற்கும் உங்களுக்கு நல்ல புள்ளிவிவர மற்றும் இயந்திர கற்றல் அடித்தளம் தேவை என்பதால், கோட்பாட்டைக் கற்றுக்கொள்ள மறக்காதீர்கள்.

தரவு சுரங்க மற்றும் தரவு அறிவியலைக் கற்க ஏழு படிகள் இங்கே. அவை எண்ணப்பட்டிருந்தாலும், அவற்றை நீங்கள் இணையாக அல்லது வேறு வரிசையில் செய்யலாம்.

  1. மொழிகள்: ஆர், பைதான் மற்றும் SQL கற்கவும்
  2. கருவிகள்: தரவுச் செயலாக்கம் மற்றும் காட்சிப்படுத்தல் கருவிகளை எவ்வாறு பயன்படுத்துவது என்பதை அறிக
  3. புத்தகங்கள்: அடிப்படைகளைப் புரிந்துகொள்ள அறிமுக புத்தகங்களைப் படியுங்கள்
  4. கல்வி: வெபினர்களைப் பாருங்கள், படிப்புகளை எடுத்து தரவு சான்றிதழில் ஒரு சான்றிதழ் அல்லது பட்டம் கருத்தில் கொள்ளுங்கள் (பென் லோரிகாஸில் மேலும் படிக்க ஒரு தரவு விஞ்ஞானியை எவ்வாறு வளர்ப்பது.)
  5. தரவு: கிடைக்கக்கூடிய தரவு ஆதாரங்களைச் சரிபார்த்து, அங்கே ஏதாவது ஒன்றைக் கண்டறியவும்
  6. போட்டிகள்: தரவு சுரங்க போட்டிகளில் பங்கேற்கவும்
  7. சமூக வலைப்பின்னல்கள், குழுக்கள் மற்றும் கூட்டங்கள் வழியாக பிற தரவு விஞ்ஞானிகளுடன் தொடர்பு கொள்ளுங்கள்

இந்த கட்டுரையில், நான் தரவு சுரங்க மற்றும் தரவு அறிவியலை ஒன்றுக்கொன்று மாற்றாக பயன்படுத்துகிறேன். புள்ளிவிவரங்கள், அறிவு கண்டுபிடிப்பு, தரவுச் செயலாக்கம், முன்கணிப்பு பகுப்பாய்வு, தரவு அறிவியல் மற்றும் பெரிய தரவு போன்ற பல்வேறு சொற்களின் பரிணாமம் மற்றும் பிரபலத்தைப் பார்க்கும் எனது விளக்கக்காட்சி, அனலிட்டிக்ஸ் தொழில் கண்ணோட்டம்.


1. கற்றல் மொழிகள்

தரவு செயலாக்கத்திற்கான மிகவும் பிரபலமான மொழிகள் ஆர், பைதான் மற்றும் SQL என்று சமீபத்திய KDnuggets Poll கண்டறிந்துள்ளது. ஒவ்வொன்றிற்கும் பல ஆதாரங்கள் உள்ளன, எடுத்துக்காட்டாக:

  • ஆர் உடன் தரவு அறிவியலில் இலவச மின் புத்தகம்
  • தரவு அறிவியலுக்கான பைத்தானுடன் தொடங்குவது
  • தரவு பகுப்பாய்விற்கான பைதான்: உண்மையான உலக தரவுகளுக்கான சுறுசுறுப்பான கருவிகள்
  • ஒரு இன்றியமையாத பைதான்: தரவு அறிவியலுக்கான தரவு ஆதாரம்
  • W3 பள்ளிகள் கற்றல் SQL

2. கருவிகள்: தரவு சுரங்க, தரவு அறிவியல் மற்றும் காட்சிப்படுத்தல் மென்பொருள்

வெவ்வேறு பணிகளுக்கு பல தரவு சுரங்க கருவிகள் உள்ளன, ஆனால் தரவு பகுப்பாய்வின் முழு செயல்முறையையும் ஆதரிக்கும் தரவு சுரங்க தொகுப்பை எவ்வாறு பயன்படுத்துவது என்பதை அறிந்து கொள்வது நல்லது. KNIME, RapidMiner மற்றும் Weka போன்ற திறந்த மூல (இலவச) கருவிகளுடன் நீங்கள் தொடங்கலாம்.

இருப்பினும், பல பகுப்பாய்வு வேலைகளுக்கு நீங்கள் SAS ஐ அறிந்து கொள்ள வேண்டும், இது முன்னணி வணிக கருவியாகும் மற்றும் பரவலாக பயன்படுத்தப்படுகிறது. MATLAB, StatSoft STATISTICA, Microsoft SQL Server, Tableau, IBM SPSS Modeler மற்றும் Rattle ஆகியவை பிற பிரபலமான பகுப்பாய்வு மற்றும் தரவு சுரங்க மென்பொருளாகும்.


பிழைகள் இல்லை, மன அழுத்தமும் இல்லை - உங்கள் வாழ்க்கையை அழிக்காமல் வாழ்க்கையை மாற்றும் மென்பொருளை உருவாக்குவதற்கான படி வழிகாட்டியின் படி

மென்பொருள் தரத்தைப் பற்றி யாரும் அக்கறை கொள்ளாதபோது உங்கள் நிரலாக்க திறன்களை மேம்படுத்த முடியாது.

எந்தவொரு தரவு பகுப்பாய்விலும் காட்சிப்படுத்தல் ஒரு முக்கிய பகுதியாகும். மைக்ரோசாஃப்ட் எக்செல் (பல எளிமையான பணிகளுக்கு நல்லது), ஆர் கிராபிக்ஸ், (குறிப்பாக ggplot2), மற்றும் அட்டவணை - காட்சிப்படுத்தலுக்கான சிறந்த தொகுப்பு ஆகியவற்றை எவ்வாறு பயன்படுத்துவது என்பதை அறிக. பிற நல்ல காட்சிப்படுத்தல் கருவிகளில் TIBCO Spotfire மற்றும் Miner3D ஆகியவை அடங்கும்.

3. புத்தகங்கள்

பல தரவு சுரங்க மற்றும் தரவு அறிவியல் புத்தகங்கள் உள்ளன, ஆனால் நீங்கள் அவற்றை சரிபார்க்கலாம்:

  • டேட்டா மைனிங் மற்றும் பகுப்பாய்வு: அடிப்படைக் கருத்துகள் மற்றும் வழிமுறைகள், இலவச PDF பதிவிறக்க (வரைவு), முகமது ஜாக்கி மற்றும் வாக்னர் மீரா ஜூனியர்.
  • டேட்டா மைனிங்: நடைமுறை இயந்திர கற்றல் கருவிகள் மற்றும் நுட்பங்கள், இயன் விட்டன், ஈபே பிராங்க் மற்றும் மார்க் ஹால் ஆகியோரால், வெக்காவின் ஆசிரியர்களிடமிருந்து, மற்றும் வெக்காவை எடுத்துக்காட்டுகளில் விரிவாகப் பயன்படுத்துதல்
  • ட்ரெவர் ஹஸ்டி, ராபர்ட் திப்ஷிராணி, ஜெரோம் ப்ரீட்மேன் எழுதிய புள்ளிவிவர கற்றல், தரவு சுரங்க, அனுமானம் மற்றும் கணிப்பு ஆகியவற்றின் கூறுகள். கணித நோக்குடைய ஒரு சிறந்த அறிமுகம்
  • லயன்புக்: ராபர்டோ பட்டிட்டி மற்றும் ம au ரோ புருனாடோ ஆகியோரால் கற்றல் மற்றும் நுண்ணறிவு உகப்பாக்கம், வலையில் இலவசமாகக் கிடைக்கிறது, அத்தியாயம் மூலம் அத்தியாயம்
  • ஏ.ராஜராமன், ஜே. உல்மேன் எழுதிய பாரிய தரவுத்தொகுப்பு புத்தகத்தின் சுரங்க
  • ஸ்டேட்சாஃப்ட் எலக்ட்ரானிக் புள்ளிவிவர புத்தகம் (இலவசம்), பல தரவு சுரங்க தலைப்புகளை உள்ளடக்கியது

4. கல்வி: வெபினார்கள், படிப்புகள், சான்றிதழ்கள் மற்றும் பட்டங்கள்

பகுப்பாய்வு, பெரிய தரவு, தரவுச் செயலாக்கம் மற்றும் தரவு அறிவியல் ஆகியவற்றில் சமீபத்திய தலைப்புகளில் பல இலவச வெபினார்கள் மற்றும் வெப்காஸ்ட்களைப் பார்த்து நீங்கள் தொடங்கலாம்.

குறுகிய மற்றும் நீண்ட பல ஆன்லைன் படிப்புகள் உள்ளன, அவற்றில் பல இலவசம். (KDnuggets ஆன்லைன் கல்வி அடைவைப் பார்க்கவும்.)

குறிப்பாக இந்த படிப்புகளை சரிபார்க்கவும்:

  • இயந்திர கற்றல், கோர்செராவில், ஆண்ட்ரூ என்ஜி கற்பித்தார்
  • கால்டெக் பேராசிரியர் யாசர் அபு-மொஸ்டாஃபா கற்பித்த எட்எக்ஸில் தரவிலிருந்து கற்றல்
  • சிராகஸ் ஐஸ்கூலில் இருந்து பயன்பாட்டு தரவு அறிவியலில் ஆன்லைன் பாடத்திட்டத்தைத் திறக்கவும்
  • வெக்காவுடன் டேட்டா மைனிங், இலவச ஆன்லைன் படிப்பு
  • தரவு சுரங்கத்தில் ஒரு செமஸ்டர் நீண்ட அறிமுக பாடமான எனது டேட்டா மைனிங் பாடநெறியிலிருந்து இலவச ஆன்லைன் ஸ்லைடுகளையும் சரிபார்க்கவும்

இறுதியாக, தரவுச் செயலாக்கத்தில் சான்றிதழ்களைப் பெறுங்கள், மற்றும் தரவு அறிவியல் அல்லது தரவு அறிவியலில் முதுகலைப் பட்டம் போன்ற மேம்பட்ட பட்டங்கள்.

5. தரவு

பகுப்பாய்வு செய்ய உங்களுக்கு தரவு தேவைப்படும் - தரவு சுரங்கத்திற்கான தரவுத்தொகுப்புகளின் KDnuggets கோப்பகத்தைப் பார்க்கவும்,

  • அரசு, கூட்டாட்சி, மாநிலம், நகரம், உள்ளூர் மற்றும் பொது தரவு தளங்கள் மற்றும் இணையதளங்கள்
  • தரவு API கள், மையங்கள், சந்தைகள், தளங்கள், இணையதளங்கள் மற்றும் தேடுபொறிகள்
  • இலவச பொது தரவுத்தொகுப்புகள்

6. போட்டிகள்

மீண்டும், செய்வதன் மூலம் நீங்கள் சிறப்பாகக் கற்றுக்கொள்வீர்கள், எனவே காகில் போட்டிகளில் கலந்து கொள்ளுங்கள். இயந்திர கற்றலைப் பயன்படுத்தி டைட்டானிக் சர்வைவலைக் கணிப்பது போன்ற தொடக்க போட்டிகளுடன் தொடங்கவும்.

7. தொடர்பு கொள்ளுங்கள்: கூட்டங்கள், குழுக்கள் மற்றும் சமூக வலைப்பின்னல்கள்

நீங்கள் பல சக குழுக்களில் சேரலாம். அனலிட்டிக்ஸ், பிக் டேட்டா, டேட்டா மைனிங் மற்றும் டேட்டா சயின்ஸ் ஆகியவற்றிற்கான சிறந்த 30 சென்டர் குழுக்களைக் காண்க.

அனலிட்டிக் பிரிட்ஜ் என்பது பகுப்பாய்வு மற்றும் தரவு அறிவியலுக்கான செயலில் உள்ள சமூகமாகும்.

அனலிட்டிக்ஸ், பிக் டேட்டா, டேட்டா மைனிங், டேட்டா சயின்ஸ், மற்றும் அறிவு கண்டுபிடிப்பு பற்றிய பல கூட்டங்கள் மற்றும் மாநாடுகளில் நீங்கள் கலந்து கொள்ளலாம்.

மேலும், இந்த துறையில் முன்னணி ஆராய்ச்சி மாநாடான வருடாந்திர கே.டி.டி மாநாட்டை ஏற்பாடு செய்யும் ஏ.சி.எம் எஸ்.ஐ.ஜி.கே.டி.யில் சேரவும்.

இந்த கட்டுரை KDNuggets.com இலிருந்து நாணல். இது ஆசிரியரின் அனுமதியுடன் பயன்படுத்தப்பட்டுள்ளது.