Published:Updated:

உலகை ஆளும் தரவுகள்: தரவு விஞ்ஞானி (Data Scientist) ஆவது எப்படி?

தரவு விஞ்ஞானி
தரவு விஞ்ஞானி

பொறியியல் ஆர்வம் கொண்ட மாணவர்களின் முதன்மைத் தேர்வாக தரவு அறிவியல் இன்று உருவெடுத்திருக்கிறது!

சில ஆண்டுகளுக்கு முன்புவரை +2-வுக்குப் பிறகான மேற்படிப்புகளுக்கு மாணவர்களின் முதன்மைத் தேர்வாக பொறியியலும், மருத்துவமும் இருந்தன. 2000-க்குப் பிறகான காலகட்டத்தில் இந்தியாவில் உற்பத்தித் துறையும், தகவல் தொழில்நுட்பத்துறையும் (ஐ.டி) வளர்ச்சியடையத் தொடங்கியிருந்த நிலையில் பொறியியல், கணினி அறிவியல் படிப்பில் சேர மாணவர்கள் மிகுந்த ஆர்வம் காட்டினர். காலப்போக்கில் இந்த நிலை மாறி கலை, அறிவியல் படிப்புகளில் மாணவர்களின் கவனம் குவிந்தது. அந்தக் கவனம் இன்றைக்கும் தொடர்கிறது என்றாலும், தொழில்நுட்ப மேம்பாடும், தொழில்நுட்பத்தை மையப்படுத்திய வாழ்க்கைமுறையின் வளர்ச்சியும் பொறியியலில் புதிய படிப்புகளை உருவாக்கியிருக்கின்றன. இது பொறியியல் மீதான மாணவர்களின் ஆர்வத்தை மீண்டும் துளிர்க்கச் செய்துள்ளது.

மிகச் சமீபத்திய காலம்வரை நாம் கற்பனைகூட செய்திருக்காத பொறியியல் படிப்புகள், பொறியியல் ஆர்வம் கொண்ட மாணவர்களின் முதன்மைத் தேர்வாக இன்றைக்கு உருவெடுத்திருக்கின்றன. அவற்றில் முக்கியமானது தரவு அறிவியல் (Data science).

தரவு அறிவியல் (Data Science) என்றால் என்ன?

தரவுகள் (Data) என்பவை பயனுள்ள குறிப்புகள் எனலாம். அவை எண்களாகவோ, வெப்பநிலை, ஒலி, ஒளி, அழுத்தம், உயரம் முதலான அளவீடுகளாகவோ, சொற்களாகவோ அல்லது பிற பயனுடைய குறிப்புகளாகவோ இருக்கலாம். எந்த ஒன்றைப் பற்றியும் ஆய்வு செய்ய வேண்டும், அலச வேண்டும் என்றால் அடிப்படையாகத் தரப்பட வேண்டிய குறிப்புகளாக அல்லது செய்திகளாக இருப்பதால் இவை தரவுகள் எனப்படுகின்றன. இவ்வகைத் தரவுகளைக் கொண்டு முறைப்படி ஆய்வு செய்து புதிய முடிவுகள், கருத்துகள், கண்டுபிடிப்புகள் ஆகியவற்றைப் பெற முடியும்.

Data Science
Data Science

உலகில் இதுவரை உற்பத்தி செய்யப்பட்ட தரவுகளில், 90 சதவிகிதம் கடந்த 2 ஆண்டுகளில் மட்டுமே உற்பத்தி செய்யப்பட்டிருக்கின்றன என்ற தகவல் உங்களைத் திகைக்கச் செய்யலாம். மனிதர்கள் நாளொன்றில் சுமார் 2.5 குவின்டில்லியன் பைட்ஸ் அளவுக்குத் தரவுகள் உற்பத்தி செய்கின்றனர். 2025-ல் 463 எக்ஸாபைட்ஸ் அளவுக்கான தரவுகளை நாளொன்றில் மனிதர்கள் உற்பத்தி செய்வார்கள் என்று கணிக்கப்பட்டுள்ளது. 'Data is the new oil' என்று கூறும் அளவுக்கு தரவுகளின் ஆற்றல் வளர்ந்திருக்கிறது; ஆம், நாம் வாழ்வது பெருந்தரவுகளின் யுகத்தில்!

2020-ம் ஆண்டு இந்தியாவில் இணையப் பயனாளர்களின் எண்ணிக்கை 69 கோடியாக இருந்தநிலையில், இந்த ஆண்டு அது 76 கோடியாக உயர்ந்திருக்கிறது. இந்த எண்ணிக்கை அடுத்த ஆண்டு 82 கோடியாக உயரும் என்று கணிக்கப்பட்டுள்ளது; 2017-ல் இந்தியாவில் 24 கோடியாக இருந்த ஃபேஸ்புக் பயனாளர்களின் எண்ணிக்கை, 2020-ல் 34 கோடியாக உயர்ந்திருக்கிறது. இத்தனை கோடி பயனாளர்களின் இணையச் செயல்பாடுகள் உற்பத்தி செய்யும் தரவுகளின் அடிப்படையில் தான் விளம்பரங்களும், பரிந்துரைகளும் இன்னும் பிறவும் திரையில் தோன்றுகின்றன. இந்தக் கட்டற்ற தரவுகளைக் கொண்டு தரவு அறிவியலின் அடிப்படையில் உருவாக்கப்படும் நிரல்கள்தான் இணைய உலகை இன்று ஆள்கின்றன.

ஆக, டிஜிட்டல் உலகில் நம்முடைய இயக்கம் என்பது நாம் உற்பத்தி செய்யும் தரவுகளின் அடிப்படையில் நிர்ணயிக்கப்படுகிறது; அது நம் யதார்த்த வாழ்விலும் எதிரொலிக்கத் தொடங்கியிருக்கிறது. இந்தப் பின்னணியில் தான் தரவு அறிவியல் என்பது மிகுந்த முக்கியத்துவம் பெறும் ஒன்றாக இன்றைக்குப் பரிணமித்திருக்கிறது.

தரவு அறிவியல் என்றால் என்ன என்று இப்போது உங்களுக்கு ஓர் அறிமுகம் கிடைத்திருக்கும். இது அடிப்படையில் ஒரு தகவல் தொழில்நுட்பப் பிரிவு. உற்பத்தியாகும் ஒட்டுமொத்த தரவுகளைத் தொகுத்து, அவற்றை ஒருங்கிணைத்து அவற்றிலிருந்து பயன்படக்கூடிய தேவையாக தரவுகளைப் பிரித்து குறிப்பிட்ட புதிய தரவுகளை எதிர்காலச் செயல்பாட்டுக்கு உருவாக்குதல் தரவு அறிவியல் எனப்படுகிறது.

Data
Data
நடந்துமுடிந்த அனைத்து தேர்தல்களில் பதிவான வாக்குகளின் அடிப்படையில் குறிப்பிட்ட தொகுதியில் தங்களுக்கு வெற்றிவாய்ப்பு எப்படி இருக்கிறது என்பதை ஒரு அரசியல் கட்சி அறிவதில் இருந்து, ஒரு வாரத்தில் பதிவாகியிருக்கும் கொரோனா தொற்றின் எண்ணிக்கையை அடிப்படையாகக் கொண்டு அடுத்தடுத்த வாரங்களில் தொற்றுப் பரவலில் எண்ணிக்கையை கணிப்பது வரை என பல தளங்களில் விரியும் பயன்பாடு என இன்றைக்கு ஏறக்குறைய அனைத்து செயல்பாடுகளிலும் தரவு அறிவியல் தாக்கம் செலுத்துகிறது.

யாரெல்லாம் படிக்கலாம்?

எந்தவொன்றின் அடிப்படைக் கட்டமைப்பின் மீதும், அதன் அடுத்தடுத்த நிலைகள் மீதும் ஈடுபாடு உள்ளவர்களுக்கு ஏற்ற துறையாக தரவு அறிவியல் விளங்குகிறது. எண்கள், கணக்குகளில் ஆர்வம் கொண்ட கணிதம், புள்ளியியல் மாணவர்கள் தரவு அறிவியலை எளிமையாகப் படிக்க முடியும்; கணிதம், புள்ளியியல், கணினி அறிவியல், பொறியியல் படித்தவர்கள் இந்தத் துறையைத் தேர்ந்தெடுப்பது பொருத்தமானதாக இருக்கும். மற்ற படிப்புகளில் இருந்து சற்றே மாறுபட்ட இந்தத் துறையில், கட்டற்ற எண்ணிக்கையிலான தரவுகளைக் கையாள்வதற்கு மன ஆற்றலும் அவசியமாகிறது. எக்ஸெல் (Excel) குறித்த அறிவும் தேவை; ஆர் (R) ப்ரோகிராமிங், டாப்ளூ (Tableau), மைக்ரோசாஃப்ட் பிஐ (BI), கூகுள் சார்ட்ஸ் (Charts), பைதன் (Python), சாஸ் (SAS) போன்ற நிரல்கள் குறித்த அறிவு இருப்பதும் அவசியமானது. இந்தத் தகுதிகளோடு தரவு அறிவியலைப் படிப்பவர்கள் துறை சார் வல்லுநர்களாக மிளிரலாம்.

Education
Education

எங்கு படிக்கலாம்?

இந்தியாவில் கீழ்கண்ட இடங்களில் டேட்டா சயின்ஸ் பயிலலாம்:

Indian Institute of Information Technology and Management (IITM) – Kerala, IIT Madras, IIIT Delhi, Jawaharlal Nehru University (JNU), Indian Institute of Science (IISc) - Bangalore, National Institute of Securities Markets (NISM), IIM Calcutta, IIT Hyderabad, IIT Kharagpur, Ahmedabad University, Academy of Maritime Education and Training, Bharathiar University Coimbatore.

தமிழகத்தில் வி.ஐ.டி பல்கலைக்கழகம், சென்னை லயோலா கல்லூரி போன்ற இடங்களில் எம்.ஸ்.சி., டேட்டா சயின்ஸ் படிப்பு வழங்கப்படுகிறது. இவை தவிர, இணைய வழியிலான டேட்டா சயின்ஸ் படிப்பைச் சென்னை ஐ.ஐ.டி. வழங்குகிறது.

விண்ணப்பிப்பது எப்படி?

சென்னை ஐ.ஐ.டி-யில் வழங்கப்படும் இணைய வழியிலான டேட்டா சயின்ஸ் படிப்புக்கு விண்ணப்பிப்பதற்கான வழிமுறைகள் குறித்து விரிவாக அறிய இந்த இணையப் பக்கத்துக்குச் செல்லலாம்: https://onlinedegree.iitm.ac.in/admissions.html#AD1

கொல்கத்தாவிலுள்ள பிராக்ஸிஸ் பிஸ்னஸ் ஸ்கூல் போன்ற தனியார் நிறுவனங்கள் உதவித்தொகையுடன் டேட்டா சயின்ஸ் படிப்பை வழங்குகின்றன; மேலதிக விவரங்களுக்கு இந்த இணையப் பக்கத்துக்குச் செல்லலாம்: https://praxis.ac.in/Programs/data-science-course-program/

சான்றிதழ் படிப்பாகவும் வழங்கப்படும் டேட்டா சயின்ஸ் பயில புள்ளியியல், கணினியியல், கணிதம் படித்தவர்களுக்கு முன்னுரிமை வழங்கப்படுகிறது.

வேலைவாய்ப்புகள்

டேட்டா சயின்ஸ் படித்தவர்களுக்கு, Data Scientist, Data Architect, Data Mining Engineer, Business Intelligence Analyst என ஏராளமான வாய்ப்புகள் கொட்டிக் கிடக்கின்றன. தமிழகம், இந்தியா மட்டுமல்லாது உலகம் முழுவதும் இதற்கான வேலைவாய்ப்புகள் உள்ளதால், வரும் காலங்களில் மாணவர்களின் தவிர்க்கமுடியாத தேர்வாக டேட்டா சயின்ஸ் இருக்கும் என்று எதிர்பார்க்கப்படுகிறது!

அடுத்த கட்டுரைக்கு