Published:Updated:

UNLOCK அறிவியல் 2.O - 28

UNLOCK அறிவியல் 2.O
பிரீமியம் ஸ்டோரி
UNLOCK அறிவியல் 2.O

அண்டன் பிரகாஷ்

UNLOCK அறிவியல் 2.O - 28

அண்டன் பிரகாஷ்

Published:Updated:
UNLOCK அறிவியல் 2.O
பிரீமியம் ஸ்டோரி
UNLOCK அறிவியல் 2.O

சென்ற வருட ஜனவரிக்குப் பின்னர் முதல்முறையாக சர்வதேசப் பயணம் செய்தேன். 14 மாதங்களில் பயண அனுபவம் என்பது வெகுவாக மாறிவிட்டது. சான் பிரான்சிஸ்கோவில் இருந்து புறப்பட்ட கத்தார் ஏர்வேய்ஸின் வணிக வகுப்பில் என்னுடன் சேர்த்து மூன்று பேர் மட்டுமே. உண்ணும் நேரம் தவிர்த்து மாஸ்க் சகிதம் இருக்க வேண்டிய கட்டாயம். ‘நீதான் தடுப்பூசி போட்டதாகச் சில வாரங்களுக்கு முன்னால் சொன்னாயே! இனியும் மாஸ்க் தேவைதானா?’ என்ற கேள்வி, வாரந்தவறாமல் இந்தத் தொடரைப் படித்துப் பின்னூட்டம் அனுப்பும் மதுரை எஸ்.மகேசன் போன்றவர்களுக்கு வரலாம். ‘தடுப்பூசி போட்டுக்கொண்டவர்களுக்கு கோவிட் வருவது மிகவும் அரிதுதான் என்றாலும், கொரோனா வைரஸ் தொற்று ஏற்பட்டு, அதற்கான எந்த அறிகுறிகளும் இல்லாமல் (asymptomatic) இருந்து, மற்றவர்களுக்கு அதைப் பரப்பிவிடும் வாய்ப்புகள் உண்டு’ என்கிறார்கள் தொற்று நோய் நிபுணர்கள். எனவே, தடுப்பூசி போட்ட பின்னர் மாஸ்க் அணிவதும், தனிநபர் இடைவெளியைக் கடைப்பிடிப்பதும் சிறந்தது. தடுப்பூசி போட்டுக்கொண்டவர்களுக்கு ‘தடுப்பூசி பாஸ்போர்ட்’ என்ற ஆவணத்தை வழங்கலாமா என்ற விவாதம் பல நாடுகளில் நடக்கிறது. அது சிக்கலான நடைமுறை என்பதாலும், அதைச் செயல்படுத்தப் பல ஆண்டுகள் ஆகலாம் என்பதாலும், பயணத்திற்கு 72 மணி நேரத்திற்குள், கோவிட் பரிசோதனை - குறிப்பாக RT-PCR சோதனை - செய்துகொள்ள வேண்டும் என்பது இன்றைய பயண நியதியாகிவிட்டது. வைரஸ் இருப்பதைத் துல்லியமாகக் கண்டறிகிறது என்பதால், இந்தப் பரிசோதனையே இன்றைய சோதனைத் தரநிலை.

பாலிமரெஸ் சங்கிலி எதிர்வினை (Polymerase Chain Reaction, சுருக்கமாக, PCR) என்பது குறிப்பிட்ட டி.என்.ஏ மரபணுக்கள் இருக்கிறதா என்பதை அறிய, பல ஆண்டுகளாகப் பயன்படும் முறைமை. சேகரிக்கப்பட்ட டி.என்.ஏ-வை பாலிமரெஸ் என்ற நொதி மூலம் பல வெப்பநிலைகளுக்கு ஆட்படுத்துகையில் அவை சங்கிலியாகப் பெருகிக்கொண்டு போகிறதா என்பதைப் பார்த்து பாக்டீரியா அல்லது வைரஸ் இருப்பதை அறிந்துகொள்ளமுடியும். ஆனால், இந்தப் பரிசோதனை RT-PCR என அழைக்கப்படுகிறதே, அந்த RT என்ன?

UNLOCK அறிவியல் 2.O - 28

அதற்கு முன்னால், ஒரு குயிக் அடிப்படை.

மரபணுவில் இருக்கும் டி.என்.ஏ (Deoxyribonucleic Acid) தனது ஜாதகத்தைத் தன்னில் இரட்டை இழையாக (double-stranded) எழுதி வைத்துக்கொண்ட ஓர் ஆவணம்; ஆர்.என்.ஏ (Ribonucleic Acid) ஒற்றை இழை (single-stranded) வடிவில் இருந்துகொண்டு வெளிப்புறப் பயணம் செய்யும் குணம் கொண்ட ஒரு பயணி. இன்னொரு விதத்தில் சொல்ல வேண்டுமானால், டி.என்.ஏ ஒரு புத்தகப் புழு; ஆர்.என்.ஏ அதைக் கடத்திப் புரதங்களை உருவாக்கச் செயல்படும் வேலைக்காரத் தேனீ.

கொரோனா வைரஸ் ‘ஆர்.என்.ஏ’வைக் கொண்ட வைரஸ். PCR சோதனைக்கோ டி.என்.ஏ தேவை. பஞ்சு சுற்றப்பட்ட குச்சியை மூக்கில் சுழற்றி எடுத்து அதிலிருந்து ஆர்.என்.ஏ-வை எடுத்துக்கொள்கிறார்கள். நொதி ஒன்றின் மூலம் அதை மறுபிரதி எடுத்து, அதன் டி.என்.ஏ வடிவத்தைக் கொண்டு வருகிறார்கள். இப்படி மறு உருவாக்கம் செய்யப்படும் முறைமைக்கு Reverse Transcription, சுருக்கமாக, RT என்று பெயர். இதன் மூலம் கிடைக்கப்பெற்ற டி.என்.ஏ-வைச் சங்கிலி எதிர்வினைக்கு உட்படுத்தி உடலில் கொரோனா வைரஸ் இருக்கிறதா (பாசிட்டிவ்), இல்லையா (நெகட்டிவ்) என முடிவு செய்கிறார்கள்.

பல வெப்ப அளவுகளில் மேற்படி சோதனைகளைச் செய்ய வேண்டும் என்பதால், இதற்கென அமைக்கப்பட்ட ஆய்வுக்கூடங்களில் மட்டுமே இந்த சோதனையைச் செய்ய முடியும் என்ற நிலை இருக்கிறது. பெருந்தொற்று நீண்ட நாள்களுக்கு நீடித்தால், வீட்டில் இருந்து நாமாகவே சோதனை செய்து வைரஸ் இருக்கிறதா என்பதை அறிந்துகொள்ளும் வசதிகளை வடிவமைக்கும் ஆராய்ச்சிகள் நடந்துவருவதையும் பார்க்க முடிகிறது.

நவீனப் புள்ளியியல் கோட்பாடுகளைப் பயன்படுத்தித் தயாரிக்கப்படும் அமெரிக்கத் தேர்தல் கணிப்புகள் பல பொய்யாகிப் போனதை நான் பல ஆண்டுகளாகப் பார்த்துவருகிறேன். தற்போது தமிழகத்தில் நடந்து முடிந்த தேர்தலில், ‘வாக்காளர்களின் கணிப்புகளாக நடத்தப்படுபவை திணிப்புகள்’ என்ற கூக்குரல்களில் இருக்கும் அரசியலை நீக்கிவிட்டு, அறிவியலை மட்டும் எடுத்துக்கொண்டால், ஒன்று புலனாகும். அடிப்படைப் புள்ளியியல் கோட்பாடுகளைப் பயன்படுத்தும் கணிப்புகள் தவறாகாது. ஆனால், கணிப்புகளுக்குப் பயன்படுத்தப்படும் தகவல்கள் பொய்யானவையாக இருக்கும் சாத்தியக்கூறுகள் மிக அதிகம். குப்பையை உள்வாங்கினால், குப்பையே வெளிவரும் (Garbage In Garbage Out, சுருக்கமாக, GIGO) என்ற பதம் கணினியியலில் உண்டு. கணிப்புகளுக்காகச் சேகரிக்கப்படும் தகவல்களின் தரத்திற்கு இதை நல்ல உதாரணமாகச் சொல்லலாம். தரமான தகவல்களைக் கண்டறிந்து அதன்மூலம் தரமான முடிவுகளை எடுக்க உதவும் அறிவியலை தகவல் அறிவியல் (Data Science) என அழைக்கிறார்கள். அதன் அடிப்படைகளை நாம் இந்த வாரத்தில் அன்லாக் செய்யலாம்.

தொடர்ந்து சேகரிக்கப்படும் தகவல்களை (Historical data) அடிப்படையாகக் கொண்டு, வரப்போகும் நிகழ்வுகளைக் கணிக்க முடிவது தகவல் அறிவியலின் ஒரு பகுதி. கலிபோர்னியாவில் இருக்கும் ஓக்லாந்து நகர் காவல் துறையின் அவசர உதவிப் பிரிவில் தொழில்நுட்பங்களைப் பயன்படுத்துவதை நெருங்கிப் புரிந்துகொள்ளும் வாய்ப்பு இருந்ததை இந்தத் தொடரின் முந்தைய கட்டுரை ஒன்றில் குறிப்பிட்டது நீண்ட கால வாசகர்களுக்கு நினைவிருக்கலாம். கடந்த 50 வருடங்களுக்கும் மேலாக, குற்றச் செயல்கள் பற்றிய விவரங்களுடன், வெளிப்புறத் தகவல்கள் பலவற்றையும் இணைத்துச் சேமித்துக்கொள்கிறார்கள். உதாரணத்திற்கு, அவர்களது பொறுப்பில் இருக்கும் நகரின் பல பகுதிகளில் காலையிலிருந்து மாலைவரை மாறும் வெப்பநிலை அளவுகளைச் சேகரிக்கிறார்கள். இந்த வெப்பநிலை வரலாற்றுத் தரவுகளிலிருந்து தெரியவருவது - வெப்பம் அதிகமானால், சண்டை, தகராறுகள் அதிகமாகி, அவசர உதவி கேட்டு வரும் தொலைபேசி அழைப்புகளின் எண்ணிக்கை அதிகமாகும். இதை மனதில்கொண்டு, வரப்போகும் அடுத்த பத்து நாள்களில் வெப்ப அளவு எப்படி இருக்கப்போகிறது என்பதை அறியும் வானிலை முன்னறிவிப்புத் தகவலின் அடிப்படையில் அதிக காவலர்களைத் தயார் நிலையில் வைக்கத் திட்டமிடுகிறார்கள். சம்பந்தமில்லாததுபோல இருக்கும் தகவல்களுக்கிடையில் இருக்கும் தொடர்புகளைக் கண்டறிந்து அதன்மூலம் வருங்கால நிகழ்வுகளை முன்னறிவது தகவல் அறிவியலாளர்களின் பணிகளில் ஒன்று.

பழைய தகவல்களின் அடிப்படையில்தான் முடிவுகளை எடுக்க வேண்டும் என்றில்லை. நிகழ்காலத் தகவல் திரட்டல்களிலிருந்தும் என்ன நடந்துகொண்டிருக்கிறது என்பதை அறியலாம். உதாரணத்திற்கு, ‘உடல்நலம் சரியில்லை; எனவே இன்று பணிக்கு வர இயலவில்லை’ என அதிக அளவில் ஈமெயில்கள் அனுப்பப்படுவதைக் கண்டறிந்தால், காய்ச்சல் அந்தப்பகுதியில் வேகமாகப் பரவிவருகிறது என்பதை அறிந்து அந்தப் பகுதியில் இருக்கும் மருத்துவமனைகளுக்கு முன்னறிவிப்பு கொடுக்க முடியும். அருகில் இருக்கும் பகுதிகளுக்கு காய்ச்சல் பரவாமல் தடுக்க நடவடிக்கை எடுக்க முடியும். இப்படிக் கண்டறியும் முறைமைகளைப் பொதுப்படையாக ‘கணிப்பு அலசல்’ (Predictive analysis) எனத் தகவல் அறிவியலில் அழைக்கிறார்கள்.

UNLOCK அறிவியல் 2.O - 28

நடந்து முடிந்த அல்லது நடந்து கொண்டிருக்கும் நிகழ்வுகளின் தகவல்களை வைத்து மட்டும்தான் முடிவுகள் எடுக்கப்படுவதால், ‘அதைத் தாண்டி எதிர்காலத்தைக் கணிக்க தகவல் அறிவியலால் முடியுமா’ என்ற கேள்வி வரலாம்.

20 வருடங்களுக்கு முன்னால் ஸ்டீவன் ஸ்பீல்பர்க்கின் இயக்கத்தில் Minority Report என்ற அறிவியல் புனைவு திரைப்படம் வெளிவந்தது. ‘மனித மனங்களின் மின் சமிக்ஞைகளைத் தொடர்ந்து படிப்பதன் மூலம், வன்முறை எண்ணம் தோன்றுவதை உடனடியாகக் கண்டறிந்து, அது கொலை, கொள்ளை, பாலியல் வன்முறை என மாறுவதற்கு முன்னரே தடுக்க முயன்றால் எப்படி இருக்கும்’ என்பதுதான் இதன் ஒரு வரிக் கதை. 2050-களில் நடப்பதாக எடுக்கப்பட்ட இந்தப் படம் முழுக்கக் கற்பனை என்றாலும், ‘தரமான முடிவுகளை எடுக்க, கலப்படமற்ற, முழுக்க நம்பிக்கைக்குரிய தகவல் தேவை’ என்பது திரைப்படம் அடிக்கோடிட்டுக் காட்டும் அறிவியல்.

தேர்தல் கணிப்புகளுக்கு இதைப் பொருத்திப் பார்க்கலாம். தேர்தலுக்கு முன்னரும் (Pre-poll) , பின்னரும் (Exit-poll) எடுக்கப்படும் கருத்துக் கணிப்புகளில், வாக்காளர்களிடமிருந்து நேரடியாக அவர்களது எண்ணங்களை சர்வே பாணியில் பெற்று, புள்ளியியல் கோட்பாடுகளின் படி அவற்றை அலசி முடிவுகளை வெளியிடுகிறார்கள். இதில் இருக்கும் சிக்கல் - தகவலைப் பெறும் முறை. காரணம், மக்கள் உண்மையான எண்ணங்களைப் பெரும்பாலும் பகிர்ந்து கொள்வதில்லை. தேர்தலில் யாருக்கு வாக்களித்தீர்கள் எனக் கேட்கப்படுவதை விடுங்கள்; சிகிச்சைக்காகச் செல்கையில் மருத்துவரிடமே முழு உண்மைகளையும் நோயாளிகள் பகிர்வதில்லை என்பது அந்தத் துறையில் சொல்லப்படும் குறைபாடு.

UNLOCK அறிவியல் 2.O - 28

சரி, மக்கள் உண்மை சொல்வதில்லை; மைனாரிட்டி ரிப்போர்ட் திரைப்படக் கதையைப்போல் மனித மனங்களை நேரடியாகப் படித்து அறிந்துகொள்வதும் சாத்தியமில்லை. இந்தச் சிக்கலுக்குத் தீர்வு ஒன்று இருக்கிறது. அது - தேடல் இயந்திரங்கள், குறிப்பாக கூகுள். மருத்துவர் களிடமும் மற்றவர்களிடமும், ஏன், தங்களுக்குத் தானே பொய் சொல்லிக் கொள்ளும் மனிதர்கள் மிக நேர்மையாக இடையிடுவது கூகுளிடம் மட்டும்தான். நினைத்துப் பாருங்கள் - யாரிடமும் பகிராத எத்தனை விவரங்களை கூகுளிடம் சென்று கேட்டிருக்கிறீர்கள்? பயனீட்டாளர்களின் பிரத்யேக விவரங்களை நீக்கிவிட்டு, தன்னிடம் கொடுக்கப்படும் தேடல் பதங்களையெல்லாம் எடுத்து, சீர்படுத்தி (Indexed) கூகுள் ட்ரெண்ட்ஸ் என்ற சேவையாகக் கொடுக்கிறது கூகுள். Trends.google.com என்ற தளத்தில், தற்சமயம் என்னென்ன பதங்கள் பிரபலமாக இருக்கிறது என்பதில் இருந்து, ‘தேநீர்’ என்ற பதம் இந்தியாவில் கடந்த ஐந்து வருடங்களாக எப்படித் தேடப்பட்டிருக்கிறது என்பது வரை பார்க்கலாம். இந்தத் தளம், தகவல் அறிவியலாளர்களுக்கு சொர்க்கம். இந்த வரியை எழுதுகையில் கூகுள் ட்ரெண்ட்ஸ் ‘பில் கேட்ஸ்’ என்பதுதான் மிகப்பிரபல பதம் என்கிறது. பில், அவர் மனைவி மலீண்டா கேட்ஸ் இருவரும் விவாகரத்து செய்கிறோம் என அறிவித்தது ஊடகங்களில் இன்று வெளியாகிவருவதால் அதன் அடிப்படையில் அந்தப் பதம் பிரபலமாக இருக்கிறது. இந்தியாவில் ‘தேநீர்’ என்பது ஜூலை/ஆகஸ்ட் மாதங்களில் குறைவாக இருப்பதற்குப் பின்னிருக்கும் காரணத்தை வேறு பல தகவல்களையும் அலசுவதன் மூலம் தொழில்முறை தகவல் அறிவியலாளரால் கண்டறிய முடியும்.

ஆண்ட்ராய்டு அலைபேசிகள் பல்கிப் பெருகி அனைவரின் கைகளிலும் நிரந்தமாகக் குடியேறிவிட்ட நிலையில், தேர்தல் கணிப்பாளர்கள் மக்களிடம் சர்வே எடுப்பதை விட்டுவிட்டு, தேடல் தகவல்களிலிருந்து ‘யாருக்கு வெற்றி வாய்ப்பு’ என்பதைத் துல்லியமாகக் கணக்கிடும் நாள் அதிக தூரத்தில் இல்லை.

தகவல் அறிவியல் என்பது பிரமாண்ட மான துறை. முறையான வடிவத்தில் அமைந்த தகவல்களையும் (Structured data), ஒன்றுக்கொன்று சம்பந்தமில்லாமல் குவியலாகப் பெறப்படும் தகவல்களையும் (Unstructured data) கோத்து இணைத்து, அந்தத் தகவல் இமயத்தில் இருந்து கூர்மை யாக நுண்ணறிவு பெற்றுக் கொள்ளும் திறனுக்கு வேலைவாய்ப்புகள் அதிகரித்து வருவதை ‘Data scientist jobs’ என கூகுளில் தேடினால் புரியும். நிரல் மொழி ஒன்றைத் தெரிந்து வைத்துக் கொண்டால் போதும் என்ற மனநிலையில் இருந்து, தகவல் சார்ந்த ஆராய்ச்சியில் விற்பன்னராகலாம் என்ற மாற்றம் வரும்.

இந்த வாரக் கட்டுரைக்கான பின்னூட்டங்களை +1 628 240 4194 என்ற வாட்ஸப் எண்ணுக்கு எப்போதும் போல அனுப்புங்கள்.

- Logging in...