Published:Updated:

கூகுளில் அதிகம் பேர் அதிகமாகத் தேடுவது `எதை?' உங்கள் கணிப்பை உறுதியாக்கும் `பளீர்’ டேட்டா!

Everybody Lies | Seth Stephens-Davidowitz

இந்தப் புத்தகத்தின் ஆசிரியர் கூகுள் டேட்டாக்களை நான்காண்டுகளாக ஆய்வு செய்தபோது, பலரும் அறியாத, பொதுவெளியில் இல்லாத எண்ணற்ற தகவல்களைத் தெரிந்துகொண்டு ஆச்சர்யப்பட்டிருக்கிறார். அது மனநோய், மனிதர்களின் பாலின உணர்வு, கருக்கலைப்பு, மதம், ஆரோக்கியம் என பல விஷயங்கள் பற்றியதாக இருந்தது.

கூகுளில் அதிகம் பேர் அதிகமாகத் தேடுவது `எதை?' உங்கள் கணிப்பை உறுதியாக்கும் `பளீர்’ டேட்டா!

இந்தப் புத்தகத்தின் ஆசிரியர் கூகுள் டேட்டாக்களை நான்காண்டுகளாக ஆய்வு செய்தபோது, பலரும் அறியாத, பொதுவெளியில் இல்லாத எண்ணற்ற தகவல்களைத் தெரிந்துகொண்டு ஆச்சர்யப்பட்டிருக்கிறார். அது மனநோய், மனிதர்களின் பாலின உணர்வு, கருக்கலைப்பு, மதம், ஆரோக்கியம் என பல விஷயங்கள் பற்றியதாக இருந்தது.

Published:Updated:
Everybody Lies | Seth Stephens-Davidowitz

பிக் டேட்டா சொல்லும் பாட்டி...

``இந்த உலகத்தில் எல்லோரும் எல்லோரிடமும் பொய் சொல்கிறார்கள்...”

இப்படி ஒருவர் சொன்னால், கொஞ்சம் பகீரென்றுதானே இருக்கிறது. ``நீங்கள் அதிர்ச்சி அடைய வேண்டும் என்பதற்காக நான் இதைச் சொல்லவில்லை. புள்ளிவிவரங்களுடன் சொல்கிறேன்’’ என்கிற பீடிகையுடன் நம்முடன் பேச ஆரம்பிக்கிறார் அமெரிக்காவின் பிரபல பத்திரிகையான நியூயார்க் டைம்ஸ் பத்திரிகையின் கட்டுரையாளர், தி வார்ட்டன் ஸ்கூலின் வருகைதரும் பேராசிரியரான சேத் ஸ்டீஃபென்ஸ்-டேவிடோவிட்ஸ் (Seth Stephens-Davidowitz).

Seth Stephens-Davidowitz
Seth Stephens-Davidowitz

இவர், சில ஆண்டுகள் கூகுள் நிறுவனத்தில் `டேட்டா சைண்டிஸ்ட்’ ஆக வேலை பார்த்தவர்; இவர் எழுதிய `எவ்ரிபடி லைஸ் - வாட் தி இன்டர்நெட் கேன் டெல் அஸ் அபெளட் ஹு வீ ரியலி ஆர்’ (Everybody Lies: What The Internet Can Tell Us About Who We Really Are) என்கிற புத்தகம் இப்போது புத்தகவாசிகளிடம் படுபிரபலம்.

இந்தப் புத்தகம் நியூயார்க் டைம்ஸின் பெஸ்ட் செல்லர் பட்டியலில் இடம்பெற்றதோடு தி எகானமிஸ்ட், நியூ ஸ்டேட்ஸ்மேன் ஆகிய பத்திரிகைகளின் `புக் ஆஃப் தி இயர்’ ஆகவும் தெரிவு செய்யப்பட்டது.

தகவல் தொழில்நுட்பத் துறையில் சமீப காலமாக மிகவும் பிரபலமாகிவரும் துறை `பிக் டேட்டா’. பல `டெரா பைட்ஸ்’ அளவுள்ள தரவுகளைப் அக்குவேறு ஆணி வேறாகப் பகுப்பாய்வு செய்து அதன் அடிப்படையில் முக்கியமான முடிவுகளை எடுப்பதாகும். இந்த `பிக் டேட்டா’ இந்த அந்தத் துறையில்தான் என்றில்லை; அனைத்துத் துறைகளுக்கும் பொருந்தும்.

விகடனின் அதிரடி ஆஃபர்!
தற்பொழுது ரூ.800 சேமியுங்கள்! ரூ.1749 மதிப்புள்ள 1 வருட டிஜிட்டல் சந்தா949 மட்டுமே! மிஸ் பண்ணிடாதீங்க!Get Offer

எல்லோரும் பொய் சொல்கிறார்கள்...

இந்தப் புத்தகம் மூன்று பகுதிகளைக்கொண்டிருக்கிறது. முதல் பகுதி, சிறிய மற்றும் பெரிய தரவுகள் குறித்த அறிமுகத்தைக் கொடுக்கிறது. ஒரு வீட்டில் பையனுக்கு எப்படிப்பட்ட பெண் பார்ப்பது என்பது குறித்து ஒவ்வொருவரும் ஒவ்வொன்று சொல்கிறார்கள். அனைத்தையும் கேட்டுவிட்டு பையனின் 88 வயதான பாட்டி, `அவனுக்கு நல்ல, ஸ்மார்ட்டான, அனைவருடனும் அனுசரித்துப் போகக்கூடிய, நகைச்சுவை உணர்வு கொண்ட பெண்தான் பொருத்தமாக இருப்பாள்’ எனக் கூற அனைவரும் ஆர்வத்துடனும் கவனத்துடனும் கேட்கிறார்கள். இதற்குக் காரணம், அவரது அனுபவம் என்கிற `பிக் டேட்டா’ ஆகும்.

Everybody Lies
Everybody Lies

இரண்டாவது பகுதி, பிக் டேட்டாவுக்கு இருக்கும் ஆற்றல் பற்றி பேசுகிறது. எண்கள் மட்டுந்தான் தரவுகளாக இருக்க வேண்டுமென்ற அவசியமில்லை. பந்தயக் குதிரைகளுக்கான ஏலம் நடக்கும்போது குதிரையின் இனம், வயது, உயரம், எடை ஆகிய உடல் சம்பந்தமான விஷயங்களும் தரவுகளாகப் பயன் படுகிறது என்பதை ஆசிரியர் உதாரணம் மூலம் விளக்கியிருக் கிறார். இது போல வார்த்தைகள், படங்கள் என அனைத்துமே டேட்டாக்கள்தான் என்கிறார்.

இதே பகுதியில் பாலியல், வெறுப்பு, பாரபட்சம், இணையம், குழந்தைகளைத் தவறான வழியில் பயன்படுத்துவது, கருக்கலைப்பு, நண்பர்கள் பற்றி நாம் எதிர்வினை ஆற்றுவது, வாடிக்கையாளர்கள் என அனைத்து விஷயங்களிலும் உண்மை என்பது எந்த அளவுக்கு இருக்கிறது என்பது பற்றி விரிவாகப் பல ஆய்வுகளை மேற்கோள் காட்டி எழுதியிருக்கிறார்.

இறுதியாக, பிக் டேட்டாவை எப்படிக் கையாள்வது அதனுடைய ஆற்றல் என்ன, வரம்புகள் என்ன என்பதையும் கோடிட்டு காட்டியிருக்கிறார்.

மனிதர்கள் தங்களின் முக்கியமான பல விஷயங்கள் குறித்து உண்மையைச் சொல்வதற்குப் பதில், பொய்யைத்தான் சொல்கிறார்கள். உதாரணமாக, எத்தனை `பெக்’ மது குடித்தேன், எத்தனை முறை ஜிம்முக்குச் செல்கிறேன், புது ஷூ வாங்க எவ்வளவு செலவழித்தேன், ஒரு புத்தகத்தைப் படிக்கிறோமோ இல்லையோ ஆனால் அது ஒரு சலிப்பு தட்டக்கூடிய புத்தகம் எனச் சொல்வது, இது திரைப்படத்துக்கும் பொருந்தும். இப்படி மனிதர்களாகிய நாம் ஒவ்வொரு நாளும் நண்பர்களிடம், மேலதிகாரிகளிடம், குழந்தைகளிடம், பெற்றோர்களிடம், மருத்துவர்களிடம், மனைவியிடம் என அனைவரிடமும் பொய் சொல்வது மட்டுமல்லாமல் நமக்கு நாமேயும் பொய் சொல்லிக் கொள்கிறோம்.

Google | கூகுள்
Google | கூகுள்

மக்களின் கருத்துகளை அறிய நடத்தும் ஆய்வுகளில் பெரும்பாலனவர்கள் தங்களைக் கீழாகவோ, ஒன்றும் தெரியாதவர்களாகவோ காட்டிக்கொள்ள விரும்புவதில்லை. இது மனித இயல்பு. என்னதான் ஆய்வு முடிவுகளில் தனிப்பட்ட நபர்களின் பெயர்கள் குறிப்பிடப்படாவிட்டாலும்கூட மக்களின் மனப்போக்கு இப்படியாகத்தான் இருக்கிறது. இதை `சமூக விருப்பச் சார்பு (social desirability bias)’ என அழைக்கிறார்.

1950-ம் ஆண்டு அமெரிக்காவில் டென்வர் நகர மக்களின் மனப்போக்கு குறித்து ஆய்வாளர்கள் அரசுத் தரப்பிலிருந்து தரவுகளைச் சேகரித்தனர். இது எத்தனை சதவிகித மக்கள் வாக்கு அளித்தனர், எவ்வளவு பேர் தொண்டு நிறுவனங்களுக்கு நன்கொடை கொடுத்தார்கள், நூலக அட்டை எத்தனை பேரிடம் இருக்கிறது என்பது போன்ற தகவல்களைக் கொண்ட தரவுகள் ஆகும். இந்தத் தரவுகளைச் சேகரித்தபின், நேரடியாக மக்களைச் சந்திந்து இதே தகவல்களைச் சேகரிக்கும்போது அரசுத் தரப்பிலிருந்து பெற்ற தகவல்களுக்கும் நேரடியாக கள ஆய்வு செய்து சேகரித்தத் தகவல்களுக்கும் மிகப் பெரிய வேறுபாடு இருந்தது.

கடந்த 70 ஆண்டுகளில் இந்தப் போக்கில் ஏதாவது மாற்றம் இருக்கிறதா? இல்லை என்றுதான் சொல்ல வேண்டும். ஆய்வுகளின் முடிவுகள் இப்படியிருக்கும்பட்சத்தில் ஒரு விஷயத்தின் மீது எப்படி முடிவு எடுக்க முடியும் என்பது மிகப் பெரிய கேள்விக்குறியாகும்.

பொருளாதாரப் புத்தகங்களைப் பலரும் படிப்பதில்லை...

இந்நூலின் இறுதிப் பக்கங்களில், இந்த நூலை வாங்குபவர்களில் எத்தனை பேர் முழுமையாக வாசித்து முடிப்பார்கள் என்பதை மற்ற பிரபல எழுத்தாளர்கள் எழுதிய நூல்களை வாசித்து முடித்தவர்களின் தரவு அடிப்படையில் நிர்ணயித்திருக்கிறார். அதன்படி, பலர் முதல் 50 பக்கங்களை வாசித்துவிட்டு சில கருத்துகளை மட்டும் மனதில் பதிய வைத்துக்கொண்டு அன்றாட வாழ்க்கையைப் பார்க்கச் சென்றுவிடுவார்கள் எனக் குறிப்பிட்டிருக்கிறார்.

தாமஸ் பிக்கெட்டி!
தாமஸ் பிக்கெட்டி!

பிரபல பொருளாதார நிபுணர் தாமஸ் பிக்கெட்டி எழுதிய `Capital in the 21st Century’ என்கிற பிரபலமான புத்தகத்தை முழுமையாக வாசித்து முடித்தவர்கள் 3 சதவிகிதத்துக்கும் குறைவுதான் என்கிறார். அதேசமயம், டோனா டார்ட் எழுதிய `The Goldfinch’ஐ வாசித்து முடித்தவர்கள் சுமார் 90%. இது குறித்து இவரது முடிவு என்னவெனில், பெரும்பாலான வாசகர்கள் பொருளாதார நிபுணர்களின் நூல்களை முழுமையாக வாசித்து முடிப்பதில்லை என்பதுதான்.

கூகுள் தேடுபொறியில் செக்ஸ் பற்றி...

மனிதர்களாகிய நாம் என்ன நினைக்கிறோமோ, அதைத்தான் செய்கிறோமா என்பதைத் தெரிந்துகொள்ள முடியுமா? முடியும் என்கிறார் நூலாசிரியர். சில ஆன்லைன் ஆதாரங்கள் (sources) மக்கள் வேறு எங்கும் அல்லது யாரிடமும் சொல்லத் தயங்குகிற அல்லது ஒப்புக்கொள்ளாத விஷயங்களை ஒப்புக்கொள்ள வைக்கின்றன. இவை எண்ம உலகின் உண்மையை அறியும் நிணநீராகப் பயன்படுகின்றன (digital truth serum).

கூகுள் தேடலில் இந்தியர்களின் விருப்பம் எதில் அதிகம்?!
கூகுள் தேடலில் இந்தியர்களின் விருப்பம் எதில் அதிகம்?!

கூகுள் தேடுபொறியை எடுத்துக்கொள்ளுங்கள். உங்களுக்கு வேண்டியதைத் தட்டச்சு செய்யும்பட்சத்தில் அது குறித்த தகவல்களை இந்தத் தேடுபொறி சில விநாடிகளில் கொடுத்துவிடும். தகவல் தேடுபவர் தனிமையில் இதைச் செய்வதால் அவர் என்ன செய்கிறார் என யாரும் பார்ப்பதோ, யாருக்கு தெரிவதோ இல்லை. அதோடு, இது ஆன்லைன் ஆய்வும் இல்லை. இந்த மாதிரியான சூழ்நிலையில், ``மனிதர்கள் இணையத்திடம் நேர்மையாகவும் உண்மையாகவும் நடந்து கொள்கிறார்கள்” என்று சொல்கிறார் இந்தப் புத்தகத்தின் ஆசிரியர்.

இந்தப் புத்தகத்தின் ஆசிரியர் கூகுள் டேட்டாக்களை நான்காண்டுகளாக ஆய்வு செய்தபோது, பலரும் அறியாத, பொதுவெளியில் இல்லாத எண்ணற்ற தகவல்களைத் தெரிந்துகொண்டு ஆச்சர்யப்பட்டிருக்கிறார். அது மனநோய், மனிதர்களின் பாலின உணர்வு, கருக்கலைப்பு, மதம், ஆரோக்கியம் என பல விஷயங்கள் பற்றியதாக இருந்தது.

ஆண்கள் பெரும்பாலும் மற்ற உடல் உறுப்புகளைவிட அவர்களது பாலியல் உறுப்பு குறித்து அதிகமான கேள்விகளை தேடுபொறியில் தேடியிருக்கிறார்கள். பாலியல் குறித்த இவர்களது இரண்டாவது பொதுக் கேள்வி என்னவெனில், ``உடலுறவு நேரத்தை நீடிப்பது எப்படி?” என்பதாகும். பெண்களைப் பொறுத்தவரை, அவர்களது கேள்வியானது ஆண்களுக்கு ``உடலுறவின் உச்சக்கட்டம் எப்போது ஏற்படுகிறது என்பது பற்றியல்ல” மாறாக, ``ஏன் ஏற்படுவதில்லை” என்பதுதான் எனத் தேடுபொறி தரவுகள் மூலம் தெரிய வந்திருக்கிறது.

இது போல, வெளியில் யாரிடமும் கேட்கத் தயங்கும் கேள்விகளை தேடுபொறி மூலம் தேடுவதால் அவர்கள் இணையத்துக்கு உண்மையானவர்களாகவும் நேர்மையானவர்களாகவும் இருக்கிறார்கள்.

இது தவிர, ``கறுப்பு இன மக்கள் ஏன் முரட்டுத்தனமாக இருக்கிறார்கள்?”, ``யூதர்கள் ஏன் தீயவர்களாக இருக்கிறார்கள்?” என்பது போன்ற இனம், நிறம், மனப்போக்கு ஆகியவை குறித்த கேள்விகளையும் கூகுள் தரவுகளில் பார்க்க முடிகிறது என்கிறார் ஆசிரியர்.

இந்த மாதிரியான தேடு தரவுகளின் வாயிலாக ஓர் இனம் அல்லது நிறம் அல்லது மதத்தின் மீதான வெறுப்புக்குக் காரணம் என்ன என்பதைக் கண்டறிந்து அதை நீக்குவதற்கு அல்லது குறைப்பதற்கு அரசும் அரசு சார்ந்த அமைப்புகளும் நடவடிக்கைகளை மேற்கொள்ள வேண்டும்.

கொரோனா மரணம்
கொரோனா மரணம்

இந்தியச் சூழலுக்கும் பொருந்தும்...

இப்படி பல புள்ளிவிவரங்களுடன் சுவாரஸ்யமாக எழுதப் பட்டிருக்கும் இந்தப் புத்தகம் சொல்லும் ஒவ்வொரு விஷயமும், நம் இந்தியச் சூழலுக்கும் நூறு சதவிகிதம் பொருந்தும். தரவுகளின் மூலம் பிரச்னைகளுக்கு வழி காண வேண்டுமெனில், முதலில் அவை குறித்து தரமான, செறிவான தகவல்களைத் திரட்டுவது முக்கியமானதாகும். இதற்கு ஓர் உதாரணம், பெருந்தொற்றில் இறந்தவர்களின் எண்ணிக்கையாகும். இந்திய அரசு கூறும் தகவலுக்கும் உலகச் சுகாதார அமைப்பு கூறுவதற்கும் இடையே இருக்கும் வித்தியாசம் சுமார் 10 மடங்காகும்.

தரவுகள் சரியாக இல்லாதபட்சத்தில் தீர்க்கமான முடிவுகளை எடுக்க முடியாது, அப்படியே எடுத்தாலும் அவை பிரச்னைகளுக்குத் தீர்வாக அமையாது என்பது என்றைக்கு நாம் சரியாகப் புரிந்துகொள்கிறோமோ, அன்றைக்குத்தான் நம்மால் சரியான முடிவுகளை எடுத்து நடைமுறைப்படுத்த முடியும் என்பதே உண்மை.

தரவுகளின் மீது ஈடுபாடு கொண்டவர்களுக்கும், ஆய்வாளர்களுக்கும், சமூகம் சார்ந்த, நிறுவனம் சார்ந்த முடிவுகளை எடுக்கும் பொறுப்பில் இருப்பவர்களுக்கும் இந்த நூல் பயனுள்ளதாக இருக்கும்!