தரவு தரநிலைப்படுத்தல்: வரையறுத்தல், சோதனை செய்தல் மற்றும் மாற்றுதல்
நிறுவனம் முழுவதும் தரவு கலாச்சாரத்தை நிறுவுவதை நோக்கி நிறுவனங்கள் மாறினாலும், பலர் இன்னும் தங்கள் தரவை சரியாகப் பெற போராடுகிறார்கள். வேறுபட்ட ஆதாரங்களில் இருந்து தரவை இழுப்பது மற்றும் வெவ்வேறு வடிவங்கள் மற்றும் அதே தகவலாக இருக்க வேண்டியவற்றின் பிரதிநிதித்துவங்களைப் பெறுவது - உங்கள் தரவு பயணத்தில் கடுமையான தடைகளை ஏற்படுத்துகிறது.
குழுக்கள் தங்கள் வழக்கமான செயல்பாடுகளைச் செய்யும்போது அல்லது தரவுத்தொகுப்புகளிலிருந்து நுண்ணறிவைப் பிரித்தெடுக்கும்போது தாமதங்கள் மற்றும் தவறுகளை அனுபவிக்கின்றன. இத்தகைய சிக்கல்கள் வணிகங்களை தரவு தரநிலைப்படுத்தல் பொறிமுறையை அறிமுகப்படுத்த கட்டாயப்படுத்துகின்றன - இது நிறுவனம் முழுவதும் நிலையான மற்றும் சீரான பார்வையில் தரவு இருப்பதை உறுதி செய்கிறது.
தரவு தரநிலைப்படுத்தல் செயல்முறையை ஆழமாகப் பார்ப்போம்: இதன் பொருள் என்ன, அது எடுக்கும் படிகள் மற்றும் உங்கள் நிறுவனத்தில் நிலையான தரவுக் காட்சியை எவ்வாறு அடையலாம்.
தரவு தரநிலைப்படுத்தல் என்றால் என்ன?
எளிமையாகச் சொன்னால், தரவு தரநிலைப்படுத்தல் என்பது தரவு மதிப்புகளை தவறான வடிவமைப்பிலிருந்து சரியான வடிவத்திற்கு மாற்றும் செயல்முறையாகும். நிறுவனம் முழுவதும் தரப்படுத்தப்பட்ட, சீரான மற்றும் நிலையான தரவுக் காட்சியை இயக்க, தரவு மதிப்புகள் தேவையான தரநிலைக்கு இணங்க வேண்டும் - அவை சார்ந்த தரவு புலங்களின் சூழலில்.
தரவு தரநிலைப்படுத்தல் பிழைகளின் எடுத்துக்காட்டு
எடுத்துக்காட்டாக, இரண்டு வெவ்வேறு இடங்களில் வசிக்கும் ஒரே வாடிக்கையாளரின் பதிவு முதல் மற்றும் கடைசி பெயர்கள், மின்னஞ்சல் முகவரி, தொலைபேசி எண் மற்றும் குடியிருப்பு முகவரி ஆகியவற்றில் முரண்பாடுகளைக் கொண்டிருக்கக்கூடாது:
பெயர் | மின்னஞ்சல் முகவரி | தொலைப்பேசி எண் | பிறந்த தேதி | பாலினம் | வீட்டு முகவரி |
---|---|---|---|---|---|
ஜான் ஒனெல் | john.neal@gmail.com | 5164659494 | 14/2/1987 | M | 11400 W ஒலிம்பிக் BL # 200 |
முதல் பெயர் | கடைசி பெயர் | மின்னஞ்சல் முகவரி | தொலைப்பேசி எண் | பிறந்த தேதி | பாலினம் | வீட்டு முகவரி |
---|---|---|---|---|---|---|
ஜான் | ஓ'நீல் | john.neal_gmail.com | + 1 516-465-9494 | 2/14/1987 | ஆண் | 11400 W ஒலிம்பிக் 200 |
மேலே உள்ள எடுத்துக்காட்டில், பின்வரும் வகையான முரண்பாடுகளை நீங்கள் காணலாம்:
- கட்டமைப்பு: முதல் ஆதாரம் வாடிக்கையாளர் பெயரை ஒரே புலமாக உள்ளடக்கியது, இரண்டாவது அதை இரண்டு புலங்களாக சேமிக்கிறது - முதல் மற்றும் கடைசி பெயர்.
- முறை: முதல் ஆதாரம் உள்ளது சரியான மின்னஞ்சல் முறை மின்னஞ்சல் முகவரி புலத்தில் அமலாக்கப்பட்டது, அதே சமயம் இரண்டாவதாக காணவில்லை @ சின்னம்.
- தரவு வகை: முதல் மூலமானது தொலைபேசி எண் புலத்தில் இலக்கங்களை மட்டுமே அனுமதிக்கிறது, இரண்டாவது ஒரு சரம் வகை புலத்தைக் கொண்டுள்ளது, அதில் குறியீடுகள் மற்றும் இடைவெளிகளும் உள்ளன.
- வடிவம்: முதல் ஆதாரத்தில் MM/DD/YYYY வடிவத்தில் பிறந்த தேதி உள்ளது, இரண்டாவது ஆதாரத்தில் DD/MM/YYYY வடிவத்தில் உள்ளது.
- டொமைன் மதிப்பு: முதல் மூலமானது பாலின மதிப்பை M அல்லது F ஆக சேமிக்க அனுமதிக்கிறது, இரண்டாவது மூலமானது ஆண் அல்லது பெண் என்ற முழு வடிவத்தை சேமிக்கிறது.
இத்தகைய தரவு முரண்பாடுகள், உங்கள் வணிகத்தில் அதிக நேரம், செலவு மற்றும் முயற்சியை இழக்கச் செய்யும் கடுமையான தவறுகளைச் செய்ய வழிவகுக்கும். இந்த காரணத்திற்காக, ஒரு எண்ட்-டு-எண்ட் பொறிமுறையை செயல்படுத்துகிறது தரவு தரநிலைப்படுத்தல் உங்கள் தரவு சுகாதாரத்தை பராமரிக்க முக்கியமானது.
தரவை எவ்வாறு தரப்படுத்துவது?
தரவு தரநிலைப்படுத்தல் ஒரு எளிய நான்கு-படி செயல்முறை ஆகும். ஆனால் உங்கள் தரவுகளில் உள்ள முரண்பாடுகளின் தன்மை மற்றும் நீங்கள் எதை அடைய முயற்சிக்கிறீர்கள் என்பதைப் பொறுத்து, தரநிலைப்படுத்தலுக்குப் பயன்படுத்தப்படும் முறைகள் மற்றும் நுட்பங்கள் மாறுபடும். இங்கே, எந்தவொரு நிறுவனமும் அதன் தரப்படுத்தல் பிழைகளை சமாளிக்க பயன்படுத்தக்கூடிய பொதுவான விதியை முன்வைக்கிறோம்.
- தரநிலை என்ன என்பதை வரையறுக்கவும்
எந்தவொரு நிலையை அடைய, நீங்கள் முதலில் அந்த நிலை என்ன என்பதை வரையறுக்க வேண்டும். எந்தவொரு தரவு தரநிலைப்படுத்தல் செயல்முறையின் முதல் படியிலும் அடைய வேண்டியதை அடையாளம் காண்பது. உங்களுக்கு என்ன தேவை என்பதை அறிய சிறந்த வழி வணிகத் தேவைகளைப் புரிந்துகொள்வதாகும். என்ன தரவு தேவை மற்றும் எந்த வடிவத்தில் உள்ளது என்பதைப் பார்க்க, உங்கள் வணிகச் செயல்முறைகளை ஸ்கேன் செய்ய வேண்டும். உங்கள் தரவுத் தேவைகளுக்கான அடிப்படையை அமைக்க இது உதவும்.
தரவு நிலையான வரையறை அடையாளம் காண உதவுகிறது:
- உங்கள் வணிக செயல்முறைக்கு முக்கியமான தரவு சொத்துக்கள்,
- அந்த சொத்துக்களின் தேவையான தரவு புலங்கள்,
- தரவு வகை, வடிவம் மற்றும் வடிவம் அவற்றின் மதிப்புகள் இணங்க வேண்டும்,
- இந்த புலங்களுக்கான ஏற்றுக்கொள்ளக்கூடிய மதிப்புகளின் வரம்பு மற்றும் பல.
- வரையறுக்கப்பட்ட தரநிலைக்கு எதிராக தரவுத்தொகுப்புகளை சோதிக்கவும்
நீங்கள் ஒரு நிலையான வரையறையைப் பெற்றவுடன், உங்கள் தரவுத்தொகுப்புகள் எவ்வளவு சிறப்பாகச் செயல்படுகின்றன என்பதைச் சோதிப்பதே அடுத்த கட்டமாகும். இதை மதிப்பிடுவதற்கான ஒரு வழி பயன்படுத்துவது தரவு விவரக்குறிப்பு விரிவான அறிக்கைகளை உருவாக்கும் மற்றும் தரவுப் புலத்தின் தேவைகளுக்கு இணங்க மதிப்புகளின் சதவீதம் போன்ற தகவல்களைக் கண்டறியும் கருவிகள்:
- மதிப்புகள் தேவையான தரவு வகை மற்றும் வடிவமைப்பைப் பின்பற்றுகின்றனவா?
- மதிப்புகள் ஏற்றுக்கொள்ளக்கூடிய வரம்பிற்கு வெளியே உள்ளதா?
- சுருக்கங்கள் மற்றும் புனைப்பெயர்கள் போன்ற சுருக்கப்பட்ட வடிவங்களை மதிப்புகள் பயன்படுத்துகின்றனவா?
- இருக்கிறீர்களா முகவரிகள் தரப்படுத்தப்பட்டுள்ளன தேவைக்கேற்ப - போன்றவை யுஎஸ்பிஎஸ் தரநிலைப்படுத்தல் அமெரிக்க முகவரிகளுக்கு?
- இணக்கமற்ற மதிப்புகளை மாற்றவும்
வரையறுக்கப்பட்ட தரநிலைக்கு இணங்காத மதிப்புகளை மாற்றுவதற்கான நேரம் இது. பயன்படுத்தப்படும் பொதுவான தரவு மாற்ற நுட்பங்களைப் பார்ப்போம்.
- தரவு பாகுபடுத்தல் - தேவையான தரவுக் கூறுகளைப் பெற சில தரவுப் புலங்கள் முதலில் பாகுபடுத்தப்பட வேண்டும். எடுத்துக்காட்டாக, முதல், நடுத்தர மற்றும் கடைசி பெயர்கள் மற்றும் மதிப்பில் உள்ள முன்னொட்டுகள் அல்லது பின்னொட்டுகளைப் பிரிக்க, பெயர் புலத்தை பாகுபடுத்துதல்.
- தரவு வகை மற்றும் வடிவமைப்பு மாற்றம் - மாற்றத்தின் போது நீங்கள் இணக்கமற்ற எழுத்துக்களை அகற்ற வேண்டியிருக்கலாம், எடுத்துக்காட்டாக, இலக்கம் மட்டுமே உள்ள தொலைபேசி எண்ணிலிருந்து குறியீடுகள் மற்றும் எழுத்துக்களை அகற்றுதல்.
- வடிவ பொருத்தம் மற்றும் சரிபார்ப்பு - முறைக்கான வழக்கமான வெளிப்பாட்டை உள்ளமைப்பதன் மூலம் பேட்டர்ன் மாற்றம் செய்யப்படுகிறது. வழக்கமான வெளிப்பாட்டிற்கு இணங்கும் மின்னஞ்சல் முகவரி மதிப்புகளுக்கு, அவை பாகுபடுத்தப்பட்டு வரையறுக்கப்பட்ட வடிவத்தில் மாற்றப்பட வேண்டும். regex ஐப் பயன்படுத்தி மின்னஞ்சல் முகவரியைச் சரிபார்க்கலாம்:
^[a-zA-Z0-9+_.-]+@[a-zA-Z0-9.-]+$
- சுருக்க விரிவாக்கம் - நிறுவனத்தின் பெயர்கள், முகவரிகள் மற்றும் நபர் பெயர்கள் பெரும்பாலும் சுருக்கமான படிவங்களைக் கொண்டிருக்கின்றன, அவை உங்கள் தரவுத்தொகுப்பை ஒரே தகவலின் பல்வேறு பிரதிநிதித்துவங்களைக் கொண்டிருக்கும். எடுத்துக்காட்டாக, நீங்கள் NY ஐ நியூயார்க்காக மாற்றுவது போன்ற நாட்டின் மாநிலங்களை விரிவாக்க வேண்டியிருக்கலாம்.
- சத்தம் நீக்கம் மற்றும் எழுத்துப்பிழை திருத்தம் - சில வார்த்தைகள் உண்மையில் ஒரு மதிப்புக்கு எந்த அர்த்தத்தையும் சேர்க்காது, அதற்கு பதிலாக, தரவுத்தொகுப்பில் அதிக சத்தத்தை அறிமுகப்படுத்துகின்றன. இந்தச் சொற்களைக் கொண்ட அகராதிக்கு எதிராக இயக்கி, அவற்றைக் கொடியிட்டு, எவற்றை நிரந்தரமாக நீக்க வேண்டும் என்பதைத் தீர்மானிப்பதன் மூலம் தரவுத்தொகுப்பில் இத்தகைய மதிப்புகளை அடையாளம் காண முடியும். எழுத்துப்பிழைகள் மற்றும் தட்டச்சு பிழைகளைக் கண்டறிய அதே செயல்முறையை செயல்படுத்தலாம்.
- வரையறுக்கப்பட்ட தரநிலைக்கு எதிராக தரவுத்தொகுப்பை மீண்டும் சோதிக்கவும்
இறுதி கட்டத்தில், சரி செய்யப்பட்ட தரவு தரநிலைப்படுத்தல் பிழைகளின் சதவீதத்தைக் கண்டறிய, மாற்றப்பட்ட தரவுத்தொகுப்பு வரையறுக்கப்பட்ட தரநிலைக்கு எதிராக மீண்டும் சோதிக்கப்படுகிறது. உங்கள் தரவுத்தொகுப்பில் இன்னும் இருக்கும் பிழைகளுக்கு, நீங்கள் உங்கள் முறைகளை மாற்றியமைக்கலாம் அல்லது மறுகட்டமைக்கலாம் மற்றும் செயல்முறையின் மூலம் தரவை மீண்டும் இயக்கலாம்.
மடக்கு
இன்று உருவாக்கப்படும் தரவுகளின் அளவு - மற்றும் இந்தத் தரவைப் பிடிக்கப் பயன்படுத்தப்படும் பல்வேறு கருவிகள் மற்றும் தொழில்நுட்பங்கள் - பயங்கரமான தரவுக் குழப்பத்தை எதிர்கொள்ள நிறுவனங்களை வழிநடத்துகிறது. தங்களுக்குத் தேவையான அனைத்தையும் வைத்திருக்கிறார்கள், ஆனால் ஏற்றுக்கொள்ளக்கூடிய மற்றும் பயன்படுத்தக்கூடிய வடிவத்திலும் வடிவத்திலும் தரவு ஏன் இல்லை என்பது உறுதியாகத் தெரியவில்லை. தரவு தரநிலைப்படுத்தல் கருவிகளை ஏற்றுக்கொள்வது, அத்தகைய முரண்பாடுகளை சரிசெய்வதற்கும் உங்கள் நிறுவனம் முழுவதும் மிகவும் தேவையான தரவு கலாச்சாரத்தை செயல்படுத்துவதற்கும் உதவும்.