Home

யுனிகோட் தமிழும் கணினியும் – 1

முத்து நெடுமாறன் நேர்காணல்
சந்திப்பு: சிபிச்செல்வன்
மூலம்: உலகத்தமிழ்

யூனிகோடு பற்றிய உங்கள் கருத்து என்ன? இப்போது இருக்கும் முறையை ஆதரிக்கிறீர்களா அல்லது மாற்றங்களுடன்கூடிய யூனிகோடு முறையை வரவேற்கிறீர்களா?
யூனிகோடு என்பது நமக்குக் கிடைத்த ஒரு வரப்பிரசாதம் என்றுதான் சொல்வேன். எமக்கிருந்த குறியீட்டு வேறுபாடுகளையெல்லாம் தவிர்த்து, ஒரு ஒருங்கணிந்த குறியீட்டு முறையை (encoding) அறிமுகப்படுதியது யூனிகோடு முறைதான். இந்திய மொழிகள், உலக மொழிகள் எல்லாவற்றிற்கும் ஒரே ஒரு குறியீட்டு முறைதான் இருக்க வேண்டும் என்ற நோக்கத்துடன் அமைக்கப்பட்டதுதான் யூனிகோடு முறை.

அதில் தமிழுக்கு ஒரு இடம் இருக்கிறது, இது சரியாகவும் இயங்குகிறது என்பதை நிரூபித்திருக்கிறார்கள். தமிழில் சிறப்பாகவே யூனிகோடில் இயங்கலாம். யூனிகோடில் பதிப்பிக்கப்பட்ட கட்டுரைகள், பதிக்கப்பட்ட பக்கங்களை, யாஹு, கூகுல், எம்.எஸ்.என். ஆகிய தேடுபொறிகளில் தேடுகிற வாய்ப்பும் நமக்குக் கிடைக்கிருக்கிறது.

உடனே நாம் யூனிகோடுக்கு மாறிவிட முடியாது. காரணம் இன்னும் பழைய கம்யூட்டர்னு வைத்திருப்பவர்கள் இருப்பார்கள். யூனிகோடுக்கு புதிய கம்ப்யூட்டர்கள் வேண்டும். பழையன கழிதலும், புதியன புகுதலுக்கும் ஏற்ப யூனிகோடின் பயன்பாடு மெல்ல மெல்ல அதிகரிக்கும் என்றுதான் நான் எதிர்பார்க்கிறேன்.

நீங்கள் மாநாட்டில் பரிந்துரை செய்த யூனிகோடு முறை எந்த வகையைச் சார்ந்தது?

இப்போது பயன்பாட்டில் இருக்கிற யூனிகோடு முறையைத்தான் சொன்னேன். குறியீட்டு முறையில் அகரமேறிய உயிர்மெய்க்கும், உயிர் எழுத்துகளுக்கும் மட்டுமே இடமிருக்கிறது. மற்ற எழுத்துகளுக்கு இடமில்லை என்பது தவறு. அப்படி சொல்லக்கூடாது. ஏனெனில் அதனுடைய அமைப்புமுறை அப்படி.

இந்திய மொழிகள் மட்டுமல்லாமல் தாய்லாந்தில் பயன்படுத்துகிற தாய்மொழி, ஹிப்ரு, அரபி போன்ற மொழிகளுக்கு எல்லா எழுத்துகளுக்கும் குறியீடு தேவையில்லை.

நமக்கு ஒரு உயிர்மெய் எழுத்து வேண்டுமென்றால் அகரமேறிய உயிர்மெய் எழுத்துகளுக்குத் தொடர்பான ஒரு உயிர்குறி பக்கத்தில் வந்தது என்று சொன்னால் அந்த இரண்டு எழுத்துகளையும் மாற்றி உயிர் மெய்யாக வழங்குவது operating system இன் பணி. இதுதான் யூனிகோடு இயங்குகிற அனைத்து operating system களும் செய்யக்கூடிய பணி. இதைதான் நான் மாநாட்டில் பேசினேன். யூனிகோடு இயங்குவதைத்தான் சில விளக்கக் காட்சிகளோடும் டெமான்ஸ்டிரேஷன்களோடும் போட்டுக் காட்டினேன்.

நீங்கள்போட்டு காட்டியது 8 Bit இல் இல்லையா?

இல்லை. யூனிகோடு 16 bit இல்தான் இயங்கியது.

கிருஷ்ணமூர்த்தி (OCR) 16 bit இல் இயக்குகிற யூனிகோடு முறையை தானே மாநாட்டில் பரிந்துரை செய்தார்?

கு-என்ற ஒரு எழுத்துக்கு ‘க’என்ற குறியீடும், ‘உ’என்ற குறியீடும் பக்கத்து பக்கத்தில் இருந்தால் ‘கு’என்ற எழுத்து வரும். அப்போது ஒரு எழுத்துக்கு ஏன் இரண்டு எழுத்து செலவு செய்ய வேண்டும் என்பதுதான் அவர்கள் வாதம். யுனிகோடில் புள்ளி எழுத்து வராது. அடிப்படை எழுத்துகள் எல்லாமே அகரமேறிய உயிர்மெய்.

குறியீடு முறை என்பது புரோகிராமரின் வேலை. அதில் க்+அ=க வா? அல்லது வெறும் ‘க’வா என்பதெல்லாம் புரோகிராமரின் வேலை. இவர்களின் வாதம் என்னவென்றால் ஒவ்வொரு எழுத்துக்கும் இரண்டு எழுத்துகளைப்போட வேண்டியிருப்பதால் File Size, Process Time ஆகியன அதிகமாகும் என்பதுதான். இதற்கு சில புள்ளி விவரங்களையும் போட்டுக் காட்டினார்கள். இதற்காக நாம் யூனிகோட்டை மாற்றியமைக்க வேண்டும் என்பதுதான் அவர்களின் வாதம்.

ஆனால் திரு. அன்பரசன் இன்னொரு கருத்தை சொன்னார் மூன்று முறை நடத்தப்பட்ட சோதனையில் மூன்று வெவ்வெறு முடிவுகள் கிடைத்திருக்கிறது. இது இயற்கை. ஏனெனில் அது எழுதப்பட்ட Software ஐப் பொறுத்திருக்கிறது.

எந்தக் கணினியில் அதை டெஸ்ட் செய்தார்கள் என்பதும் இருக்கிறது. மூன்றாவது, வட்டின் வேகம், டிஸ்க்கின் சூழற்சி வேகம், டிஸ்க்கிலிருந்து CPU – விற்கு Transfer ஆகும் Speed இதெல்லாம் இருக்கிறது. இதையெல்லாம் பொறுத்துதான். நாம் வேகத்தைக் கண்டுபிடிக்க முடியும். அதோடு அல்லாமல் இந்தப் புள்ளிவிவரங்களைப் பார்க்கும்போது ஏறக்குறைய 60%, 70% வரை வருகிறது – அப்படி என்றால், படைக்கப்பட்ட கருத்தின்படி சேமிப்பு 40% முதல் 30% வரைதான். அதுவும் இப்போதுள்ள கணினிமுறையில், 3gmhz கணினிகள் வந்தால் இந்த இடைவெளி இன்னும் குறைவாகத்தான் இருக்கும்.

இந்த Marginal Savings க்காக இவ்வளவு பெரிய குறியீட்டுத் தளத்தின் அடித்தளத்தையே மாற்றி அமைக்க வேண்டுமா என்பது பெரிய கேள்வி. வரும் காலங்களில், யூனிகோடு முறையையே மையமாகக் கொண்டு இயங்கும் கணினி முறைகள் (microprocessor உட்பட) வரும்போது, இந்த சோதனைகள் (tests) பொருந்துமா என்பது ஒரு பெரிய கேள்வி.

அன்பரசன் 32Bit முறையைப் பற்றி தானே அன்று பேசினார்?

யூனிகோடு 16Bit. யூனிகோடு encoding 16 Bit தான். சில எழுத்துகளுக்கு சில மொழியில் இருக்கிற குறியிடுகளுக்கு, குறிப்பாக சீனா, ஜப்பான், கொரிய எழுத்துகளுக்கு. எழுத்து என்றுகூட சொல்ல முடியாது. ஒவ்வொரு எழுத்தும் ஒவ்வொரு படம். அதெல்லாம் Basic Multilingual Plain (BMP) என்று போட்டால் இடம் போதாது. அதனால் SMP என்று இன்னொரு Supplimentry Multilingual Plain அதை சேர்த்து எழுதினால்தான் 32Bit.. தமிழ் 16 Bit ஆகதான் இயங்கும்.

இப்போது இருக்கிற Unicode முறையே சரியாக இயங்குகிறது. Working implement இருக்கிறது. பெரும்பாலான பெரிய பெரிய Operating System களில் Implementation செய்திருக்கிறார்கள்.

Browser Implementation, Yahoo Search Engine. Office Tools, Linux. OpenOffice. PalamOS ஆகியோர் எல்லாம் பெரியளவில் வேலைகள் செய்திருக்கிறார்கள். இனிபோய் அந்தக் குறியீட்டு முறையை மாற்றச் சொல்வது வீண் வேலை. அதனால் மாற்ற வேண்டாம், இப்போது இருக்கிற முறையே சரியானதுதான்.

இல்லை. மாற்றம் செய்தால் என்ன? தமிழுக்கு நல்லது என்றால் மாற்றம் செய்யலாமே? ஏன் செய்யக் கூடாது என்கிறீர்கள்?

இதைச் செய்வதுதான் (அதாவது மாற்றுவதுதான்) நன்மை என்பதை நான் மறுக்கிறேன். மாற்றம் செய்யாமல் இருப்பதுதான் தமிழக்கு நன்மை என்று கருதுகிறேன். காரணம் தமிழின் வளர்ச்சி தொழில்நுட்பத்தில் அல்ல.

தமிழின் வளர்ச்சி தொழில் நுட்பத்தின் பயன்பாட்டில் இருக்கிறது. பயன்பாடு கூட வேண்டும் என்றால் தொழில்நுட்பச் சிக்கல்கள் கூடிய விரைவில் தீர்க்கப்பட வேண்டும். ஒரு உதாரணம் சொல்கிறேன். TSCII-TAB பிரச்சினையை ஒருமுகப்படுத்திய பிறகு அதில் வாதங்கள் ஏதுமில்லை. அதற்கப்புறம் அதனுடைய பயன்பாடு அதிகரித்திருக்கிறது. பள்ளிகளில் இது பயன்படுத்தப்படுகிறது. புதிய புதிய மென்பொருள்கள் வந்திருக்கிருக்கின்றன. புதிய குறுந்தகடுகள் (CD), மல்ட்டிமீடியா சி.டி. ஆகியவை வெளிவந்திருக்கின்றன. ஏனென்றால் Keyboard பிரச்சினை இப்போது இல்லை, குறியீட்டு பிரச்சினை இப்போது இல்லை.

யூனிகோடு அறிமுகப்படுத்தப்பட்டது 80களில். இப்போதுதான் Operating Systemகளில் Implementation செய்ய ஆரம்பித்திருக்கிறார்கள். இப்போது போய் ஒரு புகுக்குறியீட்டு முறையை கொடுக்கிறீர்கள் என்று சொன்னால் அதை Operation System கள் ஏற்றுக்கொண்டு Implement செய்வதற்கு எவ்வளவு காலம் ஆகும்?

எவ்வளவு காலத்தை நாம் விரயமாக்க வேண்டும்? இப்போது இருக்கிற குறியீட்டு முறையில் செய்ய முடியாதது இருக்கின்றன. இதனால் நமது பயன்பாடு சரியாக இல்லாமல் இருக்கிறது. சில செயல்களை பாதி வேக்காடக்கூட வெளியிட முடியாமல் இருக்கிறது என்ற சூழ்நிலை இருந்தால் அதை மாற்றுவதில் எந்தவித தவறும் கிடையாது.

எல்லா மொழிகளுக்கும் யூனிகோடு சிறப்பாக செயல்படுகின்றது என்பதை நிரூபித்த பிறகு, அதை பெரும்பாலான பெரிய பெரிய நிறுவனங்கள் ஏற்றுக்கொண்ட பிறகு லட்சக்கணக்கில், கோடிக்கணக்கான ரூபாய் செலவழித்து புதிய புதிய மென்பொருள்கள் உருவாக்கப்பட்ட பிறகு, இப்போதுபோய் அடித்தளத்தையே மாற்றுவது என்பது ஒரு மரத்தை வேரோடு தூக்கி வீசி எறிவது போன்றது அல்லவா?.

யூனிகோடிற்கு ஏற்றபடி எல்லா Operating Systems களையும் மாற்றி அமைத்திருக்கிறார்களா?

Windows XP. Windows 2000 இவற்றில் எல்லாம் தமிழ் யூனிகோடு சிறப்பாக இயங்க வழி செய்திருக்கிறார்கள். கூகுல் தேடுபொறியில் தமிழில் தேடினால் கிடைக்கும்படி செய்திருக்கிறார்கள். அமேஸனில் போட்டுத் தேடினாலும் வரும். தமிழில் வருகிற Word document ஐ எல்லாம் இப்போதே search செய்யலாம். உங்கள் Password கூட தமிழில் செய்துகொள்ளாலாம்.

அதெல்லாம் சரி. 128 எழுத்துகளுக்கு மட்டும்தான் இப்போது Unicode Layout-இடம் கொடுத்திருக்கிறார்கள். 247 உடன் பிற எழுத்துகளுக்கும் சேர்த்து 388 எழுத்துகளுக்கும் இடம் வேண்டும் என்கிறார்கள். இந்த முறையில் அமைக்கப்பட்ட 16 Bit Unicode file size, processing time, speed எல்லாமே பிரச்சினையாக இருக்கின்றன. இதைப்பற்றி நாம் கவலைப்படாமல் இருக்க முடியுமா?

இதை நாம் ரொம்ப Clincal-ஆகப் பார்க்கவேண்டும். Broadசூழூசிறீ Comment பண்ணிவிட முடியாது. ஒவ்வொரு விஷயத்தையும் அலசி அராய்ந்து பார்க்க வேண்டும். இன்றைய சூழலை மட்டும் கண்டு கணக்கிட்டால் போதாது – எதிர்காலத்தையும் பார்க்கவேண்டும். மூன்று முக்கிய கருத்துகளை இங்கே முன்வைக்கிறேன்:

முதலாவது – 128 இடங்களில் தமிழ் குறியீடுகள் அமைந்துள்ளதால், சுருக்கும் செயல்கள் எளிமையாகின்றன. காரணம், 128 இடங்களைக் கொண்ட ஒரு பிளாக்கை (கட்டத்தை) 16 பிட்டில் இருந்து 8 பிட்டிற்கு மாற்றுவது மிகவும் எளிது. High-byte என்று கூறப்படுகின்ற முதல் 8 பிட்டை நீக்கிவிட்டால் எஞ்சி இருக்கும் 8 பிட் களில் எல்லா குறியீடுகளையும் அடக்கி விடலாம். 512 பிளாக்கில் இது இயலாது. எனவே, குறியீட்டுமுறையை மாற்றுவதை விட, தமிழுக்கான (ஏன் இந்திய மொழிகளுக்குப் பொதுவான) சுருக்குமுறையை காண்பதே பயனுள்ள செயலாகும். எதிர்காலத்தில் வரும் வட்டுகள் யாவுமே, தகவல்களை சுருக்கியே சேமிகின்றன – இதை நாம் கவணிக்க வேண்டும். இன்றய கருவிகளை மட்டுமே கொண்டு எதிர்காலத்தை எடைபோடக் கூடாது.

இரண்டாவது – 128 குறியீட்டு முறைகளை மட்டுமே கையாளுவது, பெரும்பாலான மென்பொருள் மேம்பாட்டை எளிமையாக்குகிறது. அத்தோடு, ஒரு மொழிக்கு எழுதப் பட்ட ஒரு செயலியை, மற்றொரு மொழியில் இயங்க வைப்பதும் எளிமையாகிறது. இதனால் உலகத் தரத்திலான செயலிகள், தமிழிலும் வழங்கப் படுவதை நம்மால் காணமுடிகிறது.

மூன்றாவது – முதற்பகுதி 8 பீட்டை நீக்கும் வாய்ப்பின் மூலம், கைத் தொலைபேசிகளின் வழியோ அல்லது மற்ற தொடர்புதுறை சாதனங்களின் வழியோ அனுப்பப்படும் தமிழ் “செய்திகள்” குறைந்த அளவிலான இடங்களையே பயன் படுத்துகின்றன. இவ்வாறே, தமிழில் குறுஞ்செய்தி (SMS) சேவை ஒன்றை நாங்கள் அறிமுகப் படுத்தியுள்ளோம்.

நாம் இப்போது 64 Bit பற்றி கவலைப்பட வேண்டியதில்லை. நம்முடைய கவலையெல்லாம் இப்போது 8 Bit, 16 Bit தான். உங்கள் Software பழைய, புதிய கணினியில் உள்ளீடு செய்வதில் எந்த விதமான தடையும் இருக்கக்கூடாது, TAB, TSCII இலேயே 8 Bit இலேயே பயன்படுத்திவிட முடியும்.

ஆனால் எதிர்காலத்தில் நாம் செய்வது பாதுகாக்கப்பட வேண்டும். மற்றவர்களால் Search Engine இல் தேட உதவ வேண்டும் என்று நீங்கள் நினைத்தால் 16 Bit Unicode ஐப் பயன்படுத்தவேண்டும். 64 Bit பற்றிக் கவலைப்படவேண்டியதில்லை. ஏனெனில் அது CJK மொழிகளுக்குதான் தேவை. (Chinese, Japanese, Korean) அவர்களுக்கு எக்கச்சக்கமான இடம் தேவை. அவர்களுக்கு Surragate Space தேவைப்படுகிறது. அதற்காகதான் அவர்களுக்கு 32 Bit தேவைப்படுகிறது. நமக்குத் தேவையில்லை.

நன்றி: உலகத்தமிழ்

 

முத்து நெடுமாறன் நேர்காணல்
சந்திப்பு: சிபிச்செல்வன்
மூலம்: உலகத்தமிழ்

‘திசைகள்’ இணைய பக்கத்தை திறந்து பார்க்கிறபோது சிலருக்குப் படிக்க முடியவில்லை. இது ‘திசைகள்’ இதழ் மீதான குற்றச்சாட்டாக இதை நான் சொல்லவில்லை. யூனிகோடு முறையில் இருக்கிற நடைமுறைச் சிக்கலாகக் கூறுகிறேன். இதற்கு என்ன தீர்வு? இது எதனால் ஏற்படுகிறது?

முதலில் பயன்படுத்துபவர்கள் அதற்கேற்ற உலாவி (Browser) வைத்திருக்க வேண்டும். யூனிகோடு சப்போர்ட் பண்ணும் (Browser) ஆக இருக்க வேண்டும். Windows 98 வைத்திருப்பவர்கள் பெரும்பாலும் IEC 4.0 வைத்திருப்பார்கள். இதில் தமிழ் யூனிகோட் சரிவர இயங்காது. Netscape 4.7  வைத்திருப்பார்கள். இதிலும் இதே பிரச்சினை வரும். Windows 95 வைத்திருப்பவர்களும் உலாவியின் பதிப்பை மேம்படுத்தாமல் வைத்திருப்பார்கள். இதனால்தான் நீங்கள் சொல்கிற பிரச்சினை வருகிறதே தவிர யூனிகோடால் வருவதில்லை. உலாவிகளின் புதிய பதிப்புகள் பரவலான பயன்பாட்டிற்கு வந்தபிறகு யூனிகோடில் தடையின்றியும் எந்தவித அமைபுச் செயலும் (Setup) இல்லாமலும் தமிழில் படிக்கலாம். பழைய கணினியில் யூனிகோடு இயங்காது.

Working Group 02 வின் பணிகள் என்னவாக இருக்கிறது? மாநாட்டில் அருண்மகிழ்நன் பேசும்போது அதைக் கலைத்துவிடப் போவதாக கூறினார். ஏன் அதைக் கலைக்க வேண்டும்? புதிதாக வேறு என்ன அமைக்கப் போகிறீர்கள்?

கலைப்பது என்பதில்லை. அதனுடைய நோக்கங்களை மறுபரிசீலனை செய்ய வேண்டும். நாங்கள் செய்ய வேண்டிய பணிகள் சில இருந்தன. அதில் ஒரு பணி யூனிகோடில் தமிழ்க் குறியீட்டு முறைக்கு மேலும் என்னென்ன தேவைகள் இருந்ததோ அதை ஆராய்ந்து அழகு பண்ணி யூனிகோடு கன்சார்ட்டியத்திடம் சமர்மித்திருக்கிறோம். அதன் ஒரு பகுதியை நாங்கள் முடித்துவிட்டோம். தொடர்ந்து அகரவரிசை, மற்றும் பல பணிகளைத் தொடங்க இருக்கின்றோம். இரண்டாவது, கிருஷ்ணமூர்த்தி சொன்ன தமிழ் இணையப் பல்கலைக்கழக ஆய்வுப் பணியை கலந்தாலோசித்து அந்த அமைப்பு முறையின் தேவையை ஆய்வு செய்வது. அதை நாங்கள் தொடங்கிய போது WG2 குழுவில் இரு வேறு கருத்துகள் மிகவும் வலுவானவையாக இருந்தன. பெரும்பாலானவர்கள், இப்போது இருப்பதே போதும் என்றார்கள். மாற்றம் வர வேண்டும் என விரும்புபவர்களைக் கலந்து ஆலோசிக்க வாய்ப்பளிக்கும்படியாக இதற்கென்று தனியாக வேரொறு குழுவை ஆரம்பிக்க வேண்டும் என்று சொன்னோம்.

மூன்றாவது, செயலிகளில் யூனிகோடைப் பயன்படுத்துவதற்கும், இன்னும் என்னென்ன வகைகளில் எளிமையாக பயன்படுத்துவதற்கும், மென்பொருள் உருவாக்குபவர்களுக்கும், பயன்பாட்டாளர்களுக்கும் உதவுவதற்காக பணிக்குழு-02இன் இணைய தளத்தில் தேவைபடும் உதவிப்பக்கங்களைப் போடத் திட்டமிட்டுள்ளோம். இந்த மூன்றாவது பணியை இன்னும் நாங்கள் தொடங்கவில்லை. எனவேதான், பணிக்குழு-02 இன் செயல்களை மறுபரிசீலிப்பது பற்றிப் பேசப்பட்டது.

இந்த மாநாட்டில் யூனிகோடு தொடர்பாக என்ன மாதிரியான ரிசல்ட்ஸ் வந்திருந்தன?

இருவித கருத்துகளைக் கண்டேன். ஒரு சாரர் யூனிகோடு அமைந்துவிட்டது. அது சரியாக இருக்கிறது. இனி அதைப்பற்றி யோசிக்காமல் பயன்பாட்டைப் பற்றி யோசிக்கலாம் என்கிறார்கள். இன்னொரு குழுவினர் இப்போது இருப்பது சரியில்லை. நாம் மாற்ற வேண்டும் என்கிறார்கள். இது எல்லா மாநாட்டிலும் இருப்பதுதான். இதில் நாம் வருத்தப்பட ஒன்றுமில்லை. எல்லோரும் மகிழ்ச்சியடைய வேண்டும். ஏனெனில் எல்லோரும் தமிழ் சிறப்பாக இருக்க வேண்டுமென விரும்புவது மகிழ்ச்சியடைய வேண்டிய விஷயம்தானே.

பயனாளர்களுக்கு நான் கூறுவதெல்லாம் இதுதான்: எனது கட்டுரையில் நான் கூறியது போல யூனிகோடில் தமிழ் சிறப்பாகவே இயங்குகிறது – புழக்கமும் வளர்ந்துகொண்டே வருகிறது. எனவே, தயங்காமல் அதைப் பயன்படுத்துங்கள். மாற்று கருத்துகள் எல்லா சமூகங்களிலும், மொழியைச் சார்ந்தவர்களிடமும் உண்டு, இது ஒன்றும் புதிதல்ல. பத்தாண்டுகளுக்கு மேலாக ஆசிய பசிபிக் நாடுகுளுகுச் சென்று மொழி சார்ந்த தொழில்நுட்ப வேலைகளில் ஈடுபட்டிருக்கிறேன். பெரும்பாலும் எல்லா இடங்களிலும் மாற்று கருத்துகள் இருக்கின்றன. வருங்காலத்திலும் இது போன்ற கருத்துகள் தோன்றும். தோன்றும் போதெல்லாம் தரத்தை மாற்றிக்கொண்டே இருக்க முடியுமா? அப்படி மாற்றிக் கொண்டு வந்தால் தமிழின் புழக்கம்தான் தழைக்குமா? மாங்கனி உயரமாக இருக்கிறது என்றால் மரத்தை வெட்டித்தான் கனிபறிக்க வேண்டும் என்ற அவசியம் இல்லையே!. அப்படிச் செய்தால் – எந்தனை மரங்களைத்தான் நாம் நடுவது?

மாநாட்டில் நடந்த எல்லா செஷன்களிலும் அந்தந்தத் துறையில் ஆர்வமுள்ளவர்கள் மட்டும் அமர்ந்திருந்தார்கள். ஆனால் யூனிகோடு செஷனில் எல்லாத் துறைகளில் கலந்துகொண்டவர்களும் ஆர்வத்துடன் வந்ததால் நிற்பதற்குக்குக்கூட இடமில்லாமல் இருந்தது. இது அவர்களுக்கு யூனிகோடு மீது இருக்கிற அக்கறையைக் காட்டுகிறது இல்லையா?

ஆமாம். யூனிகோடு எப்படி இயங்குகிறது என்பது பற்றி நாம் பயனாளர்களுக்கு விளக்குவதைவிட அதன் பயன்பாட்டை எவ்வளவுக்கெவ்வளவு எளிமையாக்க வேண்டுமோ அதைத்தான் நாம் செய்ய வேண்டும். இதை இந்த மாநாட்டில் நாங்கள் உணர்ந்துகொண்டோம். பொதுவாக எந்த முயற்சியிலும் இருகட்ட மேம்பாடுகளை நாம் பார்க்கிறோம். முதலாவது “Fixing the problem”.அடிப்படையில் என்னென்ன பிரச்சனைகள் இருக்கின்றனவோ அவற்றை முதலில் நாம் தீர்த்துவிட வேண்டும். இரண்டாவது கட்டத்தை “Adding the Features” என்று சொல்லலாம். புதுப்புது வசதிகளை சேர்க்க வேண்டும்.

முதல் நிலையை நாம் கடந்து வந்துவிட்டோம். ஒரு சில பிரச்சினைகள், கருத்து வேறுபாடுகள் இருந்துகொண்டேதான் இருக்கும். ஆனால் அடிப்படையான பிரச்சினைகளைத் தீர்த்துவிட்டோம் என்று நினைக்கிறேன். ஒரு நண்பர்கூட சொன்னார், “இங்கே சண்டைபோட விஷயம் எதுவும் இல்லாததால் ரொம்ப டல்லடிச்சிடிச்சி” என்றார். மற்ற கட்டுரைகளை நான் பார்க்கிறபோது எல்லோரும் செயல்பாட்டில் இறங்கிக்கொண்டிருக்கிறார்கள். “Spell Check”,. “Speech Recognition”,கல்வி துறையைச் சார்ந்த முயற்சிகள் – இதுபோல புதுப்புது துறைகளில் நாம் மேம்பாடு காண்கிறபோது உள்ளபடியே மகிழ்ச்சியாக இருக்கிறது. இப்போது விசைப் பலகை, குறியீட்டு முறை (அதாவது 8Htm) பிரச்சினை இல்லை. இது மகிழ்ச்சியாகவே இருக்கிறது.

எங்களைப் போன்றவர்களுக்குக்கூட encoding problem இருக்கிறது. நான் ஏற்கனவே சொன்னதுபோல end-user இந்தப் பிரச்சினை இன்னும் இருக்கிறது.

இதில் கண்டிப்பாக வளர்ச்சி இருக்கிறது. பயனாளர்களுக்கு எந்தவித பிரச்சனையும் இல்லாமல் தமிழ் போய்ச் சேர தொழில்நுட்ப வல்லுநர்கள் முதலில் அக்கறை எடுக்க வேண்டும். சிங்கப்பூரில் இயங்கும் “ஒலி 96.8″ வானொலி நிலையத்துடன் ஒரு திட்டத்தை மேற்கொண்டோம். குறுந்தட்டை கணினிக்குள் செலுத்திய உடனெயே, பயனாளர்கள் தமிழில் அஞ்சல் அனுப்ப வகை செய்ய வேண்டும் என்பதுதான் திட்டத்தின் நோக்கம். இந்த குறுந்தட்டு 10,000 பயனாளர்களைச் சென்றடைந்தது. ஒரு சிலர் மட்டுமே எங்களை நாடி பிரச்சனை என்று சொல்லி தீர்வு கேட்டார்கள். அதுவும் கூட நாங்கள் உருவாக்கிய செயலியினால் வந்த பிரச்சனை இல்லை – அவர்கள் வைத்திருந்த கணினியில் இருந்த பிரச்சனை.

எனவே, வல்லுநர்கள் மனம் வைத்தால், பிரச்சனை இல்லாமல் தமிழ் இயங்க அவர்கள் வகை செய்யலாம். பொறுப்பும் அதற்கேற்ற உழைப்பும் வேண்டும்.

இ-மெயிலில் எவ்வளவுதான் முரசு மாதிரியான மென்பொருளைப் பயன்படுத்தினாலும் இங்கே (தமிழ்நாட்டில்) இருப்பவர்களுக்கு அதைத் திறந்து பார்க்கிறபோது பிரச்சினை வருகிறது.

இங்கே என்ன பிரச்சினை என்றால் Browsing Centre அல்லது நண்பர்களின் கணினிகளில் பார்க்கிறார்கள். அவர்கள் சொந்தமாக கணினி வைத்திருக்க பலருக்கு வசதியில்லை. ஒருவர் ‘இந்தப் பிரச்சினை’ என்று அஞ்சல் அனுப்புவார். அதற்கு பதில் போடுவேன். மறுநாளும் அதே பிரச்சினையென்று இன்னாரு அஞ்சல் போடுவார். எங்களுக்கு ஒரு நாளுக்கு 100-150 மின்-அஞ்சல்கள் வரும். அதற்கு பதில் போடுவோம். மறுநாள் அவருக்கு மறுபடியும் பிரச்சினை வருவதற்கான காரணம் வேறு கணினியில்,. வேறு Browser இல் செய்வதால் Setup மாறியிருக்கும். அந்தப் பிரச்சினை மறுபடியும் வரத்தானே செய்யும். இது அவர்களுடைய குற்றமில்லை. இதற்காக நாம் என்ன செய்யலாம் என்று யோசிக்கலாம். கம்ப்யூட்டரில் போடலாம். சிடி யில் வைத்துக்கொள்ள முயற்சிக்கலாம். சிடி யில் போட்டு அதில் இருந்து இயங்கும்படி செய்யலாம். இவை எல்லாம் மென்பொருள் உருவாக்குபவர்களிடம் இருக்கிறது.

மாநாட்டில் கிருஷ்ணமூர்த்தி படித்த பேப்பர் யூனிகோடிடம் சப்மிட் செய்தாரா? அல்லது Working Group2 ல் செய்தாரா?

யூனிகோடிடம் செய்தாரா என்று எனக்குத் தெரியாது.WGO2 விடம் சப்மிட் செய்தார்கள். ஆனால் அதைப் பற்றி விவாதம் தொடரவில்லை. எனவேதான் வேறொரு பனிக்குழு அமைக்கும்படி பரிந்துரை செய்தோம்.

ஏற்கனவே சப்மிட் செய்து நிராகரித்து விட்டார்கள். அதனால் மறுபடியும் எதற்கு சப்மிட் செய்ய வேண்டும் என்றும், இன்னொரு சாரர் ஏன் மறுபடியும் சப்மிட் செய்யக்வடாது என்றும் கேட்டார்கள் இல்லையா?

எந்தப் பேப்பர் என்று எனக்குத் தெரியாது. 16 Bit  குறியீட்டு முறை என்பது யூனிகோடு சன்சார்ட்டியத்திற்கு கொண்டுபோய் பிரசென்ட் செய்யப்பட்டிருக்கிறது. ஆனால் அதை நிராகரித்துவிட்டார்கள். காரணம் நான் ஏன்கனவே சொன்னதுதான். இப்போது இருக்கிற யுனிகோடு முறை வேலை செய்யவில்லையென்று சொல்லுங்கள். நாங்கள் புதிதாக செய்யலாம் என்று சொல்லி இருக்கிறார்கள். இது WGO2 அமைப்பதற்கு முன்பு நடைபெற்ற செயல் என்று நினைக்கிறேன்.

இந்தப் பிரச்சினையில் தமிழக அரசு, மைய அரசின் Role என்னவாக இருக்கும்?

என்னுடைய விருப்பம் என்னவென்றால் அவர்கள் எடுக்கக்கூடிய நடவடிக்கைகள் ஒருமுகப்படுத்தக்கூடியவையாக இருக்க வேண்டும். இவர்கள் ஒரு மாதிரி, அவர்கள் ஒரு மாதிரி என்று சொன்னால், இழக்கக்கூடியது நாம்தான். ஊர் கூடி தேர் இழுத்தால்தான் தேர் நகரும். எல்லா மொழிகளுக்கும் கிடைக்கக்கூடிய வாய்புகள் நமக்குக் கிடைக்காமல் போய்விடக்கூடாது.

இப்போதிருக்கிற யூனிகோட்டில் என்னென்ன மாறுபாடுகள் செய்ய வேண்டும் என்று நீங்கள் எதிர்பார்க்கிறீர்கள்?

இருக்கிற முறையில் குறைபாடுகள் இருப்பதாக நான் நினைக்கவில்லை. இன்னும் பயன்பாட்டிற்கு வரவில்லை. நிறைய செயலிகளை முதலில் எழுதவேண்டும். எந்தெந்த எழுத்துகளுக்கு குறியீடு தேவைப்படுகிறதோ, அவற்றைப் பட்டியலிட்டு கொடுத்திருக்கின்றோம் – சேர்த்திருக்கிறார்கள். இப்போது இரண்டு விஷயங்கள் பேசிக்கொண்டு இருக்கிறோம். “z” மற்றும் “சிறீ” எழுத்துகளை எப்படிப் போட வேண்டும். மற்றும் ‘ஓம்’ என்பதை ஒரு சொல்லாக இருக்கும் போது, அதை “சின்னமாக”(symbol) எப்படிக் காண்பது என்று தொழில்நுட்ப அடிப்படையில் ஆலோசனை நடத்தி வருகின்றோம்.

ஒகர, ஓகார மற்றும் ஒளகார வரிசையில் உள்ள எழுத்துகளுக்கு மூன்று யூனிகோடு குறியீடுகள்கள் தேவைப்படும் என்று சொல்கிறார்கள் – அது தப்பு. அதற்கு இரண்டே குறியீடுகள்தான் தேவைப்படும். ஆனால் யூனிகோடின் பழைய பதிப்பில் நீங்கள் இப்படியும், அப்படியும் போட்டுக்கொள்ளலாம் என்று சொல்லியிருந்தார்கள். ஆனால் இப்படி (அதாவது இரண்டு குறியீடுகளைக் கொண்டு) எழுதுவதுதான் பொருத்தமாக இருக்கும் என்று சொல்லி புதிய பதிப்பில் மாற்றம் செய்துவிட்டோம். இதெல்லாம் WG02 செய்ததுதான்.

நன்றி: உலகத்தமிழ்

Advertisements

மறுமொழியொன்றை இடுங்கள்

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / மாற்று )

Twitter picture

You are commenting using your Twitter account. Log Out / மாற்று )

Facebook photo

You are commenting using your Facebook account. Log Out / மாற்று )

Google+ photo

You are commenting using your Google+ account. Log Out / மாற்று )

Connecting to %s