യൂണീക്കോഡ് ഡോട്ട് ഓര്ഗിനെ പറ്റി
വിവിധ രാജ്യങ്ങളിലും ഭാഷകളിലും ഭാഷാ ആപ്ലിക്കേഷനുകള് വികസിപ്പിച്ചെടുക്കുകയും ഉപയോഗിക്കുകയും ചെയ്യുന്നു. ഇത്തരം ഭാഷാ ആപ്ലിക്കേഷനുകളുടെ വലുപ്പവും വ്യാപ്തിയും ബഹുഭാഷാ അന്തരീക്ഷത്തിന് അനുയോജ്യമല്ലെന്ന് പറയേണ്ടതില്ലല്ലോ. അപ്പോള് എല്ലാ ഭാഷാ ആപ്ലിക്കേഷനുകളും ഉല്പാദിപ്പിക്കുന്ന ക്യാരക്ടറുകള് ഒരു നിശ്ചിത മാനദണ്ഡത്തെ അനുസരിക്കേണ്ടി വരും. ഇങ്ങിനെ, എല്ലാ ഭാഷകളിലെയും ക്യാരക്ടറുകള്ക്ക് ഉള്ള ആഗോള മാനദണ്ഡമാണ് യൂണീക്കോഡ് എന്നത്. യൂണീക്കോഡ് മാനദണ്ഡങ്ങള് വികസിപ്പിച്ചെടുക്കുന്നതിനുള്ള പ്രയത്നങ്ങള്ക്ക് നേതൃത്വം നല്കുന്ന സംഘടനയായ യൂണീക്കോഡ് കണ്സോര്ഷ്യത്തിന്റെ (യൂണീക്കോഡ് ഇന്ക്) ഔദ്യോഗിക സൈറ്റാണ് യൂണീക്കോഡ് ഡോട്ട് ഓര്ഗ് (unicode.org).
യൂണീക്കോഡിനെ പറ്റി നമുക്ക് കൂടുതല് മനസിലാക്കാം. അക്ഷരങ്ങളും അക്കങ്ങളും ചിഹ്നങ്ങളുമൊക്കെ കമ്പ്യൂട്ടറില് ശേഖരിച്ച് വയ്ക്കുന്നത് പൂജ്യത്തിന്റേയും ഒന്നിന്റേയും കൂട്ടങ്ങളായി മാറ്റിയാണ്. ASCII (അമേരിക്കന് സ്റ്റാന്ഡേര്ഡ് കോഡ് ഫോര് ഇന്ഫര്മേഷന് ഇന്റര്ചേഞ്ച്) എന്ന കോഡാണ് മുമ്പ് ഇതിനായി ഉപയോഗിച്ചിരുന്നത് (ഇപ്പോഴും ഈ കോഡ് ഉപയോഗിക്കപ്പെടുന്നുണ്ട് എന്നും ഓര്ക്കുക).
ഈ രീതി ഉപയോഗിച്ച് ഉണ്ടാക്കാവുന്ന അക്ഷരാദികളുടെ എണ്ണം വളരെ പരിമിതമാണ് (256 എണ്ണം മാത്രം). ഇത് ഉപയോഗിച്ചാല് രണ്ടു ഭാഷകളിലെ അക്ഷരങ്ങള് മാത്രമാണ് ഒരുസമയത്ത് ഉപയോഗിക്കാന് പറ്റുകയുള്ളൂ. ഇതില് ആദ്യത്തെ 128 എണ്ണം ആഗോള ഭാഷയായ ഇംഗ്ലീഷിനും അടുത്ത 128 എണ്ണം വേറെ ഏതെങ്കിലും ഭാഷക്കും ഉപയോഗിക്കാം. എന്നാല് ലോകത്തിലെ പ്രധാനപ്പെട്ട ഭാഷകളെല്ലാം കമ്പ്യൂട്ടര് സാങ്കേതികത ഉപയോഗപ്പെടുത്താന് തുടങ്ങിയതോടെ ബഹുഭാഷകള് പിന്തുണയ്ക്കുന്ന ഒരു കോഡിംഗ് സിസ്റ്റം വേണമെന്നത് നിര്ബന്ധമായി.
ഇതിനായി ഇന്റര്നാഷണല് സ്റ്റാന്ഡേര്ഡ് സംഘടന (ISO/IEC 106461) ഒരു പദ്ധതി തയ്യാറാക്കി. എന്നാല്, ഈ പദ്ധതിയില് നിര്ദേശിച്ചിട്ടുള്ള എല്ലാ അക്ഷരാദികളേയും ഉള്പ്പെടുത്തിക്കൊണ്ട് കുറേക്കൂടി വിപുലമായ ഒരു കോഡിംഗ് രീതി വേണമെന്ന ആവശ്യം കമ്പ്യൂട്ടര് വ്യവസായലോകം മുമ്പോട്ടുവച്ചു. അങ്ങനെയാണ് കമ്പ്യൂട്ടര് നിര്മാതാക്കളും സോഫ്റ്റ്വെയര് ഉല്പാദകരും വിവിധ ഏജന്സികളും കൂടി 1991-ല് യൂണീക്കോഡ് കണ്സോര്ഷ്യം രൂപീകരിക്കുന്നത്. യൂണീക്കോഡ് കണ്സോര്ഷ്യം മുമ്പോട്ടുവച്ച ഏക കോഡിംഗ് സമ്പ്രദായമാണ് യൂണീക്കോഡെന്ന് അറിയപ്പെടുന്നത്.
പ്ലാറ്റ്ഫോമിനും പ്രോഗ്രാമിനും ഭാഷയ്ക്കും അതീതമായി, ഒരു പ്രതീകത്തിന് (ക്യാരക്ടറിന്) ഒരു സവിശേഷ നമ്പര് നല്കാനാണ് യൂണീക്കോഡ് എന്കോഡിംഗ് രീതി ഉന്നംവയ്ക്കുന്നത്. മൈക്രോസോഫ്റ്റ്, ആപ്പിള്, ഹ്യൂലറ്റ് പക്കാര്ഡ്, ഒറാക്കിള് തുടങ്ങിയ കമ്പനികള് ഈ രീതി അവരുടെ ഉല്പന്നങ്ങളില് നടപ്പാക്കിക്കഴിഞ്ഞിട്ടുണ്ട്. ഇന്റര്നെറ്റ് എക്സ്പ്ലോറര്, മോസില്ല ഫയര്ഫോക്സ്, ഗൂഗിള് ക്രോം പോലുള്ള ബ്രൌസറുകളും വിന്ഡോസ്, മാക്ക് ഓഎസ്, ലിനക്സ് പോലുള്ള ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളും യൂണീക്കോഡിനെ പിന്തുണയ്ക്കുന്നു.
വ്യത്യസ്ത ഭാഷകളില് യൂണീക്കോഡ് എങ്ങിനെ ഉപയോഗിക്കണമെന്ന് യൂണീക്കോഡ് ഡോട്ട് ഓര്ഗില് വിവരിച്ചിട്ടുണ്ട്. ഒപ്പം തന്നെ, നിങ്ങള്ക്ക് എന്തെങ്കിലും ക്യാരക്ടര് കൂട്ടിച്ചേര്ക്കണമെന്ന് തോന്നുന്നുവെങ്കില് അതിനായി അപേക്ഷിക്കാനുള്ള സൌകര്യവും ഇവിടെയുണ്ട്. ഇന്ത്യന് രൂപയ്ക്കുള്ള ചിഹ്നം ഈയടുത്തിടെ യൂണീക്കോഡില് ഉള്പ്പെടുത്തിയത് ഓര്മയുണ്ടാകുമല്ലോ. ഭാരത സര്ക്കാരിന്റെ ഇന്ഫര്മേഷന് ടെക്നോളജി ഡിപ്പാര്ട്ട്മെന്റ് യൂണീക്കോഡ് കണ്സോര്ഷ്യത്തിലെ ഒരു മുഴുവന് സമയ അംഗമാണ്.
ലാഭേച്ഛ ഇല്ലാതെ പ്രവര്ത്തിക്കുന്ന ഒരു സംഘടനയാണ് യൂണീക്കോഡ് കണ്സോര്ഷ്യം. യൂണീക്കോഡിനെ ഒരു മാനദണ്ഡമാക്കി വികസിപ്പിക്കലും യൂണീക്കോഡിന്റെ ഉപയോഗം പ്രചരിപ്പിക്കലുമാണ് കണ്സോര്ഷ്യത്തിന്റെ പ്രധാന ലക്ഷ്യം. കമ്പ്യൂട്ടറില് ഒരു ക്യാരക്ടര് എങ്ങിനെയാണ് മാപ്പ് ചെയ്യപ്പെട്ടിരിക്കുന്നത് എന്ന് മനസിലാക്കാന് യൂണീക്കോഡ് ഡോട്ട് ഓര്ഗിലെ ‘വേര് ഈസ് മൈ ക്യാരക്ടര്’ വിഭാഗം സന്ദര്ശിക്കുക.