Technology
 

Help:Contents/Unicode: How To

From Varamozhi

Computers operates by assigning a code number for each English character. For example, letter A has the number 65. Now we have separate code numbers for all Malayalam characters - in fact, for all languages of the world. This numbering scheme is called Unicode. In Unicode, Malayalam first letter 'a' (അ) is given the number 3333. Simillarly different different numbers for rest of Malayalam alphabets. The fonts that understand these new code numbers are called Unicode fonts.

Fonts like ML-TTKarthika, Thoolika etc are not Unicode fonts. They used the code numbers assigned for English alphabets for Malayalam. That is not any standards based. So a document written in ML-TTkarthika can not be processed by other applications like google search.

Contents

[edit] Setting up your Windows PC for reading Unicode

Download and install the AnjaliOldLipi font. For that, save AnjaliOldLipi font in Desktop and do Start > Control Panel > Fonts > Install New Font.

[edit] Make it the default system font for Malayalam

  1. Click Start, Control Panel
  2. Double click on Internet Options, click on Fonts and Select Language Script Malayalam. Then select Web page font as AnjaliOldLipi.
  3. Press OK and OK.

[edit] Optional

[edit] Malayalam in all applications

For correct Malayalam display in applications other than Internet Explorer, please make sure, Install files for complex script... is checked in Control Panel > Regional and Language Options > Languages tab. This may require the Windows Installation CD.

[edit] Visually pleasing rendering

  • Goto Start > setting> controlpannel> Display > Appearance > Effects...
  • Check Use the following method to smooth edges of screen fonts:
  • Select ClearType
  • OK > OK

[edit] Browsers other than IE

Do following additional steps for browsers other than IE:

[edit] FireFox 1.5 & 2.0 beta

  • Click Tools
  • Select Options
  • Click on the Content Tab
  • Click Advanced button in Fonts & Colors section.
  • Select Western in 'Fonts for'
  • Choose Proportional as 'Sans Serif'
  • Choose Serif as 'Garamond'
  • Choose Sans-Serif as 'Verdana'
  • Select Malayalam in 'Fonts for'
  • Choose Proportional as 'Sans Serif'
  • Choose Serif as 'AnjaliOldLipi'
  • Choose Sans-Serif as 'AnjaliOldLipi'
  • Choose Monospace as 'AnjaliOldLipi'
  • Choose Default Character Encoding as 'Unicode(UTF-8)'
  • Click OK
  • Click OK in Options window

If you prefer a different Malayalam Unicode font, say Kartika, run above instructions replacing AnjaliOldLipi with Kartika.

[edit] Opera

  • Click Tools menu
  • Select Preferences
  • Click Advanced tab
  • From the left sidebar select Fonts
  • Click International Fonts button
  • Choose Malayalam in Writing Section
  • Select desired Malayalam Unicode font as Normal font
  • If available choose a Monospace font also
  • Click OK two times and restart Opera

[edit] More information

[edit] Available Malayalam Unicode fonts

[edit] Windows Vista & XP fonts for Unicode 5.1

Fonts that work in Microsoft's Vista and XP systems. Only those fonts capable of displaying common conjuncts and chillus are listed.

[edit] AnjaliOldLipi

  • A traditional lipi font
  • Typographed like Arial which is the very essential web English font
  • Hinted for small font sizes
  • Not so attractive in printed documents
  • The only public domain font available for Malayalam. This means, you can do whatever you wanted to do with this font - commercial or non-commercial.

[edit] Meera

  • Even Thickness
  • GNU GPL font with Font Excepti

[edit] Raghu

  • Title font
  • Not so good in smaller font sizes
  • Designed by famous typographer R. K. Joshi
  • GNU GPL font with specific clause for embedding

[edit] Windows Vista & XP fonts without Unicode 5.1 support

[edit] Kartika

  • A new lipi font
  • Default Malayalam Unicode font in Microsoft Vista
  • Does not have conjunct problems visible in XP
[edit] Issue: Odd letter shapes
  • Looks like designed without consulting a Malayalam native

[edit] Windows XP fonts

Fonts that work in Microsoft's XP system; not in Vista. Only those fonts capable of displaying common conjuncts and chillus are listed.

[edit] Karumbi

  • An old lipi font
  • This is a script Typeface.

[edit] Thoolika

  • Seperate fonts for modified lipi and traditional lipi.
  • Free download for non-commercial personal use.

[edit] Nila

  • Modified lipi only
  • Varying width pen

[edit] MLU-Panini

  • Modified lipi only
  • Varying width pen

[edit] e-Malayalam OT

  • Modified lipi only.
  • Uniform width pen

[edit] Kartika

  • A new lipi font
  • Default Malayalam Unicode font in Microsoft XP
[edit] Issue: Odd letter shapes
  • Looks like designed without consulting a Malayalam native
[edit] Issue: Some conjuncts not displayed correctly
  • ന്റ്ര
  • ന്റ
  • സ്റ്റ്ര
  • ക്ഷ്യ
  • ണ്ട
  • ല്ലു്

<nowiki>Insert non-formatted text here==== Arial Unicode MS ====

  • Don't use it - it does not put vowel signs correctly.

എന്റെ പെണ്ണെ, ഈ രണ്ടു ദിവസമായി ഞാന്‍ മരിച്ചുപോയിരുന്നു... നിന്റെ സ്നേഹവും കരുതലുമൊക്കെ ഒരുനിമിഷം കൊണ്ട് ഇല്ലാതായതുപോലെ തോന്നി... ഒരുദിവസം കൊണ്ട് എല്ലമാവസാനിച്ചതുപോലെ... എന്റെ സ്നേഹം ഇത്രയും</nowiki>

==

[edit] Headline text

WikiTeX: latex reported a failure, namely:
This is pdfeTeX, Version 3.141592-1.21a-2.2 (Web2C 7.5.4)
entering extended mode
(./e9c0393b7af1c87131bd5030d482c
LaTeX2e <2003/12/01>
Babel  and hyphenation patterns for american, french, german, ngerman, b
ahasa, basque, bulgarian, catalan, croatian, czech, danish, dutch, esperanto, e
stonian, finnish, greek, icelandic, irish, italian, latin, magyar, norsk, polis
h, portuges, romanian, russian, serbian, slovak, slovene, spanish, swedish, tur
kish, ukrainian, nohyphenation, loaded.
(/usr/share/texmf/tex/latex/base/article.cls
Document Class: article 2004/02/16 v1.4f Standard LaTeX document class
(/usr/share/texmf/tex/latex/base/size10.clo))
(/usr/share/texmf/tex/latex/amsfonts/amssymb.sty
(/usr/share/texmf/tex/latex/amsfonts/amsfonts.sty))
(/usr/share/texmf/tex/latex/amsmath/amsmath.sty
For additional information on amsmath, use the `?' option.
(/usr/share/texmf/tex/latex/amsmath/amstext.sty
(/usr/share/texmf/tex/latex/amsmath/amsgen.sty))
(/usr/share/texmf/tex/latex/amsmath/amsbsy.sty)
(/usr/share/texmf/tex/latex/amsmath/amsopn.sty))
(/usr/share/texmf/tex/latex/amsmath/amscd.sty)
(/usr/share/texmf/tex/latex/concmath/concmath.sty)
(./e9c0393b7af1c87131bd5030d482c.aux)
(/usr/share/texmf/tex/latex/concmath/ot1ccr.fd)
(/usr/share/texmf/tex/latex/concmath/omlccm.fd)
(/usr/share/texmf/tex/latex/concmath/omsccsy.fd)
(/usr/share/texmf/tex/latex/concmath/omxccex.fd)
(/usr/share/texmf/tex/latex/amsfonts/umsa.fd)
(/usr/share/texmf/tex/latex/amsfonts/umsb.fd)
! Missing $ inserted.
 
                $
l.7 
    
! Display math should end with $$.
 
                   \par 
l.7 
    

! LaTeX Error: Bad math environment delimiter.

See the LaTeX manual or LaTeX Companion for explanation.
Type  H   for immediate help.
 ...                                              
                                                  
l.11 ...'Bold text'''sfdgdfsdfds'''\end{equation*}
                                                  
! Missing $ inserted.
 
                $
l.11 ...'Bold text'''sfdgdfsdfds'''\end{equation*}
                                                  
! Display math should end with $$.
 
                   \endgroup 
l.11 ...'Bold text'''sfdgdfsdfds'''\end{equation*}
                                                  
[1] (./e9c0393b7af1c87131bd5030d482c.aux) )
(see the transcript file for additional information)
Output written on e9c0393b7af1c87131bd5030d482c.dvi (1 page, 404 bytes).
Transcript written on e9c0393b7af1c87131bd5030d482c.log.
==

കണ്ടിട്ടും, എന്നെ നീ വിണ്ടും പരിക്ഷിച്ചുവെന്നോര്‍ത്തു മനസ് വല്ലാതെ നൊന്തു.. ഒരിക്കല്‍ എല്ലാ മാനുഷിക സ്നേഹങ്ങളും ഞാന്‍ ഉപേക്ഷിക്കാന്‍ തയ്യാറായിരുന്നു... ആര്‍ക്കും ആത്മാര്‍ഥമായി സ്നേഹിക്കാന്‍ കഴിയില്ല എന്ന് ഞാന്‍ വിസ്വസിച്ചുപോയിരുന്നു... പക്ഷെ നിന്നെ കണ്ടതുമുതല്‍ സുഹൃതുബന്തങ്ങള്‍ക്ക് വല്ലാത്തൊരു അഴമുണ്ടെന്നു തോന്നിത്തുടങ്ങി.. പിന്നെ ഒന്ന് പിറകോട്ടു നോക്കാതെ അതില്‍ ആഴത്തില്‍ നിന്താന്‍ ആരംഭിച്ചു..അതിനിടയിലുണ്ടായ ചെറിയ പിണക്കങ്ങളും, പരാതികളും, മിണ്ടാതിരിക്കലുകളും, ഒക്കെ ഞാന്‍ ആസ്വതിച്ചു. അതെല്ലാം നിന്നെ ഒത്തിരി ഇഷ്ടപെടാന്‍ വിണ്ടും വിണ്ടും കാരണമാക്കി. എന്റെ ജീവിതത്തിന് ഒരിക്കലും ഉണ്ടാകാതിരുന്ന നിറവും മണവും ഉണ്ടാകാന്‍ ആരംഭിച്ചു... ശരിരവും മനസും തന്നു സ്നേഹിക്കുന്ന, എല്ലാ തരത്തിലും വ്യത്യസ്തയായ ഒരു പെണ്ണ് എന്റെ ജീവിതത്തെ അത്രമാത്രം ഗ്രസിച്ചു... എന്റെ ജീവിതത്തിന്റെ ഭാഗം തന്നെയായി മാറി അവള്‍. അവളുടെ വേരുകള്‍ ഹ്രദ്യത്തെ പൊതിഞ്ഞിരുന്നു. എന്റെ ശരിരത്തെ കുറിച്ചുള്ള ഭയവും സംശയങ്ങളും, എല്ലാം നിങ്ങി..ഇടയ്ക്കു ചില സംശയങ്ങളൊക്കെ ഉണ്ടായിരുന്നെങ്കിലും എന്റെ അധ്യാത്മിക ഗുരുക്കളുടെ ഉപദേശം എന്നെ ഒത്തിരി സഹായിച്ചു വിണ്ടും വിണ്ടും നിന്നോട് അടുത്ത്... പക്ഷെ ജൂണ്‍ പതിനാറു രാത്രി അതെല്ലാം തകിടം മറിഞ്ഞു... എല്ലാം അവസാനിച്ചതായി തോന്നി... ഒരുമനുഷ്യനും ആരേം ആത്മാര്‍ത്ഥമായി സ്നേഹിക്കാന്‍ കഴിയില്ലെന്ന വിശ്വാസത്തില്‍ ഞാന്‍ ഉറച്ചു.. ഞാന്‍ അവസാനം കണ്ടെത്തിയ നിധിയും കയ്യില്‍ നിന്ന് നഷ്ട്ടപെട്ടു... എനിക്ക് ദൈവവും ദൈവത്തിനു ഞാനും മാത്രം... മനുഷ്യര്‍ക്ക് ആത്മാര്‍ഥമായി സ്നേഹിക്കാന്‍ പറ്റില്ലെങ്കില്‍ പിന്നെ എന്തിനു ഈ മനുഷ്യരെ നാം സ്നേഹിക്കണം എന്ന് എന്റെ മനസ് പറയാന്‍ തുടങ്ങി! ഒരികല്‍കുടി, അതും അവസാനമായി ഞാന്‍ തോറ്റു..ഇനി ഇത്തരത്തില്‍ ഒരു പരിക്ഷണം എന്റെ ജീവിതത്തില്‍ ഉണ്ടാവാറില്ല എന്ന് മനസുകൊണ്ട് ആണയിട്ടു... ഒരു ആയിരം...! പക്ഷെ നിന്നെ ഉപേക്ഷിക്കാന്‍ എന്റെ മനസ് പാടുപെടുകയായിരുന്നു...ഹ്രദയം കരയുന്നത് ആദ്യമായി കേട്ടു...! വിങ്ങിപോട്ടുകയയിരുന്നു....! പക്ഷെ, ഞാന്‍ സ്നേഹിക്കുന്ന പെണ്ണ് മറ്റൊരാളെ ഇഷ്ടപെടാന്‍ തുടങ്ങിയാല്‍ എന്ത് ചെയ്യും..? അവള്‍ക്കു ആ സ്നേഹമാണ് കുടുതല്‍ വിലയുള്ളതെന്നു തോന്നിയാലോ.. വാക്കുകളും, അക്ഷരങ്ങള്‍ക്കും അതിനെ പിന്തിരിപ്പിക്കാന്‍ പറ്റുമോ..? എന്റെ അവസ്ഥ അതായിരുന്നു... നിന്റെ ഇഷ്ടത്തെ ഞാന്‍ മനസിലാക്കാന്‍ ശ്രമിച്ചു.. അംഗികരിക്കാന്‍ ശ്രമിച്ചു.. വാക്കുകള്‍കൊണ്ട് പോലും വേദനിപ്പിക്കാതിരിക്കാന്‍ തിരുമാനിച്ചു.... പക്ഷെ നിന്റെ മെസ്സേജ് കണ്ടപ്പോ വിളിച്ചു അശ്വസിപ്പിക്കണമെന്നു തോന്നി... ഹ്രദയം ഉരുകികൊണ്ടാനെങ്കിലും നിന്റെ തിരുമാനങ്ങള്‍ക്ക് ഞാന്‍ എന്നും കുട്ടുണ്ടെന്നു പറയണമെന്ന് തോന്നി... പക്ഷെ പറഞ്ഞപ്പോള്‍ എല്ലാം പറയാന്‍ പറ്റിയില്ല... നിന്റെ കരച്ചില്‍ കേട്ടപ്പോള്‍ നിനക്ക് അവന്‍ വേണ്ട, ഞാന്‍ മതി, ആ ജിവിതം വേണ്ട ഇതാണ് നമ്മുടെതെന്ന് പറഞ്ഞു പോയി... ഉപോക്ഷിക്കാന്‍ അപ്പോഴും ഹൃദയം ഒരുക്കമല്ലായിരുന്നു.. എല്ലാം കാര്‍മേഘങ്ങളും അവസാനിച്ചത് ജൂണ്‍ പതിനെട്ടിനാണ്... പുതിയ ജീവതം തുടങ്ങതിയതുപോലെ.... നിന്നെ പിരിയാന്‍ വയ്യ ജോകുട്ടി.. അത്രക്കും നിന്നെ ഞാന്‍ സ്നേഹിക്കുന്നു... എന്റെ സൌഹൃദത്തിനു ഒത്തിരി പോരായ്മകളുണ്ട്... നിന്നെ വിളിക്കാനും, എഴുതാനും കാണാനും പോലും പറ്റാത്ത അവസ്ഥ... പക്ഷെ നിന്നെ സ്നേഹിക്കാതെ ഓര്‍ക്കാതെ ഇരിക്കുന്ന ഒരു സെക്കണ്ടുമില്ല... നിന്നെ ഒത്തിരി സ്നേഹിക്കുന്നു ... എന്നും നിന്റെ സ്വന്തം... പ്രിന്‍സേട്ടന്‍...

[edit] GNU/Linux fonts

Fonts below works correctly, after applying patches thru package manager.

Get the public key:

cd
wget http://download.savannah.nongnu.org/releases/smc/praveen.key.asc
sudo apt-key add ~/praveen.key.asc (give your password, when asked for)

For synaptic in Ubundu add following repository URI details:

http://download.savannah.nongnu.org/releases/smc/debian
etch
main

For more details and options visit SMC.

[edit] Meera_g02

  • Even Thickness
  • GNU GPL font with Font Exception for embedding

[edit] Rachana_g02

[edit] MalOTF

[edit] Dyuthi

[edit] Useful Links

[edit] Writing Malayalam in Unicode

[edit] Web based

In case, you cannot install anything, please try one of the following online editors:

[edit] Mozhi Online

Mozhi Online by Raj Nair

[edit] Google Transliteration service

Please go to Google's innovative transliteration page. You don't have to follow any keyboard layout or transliteration scheme. Just type as if you type Manglish in a chat session.

You can avail the same service at Orkut as well. Select Malayalam as your language you speak in your profile (not in settings). Once that is updated, you will see an extra option list above the scarp writing place.

[edit] Quillpad

http://quillpad.in/malayalam/

[edit] ഇളമൊഴി

Anthony Deign's ഇളമൊഴി has a online interface for basic Mozhi scheme. It instantaneously converts manglish text to Unicode while you type.

[edit] Varamozhi Online

Varamozhi editor is available online at any of the following mirrors. It has the complete rule-set of the Varamozhi Editor. However, the conversion is not instantaneous. You need to press convert for the manglish text to be converted to Unicode.

[edit] Microsoft Windows

[edit] Mozhi Keyman

Use Mozhi Keyman to type Malayalam directly in any application.

  1. Go to the download page
  2. Wait 15 seconds for the download to start
  3. Save the file to Desktop
  4. Open/run the downloaded file and complete the installation
  5. You will notice on the right side of the task bar, a diamond shaped icon with the letter 'K'
  6. Now installation is complete.

To verify everything is proper,

  1. go to Google.com
  2. Click on K icon and select 'Mozhi Keymap' to write in Malayalam. The icon will turn to 'ക'.
  3. Start writing in the search area in Manglish as per Mozhi scheme
  4. When you are done, click on the 'ക' icon and select 'No Keyman'

[edit] Using Varamozhi Editor

Install the editor first. After typing in what you wanted to write, just click File menu and select Export to UTF8 (unicode).

[edit] Enhanced Inscript

To type in using a Malayalam keyboard, use the Inscript Keyboard enhanced by including Alt keys. Inscript is a common keyboard layout for Indic Languages by CDAC.

[edit] Baraha

http://www.baraha.com/BarahaIME.htm

[edit] Linux

[edit] Lalitha

Lalitha phonetic keyboard layout.

[edit] Swanalekha

This Swanalekha input method comes with flexible key-mappings and typing suggestion features.

[edit] Links

  1. Wikipedia Help section
  2. Peringodan's Linux 'n Malayalam blog
  3. http://malayalam.web4all.in
  4. http://smc.org.in

[edit] Links

  1. മലയാളം യൂണീകോഡ് എങ്ങനെ റ്റൈപ്പ് ചെയ്യാം?

[edit] Chatting in Malayalam

In Gtalk and MSN one could use Mozhi Keyman directly. But that method does not work in Yahoo ! messenger. Use a third party IM client (eg: Miranda) to connect to yahoo! IM network.

Now It's Possible In Yahoo Messenger All You Need Is Get Yahoo Indic Plugin. Go To This Link And Download It. http://gallery.yahoo.com/apps/2047/locale/en and Read The Instructions.

[edit] Unicode to Manglish conversion

Varamozhi Editor's is using by Perl/Tk which does not have the capability to display Unicode. Also, many windows versions does not have capability to copy Unicoded text from IE to other applications.

  1. In IE click File > Save As...
  2. Set Save type as Text File .txt
  3. Encoding as Unicode(UTF-8)
  4. Save it in My Documents as t.txt
  5. Run cmd

In the command console

  1. cd "My Documents"
  2. "C:\Program Files\Varamozhi Editor\bin\lamvi_unicode.exe" < t.txt | "C:\Program Files\Varamozhi Editor\bin\malvi_mozhi_mathrubhumi.exe" -h > t.html
  3. t.html in My Documents contains converted text in desired font - Mathrubhumi(Matweb) font in this example.

[edit] Old instrucitons

When you have set the font to Unicode, the Malayalam text area will show garbled text. That font option is essentially intended for converting Unicode to Manglish ONLY.

Here are the steps to edit already existing Unicode Malayalam text:

  1. First we need to convert the Unicode text to raw UTF-8. Do ONE of the following work-arounds:
    1. Paste the Unicode text under 'Unicode String:' in this converter and press 'UTF8 Encode'
    2. In FireFox, change View->Character Encoding->Western(ISO-8859-15). By doing this, we essentially make the browser believe that this text is not Unicode. Then it will show all characters in UTF8 representation as it is.
    3. In IE, change View->Character Encoding->Western(ISO-8859). Does not work in IE 7 onwards.
  2. Now you will see the uninterpreted, raw UTF-8 sequence corresponding to the Unicode text
  3. Do Lock->Unlock in Varamozhi Editor for editing in Malayalam window
  4. Copy paste that garbled text by Control-v to Malayalam window
  5. Corresponding manglish will appear in the Manglish window
  6. Now switch the Font to an ASCII fonts like 'Matweb'
  7. Complete your editing

[edit] യുണീക്കോഡിനെ പറ്റി കൂടുതല്‍

[edit] ബിറ്റ്

പടിഞ്ഞാറ്‌ തിരി താഴ്ത്തിയ സൂര്യന്‍‍. പടര്‍‌‍ന്നൊഴുകുന്ന നിലാവു്‌. നിറഞ്ഞുയരുന്ന മുല്ലമണം. ഉമ്മറത്തു് കത്തിനില്‍‌ക്കുന്ന വൈദ്യുതി വിളക്കു്. ആളകത്തുണ്ടെന്നു് അനുമാനിക്കാം. ഇങ്ങനെ, ഒരു സ്വിച്ച്‌ കൊണ്ടു് ഒരു സമയം വിനിമയം ചെയ്യാവുന്ന ഏറ്റവും കുറഞ്ഞ വിവരമാണു് ഒരു ബിറ്റ്‌.

ഒരു സ്വിച്ച്‌ കൊണ്ട്‌ ആകെ രണ്ടു സന്ദേശങ്ങള്‍ കൈമാറാം. ഉദാ: വിളക്കു തെളിഞ്ഞാണെങ്കില്‍ ആളകത്തുണ്ടു്. വിളക്കു കെട്ടാണെങ്കില്‍ ആളകത്തില്ല.

രണ്ടു സ്വിച്ച്‌ ഉണ്ടെങ്കില്‍ നാലാകാം സന്ദേശം. ഉദാ: രണ്ടു വിളക്കും തെളിഞ്ഞാണെങ്കില്‍ ആളകത്തുണ്ട്‌. രണ്ടും കെട്ടാണെങ്കില്‍ ആളകത്തില്ല. ഒന്നാം വിളക്കു തെളിഞ്ഞാണെങ്കില്‍ ഇന്നുണ്ട്‌ നാളെയില്ല. രണ്ടാം വിളക്കു തെളിഞ്ഞാണെങ്കില്‍ ഇന്നില്ല, നാളെയുണ്ട്‌.

രണ്ടിനു പകരം എട്ടാണ്‌ സ്വിച്ചുകളെങ്കിലോ? എട്ട്‌ വിളക്കുകളുടെ കൂട്ടത്തെ 256 വിവിധ രീതികളില്‍ കത്തിച്ചും കെടുത്തിയും കാണിക്കാം. ഉദാ: എട്ടു വിളക്കും ഒരുമിച്ചു കത്തിയാല്‍ ആളകത്തുണ്ട്‌. ഇതില്‍ ഓരോ വിളക്കും ഒരു ബിറ്റിനെ പ്രതിനിധാനം ചെയ്യുന്നു. ഇങ്ങനെയുള്ള എട്ടു ബിറ്റുകളുടെ കൂട്ടത്തെ ഒരു ബൈറ്റ്‌ എന്നു പറയുന്നു.

കൈകൊണ്ട്‌ സ്വിച്ച്‌ പ്രവര്‍ത്തിപ്പിക്കാന്‍ സമയമെടുക്കും. വൈദ്യുതി ഉപയോഗിച്ച്‌ മിന്നല്‍ വേഗത്തില്‍ പ്രവര്‍ത്തിപ്പിക്കാവുന്ന സ്വിച്ചുകളുണ്ട്‌. ഇവയെ ട്രാന്‍സിസ്റ്ററുകള്‍ എന്നു പറയുന്നു. മിന്നല്‍വേഗത്തില്‍ പ്രവര്‍ത്തിക്കുന്ന ലക്ഷക്കണക്കിന്‌ സ്വിച്ചുകള്‍ ഉപയോഗിച്ചാണ്‌ കമ്പ്യൂട്ടറുകള്‍ പ്രവര്‍ത്തിക്കുന്നത്‌.

[edit] UTF-8

യുണീക്കോഡ് ഒരു നമ്പറിംഗ് സ്കീം മാത്രമാണ്. അതായത്‌, മലയാളം ‘അ’-ക്ക്‌ 3333 എന്ന സംഖ്യ. ഒരു സംഖ്യയെ ഈ പറഞ്ഞ ബിറ്റുകള്‍ വച്ച്‌ അവതരിപ്പിക്കുന്ന (representation) ഒരു രീതിയാണ് UTF-8. യുണീക്കോഡ് സ്റ്റാന്റേഡ്, റപ്രസെന്റേഷനെ പറ്റി ഒന്നും പറയുന്നില്ല. ASCII-ടെ 7 ബിറ്റ് റപ്രസെന്റേഷനു പ്രശ്നമൊന്നും ഉണ്ടാക്കാത്തതിനാല്‍ UTF-8 ഇന്റര്‍നെറ്റില്‍ വളരെ പോപ്പുലറായി. എന്നാല്‍ വിവിധ ഓപറേറ്റിങ് സിസ്റ്റങ്ങളുടെ API-കള്‍ യുണീക്കോഡ്‌ ടെക്സ്റ്റ് സംസാരിക്കാന്‍ UTF-8 ഉപയോഗിച്ചുകൊള്ളണമെന്നില്ല. ഉദാഹരണത്തിന് മൈക്രോസോഫ്റ്റ് UTF-32 ആണ് ഉപയോഗിക്കുന്നത്‌.

[edit] Status of Chillu Letters in Unicode

In mid-2005, Unicode consortium had decided to have special encoding for Malayalam chillus. Accordingly Anjali, Varamozhi, Mozhi Keyman (ക) and Vamozhi softwares have adopted that scheme early. After couple of months, Unicode consortium reverted that decision. Correspondingly all the above softwares had to be reverted. The latest versions of all these softwares support current standard (without special encoding) for Chillus. The versions onwhich current standard chillu encoding is available:

Anjali 0.730
Varamozhi 1.3.3
Mozhi Keyman 1.1.0
Karthika keyboard in Vamozhi 2.6.0
Rachana any version
Karthika any version

Update: Last week, UTC has decided to encode Chillu letters for ന, ണ, ല, ള/ഴ, റ/ര, ക

-Cibu 21:04, 2 June 2006 (UTC)

[edit] Malayalam rendering in Mac OS X

As of today it does not work. With AnjaliOldLipi or Rachana, Safari displays Malayalam characters; but not conjuncts or reordering. So it is very difficult to read Malayalam text. Firefox won't even do that. It will display array of question marks.

The problem could be with the font or rendering engine. The Microsoft's Malayalam specific tables in an opentype font may not be read by the rendering engine. Or the rendering engine does not have the implementation for Malayalam. I don't know which one is the case.

[edit] Mixing Arabic and Malayalam

സാധാരണ യുണികോഡ് ഗദ്യത്തില് അറബിയും മലയാളവും (അല്ലെങ്കില് ഇംഗ്ലീഷോ മറ്റേതെങ്കിലും ഭാഷയോ) ഇടകലര്ത്തിയെഴുതാന് പ്രശ്നമൊന്നുമില്ല. വരികള്, വാചകങ്ങള് എന്നു നോക്കാതെ അറബിയിലുള്ള ഓരോ വാക്കുകളിലും ഈ നിബന്ധന പാലിച്ചാല് മതിയല്ലോ!

ഉദാഹരണത്തിന് “അറബിയില് السلام عليكم (അസ്സലാമു അലൈക്കും) എന്നെഴുതിയാല് Peace to you എന്നാണര്ത്ഥം” എന്ന വാചകത്തില് മൂന്നു ഭാഷകളും നിങ്ങളുടെ സ്ക്രീനില് കാണാമെന്നു പ്രതീക്ഷിക്കുന്നു!

എന്നാലും തുടക്കക്കാര്ക്ക് ഇത് സ്വല്പം ആശയക്കുഴപ്പം ഉണ്ടാക്കാതില്ല. ഇത്തരം വാചകങ്ങള് എഡിറ്റു ചെയ്യുമ്പോള് cursor behaviour സാധാരണ നാം ശീലിച്ചപോലെയാവില്ല. ഉദാഹരണത്തിന് മേല്ക്കാണിച്ച വാചകം ഒരു Editable text field-ലേക്ക് കോപ്പി പേസ്റ്റു ചെയ്തു കര്സര് അതിലൂടെ ഓടിച്ചുനോക്കൂ! അറബി വാക്ക് എത്തുമ്പോള് പെട്ടെന്നു കര്സര് ഒരു right-to-left ചാട്ടം ചാടുന്നതു കാണാം! അതു കഴിയുമ്പോള് തിരിച്ചും!

എന്തായാലും ഈ cursor management യുണികോഡ് അറബിഫോണ്ടുകളും ഓപ്പറേറ്റിങ് സിസ്റ്റവും കൂടി നോക്കിക്കോളും. സാധാരണ ഉപയോക്താവിനേയും ടാവുല്ടെസോഫ്റ്റ് കീമാന് പോലത്തെ പ്രോഗ്രാമുകളേയും സംബന്ധിച്ചിടത്തോളം, ഇതൊരു വലിയ പ്രശ്നമല്ല.

വരമൊഴി തല്ക്കാലം മലയാളം യുണികോഡ് സൃഷ്ടിക്കാനുള്ള പ്രോഗ്രാം ആയി നിലകൊള്ളട്ടെ. വരമൊഴി ഉപയോഗിച്ച് മലയാളം യുണികോഡിലേക്ക് എക്സ്പോര്ട് ചെയ്തതിനു ശേഷം അതില് ആവശ്യമുള്ള അറബി വാക്കുകള് (അല്ലെങ്കില് വരികള് /ഖണ്ഡികകള്) ഏതെങ്കിലും എഡിറ്റര് (ഉദാ: നോട്ട് പാഡ്, വേര്ഡ് പാഡ്, വേര്ഡ് , ഫ്രന്റ്പേജ്, IE ഫോമുകള് തുടങ്ങിയവ...) ഉപയോഗിച്ച് ഇടകലര്ത്തിയെഴുതാവുന്നതാണ്. പക്ഷേ സുഗമമായ, compatibility ഉറപ്പായ ഫലം കിട്ടാന്, എഴുതിച്ചേര്ക്കുന്ന അറബിവാക്കുകളും യുണികോഡില് തന്നെയാണെന്നുറപ്പു വരുത്തുക.

പഴയതരം എന്കോഡിംഗ് ഉപയോഗിക്കുന്ന ഫോണ്ടുകള്‍ (Encoding=Arabic Windows) ഉപയോഗിക്കുമ്പോള്‍ പ്രശ്നങ്ങളുണ്ടാവാം.

യുണികോഡ് വാസ്തവമായും ഒരു യൂണിവേര്സല് സെറ്റ് ആണ്. യുണികോഡില് എഴുതിയിരിക്കുന്ന ഓരോ അക്ഷരത്തിനും അതിന്റെ സ്വന്തം ഭാഷ തിരിച്ചറിയാം. അതുകൊണ്ട് എത്ര ഭാഷ വേണമെങ്കിലും ഒരേ ഖണ്ഡികയില് ഇടകലര്ത്തി ഉപയോഗിക്കാം. വെവ്വേറെയോ ഒരുമിച്ചോ ആ ഭാഷകളൊക്കെ ഉള്പ്പെട്ടിട്ടുള്ള യുണികോഡ് ഫോണ്ട് ഫയലുകള് കമ്പ്യൂട്ടറില് വേണമെന്നു മാത്രം.

ഉപയോഗിക്കുന്ന ആളെ സംബന്ധിച്ചിടത്തോളം അറബിയുടെ പഴയ എന്കോഡിംഗും യുണികോഡ് എന്കോഡിംഗുമായി പ്രകടമായ വ്യത്യാസങ്ങളൊന്നുമില്ല. Windows 3.11 മുതല് ഉപയോഗിച്ചുവരുന്ന അതേ കീബോര്ഡ് തന്നെ യുണികോഡിനും ഉപയോഗിക്കാം. കൂടാതെ Arial, Tahoma, Times New Roman തുടങ്ങിയ മിക്ക വിന്ഡോസ് യുണികോഡ് ഫോണ്ടുകളിലും അറബി, ഗ്രീക്, സിറില്ലിക്, ഹെബ്ര്യൂ, തായ് തുടങ്ങിയ അക്ഷരങ്ങള് സാധാരണനിലയില് തന്നെ ഉള്പ്പെട്ടിട്ടുണ്ട്. അറബിയിലെ Simple, Naskh, Koufi തുടങ്ങിയ കാലിഗ്രാഫി വകഭേദങ്ങള്ക്കും ‘അള്അഃ’ (ﷲ), സജ്ദ (۩), റുബ് എല്ഹിസ്ബ് (۞) , അയാ ഒടുക്കം (۝ ) തുടങ്ങിയ കുര്-ആന് ചിഹ്നങ്ങള്ക്കും ഇതേ ഫോണ്ടുകളില് തന്നെ പ്രത്യേകം സ്ഥാനങ്ങള് കൊടുത്തിട്ടുമുണ്ട്!) (Unicode Arabic Presentation Forms 1 &2) . ഇതൊന്നും പോരാതെ മനോഹരമായി രൂപകല്പന ചെയ്തിട്ടുള്ള നൂറുകണക്കിനു അറബിക് യുണികോഡ് ഫോണ്ടുകളും ഇന്റര്നെറ്റില് തന്നെ ലഭ്യമാണ്.

[edit] Internationalized Domain Names (IDN)

Internationalized Domain Names means displaying web address in Malayalam. Ex: http://കൈപ്പള്ളി.blogspot.com. IE7 can display it in Malayalam itself. You will need to add Malayalam as the first entry in the Internationalized Website Address configuration. This is found near the refresh button. Otherwise, the status bar would show the punycode form of the same website: http://xn--bwc6ba0ba6ewczbc.blogspot.com/.

[edit] Malayalam in J2EE applicaiton

ഒരു J2EE ആപ്ലിക്കേഷനു പൊതുവെ മൂന്നു ഭാഗങളാണുള്ളതു. ഇവ മൂന്നും സുരക്ഷിതമായീ യൂണിക്കോഡ് കൈകാര്യം ചെയ്താല്‍ ആപ്ലിക്കേഷന്‍ പൂര്‍ണ്ണമായും യൂണിക്കോഡ് റെഡി ആയീ എന്നു പറയാം.

  • content കാണിക്കുന്ന പേജുകള്‍
  • content സൂക്ഷിക്കുന്ന ഡാറ്റാബേസ്
  • ഡാറ്റാബേസില്‍ നിന്നും പേജിലേക്കു ഡാറ്റ എത്തിക്കുന്ന ആപ്പളിക്കേഷന്‍ കോഡ്

ഒന്നാമതായീ jsp പേജുകള്‍ യൂണീക്കോടില്‍ സേവ് ചെയ്യുക. എക്ലിപ്സ് എഡിറ്ററില്‍ ഇതു നിസ്സാരമായീ സാധിക്കും. രണ്ടാമതായീ ദാ ഇത്രേം പേജില്‍ ഇടുക:

<%@page pageEncoding="UTF-8"%> <%@page language="java" contentType="text/html;charset=UTF-8"%> 

ഇത്രയുമായാല്‍ പേജ് റെഡി ആയീ. ഇനി പല ഭാഷകളേ സപ്പോര്‍ട് ചെയ്യുന്ന പോര്‍ട്ടലുകള്‍ പൊതുവേ സ്റ്റാ‍റ്റിക് കണ്ടന്റ് property ഫയലുകളില്‍ സൂക്ഷിക്കുക ആണു പതിവു. ഇങനെ ചെയ്യുമ്പോള്‍ യൂണീക്കോട് ഫയലുകളെ അവയുടെ തത്തുല്യ കോടുകളായീ സൂക്ഷിച്ചാലേ jstl പോലെയുള്ള റ്റാഗ് ലൈബ്രറികള്‍ക്കു അതു യൂണിക്കോഡ് ആണെന്നു മനസ്സിലാവൂ. അപ്പോള്‍ പ്രോപര്‍ട്ടി ഫയല്‍ ഉപയോഗിക്കുന്നവര്‍ native2ascii java ടൂള്‍ ഉപയോഗിച്ചു മലയാള‍ത്തിലുള്ള പ്രൊപര്‍ടി ഫയലിനേ ഒരു ascii ഫയല്‍ ആയീ മാറ്റണം. ഇത്രയുമാ‍യാല്‍‍ പേജ് യൂണിക്കൊഡ് കമ്പാറ്റിബിള്‍ ആയീ എന്നു പറയാം. ആപ്ലിക്കേഷന്‍ കോഡും ഡാറ്റാബേസും കൂടി യൂണിക്കോഡ് കമ്പാറ്റിബിള്‍ ആക്കിയാലേ യൂണീക്കോഡ് സപ്പോര്‍ട് പൂര്‍ണ്ണമാവൂ.

[edit] Troubleshooting

Basic instructions: Chintha.com
Detailed instructions: Malayalam Wikipedia
Most comprehensive instruction set: by Viswaprabha

My favourite Malayalam Unicode font is AnjaliOldLipi by Kevin

[edit] Can't read Malayalam in Varamozhi Yahoo! Group

In yahoo mail and groups, you need to select encoding as unicode. In Internet Explorer, it can be done by either Right mouse click->Encoding->Unicode(UTF-8) or by Menu->View->Encoding->Unicode (UTF-8).

[edit] Why are the unicode fonts like Rachana missing?

Unicode fonts like Rachana, Anjali, Nila or ThoolikaUnicode does not have proprietary encoding of Malayalam characters or symbols like ASCII fonts like Matweb or ML-TTKarthika have. For example, അ is encoded with the same code in all these Unicode fonts. So, convert to Unicode (UTF8) menu action is good enough for anyone of them.

[edit] Works in IE, but not in other applications

Please do following steps:

  • Click on Start > Control Panel
  • Open Regional and Language options
  • Click on Languages tab
  • Check/enable install files for complex script. It might ask for Windows Installation CD.
  • Reboot the system

[edit] Varamozhi Editor in Win98 hangs on Unicode conversion

Problem

Varamozhi Editor in Windows 98 hangs when File > Export to Unicode(UTF8) is clicked.

Cause

There are some problems with Varamozhi in Windows 98. Unfortunately, they cannot fixed since there is no developer access to a Windows 98 PC.

Workaround

Once you have typed in the text in Varamozhi Editor, copy paste it to Online Varamozhi Editor for conversion to Unicode.

[edit] Letters disappear below the baseline in Firefox

Symptom

Symptom

Workaround

Please install AnjaliOldLipi font and set it as the default font in Firefox.

[edit] Some Unicode blogs viewed in Firefox have lots of doted circles

  • Solution for the viewer: View that in IE or use Firefox 3.0 beta version. Firefox beta is available from http://ftp.mozilla.org/pub/mozilla.org/firefox/nightly/latest-trunk. Get the file with win32.zip extension and unzip it in a convenient location. Close the existing firefox window and navigate to the unziped directory locate the firefox.exe to execute.
  • Solution for the blogger: This issue happens when the text is formatted with align="justify" or letter-spacing:..em;. Either remove justfy or change that to something else like left/right/center.

[edit] ചില്ലും ചതുരവും!

എല്ലാ ബൂലോഗകാരന്മാരുടേയും കാരികളുടേയും ശ്രദ്ധയ്ക്ക്,


ഇപ്പോള്‍ മലയാളം യുണികോഡ് ഉപയോഗിച്ച് ബ്ലോഗുകള്‍ എഴുതുന്ന ചിലരുടെ ഒന്നോ അതിലധികമോ കമ്പ്യൂട്ടറുകളില്‍ മലയാളം യുണികോഡ് ഘടിപ്പിച്ചിരിക്കുന്നതില്‍ ഒരു ചെറിയ പിശകുണ്ട്.

കഴിഞ്ഞ ജൂലായില്‍(2005) യുണികോഡുകാര്‍ മലയാളത്തിലെ ചില്ലുകള്‍ക്കു വേണ്ടി പ്രത്യേക കോഡ്‌ സ്ഥാനങ്ങള്‍ അനുവദിക്കാന്‍ ആലോചിച്ച് അങ്ങനെ ഭേദഗതി ചെയ്ത ഒരു പുതിയ കോഡുമാപ്പു കൊണ്ടുവന്നിരുന്നു. ഉത്സാഹശാലികളായ നമ്മുടെ കൂട്ടുകാര്‍ ഒട്ടും കാലതാമസമില്ലാതെ ഈ പുതിയ മാറ്റത്തിനനുസരണമായി അഞ്ജലി ഫോണ്ട്, (കെവിന്‍ & സിജി), വാമൊഴി കീമാപ്പ് ( സൂപ്പര്‍ VHS സാം-വറുഗീസ് സാമുവല്‍), ‘ക’ മൊഴി കീമാപ്പ് ( പെരിങ്ങോടന്‍ -രാജ് നായര്‍), വരമൊഴി പ്രോഗ്രാം (സിബു) എന്നിവ പുതുക്കിയെഴുതി.

ഇതനുസരിച്ച് പുതുതായി അന്നു വന്ന വേര്‍ഷനുകള്‍: (2005 July)

KevinSiji's AnjaliOldLipi 0.72 ( ഇതില്‍ OldLipi എന്നത് ഫോണ്ട്ഫയലിന്റെ പഴക്കമല്ല, 'മലയാളത്തിലെ പഴയ ലിപി' എന്നാണര്‍ത്ഥമാക്കുന്നതെന്നു പ്രത്യേകം ശ്രദ്ധിക്കുമല്ലോ)

Sam's Vaamozhi (For Anjali)

Raj's 'Ka' mozhi 1.0.2

Cibu's Varamozhi 1.3.2

നിര്‍ഭാഗ്യവശാലെന്നു പറയാം, രണ്ടുമൂന്നു മാസത്തിനുള്ളില്‍ ചില്ലുകളുടെ ഈ ഭേദഗതി സാങ്കേതികമായ ചില കാരണങ്ങളാല്‍, യുണികോഡ് ഇനിയൊരറിയിപ്പുണ്ടാവുന്നതുവരെ പിന്‍‌വലിച്ചു. അതായത് കാര്യങ്ങള്‍ മുന്‍പുള്ള അതേ അവസ്ഥയിലേക്കു തിരിച്ചുമാറ്റി എന്നര്‍ത്ഥം.

ഇങ്ങനെ വന്നപ്പോള്‍ മേല്‍പ്പറഞ്ഞ പ്രോഗ്രാമുകളും ഇതുപോലെത്തന്നെ തിരിച്ചുമാറ്റാന്‍ നാം നിര്‍ബന്ധിതരായി. അങ്ങനെ ചെയ്തില്ലെങ്കില്‍ ഈ 'വേര്‍ച്ചില്ലു' വേര്‍ഷനില്‍ നാം തയ്യാ‍റാക്കുന്ന മലയാളവാക്കുകളൊക്കെ കാലാകാലത്തോളം വികടമായി അവശേഷിക്കുവാനുള്ള സാദ്ധ്യതയുണ്ടായിരുന്നു.

അങ്ങനെ 2005 സെപ്റ്റംബറില്‍ താഴെ പറയുന്ന വേര്‍ഷനുകള്‍ നിലവില്‍ വന്നു.

KevinSiji's AnjaliOldLipi 0.73

Raj's 'Ka' mozhi 1.1.0 Beta

Cibu's Varamozhi 1.3.3

എങ്കിലും സണ്ണിച്ചായന്റെ Anjaliക്കു വേണ്ടിയുള്ള കീമാപ്പു മാത്രം സ്വന്തം ജോലിത്തിരക്കുമൂലം അദ്ദേഹത്തിനു മാറ്റിയെഴുതാന്‍ കഴിഞ്ഞില്ല. വാസ്തവത്തില്‍ അതിന്റെ ആവശ്യമുണ്ടായിരുന്നില്ല. കാരണം അദ്ദേഹത്തിന്റെ തന്നെ 'കാര്‍ത്തിക' ഫോണ്ടിനുള്ള മറ്റൊരു കീമാപ്പ് ഈ മാറ്റങ്ങള്‍ക്കു പകരമായി ഉപയോഗിച്ചാലും ഇതേ ഫലമുണ്ടാക്കുമായിരുന്നു.

മറ്റുള്ളവരാകട്ടെ, ( കെവിനും സിബുവും രാജും), പുതിയ (2005 സെപ്റ്റംബര്‍) വേര്‍ഷനുകളില്‍ സമര്‍ത്ഥമായ ഒരുപായം ചെയ്തു. ചില്ലുകള്‍ക്ക് അവര്‍ പഴയതും പുതിയതും ആയ രണ്ടു സ്ഥാനങ്ങളും നിലനിര്‍ത്തി. ഇതനുസരിച്ച്, ഇനി നാളെ വീണ്ടും ചില്ലുകള്‍ക്ക് പ്രത്യേക സ്വരസ്ഥാനം കൊടുത്താലും പ്രശ്നമുണ്ടാകുകയില്ല എന്നതായിരുന്നു ഇതിലെ നല്ല വശം.

**** **** ****

ഇത്രയും എഴുതിയത് Technical Reasons.

ശരി,ശരി. ഇതിലെ ഭാരിച്ച കാര്യങ്ങളൊന്നും മനസ്സിലാവുന്നില്ല എന്നു തോന്നുന്നുവെങ്കില്‍ ഇനി ‘വെറും കാര്യം‘ പറയാം.

നിങ്ങളില്‍ ചിലര്‍ ഇതിനിടയ്ക്കുള്ള ('വേര്‍ച്ചില്ലു' വേര്‍ഷനുള്ള) ഏതോ പ്രോഗ്രാം ഇപ്പോഴും ഉപയോഗിക്കുന്നുണ്ട്. അതുകൊണ്ട് നിങ്ങള്‍ തയ്യാറാക്കുന്ന മലയാളത്തില്‍ ചില്ലുകള്‍ക്ക് ഒരു ന്യൂനതയും വരുന്നുണ്ട്.

എന്താണെന്നുവെച്ചാല്‍,

അഞ്ജലി ഒഴികെയുള്ള, കാര്‍ത്തികയും മറ്റു യുണികോഡ് ഫോണ്ടുകളും ഉപയോഗിച്ചു കമ്പ്യൂട്ടറുകളില്‍ വായിക്കുന്നവര്‍ക്ക്, നിങ്ങള്‍ എഴുതുന്ന വാക്കുകളില്‍ ചില്ലുകള്‍ക്കു പകരം വെറും ചതുരങ്ങളാണു കാണുക.

അതായത് ‘ര്‍’,‘ല്‍’,‘ള്‍,‘ന്‍’,‘ണ്‍’ - ഈ അക്ഷരങ്ങള്‍ അവര്‍ക്ക് തിരിച്ചറിഞ്ഞു വായിക്കാനാവില്ല!

പക്ഷേ ‘അഞ്ജലി’ ഫോണ്ടുപയോഗിച്ചു വായിക്കുന്ന നിങ്ങളുടെ സ്വന്തം കമ്പ്യൂട്ടറില്‍ ഇവയൊക്കെ ശരിക്കു കണ്ടെന്നും വരാം. അതിനാല്‍ നിങ്ങള്‍ക്കു സ്വയം ഈ തെറ്റു കണ്ടു മനസ്സിലാക്കാനും തിരിച്ചറിയാനും പറ്റുകയുമില്ല!

**** **** ****

എങ്ങനെ സ്വയം പരിശോധിക്കാം?

നിങ്ങളുടേ കമ്പ്യൂട്ടറില്‍ ഈ ന്യൂനതയുണ്ടോ എന്നെങ്ങനെയറിയാം?

തത്കാലത്തേക്ക് Internet Explorer: Tools: Internet Options:General Tab: Fonts: Language Scripts എന്നതില്‍ Malayalam എന്നതു തെരഞ്ഞെടുത്ത്, അതില്‍ വലതുഭാഗത്തുവരുന്ന ലിസ്റ്റില്‍ അഞ്ജലി ഫോണ്ടിനു പകരം കാര്‍ത്തികയോ, രചനയോ, തൂലികയുണികോഡോ ആക്കി OK; OK ക്ലിക്കു ചെയ്ത് തിരിച്ചുവരിക. വേണമെങ്കില്‍ Internet Explorer അടച്ച് വീണ്ടും തുറക്കാവുന്നതാണ്. എന്നിട്ട് നിങ്ങളുടെ തന്നെ ഏതെങ്കിലും ബ്ലോഗ് പോസ്റ്റോ കമന്റോ വായിച്ചുനോക്കുക. ചില്ലുകളുടെ സ്ഥാനത്ത് ചതുരക്കട്ടകളാണു വരുന്നതെങ്കില്‍, പെട്ടു എന്നര്‍ത്ഥം!

നിങ്ങളുടെ തന്നെ പോസ്റ്റു വേണം വായിച്ചുനോക്കാന്‍. വേറെ ആളുകള്‍ എഴുതിയ മലയാളത്തില്‍ ഇതു കണ്ടേക്കാം. അതു നിങ്ങളുടെ പ്രശ്നമല്ല.

ഉറപ്പിനു വേണ്ടി കുറച്ചു ദിവസത്തേക്ക് അഞ്ജലിഫോണ്ടിനെ ഒഴിവാക്കി വെക്കാം. കാരണം അഞ്ജലിഫോണ്ടിന്റെ മിടുക്കു മൂലമാണ് ഈ ഒരു കുറവു നാമറിയാതെ പോകുന്നത്.

*** **** ****



പ്രശ്നം എന്തുകൊണ്ടുണ്ടാവുന്നു?

1. നിങ്ങള്‍ ഉപയോഗിക്കുന്നത് AnjaliOldLipi 0.72 ആയിരിക്കാം.

ഇതറിയാന്‍ ഉള്ള വഴി നിങ്ങളുടെ \Windows\Fonts ഫോള്‍ഡറില്‍ പോയി നോക്കുകയാണ്. അവിടെ ചെന്ന് ഫയലിന്റെ പേര് AnjaliOldLipi-0.730.ttf എന്നുതന്നെയല്ലേ എന്നു നോക്കുക. ഈ ഫയലിന്റെ പുറത്ത് Right-Click ചെയ്താല്‍ 423 KB (433,556 bytes) എന്നു വലിപ്പവും Modified :Saturday, September 24, 2005, 02:12:40 PM എന്നു തീയതിയും കാണിക്കണം.

ഇങ്ങനെതന്നെയാണു കാണുന്നതെങ്കില്‍, പ്രശ്നമില്ല, രണ്ടാമത്തെ സ്റ്റെപ്പിലേക്കു പോകാം.

അതല്ല, ഇതില്‍ എന്തെങ്കിലും വ്യത്യാസമുണ്ടെങ്കില്‍ ഉടനെ തന്നെ ആ ഫോണ്ട് Delete ചെയ്തു കളയുകയോ, ആ ഫോള്‍ഡറില്‍ നിന്നു മാറ്റിയിടുകയോ ചെയ്യണം. എന്നിട്ട് ശരിയായ വേര്‍ഷന്‍ http://varamozhi.sourceforge.net/fonts എന്ന സൈറ്റില്‍ പോയി Download ചെയ്ത് ഈ ഫോള്‍ഡറിലേക്കു തന്നെ ( \Windows\Fonts) കോപ്പി ചെയ്തിടണം.

ഇവിടെ ചിലപ്പോള്‍ ഒരു പ്രശ്നം ഉണ്ടായേക്കാം. പഴയ ഫോണ്ട് ഫയല്‍ ഒരുപക്ഷേ നിങ്ങള്‍ക്ക് Delete ചെയ്യാന്‍ Windows സമ്മതിച്ചില്ലെന്നു വരാം. ഇതിനു കാരണം ആ ലിപി ഇപ്പോഴും കമ്പ്യൂട്ടറിന്റെ മെമ്മറിയിലെ ഒരത്യാവശ്യ ഫോണ്ടായി ഇരിക്കുന്നതുകൊണ്ടാകാം. അതുകൊണ്ട് Delete ചെയ്യുന്നതിനു മുന്‍പ് Internet Explorerല്‍ മുന്നെ പറഞ്ഞ പോലെ മലയാളം ഫോണ്ട് മാറ്റിയിടണം. കൂടാതെ IE യുടെയും തല്‍ക്കാലം ആവശ്യമില്ലാത്ത മറ്റു പ്രോഗ്രാമുകളുടേയും എല്ലാ Window കളും ക്ലോസ് ചെയ്യുകയും വേണം. എന്നിട്ട് വീണ്ടും Delete ചെയ്യാന്‍ ശ്രമിക്കുക.

ഇതു കഴിഞ്ഞാല്‍ അടുത്ത സ്റ്റെപ്പിലേക്കു കടക്കുക.



2. നിങ്ങള്‍ ഉപയോഗിക്കുന്നത് വരമൊഴിയുടെ ഏതെങ്കിലും പഴയ വേര്‍ഷന്‍ ആയിരിക്കാം. (അതായത് 1.3.3 നു മുന്‍പുള്ള ഏതെങ്കിലും വേര്‍ഷന്‍)

വരമൊഴി പ്രോഗ്രാം തുറന്ന് മെനുവില്‍ നിന്നും Help:About എടുത്തു നോക്കിയാല്‍ 1.3.3 എന്നു കാണുന്നുണ്ടോ? ഉണ്ടെങ്കില്‍ അടുത്ത സ്റ്റെപ്പിലേക്കു (3) പോകാം.



അതല്ല, അതിലും കുറഞ്ഞ വേര്‍ഷന്‍ ആണെങ്കിലോ?

ഇതെന്തായാലും പാടില്ല. ഓരോ പുതിയ വേര്‍ഷനിലും വരമൊഴിയില്‍ നാമറിയാത്ത ഒട്ടനവധി മേന്മകള്‍ ചേര്‍ത്തിട്ടുണ്ട്. അതുകൊണ്ട് വരമൊഴിയുടെ പുതിയ പുതിയ വേര്‍ഷനുകള്‍ അപ്പോഴപ്പോള്‍ install ചെയ്യുക എന്നുള്ളത് സാമാന്യയുക്തി മാത്രമാണ്.

ഇതെഴുതുന്ന സമയത്തെ വരമൊഴി വേര്‍ഷന്‍ 1.3.3 ആണ്. മാസങ്ങളോളം രാത്രിയും പകലും അരിച്ചും പെറുക്കിയും നോക്കിയിട്ട് പറയത്തക്ക ഒരു പിശകും കണ്ടിട്ടില്ല ഈ വേര്‍ഷനില്‍. ( അഥവാ എന്തെങ്കിലും പിശകു (Bug) കാണുകയാണെങ്കില്‍ ഉടനെത്തന്നെ varamozhi@yahoogroups.com അല്ലെങ്കില്‍ http://vfaq.blogspot.com അതുമല്ലെങ്കില്‍ cibu@യാഹൂ.കോം വിശദമായ ലക്ഷണങ്ങളോടെ അറിയിക്കേണ്ടത് നിങ്ങളുടെ അവകാശമല്ല, ചുമതലയാണ്). അതിനാല്‍ വരമൊഴി ഉപയോഗിക്കുന്ന ആരും, ഇതു വായിക്കുന്ന ആരും, ഉടനെത്തന്നെ http://varamozhi.sourceforge.net/download എന്ന സൈറ്റില്‍ നിന്നും 1.3.3 വേര്‍ഷന്‍ തന്നെ ശ്രദ്ധയോടെ download ചെയ്യേണ്ടതാണ്.


3. നിങ്ങള്‍ ഉപയോഗിക്കുന്നത് പെരിങ്ങോടന്റെ 'ക' (മൊഴി) കീമാപ്പിന്റെ ഒരു പഴയ വേര്‍ഷന്‍ ആയിരിക്കാം. (1.1.0 നു മുന്‍പുള്ളത്)

വരമൊഴിയ്ക്കു പകരം നേരിട്ട് കമ്പ്യൂട്ടരിലേക്കു ടൈപ്പു ചെയ്യാവുന്ന ഒരു സംവിധാനമാണ് ടാവുല്‍ടെസോഫ്റ്റിന്റെ കീമാന്‍ എന്ന പ്രോഗ്രാം. കീമാന്‍ പ്രവര്‍ത്തിക്കുന്ന ഒരു കമ്പ്യൂട്ടറിന്റെ സ്ക്രീനില്‍ വലതുവശത്ത്‌ ഏറ്റവും കീഴെ TaskBar എന്ന ഭാഗത്ത്‌ ഒരു ഡയമണ്ട്‌ ആകൃതിയില്‍ ഒരു ചെറിയ ഐക്കണ്‍ കാണാം. അതില്‍ മൌസിന്റെ ഇടത്തേ ബട്ടണ്‍ അമര്‍ത്തിയാല്‍ "No Keyman" എന്നും 'ക' Mozhi Keymap എന്നും (ചിലപ്പോള്‍ കൂടുതല്‍ ഓപ്ഷന്‍സും കണ്ടേക്കാം) കാണാം.
ഈ ഐക്കണില്‍ ശ്രദ്ധിച്ചാല്‍ 'ക' കീമാപ്പിന്റെ വേര്‍ഷന്‍ മനസ്സിലാക്കാം. ഇത്‌ Mozhi Keymap 1.1.0 എന്നാണെങ്കില്‍ നിങ്ങള്‍ ഭാഗ്യവാന്‍. അടുത്ത സ്റ്റെപ്പിലേക്കു (4) കടക്കാം.

അതല്ലെങ്കിലോ? ഉടനെത്തന്നെ ഇപ്പോഴുള്ള വേര്‍ഷന്‍ നീക്കം ചെയ്ത്‌ ശരിയായ ഫയല്‍ വരമൊഴി സൈറ്റില്‍ നിന്നും ഇറക്കുമതി ചെയ്ത്‌ കീമാന്‍ പുനസ്ഥാപിക്കുക.

(ഒരു പക്ഷേ ഇക്കാര്യം ചെയ്യാന്‍ windows ഷട്ട്‌ ഡൌണ്‍ ചെയ്ത്‌ Restart ചെയ്യേണ്ടി വന്നേക്കും. അങ്ങനെയെങ്കില്‍ Restart ചെയ്തതിനു ശേഷം വീണ്ടും കീമാന്‍ installation തുടരുക.)



4. നിങ്ങള്‍ ഉപയോഗിക്കുന്നത്‌ സണ്ണിയുടെ 'അഞ്ജലി' കീമാപ്പ്‌ ആയിരിക്കാം.

സണ്ണിയുടെ അഞ്ജലി കീമാപ്പ്‌ (വേര്‍ഷന്‍ 2.6) ആണു നിങ്ങള്‍ ഉപയോഗിക്കുന്നതെങ്കില്‍ ഉടന്‍ തന്നെ ആ രീതി മാറ്റുക. സണ്ണിയുടെ തന്നെ 'കാര്‍ത്തിക' കീമാപ്പ്‌ ഇതിനു പകരം ഉപയോഗിക്കാവുന്നതാണ്‌.


'ചില്ലുകള്‍ക്കു പകരം ചതുരക്കള്ളികളുടെ' പ്രശ്നത്തിന്‌ ഇപ്പറഞ്ഞ നാലു കാരണങ്ങളേ സാധാരണ ഗതിയില്‍ ഉണ്ടാവാന്‍ സാദ്ധ്യത കാണുന്നുള്ളൂ. ഇനി അഥവാ ഈ നാലു കാര്യങ്ങളും ശരിയായിരുന്നിട്ടും നിങ്ങളുടെ സ്ക്രീനില്‍ ഈ വിഷമം കാണുന്നുണ്ടെങ്കില്‍ ദയവുചെയ്ത്‌ ആ വിവരം ഞങ്ങളെ ആരെയെങ്കിലും ( വിശ്വം, സിബു, പെരിങ്ങോടന്‍) അറിയിക്കുവാന്‍ മറക്കരുത്‌.

[edit] Square boxes in place of Unicode chillu

This happens because you are using an old Unicode font without specific encoding for chillu letters. Please uninstall AnjaliOldLipi font, if you have, and follow these instructions.

[edit] Consonant + chandrakkala in place of chillu

Following could be the reasons:

  1. Your Malayalam Unicode font is an old version which does not follow the latest Unicode standard on Chillus. Please install new Unicode malayalam font.
  2. Your Windows PC does not have the latest Uniscribe DLL (usp10.dll). Install latest Uniscribe.
  3. Your PC's operating system is older than Windows 2ooo.
  4. You are using alternate browsers like FireFox whose ability to interact with Uniscribe is slightly limited compared to that of Internet Explorer.

Chillus in previous Unicode encoding standard can be converted to current standard using Varamozhi Editor. Convert old Unicode text to Manglish. Then convert it to Unicode again by clicking File->Convert to Unicode(UTF8).

[edit] /nta/ is displayed as /nra/

ന്റ problem example

Microsoft and others follow differing interpretations of the Unicode 5.0 to produce /nta/ conjunct. The text created by an input tool (example: Mozhi Keyman, Varamozhi Editor), that follows non-microsoft interpretation, will be displayed in Microsoft's Kartika font as /nra/. Today, most of the Malayalam text is written this way.

The work around is to use Rachana or AnjaliOldLipi fonts instead of Kartika. Rachana and AnjaliOldLipi fonts use non-microsoft interpretation.

[edit] Updating Unicode rendering engine

The Unicode rendering engine for Windows is called Uniscribe. It is present in your system as usp10.dll. Microsoft frequently corrects this file for various problems. Installing latest usp10.dll will solve following issues:

  • Dotted circle in front of Chillu letters
    Problem examples
  • Chillu letters appearing as consonant + chandrakkala
  • The word സ്നേഹം appearing as സ്നഹേം

Follow these steps to download and install usp10.dll:

  1. Make sure Install files for complex script... is checked in Control Panel > Regional and Language Options > Languages tab
  2. For some of the readers, the chillu letters will appear as letter+chandrakkala, instead of the proper chillu. If this happens, make sure that you deleted any old AnjaliOldLipi font from the Windows font folder and installed the latest one.
  3. If step 1 did not solve the problem, it could be because you have an older version of usp10.dll file in the Windows/System32 folder. If you have Microsoft Office 2003 or later installed, you need not to proceed further. It comes witha a proper usp10.dll file. Else, proceed to step 3.
  4. Download and unzip this file. Eventhough, this is an exe file you can unzip it. You will find a usp10.cab file. Unzip that too to get the usp10.dll file. Remember the location you saved it.
  5. Download and run this program. You will be asked the location of the new usp10.dll file.
  6. After installation cancel the Windows warning and choose to keep the new file
  7. Restart the computer

[edit] Unreadable text with lot of a's or sequence of numbers

Symptom: The text is displayed as either െയാണെന്നു പ്രഖ്യാപിക്കുകയുഠor &# 3385;&# 3378;&# 3405;&# 3378;&# 3402;&# 3342;&# 3381;&# 3376;&# 3391;&# 3372;

Solution: Make sure the View->Encoding is Unicode(UTF-8). If it is so and the problem persists, follow these steps:

  1. Open 'notepad' by Start->Run->type 'notepad'->OK
  2. Copy and paste the unreadable text in notepad
  3. Click File->Save As
  4. In the 'Save As' window, click on Desktop
  5. Give File name test.html, Save as type All files and Encoding ANSI. Click 'Save'.
  6. On your Desktop, double click on test.html and a browser window will open up.
  7. Make sure the View->Encoding is Unicode(UTF-8)

[edit] Copy from IE to MSWord spoils the Chillu letters

This happens because the format control characters ZWJ, ZWNJ are getting stripped of the text. To solve this do:

On the MSWord Tools menu, click Options, and then click the Complex Scripts tab. Select the Add control characters in Cut and Copy check box.

[edit] Linux: Meera font is too small

Please see Suresh's blog.

[edit] Keyman is unsuable in MSWord and Excel (2003 and like versions)

നാം ടൈപ്പ് ചെയ്യുന്നതിനെ വേര്‍ഡ് അതിന്റെ സ്വന്തം നിലയ്ക്ക് രണ്ടാമതും തിരുത്താന്‍ നോക്കും. വേര്‍ഡിനുള്ളില്‍ മൈക്രോസോഫ്റ്റ് തന്നെ ചേര്‍ത്തിട്ടുള്ള, എങ്കിലും അപര്യാപ്തമായ, മലയാളം ടൈപ്പിങ്ങ് റൂളുകള്‍ ആണ് ഈ ഉപദ്രവം ചെയ്യുന്നത്. ഓപ്‌ഷന്‍സില്‍ പോയി ചില പ്രത്യേക സെറ്റിങ്ങുകള്‍ ചെയ്താല്‍ ചിലപ്പോള്‍ ഇതു മാറിക്കിട്ടാറുണ്ട്. എന്നാലും ഏതൊക്കെ സെറ്റിങ്ങുകള്‍ എന്ന് നോക്കി കണ്ടുപിടിക്കുക സാധാരണ യൂസറെ സംബന്ധിച്ചിടത്തോളം എളുപ്പമല്ല. (ഇതേ പ്രശ്നം എക്സലിലും ഉണ്ട്.)

ഒരു എളുപ്പവഴിയുള്ളത് വേറെ ഏതെങ്കിലും പ്രോഗ്രാം വിന്‍ഡോയില്‍ ടൈപ്പുചെയ്തു തയ്യാറാക്കി വേര്‍ഡിലേക്ക് കോപ്പി/പേസ്റ്റ് ചെയ്യുകയാണ്. ഒരിക്കല്‍ അങ്ങനെ പേസ്റ്റു ചെയ്ത ടെക്സ്റ്റിനെ എന്തായാലും വേര്‍ഡ് സ്വയം തിരുത്തുകയില്ല. ആവശ്യം പോലെ നമുക്ക് ഫോര്‍‌മാറ്റ് ചെയ്തെടുക്കാം.

വിന്‍ഡോസിലെ റൈറ്റ്പാഡ് പ്രോഗ്രാമും ഉപയോഗിക്കാം. അതുമല്ലെങ്കില്‍ ഇന്റര്‍‌നെറ്റ് എക്സ്പ്ലോററിലെ ഒരു ടെക്സ്റ്റ് വിന്‍‌ഡോയും പറ്റും. എങ്കിലും ഇങ്ങനെ ടൈപ്പ് ചെയ്തെടുക്കാന്‍ ഒരു യോജിച്ച പ്രോഗ്രാം മൈക്രോസോഫ്റ്റിന്റെ തന്നെ ഔട്ട്‌ലുക്ക് ആണ്. ഭാഗ്യവശാല്‍ അതില്‍ ഇത്തരം (അനഭിലഷണീയമായ) സ്മാര്‍ട്ട് റൂളുകള്‍ ഇല്ല.

ഒരു New Mail വിന്‍ഡോ തുറക്കുക. അതില്‍ കീമാന്‍ ഉപയോഗിച്ച് ടൈപ്പ് ചെയ്യുക. എന്നിട്ട് ആവശ്യം പോലെ വേര്‍ഡിലേക്ക് കോപ്പി/പേസ്റ്റു ചെയ്യുക.

[edit] Font selection and Chillu display problems in MS Word

Symptoms
  • While using Mozhi Keyman in MSWord, the Malayalam Unicode font is always selected as Kartika. Even when, the font is changed to AnjaliOldLipi through toolbar, it remains Kartika. OR
  • MS Word does not display Chillus even after adding complex script support.

[edit] Solution

[edit] Language settings
  1. go to Start > All Programs > Microsoft Office > Office Tools > Language Settings
  2. Add Malayalam also into the list of enabled languages
[edit] Use styles instead of font change
  1. Click on Format->Styles and Formatting. A right pane, listing all formatting appears.
  2. Click on the Malayalam text in Kartika. The style used will be highlighted on the right pane.
  3. Place mouse on the highligted style. A right pulldown menu will appear on the right side of the style name.
  4. Click on the pulldown menu arrow and select Modify Style
  5. Under Formatting change Kartika to AnjaliOldLipi font
  6. Change Latin to Complex Script
  7. Press OK

[edit] Keyman produces weird words

Symptom:

Text looks like: അത് വേറെ ഒരു ന്ആയയാണെന്നു കരുതി. അതിന്റെ ന്ഏര്ക്കു ക്ഉരച്ചു.

Workaround:

Reboot the PC.

[edit] എന്തുകൊണ്ടാണു Microsoft IIS 6.0 error ASP 0239 (0x80004005) തരുന്നത് ?

Active Server Pages, ASP 0239 (0x80004005)
Cannot process file
UNICODE ASP files are not supported.

Micrsosoft Knowledge Baseല്‍ നിര്‍ദേശിക്കുന്നത് IIS Unicode file നിര്‍മിക്കില്ല എന്നുതന്നെയാണെങ്കിലും, UNICODE IIS നിര്‍മിക്കാന്‍ വഴിയുണ്ട്.

  • 1) ASP ഫയലുകള്‍ UTF-8 ആയി Save ചെയ്യണം. UNICODE ആയി save ചെയ്താല്‍ പ്രവര്‍ത്തിക്കില്ല.
  • 2) ASP pageന്റെ ആദ്യത്തെ വരി ഇതായിരിക്കണം.
<%@ CodePage=65001 %>