April 27, 2005

Firefox'ல் என்ன பிரச்சினை?

சமீபத்தில் மதி மற்றும் காசி தத்தம் பதிவுகளில் ஃபயர்ஃபாக்ஸில் ஒழுங்கமைத்த (justified) தமிழ் ஒருங்குறி எழுத்துக்கள் சரியாக தோன்றாமை பற்றி எழுதியுள்ளனர்.
இதற்கு voice on wings (தமிழில் பெயர் வெச்சுக்க கூடாதா?) ஒரு தற்காலிக நிவாரணம் கூறியுள்ளார்.
இந்த பிரச்சினை தமிழுக்கு மட்டுமில்லை ஏனைய இந்திய மொழிகள், தாய், பர்மீஸ், அரபி, ஹீப்ரு போன்ற மொழிகளுக்கும் உண்டு. இந்த மொழிகளை சரியாக காண்பிக்க Complex Text Layout rendering engine தேவைப்படுகிறது. பொதுவாக விண்டோஸில் வரும் மென்பொருட்கள் MS'ன் Uniscribe dll'ஐ பயன்படுத்தி இம்மொழிகளை காண்பிக்கலாம். லினக்ஸில் இதே வேலைக்கு pango பயன்படுத்துகின்றனர். இவை தவிர ICU மற்றும் SIL Graphite'ம் களத்தில் உள்ளனர். (நன்றி voice on wings). மொசில்லா/ஃபயர்ஃபாக்ஸில் லினக்ஸ் வெளியீடில் pango பயன்படுத்தியுள்ளனர். பொதுவாக மற்ற இந்திய மொழிகளை காட்டிலும் மொசில்லா/ஃபயர்ஃபாக்ஸில் தமிழுக்குதான் font support நிறைய. அதனால் தற்போது தமிழ் எழுத்துருவிற்காக custom rendering code தான் உபயோகிக்கிறார்கள். Uniscribe கொண்டு தமிழ் பாவிக்க முடியுமா என்று தெரியவில்லை. இதைப்பற்றி எழுத்துரு பெரும்புள்ளி Jungshik Shinக்கு அஞ்சல் செய்துள்ளேன். நேரம் கிடைக்கும்பொழுது விடையளிப்பார் என நம்புவோம்.

தற்போதைய நிலவரம்:

  • இந்த ஒழுங்கமை (justify) பிரச்சினை எல்லா CTL மொழிகளிலும் உண்டு
  • Uniscribe, Pango support இன்னும் முழுமையாக இல்லை
  • நமக்கு இந்த பிரச்சினை சிறிய ஆனால் பரவலான பிரச்சினைதான். இது மொசில்லா/ஃபயர்ஃபாக்ஸில் உள்ள அடிப்படை குறையாகும்
என்ன செய்யலாம்?
  • Voice on wings கூறியதுதான் சாலச் சிறந்த வழி
  • C/C++ நல்ல தேர்ச்சியுடயவர்கள் மொசில்லா/ஃபயர்ஃபாக்ஸின் மூலத்தில் கை வைக்கவேண்டும், இது மண்டைகாயும் விவகாரம் போல் தெரிகிறது. யாராவது விஷயம் தெரிந்தவர்கள் தலைமை ஏற்றால் நன்றாக இருக்கும். இதுபற்றி தமிழ்லினக்ஸில் போனவருடம் விவாதம் நடந்தது. மேற்கொண்டு ஏதும் நடந்ததாக தெரியவில்லை. இது சம்பந்தமாக வசீகரனுக்கும் அஞ்சல் செய்துள்ளேன்.
  • தமிழ் வலைஞர்கள் தங்கள் ஆக்கங்களில் ஒழுங்கமைக்கும் வசதியை (text-justify) பயன்படுத்துவதை தவிர்க்கலாம்
  • மொசில்லா/ஃபயர்ஃபாக்ஸின் தமிழ் பொதியில் voice on wings சொன்ன userContent.css'ஐ முன்னதாகவே நிறுவி வினியோகிக்கலாம்.

17 comments:

SnackDragon said...

உங்கள் ஆர்வத்துக்கு நன்றி, வாய்ஸ் ஆப் விங்ஸ் சொன்னது போல் எல்லோரும் செய்வோம் இப்போதைக்கு.

Kasi Arumugam said...

யக்ஞா,

நல்ல, தெளிவான நிகழ்நிலைப் பதிவு.

இரண்டாவது சொன்னது செய்ய முடிந்தால் மிகவும் நல்லது, ஆனால் யாரால் முடியும், என்ன செய்யவேண்டும் என்ற தெளிவு இல்லை. எனவே நாலாவதாகச் சொன்னதுக்கு இயன்றவர்கள் முயன்றால் நல்லது. முதல் வழி கணினியில் ஓரளவு விபரம் அறிந்தவர்களுக்கு சரியாக வரும். சாதாரணப் பயனருக்கும் தீர்வு வேண்டும் என்றால் நான்காவது வழியை விரைந்து முயலுவது அவசியம்.

Anonymous said...

யக்ஞா,

நான் ஃபயர் ஃபொக்ஸில் உலாவும் பொழுது உங்களுடையதும், மதியினுடையதும், பத்ரியினுடையதும் வலைப்பதிவுகளில் ஒரு பிரச்சினையும் இன்றி தமிழ் எழுத்துக்கள் தோன்றுகின்றன. ஆனால் நீங்கள் சுட்டும் "" இன் வலைப்பதிவில் எழுதுகளின் ஒழுங்கமைப்பில் பிசகில்லை ஆனஆல் தமிழ் எழுத்துக்கள் குழம்பித் தெரிகின்றன ('து' திரையில் தன வுக்கருகில் தலைகீழ் அரவுடன் தோன்றுகிறது). என் கணனி வின்டோஸ் 98 இரண்டாம் பதிப்பில் இயங்குகிறது எனபது குறிப்பிடத்தக்கது.

நான் எண்ணுவது என்னவென்றால், ஏன் உங்கள் மூவரின் (நீங்கள், மதி, பத்ரி) வலைப்ப்பதிவு நுணுக்கத்தை பிறரும் கையாள முன்மோழியவில்லை?

Anonymous said...

ஆனால் நீங்கள் சுட்டும் "voice on wing" இன் ... என இருத்தல் வேண்டும்

Anonymous said...

//மொசில்லா/ஃபயர்ஃபாக்ஸின் தமிழ் பொதியில் voice on wings சொன்ன userContent.css'ஐ முன்னதாகவே நிறுவி வினியோகிக்கலாம்.
//

ஆம் யக்ஞா,
இதை எளிதாக செய்யலாம், நான் தற்போது சென்னைக்கு மாற்றலாகும் மும்மரத்தில் உள்ளேன். அடுத்த மாதம் (மே மாதம்) சென்னையிலிருந்து, ஒரு விண்டோஸ் பயர்பாக்ஸ் தமிழ் பொதியை (an installable Tamil firefox exe similar to tamil Mozilla exe we released earlier) வெளியிட திட்டமிட்டுள்ளேன்.
அதில் இந்த userContent.css ஐயும் சேர்த்து வெளியிடலாம்.
முடிந்தால் எகலப்பை இல்லாமலே யுனிகோடில் (விண்டோஸ் 98 உட்பட) டைப் செய்யு உதவும் ஒரு பயர்பாக்ஸ் பொதியுடன் வெளியிட முயற்சிப்போம்.

Voice on Wings said...

யக்ஞா, நன்றாக அலசியிருக்கிறீர் :) நீங்கள் சுட்டிய CTL Rendering Engineஐப் பற்றிய கட்டுரை கொஞ்சம் பயனுள்ளதாக இருக்குமென நினைக்கிறேன். Though it's 2 years old, it may offer some conceptual clues on the issues involved. From what i see, FF is not handling 'character-clusters', which is why the consonants and vowels get split when a justify or letter-spacing operation is carried out.

I have a question: "Is FF using Uniscribe DLL or not?" If it is not, then why is MILS (MS Indic Language Support) required to render tamil properly in FF? I tried the justify and letter-spacing operations in MS Word (after installing MILS) and they work perfectly. Then why not FF, which also depends on MILS in some way?

I'm not very much for using Uniscribe / MILS, as it is MS-specific and also, it doesn't extend beyond 2000/XP. A lot of users are still on Win'98 (including myself, at home) and I see no reason why they all should migrate to XP just because some minor text-shaping app is not available / denied on their platform. As an enabled community (what with open source etc.) we have the power to develop such an app and frustrate MS' business strategies :) Hence, my suggestion to explore something like ICU which is supported on a variety of platforms.

Anonymous நண்பரே, என் பதிவு உங்கள் windows98இல் நன்றாகத் தெரியவில்லை என கூறியுள்ளீர். அது நான் அறிந்ததே. ஆனால், மற்ற பதிவுகள் நன்றாகத் தெரிகிறது என்ற செய்தி எனக்கு புதிது. அப்படியானால் என் பதிவையும் சரி செய்கிறேன் :) உங்கள் தகவலுக்கு நன்றி.

காசி,
//முதல் வழி கணினியில் ஓரளவு விபரம் அறிந்தவர்களுக்கு சரியாக வரும். சாதாரணப் பயனருக்கும் தீர்வு வேண்டும் என்றால் நான்காவது வழியை விரைந்து முயலுவது அவசியம்.//
நம் தமிழன்பர்களை குறைவாக மதிப்பிடாதீர் :) I thought it is straight forward, but if required, we can write an 'installer' which would save the CSS file into the right folder. This can be distributed as an exe file.

Yagna said...

நன்றி கார்த்திக், மூர்த்தி.
காசி, முகுந்த் சொல்லியிருப்பதை பாருங்கள். விரைவில் அது நடக்கும் என அறிகிறேன். தாங்கள் சொல்வது போல் முதல் வழி அவ்வளவு சுலபமில்லை, அதேசமயத்தில் அவ்வளவு கஷ்டமுமில்லை.
அநாமதேயம், தாங்கள் சொல்வது கேட்டு சந்தோஷமாக இருக்கிறது. நாங்கள் பயன்படுத்தும் இயங்கு எழுத்துரு தான் காரணமோ என நான் நினைக்கிறேன்.
முகுந்த் நீங்கள் சொல்வதை சீக்கிரம் முடிக்க ஆவன செய்வோம்.
voice on wings, அதெல்லாம் சரி, தமிழில் பெயர் ஏன் வெச்சுக்கல? :-). தங்கள் கேள்விக்கு பதில் கீழே அடுத்த உள்ளீடில்.

Kasi Arumugam said...

//அநாமதேயம், தாங்கள் சொல்வது கேட்டு சந்தோஷமாக இருக்கிறது.//

சந்தோஷம் நீண்ட நேரம் நிலைக்காமல் குலைக்கவேண்டிய இருப்பதற்காக வருந்துகிறேன். ஆனால் மற்ற வலைப்பதிவெல்லாம் சரியாகத் தெரியும் என் win2k பணிநிலையத்தில் (ஹிஹி workstation தான்) இது எப்படித்தெரிகிறது பாருங்க:

இது ஒவ்வொருவர் கணியிலும் நிறுவப்பட்டுள்ள TSC, TSCu, வகை எழுத்துரு, 'லதா' உள்ளதாஎன்ற நிலை, வலைப்பதிவில்என்ன வரிசையில் எழுத்துரு அறிவிப்பு இருக்கிறது என்ற எல்லாவற்றையும் பொறுத்த ஒன்று.எனவே இதற்கு ஒற்றைத் தீர்வு இல்லை.

யக்ஞா, உங்கள் தனிமடலுக்கு நான் நாளைக்குள் ஏற்பாடு செய்கிறேன்.

Voice on Wings said...

யக்ஞா, பேச்சைத் திசை திருப்ப வேண்டாமே என்று உங்கள் 'கேள்விக்கு' விடையளிக்கவில்லை. விடாப்பிடியாகக் கேட்பதால் பிடியும் உமது விடையை :) இது நான் ஆங்கிலத்தில் வலைப்பதிவதற்காக வைத்துக்கொண்டது. அதே பயனர் பெயரை தமிழிலும் பயன்படுத்துகிறேன் :) அதனால் நல்லவேளை, 'வஞ்சிக் கோட்டை வாலிபன்', 'நாடோடி மன்னன்', 'சகலகலா வல்லவன்' போன்ற புனைப்பெயர்களை பார்க்காது நீங்களும் தப்பித்தீர்கள் :)

Coming back to the issue on hand, did you check the attachments in Mozilla bug 218887? Looks like they attempted to use Uniscribe APIs for Mozilla, and their codes are attached. Wondering if it can give us ideas to do something similar with ICU. As a 'VC++ literate' person ;) you maybe able to make better sense out of it, I hope.

Yagna said...

காசி, சரி சரி நமக்குள்ள எதுக்கு இதெல்லாம்:-), என்னுடைய ஆராய்ச்சிகூட winXP/ஃபயர்ஃபாக்ஸிலேயே அப்படிதான் தெரிகிறது.
voice on wings/வ.வா/நா.ம/ச.வ தங்கள் அடக்கத்தை யாம் மெச்சுகிறோம். விஷயத்துக்கு வரேன். அந்த இணைப்பை வெளியிட்ட T.Rowley-க்கு முன்னமே மின்னஞ்சல் செய்துள்ளேன். இந்த ஒட்டு இப்பொது வேலை செய்யுமா என்று கேட்டிருக்கிறேன். பதில் வந்தவுடன் சொல்லாம் என்று நினைத்தேன். தற்போது ஃபயர்ஃபாக்ஸில் indic support கேட்பது ஏன் என்று தாங்கள் கேட்ட கேள்விக்கு விடை இன்னும் கிடைக்கவில்லை. அதாவது எந்த அளவுக்கு MS Indic support'ஐ பயன்படுத்துகிறார்கள் என்று தெரியவில்லை. ICU'வின் சில லைப்ரரிகளைத்தான் pango'வில் உபயோகிக்கிறார்கள். முற்றுமுழுதாக ICU பயன்படுத்துவது என்பது இன்னும் சிக்கலான வேலை. தற்போது கிடைத்துள்ள ஒட்டை பயன்படுத்தவே கொஞ்சம் சிரமம் எடுக்கவேண்டும். மேலோட்டதில் ஒன்றும் பிடிபடவில்லை. என்ன இருந்தாலும் கற்றது கை மன் தானே.

Yagna said...

voice on wings, அந்த ஒட்டை படித்தாகிவிட்டது. இது வரை ஃபயர்ஃபாக்ஸ் குறிமுறையை தொகுத்தது கிடையாது. கொஞ்சம் நேரம் கிடைத்தவுடன் இந்த ஒட்டை முயன்றுபார்த்துவிட்டு சொல்கிறேன். இதற்கு C++ அறிவு போதும். VC++ எல்லாம் தேவையில்லை.

Kasi Arumugam said...

யக்ஞா எனக்கு ஒரு மின்னஞ்சல் தட்ட முடியுமா? இங்கே: akaasi@gmail.com

Voice on Wings said...

Dude, this is your page viewed on my Windows 98 system at home, using Firefox (and yes, I have IE6.0 too, and thanks to it, the usp10.dll as well). Except the title line, the text rendering seems to be reasonably ok. How did you manage this? :) However, unlike what our anonymous friend mentioned, the pages of Mathy and Badri aren't displaying properly on my Win'98 platform.

Maybe we should examine the குறி (i mean code :) ) of your page to get some clues on how to modify the user CSS to display tamil on Win'98 / Me as well.

Anonymous said...

Friends,

I use Netcaptor (www.netcaptor.com) which was the pioneer of tabbed browsing and I am able to see tamil blogs (including the ones which are not ok in Firefox without VOW's CSS files) properly. this is because Netcaptor uses IE's engine underneath.

I am using Netcaptor for last 4-5 years and able to read - TSCII/Unicode and all tamil chars properly.

this is both in WinXP and Win98

Kumar V

Yagna said...

மச்சி[dude தமிழ் பதம்?] voice on wings, நான் ஒரு அரைமணி நேரம் உட்கார்ந்து முட்டி-மோதி என் CSS'ல் தற்போதுள்ள எழுத்துரு வரிசையை நிர்ணயித்தேன். ஆனாலும் சில சமயம் வேலை செய்வதில்லை!

குமார் இந்த உலாவியை பற்றி நான் இப்பொழுது தான் கேள்விப்படுகிறேன். MS'ன் தொழில்நுட்பம் சார்ந்திருந்தால் முன்னேற்றம் இல்லை, ஃபயர்ஃபாக்ஸுக்கு வாங்க :-)

Voice on Wings said...

மச்சி யக்ஞா :), இப்பொ போட்டிருக்கற புது CSS கோப்புல உங்க எழுத்துரு வரிசையத்தான் உபயோகிச்சிருக்கேன்,் ஒரு சிறு மாற்றத்தோட - 'TheneeUni' instead of 'Thenee'. Also added 'Arial' as it is my favorite English font :) இதுவரைக்கும் பாத்த எல்லா தளங்களும் நல்லாத்தான் தெரியுது, பாக்கலாம். What I observed was, it is very important to 'uncheck' the 'Always use my fonts' feature for this font-family to work properly. அதுசரி, பறந்துகிட்டு இருப்பீங்கன்னு நினைச்சேன்? இன்னும் தறையிலதான் இருக்கீங்களா?

Anonymous said...

Firefox-ஐ text-align விஷயத்துல சரிகட்டறதுக்கு ஒரு சின்ன script எழுதி இருக்கேன். இந்த சுட்டியில்: http://www4.brinkster.com/shankarkrupa/blog/default.asp?entryid=42