Community project by students of the Faculty of Information Technology, University of Moratuwa, Sri Lanka.

3.2 පරිගනකයෙහි අක්ෂර, සංඛ්‍යාංක හා සංකේත නිරුපණය කරන ආකාරය විශ්ලේෂණය. (Numeric data representation in computers.)

යුනිකේත කේතීකරණය (Unicode encodings)

යුනිකේත අක්ෂර බිට්(bits) වලින් කේත කිරීමේ ක්‍රම ප්‍රධාන වශයෙන් හතරකි .

  • UTF-8

මෙහිදී ඕනෑම ASCII අක්ෂරයක් සඳහා බිට් එකක් භාවිතා කරයි .1920 යන සංඛ්‍යා ව අක්ෂර බිට් 2ක් භාවිතා කර කේතකරණය කරයි .(Roman, Greek, Cyrillic, Coptic, Armenian, Hebrew, Arabic අක්ෂර).63488 යන සංඛ්‍යා ව අක්ෂර බිට් 3ක් භාවිතා කර කේතකරණය කරයි .2147418112 යන සංඛ්‍යා ව අක්ෂර (තවම වෙන් කර නොමැත ) බිට් 4,6,හෝ 6 යොදාගෙන කේතකරණය කළ හැක.

  • UCS-2

සෑම අක්ෂරයක් ම බිට් 16 කේත ඒකකයක් (බිට් 2ක් )ලෙස නිරූපණය කර‍යි . මෙම කේතකරණය මගින් නිරූපණය කළ හැකි වන්නේ මුල් යුනිකේත අක්ෂර  65536 පමණි.

  • UTF-16

මෙය  UCS-2 ක්‍රමයට එකතුකිරීමකි (an extension ). මෙමගින් 1112064 ක් යුනිකේත අක්ෂර නිරූපණය කළ හැකිය .පළමු 65536 යුනිකේත අක්ෂර බිට් දෙකකින් නිරූපණය කරන අතර අනිත් අක්ෂර බිට් 4ක් මගින් නිරූපණය කරයි .

  • UCS-4

සෑම අක්ෂරයක්ම බිට් 4ක් ලෙස නිරූපණය කරයි.අනෙකුත් ක්‍රම සමග සසඳන විට UCS-4 විසින් ඉතා කුඩා සංකුචිත (Compressed) ගොනු නිපදවෙයි. මෙය ඩිස්කය තුළ ඉඩ ඉතිරි  කරගැනීමට මෙන්ම ජාල තුළ දත්ත හුවමාරු කිරීම වේගවත් කර ගැනීමට ද උපයෝගී කර ගත  හැක.  

සිංහල යුනිකේත (Sinhala Unicode)

1998 Seattle, USA හිදී පැවැත්වූ හමුවේ දී සිංහල කේත සටහන ( Code Chart) යුනිකේත අනුවාද 3.0 (Version 3.0 ) ට ඇතුත් කෙරිණි.

image04

 

රචනය : තිවංක මධුභාශ, පාරමී සචින්තිකා, චාමිනි කුමාරසිංහ

සංස්කරණය : අසිකා සුමුදුනි.

Leave a Reply

Your email address will not be published. Required fields are marked *