<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Unicode on Kavya Manohar</title>
    <link>https://kavyamanohar.com/tags/unicode/</link>
    <description>Recent content in Unicode on Kavya Manohar</description>
    <generator>Hugo</generator>
    <language>en</language>
    <managingEditor>sakhi.kavya@gmail.com (Kavya Manohar)</managingEditor>
    <webMaster>sakhi.kavya@gmail.com (Kavya Manohar)</webMaster>
    <lastBuildDate>Sat, 17 May 2025 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://kavyamanohar.com/tags/unicode/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>The Ghost of ASCII Past</title>
      <link>https://kavyamanohar.com/post/ascii-past/</link>
      <pubDate>Sat, 17 May 2025 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/ascii-past/</guid>
      <description>Indian language computing has evolved from ASCII-based font encoding to Unicode standardization. This article explains how text was represented in Indian languages before Unicode, the problems with ASCII-based fonts, and why Unicode became necessary. It covers various input methods developed for typing Indian languages and demonstrates how Unicode solved the compatibility issues between different systems.&#xA;Table of Contents What is Unicode? Some Hindi (Devanagari) Unicode Characters Unicode is more than just Codepoints!</description>
    </item>
    <item>
      <title>EMNLP 2024</title>
      <link>https://kavyamanohar.com/post/emnlp/</link>
      <pubDate>Wed, 13 Nov 2024 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/emnlp/</guid>
      <description>Empirical Methods in Natural Language Processing (EMNLP), കമ്പ്യൂട്ടേഷണൽ ലിംഗ്വിസ്റ്റിക്സിന്റെ ലോകോത്തര കോൺഫറൻസ് വേദികളിലൊന്നാണ്. കേരള ഡിജിറ്റൽ യൂണിവേഴ്സിറ്റിയിലെ Virtual Resource Centre for Language Computing (VRCLC) എന്ന ഭാഷാകമ്പ്യൂട്ടിങ്ങ് കേന്ദ്രത്തെ പ്രതിനിധീകരിച്ച് കോൺഫറൻസിൽ പങ്കെടുത്ത് ഒരു പ്രബന്ധം അവതരിപ്പിക്കുകയുണ്ടായി.&#xA;VRCLCയിലെ പ്രാദേശികഭാഷാഗവേഷണം ഇംഗ്ലീഷ് ഭാഷയ്ക്ക് അനുയോജ്യമായ വിധത്തിലുള്ള ഏറ്റവും മികച്ച ആർട്ടിഫിഷൽ ഇന്റലിജൻസ് മോഡലുകളുടെ നിർമ്മാണത്തിൽ ഒരുപാട് ബഹുരാഷ്ട്ര കമ്പനികൾ മത്സരിക്കുന്നുണ്ട്. അതിൽ ചില എഐ മോഡലുകളൊക്കെ ബഹുഭാഷാശേഷിയുള്ളതാണെന്നൊക്കെ അവർ അവകാശപ്പെടുമ്പോഴും അവയിലൊക്കെ കൃത്യത ഉറപ്പുവരുത്താനുള്ള ശ്രമങ്ങൾ പലപ്പോഴും ഉണ്ടാകാറില്ല. ഇംഗ്ലീഷിതര ഭാഷകൾക്കുള്ള ഭാഷാകമ്പ്യൂട്ടിങ്ങ്, സ്പീച്ച് എഐ മോഡലുകളുടെ നിർമ്മാണം ഒക്കെ പല കാരണങ്ങൾ കൊണ്ട് ബുദ്ധിമുട്ടുള്ളതാണ്.</description>
    </item>
    <item>
      <title>എന്താണ് ഓപ്പൺടൈപ്പ് എഞ്ചിനീയറിങ്ങ് ?</title>
      <link>https://kavyamanohar.com/post/opentype-engineering/</link>
      <pubDate>Sun, 24 Feb 2019 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/opentype-engineering/</guid>
      <description>ഗായത്രിയുടെ റിലീസ് കാർഡ് പുറത്തിറങ്ങിയപ്പോൾ മുതൽ പലരും അന്വേഷിക്കുന്നുണ്ട് എന്താണീ ഓപ്പൺടൈപ്പ് എഞ്ചിനീയറിങ്ങ് എന്ന്? ലളിതമായി പരിചയപ്പെടുത്താം. വിശദമായി ഒരു ലേഖനപരമ്പര തന്നെ മുമ്പ് സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് ബ്ലോഗിൽ സന്തോഷിനും രജീഷിനുമൊപ്പം എഴുതിയിട്ടും ഉണ്ട്.&#xA;ഫോണ്ട് എന്ന സോഫ്റ്റ്‌വെയർ ഒരേസമയം കലയുടേയും സാങ്കേതികവിദ്യയുടേയും സമന്വയമാണ്. കലയുടെ അംശം അതിലെ അക്ഷരരൂപങ്ങളുടെ ഡിസൈനിലാണുള്ളത്. ആയിരത്തിഒരുന്നൂറിൽപ്പരം അക്ഷരരൂപങ്ങൾ മലയാളത്തിലെ ഒരു സമഗ്രലിപിസഞ്ചയ ഫോണ്ടിലുണ്ടാവും. ഡിസൈൻ പ്ലാനിനനുസരിച്ച് ഇത് വ്യത്യാസപ്പെടാം, കുറഞ്ഞത് എഴുന്നൂറൊക്കെ ഉണ്ടാകും.&#xA;യൂണിക്കോഡ് മലയാളത്തിലെ അടിസ്ഥാന അക്ഷരങ്ങൾ നമ്മൾ അക്ഷരമാലയായി സ്കൂളിൽ പഠിക്കുന്ന സ്വരങ്ങളും വ്യഞ്ജനങ്ങളും മാത്രമല്ല. മലയാള അക്കങ്ങൾ, ചിഹ്നരൂപങ്ങൾ ഒപ്പം ഇന്നുപയോഗത്തിലില്ലാത്ത പല പുരാതനലിപി രൂപങ്ങളും ഒക്കെചേരുന്നതാണ്.</description>
    </item>
    <item>
      <title>Gayathri: New Malayalam Typeface</title>
      <link>https://kavyamanohar.com/post/gayathri-font/</link>
      <pubDate>Sat, 23 Feb 2019 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/gayathri-font/</guid>
      <description>Swathanthra Malayalam Computing proudly announces Gayathri – a new typeface for Malayalam. Gayathri has its glyphs designed by Binoy Dominic, opentype engineering done by Kavya Manohar and the project coordinated by Santhosh Thottingal.&#xA;This typeface was financially supported by Kerala Bhasha Institute, a Kerala government agency under department of cultural affairs.&#xA;Gayathri is a display typeface, available in Regular, Bold, Thin style variants. It is licensed under Open Font License.</description>
    </item>
    <item>
      <title>Malayalam Phonetic Analyser: Version 1.0.0</title>
      <link>https://kavyamanohar.com/post/mlphon-python-library/</link>
      <pubDate>Wed, 26 Dec 2018 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/mlphon-python-library/</guid>
      <description>Edit (September 20,2022): A detailed report on this is now available as a journal article&#xA;In the previous post, I had shared the work in progress version of a finite state transducer based Malaylam phonetic analyser. A phonetic analyser analyses the written form of the text to give the phonetic characteristics of the grapheme sequence.&#xA;Understanding the phonetic characteristics of a word is helpful in many computational linguistic problems. For instance, translating a word into its phonetic representation is needed in the synthesis of a text to speech (TTS) system.</description>
    </item>
    <item>
      <title>FST based Malayalam Phonetic Analyser</title>
      <link>https://kavyamanohar.com/post/malayalam-phonetic-analyser/</link>
      <pubDate>Tue, 02 Oct 2018 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-phonetic-analyser/</guid>
      <description>Edit (September 20,2022): A detailed report on this is now available as a journal article&#xA;What is a Phonetic analyser? ‘Phoneme’ is the fundamental unit in the the speech system of the language. ‘Grapheme’ is the fundamental unit in the writing system. From one or more graphemes a phoneme can be synthesized. A phonetic analyser analyses the written form of the text to give the phonetic characteristics of the grapheme sequence.</description>
    </item>
    <item>
      <title>Talk on &#39;Malayalam orthographic reforms&#39; at Grafematik 2018</title>
      <link>https://kavyamanohar.com/post/grafematik/</link>
      <pubDate>Thu, 21 Jun 2018 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/grafematik/</guid>
      <description>Santhosh and I presented a paper on &amp;lsquo;Malayalam orthographic reforms: impact on language and popular culture&amp;rsquo; at Graphematik conference held at IMT Atlantique, Brest, France on 14th and 15th of June, 2018. Our session was chaired by Dr. Christa Dürscheid.&#xA;The paper we presented is available here. The video of our presentation is available in youtube.&#xA;Grafematik is a conference, first of its kind, bringing together disciplines concerned with writing systems and their representation in written communication.</description>
    </item>
    <item>
      <title>യൂണിക്കോഡ് പത്താം പതിപ്പ്: മലയാളത്തിന് മൂന്നു പുതിയ കോഡ്പോയിന്റുകൾ കൂടി</title>
      <link>https://kavyamanohar.com/post/unicode10/</link>
      <pubDate>Thu, 22 Jun 2017 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/unicode10/</guid>
      <description>യൂണിക്കോഡിന്റെ പത്താം പതിപ്പ് പുറത്തിറങ്ങി. മലയാളത്തിന്റെ കോഡ് ബ്ലോക്കിലേയ്ക്ക് പുതിയ മൂന്നു അക്ഷരങ്ങൾ കൂടി ഔദ്യോഗികമായി ചേർന്നിരിക്കുന്നു. അങ്ങനെ മലയാളത്തിന്റെ കോഡ് ബ്ലോക്കിൽ 117 അക്ഷരങ്ങൾ ആയി.&#xA;പുതിയ അക്ഷരങ്ങൾ ഇവയാണ്:&#xA;D00 - Combining Anuswara Above 0D3B - Malayalam Sign Vertical Bar Virama 0D3C- Malayalam Sign Circular Virama പ്രാചീനരേഖകളിൽ കണ്ടുവരുന്നവയാണ് ഈ ചിഹ്നങ്ങൾ. അത്തരം ഗ്രന്ഥങ്ങളുടെ ഡിജിറ്റൈസേഷനിലും, പ്രാചീനലിപിസംബന്ധമായ പഠനഗവേഷണങ്ങളിലുമൊക്കെ ഇവ ഉപയോഗിക്കപ്പെട്ടേക്കാം.&#xA;0D00 - Combining Anusvara Above ആദ്യത്തേത് &#39;മുകളിലുള്ള അനുസ്വാരമാണ്&#39;. മലയാളത്തിൽ നാമിന്നുപയോഗിക്കുന്ന അനുസ്വാരത്തിനു തുല്യമായ ഉപയോഗമാണ് പ്രാചീനമലയാളലിപിയിൽ ഈ ചിഹ്നത്തിനുള്ളത്. അതായത് നാമിന്നുപയോഗിക്കുന്ന അനുസ്വാരം മറ്റക്ഷരങ്ങളുടെ അതേ നിരപ്പിൽ തന്നെ കിടന്ന് അതിനിടതുവശത്തുള്ള അക്ഷരത്തോട് &amp;lsquo;മകാരം&amp;rsquo; ചേർക്കുമ്പോളുള്ള ഉച്ചാരണം നൽകുന്നു.</description>
    </item>
  </channel>
</rss>
