<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Posts on Kavya Manohar</title>
    <link>https://kavyamanohar.com/post/</link>
    <description>Recent content in Posts on Kavya Manohar</description>
    <generator>Hugo</generator>
    <language>en</language>
    <managingEditor>sakhi.kavya@gmail.com (Kavya Manohar)</managingEditor>
    <webMaster>sakhi.kavya@gmail.com (Kavya Manohar)</webMaster>
    <lastBuildDate>Sat, 28 Mar 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://kavyamanohar.com/post/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>One Year In</title>
      <link>https://kavyamanohar.com/post/work-anniversary/</link>
      <pubDate>Sat, 28 Mar 2026 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/work-anniversary/</guid>
      <description>March. One year since I joined Adalat AI.&#xA;I have already written about the work itself — the courtrooms, the languages, the gap between benchmarks and real benches. This post is not about that. This is about what happened to life around the job.&#xA;Off the Clock I came in carrying a particular kind of guilt — the kind that early career researchers accumulate quietly over years. The feeling of always being one paper short, one grant proposal behind, perpetually under-delivering against some invisible standard.</description>
    </item>
    <item>
      <title>Recap 2025</title>
      <link>https://kavyamanohar.com/post/2025/</link>
      <pubDate>Thu, 01 Jan 2026 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/2025/</guid>
      <description>My year end note for 2024 ended like this:&#xA;Looking back, there are a lot of unfinished tasks. I want to have a pace up in 2025, personally and professionally. Will update!!&#xA;And yes, life indeed was on a litereal level-up. My first industry job found me. I got into a place where everyone was enthusiastic when I spoke about languages and AI. And started to hear about the intricate space of judiciary.</description>
    </item>
    <item>
      <title>From Benchmarks to Benches</title>
      <link>https://kavyamanohar.com/post/adalat-work/</link>
      <pubDate>Wed, 29 Oct 2025 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/adalat-work/</guid>
      <description>I haven&amp;rsquo;t posted much about my job at Adalat AI. The team I&amp;rsquo;m part of builds dictation systems for the Indian court rooms, and initially, I thought it would be a straightforward extension of my PhD research. I was wrong.&#xA;Unlike academic work where success means beating SOTA on benchmark datasets, the reality at Adalat AI demanded something more: a deep understanding of India&amp;rsquo;s diverse courtroom dynamics, legal workflows, and the intricate linguistic landscape where regional languages and English constantly intertwine.</description>
    </item>
    <item>
      <title>The Ghost of ASCII Past</title>
      <link>https://kavyamanohar.com/post/ascii-past/</link>
      <pubDate>Sat, 17 May 2025 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/ascii-past/</guid>
      <description>Indian language computing has evolved from ASCII-based font encoding to Unicode standardization. This article explains how text was represented in Indian languages before Unicode, the problems with ASCII-based fonts, and why Unicode became necessary. It covers various input methods developed for typing Indian languages and demonstrates how Unicode solved the compatibility issues between different systems.&#xA;Table of Contents What is Unicode? Some Hindi (Devanagari) Unicode Characters Unicode is more than just Codepoints!</description>
    </item>
    <item>
      <title>Malayalam: Life and Praxis - Seminar Series at Tirur</title>
      <link>https://kavyamanohar.com/post/tirur-ai-ml/</link>
      <pubDate>Thu, 20 Feb 2025 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/tirur-ai-ml/</guid>
      <description>A three day National Seminar, &amp;ldquo;Malayalam: Life and Praxis&amp;rdquo;, was organized by the Tirur Regional Centre of Sree Sankaracharya University of Sanskrit during February 18-20, 2025 as a tribute to Dr. Sushama L., Professor on Malayalam Lingustics, who is retiring from her teaching career in this academic year. Dr. Sushama currently serves as the Vice Chancellor of Thunchath Ezhuthachan Malayalam University.&#xA;I was invited to deliver a session on &amp;ldquo;കമ്പ്യൂട്ടർ മനസ്സിലാക്കുന്ന മലയാളഭാഷ&amp;rdquo;.</description>
    </item>
    <item>
      <title>Recap 2024</title>
      <link>https://kavyamanohar.com/post/2024/</link>
      <pubDate>Wed, 01 Jan 2025 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/2024/</guid>
      <description>I write this not for the world, but for me.&#xA;In the first quarter of 2024, I struggled a bit to find an answer to whether I should switch back to the full time faculty position or just continue the current semi-academic reserch position and finally decided to stick with the latter. As the year ends, I gladly realize that the decision saved me from the mundaneness of many academic/administrative chores.</description>
    </item>
    <item>
      <title>EMNLP 2024</title>
      <link>https://kavyamanohar.com/post/emnlp/</link>
      <pubDate>Wed, 13 Nov 2024 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/emnlp/</guid>
      <description>Empirical Methods in Natural Language Processing (EMNLP), കമ്പ്യൂട്ടേഷണൽ ലിംഗ്വിസ്റ്റിക്സിന്റെ ലോകോത്തര കോൺഫറൻസ് വേദികളിലൊന്നാണ്. കേരള ഡിജിറ്റൽ യൂണിവേഴ്സിറ്റിയിലെ Virtual Resource Centre for Language Computing (VRCLC) എന്ന ഭാഷാകമ്പ്യൂട്ടിങ്ങ് കേന്ദ്രത്തെ പ്രതിനിധീകരിച്ച് കോൺഫറൻസിൽ പങ്കെടുത്ത് ഒരു പ്രബന്ധം അവതരിപ്പിക്കുകയുണ്ടായി.&#xA;VRCLCയിലെ പ്രാദേശികഭാഷാഗവേഷണം ഇംഗ്ലീഷ് ഭാഷയ്ക്ക് അനുയോജ്യമായ വിധത്തിലുള്ള ഏറ്റവും മികച്ച ആർട്ടിഫിഷൽ ഇന്റലിജൻസ് മോഡലുകളുടെ നിർമ്മാണത്തിൽ ഒരുപാട് ബഹുരാഷ്ട്ര കമ്പനികൾ മത്സരിക്കുന്നുണ്ട്. അതിൽ ചില എഐ മോഡലുകളൊക്കെ ബഹുഭാഷാശേഷിയുള്ളതാണെന്നൊക്കെ അവർ അവകാശപ്പെടുമ്പോഴും അവയിലൊക്കെ കൃത്യത ഉറപ്പുവരുത്താനുള്ള ശ്രമങ്ങൾ പലപ്പോഴും ഉണ്ടാകാറില്ല. ഇംഗ്ലീഷിതര ഭാഷകൾക്കുള്ള ഭാഷാകമ്പ്യൂട്ടിങ്ങ്, സ്പീച്ച് എഐ മോഡലുകളുടെ നിർമ്മാണം ഒക്കെ പല കാരണങ്ങൾ കൊണ്ട് ബുദ്ധിമുട്ടുള്ളതാണ്.</description>
    </item>
    <item>
      <title>താപസം സെമിനാർ 2024</title>
      <link>https://kavyamanohar.com/post/tapasam/</link>
      <pubDate>Thu, 03 Oct 2024 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/tapasam/</guid>
      <description>താരതമ്യപഠനസംഘം ഒക്ടോബർ 1, 2 തീയതികളിലായി സംഘടിപ്പിച്ച താപസം സെമിനാർ ശ്രീശങ്കരാചാര്യ സംസ്കൃതസർവ്വകലാശാലയിൽ വെച്ച് നടന്നു. ഈ സെമിനാറിൽ &amp;lsquo;യൂണിക്കോഡിലെത്തിയ മലയാളം: ചില ഭാഷാസാംസ്കാരികചിചാരങ്ങൾ&amp;rsquo; എന്ന വിഷത്തിൽ ഞാനവതരിപ്പിച്ച പ്രഭാഷണം ഇവിടെ കൊടുക്കുന്നു.</description>
    </item>
    <item>
      <title>Wav2Vec2-BERT&#43;LM: Transcribing Speech and Evaluating Models using Huggingface Transformers</title>
      <link>https://kavyamanohar.com/post/evaluating-wav2vec2-bert-asr/</link>
      <pubDate>Tue, 20 Aug 2024 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/evaluating-wav2vec2-bert-asr/</guid>
      <description>What is Wav2Vec2-BERT? Wav2Vec2-BERT is a successor of the popular Wav2Vec2 Model, a pre-trained model for Automatic Speech Recognition (ASR). Wav2Vec2-BERT is a 580M-parameters audio model that has been pre-trained on 4.5M hours of unlabeled audio data covering more than 143 languages. Following the basic architecture of Wav2Vec2, with increased pretraining data and slighly different training objectives, various models (XLSR, XLS-R and MMS) with pretrained checkpoints were released.&#xA;Wav2Vec2-BERT pretrained model was introduced in the SeamlessM4T Paper by Meta in August 2023.</description>
    </item>
    <item>
      <title>Indian Languages and Text Normalization: Part 1</title>
      <link>https://kavyamanohar.com/post/indic-normalizer/</link>
      <pubDate>Mon, 06 May 2024 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/indic-normalizer/</guid>
      <description>This is a two part article. The first part will cover how the normalization routine in the popular ASR engine Whisper, removes essential characters like vowel signs in Indian languages while evaluating the performance. The second part (yet to be written) will cover various existing libraries and the approaches needed to perform proper normalization in Indian languages. Text Normalization Text Normalization in natural language processing (NLP) refers to the conversion of different written forms of text to one standardised form.</description>
    </item>
    <item>
      <title>Call me Dr. Kavya 🤩</title>
      <link>https://kavyamanohar.com/post/phd/</link>
      <pubDate>Tue, 05 Mar 2024 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/phd/</guid>
      <description>I was awarded doctoral degree by APJ Abdul Kalam Technological University, Kerala, India.&#xA;You can read my thesis &amp;lsquo;Linguistic challenges in Malayalam speech recognition: Analysis and solutions&amp;rsquo; here.&#xA;Pics from the graduation ceremony hosted by College of Engineering Trivandrum and APJ Abdul Kalam Technological University.</description>
    </item>
    <item>
      <title>Live Dictation: Malayalam speech to text using subword tokens</title>
      <link>https://kavyamanohar.com/post/malayalam-subword-asr/</link>
      <pubDate>Sun, 19 Nov 2023 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-subword-asr/</guid>
      <description>The research carried out as part of my PhD was centred around the linguistic challenges in Malayalam speech recognition. One of the biggest chellenges associated with recognizing speech in morphologically complex languages is centred around how granular should be the text tokens.&#xA;Classical ASR with Word tokens In the classical architecture of Automatic Speech Recognition (ASR) with word tokens, the acoustic model identifies fundamental sound units, the pronunciation lexicon maps sounds to words, and the language model predicts word sequences to convert speech to text.</description>
    </item>
    <item>
      <title>An Open Framework to Build Malayalam Speech to Text System</title>
      <link>https://kavyamanohar.com/post/kerala-science-congress-2023/</link>
      <pubDate>Tue, 28 Feb 2023 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/kerala-science-congress-2023/</guid>
      <description>It was indeed a pleasure to present my paper on An openframework to develop Malayalam Speech to text Systems at the 35th Kerala Science congress held during 10th-14th of February, 2023 at Kuttikkanam, Kerala India. The work was presented in the category of Scientific Social Responsibility and recieved the best oral presentation award in that category.&#xA;The presentation was all about how I ensured openness and transperancy in the development process of speech recognition system for Malayalam done as part of my PhD work Linguistic Challenges in Malayalam Speech Recognition: Analysis and Solutions.</description>
    </item>
    <item>
      <title>How to create a Malayalam Pronuciation Dictionary?</title>
      <link>https://kavyamanohar.com/post/malayalam-phonetic-lexicon/</link>
      <pubDate>Fri, 30 Sep 2022 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-phonetic-lexicon/</guid>
      <description>What is a phonetic lexicon? A pronunciation dictionary or a phonetic lexicon is a list of words and their pronunciation described as a sequence of phonemes. It is an essential component in the training and decoding of speech to text (STT) and text to speech (TTS) systems. A pronunciation dictionary is slightly different from a simple phonetic transcription. It should contain delimiters between phonemes, space is usually the default choice.</description>
    </item>
    <item>
      <title>Mlphon: A Multifunctional Grapheme-Phoneme Conversion Tool Using Finite State Transducers</title>
      <link>https://kavyamanohar.com/post/malayalam-g2p-mlphon-paper/</link>
      <pubDate>Tue, 20 Sep 2022 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-g2p-mlphon-paper/</guid>
      <description>The Mlphon tool I had been working on, for the past couple of years was extensively expanded as part of my research work at College of Engineering Trivandrum. A detailed presentation of the phonemic features of Malayalam, their incorporation as a sequential ruleset in the form of finite state transucers, a quantitative evaluation of the applications of the tool are now available in the article, published by the open access journal, IEEE Access.</description>
    </item>
    <item>
      <title>മനുഷ്യഭാഷ, യന്ത്രബുദ്ധി</title>
      <link>https://kavyamanohar.com/post/sasthragathi/</link>
      <pubDate>Thu, 30 Jun 2022 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/sasthragathi/</guid>
      <description>ശാസ്ത്രഗതി (ജൂൺ 2022) പ്രസിദ്ധീകരിച്ച ലേഖനം&#xA;ആമുഖം മനുഷ്യർക്കു നൈസർഗ്ഗികമായുള ഒരു കഴിവാണ് ഭാഷ. കുഞ്ഞുങ്ങൾ ഏതു ഭാഷയും അവരുടെ പരിസരങ്ങളിൽ നിന്നും സ്വാഭാവികമായി നേടിയെടുക്കുന്നു. ഈ ശേഷി ഒരു കമ്പ്യൂട്ടറിന് കൈവരിക്കാൻ അത്ര എളുപ്പമല്ല. സിനിമാടിക്കറ്റ് ബുക്ക് ചെയ്യാനും, ഭക്ഷണം ഓർഡർ ചെയ്യാനും, മെയിലയക്കാനും, അലാറം വെയ്ക്കാനുമൊക്കെ ഇംഗ്ലീഷ് ഭാഷയിൽ പറഞ്ഞാൽ ചെയ്യാൻ കഴിയുന്ന ഡിജിറ്റൽ അസിസ്റ്റന്റുകളൊക്കെ ഇന്നുണ്ട്. ഇതിനർത്ഥം യന്ത്രങ്ങൾ ഭാഷാശേഷി കൈവരിച്ചുവെന്നാണോ? മലയാളമുൾപ്പെടെയുള്ള മറ്റു ഭാഷകളും കമ്പ്യൂട്ടറുകൾക്കു വഴങ്ങുമോ? അതിനു കൃത്രിമബുദ്ധി ആവശ്യമുണ്ടോ? ഈ വിഷയങ്ങളൊക്കെ പരിശോധിക്കുകയാണ് ഈ ലേഖനത്തിൽ.&#xA;യന്ത്രങ്ങൾക്ക് സ്വയം പഠിക്കാനാകുമോ? ചുറ്റുപാടുമുള്ള ശബ്ദങ്ങൾ പിടിച്ചെടുക്കാനുള്ള ഉപകരണം എല്ലാ ഫോണുകളിലുമുണ്ട്. ആ ശബ്ദത്തിൽ നിന്നും സംസാരം വേർതിരിച്ച്, പറഞ്ഞതെന്തെന്ന് തിരിച്ചറിയാനുള്ള സംവിധാനം പല ഭാഷകളിലും ഇന്ന് സാധ്യമാണ്.</description>
    </item>
    <item>
      <title>Mozhi Malayalam TTS powered by Mlphon and Mlmorph</title>
      <link>https://kavyamanohar.com/post/tts-malayalam/</link>
      <pubDate>Wed, 25 May 2022 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/tts-malayalam/</guid>
      <description>Krishna Sankar recently developed a Malayalam - English bilingual Text to Speech System, Mozhi. Check the web demo page and play around with your choice of words and listen to the natural speech it produces. Krishna has set a future goal of understanding the emotional content of the text and read it out accordingly. This is expected to make the application suitable for audio books. Generating audio for arbitrary speaker with very few training samples is another area he plans to work on.</description>
    </item>
    <item>
      <title>Publishing Malayalam Speech Recognition Model</title>
      <link>https://kavyamanohar.com/post/malayalam-speech-recognition/</link>
      <pubDate>Tue, 19 Oct 2021 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-speech-recognition/</guid>
      <description>Malayalam speech recognition model trained on various openly available speech and text corpora using Kaldi toolkit is now released here. It is now available for testing on the Vosk-Browser Speech Recognition Demo website. This Malayalam model can be used with Vosk speech recognition toolkit which has bindings for Java, Javascript, C# and Python.&#xA;A speech recognition architecture that works best in scenarios of limited speech data availability is called a pipeline model, where it is composed of an acoustic model, a language model and a phonetic lexicon.</description>
    </item>
    <item>
      <title>The language of infinite words</title>
      <link>https://kavyamanohar.com/post/awsar/</link>
      <pubDate>Mon, 01 Mar 2021 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/awsar/</guid>
      <description>I wrote this article for submission to a popular science writing competition by the Department of Science and Technology. Here is my research story, which did not make to grab the award. The story is based on our research on the morphological richness of Malayalam language.&#xA;How many words are there in your language? How many of them do you know? Can you find all those words in a dictionary?</description>
    </item>
    <item>
      <title>Text Speech and Dialogue: TSD 2020</title>
      <link>https://kavyamanohar.com/post/tsd/</link>
      <pubDate>Sat, 12 Sep 2020 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/tsd/</guid>
      <description>I presented a paper on Quantitative Analysis of the Morphological Complexity of Malayalam Language at 23rd International Conference on Text, Speech and Dialogue: TSD 2020, Brno, Czech Republic, September 8–11 2020. The year being 2020, the entire conference happened in remote participation mode.&#xA;Conference proceedings and pre-recorded presentation videos were made available to the participants and we discussed it over online zoom sessions. It was a novel experience and I am super excited about how I got feedbacks and ideas to work on, even after the live sessions.</description>
    </item>
    <item>
      <title>A quantitative analysis of the morphological complexity of Malayalam  </title>
      <link>https://kavyamanohar.com/post/malayalam-morphological-complexity/</link>
      <pubDate>Mon, 07 Sep 2020 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-morphological-complexity/</guid>
      <description>My work, Quantitative Analysis of the Morphological Complexity of Malayalam Language is accepted for presentation at the 23rd International Conference on Text, Speech and Dialogue to be held from September 8-10, 2020. The conference proceedings is published by Springer and you can read the paper here. I will share the presentation slides and video after the conference. See the associated data and code here.&#xA;This blog-post is a bit detailed discussion of the following aspects, analysed in the paper:</description>
    </item>
    <item>
      <title>Releasing Malayalam Speech Corpus</title>
      <link>https://kavyamanohar.com/post/malayalam-speech-corpus/</link>
      <pubDate>Tue, 25 Aug 2020 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-speech-corpus/</guid>
      <description>Originally Published in SMC Blog&#xA;SMC announces the release of Malayalam Speech Corpus (MSC). It is the repository of curated speech samples collected using MSC web application. Speech samples are selected on the criteria that they have at least 3 positive reviews.&#xA;MSC is a project launched by SMC to crowd source Malayalam speech samples from any contributor who can read out sentences and record them as speech samples. The MSC web app has provisions for recording voices and reviewing them.</description>
    </item>
    <item>
      <title>Talks on Speech Recognition Research and Malayalam Computing</title>
      <link>https://kavyamanohar.com/post/research-talks/</link>
      <pubDate>Sun, 05 Jul 2020 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/research-talks/</guid>
      <description>Sharing the videos of two informal interviews I did during the past few months.&#xA;In this video I talk with Hrishikesh Bhaskaran on my involvement with SMC and my projects. This was the part of an interview series hosted by Tinker Hub Foundation.&#xA;In the following video I talk on Speech recognition systems in general, and on the voice corpus initiative by SMC. This interview is hosted by Mujeeb for IB Computing Youtube channel.</description>
    </item>
    <item>
      <title>A few bits of Information</title>
      <link>https://kavyamanohar.com/post/information/</link>
      <pubDate>Tue, 28 Apr 2020 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/information/</guid>
      <description>ഒരു പുസ്തകം മുഴുവനായി വായിച്ചു തീര്‍ക്കുക എന്ന സംഭവം നടന്നിട്ട് ഒരു കൊല്ലത്തിലേറെയായിരുന്നു. ഇന്ന് അത് നടന്നു. മാസങ്ങള്‍ക്കു മുമ്പേ പാതിവഴിയില്‍ നിന്നുപോയ ഒരു പുസ്തകത്തിന് രണ്ടുദിവസം മുമ്പ് വീണ്ടും തുടര്‍ച്ച കണ്ടെടുക്കുകയായിരുന്നു. പോപ്പുലര്‍ സയന്‍സ് ഗണത്തില്‍ പെടുന്ന The Information: A History, a Theory, a Flood എന്ന പുസ്തകമായിരുന്നു അത്. ജെയിംസ് ഗ്ലേക്ക് ആണ് എഴുതിയത്. ഇത് പുസ്തക റിവ്യൂ അല്ല. പക്ഷേ എഞ്ചിനീയറിങ്ങ് ക്ലാസ്സില്‍ പറഞ്ഞ് കേള്‍ക്കാതെ പോകാറുള്ള പലതും ഇതില്‍ കണ്ടു. പ്രത്യേകിച്ചും കണ്ടുപിടുത്തങ്ങളുടെ ചരിത്രവും, സാഹചര്യവും. അദ്ധ്യാപനത്തില്‍ നിന്നും ഒരു ഇടവേളയിലാണ് ഇപ്പോള്‍. ക്ലാസ്സില്‍ സാധാരണ പറയാറില്ലാത്ത ചില ചരിത്രപാഠങ്ങള്‍ ഈ പുസ്തകത്തോട് ചേര്‍ത്ത് ഇവിടെ എഴുതുകയാണ്.</description>
    </item>
    <item>
      <title>Phonetic description of Malayalam consonants</title>
      <link>https://kavyamanohar.com/post/malayalam-ipa-consonants/</link>
      <pubDate>Sat, 18 Jan 2020 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-ipa-consonants/</guid>
      <description>The orthography (system for writing a language) of Malayalam is considered phonemic in nature. It means the graphemes (written symbols) correspond to the phonemes (significant spoken sounds) of the language. But the correspondence between graphemes and phonemes is not precisely one-to-one. The pronunciation of graphemes can depend on its position in a word (word beginning, middle or end) and its proximity to other graphemes.&#xA;It was two years back, I started to work on a grapheme to phoneme conversion tool for Malayalam.</description>
    </item>
    <item>
      <title>നിർമിതബുദ്ധിയുടെ കാലത്തെ ഭാഷാസാങ്കേതികവിദ്യ</title>
      <link>https://kavyamanohar.com/post/language-ai-ml/</link>
      <pubDate>Fri, 13 Sep 2019 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/language-ai-ml/</guid>
      <description>Photo by Markus Spiske on Unsplash&#xA;ജനയുഗം ഓണപ്പതിപ്പിനു വേണ്ടിയെഴുതി പ്രസിദ്ധീകരിച്ച ലേഖനം&#xA;ആമുഖം ഭാഷയുടെ ഉപയോഗത്തെ സാങ്കേതികവിദ്യ വളരെയധികം സ്വാധീനിക്കുന്നുണ്ട്. കൈയിലൊതുങ്ങുന്ന കമ്പ്യൂട്ടിങ്ങ് ഉപകരണങ്ങൾ നിത്യജീവിതത്തിന്റെ ഭാഗമാകുന്ന കാലമാണിത്. അപ്പോൾ മനുഷ്യരോടെന്നപോലെ സ്വാഭാവികമായി അവയോടും സംവദിക്കുന്നതിന്റെ ആവശ്യം വർദ്ധിക്കുന്നു. ആപ്പിളിന്റെ സിരിയും, ആമസോണിന്റെ അലക്സയും ഡിജിറ്റൽ അസിസ്റ്റന്റുകളായി സേവനം തുടങ്ങിക്കഴിഞ്ഞു. വെറും വാചാനിർദ്ദേശങ്ങൾ കൊണ്ട് നമുക്കായി സിനിമാടിക്കറ്റ് ബുക്ക് ചെയ്യാനും, ഭക്ഷണം ഓർഡർ ചെയ്യാനും, മെയിലയക്കാനും, അലാറം വെയ്ക്കാനുമൊക്കെ ഇത്തരം ഡിജിറ്റൽ അസിസ്റ്റന്റുകൾക്ക് ഇന്ന് കഴിയും. വളരെ കണിശമായ പ്രോഗ്രാമിങ്ങ് നിർദ്ദേശങ്ങൾ പ്രകാരം മാത്രം പ്രവർത്തിക്കുന്ന ഉപകരണങ്ങളൊക്കെ ഇവയ്ക്കുമുന്നിൽ വഴിമാറുകയാണ്. ഇംഗ്ലീഷിൽ മാത്രമല്ല, വിപണിസാദ്ധ്യതകൾ കണ്ട് മറ്റു പ്രാദേശികഭാഷകൾ കൂടി പഠിച്ചെടുത്തു തുടങ്ങിയിരിക്കുന്നു ഇത്തരം പേഴ്സണൽ ഡിജിറ്റൽ അസിസ്റ്റന്റുകൾ.</description>
    </item>
    <item>
      <title>Information, Entropy and Malayalam</title>
      <link>https://kavyamanohar.com/post/malayalam-entropy/</link>
      <pubDate>Thu, 18 Jul 2019 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-entropy/</guid>
      <description>It was during my undergraduate course, I was awestruck by the idea that Information is quantifiable. Until then information for me was an abstract term. It still would have been, if not in the realm of information storage, transmission and retreival.&#xA;As a layman we associate the term information to various contexts - text content of books and newspapers, videos from news rooms, speech from telephonic conversations, audio podcasts etc- all contains information.</description>
    </item>
    <item>
      <title>എന്താണ് ഓപ്പൺടൈപ്പ് എഞ്ചിനീയറിങ്ങ് ?</title>
      <link>https://kavyamanohar.com/post/opentype-engineering/</link>
      <pubDate>Sun, 24 Feb 2019 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/opentype-engineering/</guid>
      <description>ഗായത്രിയുടെ റിലീസ് കാർഡ് പുറത്തിറങ്ങിയപ്പോൾ മുതൽ പലരും അന്വേഷിക്കുന്നുണ്ട് എന്താണീ ഓപ്പൺടൈപ്പ് എഞ്ചിനീയറിങ്ങ് എന്ന്? ലളിതമായി പരിചയപ്പെടുത്താം. വിശദമായി ഒരു ലേഖനപരമ്പര തന്നെ മുമ്പ് സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് ബ്ലോഗിൽ സന്തോഷിനും രജീഷിനുമൊപ്പം എഴുതിയിട്ടും ഉണ്ട്.&#xA;ഫോണ്ട് എന്ന സോഫ്റ്റ്‌വെയർ ഒരേസമയം കലയുടേയും സാങ്കേതികവിദ്യയുടേയും സമന്വയമാണ്. കലയുടെ അംശം അതിലെ അക്ഷരരൂപങ്ങളുടെ ഡിസൈനിലാണുള്ളത്. ആയിരത്തിഒരുന്നൂറിൽപ്പരം അക്ഷരരൂപങ്ങൾ മലയാളത്തിലെ ഒരു സമഗ്രലിപിസഞ്ചയ ഫോണ്ടിലുണ്ടാവും. ഡിസൈൻ പ്ലാനിനനുസരിച്ച് ഇത് വ്യത്യാസപ്പെടാം, കുറഞ്ഞത് എഴുന്നൂറൊക്കെ ഉണ്ടാകും.&#xA;യൂണിക്കോഡ് മലയാളത്തിലെ അടിസ്ഥാന അക്ഷരങ്ങൾ നമ്മൾ അക്ഷരമാലയായി സ്കൂളിൽ പഠിക്കുന്ന സ്വരങ്ങളും വ്യഞ്ജനങ്ങളും മാത്രമല്ല. മലയാള അക്കങ്ങൾ, ചിഹ്നരൂപങ്ങൾ ഒപ്പം ഇന്നുപയോഗത്തിലില്ലാത്ത പല പുരാതനലിപി രൂപങ്ങളും ഒക്കെചേരുന്നതാണ്.</description>
    </item>
    <item>
      <title>Gayathri: New Malayalam Typeface</title>
      <link>https://kavyamanohar.com/post/gayathri-font/</link>
      <pubDate>Sat, 23 Feb 2019 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/gayathri-font/</guid>
      <description>Swathanthra Malayalam Computing proudly announces Gayathri – a new typeface for Malayalam. Gayathri has its glyphs designed by Binoy Dominic, opentype engineering done by Kavya Manohar and the project coordinated by Santhosh Thottingal.&#xA;This typeface was financially supported by Kerala Bhasha Institute, a Kerala government agency under department of cultural affairs.&#xA;Gayathri is a display typeface, available in Regular, Bold, Thin style variants. It is licensed under Open Font License.</description>
    </item>
    <item>
      <title>Malayalam Phonetic Analyser: Version 1.0.0</title>
      <link>https://kavyamanohar.com/post/mlphon-python-library/</link>
      <pubDate>Wed, 26 Dec 2018 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/mlphon-python-library/</guid>
      <description>Edit (September 20,2022): A detailed report on this is now available as a journal article&#xA;In the previous post, I had shared the work in progress version of a finite state transducer based Malaylam phonetic analyser. A phonetic analyser analyses the written form of the text to give the phonetic characteristics of the grapheme sequence.&#xA;Understanding the phonetic characteristics of a word is helpful in many computational linguistic problems. For instance, translating a word into its phonetic representation is needed in the synthesis of a text to speech (TTS) system.</description>
    </item>
    <item>
      <title>FST based Malayalam Phonetic Analyser</title>
      <link>https://kavyamanohar.com/post/malayalam-phonetic-analyser/</link>
      <pubDate>Tue, 02 Oct 2018 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/malayalam-phonetic-analyser/</guid>
      <description>Edit (September 20,2022): A detailed report on this is now available as a journal article&#xA;What is a Phonetic analyser? ‘Phoneme’ is the fundamental unit in the the speech system of the language. ‘Grapheme’ is the fundamental unit in the writing system. From one or more graphemes a phoneme can be synthesized. A phonetic analyser analyses the written form of the text to give the phonetic characteristics of the grapheme sequence.</description>
    </item>
    <item>
      <title>ബ്രിട്ടാനിയിൽ, അറ്റ്ലാന്റിക്ക് തീരത്ത് </title>
      <link>https://kavyamanohar.com/post/brittany/</link>
      <pubDate>Mon, 25 Jun 2018 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/brittany/</guid>
      <description>ഫ്രാൻസിന്റെ വടക്കുപടിഞ്ഞാറുള്ള ഒരു പ്രവിശ്യയാണ് ബ്രിട്ടാനി. പേരുകേട്ട യൂറോപ്യൻ നഗരങ്ങളുടെ തിരക്കേതുമില്ല. ഉള്ളത് ചെറുപട്ടണങ്ങളും ഗ്രാമങ്ങളും മാത്രം. പടിഞ്ഞാറ് മത്സ്യസമ്പന്നമായ അറ്റ്ലാന്റിക്ക് സമുദ്രതീരം. കൃഷിയും അനുബന്ധവ്യവസായങ്ങളുമാണ് പ്രധാനവരുമാനം. ബ്രിട്ടാനിയുടെ പടിഞ്ഞാറുള്ള ചെറിയ തീരദേശപട്ടണമാണ് ബ്രെസ്റ്റ്. ലോകഭാഷകളുടെ ലിപിരൂപങ്ങളെക്കുറിച്ചുള്ള ഒരു അന്താരാഷ്ട്ര സമ്മേളനം ബ്രെസ്റ്റിലെ ഒരു യൂണിവേഴ്സിറ്റിയിൽ നടക്കുന്നുണ്ട്. അതിൽ പങ്കെടുക്കാനും പ്രബന്ധമവതരിപ്പിക്കുവാനും സന്തോഷും ഞാനും പോകാൻ തയ്യാറെടുക്കുന്ന കൂട്ടത്തിലാണ് ഫ്രഞ്ച് പ്രവിശ്യയായ ബ്രിട്ടാനിയേക്കുറിച്ച് ഇത്രയുമൊക്കെ മനസ്സിലാക്കിയത്.&#xA;ബ്രെസ്റ്റ് പോർട്ടിനു സമീപം&#xA;വായിച്ചറിഞ്ഞതിലേറെ അത്ഭുതങ്ങൾ ബ്രിട്ടാനി സമ്മാനിച്ചു. ജൂൺ പാതിയിലായിരുന്നു കോൺഫെറൻസ്. ഉത്തരാർദ്ധഗോളത്തിലെ വേനലിന്റെ മൂർദ്ധന്യം. നമ്മുടെ വേനലുമായൊന്നും താരതമ്യം പറ്റില്ല കേട്ടോ. ഇക്കാലത്ത് ബ്രെസ്റ്റിലെ താപനില വെറും 13 മുതൽ 19 ഡിഗ്രി സെൽഷ്യസ് വരെ മാത്രമാണ്.</description>
    </item>
    <item>
      <title>Talk on &#39;Malayalam orthographic reforms&#39; at Grafematik 2018</title>
      <link>https://kavyamanohar.com/post/grafematik/</link>
      <pubDate>Thu, 21 Jun 2018 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/grafematik/</guid>
      <description>Santhosh and I presented a paper on &amp;lsquo;Malayalam orthographic reforms: impact on language and popular culture&amp;rsquo; at Graphematik conference held at IMT Atlantique, Brest, France on 14th and 15th of June, 2018. Our session was chaired by Dr. Christa Dürscheid.&#xA;The paper we presented is available here. The video of our presentation is available in youtube.&#xA;Grafematik is a conference, first of its kind, bringing together disciplines concerned with writing systems and their representation in written communication.</description>
    </item>
    <item>
      <title>u and uː vowel signs of Malayalam</title>
      <link>https://kavyamanohar.com/post/u-vowel-signs-malayalam/</link>
      <pubDate>Sun, 15 Apr 2018 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/u-vowel-signs-malayalam/</guid>
      <description>The reformed or simplified orthographic script style of Malayalam was introduced in 1971 by this government order. This is what is taught in schools. The text book content is also in reformed style. The prevailing academic situation does not facilitate the students to learn the exhaustive and rich orthographic set of Malayalam script. At the same time they observe a lot of wall writings, graffiti, bill-boards and handwriting sticking to the exhaustive orthographic set.</description>
    </item>
    <item>
      <title>Typoday 2018</title>
      <link>https://kavyamanohar.com/post/typoday/</link>
      <pubDate>Sat, 03 Mar 2018 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/typoday/</guid>
      <description>Santhosh and I jointly presented a paper at Typoday 2018. The paper was titled &amp;lsquo;Spiral splines in typeface design: A case study of Manjari Malayalam typeface&amp;rsquo;. The full paper is available here. The presentation is available here.&#xA;Typoday is the annual conference where typographers and graphic designers from academia and industry come up with their ideas and showcase their work. Typoday 2018 was held at Convocation Hall, University of Mumbai.</description>
    </item>
    <item>
      <title>ദൈവങ്ങളുടെ ദ്വീപിൽ ഒരു ഇടവേള</title>
      <link>https://kavyamanohar.com/post/bali/</link>
      <pubDate>Wed, 13 Sep 2017 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/bali/</guid>
      <description>വിനോദയാത്രകൾ ജീവിതത്തിന്റെ അജണ്ടയിലങ്ങനെ കാര്യമായുണ്ടായിരുന്നവയല്ല. താത്പര്യമില്ലാത്തതുകൊണ്ടല്ല, ധൈര്യപ്പെടാത്തതുകൊണ്ട്. കാലം ചില കോലങ്ങളൊക്കെ കെട്ടി ചിലപ്പോഴൊക്കെ നമ്മളെ വല്ലാതെ മിടുക്കരാക്കിക്കളയും. അങ്ങനെയൊരു നിമിഷത്തിലായിരുന്നു പതിവുകൾ വിട്ടു ബാലിയാത്രയ്ക്കൊരു ടിക്കറ്റ് ഞങ്ങളെടുത്തത്. ഒരു മാസത്തെ കാത്തിരുപ്പായിരുന്നു പിന്നെ. കാണാനുള്ള കാഴ്ചകളുടെ ട്രെയിലർ ഷോട്ടുകൾ യാത്രാസഹായികളായ വെബ്സൈറ്റുകൾ ദിവസേന നിരത്തിക്കൊണ്ടിരുന്നു.&#xA;ബാലിയുടെ സ്ഥാനം&#xA;ഇന്തോനേഷ്യൻ ദ്വീപസമൂഹങ്ങൾ പൊതുവിൽ മുസ്ലീം ഭൂരിപക്ഷ പ്രദേശമാണെങ്കിലും അവയ്ക്കിടയിൽ ഹൈന്ദവസംസ്കാരം പേറുന്ന ഒരു ദ്വീപാണ് ബാലി. അയ്യായിരത്തിഎഴുന്നൂറോളം ചതുരശ്ര കിലോമീറ്റർ മാത്രമാണ് ഈ കൊച്ചു ദ്വീപിന്റെ പരപ്പ്. നമ്മുടെ കേരളം ഇതിന്റെ ഏഴിരട്ടിയുണ്ടെന്നോർക്കുക. ചുറ്റോടുചുറ്റുമുള്ള കടലോരങ്ങളുടെ ചാരുത മുതൽ അഗ്നിപർവ്വതങ്ങളുടെ ഗാംഭീര്യം വരെ ഈ ഭൂവിഭാഗം ആവാഹിച്ചിരിക്കുന്നു. ടൂറിസം ഇന്ന് ബാലിയുടെ വലിയ വ്യവസായവും പ്രധാന വരുമാന മാർഗ്ഗവുമാണ്.</description>
    </item>
    <item>
      <title>യൂണിക്കോഡ് പത്താം പതിപ്പ്: മലയാളത്തിന് മൂന്നു പുതിയ കോഡ്പോയിന്റുകൾ കൂടി</title>
      <link>https://kavyamanohar.com/post/unicode10/</link>
      <pubDate>Thu, 22 Jun 2017 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/unicode10/</guid>
      <description>യൂണിക്കോഡിന്റെ പത്താം പതിപ്പ് പുറത്തിറങ്ങി. മലയാളത്തിന്റെ കോഡ് ബ്ലോക്കിലേയ്ക്ക് പുതിയ മൂന്നു അക്ഷരങ്ങൾ കൂടി ഔദ്യോഗികമായി ചേർന്നിരിക്കുന്നു. അങ്ങനെ മലയാളത്തിന്റെ കോഡ് ബ്ലോക്കിൽ 117 അക്ഷരങ്ങൾ ആയി.&#xA;പുതിയ അക്ഷരങ്ങൾ ഇവയാണ്:&#xA;D00 - Combining Anuswara Above 0D3B - Malayalam Sign Vertical Bar Virama 0D3C- Malayalam Sign Circular Virama പ്രാചീനരേഖകളിൽ കണ്ടുവരുന്നവയാണ് ഈ ചിഹ്നങ്ങൾ. അത്തരം ഗ്രന്ഥങ്ങളുടെ ഡിജിറ്റൈസേഷനിലും, പ്രാചീനലിപിസംബന്ധമായ പഠനഗവേഷണങ്ങളിലുമൊക്കെ ഇവ ഉപയോഗിക്കപ്പെട്ടേക്കാം.&#xA;0D00 - Combining Anusvara Above ആദ്യത്തേത് &#39;മുകളിലുള്ള അനുസ്വാരമാണ്&#39;. മലയാളത്തിൽ നാമിന്നുപയോഗിക്കുന്ന അനുസ്വാരത്തിനു തുല്യമായ ഉപയോഗമാണ് പ്രാചീനമലയാളലിപിയിൽ ഈ ചിഹ്നത്തിനുള്ളത്. അതായത് നാമിന്നുപയോഗിക്കുന്ന അനുസ്വാരം മറ്റക്ഷരങ്ങളുടെ അതേ നിരപ്പിൽ തന്നെ കിടന്ന് അതിനിടതുവശത്തുള്ള അക്ഷരത്തോട് &amp;lsquo;മകാരം&amp;rsquo; ചേർക്കുമ്പോളുള്ള ഉച്ചാരണം നൽകുന്നു.</description>
    </item>
    <item>
      <title>സാങ്കേതികവിദ്യാഭ്യാസം :  പരീക്ഷകളിങ്ങനെ മതിയോ?</title>
      <link>https://kavyamanohar.com/post/technical-education-and-exams/</link>
      <pubDate>Thu, 26 Jan 2017 00:00:00 +0000</pubDate><author>sakhi.kavya@gmail.com (Kavya Manohar)</author>
      <guid>https://kavyamanohar.com/post/technical-education-and-exams/</guid>
      <description>കേരള സാങ്കേതിക സര്‍വ്വകലാശാലയുടെ ഒന്നും മൂന്നും സെമസ്റ്ററുകളിലെ പരീക്ഷകള്‍ ഒരുപാട് കോലാഹലങ്ങള്‍ക്കു ശേഷം തുടങ്ങിക്കഴിഞ്ഞു. മൂല്യനിര്‍ണ്ണയശാലകളും സജീവമായിരിക്കുന്നു. ചോദ്യപ്പേപ്പറുകളും അവയുടെ നിലവാരവും മൂല്യനിര്‍ണ്ണയരീതിയും ഒക്കെയാണ് ഞങ്ങള്‍ അദ്ധ്യാപകര്‍ക്കിടയിലിപ്പോള്‍ ചൂടുള്ള ചര്‍ച്ച. &amp;lsquo;പോര്‍ഷന്‍ തീര്‍ത്താല്‍&amp;rsquo; തീരുന്ന പണിയേ തനിക്കുളുവെന്നു കരുതിയിരുന്നവരായിരുന്നു മിക്കവരും. &amp;ldquo;ഒക്കെ ഞാന്‍ പഠിപ്പിച്ചതാ, അവര് പഠിച്ചിരുന്നെങ്കില്‍ ജയിച്ചേനെ&amp;rdquo; അല്ലെങ്കില്‍ &amp;ldquo;നമ്മളെയൊക്കെ ക്ലാസ്സില്‍ പഠിപ്പിച്ചിട്ടാണോ, കാര്യങ്ങളൊക്കെ തനിയേ കണ്ടുപിടിച്ചു പഠിക്കാനുള്ള മടികൊണ്ടാ ഇപ്പോഴത്തെ കുട്ടികളൊക്കെ പരീക്ഷയില്‍ തോല്‍ക്കുന്നേ&amp;rdquo; എന്നുമൊക്കെയുള്ള മാസ്സ് ഡയലോഗടിയ്ക്കാന്‍ അദ്ധ്യാപകർക്കൊന്നും പണ്ടത്തെയെന്നപോലെ ഇപ്പോഴും ഒരു മടിയുമില്ല. വ്യക്തിപരമായ നിരീക്ഷണങ്ങള്‍ നിന്നുള്ള സാമാന്യവല്‍ക്കരണത്തില്‍ തെറ്റുകളുണ്ടന്നു തോന്നിയാല്‍ ചൂണ്ടിക്കാണിക്കുക, തിരുത്താം 😀😊&#xA;തനിയ്ക്ക് ആഴത്തില്‍ ബോധ്യമുള്ള ഒരു കാര്യം മാത്രമേ മറ്റൊരാള്‍ക്കു ബോധിയ്ക്കും വിധം പറഞ്ഞു കൊടുക്കാന്‍ ആര്‍ക്കായാലും പറ്റൂ.</description>
    </item>
  </channel>
</rss>
