I am a researcher at College of Engineering Trivandrum working in the area of Automatic Speech Recognition under the supervision of Dr. A. R. Jayan and Dr. Rajeev Rajan. I am registered at A. P. J. Abdul Kalam Technological University, Kerala. I love to share what I learn and hence this blog.
I used to be a teacher in the field of electronics, signal processing and digital communication. I was employed as Assistant Professor at Govt. Engineering college, Sreekrishnapuram, Palakkad.
I am involved in various projects on Malayalam language computing. An attempt to analyse Malayalam text phonetically using finite state transducers can be seen here. I have had my hands wet in digital type design and open type engineering of a couple of fonts maintained by Swathanthra Malayalam Computing.
I try to engage with the world immediate to me in the possible ways to make life better for everyone around. It was a moment of pride that upon a request filed by me to the Chief Minister of Kerala, the Director of Higher Education Kerala issued a circular clarifying that there exists no regulations to insist the female teaching faculties to adhere to the dress code of saree.
In this blog I write about myself, my projects and whatever I feels like sharing with the world.
A few bits of Information
Posted on April 28, 2020
| Kavya Manohar
ഒരു പുസ്തകം മുഴുവനായി വായിച്ചു തീര്ക്കുക എന്ന സംഭവം നടന്നിട്ട് ഒരു കൊല്ലത്തിലേറെയായിരുന്നു. ഇന്ന് അത് നടന്നു. മാസങ്ങള്ക്കു മുമ്പേ പാതിവഴിയില് നിന്നുപോയ ഒരു പുസ്തകത്തിന് രണ്ടുദിവസം മുമ്പ് വീണ്ടും തുടര്ച്ച കണ്ടെടുക്കുകയായിരുന്നു. പോപ്പുലര് സയന്സ് ഗണത്തില് പെടുന്ന The Information: A History, a Theory, a Flood എന്ന പുസ്തകമായിരുന്നു അത്. ജെയിംസ് ഗ്ലേക്ക് ആണ് എഴുതിയത്. ഇത് പുസ്തക റിവ്യൂ അല്ല. പക്ഷേ എഞ്ചിനീയറിങ്ങ് ക്ലാസ്സില് പറഞ്ഞ് കേള്ക്കാതെ പോകാറുള്ള പലതും ഇതില് കണ്ടു. പ്രത്യേകിച്ചും കണ്ടുപിടുത്തങ്ങളുടെ ചരിത്രവും, സാഹചര്യവും. അദ്ധ്യാപനത്തില് നിന്നും ഒരു ഇടവേളയിലാണ് ഇപ്പോള്. ക്ലാസ്സില് സാധാരണ പറയാറില്ലാത്ത ചില ചരിത്രപാഠങ്ങള് ഈ പുസ്തകത്തോട് ചേര്ത്ത് ഇവിടെ എഴുതുകയാണ്.
[Read More]
Phonetic description of Malayalam consonants
Posted on January 18, 2020
| Kavya Manohar
The orthography (system for writing a language) of Malayalam is considered phonemic in nature. It means the graphemes (written symbols) correspond to the phonemes (significant spoken sounds) of the language. But the correspondence between graphemes and phonemes is not precisely one-to-one. The pronunciation of graphemes can depend on its position in a word (word beginning, middle or end) and its proximity to other graphemes.
It was two years back, I started to work on a grapheme to phoneme conversion tool for Malayalam.
[Read More]
നിർമിതബുദ്ധിയുടെ കാലത്തെ ഭാഷാസാങ്കേതികവിദ്യ
Posted on September 13, 2019
| Kavya Manohar
Photo by Markus Spiske on Unsplash
ജനയുഗം ഓണപ്പതിപ്പിനു വേണ്ടിയെഴുതി പ്രസിദ്ധീകരിച്ച ലേഖനം
ആമുഖം ഭാഷയുടെ ഉപയോഗത്തെ സാങ്കേതികവിദ്യ വളരെയധികം സ്വാധീനിക്കുന്നുണ്ട്. കൈയിലൊതുങ്ങുന്ന കമ്പ്യൂട്ടിങ്ങ് ഉപകരണങ്ങൾ നിത്യജീവിതത്തിന്റെ ഭാഗമാകുന്ന കാലമാണിത്. അപ്പോൾ മനുഷ്യരോടെന്നപോലെ സ്വാഭാവികമായി അവയോടും സംവദിക്കുന്നതിന്റെ ആവശ്യം വർദ്ധിക്കുന്നു. ആപ്പിളിന്റെ സിരിയും, ആമസോണിന്റെ അലക്സയും ഡിജിറ്റൽ അസിസ്റ്റന്റുകളായി സേവനം തുടങ്ങിക്കഴിഞ്ഞു. വെറും വാചാനിർദ്ദേശങ്ങൾ കൊണ്ട് നമുക്കായി സിനിമാടിക്കറ്റ് ബുക്ക് ചെയ്യാനും, ഭക്ഷണം ഓർഡർ ചെയ്യാനും, മെയിലയക്കാനും, അലാറം വെയ്ക്കാനുമൊക്കെ ഇത്തരം ഡിജിറ്റൽ അസിസ്റ്റന്റുകൾക്ക് ഇന്ന് കഴിയും. വളരെ കണിശമായ പ്രോഗ്രാമിങ്ങ് നിർദ്ദേശങ്ങൾ പ്രകാരം മാത്രം പ്രവർത്തിക്കുന്ന ഉപകരണങ്ങളൊക്കെ ഇവയ്ക്കുമുന്നിൽ വഴിമാറുകയാണ്. ഇംഗ്ലീഷിൽ മാത്രമല്ല, വിപണിസാദ്ധ്യതകൾ കണ്ട് മറ്റു പ്രാദേശികഭാഷകൾ കൂടി പഠിച്ചെടുത്തു തുടങ്ങിയിരിക്കുന്നു ഇത്തരം പേഴ്സണൽ ഡിജിറ്റൽ അസിസ്റ്റന്റുകൾ.
[Read More]
Information, Entropy and Malayalam
Posted on July 18, 2019
| Kavya Manohar
It was during my undergraduate course, I was awestruck by the idea that Information is quantifiable. Until then information for me was an abstract term. It still would have been, if not in the realm of information storage, transmission and retreival.
As a layman we associate the term information to various contexts - text content of books and newspapers, videos from news rooms, speech from telephonic conversations, audio podcasts etc- all contains information.
[Read More]
എന്താണ് ഓപ്പൺടൈപ്പ് എഞ്ചിനീയറിങ്ങ് ?
Posted on February 24, 2019
| Kavya Manohar
ഗായത്രിയുടെ റിലീസ് കാർഡ് പുറത്തിറങ്ങിയപ്പോൾ മുതൽ പലരും അന്വേഷിക്കുന്നുണ്ട് എന്താണീ ഓപ്പൺടൈപ്പ് എഞ്ചിനീയറിങ്ങ് എന്ന്? ലളിതമായി പരിചയപ്പെടുത്താം. വിശദമായി ഒരു ലേഖനപരമ്പര തന്നെ മുമ്പ് സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് ബ്ലോഗിൽ സന്തോഷിനും രജീഷിനുമൊപ്പം എഴുതിയിട്ടും ഉണ്ട്.
ഫോണ്ട് എന്ന സോഫ്റ്റ്വെയർ ഒരേസമയം കലയുടേയും സാങ്കേതികവിദ്യയുടേയും സമന്വയമാണ്. കലയുടെ അംശം അതിലെ അക്ഷരരൂപങ്ങളുടെ ഡിസൈനിലാണുള്ളത്. ആയിരത്തിഒരുന്നൂറിൽപ്പരം അക്ഷരരൂപങ്ങൾ മലയാളത്തിലെ ഒരു സമഗ്രലിപിസഞ്ചയ ഫോണ്ടിലുണ്ടാവും. ഡിസൈൻ പ്ലാനിനനുസരിച്ച് ഇത് വ്യത്യാസപ്പെടാം, കുറഞ്ഞത് എഴുന്നൂറൊക്കെ ഉണ്ടാകും.
യൂണിക്കോഡ് മലയാളത്തിലെ അടിസ്ഥാന അക്ഷരങ്ങൾ നമ്മൾ അക്ഷരമാലയായി സ്കൂളിൽ പഠിക്കുന്ന സ്വരങ്ങളും വ്യഞ്ജനങ്ങളും മാത്രമല്ല. മലയാള അക്കങ്ങൾ, ചിഹ്നരൂപങ്ങൾ ഒപ്പം ഇന്നുപയോഗത്തിലില്ലാത്ത പല പുരാതനലിപി രൂപങ്ങളും ഒക്കെചേരുന്നതാണ്.
[Read More]
Gayathri: New Malayalam Typeface
Posted on February 23, 2019
| Kavya Manohar
Swathanthra Malayalam Computing proudly announces Gayathri – a new typeface for Malayalam. Gayathri has its glyphs designed by Binoy Dominic, opentype engineering done by Kavya Manohar and the project coordinated by Santhosh Thottingal.
This typeface was financially supported by Kerala Bhasha Institute, a Kerala government agency under department of cultural affairs.
Gayathri is a display typeface, available in Regular, Bold, Thin style variants. It is licensed under Open Font License.
[Read More]
Malayalam Phonetic Analyser: Version 1.0.0
Posted on December 26, 2018
| Kavya Manohar
Edit (September 20,2022): A detailed report on this is now available as a journal article
In the previous post, I had shared the work in progress version of a finite state transducer based Malaylam phonetic analyser. A phonetic analyser analyses the written form of the text to give the phonetic characteristics of the grapheme sequence.
Understanding the phonetic characteristics of a word is helpful in many computational linguistic problems. For instance, translating a word into its phonetic representation is needed in the synthesis of a text to speech (TTS) system.
[Read More]
FST based Malayalam Phonetic Analyser
Posted on October 2, 2018
| Kavya Manohar
Edit (September 20,2022): A detailed report on this is now available as a journal article
What is a Phonetic analyser? ‘Phoneme’ is the fundamental unit in the the speech system of the language. ‘Grapheme’ is the fundamental unit in the writing system. From one or more graphemes a phoneme can be synthesized. A phonetic analyser analyses the written form of the text to give the phonetic characteristics of the grapheme sequence.
[Read More]
ബ്രിട്ടാനിയിൽ, അറ്റ്ലാന്റിക്ക് തീരത്ത്
Posted on June 25, 2018
| Kavya Manohar
ഫ്രാൻസിന്റെ വടക്കുപടിഞ്ഞാറുള്ള ഒരു പ്രവിശ്യയാണ് ബ്രിട്ടാനി. പേരുകേട്ട യൂറോപ്യൻ നഗരങ്ങളുടെ തിരക്കേതുമില്ല. ഉള്ളത് ചെറുപട്ടണങ്ങളും ഗ്രാമങ്ങളും മാത്രം. പടിഞ്ഞാറ് മത്സ്യസമ്പന്നമായ അറ്റ്ലാന്റിക്ക് സമുദ്രതീരം. കൃഷിയും അനുബന്ധവ്യവസായങ്ങളുമാണ് പ്രധാനവരുമാനം. ബ്രിട്ടാനിയുടെ പടിഞ്ഞാറുള്ള ചെറിയ തീരദേശപട്ടണമാണ് ബ്രെസ്റ്റ്. ലോകഭാഷകളുടെ ലിപിരൂപങ്ങളെക്കുറിച്ചുള്ള ഒരു അന്താരാഷ്ട്ര സമ്മേളനം ബ്രെസ്റ്റിലെ ഒരു യൂണിവേഴ്സിറ്റിയിൽ നടക്കുന്നുണ്ട്. അതിൽ പങ്കെടുക്കാനും പ്രബന്ധമവതരിപ്പിക്കുവാനും സന്തോഷും ഞാനും പോകാൻ തയ്യാറെടുക്കുന്ന കൂട്ടത്തിലാണ് ഫ്രഞ്ച് പ്രവിശ്യയായ ബ്രിട്ടാനിയേക്കുറിച്ച് ഇത്രയുമൊക്കെ മനസ്സിലാക്കിയത്.
ബ്രെസ്റ്റ് പോർട്ടിനു സമീപം
വായിച്ചറിഞ്ഞതിലേറെ അത്ഭുതങ്ങൾ ബ്രിട്ടാനി സമ്മാനിച്ചു. ജൂൺ പാതിയിലായിരുന്നു കോൺഫെറൻസ്. ഉത്തരാർദ്ധഗോളത്തിലെ വേനലിന്റെ മൂർദ്ധന്യം. നമ്മുടെ വേനലുമായൊന്നും താരതമ്യം പറ്റില്ല കേട്ടോ. ഇക്കാലത്ത് ബ്രെസ്റ്റിലെ താപനില വെറും 13 മുതൽ 19 ഡിഗ്രി സെൽഷ്യസ് വരെ മാത്രമാണ്.
[Read More]
Talk on 'Malayalam orthographic reforms' at Grafematik 2018
Posted on June 21, 2018
| Kavya Manohar
Santhosh and I presented a paper on ‘Malayalam orthographic reforms: impact on language and popular culture’ at Graphematik conference held at IMT Atlantique, Brest, France on 14th and 15th of June, 2018. Our session was chaired by Dr. Christa Dürscheid.
The paper we presented is available here. The video of our presentation is available in youtube.
Grafematik is a conference, first of its kind, bringing together disciplines concerned with writing systems and their representation in written communication.
[Read More]