commit 8c562f0d082f2afd3cfb3517970ed587f4abbab8 Author: Natasha Singh Date: Sat Jul 8 16:36:57 2023 -0400 adding verbs diff --git a/apertium-kfy.kfy.lexd b/apertium-kfy.kfy.lexd index 891d0af..b781599 100644 --- a/apertium-kfy.kfy.lexd +++ b/apertium-kfy.kfy.lexd @@ -50,7 +50,15 @@ Conjunction Adjective Adverb Verb -IrregularVerbs +Verb[pres] PresInfl +Verb[past] PastInfl +Verb[fut1] Fut1Infl +Verb[fut23] Fut23Infl +IrregVerbs +IrregVerbs[pres] PresInfl +IrregVerbs[past] PastInfl +IrregVerbs[fut1] Fut1Infl +IrregVerbs[fut23] Fut23Infl Compound Interjection @@ -91,6 +99,32 @@ LEXICON IrrNounInfl_g LEXICON CaseSuffix :थैं +LEXICON PresInfl +:नू +:छै +:छा +:छो +:नान + +LEXICON PastInfl +:छ +:छ्यो +:छी +:छ्या + +LEXICON Fut1Infl +:>{F1}ल +:>{F1}ला + + +LEXICON Fut23Infl +:ले +:ली +:लो +:ली +:ला + + ############################################################################### ### L E X I C O N ### @@ -181,6 +215,7 @@ LEXICON NounRoot गुलामी:गुलामी[noCase,noPlural] #slavery +मन:मन #mind कानून:कानून #law नीन:नीन #sleep ज्ञान:ज्ञान #knowledge @@ -283,10 +318,6 @@ LEXICON NounRoot प्रजा:प्रजा #citizens (already plural form) -शिष्य:शिष्य #student -लोग:लोग #people -कान:कान #ear -लोगो:लोगो #Dir/LR सुसमाचार:सुसमाचार #good news भीड़:भीड़ #crowd ढिंढोरा:ढिंढोरा #a type of rhythmic drumming @@ -297,16 +328,21 @@ LEXICON NounRoot नान्तिनान:नान्तिनान #Dir/LR - +शिष्य:शिष्य #student +लोग:लोग #people +बातु:बातु #fact +कान:कान #ear +लोगो:लोगो #Dir/LR +विश्वासी:विश्वासी #believer +अविश्वासी:अविश्वासी #non-believer तारा:तारा #star -दाँत:दाँत #teeth -- (multiple plural forms : Reg + Irr) - -शरीर:शरीर #body +दाँत:दाँत #teeth + शरीर:शरीर #body अंग:अंग #organ पिटींग:पिटींग #insect which can fly कीड़ा:कीड़ा #insect @@ -319,7 +355,6 @@ LEXICON NounRoot प्रदेश:प्रदेश #state प्रदेशा:प्रदेशा #Dir/LR (प्रदेश) बात:बात #conversation/matter/fact -बातु:बातु #Dir/LR स्वर्गदूत:स्वर्गदूत #angel घर:घर #home घरा:घरा #Dir/LR (घर) @@ -886,45 +921,86 @@ LEXICON Adverb भितर:भितर #inside / within अब:अब #now उनजै:उनजै #then +बार-बार:बार-बार #repeatedly LEXICON Verb +दफना:दफना #burry +फिर:फिर #move +ठैरा:ठैरा #to stay / stop +ठैरी:ठैरी #to stay / stop +विनती:विनती #request +फाड़:फाड़ #to tear +पछ्याणो:पछ्याणो #to recognize +पछ्याणी:पछ्याणी #to recognize +राज्य:राज्य #rule +नाश:नाश #destroy +रौंद:रौंद #crush / trample +पलट:पलट #to turn / flip +बुना:बुना #to weave +कटना:कटना #to cut +मानी:मानी #to accept / acknowledge +माना:माना #to accept / acknowledge +माफ:माफ #forgive +धो:धो #wash +हाल:हाल #put +जामा:जामा #collect/ store +मेल:मेल #meet +सौंप:सौंप #handover +त्याग:त्याग #resign/ sacrifice +जला:जला #ignite +ढक:ढक #cover +झुक:झुक #bend/ bow +परखी:परखी #examined/ tested +परखा:परखा #examined/ tested +भाग:भाग #run +मरवा:मरवा #make someone kill +मालूम:मालूम #came to know +डण्यून:डण्यून #crying पैद:पैद #to be born लुक:लुक #to hide -बसिना:बसिना #to settle -पकड़:पकड़ #to capture/ arrest +बसिना:बसिना #to settle +पकड़:पकड़ #to capture/ arrest बन्द:बन्द #to close -शुरू:शुरू #to start +शुरू:शुरू #to start फैल:फैल #to spread -जीना:जीना #to live -मनाया:मनाया #to celebrate -खिती:खिती #to throw -कुचली:कुचली #to crush +जीना:जीना #to live +मनाया:मनाया #to celebrate +कुचली:कुचली #to crush उठा:उठा #to pick -ग्यो:ग्यो #to go हुकुम:हुकुम #to order साबित:साबित #to prove हाण:हाण #to jump ढोक:ढोक #to saluted मर:मर #to die -ज्या:ज्या #to become -पैन:पैन #to wore निकल:निकल #to go out -बच:बच #to survive -डर:डर #to fear टल:टल #to delay -पाला:पाला #to get +खिती:खिती #to throw -- remove +ग्यो:ग्यो #to go +ज्या:ज्या #to become कर:कर #to do जा:जा # to go क्योछ:क्योछ #said करून:करून #do root-करs दीछ:दीछ #root-दी हो:हो #to happen +पैन:पैन #to wore +बच:बच #to survive +डर:डर #to fear +पाला:पाला #to get + +चाँ:चाँ[pres,past,fut1,fut23] #want/ wish +चा:चा[pres,past,fut1,fut23] #Dir/LR +देख:देख[pres,past,fut1,fut23] #to see +सक:सक[pres,past,fut1,fut23] #to be able +कहला:कहला[pres,past,fut1,fut23] #called / known +कर:कर[pres,past,fut1,fut23] #to do +आ:आ[pres,past,fut1,fut23] #to come करून:करून #gerund of do पुछून:पुछून #gerund of ask @@ -936,31 +1012,106 @@ LEXICON Verb जाणून:जाणून #gerund of जाण (to know) मरून:मरून #gerund of मरू (to die) ठाड़:ठाड़ #gerund of stand -कुन:कुन #gerund of say +कुन:कुन #gerund of say कईना:कईना #Dir/LR (कुन) ऊँन:ऊँन #gerund of आ (come) सिखून:सिखून #gerund of सिख (to learn) पकड़ना:पकड़ना #gerund of पकड़ (to catch) तोड़ना:तोड़ना #gerund of तोड़ (to break) लेखना:लेखना #gerund of लेख (to write) +दिन:दिन #gerung of दी (to give) +लीना:लीना #gerung of ली (to take) +लीन:लीन #gerung of ली (to take) +देखून:देखून #gerung of देख (to see) + + + + +LEXICON IrregVerbs +छ:छूँ #am +छ:छै #is +छ:छा #are +छ:छन #are +छ:छो +छ:छ्यो #was +छछी #was +छ:छ्या #were + +भ्य:भ्यान #happen/occur +भ्य:भ्योछ #happened/occured in past + +हो:हु[pres] #to happen +हो:हु[past] +हो:हो[fut1,fut23] + +जा:जा[pres] #to go +जा:जा[pres] +जा:ज्यू[fut1] +जा:जा[fut23] +जा:जान +जा:जाया +जा:जौ +जा:जालि #Dir/LR --same as जाली + +कुं:कुं[pres] #to say +कुं:कुं[past] +कुं:क्योछ +कुं:क्यो[fut1] +कुं:कौ[fut23] +कुं:कौ[fut23] +कुं:कुँ +कुं:कये + + +दी:दी[pres] #to give +दी:दी[past] +दी:दीयू[fut1] +दी:दे[fut23] +दी:दीया +दी:दीये +दी:दीनो #same as दीछो +दी:दीनी #same as दीनान +दी:दीयाला #same as देला + + +ली:ली[pres] #to take +ली:ली[past] +ली:लियू[fut1] +ली:ले[fut23] +ली:लियूछो #same as लीछो + +कर:कर +कर:करनै +कर:करि +कर:करछ्य +कर:करूँ +कर:करे +कर:करा +कर:कर्या #Dir/LR --same as करा +कर:करछूँ #Dir/LR --same as करनू +कर:करूनो #Dir/LR --same as करछो +कर:करोलो #Dir/LR --same as करलो + +कहला:कहलाई +कहला:कहलायो +कहला:कहलूछो + +सक:सकनै #same as सकछै +सक:सकूनो #same as सकछो +सक:सकनानी #same as सकनान +सक:सकूनो #same as सकनो + +चा:चै +चा:चैंनी +चा:चैछो +चाँ:चाँयान #same as चाँनान + +देख:देखा +देख:देखछ्य +देख:देखोलो #same as देखलो - -LEXICON IrregularVerbs -छ:छूँ #am -छ:छी #was -छ:छा #are -छ:छ्या #were -छ:छै #is -छ:छन #are -छ:छी #was -छ:छ्यो #was -छ:छ्या #were - -भ्य:भ्यान #happen/occur -भ्य:भ्योछ #happened/occured in past - LEXICON Compound जैस+में:जैमें #in which उई+तरह:उसीकैं #in the same way @@ -1036,6 +1187,7 @@ LEXICON Compound इसो+ई:इसोई #emphasis on this ऊसो+ई:ऊसोई #emphasis on that उ+ई:उई #emphasis on he/she/it +पवित्र+शास्त्र:पवित्रशास्त्र #holy script diff --git a/apertium-kfy.kfy.twol b/apertium-kfy.kfy.twol index 2f3167f..d78a9a3 100644 --- a/apertium-kfy.kfy.twol +++ b/apertium-kfy.kfy.twol @@ -11,7 +11,9 @@ Alphabet ा ि ी ु ू ृ े ै ो ौ ॅ ॉ ◌ं ् %{R%}:ू %{R%}:0 %{I1%}:ओ %{I1%}:ो -%{I1%}:ि %{I1%}:इ ; +%{I1%}:ि %{I1%}:इ +%{F1%}:ू %{F1%}:उ +%>:0; Sets @@ -20,11 +22,13 @@ Vowel = अ आ इ ई उ ऊ ॠ ए ऐ ओ औ अं अः ा ि ी Rules "If the root lexicon ends with vowel, do not add vowel in the regular plural forms" -%{R%}:0 <=> Vowel _ ; +%{R%}:0 <=> Vowel ( %>: ) _ ; "If the root lexicon ends with vowel, add ओ in the irregular plural forms" %{I1%}:ओ <=> Vowel _ ; "If the root lexicon ends with ई, replace it with इ in the irregular plural forms" %{I2%}:इ <=> ई _ ; +"If the root lexicon ends with Vowel, add उ to the Fut1 verb forms" +%{F1%}:उ <=> Vowel _ ; ! Resources: ! https://wiki.apertium.org/wiki/Starting_a_new_language_with_HFST#Enter_twol diff --git a/result.txt b/result.txt index 8ad6a87..b91bbc4 100644 --- a/result.txt +++ b/result.txt @@ -1,30 +1,30 @@ -coverage: 72% (176296/242362) +coverage: 78% (189517/242314) -unknown forms: 66066 +unknown forms: 52797 top unknown forms: - 1585 ^लोगून/*लोगून$ - 678 ^करछ्य/*करछ्य$ - 464 ^दी/*दी$ 421 ^रैछ/*रैछ$ - 382 ^करा/*करा$ - 324 ^करछो/*करछो$ - 317 ^बातुन/*बातुन$ - 308 ^शिष्यून/*शिष्यून$ 284 ^ग्योछ/*ग्योछ$ - 278 ^करनान/*करनान$ + 273 ^छी/*छी$ 272 ^करना/*करना$ - 262 ^होलो/*होलो$ 262 ^हुन/*हुन$ 260 ^रौ/*रौ$ - 249 ^चैछो/*चैछो$ 241 ^लाग्यान/*लाग्यान$ - 237 ^ली/*ली$ - 233 ^करछूँ/*करछूँ$ 226 ^ग्यान/*ग्यान$ - 225 ^करि/*करि$ - 208 ^करोलो/*करोलो$ - 204 ^विश्वासीन/*विश्वासीन$ - 195 ^देखछ्य/*देखछ्य$ 195 ^करिना/*करिना$ - 189 ^मन/*मन$ + 187 ^ग्या/*ग्या$ + 184 ^के/*के$ + 170 ^कुछूँ/*कुछूँ$ + 158 ^द्योलो/*द्योलो$ + 152 ^रून/*रून$ + 146 ^परमेश्वरेले/*परमेश्वरेले$ + 145 ^बीच/*बीच$ + 141 ^हुना/*हुना$ + 141 ^लिखीना/*लिखीना$ + 140 ^पर/*पर$ + 138 ^यहूदीन/*यहूदीन$ + 138 ^खुद/*खुद$ + 136 ^जाण/*जाण$ + 133 ^दुसरा/*दुसरा$ + 132 ^पौलुस/*पौलुस$ + 131 ^बार/*बार$