commit d899552679dda1bafef41fcfdfbea6e7cf9ff903 Author: Eiji Miyamoto Date: Mon Jul 31 07:41:48 2023 +0100 improved some rules and words on lexc and rlx file diff --git a/apertium-jpn.jpn.lexc b/apertium-jpn.jpn.lexc index 8b4dbf4..13b5355 100644 --- a/apertium-jpn.jpn.lexc +++ b/apertium-jpn.jpn.lexc @@ -44228,7 +44228,6 @@ LEXICON NounRoot 二だん構え:二だん構え NounTag ; 二だんがまえ:二だんがまえ NounTag ; にだんがまえ:にだんがまえ NounTag ; -日:日 NounTag ; にち:にち NounTag ; 日限:日限 NounTag ; 日げん:日げん NounTag ; @@ -48295,22 +48294,13 @@ LEXICON NounRoot パートナ:パートナ NounTag ; パートナー:パートナー NounTag ; パーマ:パーマ NounTag ; -日:日 NounTag ; -ひ:ひ NounTag ; 妃:妃 NounTag ; -ひ:ひ NounTag ; 比:比 NounTag ; -ひ:ひ NounTag ; 火:火 NounTag ; -ひ:ひ NounTag ; 灯:灯 NounTag ; -ひ:ひ NounTag ; 碑:碑 NounTag ; -ひ:ひ NounTag ; 秘:秘 NounTag ; -ひ:ひ NounTag ; 非:非 NounTag ; -ひ:ひ NounTag ; 悲哀:悲哀 NounTag ; 悲あい:悲あい NounTag ; ひあい:ひあい NounTag ; @@ -52009,7 +51999,6 @@ LEXICON NounRoot プードル:プードル NounTag ; プール:プール NounTag ; 屁:屁 NounTag ; -へ:へ NounTag ; ヘア:ヘア NounTag ; ヘアヌード:ヘアヌード NounTag ; 兵:兵 NounTag ; @@ -62608,9 +62597,7 @@ LEXICON NounRoot ロール:ロール NounTag ; ローン:ローン NounTag ; 和:和 NounTag ; -わ:わ NounTag ; 輪:輪 NounTag ; -わ:わ NounTag ; 歪曲:歪曲 NounTag ; わい曲:わい曲 NounTag ; わいきょく:わいきょく NounTag ; @@ -68156,9 +68143,7 @@ LEXICON ProperNouns イラン:イラン NPTop ; テヘラン:テヘラン NPTop ; 日本:日本 NPTop ; -日本:日本 NPTop ; ジャパン:ジャパン NPTop ; -日:日 NPTop ; タジキスタン:タジキスタン NPTop ; ドゥシャンベ:ドゥシャンベ NPTop ; カタール:カタール NPTop ; @@ -518724,7 +518709,6 @@ LEXICON VerbRoot 減ったり:減ったり UVerbInflCP ; 減っちゃ:減っちゃ UVerbInflCP ; 減りゃ:減りゃ UVerbInflCP ; -へ:へ UVerbInflCP ; へる:へる UVerbInflCP ; へら:へら UVerbInflCP ; へろう:へろう UVerbInflCP ; @@ -518759,15 +518743,11 @@ LEXICON VerbRoot 経ちゃ:経ちゃ UVerbInflCP ; 経りゃ:経りゃ UVerbInflCP ; 経よ:経よ UVerbInflCP ; -へ:へ UVerbInflCP ; へる:へる UVerbInflCP ; -へ:へ UVerbInflCP ; へよう:へよう UVerbInflCP ; へよ:へよ UVerbInflCP ; へろ:へろ UVerbInflCP ; へれば:へれば UVerbInflCP ; -へ:へ UVerbInflCP ; -へ:へ UVerbInflCP ; へた:へた UVerbInflCP ; へたろう:へたろう UVerbInflCP ; へたろ:へたろ UVerbInflCP ; @@ -551631,7 +551611,6 @@ LEXICON VerbRoot 沸いたり:沸いたり UVerbInflCP ; 沸いちゃ:沸いちゃ UVerbInflCP ; 沸きゃ:沸きゃ UVerbInflCP ; -わ:わ UVerbInflCP ; わく:わく UVerbInflCP ; わか:わか UVerbInflCP ; わこう:わこう UVerbInflCP ; @@ -551682,7 +551661,6 @@ LEXICON VerbRoot 涌いたり:涌いたり UVerbInflCP ; 涌いちゃ:涌いちゃ UVerbInflCP ; 涌きゃ:涌きゃ UVerbInflCP ; -わ:わ UVerbInflCP ; わく:わく UVerbInflCP ; わか:わか UVerbInflCP ; わこう:わこう UVerbInflCP ; @@ -551820,7 +551798,6 @@ LEXICON VerbRoot 和したり:和したり UVerbInflCP ; 和しちゃ:和しちゃ UVerbInflCP ; 和しゃ:和しゃ UVerbInflCP ; -わ:わ UVerbInflCP ; わす:わす UVerbInflCP ; わさ:わさ UVerbInflCP ; わそう:わそう UVerbInflCP ; @@ -551857,7 +551834,6 @@ LEXICON VerbRoot 和す:和す UVerbInflCP ; 和せ:和せ UVerbInflCP ; 和せよ:和せよ UVerbInflCP ; -わ:わ UVerbInflCP ; わする:わする UVerbInflCP ; わさ:わさ UVerbInflCP ; わしよう:わしよう UVerbInflCP ; @@ -553400,7 +553376,6 @@ LEXICON VerbRoot 割ったり:割ったり UVerbInflCP ; 割っちゃ:割っちゃ UVerbInflCP ; 割りゃ:割りゃ UVerbInflCP ; -わ:わ UVerbInflCP ; わる:わる UVerbInflCP ; わら:わら UVerbInflCP ; わろう:わろう UVerbInflCP ; diff --git a/apertium-jpn.jpn.rlx b/apertium-jpn.jpn.rlx index 8f94557..108eb11 100644 --- a/apertium-jpn.jpn.rlx +++ b/apertium-jpn.jpn.rlx @@ -17,7 +17,7 @@ SELECT (v) IF (1 ("、")) ; # Noun with People or verb with People SELECT (suff) IF (-1 (pn)) ; -SELECT (n) IF (-1 (v))(1 (suff)) ; +#SELECT (n) IF (-1 (v))(1 (suff)) ; # verb si or suff si SELECT (v) IF (-1 (n))(1 (suff)) ; @@ -62,6 +62,38 @@ SELECT (suff) IF (-1 (num))(-1 (adj))(0 ("目")) ; # teki with N SELECT (suff) IF (-1 (n))(0 ("的")) ; +# aru verb or suffix +SELECT (v) IF (-1 ("が"))(0 ("ある")) ; + +SELECT (suff) IF (0 ("ある")) ; + +# ie with no +SELECT (n) IF (-1 ("の"))(-2 (n)) ; + +# usages in iki +SELECT (v) IF (0 ("いき")) ; + +#masi with suff +SELECT (v) IF (0 ("まし")) ; + +# nai with ni +REMOVE (suff) IF (-1 ("に"))(0 ("ない"))(1 ("の")) ; + +REMOVE (v) IF (-1 ("に"))(0 ("ない"))(1 ("の")) ; + +# jodousi nai with words ending with a, mizen form +SELECT (v) IF (-1 ("わから")) ; + +SELECT (v) IF (-1 ("知ら")) ; + +#naru verv +SELECT (v) IF (0 ("なっ")) ; + +#you ni and sou ni They r jodousi verbs +SELECT (v ifml npst) IF (-1 (v))(2 (v)) ; + +SELECT (v ifml npst) IF (-2 (n))(2 (v)) ; + # Resources: # http://visl.sdu.dk/cg3.html # http://groups.google.com/group/constraint-grammar