commit 44a79eebc695111090bb5c209d273237023768ef Author: hectoralos Date: Thu Jul 11 10:45:39 2019 +0300 + disamb ant/cog/top diff --git a/apertium-cat.cat.rlx b/apertium-cat.cat.rlx index 0ba4323..d6fa28d 100644 --- a/apertium-cat.cat.rlx +++ b/apertium-cat.cat.rlx @@ -1,4 +1,4 @@ -# exemple ambigüitat fins i tot per a un parlant: "noble húngaro" (hungara nobelo / nobla hungaro), "viejos fanáticos" (maljunaj fanatikuloj / fanatikaj maljunuloj) +# exemple ambigüitat fins i tot per a un parlant: "noble húngaro" (hungara nobelo / nobla hungaro), "viejos fanáticos" (maljunaj fanatikuloj / fanatikaj maljunuloj)però és infreqüent en el tipus de textos que tractem i és improbable que, a més, coincideixi amb un top) DELIMITERS = "<.>" "" "" "<...>" "<¶>" "<:>"; SOFT-DELIMITERS = "<,>" "<;>"; SUBREADINGS = LTR ; # Alternate, left-to-right (main reading on the left) @@ -406,6 +406,9 @@ SELECT Top IF (-2 ("")) (-1 ("de")) (0 Ant OR Cog OR Top OR Al) ; # Comunitat de Madrid SELECT Top IF (-1 ("alt") OR ("baix")) (0 Ant OR Cog OR Top OR Al) (NOT 0 ("Consell")); # Alt Aragó, Baix Aragó, però no: Alt Consell +REMOVE Cog IF (-1 Det + Def) (0 NP) ; # el Rosselló (pot ser l'article, però és infreqüent en el tipus de textos que tractem i és improbable que, a més, coincideixi amb un top) +REMOVE Ant_Cog IF (-1 ("en")) (0 NP) ; # pot ser l'article (que no analitzem com a tal), però és infreqüent en el tipus de textos que tractem i és improbable que, a més, coincideixi amb un top (excepte en alguns topònims) +REMOVE Ant_Cog IF (-2 >>> OR CnjSub) (-1 ("a")) (0 NP) ; # és molt difícil que sigui un ant/cog en aquesta posició, en canvi els top són freqüents en inici de frase SELECT Top IF (-2 ("anar") OR ("viatjar")) (-1 ("a")) (0 Ant OR Cog OR Top) ; REMOVE Top IF (NOT -2 ("anar") OR ("viatjar")) (-1 ("a")) (0C Ant OR Cog OR Top) ; SELECT Top IF (-3 ("anar") OR ("viatjar")) (-2 ("a")) (-1 Det + Def) (0 Ant OR Cog OR Top) ;