@@ -428,6 +438,7 @@
miliómillione
+ II
IIII
IIIIII
IVIV
@@ -447,6 +458,7 @@
XVIIIXVIII
XIXXIX
XXXX
+ XXIXXI
@@ -502,7 +514,7 @@
diversitatdiversidade
modalitatmodalidade
visibilitatvisibilidade
- senyalsignale
+ senyalsignale
nitnote
cabracabra
tipustipu
@@ -577,10 +589,8 @@
baristabarista
finestrabentana
llunaluna
- camionercamionista
- camionercamionista
- campiócampione
- campiócampione
+ camionercamionista>
+ campiócampione>
cantantcantante
coneixementconnoschèntzia
contracciócontratzione
@@ -601,11 +611,11 @@
influènciainfluèntzia
informàticainformàtica
crucifixióiscravamentu
- instruccióistruzione
+ instruccióistrutzione
lliçóletzione
- lesiólezione
+
boigmacu
- boigmacu
+ boigmacu
membremembru
maritmaridu
pianopianu
@@ -807,7 +817,8 @@
orientoriente
maritmaridu
lliçólezione
- famfàmine
+ famfàmene
+ ganafàmene
instruccióistrutzione
independènciaindipendèntzia
joventutgioventude
@@ -840,7 +851,7 @@
personalitatpersonalidade
pensamentpensamentu
neoplasticismeneoplasticismu
- nebotnebode
+ nebotnebode
modernismemodernismu
mercatmercadu
mentmente
@@ -900,7 +911,7 @@
suprematismesuprematismu
subregiósub-regione
circumscripciótzircoscritzione
- socialismesocialismu
+ socialismesotzialismu
simbolismesimbolismu
parlamentparlamentu
canvicambiamentu
@@ -912,7 +923,7 @@
currículumcurrìculum
revoluciórivolutzione
gramàticagramàtica
- reduccióriduzione
+ reduccióridutzione
resistènciaresistèntzia
residènciaresidèntzia
redaccióredatzione
@@ -924,7 +935,7 @@
prioritatprioridade
fasefase
presentaciópresentatzione
- predisposiciópredisposizione
+ predisposiciópredispositzione
muntanyamontagna
posiciópositzione
politeismepoliteismu
@@ -970,7 +981,7 @@
conducciócondutzione
comunitatcomunidade
partículapartighedda
- composiciócomposizione
+ composiciócumpositzione
compilaciócompilatzione
colonialismecolonialismu
guitarristachitarrista
@@ -977,7 +988,7 @@
capitalistacapitalista
calendaricalendàriu
benediccióbeneditzione
- audicióaudizione
+ audicióauditzione
ajudaagiudu
necessitatbisòngiu
absolutismeassolutismu
@@ -1007,7 +1018,8 @@
adjectiuagetivu
preguntapregonta
- impressorimpressadore
+ impressorimpressadore
+ impressorimpressadora
diadie
àreaarea
centretzentru
@@ -1059,7 +1071,7 @@
úsusu
úsimpreu
introspeccióintrospetzione
- introduccióintroduzione
+ introduccióintrodutzione
integracióintregatzione
intencióintentzione
informacióinformatzione
@@ -1075,7 +1087,7 @@
formacióformatzione
fàbricafàbrica
fonemafonema
- flexióflezione
+ flexiófletzione
eleccióeletzione
feudalismefeudalismu
esborranyabotzu
@@ -1101,8 +1113,8 @@
expertespertu
marmare
qualitatcalidade
- composiciócompositzione
- aplicacióapplicatzione
+ composiciócumpositzione
+ aplicacióaplicatzione
soluciósolutzione
critericritèriu
mantenimentmantenimentu
@@ -1129,7 +1141,7 @@
assimilacióassimilatzione
paràbolaparabula
penínsulapenìsola
- consonantcunsonante
+ consonantcunsonante
principiprintzìpiu
acordacordu
fifine
@@ -1220,8 +1232,7 @@
treballadortraballadore
apartheidapartheid
- presidentpresidente
- presidentpresidente
+ presidentpresidente
veritatberu
políticapolìtica
desenvolupamentisvilupu
@@ -1401,7 +1412,7 @@
condicióconditzione
budistabuddhista
signesignu
- satèl·litsatellite
+ satèl·litsatèllite
ritmeritmu
plantapranta
pacifistapacifista
@@ -1416,14 +1427,14 @@
climaclima
classeclasse
realitzaciórealizatzione
- monestirmonasteriu
- màfiamafia
+ monestirmonastèriu
+ màfiamàfia
interlinguainterlingua
iniciativainitziativa
geografiageografia
generaciógeneratzione
- fotògraffotografu
- fotògraffotografu
+ fotògraffotògrafu
+ fotògraffotògrafu
autobiografiaautobiografia
anarquiaanarchia
vocalvocale
@@ -1468,8 +1479,8 @@
modificaciómodificatzione
biografiabiografia
preposicióprepositzione
- príncepprintzipe
- príncepprintzipe
+ príncepprìntzipe
+ príncepprìntzipe
representaciórapresentatzione
representaciórapresentàntzia
regularitatregularidade
@@ -1609,7 +1620,7 @@
sacrificisacrifìtziu
poemapoema
llàgrimalàgrima
- imatgeimàgine
+
golabuca
fullfògiu
foscoriscuru
@@ -1623,7 +1634,7 @@
AnglaterraInghilterra
MaltaMalta
- JapóGiappone
+ JapóGiapone
CamerunCamerun
EslovèniaIslovènia
RegneUnitRegnuUnidu
@@ -1665,10 +1676,11 @@
CanadàCanada
ÀustriaAustria
Sud-àfricaSudàfrica
- PolòniaPolonia
+ PolòniaPolània
SuïssaIsvìtzera
ChicagoChicago
- AzerbaidjanAzerbaigián
+ XicagoChicago
+ AzerbaidjanAzerbaigiàn
ArgentinaArgentina
VietnamVietnàm
BerlínBerlinu
@@ -1675,10 +1687,10 @@
TurquiaTurchia
MoscouMosca
VaticàVaticanu
- SudanSudan
- MesopotàmiaMesopotamia
+ SudanSudàn
+ MesopotàmiaMesopotàmia
GeòrgiaGeòrgia
- FiladèlfiaFiladelfia
+ FiladèlfiaFiladèlfia
CarboniaCarbònia
LiechtensteinLiechtenstein
SantiagoSantiago
@@ -1695,12 +1707,12 @@
CannesCannes
NovaYorkNewYork
NovaDelhiNewDelhi
- TeheranTeheran
+ TeheranTeheràn
StanfordStanford
SíriaSìria
- NatzaretNazaret
+ NatzaretNazarèt
GranBretanyaBretagnaManna
- TràciaTracia
+ TràciaTràtzia
SantFrancescSantuFrantziscu
SanMarinoSanMarino
RomaniaRomania
@@ -2091,9 +2103,8 @@
segonsegundu
primerprimu
- quartcuartu
- últimùrtimu
- penúltimpenùrtimu
+ últimùrtimu
+ penúltimpenùrtimu
mateixmatessi
similarchepare
@@ -2140,9 +2151,9 @@
libanèslibanesu
elèctricelètricu
japonèsgiaponesu
- suecsvedesu
+ suecisvedesu
megalíticmegalìticu
- simplesèmplitze
+ simplesèmplitze
industrialindustriale
provincialprovintziale
físicfìsicu
@@ -2151,7 +2162,7 @@
portàtilportàtile
poderóspoderosu
mecànicmecànicu
- interessantinteressante
+ interessantinteressante
impressionantimpressionante
fèrtilfèrtile
electròniceletrònicu
@@ -2166,8 +2177,8 @@
solarsolare
carcaru
binaribinàriu
- albanèsarbanesu
- albanèsarbanese
+ albanèsalbanesu
+ albanèsalbanese
tecnològictecnològicu
aritmèticaritmèticu
jurídicgiurìdicu
@@ -2219,7 +2230,7 @@
cristiàcristianu
personalpersonale
democràticdemocràticu
- socialdemòcratasocialdemocràticu
+ socialdemòcratasotzialdemocràticu
distintdistintu
diversdiversu
hebreuebràicu
@@ -2237,7 +2248,7 @@
governatiuguvernativu
satíricsatìricu
sahariàsaharianu
- evidentevidente
+ evidentevidente
autònomautònomu
pluralplurale
formalformale
@@ -2285,9 +2296,9 @@
moltmeda
holandèsolandesu
hongarèsungheresu
- importantimportante
+ importantimportante
independentistaindipendentista
- socialistasocialista
+ socialistasotzialista
generalistageneralista
internacionalinternatzionale
llatílatinu
@@ -2320,7 +2331,7 @@
sud-africàsudafricanu
tradicionaltraditzionale
turcturcu
- turísticturisticu
+ turísticturìsticu
característiccaraterìsticu
ucraïnèsucrainu
públicpùblicu
@@ -2406,7 +2417,7 @@
menorminore
mutmudu
negrenieddu
- potentpotente
+ potentpotente
pleprenu
professionalprofessionale
romàromanu
@@ -2472,7 +2483,7 @@
vermellruju
roigruju
- diminutminore
+ diminutminore
@@ -2693,13 +2704,13 @@
nominarnominare
menjarmandigare
indicarindicare
- caracteritzarcaraterizzare
+ caracteritzarcaraterizare
manifestarmanifestare
manarmandare
distingirdistìnghere
analitzaranalizare
colonitzarcolonizare
- acompanyaraccumpagnare
+ acompanyaracumpagnare
servirserbire
proposarpropònnere
proclamarproclamare
@@ -2717,8 +2728,8 @@
sortiressire
demostrardimostrare
confirmarcunfirmare
- compilarcumpilare
- canviarcàmbiare
+ compilarcompilare
+ canviarcambiare
buscarbuscare
aprendreimparare
pensarpensare
@@ -2743,7 +2754,7 @@
deixardassare
arribararribare
quedarabarrare
- representarrappresentare
+ representarrapresentare
interessarinteressare
costarcostare
mostrarmustrare
@@ -2772,7 +2783,7 @@
aprovaraprovare
afirmarafirmare
acostumaracostumare
- acumularaccumulare
+ acumularacumulare
constituircostituire
basarbasare
freqüentarfrecuentare
@@ -2788,11 +2799,10 @@
obrirabèrrere
trencarsegare
recordarregordare
- aprofitarprovochere
atendreisetare
empresonarimpresonare
enviarimbiare
- emergiremergere
+ emergiristupare
solercostumare
aprovarcolare
esborrarburrare
@@ -2898,7 +2908,7 @@
escaparfuire
gaudirgodire
començarimbetzare
- aprendreimparere
+ aprendreimparare
trobarimbènnere
especialitzarispetzializare
estudiaristudare
@@ -2937,7 +2947,7 @@
dirigirdirìgere
assignarassignare
presenciarpresentziare
- italianitzaritalianisare
+ italianitzaritalianizare
sentirsentire
preocuparpreoccupare
descriuredescrìere
@@ -3048,7 +3058,7 @@
exiliaresiliare
acceleraratzelerare
acontentaracuntentare
- acreditaracrèditare
+ acreditaracreditare
respectarrespetare
redactarredatare
@@ -3072,7 +3082,7 @@
escollirseberare
obligarobrigare
- odiaròdiare
+ odiarodiare
orientarpunnare
tutelartutelare
desocupardisocupare
@@ -3080,7 +3090,7 @@
sotmetreassuzetare
promourepromovare
promourepromòvere
- normalitzarnormalizere
+ normalitzarnormalizare
establiristabilire
llegirlèghere
partirpartire
@@ -3125,12 +3135,12 @@
estecustu
eixecustu
unseguitdeunasèriede
- algunaltrecalicunuàteru
- senglesambos
+
+
aqueixcustu
- totunseguitdetotuunasèriede
- ningunnemos
+
ningunnessunu
+ ningunnemos
uniunaltreunues'àteru
vint-i-unbintunu
trenta-untrintunu
@@ -3146,7 +3156,6 @@
queca
onue
elquesuchi
- elquecale
quèchi
quèite
quèca
@@ -3155,14 +3164,14 @@
alqualasuchi
alqualacale
qualcale
- elquisuchi
+ elquisuchi
elquichie
aonaue
alquiasuchi
alquiachie
- delquide
- pelquiprochi
- quantcantu
+
+
+ quantcantu
jaquesigomente
aixícomgosicomente
@@ -3174,6 +3183,7 @@
ésadirestanàrrere
demaneraquedemanerachi
aleshorestando
+ llavorstando
abansqueinantischi
talcomgosicomente
desprésqueapustischi
@@ -3454,7 +3464,7 @@
sisi
homunu
allòcuddu
- tothomtotus
+ tothomtotu
algunacosacalicunacosa
algunacosacarchicosa
qualsevolcalesisiat
@@ -3470,7 +3480,7 @@
estecustu
vostèvostè
vosbois
- ambsicunsegus
+
algunaltrecalicunuàteru
eixecustu
totplegattotuparis
@@ -3477,14 +3487,14 @@
totplegattotuimpare
resnonudda
undesolunusolu
- ambmicunmegus
- noresnudda
+
+ noresnudda
vósbois
- ambtucuntegus
+
elmeusumeu
totsjuntstotuparis
totsjuntstotugiuntos
- altriàteros
+
elvostresubostru
totsplegatstotuparis
totsplegatstotugiuntos
@@ -3494,29 +3504,31 @@
totirestotuenudda
joqueelldeocheaissu
+ morirmòrrere
+
+
kmkm
-
- MITMIT
- APECAPEC
+ MITMIT
+ APECAPEC
ONUONU
- ADNADN
- ADNDNA
- UnescoUnesco
- LSCLSC
- FAOFAO
- LSULSU
- OPEPOPEC
- OTANNATO
- AIEAIAEA
- OSCEOSCE
- sidaSIDA
- SIDAAIDS
- CIACIA
- AFIIPA
- VIHVIH
- GNUGNU
+ ADNADN
+ ADNDNA
+ UnescoUnesco
+ LSCLSC
+ FAOFao
+ LSULSU
+ OPEPOPEC
+ OTANNATO
+ AIEAIAEA
+ OSCEOSCE
+ sidaSIDA
+ SIDAAIDS
+ CIACIA
+ AFIIPA
+ VIHVIH
+ GNUGNU
@@ -3527,5 +3539,16 @@
[\(\[]
[\)\]]
+ mésprus
+ següentimbeniente
+ obraòpera
+ properimbeniente
+ vavanu
+ parellapariga
+ parellacroba
+ incrementacreschimentu
+ altreàteru
+ morirmòrrere
+
Index: staging/apertium-cat-srd/dev/testvoc/bidix-unknowns.sh
===================================================================
--- staging/apertium-cat-srd/dev/testvoc/bidix-unknowns.sh (nonexistent)
+++ staging/apertium-cat-srd/dev/testvoc/bidix-unknowns.sh (revision 78982)
@@ -0,0 +1,98 @@
+#!/bin/bash
+
+set -e -u
+
+if [[ $# -eq 1 ]]; then
+ lang=$1
+ monodix=guess
+ bidix=guess
+ side=guess
+elif [[ $# -eq 4 ]]; then
+ lang=$1
+ monodix=$2
+ bidix=$3
+ side=$4
+else
+ cat >&2 <&2
+lt-expand "${monodix}" \
+ | grep -ve __REGEXP__ \
+ | sed 's/[^:]*//; s/\(<.*>\)\(#.*\)/\2\1/' \
+ | LC_ALL=C sort -u >"${exp}"
+
+in_mono () {
+ # bidix has prefixes of monodix, have to use look instead of comm :-/
+ LC_ALL=C look "$1" "${exp}" >/dev/null
+}
+echo "Expanding bidix and checking for entries missing from monodix …" >&2
+lt-expand "${bidix}" \
+ | awk -vside="${side}" -F':|:[<>]:' '
+ BEGIN {
+ if(side=="l") {
+ nside=1
+ LR=":>:"
+ RL=":<:"
+ }
+ else {
+ nside=2
+ LR=":<:" # flip it
+ RL=":>:" # and reverse
+ }
+ }
+ # Make bidix match up with monodix (left=left, right=right):
+ /:>:/ { print LR $nside; next }
+ /:<:/ { print RL $nside; next }
+ /:/ { print ":"$nside }
+' \
+ | while read -r bientry; do
+ # Bidix now normalised to have the requested monodix on the "left"
+ case ${bientry} in
+ ":>:"* ) # If it's LR in bidix, then we check if unmarked / LR is in monodix
+ in_mono "${bientry##:>}" || in_mono "${bientry}" || echo "${bientry}"
+ ;;
+ ":<:"* ) # If it's RL in bidix, then we check if unmarked / RL is in monodix
+ in_mono "${bientry##:<}" || in_mono "${bientry}" || echo "${bientry}"
+ ;;
+ ":"* ) # If it's unmarked in bidix, then we check if unmarked / LR / RL in monodix
+ in_mono "${bientry}" || in_mono ":>${bientry}" || in_mono ":<${bientry}" || echo "${bientry}"
+ ;;
+ *) echo "ERROR: unexpected bientry format: ${bientry}" >&2;;
+ esac
+ done
Index: staging/apertium-cat-srd/dev/testvoc/generation.sh
===================================================================
--- staging/apertium-cat-srd/dev/testvoc/generation.sh (nonexistent)
+++ staging/apertium-cat-srd/dev/testvoc/generation.sh (revision 78982)
@@ -0,0 +1,98 @@
+#!/bin/bash
+
+set -e -u
+
+if [[ $# -eq 1 ]]; then
+ mode=$1
+ dix=guess
+elif [[ $# -eq 2 ]]; then
+ mode=$1
+ dix=$2
+else
+ cat >&2 <"clb"$"
+ }'
+ # give the "disambiguated" output, no forms
+}
+
+split_ambig () {
+ if command -V pypy3 &>/dev/null; then
+ python=pypy3
+ else
+ python=python3
+ fi
+ PYTHONPATH="$(dirname "$0"):${PYTHONPATH:-}" "${python}" -c '
+from streamparser import parse_file, readingToString
+import sys
+for blank, lu in parse_file(sys.stdin, withText=True):
+ print(blank+" ".join("^{}/{}$".format(lu.wordform, readingToString(r))
+ for r in lu.readings),
+ end="")'
+
+}
+
+mode_after_analysis ()
+{
+ eval $(grep '|' "$1" |\
+ sed 's/[^|]*|//' |\
+ sed 's/.*apertium-pretransfer/apertium-pretransfer/' |\
+ sed 's/lt-proc -p[^|]*/cat/' |\
+ sed 's/autobil.bin *|/& split_ambig |/' |\
+ sed 's/\$1/-d/g;s/\$2//g')
+ # lt-proc -p fails
+}
+
+only_errs () {
+ grep '][^<]*[#/]'
+}
+
+
+lang1=${mode%%-*}
+
+if [[ ${dix} = guess ]]; then
+ lang1dir=$(grep -m1 "^AP_SRC.*apertium-${lang1}" config.log | sed "s/^[^=]*='//;s/'$//")
+ dix=${lang1dir}/apertium-${lang1}.${lang1}.dix
+fi
+
+clb=""
+case ${lang1} in
+ nno|nob) clb="" ;;
+esac
+
+# Make it possible to edit the .dix while testvoc is running:
+dixtmp=$(mktemp -t gentestvoc.XXXXXXXXXXX)
+trap 'rm -f "${dixtmp}"' EXIT
+cat "${dix}" > "${dixtmp}"
+
+analysis_expansion "${mode}" "${clb}" \
+ | mode_after_analysis modes/"${mode}".mode \
+ | only_errs
Property changes on: staging/apertium-cat-srd/dev/testvoc/generation.sh
___________________________________________________________________
Added: svn:executable
## -0,0 +1 ##
+*
\ No newline at end of property
Index: staging/apertium-cat-srd/dev/testvoc/streamparser.py
===================================================================
--- staging/apertium-cat-srd/dev/testvoc/streamparser.py (nonexistent)
+++ staging/apertium-cat-srd/dev/testvoc/streamparser.py (revision 78982)
@@ -0,0 +1,144 @@
+#!/usr/bin/python3
+# -*- coding: utf-8 -*-
+"""
+Usage: streamparser.py [FILE]
+
+Consumes input from a file (first argument) or stdin, parsing and pretty printing the readings of lexical units found.
+"""
+
+import re, pprint, sys, itertools, fileinput
+from collections import namedtuple
+
+SReading = namedtuple('SReading', ['baseform', 'tags'])
+
+def subreadingToString(sub):
+ return sub.baseform+"".join("<"+t+">" for t in sub.tags)
+
+def readingToString(reading):
+ return "+".join(subreadingToString(sub) for sub in reading)
+
+def mainpos(reading, ltr=False):
+ """Return the first part-of-speech tag of a reading. If there are
+ several subreadings, by default give the first tag of the last
+ subreading. If ltr=True, give the first tag of the first
+ subreading, see
+ http://beta.visl.sdu.dk/cg3/single/#sub-stream-apertium for more
+ information.
+
+ """
+ if ltr:
+ return reading[0].tags[0]
+ else:
+ return reading[-1].tags[0]
+
+class LexicalUnit:
+
+ """A lexical unit consisting of a lemma and its readings.
+
+ Attributes:
+ lexicalUnit (str): The lexical unit in Apertium stream format.
+ wordform (str): The word form (surface form) of the lexical unit.
+ readings (list of list of SReading): The analyses of the lexical unit with sublists containing all subreadings.
+ """
+
+ def __init__(self, lexicalUnit):
+ self.lexicalUnit = lexicalUnit
+
+ cohort = re.split(r'(?]+>)+)', reading)
+ for subreading in subreadingParts:
+ baseform = subreading[0].lstrip('+')
+ tags = re.findall(r'<([^>]+)>', subreading[1])
+
+ subreadings.append(SReading(baseform=baseform, tags=tags))
+
+ self.readings.append(subreadings)
+
+ def __repr__(self):
+ return self.lexicalUnit
+
+
+def parse(stream, withText=False):
+ """Generates lexical units from a character stream.
+
+ Args:
+ stream (iterable): A character stream containing lexical units, superblanks and other text.
+ withText (bool, optional): A boolean defining whether to output preceding text with each lexical unit.
+
+ Yields:
+ LexicalUnit: The next lexical unit found in the character stream. (if withText is False)
+ (str, LexicalUnit): The next lexical unit found in the character stream and the the text that seperated it from the prior unit in a tuple. (if withText is True)
+ """
+
+ buffer = ''
+ textBuffer = ''
+ inLexicalUnit = False
+ inSuperblank = False
+
+ for char in stream:
+
+ if inSuperblank:
+ if char == ']':
+ inSuperblank = False
+ textBuffer += char
+ elif char == '\\':
+ textBuffer += char
+ textBuffer += next(stream)
+ else:
+ textBuffer += char
+ elif inLexicalUnit:
+ if char == '$':
+ if withText:
+ yield (textBuffer, LexicalUnit(buffer))
+ else:
+ yield LexicalUnit(buffer)
+ buffer = ''
+ textBuffer = ''
+ inLexicalUnit = False
+ elif char == '\\':
+ buffer += char
+ buffer += next(stream)
+ else:
+ buffer += char
+ else:
+ if char == '[':
+ inSuperblank = True
+ textBuffer += char
+ elif char == '^':
+ inLexicalUnit = True
+ elif char == '\\':
+ textBuffer += char
+ textBuffer += next(stream)
+ else:
+ textBuffer += char
+
+
+def parse_file(f, withText=False):
+ """Generates lexical units from a file.
+
+ Args:
+ f (file): A file containing lexical units, superblanks and other text.
+
+ Yields:
+ LexicalUnit: The next lexical unit found in the file.
+ """
+
+ return parse(itertools.chain.from_iterable(f), withText)
+
+
+if __name__ == '__main__':
+ lexicalUnits = parse_file(fileinput.input())
+
+ for lexicalUnit in lexicalUnits:
+ pprint.pprint(lexicalUnit.readings, width=120)
Index: staging/apertium-cat-srd/dev/inconsistency.sh
===================================================================
--- staging/apertium-cat-srd/dev/inconsistency.sh (revision 78978)
+++ staging/apertium-cat-srd/dev/inconsistency.sh (revision 78982)
@@ -1,19 +1,19 @@
TMPDIR=/tmp
-if [[ $1 = "sc-ca" ]]; then
+if [[ $1 = "srd-cat" ]]; then
-lt-expand ../apertium-ca-sc.sc.dix | grep -v REGEX | grep -v '' | sed 's/:>:/%/g' | grep -v ':<:' | sed 's/:/%/g' | cut -f2 -d'%' | sed 's/^/^/g' | sed 's/$/$ ^.$/g' | tee $TMPDIR/tmp_testvoc1.txt |
+lt-expand ../apertium-cat-srd.srd.dix | grep -v REGEX | grep -v '' | sed 's/:>:/%/g' | grep -v ':<:' | sed 's/:/%/g' | cut -f2 -d'%' | sed 's/^/^/g' | sed 's/$/$ ^.$/g' | tee $TMPDIR/tmp_testvoc1.txt |
apertium-pretransfer|
- apertium-transfer ../apertium-ca-sc.sc-ca.t1x ../sc-ca.t1x.bin ../sc-ca.autobil.bin | tee $TMPDIR/tmp_testvoc2.txt |
- lt-proc -d ../sc-ca.autogen.bin > $TMPDIR/tmp_testvoc3.txt
+ apertium-transfer ../apertium-cat-srd.srd-cat.t1x ../srd-cat.t1x.bin ../srd-cat.autobil.bin | tee $TMPDIR/tmp_testvoc2.txt |
+ lt-proc -d ../srd-cat.autogen.bin > $TMPDIR/tmp_testvoc3.txt
paste -d _ $TMPDIR/tmp_testvoc1.txt $TMPDIR/tmp_testvoc2.txt $TMPDIR/tmp_testvoc3.txt | sed 's/\^.\$//g' | sed 's/_/ ---------> /g'
-elif [[ $1 = "ca-sc" ]]; then
+elif [[ $1 = "cat-srd" ]]; then
-lt-expand ../ca/ca.dix | grep -v REGEX | grep -v '' | sed 's/:>:/%/g' | grep -v ':<:' | sed 's/:/%/g' | cut -f2 -d'%' | sed 's/^/^/g' | sed 's/$/$ ^.$/g' | tee $TMPDIR/tmp_testvoc1.txt |
+lt-expand ../cat/cat.dix | grep -v REGEX | grep -v '' | sed 's/:>:/%/g' | grep -v ':<:' | sed 's/:/%/g' | cut -f2 -d'%' | sed 's/^/^/g' | sed 's/$/$ ^.$/g' | tee $TMPDIR/tmp_testvoc1.txt |
apertium-pretransfer|
- apertium-transfer ../apertium-ca-sc.ca-sc.t1x ../ca-sc.t1x.bin ../ca-sc.autobil.bin | tee $TMPDIR/tmp_testvoc2.txt |
- lt-proc -d ../ca-sc.autogen.bin > $TMPDIR/tmp_testvoc3.txt
+ apertium-transfer ../apertium-cat-srd.cat-srd.t1x ../cat-srd.t1x.bin ../cat-srd.autobil.bin | tee $TMPDIR/tmp_testvoc2.txt |
+ lt-proc -d ../cat-srd.autogen.bin > $TMPDIR/tmp_testvoc3.txt
paste -d _ $TMPDIR/tmp_testvoc1.txt $TMPDIR/tmp_testvoc2.txt $TMPDIR/tmp_testvoc3.txt | sed 's/\^.\$//g' | sed 's/_/ ---------> /g'
Index: staging/apertium-cat-srd/dev/testvoc-summary.ca-sc.txt
===================================================================
--- staging/apertium-cat-srd/dev/testvoc-summary.ca-sc.txt (revision 78978)
+++ staging/apertium-cat-srd/dev/testvoc-summary.ca-sc.txt (revision 78982)
@@ -1,27 +1,3 @@
-dj nov 18 12:01:34 GMT 2010
-===============================================
-POS Total Clean With @ With # Clean %
-vblex 53984 53984 0 0 100
-vbmod 5671 5671 0 0 100
-pr 5382 5382 0 0 100
-n 2857 2857 0 0 100
-adj 2572 2572 0 0 100
-np 466 466 0 0 100
-det 397 397 0 0 100
-adv 165 165 0 0 100
-prn 147 147 0 0 100
-vbser 115 115 0 0 100
-vbhaver 95 95 0 0 100
-num 87 87 0 0 100
-rel 63 63 0 0 100
-cnjsub 20 20 0 0 100
-abbr 20 20 0 0 100
-cnjadv 14 14 0 0 100
-predet 10 10 0 0 100
-cnjcoo 7 7 0 0 100
-preadv 5 5 0 0 100
-vaux 0 0 0 0 100
-ij 0 0 0 0 100
-guio 0 0 0 0 100
-cm 0 0 0 0 100
-===============================================
+Sun Jun 4 22:49:09 MSK 2017
+-e ===============================================
+-e POS Total Clean With @ With # Clean %
Index: staging/apertium-cat-srd/dev/testvoc.sh
===================================================================
--- staging/apertium-cat-srd/dev/testvoc.sh (revision 78978)
+++ staging/apertium-cat-srd/dev/testvoc.sh (revision 78982)
@@ -1,5 +1,5 @@
echo "==Catalan->Sardinian==========================";
-bash inconsistency.sh ca-sc > /tmp/ca-sc.testvoc; sh inconsistency-summary.sh /tmp/ca-sc.testvoc ca-sc
+bash inconsistency.sh cat-srd > /tmp/cat-srd.testvoc; sh inconsistency-summary.sh /tmp/cat-srd.testvoc cat-srd
#echo ""
#echo "==Sardinian->Catalan===========================";
-#bash inconsistency.sh sc-ca > /tmp/sc-ca.testvoc; bash inconsistency-summary.sh /tmp/sc-ca.testvoc sc-ca
+#bash inconsistency.sh srd-cat > /tmp/srd-cat.testvoc; bash inconsistency-summary.sh /tmp/srd-cat.testvoc srd-cat
Index: languages/apertium-srd/apertium-srd.srd.dix
===================================================================
--- languages/apertium-srd/apertium-srd.srd.dix (revision 78978)
+++ languages/apertium-srd/apertium-srd.srd.dix (revision 78982)
@@ -449,7 +449,7 @@
a u
-