Index: staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix =================================================================== --- staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix (revision 78978) +++ staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix (revision 78982) @@ -39,6 +39,7 @@ + @@ -78,6 +79,11 @@

+ +

+

+

+

@@ -97,7 +103,7 @@

- +

@@ -104,6 +110,10 @@

+ +

+

+

@@ -428,6 +438,7 @@

miliómillione

+

II

IIII

IIIIII

IVIV

@@ -447,6 +458,7 @@

XVIIIXVIII

XIXXIX

XXXX

+

XXIXXI

@@ -502,7 +514,7 @@

diversitatdiversidade

modalitatmodalidade

visibilitatvisibilidade

-

senyalsignale

+

senyalsignale

nitnote

cabracabra

tipustipu

@@ -577,10 +589,8 @@

baristabarista

finestrabentana

llunaluna

-

camionercamionista

-

camionercamionista

-

campiócampione

-

campiócampione

+

camionercamionista>

+

campiócampione>

cantantcantante

coneixementconnoschèntzia

contracciócontratzione

@@ -601,11 +611,11 @@

influènciainfluèntzia

informàticainformàtica

crucifixióiscravamentu

-

instruccióistruzione

+

instruccióistrutzione

lliçóletzione

-

lesiólezione

+

boigmacu

-

boigmacu

+

boigmacu

membremembru

maritmaridu

pianopianu

@@ -807,7 +817,8 @@

orientoriente

maritmaridu

lliçólezione

-

famfàmine

+

famfàmene

+

ganafàmene

instruccióistrutzione

independènciaindipendèntzia

joventutgioventude

@@ -840,7 +851,7 @@

personalitatpersonalidade

pensamentpensamentu

neoplasticismeneoplasticismu

-

nebotnebode

+

nebotnebode

modernismemodernismu

mercatmercadu

mentmente

@@ -900,7 +911,7 @@

suprematismesuprematismu

subregiósub-regione

circumscripciótzircoscritzione

-

socialismesocialismu

+

socialismesotzialismu

simbolismesimbolismu

parlamentparlamentu

canvicambiamentu

@@ -912,7 +923,7 @@

currículumcurrìculum

revoluciórivolutzione

gramàticagramàtica

-

reduccióriduzione

+

reduccióridutzione

resistènciaresistèntzia

residènciaresidèntzia

redaccióredatzione

@@ -924,7 +935,7 @@

prioritatprioridade

fasefase

presentaciópresentatzione

-

predisposiciópredisposizione

+

predisposiciópredispositzione

muntanyamontagna

posiciópositzione

politeismepoliteismu

@@ -970,7 +981,7 @@

conducciócondutzione

comunitatcomunidade

partículapartighedda

-

composiciócomposizione

+

composiciócumpositzione

compilaciócompilatzione

colonialismecolonialismu

guitarristachitarrista

@@ -977,7 +988,7 @@

capitalistacapitalista

calendaricalendàriu

benediccióbeneditzione

-

audicióaudizione

+

audicióauditzione

ajudaagiudu

necessitatbisòngiu

absolutismeassolutismu

@@ -1007,7 +1018,8 @@

adjectiuagetivu

preguntapregonta

-

impressorimpressadore

+

impressorimpressadore

+

impressorimpressadora

diadie

àreaarea

centretzentru

@@ -1059,7 +1071,7 @@

úsusu

úsimpreu

introspeccióintrospetzione

-

introduccióintroduzione

+

introduccióintrodutzione

integracióintregatzione

intencióintentzione

informacióinformatzione

@@ -1075,7 +1087,7 @@

formacióformatzione

fàbricafàbrica

fonemafonema

-

flexióflezione

+

flexiófletzione

eleccióeletzione

feudalismefeudalismu

esborranyabotzu

@@ -1101,8 +1113,8 @@

expertespertu

marmare

qualitatcalidade

-

composiciócompositzione

-

aplicacióapplicatzione

+

composiciócumpositzione

+

aplicacióaplicatzione

soluciósolutzione

critericritèriu

mantenimentmantenimentu

@@ -1129,7 +1141,7 @@

assimilacióassimilatzione

paràbolaparabula

penínsulapenìsola

-

consonantcunsonante

+

consonantcunsonante

principiprintzìpiu

acordacordu

fifine

@@ -1220,8 +1232,7 @@

treballadortraballadore

apartheidapartheid

-

presidentpresidente

-

presidentpresidente

+

presidentpresidente

veritatberu

políticapolìtica

desenvolupamentisvilupu

@@ -1401,7 +1412,7 @@

condicióconditzione

budistabuddhista

signesignu

-

satèl·litsatellite

+

satèl·litsatèllite

ritmeritmu

plantapranta

pacifistapacifista

@@ -1416,14 +1427,14 @@

climaclima

classeclasse

realitzaciórealizatzione

-

monestirmonasteriu

-

màfiamafia

+

monestirmonastèriu

+

màfiamàfia

interlinguainterlingua

iniciativainitziativa

geografiageografia

generaciógeneratzione

-

fotògraffotografu

-

fotògraffotografu

+

fotògraffotògrafu

+

fotògraffotògrafu

autobiografiaautobiografia

anarquiaanarchia

vocalvocale

@@ -1468,8 +1479,8 @@

modificaciómodificatzione

biografiabiografia

preposicióprepositzione

-

príncepprintzipe

-

príncepprintzipe

+

príncepprìntzipe

+

príncepprìntzipe

representaciórapresentatzione

representaciórapresentàntzia

regularitatregularidade

@@ -1609,7 +1620,7 @@

sacrificisacrifìtziu

poemapoema

llàgrimalàgrima

-

imatgeimàgine

+

golabuca

fullfògiu

foscoriscuru

@@ -1623,7 +1634,7 @@

AnglaterraInghilterra

MaltaMalta

-

JapóGiappone

+

JapóGiapone

CamerunCamerun

EslovèniaIslovènia

RegneUnitRegnuUnidu

@@ -1665,10 +1676,11 @@

CanadàCanada

ÀustriaAustria

Sud-àfricaSudàfrica

-

PolòniaPolonia

+

PolòniaPolània

SuïssaIsvìtzera

ChicagoChicago

-

AzerbaidjanAzerbaigián

+

XicagoChicago

+

AzerbaidjanAzerbaigiàn

ArgentinaArgentina

VietnamVietnàm

BerlínBerlinu

@@ -1675,10 +1687,10 @@

TurquiaTurchia

MoscouMosca

VaticàVaticanu

-

SudanSudan

-

MesopotàmiaMesopotamia

+

SudanSudàn

+

MesopotàmiaMesopotàmia

GeòrgiaGeòrgia

-

FiladèlfiaFiladelfia

+

FiladèlfiaFiladèlfia

CarboniaCarbònia

LiechtensteinLiechtenstein

SantiagoSantiago

@@ -1695,12 +1707,12 @@

CannesCannes

NovaYorkNewYork

NovaDelhiNewDelhi

-

TeheranTeheran

+

TeheranTeheràn

StanfordStanford

SíriaSìria

-

NatzaretNazaret

+

NatzaretNazarèt

GranBretanyaBretagnaManna

-

TràciaTracia

+

TràciaTràtzia

SantFrancescSantuFrantziscu

SanMarinoSanMarino

RomaniaRomania

@@ -2091,9 +2103,8 @@

segonsegundu

primerprimu

-

quartcuartu

-

últimùrtimu

-

penúltimpenùrtimu

+

últimùrtimu

+

penúltimpenùrtimu

mateixmatessi

similarchepare

@@ -2140,9 +2151,9 @@

libanèslibanesu

elèctricelètricu

japonèsgiaponesu

-

suecsvedesu

+

suecisvedesu

megalíticmegalìticu

-

simplesèmplitze

+

simplesèmplitze

industrialindustriale

provincialprovintziale

físicfìsicu

@@ -2151,7 +2162,7 @@

portàtilportàtile

poderóspoderosu

mecànicmecànicu

-

interessantinteressante

+

interessantinteressante

impressionantimpressionante

fèrtilfèrtile

electròniceletrònicu

@@ -2166,8 +2177,8 @@

solarsolare

carcaru

binaribinàriu

-

albanèsarbanesu

-

albanèsarbanese

+

albanèsalbanesu

+

albanèsalbanese

tecnològictecnològicu

aritmèticaritmèticu

jurídicgiurìdicu

@@ -2219,7 +2230,7 @@

cristiàcristianu

personalpersonale

democràticdemocràticu

-

socialdemòcratasocialdemocràticu

+

socialdemòcratasotzialdemocràticu

distintdistintu

diversdiversu

hebreuebràicu

@@ -2237,7 +2248,7 @@

governatiuguvernativu

satíricsatìricu

sahariàsaharianu

-

evidentevidente

+

evidentevidente

autònomautònomu

pluralplurale

formalformale

@@ -2285,9 +2296,9 @@

moltmeda

holandèsolandesu

hongarèsungheresu

-

importantimportante

+

importantimportante

independentistaindipendentista

-

socialistasocialista

+

socialistasotzialista

generalistageneralista

internacionalinternatzionale

llatílatinu

@@ -2320,7 +2331,7 @@

sud-africàsudafricanu

tradicionaltraditzionale

turcturcu

-

turísticturisticu

+

turísticturìsticu

característiccaraterìsticu

ucraïnèsucrainu

públicpùblicu

@@ -2406,7 +2417,7 @@

menorminore

mutmudu

negrenieddu

-

potentpotente

+

potentpotente

pleprenu

professionalprofessionale

romàromanu

@@ -2472,7 +2483,7 @@

vermellruju

roigruju

-

diminutminore

+

diminutminore

@@ -2693,13 +2704,13 @@

nominarnominare

menjarmandigare

indicarindicare

-

caracteritzarcaraterizzare

+

caracteritzarcaraterizare

manifestarmanifestare

manarmandare

distingirdistìnghere

analitzaranalizare

colonitzarcolonizare

-

acompanyaraccumpagnare

+

acompanyaracumpagnare

servirserbire

proposarpropònnere

proclamarproclamare

@@ -2717,8 +2728,8 @@

sortiressire

demostrardimostrare

confirmarcunfirmare

-

compilarcumpilare

-

canviarcàmbiare

+

compilarcompilare

+

canviarcambiare

buscarbuscare

aprendreimparare

pensarpensare

@@ -2743,7 +2754,7 @@

deixardassare

arribararribare

quedarabarrare

-

representarrappresentare

+

representarrapresentare

interessarinteressare

costarcostare

mostrarmustrare

@@ -2772,7 +2783,7 @@

aprovaraprovare

afirmarafirmare

acostumaracostumare

-

acumularaccumulare

+

acumularacumulare

constituircostituire

basarbasare

freqüentarfrecuentare

@@ -2788,11 +2799,10 @@

obrirabèrrere

trencarsegare

recordarregordare

-

aprofitarprovochere

atendreisetare

empresonarimpresonare

enviarimbiare

-

emergiremergere

+

emergiristupare

solercostumare

aprovarcolare

esborrarburrare

@@ -2898,7 +2908,7 @@

escaparfuire

gaudirgodire

començarimbetzare

-

aprendreimparere

+

aprendreimparare

trobarimbènnere

especialitzarispetzializare

estudiaristudare

@@ -2937,7 +2947,7 @@

dirigirdirìgere

assignarassignare

presenciarpresentziare

-

italianitzaritalianisare

+

italianitzaritalianizare

sentirsentire

preocuparpreoccupare

descriuredescrìere

@@ -3048,7 +3058,7 @@

exiliaresiliare

acceleraratzelerare

acontentaracuntentare

-

acreditaracrèditare

+

acreditaracreditare

respectarrespetare

redactarredatare

@@ -3072,7 +3082,7 @@

escollirseberare

obligarobrigare

-

odiaròdiare

+

odiarodiare

orientarpunnare

tutelartutelare

desocupardisocupare

@@ -3080,7 +3090,7 @@

sotmetreassuzetare

promourepromovare

promourepromòvere

-

normalitzarnormalizere

+

normalitzarnormalizare

establiristabilire

llegirlèghere

partirpartire

@@ -3125,12 +3135,12 @@

estecustu

eixecustu

unseguitdeunasèriede

-

algunaltrecalicunuàteru

-

senglesambos

+ +

aqueixcustu

-

totunseguitdetotuunasèriede

-

ningunnemos

+

ningunnessunu

+

ningunnemos

uniunaltreunues'àteru

vint-i-unbintunu

trenta-untrintunu

@@ -3146,7 +3156,6 @@

queca

onue

elquesuchi

-

elquecale

quèchi

quèite

quèca

@@ -3155,14 +3164,14 @@

alqualasuchi

alqualacale

qualcale

-

elquisuchi

+

elquisuchi

elquichie

aonaue

alquiasuchi

alquiachie

-

delquide

-

pelquiprochi

-

quantcantu

+ + +

quantcantu

jaquesigomente

aixícomgosicomente

@@ -3174,6 +3183,7 @@

ésadirestanàrrere

demaneraquedemanerachi

aleshorestando

+

llavorstando

abansqueinantischi

talcomgosicomente

desprésqueapustischi

@@ -3454,7 +3464,7 @@

sisi

homunu

allòcuddu

-

tothomtotus

+

tothomtotu

algunacosacalicunacosa

algunacosacarchicosa

qualsevolcalesisiat

@@ -3470,7 +3480,7 @@

estecustu

vostèvostè

vosbois

-

ambsicunsegus

+

algunaltrecalicunuàteru

eixecustu

totplegattotuparis

@@ -3477,14 +3487,14 @@

totplegattotuimpare

resnonudda

undesolunusolu

-

ambmicunmegus

-

noresnudda

+ +

noresnudda

vósbois

-

ambtucuntegus

+

elmeusumeu

totsjuntstotuparis

totsjuntstotugiuntos

-

altriàteros

+

elvostresubostru

totsplegatstotuparis

totsplegatstotugiuntos

@@ -3494,29 +3504,31 @@

totirestotuenudda

joqueelldeocheaissu

+

morirmòrrere

+ +

kmkm

- -

MITMIT

-

APECAPEC

+

MITMIT

+

APECAPEC

ONUONU

-

ADNADN

-

ADNDNA

-

UnescoUnesco

-

LSCLSC

-

FAOFAO

-

LSULSU

-

OPEPOPEC

-

OTANNATO

-

AIEAIAEA

-

OSCEOSCE

-

sidaSIDA

-

SIDAAIDS

-

CIACIA

-

AFIIPA

-

VIHVIH

-

GNUGNU

+

ADNADN

+

ADNDNA

+

UnescoUnesco

+

LSCLSC

+

FAOFao

+

LSULSU

+

OPEPOPEC

+

OTANNATO

+

AIEAIAEA

+

OSCEOSCE

+

sidaSIDA

+

SIDAAIDS

+

CIACIA

+

AFIIPA

+

VIHVIH

+

GNUGNU

@@ -3527,5 +3539,16 @@ [\(\[]

[\)\]]

+

mésprus

+

següentimbeniente

+

obraòpera

+

properimbeniente

+

vavanu

+

parellapariga

+

parellacroba

+

incrementacreschimentu

+

altreàteru

+

morirmòrrere

+ Index: staging/apertium-cat-srd/dev/testvoc/bidix-unknowns.sh =================================================================== --- staging/apertium-cat-srd/dev/testvoc/bidix-unknowns.sh (nonexistent) +++ staging/apertium-cat-srd/dev/testvoc/bidix-unknowns.sh (revision 78982) @@ -0,0 +1,98 @@ +#!/bin/bash + +set -e -u + +if [[ $# -eq 1 ]]; then + lang=$1 + monodix=guess + bidix=guess + side=guess +elif [[ $# -eq 4 ]]; then + lang=$1 + monodix=$2 + bidix=$3 + side=$4 +else + cat >&2 <&2 +lt-expand "${monodix}" \ + | grep -ve __REGEXP__ \ + | sed 's/[^:]*//; s/\(<.*>\)\(#.*\)/\2\1/' \ + | LC_ALL=C sort -u >"${exp}" + +in_mono () { + # bidix has prefixes of monodix, have to use look instead of comm :-/ + LC_ALL=C look "$1" "${exp}" >/dev/null +} +echo "Expanding bidix and checking for entries missing from monodix …" >&2 +lt-expand "${bidix}" \ + | awk -vside="${side}" -F':|:[<>]:' ' + BEGIN { + if(side=="l") { + nside=1 + LR=":>:" + RL=":<:" + } + else { + nside=2 + LR=":<:" # flip it + RL=":>:" # and reverse + } + } + # Make bidix match up with monodix (left=left, right=right): + /:>:/ { print LR $nside; next } + /:<:/ { print RL $nside; next } + /:/ { print ":"$nside } +' \ + | while read -r bientry; do + # Bidix now normalised to have the requested monodix on the "left" + case ${bientry} in + ":>:"* ) # If it's LR in bidix, then we check if unmarked / LR is in monodix + in_mono "${bientry##:>}" || in_mono "${bientry}" || echo "${bientry}" + ;; + ":<:"* ) # If it's RL in bidix, then we check if unmarked / RL is in monodix + in_mono "${bientry##:<}" || in_mono "${bientry}" || echo "${bientry}" + ;; + ":"* ) # If it's unmarked in bidix, then we check if unmarked / LR / RL in monodix + in_mono "${bientry}" || in_mono ":>${bientry}" || in_mono ":<${bientry}" || echo "${bientry}" + ;; + *) echo "ERROR: unexpected bientry format: ${bientry}" >&2;; + esac + done Index: staging/apertium-cat-srd/dev/testvoc/generation.sh =================================================================== --- staging/apertium-cat-srd/dev/testvoc/generation.sh (nonexistent) +++ staging/apertium-cat-srd/dev/testvoc/generation.sh (revision 78982) @@ -0,0 +1,98 @@ +#!/bin/bash + +set -e -u + +if [[ $# -eq 1 ]]; then + mode=$1 + dix=guess +elif [[ $# -eq 2 ]]; then + mode=$1 + dix=$2 +else + cat >&2 <"clb"$" + }' + # give the "disambiguated" output, no forms +} + +split_ambig () { + if command -V pypy3 &>/dev/null; then + python=pypy3 + else + python=python3 + fi + PYTHONPATH="$(dirname "$0"):${PYTHONPATH:-}" "${python}" -c ' +from streamparser import parse_file, readingToString +import sys +for blank, lu in parse_file(sys.stdin, withText=True): + print(blank+" ".join("^{}/{}$".format(lu.wordform, readingToString(r)) + for r in lu.readings), + end="")' + +} + +mode_after_analysis () +{ + eval $(grep '|' "$1" |\ + sed 's/[^|]*|//' |\ + sed 's/.*apertium-pretransfer/apertium-pretransfer/' |\ + sed 's/lt-proc -p[^|]*/cat/' |\ + sed 's/autobil.bin *|/& split_ambig |/' |\ + sed 's/\$1/-d/g;s/\$2//g') + # lt-proc -p fails +} + +only_errs () { + grep '][^<]*[#/]' +} + + +lang1=${mode%%-*} + +if [[ ${dix} = guess ]]; then + lang1dir=$(grep -m1 "^AP_SRC.*apertium-${lang1}" config.log | sed "s/^[^=]*='//;s/'$//") + dix=${lang1dir}/apertium-${lang1}.${lang1}.dix +fi + +clb="" +case ${lang1} in + nno|nob) clb="" ;; +esac + +# Make it possible to edit the .dix while testvoc is running: +dixtmp=$(mktemp -t gentestvoc.XXXXXXXXXXX) +trap 'rm -f "${dixtmp}"' EXIT +cat "${dix}" > "${dixtmp}" + +analysis_expansion "${mode}" "${clb}" \ + | mode_after_analysis modes/"${mode}".mode \ + | only_errs Property changes on: staging/apertium-cat-srd/dev/testvoc/generation.sh ___________________________________________________________________ Added: svn:executable ## -0,0 +1 ## +* \ No newline at end of property Index: staging/apertium-cat-srd/dev/testvoc/streamparser.py =================================================================== --- staging/apertium-cat-srd/dev/testvoc/streamparser.py (nonexistent) +++ staging/apertium-cat-srd/dev/testvoc/streamparser.py (revision 78982) @@ -0,0 +1,144 @@ +#!/usr/bin/python3 +# -*- coding: utf-8 -*- +""" +Usage: streamparser.py [FILE] + +Consumes input from a file (first argument) or stdin, parsing and pretty printing the readings of lexical units found. +""" + +import re, pprint, sys, itertools, fileinput +from collections import namedtuple + +SReading = namedtuple('SReading', ['baseform', 'tags']) + +def subreadingToString(sub): + return sub.baseform+"".join("<"+t+">" for t in sub.tags) + +def readingToString(reading): + return "+".join(subreadingToString(sub) for sub in reading) + +def mainpos(reading, ltr=False): + """Return the first part-of-speech tag of a reading. If there are + several subreadings, by default give the first tag of the last + subreading. If ltr=True, give the first tag of the first + subreading, see + http://beta.visl.sdu.dk/cg3/single/#sub-stream-apertium for more + information. + + """ + if ltr: + return reading[0].tags[0] + else: + return reading[-1].tags[0] + +class LexicalUnit: + + """A lexical unit consisting of a lemma and its readings. + + Attributes: + lexicalUnit (str): The lexical unit in Apertium stream format. + wordform (str): The word form (surface form) of the lexical unit. + readings (list of list of SReading): The analyses of the lexical unit with sublists containing all subreadings. + """ + + def __init__(self, lexicalUnit): + self.lexicalUnit = lexicalUnit + + cohort = re.split(r'(?]+>)+)', reading) + for subreading in subreadingParts: + baseform = subreading[0].lstrip('+') + tags = re.findall(r'<([^>]+)>', subreading[1]) + + subreadings.append(SReading(baseform=baseform, tags=tags)) + + self.readings.append(subreadings) + + def __repr__(self): + return self.lexicalUnit + + +def parse(stream, withText=False): + """Generates lexical units from a character stream. + + Args: + stream (iterable): A character stream containing lexical units, superblanks and other text. + withText (bool, optional): A boolean defining whether to output preceding text with each lexical unit. + + Yields: + LexicalUnit: The next lexical unit found in the character stream. (if withText is False) + (str, LexicalUnit): The next lexical unit found in the character stream and the the text that seperated it from the prior unit in a tuple. (if withText is True) + """ + + buffer = '' + textBuffer = '' + inLexicalUnit = False + inSuperblank = False + + for char in stream: + + if inSuperblank: + if char == ']': + inSuperblank = False + textBuffer += char + elif char == '\\': + textBuffer += char + textBuffer += next(stream) + else: + textBuffer += char + elif inLexicalUnit: + if char == '$': + if withText: + yield (textBuffer, LexicalUnit(buffer)) + else: + yield LexicalUnit(buffer) + buffer = '' + textBuffer = '' + inLexicalUnit = False + elif char == '\\': + buffer += char + buffer += next(stream) + else: + buffer += char + else: + if char == '[': + inSuperblank = True + textBuffer += char + elif char == '^': + inLexicalUnit = True + elif char == '\\': + textBuffer += char + textBuffer += next(stream) + else: + textBuffer += char + + +def parse_file(f, withText=False): + """Generates lexical units from a file. + + Args: + f (file): A file containing lexical units, superblanks and other text. + + Yields: + LexicalUnit: The next lexical unit found in the file. + """ + + return parse(itertools.chain.from_iterable(f), withText) + + +if __name__ == '__main__': + lexicalUnits = parse_file(fileinput.input()) + + for lexicalUnit in lexicalUnits: + pprint.pprint(lexicalUnit.readings, width=120) Index: staging/apertium-cat-srd/dev/inconsistency.sh =================================================================== --- staging/apertium-cat-srd/dev/inconsistency.sh (revision 78978) +++ staging/apertium-cat-srd/dev/inconsistency.sh (revision 78982) @@ -1,19 +1,19 @@ TMPDIR=/tmp -if [[ $1 = "sc-ca" ]]; then +if [[ $1 = "srd-cat" ]]; then -lt-expand ../apertium-ca-sc.sc.dix | grep -v REGEX | grep -v '' | sed 's/:>:/%/g' | grep -v ':<:' | sed 's/:/%/g' | cut -f2 -d'%' | sed 's/^/^/g' | sed 's/$/$ ^.$/g' | tee $TMPDIR/tmp_testvoc1.txt | +lt-expand ../apertium-cat-srd.srd.dix | grep -v REGEX | grep -v '' | sed 's/:>:/%/g' | grep -v ':<:' | sed 's/:/%/g' | cut -f2 -d'%' | sed 's/^/^/g' | sed 's/$/$ ^.$/g' | tee $TMPDIR/tmp_testvoc1.txt | apertium-pretransfer| - apertium-transfer ../apertium-ca-sc.sc-ca.t1x ../sc-ca.t1x.bin ../sc-ca.autobil.bin | tee $TMPDIR/tmp_testvoc2.txt | - lt-proc -d ../sc-ca.autogen.bin > $TMPDIR/tmp_testvoc3.txt + apertium-transfer ../apertium-cat-srd.srd-cat.t1x ../srd-cat.t1x.bin ../srd-cat.autobil.bin | tee $TMPDIR/tmp_testvoc2.txt | + lt-proc -d ../srd-cat.autogen.bin > $TMPDIR/tmp_testvoc3.txt paste -d _ $TMPDIR/tmp_testvoc1.txt $TMPDIR/tmp_testvoc2.txt $TMPDIR/tmp_testvoc3.txt | sed 's/\^.\$//g' | sed 's/_/ ---------> /g' -elif [[ $1 = "ca-sc" ]]; then +elif [[ $1 = "cat-srd" ]]; then -lt-expand ../ca/ca.dix | grep -v REGEX | grep -v '' | sed 's/:>:/%/g' | grep -v ':<:' | sed 's/:/%/g' | cut -f2 -d'%' | sed 's/^/^/g' | sed 's/$/$ ^.$/g' | tee $TMPDIR/tmp_testvoc1.txt | +lt-expand ../cat/cat.dix | grep -v REGEX | grep -v '' | sed 's/:>:/%/g' | grep -v ':<:' | sed 's/:/%/g' | cut -f2 -d'%' | sed 's/^/^/g' | sed 's/$/$ ^.$/g' | tee $TMPDIR/tmp_testvoc1.txt | apertium-pretransfer| - apertium-transfer ../apertium-ca-sc.ca-sc.t1x ../ca-sc.t1x.bin ../ca-sc.autobil.bin | tee $TMPDIR/tmp_testvoc2.txt | - lt-proc -d ../ca-sc.autogen.bin > $TMPDIR/tmp_testvoc3.txt + apertium-transfer ../apertium-cat-srd.cat-srd.t1x ../cat-srd.t1x.bin ../cat-srd.autobil.bin | tee $TMPDIR/tmp_testvoc2.txt | + lt-proc -d ../cat-srd.autogen.bin > $TMPDIR/tmp_testvoc3.txt paste -d _ $TMPDIR/tmp_testvoc1.txt $TMPDIR/tmp_testvoc2.txt $TMPDIR/tmp_testvoc3.txt | sed 's/\^.\$//g' | sed 's/_/ ---------> /g' Index: staging/apertium-cat-srd/dev/testvoc-summary.ca-sc.txt =================================================================== --- staging/apertium-cat-srd/dev/testvoc-summary.ca-sc.txt (revision 78978) +++ staging/apertium-cat-srd/dev/testvoc-summary.ca-sc.txt (revision 78982) @@ -1,27 +1,3 @@ -dj nov 18 12:01:34 GMT 2010 -=============================================== -POS Total Clean With @ With # Clean % -vblex 53984 53984 0 0 100 -vbmod 5671 5671 0 0 100 -pr 5382 5382 0 0 100 -n 2857 2857 0 0 100 -adj 2572 2572 0 0 100 -np 466 466 0 0 100 -det 397 397 0 0 100 -adv 165 165 0 0 100 -prn 147 147 0 0 100 -vbser 115 115 0 0 100 -vbhaver 95 95 0 0 100 -num 87 87 0 0 100 -rel 63 63 0 0 100 -cnjsub 20 20 0 0 100 -abbr 20 20 0 0 100 -cnjadv 14 14 0 0 100 -predet 10 10 0 0 100 -cnjcoo 7 7 0 0 100 -preadv 5 5 0 0 100 -vaux 0 0 0 0 100 -ij 0 0 0 0 100 -guio 0 0 0 0 100 -cm 0 0 0 0 100 -=============================================== +Sun Jun 4 22:49:09 MSK 2017 +-e =============================================== +-e POS Total Clean With @ With # Clean % Index: staging/apertium-cat-srd/dev/testvoc.sh =================================================================== --- staging/apertium-cat-srd/dev/testvoc.sh (revision 78978) +++ staging/apertium-cat-srd/dev/testvoc.sh (revision 78982) @@ -1,5 +1,5 @@ echo "==Catalan->Sardinian=========================="; -bash inconsistency.sh ca-sc > /tmp/ca-sc.testvoc; sh inconsistency-summary.sh /tmp/ca-sc.testvoc ca-sc +bash inconsistency.sh cat-srd > /tmp/cat-srd.testvoc; sh inconsistency-summary.sh /tmp/cat-srd.testvoc cat-srd #echo "" #echo "==Sardinian->Catalan==========================="; -#bash inconsistency.sh sc-ca > /tmp/sc-ca.testvoc; bash inconsistency-summary.sh /tmp/sc-ca.testvoc sc-ca +#bash inconsistency.sh srd-cat > /tmp/srd-cat.testvoc; bash inconsistency-summary.sh /tmp/srd-cat.testvoc srd-cat Index: languages/apertium-srd/apertium-srd.srd.dix =================================================================== --- languages/apertium-srd/apertium-srd.srd.dix (revision 78978) +++ languages/apertium-srd/apertium-srd.srd.dix (revision 78982) @@ -449,7 +449,7 @@

a u

- +

u u

us u

@@ -497,6 +497,10 @@

+ +

+
+

suchi suchi

sachi suchi

@@ -517,6 +521,11 @@

+ +

+

s

+
+

u u

a u

@@ -3716,7 +3725,7 @@ a - cale + cale cando

candu cando

cant @@ -6070,7 +6079,7 @@ tegus tene tie - tot + tot trop tue un @@ -15865,6 +15874,7 @@ XVIII XX XXI + XXII bndighi barant baranta @@ -16126,6 +16136,7 @@ CV AG AIDS + APEC ATP BBC BMW @@ -16145,6 +16156,7 @@ HD HMS IAEA + IPA ITF Incumandtzia Institute @@ -36723,8 +36735,7 @@ satzerdote satzerdotissa satzina -

satèllite satellite

-

satèlliti satellite

+

satèlliti satèllite

saucrgi sauc sauca @@ -37833,7 +37844,7 @@ sutzidura sutzone

svedes isvedes

-

sàtellite satellite

+

sàtellite satèllite

sècul sècul

sèmene

sécul sècul

@@ -43414,6 +43425,7 @@ Jim Jimmy Joan + Carles Joe Johann John @@ -55847,6 +55859,8 @@ prus + monoparental + verticale