Index: staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix =================================================================== --- staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix (revision 79648) +++ staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix (revision 79650) @@ -1718,7 +1718,6 @@

NatzaretNazarèt

GranBretanyaBretagnaManna

TràciaTràtzia

-

SantFrancescSantuFrantziscu

SanMarinoSanMarino

RomaniaRomania

PrússiaPrùssia

@@ -5499,11 +5498,10 @@

plantarprantare

butllasègliu

atraparaferrare

-

ParisParigi

+

ParisHiltonParisHilton

souistipèndiu

filtrefiltru

càtedracàtedra

-

SánchezSánchez

dauraraorare

pressupostbilantzu

crèditcrèditu

@@ -5768,7 +5766,6 @@

confiscarcunfiscare

informàticinformàticu

fidelitatfidelidade

-

SantAntoniSantuAntoni

deduirdeduire

tòxictòssicu

nominaciódenominatzione

@@ -7214,7 +7211,6 @@

energèticenergèticu

bíblicbìblicu

prehistòricpreistòricu

-

CaucasCaucas

cantonadacantonada

floraflora

BolonyaBologna

@@ -7536,8 +7532,6 @@

flamaframa

flamapampa

ColumbiaColumbia

-

SimóSimone

-

SimóSimone

emergènciaemergèntzia

TroiaTroia

barretbonete

@@ -8885,6 +8879,140 @@

existentchiesistit

sortintchiessit

flotantchigalligiat

+

incloentchiincluet

+

resistentchiresistit

+

resultantchirisultat

+

solublechis'isòlvet

+

sobrantchisobrat

+

discogràficaagèntziadiscogràfica

+

arribaraarribarea

+

arribaralòmperea

+

participarenpartetziparea

+

seriarfàghereinsèrie

+

ferservirimpreare

+

ferservirtratare

+

SanSan

+

comptarambcontarecun

+

tractardetratarede

+

tenirlloctènnerelogu

+

duratermecumprire

+

necessitartènnerebisòngiu

+

anunciarannuntziare

+

menysdemancu

+

àrabàrabu

+

tenirencomptetènnereincontu

+

alumnealunnu

+

actoratore

+

paisatgepaesàgiu

+

ordreòrdine

+

SantJoanSantJoan

+

reconstruirtorrareacostrùere

+

tallerlaboratòriu

+

donarsuportsuportare

+

múltipleplùrimu

+

protagonitzarfàgheresuprotagonista

+

protagonitzarinterpretare

+

allunyaristesiare

+

reprendretorrareapigare

+

donarsuportaamparare

+

pacientmalàidu

+

políticpolìticu

+

rellevantdeimportumannu

+

portaratermeacabare

+

ermitaeremitanu

+

persapersianu

+

exerciciesertzìtziu

+

equiparfàghereparis

+

UCIUCI

+

impulsimpèllida

+

tècnictècnicu

+

tripulacióatretzadura

+

adultmannu

+

fabricantfraigadore

+

negrenieddu

+

culminarartziareapunta

+

culminarcròmpere

+

visitantbisitadore

+

consideratpoderiu

+

polsprùere

+

ferfrontfàgherefronte

+

promèsamoradu

+

almirallammiràlliu

+

fanammiradore

+

fluvialdesuriu

+

apartarpònnereaunala

+

apartarpònnereabanda

+

francèsfrantzesu

+

ParisParis

+

SánchezSánchez

+

botànicbotànicu

+

laboraldesutraballu

+

frontaldefronte

+

UEUE

+

berberbèrberu

+

destacabledecussiderare

+

WilliamsWilliams

+

ajuntarpònnereapare

+

ajuntarregollire

+

ISOISO

+

químicchìmicu

+

CNTCNT

+

PPPP

+

CaucasCaucas

+

estard'acordèsseredeacordu

+

estard'acordabarraredeacordu

+

corporaldecorpus

+

canviarelnomcambiaresunùmene

+

senyorsennore

+

comarcaldesacontrada

+

concentrarencuntzentrarein

+

amorósdeamore

+

restantchiabarrat

+

restantchisobrat

+

ostatgepresoneri

+

dorsaldepalas

+

depesdepede

+

SimóSimone

+

SimóSimone

+

cerebraldesucherbeddu

+

empresarialdeimpresa

+

IBMIBM

+

deudeghe

+

melmele

+

precedentdeinantis

+

policialdesapolitzia

+

pregàriapregadoria

+

orquestraldeorchestra

+

RAFRAF

+

cridarl'atencióatirares'atentzione

+

transversaldetraessu

+

espectraldepantasma

+

floraldefrores

+

ETAETA

+

dibuixantdisegnadore

+

puntuabledeistimare

+

PlaPla

+

PCEPCE

+

ancestreantepassadu

+

patrópatronu

+

lladreladru

+

PAPA

+

romàromanu

+

retrocedirtorrareadaesegus

+

ACAC

+

comestiblebonuamandigare

+

catalàcatalanu

+

acoblarpònnereapare

+

acoblarcrobare

+

passadísistentu

+

reaparèixertorrareaapàrrere

+

narradornarradore

+

alcaldiacàrrigadesìndigu

+

vulnerabledefèrrere

+

rupestrederoca:detrèmene

+

PSCPSC

+

HTMLHTML

+ Index: staging/apertium-cat-srd/carregar_lexic.pl =================================================================== --- staging/apertium-cat-srd/carregar_lexic.pl (revision 79648) +++ staging/apertium-cat-srd/carregar_lexic.pl (revision 79650) @@ -47,7 +47,7 @@ while (my $linia = <$fitx>) { chop $linia; -#print "1. fitxer $nfitx, $linia\n" if $nfitx eq 'cat' && $linia =~ /comarca/o; +print "1. fitxer $nfitx, $linia\n" if $nfitx eq 'cat' && $linia =~ /Aliaga/o; if ($linia =~ m|.*.*|o) { $lemma = $1; $par = $2; @@ -78,18 +78,18 @@ if ($par =~ /__(.*)$/o) { $morf = $1; } else { - die "fitxer $nfitx, $linia, par=$par, morf=$morf"; + die "fitxer $nfitx, $linia, par=$par"; } -#print "2. fitxer $nfitx, $linia, par=$par, morf=$morf\n" if $nfitx eq 'cat' && $linia =~ /comarca/o; +print "2. fitxer $nfitx, $linia, par=$par, morf=$morf\n" if $nfitx eq 'cat' && $linia =~ /Aliaga/o; if ($morf ne 'n' && $morf ne 'adj' && $morf ne 'adv' && $morf ne 'np' && $morf ne 'vblex' && $morf ne 'abbr') { # print STDERR "línia $.: $linia - morf $morf\n"; next; } -#print "3. fitxer $nfitx, $linia, par=$par, morf=$morf\n" if $nfitx eq 'cat' && $linia =~ /comarca/o; +print "3. fitxer $nfitx, $linia, par=$par, morf=$morf\n" if $nfitx eq 'cat' && $linia =~ /Aliaga/o; $r_struct->{$morf}{$lemma} = $par; #print "r_struct->{$morf}{$lemma} = $r_struct->{$morf}{$lemma}\n" if $par =~ /vblex/o; -#print "r_struct->{$morf}{$lemma} = $r_struct->{$morf}{$lemma}\n" if $lemma =~ /comarca/o; +print "r_struct->{$morf}{$lemma} = $r_struct->{$morf}{$lemma}\n" if $lemma =~ /Aliaga/o; #print "r_struct->{$morf}{$lemma} = $r_struct->{$morf}{$lemma}\n"; } } @@ -107,7 +107,7 @@ while (my $linia = <$fitx>) { chop $linia; $linia =~ s|| |og; -#print "1. fitxer $nfitx, $linia\n" if $nfitx eq 'cat' && $linia =~ /comarca/o; +print "1. fitxer bidix, $linia\n" if $linia =~ /Aliaga/o; if ($linia =~ m| *

([^<]*)([^<]*){$morf}{$lemma_cat} = $lemma_srd; #print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n" if $morf =~ /vblex/o; -print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n" if $lemma_cat =~ /conegut/o; +#print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n" if $lemma_cat =~ /conegut/o; #print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n"; } } @@ -163,6 +163,8 @@ while (my $linia = ) { chop $linia; $linia =~ s/[^a-z\t]+$//o; + $linia =~ s|\r| |og; + $linia =~ s| +| |og; my @dades = split /\t/, $linia; for (my $i=0; $i<=$#dades; $i++) { $dades[$i] =~ s/^ +//o; @@ -220,6 +222,7 @@ $stem_srd =~ s| ||og; my $gram_cat = $dades[2]; + $gram_cat =~ s/ //og; $gram_cat =~ s/^ * *$//og; if ($gram_cat =~ /> *$//og; @@ -281,9 +285,26 @@ # comprovo que és en el diccionari monolingüe print STDERR "FALTA CAT $lemma_cat <$gram_cat>\n" unless $par_cat; # seria estranyíssim no trobar-lo! next unless $par_cat; - print STDERR "Falta srd $lemma_srd <$gram_srd>\n" unless $par_srd; - next unless $par_srd; + unless ($par_srd) { + # generem el paradigma al diccionari sard (tot i que només en alguns casos) + if ($lemma_srd =~ /^de /) { + $par_srd = 'matessi__adj'; + printf $fsrd " %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($lemma_srd =~ /^a /) { + $par_srd = 'matessi__adj'; + printf $fsrd " %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($lemma_srd =~ /^chi /) { + $par_srd = 'chi_proveni/t__adj'; + my $stem_srd2 = $stem_srd; + $stem_srd2 =~ s/t$//o; + printf $fsrd " %s\n", $lemma_srd, $stem_srd2, $par_srd; + } else { + print STDERR "Falta srd $lemma_srd <$gram_srd>\n"; + next; + } + } + if ($par_cat eq 'multimèdia__adj' && $par_srd eq 'matessi__adj') { printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } elsif ($par_cat eq 'abdominal__adj' && $par_srd eq 'matessi__adj') { @@ -466,9 +487,21 @@ print STDERR "FALTA CAT $lemma_cat <$gram_cat>\n" unless $par_cat; # seria estranyíssim no trobar-lo! # print STDERR "dades[1] = #$dades[1]#, length = ", length($dades[1]), "\n" unless $par_cat; next unless $par_cat; - print STDERR "Falta srd $lemma_srd <$gram_srd>\n" unless $par_srd; - next unless $par_srd; + unless ($par_srd) { + # generem el paradigma al diccionari sard (tot i que només en alguns casos) + if ($par_cat eq 'BBC__n') { + $par_srd = 'TV__n'; + printf $fsrd " %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($par_cat eq 'BBVA__n') { + $par_srd = 'PNB__n'; + printf $fsrd " %s\n", $lemma_srd, $stem_srd, $par_srd; + } else { + print STDERR "Falta srd $lemma_srd <$gram_srd>\n"; + next; + } + } + if ($par_cat eq 'abell/a__n' && $par_srd eq 'mesa__n') { printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } elsif ($par_cat eq 'abell/a__n' && $par_srd eq 'region/e__n') { @@ -735,6 +768,7 @@ next unless $par_cat; unless ($par_srd) { +print "No es troba dix_srd{$gram_srd}{$lemma_srd}. Es prova de generar $lemma_srd\n" if $lemma_cat =~ /Aliaga/o; # generem el paradigma al diccionari sard if ($gram_srd eq 'np> afus afusc ag +

agèntziadiscogràfica agèntziadiscogràfica

+

agèntziasdiscogràficas agèntziadiscogràfica

ag aggia agabb @@ -46719,7 +46721,8 @@ group vbser ****************************** --> -

alargualargu

+

alargualargu

+

deacordudeacordu