Index: staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix
===================================================================
--- staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix (revision 79648)
+++ staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix (revision 79650)
@@ -1718,7 +1718,6 @@
NatzaretNazarèt
GranBretanyaBretagnaManna
TràciaTràtzia
- SantFrancescSantuFrantziscu
SanMarinoSanMarino
RomaniaRomania
PrússiaPrùssia
@@ -5499,11 +5498,10 @@
plantarprantare
butllasègliu
atraparaferrare
- ParisParigi
+ ParisHiltonParisHilton
souistipèndiu
filtrefiltru
càtedracàtedra
- SánchezSánchez
dauraraorare
pressupostbilantzu
crèditcrèditu
@@ -5768,7 +5766,6 @@
confiscarcunfiscare
informàticinformàticu
fidelitatfidelidade
- SantAntoniSantuAntoni
deduirdeduire
tòxictòssicu
nominaciódenominatzione
@@ -7214,7 +7211,6 @@
energèticenergèticu
bíblicbìblicu
prehistòricpreistòricu
- CaucasCaucas
cantonadacantonada
floraflora
BolonyaBologna
@@ -7536,8 +7532,6 @@
flamaframa
flamapampa
ColumbiaColumbia
- SimóSimone
- SimóSimone
emergènciaemergèntzia
TroiaTroia
barretbonete
@@ -8885,6 +8879,140 @@
existentchiesistit
sortintchiessit
flotantchigalligiat
+ incloentchiincluet
+ resistentchiresistit
+ resultantchirisultat
+ solublechis'isòlvet
+ sobrantchisobrat
+ discogràficaagèntziadiscogràfica
+ arribaraarribarea
+ arribaralòmperea
+ participarenpartetziparea
+ seriarfàghereinsèrie
+ ferservirimpreare
+ ferservirtratare
+ SanSan
+ comptarambcontarecun
+ tractardetratarede
+ tenirlloctènnerelogu
+ duratermecumprire
+ necessitartènnerebisòngiu
+ anunciarannuntziare
+ menysdemancu
+ àrabàrabu
+ tenirencomptetènnereincontu
+ alumnealunnu
+ actoratore
+ paisatgepaesàgiu
+ ordreòrdine
+ SantJoanSantJoan
+ reconstruirtorrareacostrùere
+ tallerlaboratòriu
+ donarsuportsuportare
+ múltipleplùrimu
+ protagonitzarfàgheresuprotagonista
+ protagonitzarinterpretare
+ allunyaristesiare
+ reprendretorrareapigare
+ donarsuportaamparare
+ pacientmalàidu
+ políticpolìticu
+ rellevantdeimportumannu
+ portaratermeacabare
+ ermitaeremitanu
+ persapersianu
+ exerciciesertzìtziu
+ equiparfàghereparis
+ UCIUCI
+ impulsimpèllida
+ tècnictècnicu
+ tripulacióatretzadura
+ adultmannu
+ fabricantfraigadore
+ negrenieddu
+ culminarartziareapunta
+ culminarcròmpere
+ visitantbisitadore
+ consideratpoderiu
+ polsprùere
+ ferfrontfàgherefronte
+ promèsamoradu
+ almirallammiràlliu
+ fanammiradore
+ fluvialdesuriu
+ apartarpònnereaunala
+ apartarpònnereabanda
+ francèsfrantzesu
+ ParisParis
+ SánchezSánchez
+ botànicbotànicu
+ laboraldesutraballu
+ frontaldefronte
+ UEUE
+ berberbèrberu
+ destacabledecussiderare
+ WilliamsWilliams
+ ajuntarpònnereapare
+ ajuntarregollire
+ ISOISO
+ químicchìmicu
+ CNTCNT
+ PPPP
+ CaucasCaucas
+ estard'acordèsseredeacordu
+ estard'acordabarraredeacordu
+ corporaldecorpus
+ canviarelnomcambiaresunùmene
+ senyorsennore
+ comarcaldesacontrada
+ concentrarencuntzentrarein
+ amorósdeamore
+ restantchiabarrat
+ restantchisobrat
+ ostatgepresoneri
+ dorsaldepalas
+ depesdepede
+ SimóSimone
+ SimóSimone
+ cerebraldesucherbeddu
+ empresarialdeimpresa
+ IBMIBM
+ deudeghe
+ melmele
+ precedentdeinantis
+ policialdesapolitzia
+ pregàriapregadoria
+ orquestraldeorchestra
+ RAFRAF
+ cridarl'atencióatirares'atentzione
+ transversaldetraessu
+ espectraldepantasma
+ floraldefrores
+ ETAETA
+ dibuixantdisegnadore
+ puntuabledeistimare
+ PlaPla
+ PCEPCE
+ ancestreantepassadu
+ patrópatronu
+ lladreladru
+ PAPA
+ romàromanu
+ retrocedirtorrareadaesegus
+ ACAC
+ comestiblebonuamandigare
+ catalàcatalanu
+ acoblarpònnereapare
+ acoblarcrobare
+ passadísistentu
+ reaparèixertorrareaapàrrere
+ narradornarradore
+ alcaldiacàrrigadesìndigu
+ vulnerabledefèrrere
+ rupestrederoca:detrèmene
+ PSCPSC
+ HTMLHTML
+
Index: staging/apertium-cat-srd/carregar_lexic.pl
===================================================================
--- staging/apertium-cat-srd/carregar_lexic.pl (revision 79648)
+++ staging/apertium-cat-srd/carregar_lexic.pl (revision 79650)
@@ -47,7 +47,7 @@
while (my $linia = <$fitx>) {
chop $linia;
-#print "1. fitxer $nfitx, $linia\n" if $nfitx eq 'cat' && $linia =~ /comarca/o;
+print "1. fitxer $nfitx, $linia\n" if $nfitx eq 'cat' && $linia =~ /Aliaga/o;
if ($linia =~ m|.*.*|o) {
$lemma = $1;
$par = $2;
@@ -78,18 +78,18 @@
if ($par =~ /__(.*)$/o) {
$morf = $1;
} else {
- die "fitxer $nfitx, $linia, par=$par, morf=$morf";
+ die "fitxer $nfitx, $linia, par=$par";
}
-#print "2. fitxer $nfitx, $linia, par=$par, morf=$morf\n" if $nfitx eq 'cat' && $linia =~ /comarca/o;
+print "2. fitxer $nfitx, $linia, par=$par, morf=$morf\n" if $nfitx eq 'cat' && $linia =~ /Aliaga/o;
if ($morf ne 'n' && $morf ne 'adj' && $morf ne 'adv' && $morf ne 'np' && $morf ne 'vblex' && $morf ne 'abbr') {
# print STDERR "línia $.: $linia - morf $morf\n";
next;
}
-#print "3. fitxer $nfitx, $linia, par=$par, morf=$morf\n" if $nfitx eq 'cat' && $linia =~ /comarca/o;
+print "3. fitxer $nfitx, $linia, par=$par, morf=$morf\n" if $nfitx eq 'cat' && $linia =~ /Aliaga/o;
$r_struct->{$morf}{$lemma} = $par;
#print "r_struct->{$morf}{$lemma} = $r_struct->{$morf}{$lemma}\n" if $par =~ /vblex/o;
-#print "r_struct->{$morf}{$lemma} = $r_struct->{$morf}{$lemma}\n" if $lemma =~ /comarca/o;
+print "r_struct->{$morf}{$lemma} = $r_struct->{$morf}{$lemma}\n" if $lemma =~ /Aliaga/o;
#print "r_struct->{$morf}{$lemma} = $r_struct->{$morf}{$lemma}\n";
}
}
@@ -107,7 +107,7 @@
while (my $linia = <$fitx>) {
chop $linia;
$linia =~ s|| |og;
-#print "1. fitxer $nfitx, $linia\n" if $nfitx eq 'cat' && $linia =~ /comarca/o;
+print "1. fitxer bidix, $linia\n" if $linia =~ /Aliaga/o;
if ($linia =~ m| *([^<]*)([^<]*){$morf}{$lemma_cat} = $lemma_srd;
#print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n" if $morf =~ /vblex/o;
-print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n" if $lemma_cat =~ /conegut/o;
+#print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n" if $lemma_cat =~ /conegut/o;
#print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n";
}
}
@@ -163,6 +163,8 @@
while (my $linia = ) {
chop $linia;
$linia =~ s/[^a-z\t]+$//o;
+ $linia =~ s|\r| |og;
+ $linia =~ s| +| |og;
my @dades = split /\t/, $linia;
for (my $i=0; $i<=$#dades; $i++) {
$dades[$i] =~ s/^ +//o;
@@ -220,6 +222,7 @@
$stem_srd =~ s| ||og;
my $gram_cat = $dades[2];
+ $gram_cat =~ s/ //og;
$gram_cat =~ s/^ */og;
$gram_cat =~ s/> *$//og;
if ($gram_cat =~ /> *$//og;
@@ -281,9 +285,26 @@
# comprovo que és en el diccionari monolingüe
print STDERR "FALTA CAT $lemma_cat <$gram_cat>\n" unless $par_cat; # seria estranyíssim no trobar-lo!
next unless $par_cat;
- print STDERR "Falta srd $lemma_srd <$gram_srd>\n" unless $par_srd;
- next unless $par_srd;
+ unless ($par_srd) {
+ # generem el paradigma al diccionari sard (tot i que només en alguns casos)
+ if ($lemma_srd =~ /^de /) {
+ $par_srd = 'matessi__adj';
+ printf $fsrd " %s\n", $lemma_srd, $stem_srd, $par_srd;
+ } elsif ($lemma_srd =~ /^a /) {
+ $par_srd = 'matessi__adj';
+ printf $fsrd " %s\n", $lemma_srd, $stem_srd, $par_srd;
+ } elsif ($lemma_srd =~ /^chi /) {
+ $par_srd = 'chi_proveni/t__adj';
+ my $stem_srd2 = $stem_srd;
+ $stem_srd2 =~ s/t$//o;
+ printf $fsrd " %s\n", $lemma_srd, $stem_srd2, $par_srd;
+ } else {
+ print STDERR "Falta srd $lemma_srd <$gram_srd>\n";
+ next;
+ }
+ }
+
if ($par_cat eq 'multimèdia__adj' && $par_srd eq 'matessi__adj') {
printf $fbi " %s%s
\n", $stem_cat, $stem_srd;
} elsif ($par_cat eq 'abdominal__adj' && $par_srd eq 'matessi__adj') {
@@ -466,9 +487,21 @@
print STDERR "FALTA CAT $lemma_cat <$gram_cat>\n" unless $par_cat; # seria estranyíssim no trobar-lo!
# print STDERR "dades[1] = #$dades[1]#, length = ", length($dades[1]), "\n" unless $par_cat;
next unless $par_cat;
- print STDERR "Falta srd $lemma_srd <$gram_srd>\n" unless $par_srd;
- next unless $par_srd;
+ unless ($par_srd) {
+ # generem el paradigma al diccionari sard (tot i que només en alguns casos)
+ if ($par_cat eq 'BBC__n') {
+ $par_srd = 'TV__n';
+ printf $fsrd " %s\n", $lemma_srd, $stem_srd, $par_srd;
+ } elsif ($par_cat eq 'BBVA__n') {
+ $par_srd = 'PNB__n';
+ printf $fsrd " %s\n", $lemma_srd, $stem_srd, $par_srd;
+ } else {
+ print STDERR "Falta srd $lemma_srd <$gram_srd>\n";
+ next;
+ }
+ }
+
if ($par_cat eq 'abell/a__n' && $par_srd eq 'mesa__n') {
printf $fbi " %s%s
\n", $stem_cat, $stem_srd;
} elsif ($par_cat eq 'abell/a__n' && $par_srd eq 'region/e__n') {
@@ -735,6 +768,7 @@
next unless $par_cat;
unless ($par_srd) {
+print "No es troba dix_srd{$gram_srd}{$lemma_srd}. Es prova de generar $lemma_srd\n" if $lemma_cat =~ /Aliaga/o;
# generem el paradigma al diccionari sard
if ($gram_srd eq 'np> afus
afusc
ag
+agèntziadiscogràfica agèntziadiscogràfica
+agèntziasdiscogràficas agèntziadiscogràfica
ag
aggia
agabb
@@ -46719,7 +46721,8 @@
group vbser
****************************** -->
- alargualargu
+ alargualargu
+ deacordudeacordu