Index: languages/apertium-cat/apertium-cat.cat.rlx =================================================================== --- languages/apertium-cat/apertium-cat.cat.rlx (revision 79074) +++ languages/apertium-cat/apertium-cat.cat.rlx (revision 79077) @@ -627,3 +627,6 @@ # un cap blanc SELECT N IF (-1 ("com a")) (0 ("cap")) ; # ha estat designat com a cap de les famílies + +SELECT PP IF (-1 Ser) (0 ("conegut")) ; + # són conegudes principalment a través de Index: languages/apertium-srd/apertium-srd.srd.dix =================================================================== --- languages/apertium-srd/apertium-srd.srd.dix (revision 79074) +++ languages/apertium-srd/apertium-srd.srd.dix (revision 79077) @@ -54320,6 +54320,7 @@ templ

ten tènnere

ten tènnere

logulogu

+

ten tènnere

bisòngiubisòngiu

tend tèndere

tent tent @@ -54890,6 +54891,7 @@

tèmper temperare

tèn tènnere

tèn tènnere

logulogu

+

tèn tènnere

bisòngiubisòngiu

tènd tèndere

tènte tenteare

tèrg tèrghere

@@ -55920,6 +55922,152 @@ prus monoparental verticale +

NostraSennora NostraSennora

+ Lluís + pronarrere + comenteesempru + comentecomo + Enric + Egitu + normalmente + Castella + Miquel + Ramon + Manuel + saprimabia + SantaMaria + Alfons + Ferran + ins'interi + Abu + Deus + fortza + Lluís + Guerra + Enric + Egitu + Castella + Miquel + Ramon + Manuel + SantaMaria + Alfons + Ferran + Abu + Deus + primu + Frederic + James + Tarragona + Isvètzia + Martí + María + Paul + semplitzemente + inpràtica + Jordi + Bèlgiu + Marc + Milà + Hongria + Luis + asasprimas + EAU + Pau + afavore + SantJoan + Lleida + Atene + Royal + Pau + Pedro + Sevilla + Danimarca + Norvègia + deacordu + Gerusalemme + García + acàmbiu + Carlos + Bernat + Joseph + cadabia + cadaborta + Tzile + Nord + Costantinòpoli + Esteve + Salvador + SantPere + Serrat + gustu + Baviera + Cèsar + Napoleone + asadereta + siestpossìbile + LosAngeles + asamanca + asuturnusuo + Rafael + Miguel + basta + Astùrias + Fernando + SantJordi + saprima + Granada + López + Urgell + insustàntzia + Berenguer + Palma + Perù + prosamajoria + Eduard + Roger + Perpignanu + Fernández + Conca + decustamanera + Savoia + segundusatraditzione + Nicolau + Tolosa + González + Galìtzia + Alicante + Pérez + Borgogna + sutasadiretzione + Grand + Finlàndia + apuntu + Bretagna + Climent + Tomàs + Víctor + Lluïsa + Mark + Isaac + Enrique + Lewis + Joaquín + Ohio + Montcada + Llobregat + Sants + Baptista + Colorado + Zamora + Sitges + Chris + Xàtiva + Brandenburg + Atlanta + Pla + Mohammed + Mauritània Index: staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix =================================================================== --- staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix (revision 79074) +++ staging/apertium-cat-srd/apertium-cat-srd.cat-srd.dix (revision 79077) @@ -147,6 +147,16 @@

+ +

+

+

+
+ +

+

+

+

@@ -3960,5 +3970,869 @@

militarmilitare

privatprivadu

+

MaredeDéuNostraSennora

+ +

m/>m

+

solasola

+

percapitaperòmine

+

conjuntannantu

+

méstardprustardu

+

sobrebusta

+

finsitotagiomai

+

ferservirimpreare

+

ferservirtratare

+

anglèsinglesu

+

delnordsetentrionale

+

catalàcatalanu

+

governadorguvernadore

+

jugadorgiogadore

+

usuariimpitadore

+

senyorsennore

+

duratermecumprire

+

alemanytedescu

+

juntgiuntu

+

britànicbritànnicu

+

escolariscolare

+

regnatreinadu

+

diputatdeputadu

+

engeneralingenerale

+

extremestremu

+

grecgregu

+

devegadesabias

+

moltmésmedadeprus

+

presonerpresoneri

+

successorsutzessore

+

formatformadu

+

llatílatinu

+

serraserra

+

aliatalleadu

+

enemicnemigu

+

conegutconnoschèntzia

+

arbreàrbore

+

segonsegundu

+

defensadefensa

+

rendarenta

+

arribaraarribarea

+

arribaralòmperea

+

participarenpartetziparea

+

ferservirimpreare

+

ferservirtratare

+

posteriorposteriore

+

LluísLluís

+

costatcostàgiu

+

francèsfrantzesu

+

comarapronarrere

+

comaracomenteesempru

+

comaracomentecomo

+

incorporarachirire

+

retornartorrare

+

clàssicclàssicu

+

nounughe

+

meitatmetade

+

inicicumintzu

+

suposarsupònnere

+

tributribù

+

temperaturatemperadura

+

GuerraGuerra

+

EnricEnric

+

dinastiadinastia

+

probablementfortzis

+

competiciódisputa

+

ViquipèdiaWikipedia

+

tractardetratarede

+

tenirlloctènnerelogu

+

duratermecumprire

+

enfrontariscaretzire

+

enfrontarpònnerefronte

+

EgipteEgitu

+

variarvariare

+

normalmentnormalmente

+

CastellaCastella

+

MiquelMiquel

+

plantillacaratza

+

plantillasàgoma

+

RamonRamon

+

necessitartènnerebisòngiu

+

ManuelManuel

+

reformariforma

+

possessiópoderiu

+

perprimeravegadasaprimabia

+

SantaMariaSantaMaria

+

AlfonsAlfons

+

FerranFerran

+

alhorains'interi

+

flotaflota

+

rocaroca

+

AbuAbu

+

equacióecuatzione

+

castellàcastiglianu

+

oberturaabertura

+

esportisport

+

feinatraballu

+

feinafaina

+

DéuDeus

+

forçafortza

+

descendentdiscendente

+

dinerdinare

+

estudiantistudiante

+

aixecarpesare

+

romàromanu

+

vestirbestire

+

notablenòdidu

+

companycumpàngiu

+

errorfaddina

+

enterrarinterrare

+

debutardebutare

+

dretderetu

+

quasibelle

+

gravarcravare

+

gravarregistrare

+

llevantlevante

+

metallmetallu

+

propostaproposta

+

ponentponente

+

cimchima

+

creuarrugrare

+

instal·lacióinstallatzione

+

amenaçarminetzare

+

ingressardepositare

+

presentpresente

+

obertabertu

+

presópresone

+

geogràficgeogràficu

+

inaugurarinaugurare

+

capacapa

+

murallamuralla

+

impedirimpedire

+

impedirimpedumare

+

llegendaparistòria

+

plataprata

+

travessarrugrare

+

historiadoristòricu

+

primerprimu

+

imperialimperiale

+

armararmare

+

restauraracontzare

+

ajutagiudu

+

musulmàmusulmanu

+

esquerramanca

+

tombatumba

+

rangrangu

+

alturaartària

+

gòticgòticu

+

arrelraighina

+

bronzebrunzu

+

assistirassistire

+

pintarpintare

+

anàlisianàlisi

+

fórmulafòrmula

+

janooramai

+

diferenciardiferentziare

+

onaunda

+

FredericFrederic

+

JamesJames

+

poesiapoesia

+

assumirassùmere

+

vendabèndida

+

bisbatdiòtzesi

+

citartzitare

+

ocellpugione

+

einaaina

+

esculturaiscultura

+

greugrave

+

greugrae

+

córrercùrrere

+

ferroferru

+

accidentintzidente

+

comandantcumandante

+

igualuguale

+

igualsupròpiu

+

igualsumatessi

+

resoldreisòrvere

+

semblantassimigiante

+

ventbentu

+

proteïnaproteina

+

caigudaruta

+

allàincue

+

TarragonaTarragona

+

vellbetzu

+

candidatcandidadu

+

secsicu

+

verdbirde

+

angleàngulu

+

SuèciaIsvètzia

+

dibuixdisinnu

+

establimentistabilimentu

+

pisapartamentu

+

profundfungudu

+

elevarartziare

+

MartíMartí

+

tallarsegare

+

futurimbeniente

+

cavallercadderi

+

canócannone

+

exteriorforanu

+

trentrenu

+

rebelrebelde

+

interiorinteriore

+

facilitarfatzilitare

+

mesurarmedire

+

jueugiudeu

+

coincidircointzìdere

+

fixarfissare

+

arxiuarchìviu

+

relleuannotu

+

relleurilievu

+

MaríaMaría

+

farmàciapotecaria

+

episodiepisòdiu

+

forçarfortzare

+

PaulPaul

+

quadrecuadru

+

inscripcióiscritzione

+

sangsàmbene

+

revoltarbortare

+

massatropu

+

novamentdenou

+

novamenttorra

+

particularpiessignu

+

simplementsemplitzemente

+

repetirrepìtere

+

durtostu

+

espacialispatziale

+

sòlterrinu

+

assetjaracometare

+

acolliracollire

+

absolutassolutu

+

aportarbatire

+

pràcticamentinpràtica

+

concretcuncretu

+

JordiJordi

+

retorntorrada

+

BèlgicaBèlgiu

+

MarcMarc

+

pellpedde

+

espanyolispagnolu

+

legislatiulegislativu

+

legislatiulegislatòriu

+

HongriaHongria

+

oliògiu

+

visitabisita

+

intervenirintervènnere

+

plapranu

+

agentagente

+

blaubiaitu

+

darrereinpalas

+

estadiistàdiu

+

alaala

+

distribuirdistribuire

+

capítolcapìtulu

+

maternalmaternu

+

trettretu

+

entornambiente

+

unamicaunupagu

+

LuisLuis

+

blocblocu

+

blocarrocu

+

significatiusignificativu

+

sobreviurecampare

+

conventcumbentu

+

aparelltrastu

+

intervencióinterventu

+

caracara

+

envairocupare

+

envairassemidare

+

dretadereta

+

cordacorda

+

equipamentatretzadura

+

aliarligare

+

aliarprèndere

+

ordreòrdine

+

combatregherrare

+

inicialmentasasprimas

+

críticacrìtica

+

vídeovìdeu

+

missatgemessàgiu

+

cerclechircu

+

escenariiscenàriu

+

elevatartu

+

transmetretrasmìtere

+

aturaracabare

+

censtzensu

+

poblarpobulare

+

registrarregistrare

+

EUAEAU

+

òrganòrganu

+

pretendrepretèndere

+

presidirpresidire

+

pespesu

+

molèculamolècula

+

parlaallega

+

pantallaischermu

+

desplaçariscostiare

+

assassinatbocchidura

+

suggerirsugerire

+

arquebisbearchipìscamu

+

afavorafavore

+

provarproare

+

SantJoanSantJoan

+

infantpipiu

+

costpreju

+

recolzararrumbare

+

italiàitalianu

+

LleidaLleida

+

AtenesAtene

+

lleugerlèbiu

+

excepcióetzetzione

+

relatiurelativu

+

sòlidsòlidu

+

mancafalta

+

mancafarta

+

terrestreterrestre

+

cultecultu

+

braçbratzu

+

RoyalRoyal

+

renunciarrinuntziare

+

negociafare

+

ouou

+

permanentpermanente

+

milloramegioru

+

ducatducadu

+

anteriormentinantis

+

primariprimàriu

+

assenyalarsignalare

+

placaplaca

+

arqueològicarcheològicu

+

afavorirfavorire

+

esclataresplòdere

+

PedroPedro

+

definitiudefinitivu

+

costumabitùdine

+

SevillaSevilla

+

musulmàmusulmanu

+

DinamarcaDanimarca

+

ubicarassetiare

+

atreureatràere

+

NoruegaNorvègia

+

paràmetreparàmetru

+

notanota

+

puntapunta

+

duradadurada

+

detalldetàlliu

+

ribaoru

+

descripciódescritzione

+

d'acorddeacordu

+

JerusalemGerusalemme

+

decorardecorare

+

cardenalcardinale

+

convèncercumbìnchere

+

sofrirsufrire

+

constantcostante

+

variacióvariatzione

+

presentpresente

+

allíincue

+

naturalesanatura

+

eclesiàsticeclesiàsticu

+

eclesiàsticcresiàsticu

+

anellaneddu

+

reconstruirtorrareacostrùere

+

comptarcontare

+

ocórreracontèssere

+

refugiarfrànghere

+

convocarcunvocare

+

avantatgebantàgiu

+

encapçalarcumandare

+

minamina

+

vincularassotziare

+

vessantaspetu

+

giai

+

extincióestintzione

+

GarcíaGarcía

+

dissoldreisòlvere

+

premsaistampa

+

detenirdetènnere

+

impulsarsegugiare

+

desitjardisigiare

+

tansolspetzi

+

estàtuaistàtua

+

compostcumpostu

+

competircumpètere

+

primaveraberanu

+

marxamartza

+

matriumàdrighe

+

opciósèberu

+

reforçarafortigare

+

acanviacàmbiu

+

restauracióacontzadura

+

medicinameighina

+

disminuirminimare

+

CarlosCarlos

+

apoderarapoderare

+

incrementarismanniare

+

decoraciódecoradura

+

contractecuntratu

+

residiristare

+

veritableberu

+

veritableverdaderu

+

enormeenorme

+

BernatBernat

+

indretlogu

+

reemplaçarremplasare

+

consellercussigeri

+

revelariscobiare

+

noipitzinnu

+

carbonicarbòniu

+

donarsuportsuportare

+

JosephJoseph

+

enfrontamentatapada

+

retiradaritirada

+

primitiuprimitivu

+

oportunitatoportunidade

+

gengene

+

ballballu

+

exigiresigire

+

colltzugru

+

fàcilmentadiscansu

+

execucióesecutzione

+

descobrimentiscoberta

+

consolidarconsolidare

+

procedirprotzèdere

+

cadavegadacadabia

+

cadavegadacadaborta

+

recórrerricùrrere

+

valenciàvalentzianu

+

connexióconnessione

+

descarregariscarrigare

+

coronarcoronare

+

carregarcarrigare

+

cremarbrusiare

+

navalnavale

+

masclemascru

+

gelastra

+

ruïnaruina

+

cuacoa

+

teixitintessidura

+

fragmentàstula

+

liderarghiare

+

estrènyerastrìnghere

+

deixebledischente

+

agradaragradare

+

idealideale

+

espectacleispetàculu

+

otomàotomanu

+

califacalifu

+

separatseparadu

+

sexualsessuale

+

únicamentinmaneraùnica

+

cristiàcristianu

+

XileTzile

+

políticpolìticu

+

electróeletrone

+

enllaçarligare

+

NordNord

+

compararcumparare

+

nazinazista

+

rendirarrèndere

+

festivalfèstival

+

cambraaposentu

+

rondarunda

+

clanereu

+

sumasumma

+

portimoria

+

riscarriscu

+

fusiófusione

+

cantcàntigu

+

retratritratu

+

videojocvideo-giogu

+

observaciópompiadura

+

jacimentistèrrida

+

disciplinadisciplina

+

visiblevisìbile

+

famafama

+

malmale

+

portuguèsportughesu

+

torrenttrainu

+

abadiaabbadia

+

llunyalargu

+

olímpicolìmpicu

+

alfabetalfabetu

+

covagruta

+

comptecontu

+

voralàcana

+

apreciaragradèssere

+

LuxemburgLussemburgu

+

retaulepala

+

filafila

+

filalìnia

+

originarinadiu

+

volbolu

+

linealliniare

+

heretareredare

+

regnarregnare

+

bateriabateria

+

cavalleriacavalleria

+

magnèticmagnèticu

+

batejarbatijare

+

adaptacióadatamentu

+

al'interioraintro

+

confondreconfùndere

+

realmentaberu

+

aupugione

+

resistiraguantare

+

bitbit

+

noblesanobilesa

+

saquejarassachigiare

+

saquejarisrobare

+

desconegutdisconnotu

+

apuntarpuntare

+

transportarcarrare

+

monarquiamonarchia

+

profunditatprofundidade

+

infanteriafanteria

+

tendirtèndere

+

fluxflussu

+

peticiópetitzione

+

peticiódimanda

+

brillantlughente

+

guitarrachitarra

+

guitarrachiterra

+

ConstantinobleCostantinòpoli

+

humitinfustu

+

EsteveEsteve

+

àtomàtomu

+

impacteefetu

+

saltbrincu

+

sonorsonoru

+

autonomiaautonomia

+

emprendrecumintzare

+

turcturcu

+

òrbitaòrbita

+

taxatassa

+

caixacàscia

+

cerimòniatzerimònia

+

dipòsitdepòsitu

+

carnpetza

+

tributtributu

+

justgustu

+

matemàticmatemàticu

+

calorcalore

+

BavieraBaviera

+

particularmentmescamente

+

MacedòniaMatzedònia

+

estadafirmada

+

enderrocarderrùere

+

detectarsebestare

+

dobledòpiu

+

celchelu

+

CèsarCèsar

+

NapoleóNapoleone

+

atmosferaatmosfera

+

frasefrase

+

baixaabbassamentu

+

aladretaasadereta

+

procedimentprotzedimentu

+

graduargraduare

+

gusttastu

+

salsale

+

acordarcuncordare

+

cristianismecristianèsimu

+

motparàula

+

motallega

+

enginyeringegneri

+

transiciótransitzione

+

possiblementsiestpossìbile

+

demandadimanda

+

al'esquerraasamanca

+

marítimmarìtimu

+

vaporpapore

+

exemplaresemplare

+

rodaroda

+

voltantambiente

+

sencerintregu

+

espectadorispetadore

+

contractarcuntratare

+

tinenttenente

+

foratistampu

+

avegadesabias

+

avegadesabortas

+

alseutornasuturnusuo

+

efectuarfàghere

+

abundantbundante

+

abundantbundatziosu

+

RafaelRafael

+

rècordrècord

+

MiguelMiguel

+

orgànicorgànicu

+

guarnicióguarnitzione

+

rebel·liórebellia

+

tropicaltropicale

+

plantejarpònnere

+

plantejarpesare

+

cementiricampusantu

+

llavorsèmene

+

consagrarcunsagrare

+

presapresa

+

editoreditore

+

natalnadiu

+

vectorvetore

+

seguidorsighidore

+

locallocale

+

estratègiaistrategia

+

proubasta

+

lleugeramentinmaneralèbia

+

fefede

+

oficinaufìtziu

+

pronunciarpronuntziare

+

operatiuoperativu

+

regidorassessore

+

bàndolbandu

+

temàtictemàticu

+

ToledoToledo

+

habitualmentafitianu

+

AstúriesAstùrias

+

renovarrinnovare

+

FernandoFernando

+

comèdiacummèdia

+

aventuraaventura

+

SantJordiSantJordi

+

tubtubu

+

remuntarremontare

+

dotardotare

+

perprimercopsaprimabia

+

perprimercopsaprima

+

coronelcoronellu

+

donaciódonatzione

+

donaciólassa

+

principatprintzipadu

+

arquitectònicarchitetònicu

+

fracassarfaddire

+

suportaraguantare

+

robaroba

+

actaatu

+

galeriagalleria

+

marcmarcu

+

administradoramministradore

+

lentlentu

+

seleccionarseletzionare

+

seleccionarischertare

+

xifratzifra

+

conreucoltivu

+

variablevariàbile

+

difondredifùndere

+

difondreispàrghere

+

difondreispainare

+

estratègicistratègicu

+

contribuciócontributu

+

entrenadorallenadore

+

altaraltare

+

vegetaciómatedu

+

bancbangu

+

persotadaesuta

+

cobertamanta

+

cintachintu

+

ampladalargària

+

danydannu

+

verticalverticale

+

verticalritzu

+

concentrarcuntzentrare

+

refusarrefudare

+

fusionarfùndere

+

LópezLópez

+

utilitzacióimpreu

+

triomftriunfu

+

pràcticpràticu

+

ceràmicatzeràmica

+

trajectòriaparàbula

+

enginyeriaingegneria

+

conservaciócunservatzione

+

rectangularretangulare

+

estàndardistandard

+

prometrepromìtere

+

cuinacoghina

+

resultarisultadu

+

separacióseparatzione

+

privilegiprivilègiu

+

parroquialparrochiale

+

negociaciónegatzione

+

paral·lelparallelu

+

capçaleralìtera

+

bellesabellesa

+

platpratu

+

políticpolìticu

+

penjarapicare

+

UrgellUrgell

+

relatrelata

+

cèlebrefamadu

+

grandàriamannària

+

temporaltemporale

+

documentaciódocumentatzione

+

recintecresura

+

probabledàbile

+

bàsicamentinsustàntzia

+

emmagatzemarimmagasinare

+

segellfrancubullu

+

massiumassitzu

+

septentrionalsetentrionale

+

rolruolu

+

BerenguerBerenguer

+

acostarcorcare

+

institutistitutu

+

estranyistranu

+

actitudatitudine

+

barrejarammisturare

+

hipòtesiipòtesi

+

antiguitatantighidade

+

modamoda

+

purpuru

+

radiacióradiatzione

+

feufèudu

+

sasanu

+

PalmaPalma

+

badiacala

+

serraladaserra

+

osossu

+

excel·lentestremadu

+

excel·lentprimorosu

+

PerúPerù

+

majoritàriamentprosamajoria

+

concretamentinmaneracuncreta

+

incendifogu

+

aportacióagiudu

+

recuperaciórecùperu

+

EduardEduard

+

ànimaànima

+

RogerRoger

+

PerpinyàPerpignanu

+

FernándezFernández

+

ConcaConca

+

interaccióinteratzione

+

universuniversu

+

allargarillargare

+

informeraportu

+

menorminore

+

refugiamparu

+

prestigiprestìgiu

+

d'aquestamaneradecustamanera

+

portaratermeacabare

+

SavoiaSavoia

+

medimèdiu

+

tradicionalmentsegundusatraditzione

+

NicolauNicolau

+

mineralminerale

+

amantamante

+

espasaispada

+

variablevariàbile

+

apropacurtzu

+

insectebabautzu

+

desprendreabèrrere

+

assumpteafare

+

TolosaTolosa

+

GonzálezGonzález

+

noipitzocu

+

membranamembrana

+

ferirfèrrere

+

GalíciaGalìtzia

+

encàrrecincàrrigu

+

favorablefavoràbile

+

eraera

+

comentaricummentu

+

elevacióartària

+

revolucionaririvolutzionàriu

+

menciómentovu

+

pròximpròssimu

+

enfonsarafundare

+

pertanyentpertinente

+

tesitesi

+

omplircumpletare

+

aceratzàrgiu

+

alçarartziare

+

AlacantAlicante

+

sorprendreispantare

+

lliuralira

+

sessiósessione

+

PérezPérez

+

decisiudetzisivu

+

BorgonyaBorgogna

+

perspectivaprospetiva

+

barrabangu

+

genèticgenèticu

+

otomàotomanu

+

reservarabbandare

+

reservarapartare

+

llicenciarlaureare

+

talgasi

+

pipinu

+

sagratsagradu

+

vestitbestire

+

homenatgedonu

+

petrolipetròliu

+

globalglobale

+

materialmateriale

+

intercanvicuncàmbiu

+

aprenentatgeimparu

+

pescapisca

+

mainomai

+

universitariuniversitàriu

+

desconèixerdisconnòschere

+

consecutiuconsecutivu

+

sorraarena

+

sucretzùcaru

+

automòbilautomòbile

+

sotaladirecciósutasadiretzione

+

doctrinadotrina

+

regirrèghere

+

impossibleimpossìbile

+

GrandGrand

+

geometriageometria

+

orientacióorientamentu

+

totalitattotale

+

FinlàndiaFinlàndia

+

governantguvernadore

+

apuntapuntu

+

BretanyaBretagna

+

parentparente

+

gammavariedade

+

guardonarpremiare

+

fortificaciócasteddu

+

àmpliamentampliamentu

+

àmpliamentismanniamentu

+

comerciantcummertziante

+

debutesòrdiu

+

vegetalvegetale

+

dictaduraditadura

+

travessatraessa

+

autènticautènticu

+

dibuixardisinnare

+

proveirfrunire

+

campamentcampu

+

paticorte

+

rodarfurriare

+

ClimentCliment

+

TomàsTomàs

+

VíctorVíctor

+

LluïsaLluïsa

+

MarkMark

+

IsaacIsaac

+

EnriqueEnrique

+

LewisLewis

+

JoaquínJoaquín

+

OhioOhio

+

MontcadaMontcada

+

LlobregatLlobregat

+

SantsSants

+

BaptistaBaptista

+

ColoradoColorado

+

ZamoraZamora

+

SitgesSitges

+

ChrisChris

+

XàtivaXàtiva

+

BrandenburgBrandenburg

+

AtlantaAtlanta

+

LiverpoolLiverpool

+

EmmaEmma

+

PlaPla

+

MohammedMohammed

+

MauritàniaMauritània

+ Index: staging/apertium-cat-srd/carregar_lexic.pl =================================================================== --- staging/apertium-cat-srd/carregar_lexic.pl (revision 79074) +++ staging/apertium-cat-srd/carregar_lexic.pl (revision 79077) @@ -3,17 +3,20 @@ # En aquest programa es llegeix el fitxer amb 4 columnes separades per tabuladors amb paraules amb categories tancaes # 0. ocurrències # 1. paraula catalana -# 2. categoria gramatical +# 2. categoria gramatical sarda # 3. paraula sarda +# 4. categoria gramatical sarda # El programa genera 2 fitxers per carregar als 2 fitxers de diccionari +# Només genera paraules per als fitxers si la paraula català no té traducció prèvia en el fitxer bilingüe use strict; use utf8; -my ($fsrd, $fbi, $fdixsrd, $fdixcat); +my ($fsrd, $fbi, $fdixsrd, $fdixcat, $fdixbi); open($fdixsrd, "../apertium-srd/apertium-srd.srd.dix") || die "can't open apertium-srd.srd.dix: $!"; open($fdixcat, "../apertium-cat/apertium-cat.cat.dix") || die "can't open apertium-cat.cat.dix: $!"; +open($fdixbi, "apertium-cat-srd.cat-srd.dix") || die "can't open apertium-cat.cat.dix: $!"; open($fsrd, ">f_srd.dix.txt") || die "can't open f_srd.dix: $!"; open($fbi, ">f_bi.dix.txt") || die "can't open f_bi.dix: $!"; @@ -21,6 +24,7 @@ binmode(STDIN, ":encoding(UTF-8)"); binmode($fdixsrd, ":encoding(UTF-8)"); binmode($fdixcat, ":encoding(UTF-8)"); +binmode($fdixbi, ":encoding(UTF-8)"); binmode($fsrd, ":encoding(UTF-8)"); binmode($fbi, ":encoding(UTF-8)"); binmode(STDOUT, ":encoding(UTF-8)"); @@ -37,6 +41,7 @@ #

intertzed intertzèdere

#

ismorr ismòrrere

#més +#

ten tènnere

logulogu

while (my $linia = <$fitx>) { chop $linia; @@ -44,9 +49,15 @@ if ($linia =~ m|.*.*|o) { $lemma = $1; $par = $2; + } elsif ($linia =~ m|.*.*

|o) { + $lemma = $1; + $par = $2; } elsif ($linia =~ m|.*.*|o) { $lemma = $1; $par = $2; + } elsif ($linia =~ m|.*.*

|o) { + $lemma = $1; + $par = $2; } else { next; } @@ -69,11 +80,69 @@ } } +# llegeixo el fitxer bilingüe: n, adj, adv, np, abbr +sub llegir_bidix { + my ($fitx, $r_struct) = @_; + my ($lemma_cat, $lemma_srd, $morf, $morf2); + +#

derrotaderrota

+#

properimbeniente

+#

aqueixcustu

+ + + while (my $linia = <$fitx>) { + chop $linia; + $linia =~ s|| |og; +#print "1. fitxer $nfitx, $linia\n" if $nfitx eq 'cat' && $linia =~ /comarca/o; + if ($linia =~ m| *

([^<]*)([^<]*) *

([^<]*)([^<]*) *

([^<]*).*([^<]*) *

([^<]*).*([^<]*){$morf}{$lemma_cat} = $lemma_srd; +#print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n" if $morf =~ /vblex/o; +print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n" if $lemma_cat =~ /conegut/o; +#print "r_struct->{$morf}{$lemma_cat} = $r_struct->{$morf}{$lemma_cat}\n"; + } +} + my %dix_srd = (); my %dix_cat = (); +my %dix_bi = (); llegir_dix('srd', $fdixsrd, \%dix_srd); llegir_dix('cat', $fdixcat, \%dix_cat); +llegir_bidix($fdixbi, \%dix_bi); ; # saltem la primera línia my ($stem_cat, $stem_srd, $gen_cat, $gen_srd, $num_cat, $num_srd, $lemma_cat, $lemma_srd); @@ -80,7 +149,6 @@ while (my $linia = ) { chop $linia; $linia =~ s/[^a-z\t]+$//o; -# $linia =~ tr/[A-ZÀÈÌÒÙÉÍÓÚ/a-zàèìòùéíóú/; my @dades = split /\t/, $linia; for (my $i=0; $i<=$#dades; $i++) { $dades[$i] =~ s/^ +//o; @@ -89,7 +157,8 @@ next unless $dades[3]; # línia buida next if $dades[5] =~ /\?/o; # dubtes -print "99. $. dades[1] = $dades[1]\n" if length $dades[1] == 1; # una sola lletra + next if length $dades[1] == 1; # una sola lletra +#print "99. $. dades[1] = $dades[1]\n" if length $dades[1] == 1; # una sola lletra $stem_cat = $dades[1]; $stem_cat =~ s| +| |og; @@ -102,6 +171,22 @@ } $stem_cat =~ s| ||og; + my $gram_cat = $dades[2]; + $gram_cat =~ s/^ * *$//og; + $gram_cat =~ s/> %s\n", $lemma_srd, $stem_srd, $par_srd; + } else { print STDERR "Falta $lemma_srd <$gram_srd>\n" unless $dix_srd{$gram_srd}{$lemma_srd}; # print "dix_srd{$gram_srd}{$lemma_srd} = $dix_srd{$gram_srd}{$lemma_srd}\n"; - next unless $dix_srd{$gram_srd}{$lemma_srd}; + next; + } + } my $rl = ' r="RL"' unless $primer; printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; @@ -248,6 +342,7 @@ my $par_srd = $dix_srd{$gram_srd}{$lemma_srd}; # comprovo que és en el diccionari monolingüe print STDERR "FALTA CAT $lemma_cat <$gram_cat>\n" unless $par_cat; # seria estranyíssim no trobar-lo! +# print STDERR "dades[1] = #$dades[1]#, length = ", length($dades[1]), "\n" unless $par_cat; next unless $par_cat; print STDERR "Falta srd $lemma_srd <$gram_srd>\n" unless $par_srd; next unless $par_srd; @@ -318,6 +413,8 @@ printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } elsif ($par_cat eq 'acompanyant__n' && $par_srd eq 'dentista__n') { printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; + } elsif ($par_cat eq 'acompanyant__n' && $par_srd eq 'albanes/e__n') { + printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } elsif ($par_cat eq 'acompanyant__n' && $par_srd eq 'mesa__n') { printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } elsif ($par_cat eq 'acompanyant__n' && $par_srd eq 'pane__n') { @@ -366,13 +463,50 @@ # comprovo que és en el diccionari monolingüe print STDERR "FALTA CAT $lemma_cat <$gram_cat>\n" unless $par_cat; # seria estranyíssim no trobar-lo! next unless $par_cat; - print STDERR "Falta srd $lemma_srd <$gram_srd>\n" unless $par_srd; - next unless $par_srd; + unless ($par_srd) { + # generem el paradigma al diccionari sard + if ($gram_srd eq 'np> %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($gram_srd eq 'np> %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($gram_srd =~ /^np> %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($gram_srd eq 'np> %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($gram_srd eq 'np> %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($gram_srd eq 'np> %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($gram_srd eq 'np> %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($gram_srd eq 'np> %s\n", $lemma_srd, $stem_srd, $par_srd; + } elsif ($gram_srd eq 'np> %s\n", $lemma_srd, $stem_srd, $par_srd; + } else { + print STDERR "Falta srd $lemma_srd <$gram_srd> - no el podem generar (falten dades)\n" unless $par_srd; + next; + } + } + if ($par_cat eq 'Abad__np' && $par_srd eq 'Antoni__np') { printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } elsif ($par_cat eq 'Abad__np' && $par_srd eq 'Maria__np') { printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; + } elsif ($par_cat eq 'Marc__np' && $par_srd eq 'Antoni__np') { + printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; + } elsif ($par_cat eq 'Maria__np' && $par_srd eq 'Maria__np') { + printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } elsif ($par_cat eq 'Abad__np' && $par_srd eq 'Saussure__np') { printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } elsif ($par_cat eq 'Afganistan__np' && $par_srd eq 'Afganistàn__np') { @@ -387,6 +521,8 @@ printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } elsif ($par_cat eq 'Afganistan__np' && $par_srd eq 'Loira__np') { printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; + } elsif ($par_cat eq 'ABC__np' && $par_srd eq 'Fiat__np') { + printf $fbi "

%s%s

\n", $stem_cat, $stem_srd; } else { print STDERR "np 1. par_cat = $par_cat, par_srd = $par_srd, $stem_cat > $stem_srd\n"; }