Index: incubator/apertium-pol-rus/apertium-pol-rus.pol-rus.dix
===================================================================
--- incubator/apertium-pol-rus/apertium-pol-rus.pol-rus.dix	(revision 69701)
+++ incubator/apertium-pol-rus/apertium-pol-rus.pol-rus.dix	(revision 69703)
@@ -625,6 +625,7 @@
 
 
     <!-- conjunctions -->
+    <e><p><l>zarówno<s n="cnjcoo"/></l><r>как<s n="cnjadv"/></r></p></e>
     <e><p><l>a<s n="cnjcoo"/></l><r>а<s n="cnjcoo"/></r></p></e>
     <e><p><l>a<s n="cnjcoo"/></l><r>и<s n="cnjcoo"/></r></p></e>
     <e><p><l>albo<s n="cnjcoo"/></l><r>или<s n="cnjcoo"/></r></p></e>
@@ -708,9 +709,6 @@
     <e><p><l>natomiast<s n="cnjadv"/></l><r>но<s n="cnjadv"/></r></p></e>
     <e><p><l>natomiast<s n="cnjadv"/></l><r>тогда<b/>как<s n="cnjadv"/></r></p></e>
     <e><p><l>niby<s n="cnjadv"/></l><r>будто<s n="cnjadv"/></r></p></e>
-    <e><p><l>niby<s n="cnjadv"/></l><r>дескать<s n="cnjadv"/></r></p></e>
-    <e><p><l>niby<s n="cnjadv"/></l><r>подобно<s n="cnjadv"/></r></p></e>
-    <e><p><l>niby<s n="cnjadv"/></l><r>почти<s n="cnjadv"/></r></p></e>
     <e><p><l>niby<s n="cnjadv"/></l><r>словно<s n="cnjadv"/></r></p></e>
     <e><p><l>niby<s n="cnjadv"/></l><r>точно<s n="cnjadv"/></r></p></e>
     <e><p><l>ponieważ<s n="cnjadv"/></l><r>потому<b/>что<s n="cnjadv"/></r></p></e>
@@ -36148,9 +36146,14 @@
     <e><p><l>gburowatość<s n="n"/><s n="f"/></l><r>грубость<s n="n"/><s n="f"/><s n="nn"/></r></p></e>
     <e><p><l>ichtiozaur<s n="n"/><s n="ma"/></l><r>ихтиозавр<s n="n"/><s n="m"/><s n="aa"/></r></p></e>
 
+    <!-- fixit -->
+    <e><p><l>ludzie<s n="n"/><s n="pl"/></l><r>люди<s n="n"/><s n="m"/><s n="pl"/></r></p></e> 
+    <e><p><l>rola<s n="n"/><s n="ma"/></l><r>ихтиозавр<s n="n"/><s n="m"/><s n="aa"/></r></p></e>
+    <e><p><l>kolej<s n="n"/><s n="ma"/></l><r>ихтиозавр<s n="n"/><s n="m"/><s n="aa"/></r></p></e>
 
 
 
+
     <!-- adjectives -->
 
     <e><p><l>abchaski<s n="adj"/></l><r>абхазский<s n="adj"/></r></p></e>
Index: incubator/apertium-pol-rus/dev/from_morpheus.py
===================================================================
--- incubator/apertium-pol-rus/dev/from_morpheus.py	(nonexistent)
+++ incubator/apertium-pol-rus/dev/from_morpheus.py	(revision 69703)
@@ -0,0 +1,128 @@
+# -*- coding: utf-8 -*-
+
+import codecs
+import re
+
+def forms_collector(fname):
+	'''opens a with smthn from morpheus, reads it and makes a dictionary of lemmas and wordforms'''
+	with codecs.open(fname, 'r', 'utf-8') as f:
+		forms = [line.split('\t') for line in f.readlines()]
+
+	morph_d = {}
+	for line in forms:
+		if line[1] not in morph_d:
+			morph_d[line[1]] = [line[0]]
+		else:
+			morph_d[line[1]].append(line[0])
+	return morph_d
+
+def info_collector(fname):
+	'''opens a with smthn from morpheus, reads it and makes a dictionary of lemmas and wordforms'''
+	with codecs.open(fname, 'r', 'utf-8') as f:
+		forms = [line.split('\t') for line in f.readlines()]
+
+	gram_d = {}
+	for line in forms:
+		if line[1] not in gram_d:
+			gram_d[line[1]] = line[2].split(':')[-1]
+	# for key in gram_d:
+	# 	print(key + ' : ' + gram_d[key])
+	return gram_d
+
+def paradigm_collector(morph_d):
+	'''returns a dictionary, where keys are lemmas and values is a tuple of stem and flections'''
+	paradigms = {}
+	for lemma in morph_d:
+		# print(lemma)
+		stem_len = stem_finder(morph_d[lemma], lemma)
+		# for form in morph_d[lemma]:
+		# 	print(form[:stem_len] + ' : ' + form[stem_len:], end = ', ')
+		# print('\n')
+		stem = lemma[:stem_len]
+		flections = [form[stem_len:] for form in morph_d[lemma]]
+		paradigms[lemma] = (stem, flections)
+	return paradigms
+
+def stem_finder(forms, lemma):
+	'''finds length of the stem, returns an integer. called in paradigm_collector'''
+	min_len = len(min(forms, key=len))
+	stems_len = min_len
+	for form in forms:
+		for i in range(min_len):
+			if lemma[i:i+1] != form[i:i+1]:
+				# print(form[i:], end = ', ')
+				if i < stems_len:
+					stems_len = i
+					break
+	return stems_len
+
+def find_similar(paradigms):
+	'''finds similar inflectional types'''
+	similar = {}
+	for lemma in paradigms:
+		if tuple(set(paradigms[lemma][1])) not in similar:
+			similar[tuple(set(paradigms[lemma][1]))] = [lemma]
+		else:
+			similar[tuple(set(paradigms[lemma][1]))].append(lemma)
+
+	# for inventory in similar:
+		# print(str(inventory))
+		# print(str(similar[inventory]))
+	print('number of paradigms: ' + str(len(similar)))
+	return similar
+
+def check_presence(lemmas):
+	with codecs.open('../../apertium-pol/apertium-pol.pol.dix', 'r', 'utf-8') as f:
+		hyp = [re.findall('<e lm="(\\w+)"><i>\w+</i><par n=".+__vblex"/>', line) for line in f]
+		already_there = set([h[0] for h in hyp if len(h) > 0])
+	# print(already_there)
+	intersection = set(lemmas).intersection(set(already_there))
+	print('intersection: ' + str(intersection))
+	return set(lemmas).difference(set(already_there))
+
+def to_morph(to_add, info):
+	with codecs.open('add_to_monodix.xml', 'w', 'utf-8') as f:
+		for word in to_add:
+			f.write('    <e lm="' + word + '"><i>' + word[:-4] + '</i><par n="mal/ować__vblex"/></e>\n')
+			# if info[word] == 'f':
+			# 	f.write('    <e lm="' + word + '"><i>' + word + '</i><par n="miłoś/ć__n"/></e>\n')
+			# else:
+			# 		print('aaa')
+				# f.write('    <e lm="' + word + '"><i>' + word + '</i><par n="Adam__np"/></e>\n')
+
+def to_bidix(to_add, info):
+	with codecs.open('add_to_bidix.xml', 'w', 'utf-8') as f:
+		for word in to_add:
+			if info[word] == 'f':
+				f.write('    <e><p><l>' + word + '<s n="np"/><s n="ant"/><s n="f"/></l><r>' + word + '<s n="np"/><s n="ant"/><s n="f"/></r></p></e>\n')
+			else:
+				f.write('    <e><p><l>' + word + '<s n="np"/><s n="ant"/><s n="mp"/></l><r>' + word + '<s n="np"/><s n="ant"/><s n="m"/></r></p></e>\n')
+
+morph_d = forms_collector('verbs_from_morpheus.txt')
+# info = info_collector('adjectives_from_morpheus.txt')
+paradigms = paradigm_collector(morph_d)
+similar = find_similar(paradigms)
+inventories = [similar[inventory] for inventory in similar]
+# wordclass = sorted(inventories, key = len)[-1]
+
+for inventory in inventories:
+	if 'stać' in inventory:
+		wordclass = inventory
+
+print(wordclass)
+
+with codecs.open('added.txt', 'w', 'utf-8') as f:
+	for lemma in wordclass:
+		f.write(lemma + '\n')
+
+for key in similar:
+	if similar[key] == wordclass:
+		print(key)
+
+to_add = check_presence(wordclass)
+# to_morph(to_add, info)
+# to_bidix(to_add, info)
+
+# done = [wordclass]
+# inventories = [similar[inventory] for inventory in similar if similar[inventory] not in done]
+
Index: languages/apertium-pol/apertium-pol.pol.dix
===================================================================
--- languages/apertium-pol/apertium-pol.pol.dix	(revision 69701)
+++ languages/apertium-pol/apertium-pol.pol.dix	(revision 69703)
@@ -5281,6 +5281,16 @@
       <e><p><l>ni</l><r><s n="f"/><s n="sg"/><s n="voc"/></r></p></e>    
     </pardef>
     
+    <pardef n="PBASE__kolej_sg">      
+      <e><p><l>j</l><r><s n="f"/><s n="sg"/><s n="nom"/></r></p></e>      
+      <e><p><l>i</l><r><s n="f"/><s n="sg"/><s n="gen"/></r></p></e>      
+      <e><p><l>i</l><r><s n="f"/><s n="sg"/><s n="dat"/></r></p></e>      
+      <e><p><l>j</l><r><s n="f"/><s n="sg"/><s n="acc"/></r></p></e>      
+      <e><p><l>ią</l><r><s n="f"/><s n="sg"/><s n="ins"/></r></p></e>      
+      <e><p><l>i</l><r><s n="f"/><s n="sg"/><s n="loc"/></r></p></e>      
+      <e><p><l>i</l><r><s n="f"/><s n="sg"/><s n="voc"/></r></p></e>    
+    </pardef>
+
     <pardef n="PBASE__łódź_sg">      
       <e><p><l>ź</l><r><s n="f"/><s n="sg"/><s n="nom"/></r></p></e>      
       <e><p><l>zi</l><r><s n="f"/><s n="sg"/><s n="gen"/></r></p></e>      
@@ -5309,6 +5319,16 @@
       <e><p><l>niach</l><r><s n="pl"/><s n="loc"/></r></p></e>      
       <e><p><l>nie</l><r><s n="pl"/><s n="voc"/></r></p></e>    
     </pardef>
+
+    <pardef n="PBASE__kolej_pl">      
+      <e><p><l>je</l><r><s n="pl"/><s n="nom"/></r></p></e>      
+      <e><p><l>i</l><r><s n="pl"/><s n="gen"/></r></p></e>      
+      <e><p><l>jom</l><r><s n="pl"/><s n="dat"/></r></p></e>      
+      <e><p><l>je</l><r><s n="pl"/><s n="acc"/></r></p></e>      
+      <e><p><l>jami</l><r><s n="pl"/><s n="ins"/></r></p></e>      
+      <e><p><l>jach</l><r><s n="pl"/><s n="loc"/></r></p></e>      
+      <e><p><l>je</l><r><s n="pl"/><s n="voc"/></r></p></e>    
+    </pardef>
     
     <pardef n="PBASE__sarna_sg">      
       <e><p><l>a</l><r><s n="f"/><s n="sg"/><s n="nom"/></r></p></e>      
@@ -6193,6 +6213,19 @@
       <e><p><l>ciach</l><r>cko<s n="n"/><s n="nt"/><s n="pl"/><s n="loc"/></r></p></e>      
       <e><p><l>ci</l><r>cko<s n="n"/><s n="nt"/><s n="pl"/><s n="voc"/></r></p></e>    
     </pardef>
+
+    <!-- half-done -->
+
+    <pardef n="lud/zie__n">   
+      <e><p><l>zie</l><r>zie<s n="n"/><s n="pl"/><s n="nom"/></r></p></e>      
+      <e><p><l>zi</l><r>zie<s n="n"/><s n="pl"/><s n="gen"/></r></p></e>      
+      <e><p><l>ziom</l><r>zie<s n="n"/><s n="pl"/><s n="dat"/></r></p></e>      
+      <e><p><l>zi</l><r>zie<s n="n"/><s n="pl"/><s n="acc"/></r></p></e>      
+      <e><p><l>źmi</l><r>zie<s n="n"/><s n="pl"/><s n="ins"/></r></p></e>      
+      <e><p><l>ziach</l><r>zie<s n="n"/><s n="pl"/><s n="loc"/></r></p></e>      
+      <e><p><l>zi</l><r>zie<s n="n"/><s n="pl"/><s n="voc"/></r></p></e>    
+    </pardef>
+
     
     <pardef n="s/to__n">      
       <e><p><l>to</l><r>to<s n="n"/><s n="nt"/><s n="sg"/><s n="nom"/></r></p></e>      
@@ -8329,6 +8362,11 @@
       <e><p><l></l><r>ń<s n="n"/></r></p><par n="PBASE__dłoń_sg"/></e>      
       <e><p><l></l><r>ń<s n="n"/><s n="f"/></r></p><par n="PBASE__słoń_pl"/></e>    
     </pardef>
+
+    <pardef n="kole/j__n">      
+      <e><p><l></l><r>ń<s n="n"/></r></p><par n="PBASE__kolej_sg"/></e>      
+      <e><p><l></l><r>ń<s n="n"/><s n="f"/></r></p><par n="PBASE__kolej_pl"/></e>    
+    </pardef>
     
     <pardef n="sło/ń__n">      
       <e><p><l>ń</l><r>ń<s n="n"/><s n="ma"/><s n="sg"/><s n="nom"/></r></p></e>      
@@ -21869,6 +21907,7 @@
     <e lm="cielę"><i>ciel</i><par n="zwierz/ę__n"/></e>    
     <e lm="imię"><i>imi</i><par n="imi/ę__n"/></e>    
     <e lm="dziecko"><i>dzie</i><par n="dzie/cko__n"/></e>    
+    <e lm="ludzie"><i>lud</i><par n="lud/zie__n"/></e>    
     <e lm="śpioch"><i>śpioch</i><par n="śpioch__n"/></e>    
     <e lm="astronom"><i>astronom</i><par n="astronom__n"/></e>    
     <e lm="filozof"><i>filozof</i><par n="astronom__n"/></e>    
@@ -23216,7 +23255,11 @@
     <e lm="żarówka"><i>żarów</i><par n="mat/ka__n"/></e>    
     <e lm="żyletka"><i>żylet</i><par n="mat/ka__n"/></e>    
     <e lm="córka"><i>cór</i><par n="mat/ka__n"/></e>    
-    <e lm="topola"><i>top</i><par n="top/ola__n"/></e>    
+    <e lm="topola"><i>top</i><par n="top/ola__n"/></e>
+
+    <e lm="rola"><i>r</i><par n="top/ola__n"/></e>
+    <e lm="kolej"><i>kole</i><par n="kole/j__n"/></e>
+
     <e lm="fasola"><i>fasol</i><par n="filozofi/a__n"/></e>    
     <e lm="aureola"><i>aureol</i><par n="filozofi/a__n"/></e>    
     <e lm="aria"><i>ari</i><par n="filozofi/a__n"/></e>