commit b72eeb699db2fc0f5eff77558c433a6a9f63b836 Author: Gourab <19bcs118@iiitdwd.ac.in> Date: Mon Jul 5 12:10:23 2021 +0530 Fixed adverb * cases diff --git a/apertium-ben-hin.ben-hin.dix b/apertium-ben-hin.ben-hin.dix index 0ac5945..df20248 100644 --- a/apertium-ben-hin.ben-hin.dix +++ b/apertium-ben-hin.ben-hin.dix @@ -196,29 +196,29 @@ -

দুজনেইदोनोंही

-

হয়েहोकर

-

হয়होताहै

-

কখনওकभीभी

+

দুজনেইदोनोंही

+

হয়েहोकर

+

হয়होताहै

+

কখনওकभीभी

এখনইअभीही

-

মনোযোগध्यान

+

মনোযোগध्यान

আবারওफिरसे

-

হতেहो

-

পিছনपीछे

-

সবদিকেचारोंओर

-

চারপাশেचारोंओर

+

হতেहो

+

পিছনपीछे

+

সবদিকেचारोंओर

+

চারপাশেचारोंओर

কেনक्यों

এমনऐसा

পিছনেपीछे

তারপরउसकेबाद

এখনअब

-

কোথায়कहाँ

+

কোথায়कहाँ

একসাথেएकसाथ

খুবबहुत

তখনतब

যখনजब

আস্তেधीरे

-

কোনওकोई

+

কোনওकोई

অবশ্যইबेशक

নাनहीं

নেইनहीं

@@ -228,7 +228,7 @@

আজआज

এখনওअभीभी

সুতরাংइसलिए

-

যেकि

+

যেकि

সবদিকেहरओर

diff --git a/fran_hitparade_hin_ben.sh b/fran_hitparade_hin_ben.sh new file mode 100644 index 0000000..1f4e4b4 --- /dev/null +++ b/fran_hitparade_hin_ben.sh @@ -0,0 +1,4 @@ +# cat plain_big_corpus_file.txt | this_script > output_file +# e.g.: +# cat ../apertium-hin/texts/wiki_hin.txt | this_script > output_file +apertium-destxt | lt-proc -w ../apertium-hin/hin.automorf.bin | cg-proc -w ../apertium-hin/hin.rlx.bin | apertium-tagger -u 2 -g ../apertium-hin/hin.prob | apertium-pretransfer | sed 's/\$[^\^]*\^/$\n^/g' | lt-proc -b ../apertium-ben-hin/hin-ben.autobil.bin | grep '/@' | sed 's/\(<[^>]\+><[^>]\+>\)\(<[^>]\+>\)*/\1/g' | sed 's/\(\|\|\|\)\(<[^>]\+>\)*/\1/g' | apertium-retxt | cut -f2- -d'^' | cut -f1 -d'$' | sed 's/.*/^&$/g' | sort -f | uniq -c | sort -gr | sed 's/\/@.*$//' | sed 's/^\( *[0-9]*\) \^/\1\t/' | sed 's/