Korpus: udm_wikipedia_2016

Weitere Korpora

3.12.13 Compounds

Compounds among the top 10.000 words

Quantity of compounds without interfix
Count
8
Most frequent compounds
compound structure w_id compound w_id word1 w_id word2
пиосмуртъёс пиос-муртъёс 2742 2355 2713
кинотеатръёс кино-театръёс 8255 2302 4197
пиосмуртъёслы пиос-муртъёслы 8826 2355 22685
пӧсьтолэзьысен пӧсь-толэзьысен 8982 2370 25481
черкогуртлэсь черко-гуртлэсь 3381 3380 979
радиожурналлэн радио-журналлэн 8988 1155 814
радиостанцилэн радио-станцилэн 8989 1155 24930
черкогуртъёсын черко-гуртъёсын 9485 3380 1779
Quantity of compounds with interfix length 1
Count
16
Most frequent compounds
compound structure w_id compound w_id word1 w_id word2
черкогуртысь черк-о-гуртысь 1081 266 377
черкогуртлэн черк-о-гуртлэн 2809 266 939
черкогуртлэсь черк-о-гуртлэсь 3381 266 979
Черкогуртлэн Черк-о-гуртлэн 3755 4961 939
черкогуртын. черк-о-гуртын. 5841 266 2006
РКРП-КПСС-лэн РКРП---КПСС-лэн 7247 4842 3608
Рейн-Вестфалия Рейн---Вестфалия 7260 3011 13457
каронкыллэсь каро-н-кыллэсь 8212 1347 1234
черкогуртъёс черк-о-гуртъёс 9484 266 404
черкогуртъёсын черк-о-гуртъёсын 9485 266 1779
1774—1775-тӥ 1774-—-1775-тӥ 9914 9912 5992
1780–1934-тӥ 1780-–-1934-тӥ 9920 9919 1174
школа-интернат школа---интернат 4271 187 8149
Зенит-Ижевсклэн Зенит---Ижевсклэн 6806 6804 6823
газет-журналъёсын газет---журналъёсын 7937 403 1457
лымшор-шундыпуксён лымшор---шундыпуксён 5407 271 1168
Quantity of compounds with interfix length 2
Count
3
Most frequent compounds
compound structure w_id compound w_id word1 w_id word2
тодон-валанзэ тодо-н--валанзэ 9217 1384 18688
тодон-эскеронъя тодо-н--эскеронъя 9218 1384 4299
историко-культурной историк-о--культурной 5255 1788 2031
Most frequent interfixes of length 1
interfix count
-о- 7
--- 6
-н- 1
-—- 1
-–- 1
Most frequent interfixes of length 2
interfix count
-н-- 2
-о-- 1
193140 msec needed at 2018-01-25 22:36