Korpus: mhr_wikipedia_2018_10K

Weitere Korpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
ын погынын 20
Ал аралалт 17
ыш илышыште 17
ал аралалт 17
еш ешеш 14
Еш ешеш 14
Ар варарак 11
ар варарак 11
шо Шошо 11
ыш илышыштыже 10
Subword Length 2 - Most frequent subwords
Subword Count
ыш 51
ым 48
Ал 25
ал 25
ла 14
ок 6
Ок 6
ат 5
ма 5
ын 3
Amount of words containing repeated subwords of length 2 - per mille
Per mille
8.4480
Subword Length 3 - most frequent words
Subword Word Frequency
ышт Омыштышт 1
ышт верыштышт 1
ышт газетыштышт 1
ышт илышыштышт 1
ышт каҥашыштышт 1
ышт конгрессыштышт 1
ышт кундемыштышт 1
ышт мландыштышт 1
ышт мӧнгыштышт 1
ышт оҥыштышт 1
Subword Length 3 - Most frequent subwords
Subword Count
ышт 17
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.8965
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
ар Сакар-Арсак 1
Ар Сакар-Арсак 1
эр эр-эрденак 1
Эр эр-эрденак 1
Subword Length 2 - Most frequent subwords
Subword Count
ар 1
Ар 1
эр 1
Эр 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.0849
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
ваш ваш-ваш 15
ваш Ваш-ваш 1
чот чот-чот-чот 1
тын тын-тын-тын 1
Рак кр-рак-рак 1
рак кр-рак-рак 1
чоп чийоп-чоп-чоп 1
Чот чот-чот-чот 1
Subword Length 3 - Most frequent subwords
Subword Count
ваш 2
Рак 1
рак 1
тын 1
чоп 1
чот 1
Чот 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.3164
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
туге Туге-туге 1
Туге Туге-туге 1
лыве лыве-лыве 1
илет Илет-илет 1
поче поче-поче 1
Subword Length 4 - Most frequent subwords
Subword Count
илет 1
туге 1
Туге 1
лыве 1
поче 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.3257
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
эркын эркын-эркын 4
жапын жапын-жапын 3
Жапын жапын-жапын 3
тӱрлӧ тӱрлӧ-тӱрлӧ 2
Тӱрлӧ тӱрлӧ-тӱрлӧ 2
турло тӱрлӧ-тӱрлӧ 2
эркын Эркын-эркын 2
жапын Жапын-жапын 2
Жапын Жапын-жапын 2
тӱрло тӱрлӧ-тӱрлӧ 2
Subword Length 5 - Most frequent subwords
Subword Count
манеш 3
эркын 2
жапын 2
Жапын 2
мурен 1
Мурен 1
порын 1
тӱрлӧ 1
тÿрлö 1
Тӱрлӧ 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
2.1783
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
почела почела-почела 1
Subword Length 6 - Most frequent subwords
Subword Count
почела 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.3365
83759 msec needed at 2024-03-26 01:03