Corpus: rus-md_web_2011

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
Га Гагаузии 354
га Гагаузии 354
Го другого 189
го другого 189
та результатам 98
Та результатам 98
мА мама 86
во правовой 81
Во правовой 81
ку кукурузы 75
Subword Length 2 - Most frequent subwords
Subword Count
Ли 36
ли 36
по 31
По 31
та 31
ок 31
Та 31
Ок 31
га 22
Га 22
Amount of words containing repeated subwords of length 2 - per mille
Per mille
3.6030
Subword Length 3 - most frequent words
Subword Word Frequency
ест естественно 113
ест Естественно 84
ест естественный 32
ест естественным 25
ест естественной 22
ест естественного 20
ест естественную 18
ест естественных 16
ест естественная 15
ест естественные 14
Subword Length 3 - Most frequent subwords
Subword Count
ест 19
ном 1
пос 1
они 1
Они 1
бар 1
Бар 1
Вар 1
Ной 1
ной 1
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.2989
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
то что-то 342
То что-то 342
то кто-то 180
То кто-то 180
то Кто-то 57
То Кто-то 57
то Что-то 15
То Что-то 15
до До-До 6
Да Да-да 6
Subword Length 2 - Most frequent subwords
Subword Count
то 4
То 4
ка 1
ни 1
Да 1
Ни 1
да 1
до 1
До 1
ку 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.1145
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
вот вот-вот 13
Вот вот-вот 13
нет Нет-нет 3
Нет Нет-нет 3
все все-все 2
Все все-все 2
всё все-все 2
Всё все-все 2
еле еле-еле 2
нет нет-нет 2
Subword Length 3 - Most frequent subwords
Subword Count
нет 2
Нет 2
вот 1
Вот 1
все 1
Все 1
всё 1
Всё 1
еле 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0598
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
чуть чуть-чуть 18
Чуть чуть-чуть 18
друг друг-другу 2
Друг друг-другу 2
Subword Length 4 - Most frequent subwords
Subword Count
чуть 1
Чуть 1
друг 1
Друг 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0330
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
точка точка-точка 7
Точка точка-точка 7
много много-много 5
Много много-много 5
очень очень-очень 4
Очень очень-очень 4
Subword Length 5 - Most frequent subwords
Subword Count
точка 1
Точка 1
много 1
Много 1
очень 1
Очень 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0843
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
только только-только 7
Только только-только 7
многие многие-многие 2
Многие многие-многие 2
Subword Length 6 - Most frequent subwords
Subword Count
только 1
Только 1
многие 1
Многие 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.1161
1935169 msec needed at 2018-06-09 04:52