Corpus: rus-ru_web_2013

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
го другого 6173
Го другого 6173
та результатам 3630
Та результатам 3630
та результата 3536
Та результата 3536
Ка какая 2964
ка какая 2964
ит защитить 2594
мА мама 2355
Subword Length 2 - Most frequent subwords
Subword Count
ок 36
по 31
По 31
та 29
Та 29
ли 28
Ли 28
ин 24
Ин 24
ом 16
Amount of words containing repeated subwords of length 2 - per mille
Per mille
3.7776
Subword Length 3 - most frequent words
Subword Word Frequency
ест естественно 3594
ест Естественно 2657
ест естественной 1281
ест естественным 1276
ест естественных 1052
ест естественный 1022
ест естественного 955
ест естественные 665
ест естественное 556
ест естественную 459
Subword Length 3 - Most frequent subwords
Subword Count
ест 24
пос 1
ние 1
раз 1
Раз 1
бар 1
Бар 1
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.3357
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
то что-то 10945
То что-то 10945
то кто-то 4524
То кто-то 4524
то Кто-то 1374
То Кто-то 1374
то Что-то 535
То Что-то 535
да Да-да 181
Да Да-да 181
Subword Length 2 - Most frequent subwords
Subword Count
то 5
То 5
да 2
Да 2
Go 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.0835
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
вот вот-вот 267
Вот вот-вот 267
чау чау-чау 131
еле еле-еле 59
нет нет-нет 56
Нет нет-нет 56
Subword Length 3 - Most frequent subwords
Subword Count
вот 1
Вот 1
чау 1
еле 1
нет 1
Нет 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0480
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
чуть чуть-чуть 548
Чуть чуть-чуть 548
Subword Length 4 - Most frequent subwords
Subword Count
чуть 1
Чуть 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0167
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
много много-много 176
Много много-много 176
очень очень-очень 134
Очень очень-очень 134
Subword Length 5 - Most frequent subwords
Subword Count
много 1
Много 1
очень 1
Очень 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0584
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
многое многое-многое 173
Многое многое-многое 173
только только-только 157
Только только-только 157
Subword Length 6 - Most frequent subwords
Subword Count
многое 1
Многое 1
только 1
Только 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.1244
2039169 msec needed at 2018-06-09 20:16