Corpus: rus-tj_web_2015

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
Ен изменения 4821
Ён изменения 4821
Го другого 1933
го другого 1933
Ен применения 1648
Ён применения 1648
Ен изменений 1487
Ён изменений 1487
Ен применение 1100
Ён применение 1100
Subword Length 2 - Most frequent subwords
Subword Count
Ён 59
Ен 59
ли 39
Ли 39
по 30
По 30
бо 30
Бо 30
та 27
Та 27
Amount of words containing repeated subwords of length 2 - per mille
Per mille
5.3298
Subword Length 3 - most frequent words
Subword Word Frequency
ест естественно 906
ест Естественно 775
ест естественных 260
ест естественным 254
ест естественной 191
ест естественный 185
ест естественные 134
ест естественного 132
Bar Barbarian 114
ест естественное 112
Subword Length 3 - Most frequent subwords
Subword Count
ест 22
раз 2
Раз 2
пос 2
Bar 1
бар 1
Бар 1
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.3375
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0000
Subword Length 5 - most frequent words
Subword Word Frequency
спорт спортСпорт 16
Спорт спортСпорт 16
Subword Length 5 - Most frequent subwords
Subword Count
спорт 1
Спорт 1
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0296
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
то что-то 3494
То что-то 3494
то кто-то 1859
То кто-то 1859
то Кто-то 514
То Кто-то 514
Би Би-би-си 306
Би Би-Би-Си 171
то Что-то 110
То Что-то 110
Subword Length 2 - Most frequent subwords
Subword Count
то 5
То 5
Би 3
но 1
Но 1
ко 1
Ко 1
да 1
Да 1
на 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.1359
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
вот вот-вот 168
Вот вот-вот 168
еле еле-еле 23
нет нет-нет 16
Нет нет-нет 16
Subword Length 3 - Most frequent subwords
Subword Count
вот 1
Вот 1
еле 1
нет 1
Нет 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0362
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
чуть чуть-чуть 146
Чуть чуть-чуть 146
Subword Length 4 - Most frequent subwords
Subword Count
чуть 1
Чуть 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0169
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
много много-много 28
Много много-много 28
очень очень-очень 17
Очень очень-очень 17
Subword Length 5 - Most frequent subwords
Subword Count
много 1
Много 1
очень 1
Очень 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0592
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
только только-только 41
Только только-только 41
Subword Length 6 - Most frequent subwords
Subword Count
только 1
Только 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0624
1117005 msec needed at 2020-06-21 20:19