Corpus: rus-ge_web_2014

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
Ен изменения 6900
Ён изменения 6900
Ен изменений 4820
Ён изменений 4820
го другого 3670
Ко Кокойты 3446
ко Кокойты 3446
Ги Гиги 2597
та депутата 2394
Та депутата 2394
Subword Length 2 - Most frequent subwords
Subword Count
Ен 62
Ён 62
ли 55
Ли 55
та 48
Та 48
че 30
чё 30
Че 30
По 28
Amount of words containing repeated subwords of length 2 - per mille
Per mille
5.1156
Subword Length 3 - most frequent words
Subword Word Frequency
ест естественно 3310
ест Естественно 2141
ест естественным 453
ест естественный 320
так Тактакишвили 271
Так Тактакишвили 271
ест естественных 267
ест естественной 257
ест «Естественно 238
ест естественное 226
Subword Length 3 - Most frequent subwords
Subword Count
ест 20
раз 5
Раз 5
бар 3
Бар 3
пос 2
мар 2
так 1
Так 1
Ани 1
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.4183
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
то что-то 6105
То что-то 6105
то кто-то 4323
То кто-то 4323
то Кто-то 772
То Кто-то 772
Би Би-би-си 655
би Би-би-си 655
то Что-то 370
То Что-то 370
Subword Length 2 - Most frequent subwords
Subword Count
то 6
То 6
Би 3
би 3
Да 1
да 1
Ан 1
ан 1
на 1
На 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.1248
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
вот вот-вот 274
Вот вот-вот 274
нет Нет-нет 25
Нет Нет-нет 25
Subword Length 3 - Most frequent subwords
Subword Count
вот 1
Вот 1
нет 1
Нет 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0239
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
чуть чуть-чуть 218
Чуть чуть-чуть 218
дабл дабл-дабл 65
друг друг-друга 39
Друг друг-друга 39
Subword Length 4 - Most frequent subwords
Subword Count
чуть 1
Чуть 1
дабл 1
друг 1
Друг 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0498
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
очень очень-очень 41
Очень очень-очень 41
много много-много 32
Много много-много 32
Subword Length 5 - Most frequent subwords
Subword Count
очень 1
Очень 1
много 1
Много 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0576
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
только только-только 78
Только только-только 78
Subword Length 6 - Most frequent subwords
Subword Count
только 1
Только 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0613
2016554 msec needed at 2018-06-07 10:25