Corpus: rus_wikipedia_2010

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
Та результатам 6826
та результатам 6826
Ён изменения 6238
те университете 5438
Те университете 5438
Ён применения 4292
Го другого 3882
го другого 3882
Ён применение 3772
Та штата 2995
Subword Length 2 - Most frequent subwords
Subword Count
Ён 73
та 44
Та 44
ли 40
Ли 40
Ин 23
ин 23
по 17
По 17
ом 15
Amount of words containing repeated subwords of length 2 - per mille
Per mille
4.6813
Subword Length 3 - most frequent words
Subword Word Frequency
ест естественных 1110
ест естественно 994
ест естественной 738
ест естественного 691
ест естественным 655
ест Естественно 514
ест естественный 432
ест естественные 357
Вар варваров 337
бар Барбара 334
Subword Length 3 - Most frequent subwords
Subword Count
ест 30
Вар 8
бар 5
Бар 5
раз 2
Раз 2
Инь 1
инь 1
Цин 1
пос 1
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.6061
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
то что-то 2251
То что-то 2251
то кто-то 1273
То кто-то 1273
то Кто-то 201
То Кто-то 201
Би Би-би-си 158
би Би-би-си 158
Ан Сан-Антонио 97
то Что-то 83
Subword Length 2 - Most frequent subwords
Subword Count
то 4
То 4
Би 2
би 2
си 1
Йо 1
Ан 1
Си 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.0945
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
вер кавер-версию 151
Вер кавер-версию 151
вер кавер-версии 145
Вер кавер-версии 145
вот вот-вот 128
Вот вот-вот 128
вер кавер-версия 109
Вер кавер-версия 109
вер кавер-версий 97
Вер кавер-версий 97
Subword Length 3 - Most frequent subwords
Subword Count
вер 5
Вер 5
вот 1
Вот 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0742
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
чуть чуть-чуть 86
Чуть чуть-чуть 86
Subword Length 4 - Most frequent subwords
Subword Count
чуть 1
Чуть 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0178
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0000
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
воздух воздух-воздух 67
Воздух воздух-воздух 67
только только-только 43
Только только-только 43
Subword Length 6 - Most frequent subwords
Subword Count
воздух 1
Воздух 1
только 1
Только 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.1400
2433354 msec needed at 2017-10-24 05:32