Korpus: uzn-uz_web_2015_100K

Weitere Korpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
ул Расулуллоҳ 799
Ул Расулуллоҳ 799
Ин ўзининг 611
ин ўзининг 611
Ла болалар 495
ла болалар 495
Ўқ ҳуқуқий 433
ўқ ҳуқуқий 433
ни эканини 338
Ин кишининг 328
Subword Length 2 - Most frequent subwords
Subword Count
ин 1392
Ин 1392
ни 293
Ла 172
ла 172
бо 101
Бо 101
ўқ 81
Ўқ 81
ар 72
Amount of words containing repeated subwords of length 2 - per mille
Per mille
27.3185
Subword Length 3 - most frequent words
Subword Word Frequency
%ни эканини 338
%ни имконини 189
%ни ўрнини 151
%га эгаллаган 86
%ни бўлганини 85
%ни нимани 75
%ни сонини 61
%ни маданиятини 60
%ни имкониятларини 57
%ни ўйинини 56
Subword Length 3 - Most frequent subwords
Subword Count
%ни 741
%га 337
%ли 241
тан 10
Тан 10
бўл 8
бул 8
Бул 8
Бўл 8
ган 7
Amount of words containing repeated subwords of length 3 - per mille
Per mille
16.6888
Subword Length 4 - most frequent words
Subword Word Frequency
%ини қилинишини 29
%ини кўринишини 14
%ини кўринишларини 5
%ини линиясини 5
%ини олинишини 3
%ини Соғиниб-соғиниб 2
%ини бўлинишини 2
гина озгинагина 2
%ини ўзиникини 2
гина Озгинагина 1
Subword Length 4 - Most frequent subwords
Subword Count
%ини 8
гина 2
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.1733
Subword Length 5 - most frequent words
Subword Word Frequency
вақти вақтивақти 3
Вақти вақтивақти 3
Subword Length 5 - Most frequent subwords
Subword Count
вақти 1
Вақти 1
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0317
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
ўз ўз-ўзидан 60
Ўз ўз-ўзидан 60
уз ўз-ўзидан 60
Уз ўз-ўзидан 60
ўз ўз-ўзини 21
Ўз ўз-ўзини 21
не не-не 21
уз ўз-ўзини 21
Не не-не 21
Уз ўз-ўзини 21
Subword Length 2 - Most frequent subwords
Subword Count
ўз 13
Ўз 13
уз 13
Уз 13
оз 4
Оз 4
ич 4
Ич 4
не 3
ар 3
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.4676
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
бир бир-бирига 158
Бир бир-бирига 158
тез тез-тез 94
Тез тез-тез 94
бир бир-биридан 50
Бир бир-биридан 50
бир бир-бирини 42
бир бир-бирларига 42
Бир бир-бирини 42
Бир бир-бирларига 42
Subword Length 3 - Most frequent subwords
Subword Count
бир 38
Бир 38
%ни 9
%ли 5
йул 3
йўл 3
Йўл 3
ўша 2
қат 2
Ўша 2
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
1.1093
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
янги янги-янги 21
Янги янги-янги 21
бора бора-бора 14
азал азал-азалдан 14
жуда жуда-жуда 11
минг минг-минглаб 11
бора Бора-бора 11
Жуда жуда-жуда 11
Минг минг-минглаб 11
энди энди-энди 6
Subword Length 4 - Most frequent subwords
Subword Count
узоқ 3
Узоқ 3
ўзоқ 3
бири 2
Бири 2
аста 2
Аста 2
бора 2
гоҳи 2
жуда 2
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.6065
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
қайта қайта-қайта 46
Қайта қайта-қайта 46
катта катта-катта 24
Катта катта-катта 24
вақти вақти-вақти 23
Вақти вақти-вақти 23
бўлиб бўлиб-бўлиб 7
бошқа бошқа-бошқа 7
кичик кичик-кичик 7
Бошқа бошқа-бошқа 7
Subword Length 5 - Most frequent subwords
Subword Count
Ўйлаб 2
уйлаб 2
кичик 2
Оллоҳ 2
катта 2
Кичик 2
баъзи 2
Катта 2
қанча 2
Баъзи 2
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
1.2695
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
такрор такрор-такрор 8
йиғлаб йиғлаб-йиғлаб 2
Йиғлаб йиғлаб-йиғлаб 2
шундай шундай-шундай 2
Шундай шундай-шундай 2
қаттиқ қаттиқ-қаттиқ 2
мақтаб мақтаб-мақтаб 2
Қаттиқ қаттиқ-қаттиқ 2
миллий Миллий-миллийча 1
Миллий Миллий-миллийча 1
Subword Length 6 - Most frequent subwords
Subword Count
йиғлаб 2
Йиғлаб 2
такрор 1
Баланд 1
бурчак 1
Бурчак 1
мақтаб 1
БУрчак 1
шундай 1
миллий 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.7282
1084055 msec needed at 2020-08-16 00:23