Korpus: sqi_wikipedia_2014

Weitere Korpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
It vitit 7508
it vitit 7508
te vërtetë 1773
vërtetë 1773
vërtetë 1773
vërtetë 1773
Te vërtetë 1773
vërtetë 1773
vërtetë 1773
vërtetë 1773
Subword Length 2 - Most frequent subwords
Subword Count
222
222
222
te 222
222
Te 222
222
222
et 134
ët 134
Amount of words containing repeated subwords of length 2 - per mille
Per mille
15.3719
Subword Length 3 - most frequent words
Subword Word Frequency
gjë përgjegjës 290
Gjë përgjegjës 290
gje përgjegjës 290
Vet vetvete 162
vet vetvete 162
Vet vetveten 153
vet vetveten 153
gjë përgjegjësi 142
Gjë përgjegjësi 142
gje përgjegjësi 142
Subword Length 3 - Most frequent subwords
Subword Count
gjë 39
gje 39
Gjë 39
bar 22
Bar 22
vet 10
Vet 10
Xha 6
xha 6
mer 5
Amount of words containing repeated subwords of length 3 - per mille
Per mille
1.5948
Subword Length 4 - most frequent words
Subword Word Frequency
lloj llojllojshme 29
Lloj llojllojshme 29
para parapara 24
Para parapara 24
Meha Kamehameha 16
lloj llojllojshëm 6
Lloj llojllojshëm 6
lloj llojllojshmëri 4
Lloj llojllojshmëri 4
Make Makemake 4
Subword Length 4 - Most frequent subwords
Subword Count
lloj 3
Lloj 3
Meha 2
para 1
Para 1
Make 1
tëri 1
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.1661
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
ll All-llahu 599
ll All-llahut 310
ll All-llahun 97
ii III-II 15
iI III-II 15
Al sal-allahu 11
al sal-allahu 11
ll All-llahut. 7
ll sal-lall-llahu 7
sh ish-shefi 6
Subword Length 2 - Most frequent subwords
Subword Count
ll 6
Xi 2
ii 2
iI 2
Al 2
al 2
sh 2
Sh 2
vi 2
1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.1887
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
Chi Chi-Chi 5
Subword Length 3 - Most frequent subwords
Subword Count
Chi 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0129
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
herë herë-herë 19
here herë-herë 19
Herë herë-herë 19
Here herë-herë 19
hërë herë-herë 19
lloj lloj-lloj 12
Lloj lloj-lloj 12
gati gati-gati 7
Gati gati-gati 7
valë valë-valë 6
Subword Length 4 - Most frequent subwords
Subword Count
lloj 3
Lloj 3
herë 2
here 2
Herë 2
Here 2
hërë 2
Gati 1
Lara 1
copa 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.2699
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
vende vende-vende 15
Vende vende-vende 15
vënde vende-vende 15
vendë vende-vende 15
pjesë pjesë-pjesë 8
pjese pjesë-pjesë 8
Pjesë pjesë-pjesë 8
Pjese pjesë-pjesë 8
grupe grupe-grupe 4
Grupe grupe-grupe 4
Subword Length 5 - Most frequent subwords
Subword Count
grupe 1
Grupe 1
grupë 1
vende 1
bakër 1
Vende 1
Baker 1
vënde 1
baker 1
vendë 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.2321
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
dredha dredha-dredha 4
Dredha dredha-dredha 4
Subword Length 6 - Most frequent subwords
Subword Count
dredha 1
Dredha 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.1510
2168240 msec needed at 2018-01-21 12:06