Korpus: afr_wikipedia_2018_100K

Weitere Korpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
gegee 459
Ge gegee 459
Si posisie 261
uitgegee 142
Ge uitgegee 142
Er literêre 116
er literêre 116
re literêre 116
oorsese 65
se oorsese 65
Subword Length 2 - Most frequent subwords
Subword Count
er 57
Er 57
Si 45
Is 37
is 37
in 33
In 33
31
Ge 31
en 28
Amount of words containing repeated subwords of length 2 - per mille
Per mille
6.9615
Subword Length 3 - most frequent words
Subword Word Frequency
An% aanvanklik 405
An% Aanvanklik 131
Els stelsels 121
Els sterrestelsels 75
An% aanvang 60
An% aanvanklike 60
An% aanhangers 55
An% vooraanstaande 50
An% Atlantiese Oseaan 45
An% aangegaan 34
Subword Length 3 - Most frequent subwords
Subword Count
An% 581
Els 45
Bar 9
bar 9
oor 7
Oor 7
nde 6
ver 5
Ver 5
vêr 5
Amount of words containing repeated subwords of length 3 - per mille
Per mille
9.0106
Subword Length 4 - most frequent words
Subword Word Frequency
Khoi Khoikhoi 18
make Makemake 3
Make Makemake 3
maan maanmaand 2
maan maanmaande 2
Maan maanmaand 2
Maan maanmaande 2
20px 20px20px 1
klop Landeryklopkloppie 1
Khoi KhoiKhoi 1
Subword Length 4 - Most frequent subwords
Subword Count
Khoi 10
maan 2
Maan 2
klop 1
make 1
kele 1
Make 1
Kele 1
wiki 1
Wiki 1
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.3631
Subword Length 5 - most frequent words
Subword Word Frequency
Suid- Suid-Suid-Afrika 1
suid- Suid-Suid-Afrika 1
Subword Length 5 - Most frequent subwords
Subword Count
Suid- 1
suid- 1
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0274
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
en een-en-twintig 5
En een-en-twintig 5
én een-en-twintig 5
El diesel-elektriese 4
el diesel-elektriese 4
en een-en-twintigste 2
en heen-en-weer 2
En een-en-twintigste 2
En heen-en-weer 2
én een-en-twintigste 2
Subword Length 2 - Most frequent subwords
Subword Count
en 5
En 5
én 5
er 4
Er 4
on 3
On 3
re 3
El 2
el 2
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.3797
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
een een-een 13
Een een-een 13
één een-een 13
net net-net 9
Net net-net 9
Jan Jan-Jan 2
oud oud-ouderling 2
dik Damara-dik-dik 1
Dik Damara-dik-dik 1
Off Off-Off-Broadway 1
Subword Length 3 - Most frequent subwords
Subword Count
een 1
Een 1
één 1
net 1
Net 1
Jan 1
oud 1
dik 1
Dik 1
Off 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0759
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
plek plek-plek 9
Plek plek-plek 9
Khoi Khoi-Khoi 7
kort kort-kort 4
Kort kort-kort 4
plek Plek-plek 3
stuk stuk-stuk 3
Plek Plek-plek 3
Béla Bela-Bela 3
Stuk stuk-stuk 3
Subword Length 4 - Most frequent subwords
Subword Count
Khoi 3
kort 3
Kort 3
plek 2
Plek 2
Drie 1
blou 1
Blou 1
take 1
Take 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.2940
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
Baden Baden-Baden 10
Duits Duits-Duitse 1
speel Speel-speel” 1
Speel Speel-speel” 1
Subword Length 5 - Most frequent subwords
Subword Count
Baden 1
Duits 1
speel 1
Speel 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0823
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
Eoseen Paleoseen-Eoseen 1
Subword Length 6 - Most frequent subwords
Subword Count
Eoseen 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0465
1309652 msec needed at 2024-01-17 13:25