Technical Report Series on Corpus Building
Vol. 3 (April 2013)
Dutch Corpora
Uwe Quasthoff Dirk Goldhahn Michael Cysouw
Abteilung Automatische Sprachverarbeitung, Institut für Informatik, Universität Leipzig
Affiliation of the authors: Uwe Quasthoff und Dirk Goldhahn: Institut für Informatik,Universität Leipzig {quasthoff, dgoldhahn}@informatik.uni-leipzig.de Michael Cysouw, Forschungszentrum Deutscher Sprachatlas, Universität Marburg,
[email protected]
Copyright: Abteilung Automatische Sprachverarbeitung, Institut für Informatik, Universität Leipzig, http://asv.informatik.uni-leipzig.de/
Technical Report Series on Corpus Building Vol. 1: Deutscher Wortschatz 2013 Vol. 2: Danish Corpora Vol. 3: Dutch Corpora
This PDF document was created using the open source tool mwlib. For more infotmation, see http://code.pediapress.com/ PDF generated at: Wed, 03 Apr 2013
Dutch corpora
1
Introduction to corpus creation
1
NLD - a processing related language description
2
NLD corpora
3
NLD corpus comparison
8
Processing details
9
Appendix to nld news 2007: Database summary
9
Appendix to nld news 2008: Database summary
9
Appendix to nld news 2009: Database summary
10
Appendix to nld news 2010: Database summary
10
Appendix to nld news 2011: Database summary
11
Appendix to nld newscrawl 2011: Database summary
11
Appendix to nld wikipedia 2007: Database summary
12
Appendix to nld wikipedia 2012: Database summary
12
Appendix to nld web 2002: Database summary
13
Appendix to nld web 2011: Database summary
13
Appendix to nld mixed 2012: Database summary
14
Content details
15
Appendix to nld news 2007: Size of different TLDs
15
Appendix to nld news 2008: Size of different TLDs
15
Appendix to nld news 2009: Size of different TLDs
16
Appendix to nld news 2010: Size of different TLDs
16
Appendix to nld news 2011: Size of different TLDs
17
Appendix to nld newscrawl 2011: Size of different TLDs
17
Appendix to nld web 2002: Size of different TLDs
18
Appendix to nld web 2011: Size of different TLDs
18
Appendix to nld mixed 2012: Size of different TLDs
18
Appendix to nld news 2007: Size of largest domains
19
Appendix to nld news 2008: Size of largest domains
19
Appendix to nld news 2009: Size of largest domains
20
Appendix to nld news 2010: Size of largest domains
21
Appendix to nld news 2011: Size of largest domains
21
Appendix to nld newscrawl 2011: Size of largest domains
22
Appendix to nld web 2002: Size of largest domains
23
Appendix to nld web 2011: Size of largest domains
23
Appendix to nld mixed 2012: Size of largest domains
24
Appendix to nld news 2007: Number of sources by time period
25
Appendix to nld news 2008: Number of sources by time period
27
Appendix to nld news 2009: Number of sources by time period
28
Appendix to nld news 2010: Number of sources by time period
30
Appendix to nld news 2011: Number of sources by time period
31
Word details
33
Appendix to nld news 2007: Words by length without multiplicity
33
Appendix to nld news 2008: Words by length without multiplicity
35
Appendix to nld news 2009: Words by length without multiplicity
37
Appendix to nld news 2010: Words by length without multiplicity
39
Appendix to nld news 2011: Words by length without multiplicity
41
Appendix to nld newscrawl 2011: Words by length without multiplicity
43
Appendix to nld wikipedia 2007: Words by length without multiplicity
45
Appendix to nld wikipedia 2012: Words by length without multiplicity
47
Appendix to nld web 2002: Words by length without multiplicity
49
Appendix to nld web 2011: Words by length without multiplicity
51
Appendix to nld mixed 2012: Words by length without multiplicity
53
Appendix to nld news 2007: Words by length with multiplicity
55
Appendix to nld news 2008: Words by length with multiplicity
57
Appendix to nld news 2009: Words by length with multiplicity
59
Appendix to nld news 2010: Words by length with multiplicity
61
Appendix to nld news 2011: Words by length with multiplicity
63
Appendix to nld newscrawl 2011: Words by length with multiplicity
65
Appendix to nld wikipedia 2007: Words by length with multiplicity
67
Appendix to nld wikipedia 2012: Words by length with multiplicity
69
Appendix to nld web 2002: Words by length with multiplicity
71
Appendix to nld web 2011: Words by length with multiplicity
73
Appendix to nld mixed 2012: Words by length with multiplicity
75
Appendix to nld news 2007: The most frequent 50 words
76
Appendix to nld news 2008: The most frequent 50 words
77
Appendix to nld news 2009: The most frequent 50 words
78
Appendix to nld news 2010: The most frequent 50 words
79
Appendix to nld news 2011: The most frequent 50 words
80
Appendix to nld newscrawl 2011: The most frequent 50 words
81
Appendix to nld wikipedia 2007: The most frequent 50 words
82
Appendix to nld wikipedia 2012: The most frequent 50 words
83
Appendix to nld web 2002: The most frequent 50 words
84
Appendix to nld web 2011: The most frequent 50 words
85
Appendix to nld mixed 2012: The most frequent 50 words
86
Appendix to nld news 2007: Longest words in top-1.000 by rank
87
Appendix to nld news 2008: Longest words in top-1.000 by rank
88
Appendix to nld news 2009: Longest words in top-1.000 by rank
89
Appendix to nld news 2010: Longest words in top-1.000 by rank
90
Appendix to nld news 2011: Longest words in top-1.000 by rank
91
Appendix to nld newscrawl 2011: Longest words in top-1.000 by rank
92
Appendix to nld wikipedia 2007: Longest words in top-1.000 by rank
93
Appendix to nld wikipedia 2012: Longest words in top-1.000 by rank
94
Appendix to nld web 2002: Longest words in top-1.000 by rank
95
Appendix to nld web 2011: Longest words in top-1.000 by rank
96
Appendix to nld mixed 2012: Longest words in top-1.000 by rank
97
Character N-gram details
98
Appendix to nld news 2007: Alphabet as used in the top-100.000 words
98
Appendix to nld news 2008: Alphabet as used in the top-100.000 words
99
Appendix to nld news 2009: Alphabet as used in the top-100.000 words
100
Appendix to nld news 2010: Alphabet as used in the top-100.000 words
101
Appendix to nld news 2011: Alphabet as used in the top-100.000 words
103
Appendix to nld newscrawl 2011: Alphabet as used in the top-100.000 words
104
Appendix to nld wikipedia 2007: Alphabet as used in the top-100.000 words
105
Appendix to nld wikipedia 2012: Alphabet as used in the top-100.000 words
106
Appendix to nld web 2002: Alphabet as used in the top-100.000 words
108
Appendix to nld web 2011: Alphabet as used in the top-100.000 words
109
Appendix to nld mixed 2012: Alphabet as used in the top-100.000 words
110
Abbreviation details
112
Appendix to nld news 2007: Most frequent abbreviations
112
Appendix to nld news 2008: Most frequent abbreviations
113
Appendix to nld news 2009: Most frequent abbreviations
114
Appendix to nld news 2010: Most frequent abbreviations
115
Appendix to nld news 2011: Most frequent abbreviations
116
Appendix to nld newscrawl 2011: Most frequent abbreviations
117
Appendix to nld wikipedia 2007: Most frequent abbreviations
118
Appendix to nld wikipedia 2012: Most frequent abbreviations
119
Appendix to nld web 2002: Most frequent abbreviations
120
Appendix to nld web 2011: Most frequent abbreviations
121
Appendix to nld mixed 2012: Most frequent abbreviations
122
Appendix to nld news 2007: Left neighbors of the full stop
123
Appendix to nld news 2008: Left neighbors of the full stop
124
Appendix to nld news 2009: Left neighbors of the full stop
125
Appendix to nld news 2010: Left neighbors of the full stop
126
Appendix to nld news 2011: Left neighbors of the full stop
127
Appendix to nld newscrawl 2011: Left neighbors of the full stop
128
Appendix to nld wikipedia 2007: Left neighbors of the full stop
129
Appendix to nld wikipedia 2012: Left neighbors of the full stop
130
Appendix to nld web 2002: Left neighbors of the full stop
131
Appendix to nld web 2011: Left neighbors of the full stop
132
Appendix to nld mixed 2012: Left neighbors of the full stop
133
Appendix to nld news 2007: Left neighbors of the full stop with additional internal full stops
134
Appendix to nld news 2008: Left neighbors of the full stop with additional internal full stops
135
Appendix to nld news 2009: Left neighbors of the full stop with additional internal full stops
136
Appendix to nld news 2010: Left neighbors of the full stop with additional internal full stops
137
Appendix to nld news 2011: Left neighbors of the full stop with additional internal full stops
138
Appendix to nld newscrawl 2011: Left neighbors of the full stop with additional internal full stops 139 Appendix to nld wikipedia 2007: Left neighbors of the full stop with additional internal full stops
140
Appendix to nld wikipedia 2012: Left neighbors of the full stop with additional internal full stops
141
Appendix to nld web 2002: Left neighbors of the full stop with additional internal full stops
142
Appendix to nld web 2011: Left neighbors of the full stop with additional internal full stops
143
Appendix to nld mixed 2012: Left neighbors of the full stop with additional internal full stops
144
Sentences details
145
Appendix to nld news 2007: Shortest sentences
145
Appendix to nld news 2008: Shortest sentences
146
Appendix to nld news 2009: Shortest sentences
148
Appendix to nld news 2010: Shortest sentences
149
Appendix to nld news 2011: Shortest sentences
151
Appendix to nld newscrawl 2011: Shortest sentences
152
Appendix to nld wikipedia 2007: Shortest sentences
154
Appendix to nld wikipedia 2012: Shortest sentences
155
Appendix to nld web 2002: Shortest sentences
157
Appendix to nld web 2011: Shortest sentences
158
Appendix to nld mixed 2012: Shortest sentences
160
Appendix to nld news 2007: Longest sentences
161
Appendix to nld news 2008: Longest sentences
163
Appendix to nld news 2009: Longest sentences
165
Appendix to nld news 2010: Longest sentences
167
Appendix to nld news 2011: Longest sentences
169
Appendix to nld newscrawl 2011: Longest sentences
171
Appendix to nld wikipedia 2007: Longest sentences
173
Appendix to nld wikipedia 2012: Longest sentences
175
Appendix to nld web 2002: Longest sentences
177
Appendix to nld web 2011: Longest sentences
179
Appendix to nld mixed 2012: Longest sentences
181
Appendix to nld news 2007: Length of sentences in characters
183
Appendix to nld news 2008: Length of sentences in characters
184
Appendix to nld news 2009: Length of sentences in characters
185
Appendix to nld news 2010: Length of sentences in characters
186
Appendix to nld news 2011: Length of sentences in characters
187
Appendix to nld newscrawl 2011: Length of sentences in characters
188
Appendix to nld wikipedia 2007: Length of sentences in characters
189
Appendix to nld wikipedia 2012: Length of sentences in characters
190
Appendix to nld web 2002: Length of sentences in characters
191
Appendix to nld web 2011: Length of sentences in characters
192
Appendix to nld mixed 2012: Length of sentences in characters
193
Appendix to nld news 2007: Length of sentences in words
194
Appendix to nld news 2008: Length of sentences in words
195
Appendix to nld news 2009: Length of sentences in words
196
Appendix to nld news 2010: Length of sentences in words
197
Appendix to nld news 2011: Length of sentences in words
198
Appendix to nld newscrawl 2011: Length of sentences in words
199
Appendix to nld wikipedia 2007: Length of sentences in words
200
Appendix to nld wikipedia 2012: Length of sentences in words
201
Appendix to nld web 2002: Length of sentences in words
202
Appendix to nld web 2011: Length of sentences in words
203
Appendix to nld mixed 2012: Length of sentences in words
204
Oddities details
205
Appendix to nld news 2007: Longest words
205
Appendix to nld news 2008: Longest words
205
Appendix to nld news 2009: Longest words
206
Appendix to nld news 2010: Longest words
206
Appendix to nld news 2011: Longest words
207
Appendix to nld newscrawl 2011: Longest words
207
Appendix to nld wikipedia 2007: Longest words
208
Appendix to nld wikipedia 2012: Longest words
208
Appendix to nld web 2002: Longest words
209
Appendix to nld web 2011: Longest words
209
Appendix to nld mixed 2012: Longest words
210
Appendix to nld news 2007: Sentences with high average word length
210
Appendix to nld news 2008: Sentences with high average word length
211
Appendix to nld news 2009: Sentences with high average word length
212
Appendix to nld news 2010: Sentences with high average word length
213
Appendix to nld news 2011: Sentences with high average word length
214
Appendix to nld newscrawl 2011: Sentences with high average word length
215
Appendix to nld wikipedia 2007: Sentences with high average word length
216
Appendix to nld wikipedia 2012: Sentences with high average word length
217
Appendix to nld web 2002: Sentences with high average word length
218
Appendix to nld web 2011: Sentences with high average word length
219
Appendix to nld mixed 2012: Sentences with high average word length
220
Appendix to nld news 2007: Problems with sentence segmentation - words ending in a stopword
221
Appendix to nld news 2008: Problems with sentence segmentation - words ending in a stopword
222
Appendix to nld news 2009: Problems with sentence segmentation - words ending in a stopword
223
Appendix to nld news 2010: Problems with sentence segmentation - words ending in a stopword
224
Appendix to nld news 2011: Problems with sentence segmentation - words ending in a stopword
225
Appendix to nld newscrawl 2011: Problems with sentence segmentation - words ending in a stopword 226 Appendix to nld wikipedia 2007: Problems with sentence segmentation - words ending in a stopword 227 Appendix to nld wikipedia 2012: Problems with sentence segmentation - words ending in a stopword 228 Appendix to nld web 2002: Problems with sentence segmentation - words ending in a stopword
229
Appendix to nld web 2011: Problems with sentence segmentation - words ending in a stopword
230
Appendix to nld mixed 2012: Problems with sentence segmentation - words ending in a stopword 231
1
Dutch corpora Introduction to corpus creation The Leipzig Corpora Collection (LCC) collects Web based corpora for many different languages. The main text genres are newspaper texts, Wikipedias and randomly collected web pages. All corpora are processed in the same way: • • • • • • •
Crawling Web pages HTML stripping Language identifikation Sentence segmentation Cleaning: Removal of ill-formed sentences Duplicate removal Calculation of word frequences and word co-occurrences
As result we have a corpus containing only well-formed sentences in the language under consideration. The sentences are in random order; hence, sharing the corpus does not violate copyright law because it is impossible to reconstruct the original texts. The pre-processing steps contain both language independent steps (like HTML stripping and duplicate removal) and language dependent steps (like language identification and sentence segmentation). Especially the language specific parts are vulnerable to specific processing problems. The aim of the paper is to identify possible problems and evaluate the results. The following problems are adressed: • • • • • •
A processing-focused language description Language size: How much text is available for this language? What are the biggest sources? Corpus description: Genre, size, crawling and processing date. Possible problems in language identification: Which languages are similar? Character set and alphabet Inspecting the word list: Most frequent words, longer high frequent words and longest words at all. Word length distribution. • Can abbreviations confuse sentence segmentation? Information about the abbreviation list. • Inspecting sentences: Inspect shortest and longest sentences to identify possible segmentation problems. Sentence length distribution. The paper describes the result of these inspections; the appendices show the exact results for the different corpora. This helps to compare the corpora with respect to quality. In the section quality overview, an overall quality description for each corpus is given. All corpora contain only minor problems which are irrelevant for most applications. Otherwise the corpus creation has been iterated.
NLD - a processing related language description
NLD - a processing related language description Language description: Dutch General properties of the language • • • • •
Native Name: Nederlands Classifiation: Indo-European, Germanic, West, Low Saxon-Low Franconian, Low Franconian Total Number of Speakers: 21M Largest countries with number of spakers: Netherlands (16M), Belgium (4.6M), Suriname (0.2M) Source: http://www.ethnologue.org/show_language.asp?code=nld
Properties important for processing Alphabet and punctuation • The alphabet is latin based, with the following specialities (source:en.wikipedia.org/wiki/Alphabets_derived_from_the_Latin): • Dutch includes all 26 base letters • Additional letter forms: Á, À, Â, Ä, É, È, Ê, Ë, Í, Ì, Î, Ï, Ó, Ò, Ô, Ö, Ú, Ù, Û, Ü • Additional digraphs: ij • Usual latin punctuation • Usage of uppercase letters: • At sentence beginnings and • for proper names (of persons, organisations, countries etc.). • When a word beginning with ij is capitalized, both letters become capitals, e.g. IJsselmeer.
Sentence segmentation and word tokenization • Sentence beginnings • Usually, sentencees begin with a capitalized first word. • Uncommon exceptions are the following lowercase beginnings preceded by an apostrophe: 'n, 't, 's, ('k). Example: 'n Beetje eng, maar wel super spannend. • Abbreviations • Abbreviations confusing with sentence boundaries: Special abbreviation list has to be inspected. • Sources for abbreviations: http://nl.wikipedia.org/wiki/Afkorting • Abbreviations with full stop may appear in the word list without full stop. • Apostrophes • Use of apostrophes: infrequent. • Used in clitic forms like "’s" as abbreviation for "des" • Used in fixed expressions or place names such as 's-Gravenhage and 's-Hertogenbosch • Mainly used to mark citations • Frequency ratio compared with comma in nld_mixed_2012: '/, = 4.209.290 / 35.011.915 • Multiwords • Number of multiwords: 2011 • source: Wikipedia
2
NLD - a processing related language description
Sources • Estimated number of webpages containing text
• • • • • •
• Google.com top-5 words: 692,000,000 results for "de" "van" "een" "en" "het" • Google.com top-10 words: 3,550,000 results for "de" "van" "een" "en" "het" "in" "is" "op" "te" "met" Rank according to number of speakers (Ethnologue): 42 Rank according to Wikipedia size 11/2012 (see http://de.wikipedia.org/wiki/Wikipedia:Sprachen): Rank 4 with 1.127.983 articles. Rank according to web text: 8? (Bing search engine, Haselhuhn data, September 2012) Rank according to number of newspapers as found by AbyZ (5/2012): 223 newspapers, rank 11. Rank according to number of newspapers with RSS feeds (5/2012): 230 newspapers, rank 7. Rank according to our corpus size (9/2012): 6
NLD corpora Quality Overview Quality Ratings • A: Very good quality. Ready to use (or already used) for frequency dictionary. • Size as large as possible • Only minimal errors • Multiple genres (if possible) • A-: Small problems identified. They should not affect usage. • B: Native speaker quality. • Information about abbreviations and sentence boundaries by native speaker • Resulting statistics checked by native speaker, possible errors corrected • C: Non-native speaker quality • Obvious problems shown in corpus statistics are corrected • D: First version • Pre-processing with default abbreviation list and default sentence boundaries • E: Poor Quality: Old, outdated or faulty.
Corpus Quality The quality of the corpora differes slightly because the corpus processing toolchain changed slightly during several years. Moreover, original data are often no more available. Hence, improvement of quality often means removing incomplete or doubtful sentences. Forthcoming editions of all corpora thus might have a slightly smaller number of sentences. This especially applies to near duplicate sentences which are removed only sparingly. The following table shows the quality of the corpora. Minimal errors are still possible and described in the sections below. All possible major improvements are mentioned here.
3
NLD corpora
4
Corpus
Quality rating Known problems
to-dos
nld_news_2007
A
-
-
nld_news_2008
A-
14% without date
-
nld_news_2009
A-
14% without date
-
nld_news_2010
A
-
-
nld_news_2011
A
-
-
nld_newscrawl_2011 A
-
-
nld_web_2002
A
-
-
nld_web_2011
A
-
-
nld_wikipedia_2007
A-
near duplicates, see sentence length distibution -
nld_wikipedia_2012
A-
near duplicates, see sentence length distibution -
nld_mixed_2012
A
-
-
Processing Overview For more details, see Appendix: Database Summary and Appendix: Number of sources by time period. Corpus
Size (M sentences) Size (M running words) Multiwords Crawling date
Production date
nld_news_2007
5
79
0
end of 2005-end of 2007
2010
nld_news_2008
5
77
744
daily 2008, 14% without date 2011
nld_news_2009
5.5
85
762
daily 2009, 14% without date 2011
nld_news_2010
5.4
83
728
daily 2010
2011
nld_news_2011
2.9
45
618
daily 2011
2012
nld_newscrawl_2011 5
81
716
04/2012
2012
nld_web_2002
22
338
4
batch crawl 2002
2010
nld_web_2011
23
362
989
12/2010 - 12/2011
2012
nld_wikipedia_2007
2.6
43
0
10/2007
2010
nld_wikipedia_2012
4.8
81
973
01/2012
2012
nld_mixed_2012
72
1121
1242
see above
2012
Content Overview For more details, see Appendix: Size of different TLDs and Appendix: Size of different domains.
NLD corpora
5
Corpus
Type of sources Countries
Number of sources Publishing date Biggest source
nld_news_2007
News
nl(72%), be(22%)
368
2005-2007
www.ad.nl/
nld_news_2008
News
nl(79%), be(10%)
281
2008
www.spitsnieuws.nl/
nld_news_2009
News
nl(70%), be(15%)
290
2009
www.spitsnieuws.nl/
nld_news_2010
News
nl(75%), be(13%)
336
2010
www.spitsnieuws.nl/
nld_news_2011
News
nl(66%), com(25%) 337
2011
geenstijl.feedsportal.com/
nld_newscrawl_2011 News
nl(81%), be(15%)
43
2011 and before www.refdag.nl/
nld_web_2002
Web
nl (100%)
77383
2002 and before www.burojansen.nl/
nld_web_2011
Web
nl(81%), be(13%)
216866
2011 and before www.tboek.nl/
nld_wikipedia_2007
Wikipedia
-
1
2007 and before wikipedia.org
nld_wikipedia_2012
Wikipedia
-
1
2012 and before wikipedia.org
nld_mixed_2012
Mixed Sources
nl(72%), be(14%)
471978
2012 and before www.spitsnieuws.nl/
Words Appendix: Words by Length without multiplicity shows a plot of the corresponding length distribution. A smooth asymetric bell-shaped curve is expected. Appendix: Words by Length with multiplicity shows a plot of the corresponding length distribution. A smooth asymetric bell-shaped curve is expected. Appendix: The Most Frequent 50 Words shows the most frequent stopwords as well as one or more words related to the region. Appendix: Longest Words in Top-1000 by rank shows the 25 longest words within the top-1000. The usually give an impression of the main topics treated in the corpus. Appendix: Longest Words with minimum frequency 2 should give an idea of very long words. In the case of processing problems, different types of non-words may appear. This might help to improve the word definition. Corpus
Word length graph without multiplicity
Word length graph with multiplicity
Most Frequent 50 Words
Longest Words in Top-1000
Longest Words with minimum frequency 2
nld_news_2007
okay
okay
okay
okay
URLs, routes
nld_news_2008
okay
okay
okay
okay
special characters
nld_news_2009
okay
okay
okay
okay
URLs, routes
nld_news_2010
okay
okay
okay
okay
URLs, routes, missing blanks etc.
nld_news_2011
okay, min. average 10.47
okay, max. average 5.29
okay
okay
URLs, routes, missing blanks etc.
nld_newscrawl_2011 okay
okay
okay
okay
Missing blanks, junk, etc.
nld_web_2002
okay
okay
okay
okay
URLs, missing blanks, special characters
nld_web_2011
okay
okay
okay
okay
non-utf8, missing blanks, etc.
nld_wikipedia_2007
???
okay
okay
rank 179:Wikipediagebruiker(s
special characters, routes
NLD corpora
6
nld_wikipedia_2012
okay
okay, min. average 4.96
okay
okay
special characters, URLs, routes
nld_mixed_2012
okay, max. average 12.18
okay
okay
okay
all of the above
Abbreviations Abbreviations are usually not used as sentence boundaries. Conversely, missing abbreviations can overgenerate sentence boundaries. Due to limitations in the processing chain, the list of abbreviations used for sentence boundary detection can differ from the abbreviations in the word list. • Appendix: Most Frequent Abbreviations shows possible under-generation of sentence boundaries by wrong abbreviations (i.e. words ending in a full stop) in the word list.
Sentences Appendix: Shortest sentences shows the shortest declarative, exclamatory and interrogative sentences. In preprocessing, a minimal length for sentences might be specified. And missing abbreviations are often visible as faulty sentence engings. Appendix: Longest sentences shows the longest declarative, exclamatory and interrogative sentences. Usually, the maximun sentence length is defined as 256 characters (not 256 bytes). Very long exclamatory or interrogative sentences often contain an overseen sentence boundary. Appendix: Length of sentences in characters shows the distribution of the sentence length. A large and balanced corpus will result in a smooth and bell-shaped curve. Isolated local maxima usually result from large sets of near duplicate sentences. Corpus
Shortest sentences
Longest sentences
Length distribution (in characters)
Length distribution (in words)
nld_news_2007
Some wrong sentence beginnings
okay
okay
okay
nld_news_2008
okay
okay
okay
okay
nld_news_2009
okay
okay
okay
okay
nld_news_2010
non-utf8 character
okay
okay
okay
nld_news_2011
okay
some concatenated non-sentences
okay
okay
nld_newscrawl_2011 okay
some concatenated non-sentences
okay
okay
nld_web_2002
okay
Link in text, some non-sentences
okay
okay
nld_web_2011
okay
some non-sentences
okay
okay
nld_wikipedia_2007
okay
okay
seveal near duplicate peaks
seveal near duplicate peaks
nld_wikipedia_2012
some wrong beginnings.
some wrong sentence boundaries
seveal near duplicate peaks
seveal near duplicate peaks
nld_mixed_2012
(XXX not ready)
all of the above.
okay
okay
NLD corpora
7
Oddities Appendix: Sentences with high average word length: Average sentences contain many stopwords, and these stopwords are usually short. Hence, they restrict the average word length in a sentence. Conversely, sentences with high average word length are often ill formed. They may be used to improve pre-processing. Appendix: Problems with sentence segmentation - Words ending in a stopword: If there are many ill-formed word or sentence boundaries witout a blank between two words, they will generate new ill-formed words. The appendix shows the most frequent words ending in an uppercase stopword. If they are infrequent then the date were of high quality. Corpus
Sentences with high average word length Words ending in a stopword
nld_news_2007
URLs, missing blanks
rudimentary HTML constants like rsquo;’De
nld_news_2008
URLs, missing blanks, junk
HTML constants, non-utf8
nld_news_2009
URLs, missing blanks, very long words
some sentence boundaries without blank
nld_news_2010
URLs, missing blanks, very long words
all above
nld_news_2011
URLs, missing blanks, very long words
maxfreq=28
nld_newscrawl_2011 URLs, missing blanks, very long words
maxfreq=15
nld_web_2002
URLs, missing blanks
Hex characters: 8220;De
nld_web_2011
URLs, missing blanks, routes
non-utf8
nld_wikipedia_2007
URLs, chemicals
okay, maxfreq=12
nld_wikipedia_2012
URLs, chemicals
okay, maxfreq=11
nld_mixed_2012
as above
as above
POS Tagging The Stuttgart TreeTagger provides POS-Tagging and baseform reduction for Dutch. If applied to a corpus, frequencies for words with POS-tags are provided.
NLD corpus comparison
NLD corpus comparison Automated Corpus comparison For the conducted comparisons, the following tests on the top-1000 words are performed: • Vectors based on the frequencies of the top-1000 words are created for the analysed languages. The cosine of the angle between these vectors is computed. Identical languages receive a value of 0, distinct languages get a value of 1. • The same analysis is conducted using the frequencies of the top-1000 typical letter trigrams of the languages.
Monolingual word list comparison (top-1000 words) As one can expect the comparisons show: • • • •
The different news corpora have word lists with maximum distance 0.19 (news_2007 and news_2011) The web corpora have word lists with distance 0.11 The wikipedia corpora are similar with distance 0.09 The biggest distance of 0.62 can be found between bible_2012 and wikipedia_2007
• The mixed corpus nld_mixed_2012 has a central position within the corpora and has a maximum distance of 0.57 to the bible_2012 corpus
Multilingual word list comparison (top-1000 words) Both the comparison of the top-1000 words and the comparison of the letter trigrams used in these words were conducted to find the most similar languages to Dutch based on these features. The distance of Dutch to the next languages Afrikaans are 0.57 for the words and 0.34 for the letter trigrams. These distances are below average. On average the value for the most similar language to a language in question is 0.58 for trigrams. • The most similar languages based on words: Afrikaans, Western Frisian, Norwegian +--------+---------------------+------------------+-------------+ | source | language_short_name | language_name | cos_logfreq | +--------+---------------------+------------------+-------------+ | nld | afr | Afrikaans | 0.571188 | | nld | fri | Frisian, Western | 0.75231 | | nld | nor | Norwegian | 0.864657 | | nld | ltz | Luxembourgeois | 0.877861 | | nld | dan | Danish | 0.880388 | +--------+---------------------+------------------+-------------+ • The most similar languages based on letter trigrams: Afrikaans, German, Danish +--------+---------------------+--------------------+-------------+ | source | language_short_name | language_name | cos_logfreq | +--------+---------------------+--------------------+-------------+ | nld | afr | Afrikaans | 0.335886 | | nld | deu | German | 0.514411 | | nld | dan | Danish | 0.547686 | | nld | nor | Norwegian | 0.548445 | | nld | nob | Norwegian, Bokmål | 0.578093 | +--------+---------------------+--------------------+-------------+
8
9
Processing details Appendix to nld news 2007: Database summary Values for some general parameters Parameter
Value
Number of sentences
4815810
Number of running word forms
78780379
Number of distinct word forms
1227805
Number of multiwords
0
Percentage of words with frequency=1
57.6491
Number of sentence based co-occurrences 12561274 Number of neighbour co-occurrences
1519141
Appendix to nld news 2008: Database summary Values for some general parameters Parameter
Value
Number of sentences
4854115
Number of running word forms
77149027
Number of distinct word forms
1198513
Number of multiwords
744
Percentage of words with frequency=1
58.2538
Number of sentence based co-occurrences 12316530 Number of neighbour co-occurrences
1484614
Appendix to nld news 2009: Database summary
10
Appendix to nld news 2009: Database summary Values for some general parameters Parameter
Value
Number of sentences
5467051
Number of running word forms
84853169
Number of distinct word forms
1300809
Number of multiwords
762
Percentage of words with frequency=1
59.7146
Number of sentence based co-occurrences 12722438 Number of neighbour co-occurrences
1564029
Appendix to nld news 2010: Database summary Values for some general parameters Parameter
Value
Number of sentences
5385961
Number of running word forms
82573184
Number of distinct word forms
1221426
Number of multiwords
728
Percentage of words with frequency=1
59.4512
Number of sentence based co-occurrences 12254282 Number of neighbour co-occurrences
1500045
Appendix to nld news 2011: Database summary
11
Appendix to nld news 2011: Database summary Values for some general parameters Parameter
Value
Number of sentences
2827087
Number of running word forms
44677864
Number of distinct word forms
831329
Number of multiwords
618
Percentage of words with frequency=1
58.0094
Number of sentence based co-occurrences 6629074 Number of neighbour co-occurrences
881362
Appendix to nld newscrawl 2011: Database summary Values for some general parameters Parameter
Value
Number of sentences
4998824
Number of running word forms
80596345
Number of distinct word forms
1153682
Number of multiwords
716
Percentage of words with frequency=1
56.3541
Number of sentence based co-occurrences 12397674 Number of neighbour co-occurrences
1626231
Appendix to nld wikipedia 2007: Database summary
12
Appendix to nld wikipedia 2007: Database summary Values for some general parameters Parameter
Value
Number of sentences
2642751
Number of running word forms
42837322
Number of distinct word forms
1148661
Number of multiwords
0
Percentage of words with frequency=1
55.7601
Number of sentence based co-occurrences 7414840 Number of neighbour co-occurrences
931670
Appendix to nld wikipedia 2012: Database summary Values for some general parameters Parameter
Value
Number of sentences
4827138
Number of running word forms
80688271
Number of distinct word forms
1842412
Number of multiwords
973
Percentage of words with frequency=1
55.6300
Number of sentence based co-occurrences 12578406 Number of neighbour co-occurrences
1533353
Appendix to nld web 2002: Database summary
13
Appendix to nld web 2002: Database summary Values for some general parameters Parameter
Value
Number of sentences
21834114
Number of running word forms
337980054
Number of distinct word forms
4587117
Number of multiwords
4
Percentage of words with frequency=1
60.9881
Number of sentence based co-occurrences 38879606 Number of neighbour co-occurrences
4596797
Appendix to nld web 2011: Database summary Values for some general parameters Parameter
Value
Number of sentences
22559841
Number of running word forms
362040180
Number of distinct word forms
4436927
Number of multiwords
989
Percentage of words with frequency=1
55.6717
Number of sentence based co-occurrences 46742058 Number of neighbour co-occurrences
5022334
Appendix to nld mixed 2012: Database summary
14
Appendix to nld mixed 2012: Database summary Values for some general parameters Parameter
Value
Number of sentences
70349513
Number of running word forms
1121438338
Number of distinct word forms
10605969
Number of multiwords
1242
Percentage of words with frequency=1
59.9697
Number of sentence based co-occurrences 120112724 Number of neighbour co-occurrences
11942334
15
Content details Appendix to nld news 2007: Size of different TLDs TLDs larger than 1% TLD # of sources
%
.nl/
519852
72.05
.be/
161273
22.35
com/ 32848
4.55
Appendix to nld news 2008: Size of different TLDs TLDs larger than 1% TLD # of sources
%
.nl/
454577
78.60
.be/
58543
10.12
com/ 57950
10.02
Appendix to nld news 2009: Size of different TLDs
16
Appendix to nld news 2009: Size of different TLDs TLDs larger than 1% TLD # of sources
%
.nl/
417100
69.76
.be/
92405
15.45
com/ 75982
12.71
net/
1.54
9221
Appendix to nld news 2010: Size of different TLDs TLDs larger than 1% TLD # of sources
%
.nl/
404307
74.91
.be/
70504
13.06
com/ 51964
9.63
net/
1.67
9003
Appendix to nld news 2011: Size of different TLDs
17
Appendix to nld news 2011: Size of different TLDs TLDs larger than 1% TLD # of sources .nl/
235841
% 66.31
com/ 89095
25.05
net/
15348
4.32
.ws/
9350
2.63
nfo/
4148
1.17
Appendix to nld newscrawl 2011: Size of different TLDs TLDs larger than 1% TLD # of sources
%
.nl/
304989
81.46
.be/
57002
15.22
net/
8997
2.40
Appendix to nld web 2002: Size of different TLDs
18
Appendix to nld web 2002: Size of different TLDs TLDs larger than 1% TLD # of sources .nl/
77369
% 99.98
Appendix to nld web 2011: Size of different TLDs TLDs larger than 1% TLD # of sources
%
.nl/
2037881
81.20
.be/
321797
12.82
com/ 65558
2.61
Appendix to nld mixed 2012: Size of different TLDs TLDs larger than 1% TLD # of sources
%
.nl/
3670113
72.08
.be/
702425
13.80
com/ 226276
4.44
Appendix to nld news 2007: Size of largest domains
19
Appendix to nld news 2007: Size of largest domains Largest domains Source
# of sentences
www.ad.nl/
845519
www.refdag.nl/
748623
www.telegraaf.nl/
459096
www.standaard.be/
367796
www.parool.nl/
219294
www.gva.be/
201950
feeds.feedburner.com/ 189742 www.limburger.nl/
183934
www.hbvl.be/
154937
feeds.volkskrant.nl/
145875
# of distinct sources 368
Appendix to nld news 2008: Size of largest domains Largest domains Source www.spitsnieuws.nl/
# of sentences 485534
feeds.feedburner.com/ 403176 www.telegraaf.nl/
339823
www.refdag.nl/
278402
www.standaard.be/
258138
www.geenstijl.nl/
254581
www.nieuws.nl/
242078
www.trouw.nl/
230051
rss.feedsportal.com/
199046
www.ad.nl/
194133
# of distinct sources 281
Appendix to nld news 2008: Size of largest domains
20
Appendix to nld news 2009: Size of largest domains Largest domains Source
# of sentences
www.spitsnieuws.nl/
802418
rss.feedsportal.com/
681264
www.trouw.nl/
421790
www.standaard.be/
366703
www.refdag.nl/
347528
tweakers.net/
220542
www.geenstijl.nl/
201421
feedproxy.google.com/ 190013 www.nieuws.nl/
183968
www.gva.be/
143818
# of distinct sources 290
Appendix to nld news 2010: Size of largest domains
21
Appendix to nld news 2010: Size of largest domains Largest domains Source www.spitsnieuws.nl/
# of sentences 847098
feedproxy.google.com/ 506757 rss.feedsportal.com/
473121
www.trouw.nl/
346888
www.telegraaf.nl/
339600
tweakers.net/
257471
www.standaard.be/
250623
fok.nl/
243525
www.refdag.nl/
219870
www.nieuws.nl/
189105
# of distinct sources 336
Appendix to nld news 2011: Size of largest domains Largest domains Source
# of sentences
geenstijl.feedsportal.com/ 458871 tweakers.net/
419501
rss.feedsportal.com/
375222
fok.nl/
228540
www.volkskrant.nl/
199850
www.nieuws.nl/
170582
www.spitsnieuws.nl/
164587
www.nu.nl/
111619
www.elfvoetbal.nl/
73918
feedproxy.google.com/
67064
# of distinct sources 337
Appendix to nld news 2011: Size of largest domains
22
Appendix to nld newscrawl 2011: Size of largest domains Largest domains Source www.refdag.nl/
# of sentences 788163
www.spitsnieuws.nl/ 578237 www.politics.be/
504012
www.waterkant.net/
416792
www.vn.nl/
330756
www.rtvoost.nl/
263974
www.parool.nl/
194101
www.telegraaf.nl/
189190
www.radio1.nl/
179357
www.rtvnh.nl/
169569
# of distinct sources 43
Appendix to nld web 2002: Size of largest domains
23
Appendix to nld web 2002: Size of largest domains Largest domains Source
# of sentences
www.burojansen.nl/
158286
www.groene.nl/
88293
www.driebergen.nl/
66857
www.descherperonline.nl/
57624
www.dealerinfo.nl/
53289
www.katholieknieuwsblad.nl/ 51834 www.hengelo.nl/
49189
www.faq-online.nl/
47561
www.rhemaprint.nl/
46987
www.barendrecht.nl/
44812
# of distinct sources 77383
Appendix to nld web 2011: Size of largest domains Largest domains Source
# of sentences
www.tboek.nl/
64248
www.spelmagazijn.nl/
27309
www.iisg.nl/
25167
www.kb.nl/
23497
www.streektaalzang.nl/
19055
www.exmedica.nl/
15638
www.opusklassiek.nl/
15536
www.adromaplace.nl/
15313
www.soaaidsmagazine.nl/ 14850 www.fransmensonides.nl/ 14602
# of distinct sources 216866
Appendix to nld web 2011: Size of largest domains
24
Appendix to nld mixed 2012: Size of largest domains Largest domains Source
# of sentences
www.spitsnieuws.nl/
2212547
www.refdag.nl/
1964606
rss.feedsportal.com/
1149447
www.telegraaf.nl/
1082729
www.ad.nl/
1082647
www.standaard.be/
1001377
www.trouw.nl/
835324
feedproxy.google.com/ 691417 www.politics.be/
499181
# of distinct sources 471978
Appendix to nld news 2007: Number of sources by time period
25
Appendix to nld news 2007: Number of sources by time period Number of sources by year, month, and day
Number of sources per year year # of sources
Number of sources per month
%
2005 61184
8.48
2006 241742
33.51
2007 418543
58.01
Appendix to nld news 2007: Number of sources by time period
month
# of sources
26
%
2005-11 16552
2.29
2005-12 19207
2.66
2006-01 20797
2.88
2006-02 18840
2.61
2006-03 22454
3.11
2006-04 20533
2.85
2006-05 19399
2.69
2006-06 19582
2.71
2006-07 19923
2.76
2006-08 19588
2.72
2006-09 20175
2.80
2006-10 21328
2.96
2006-11 20445
2.83
2006-12 18678
2.59
2007-01 23107
3.20
2007-02 18138
2.51
2007-03 33422
4.63
2007-04 30588
4.24
2007-05 35974
4.99
2007-06 38541
5.34
2007-07 35521
4.92
2007-08 41708
5.78
2007-09 39037
5.41
2007-10 44340
6.15
2007-11 39406
5.46
2007-12 38761
5.37
Appendix to nld news 2008: Number of sources by time period
27
Appendix to nld news 2008: Number of sources by time period Number of sources by year, month, and day
Number of sources per year year # of sources null
Number of sources per month
%
298230
51.57
2008 280111
48.43
Appendix to nld news 2008: Number of sources by time period
month
# of sources
null
298230
28
% 51.57
2008-01 20068
3.47
2008-02 19398
3.35
2008-03 26124
4.52
2008-04 25970
4.49
2008-05 24335
4.21
2008-06 24167
4.18
2008-07 24049
4.16
2008-08 23006
3.98
2008-09 23375
4.04
2008-10 24630
4.26
2008-11 22888
3.96
2008-12 22101
3.82
Appendix to nld news 2009: Number of sources by time period Number of sources by year, month, and day
Appendix to nld news 2009: Number of sources by time period
29
Number of sources per year year # of sources null
86693
2009 511242
% 14.50 85.50
Number of sources per month month
# of sources
null
86693
% 14.50
2009-01 24179
4.04
2009-02 22202
3.71
2009-03 23853
3.99
2009-04 43723
7.31
2009-05 50640
8.47
2009-06 52048
8.70
2009-07 51681
8.64
2009-08 49259
8.24
2009-09 54843
9.17
2009-10 55723
9.32
2009-11 34152
5.71
2009-12 48939
8.18
Appendix to nld news 2010: Number of sources by time period
30
Appendix to nld news 2010: Number of sources by time period Number of sources by year, month, and day
Number of sources per year year # of sources 2010 539750
% 100.00
Number of sources per month month
# of sources
%
2010-01 54875
10.17
2010-02 49650
9.20
2010-03 58046
10.75
2010-04 53647
9.94
2010-05 52012
9.64
2010-06 52582
9.74
2010-07 54118
10.03
2010-08 46342
8.59
2010-09 47002
8.71
Appendix to nld news 2010: Number of sources by time period
31
2010-10 22550
4.18
2010-11 24062
4.46
2010-12 24864
4.61
Appendix to nld news 2011: Number of sources by time period Number of sources by year, month, and day
Number of sources per year year # of sources 2011 355674
Number of sources per month
% 100.00
Appendix to nld news 2011: Number of sources by time period
month
# of sources
32
%
2011-01 30560
8.59
2011-02 28548
8.03
2011-03 29494
8.29
2011-04 29235
8.22
2011-05 30263
8.51
2011-06 25270
7.10
2011-07 31281
8.79
2011-08 31949
8.98
2011-09 32433
9.12
2011-10 31401
8.83
2011-11 31725
8.92
2011-12 23515
6.61
33
Word details Appendix to nld news 2007: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 11.5251
word length percentage 1
0.0170
2
0.1931
3
1.5017
4
3.1175
5
5.3688
6
6.3254
7
7.1306
8
7.5277
9
8.0425
Appendix to nld news 2007: Words by length without multiplicity
10
8.0918
11
7.8487
12
7.2692
13
6.6234
14
5.8549
15
5.0714
16
4.2996
17
3.5737
18
2.8985
19
2.2948
20
1.7983
21
1.3509
22
1.0022
23
0.7499
24
0.5544
25
0.4012
26
0.2812
27
0.2087
28
0.1484
29
0.1024
30
0.0753
31
0.0514
32
0.0375
33
0.0254
34
0.0187
35
0.0157
36
0.0116
37
0.0084
38
0.0070
39
0.0050
40
0.0037
41
0.0042
42
0.0031
43
0.0035
44
0.0025
45
0.0029
46
0.0011
47
0.0016
48
0.0042
34
Appendix to nld news 2007: Words by length without multiplicity
49
0.0015
50
0.0017
Appendix to nld news 2008: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 11.1281
word length percentage 1
0.0169
2
0.2131
3
1.6387
4
3.3259
5
5.6022
6
6.7431
7
7.5850
8
8.0307
9
8.4358
35
Appendix to nld news 2008: Words by length without multiplicity
10
8.4672
11
8.0567
12
7.3200
13
6.5421
14
5.7025
15
4.8013
16
4.0035
17
3.2513
18
2.5929
19
2.0177
20
1.5387
21
1.1521
22
0.8310
23
0.5924
24
0.4380
25
0.3239
26
0.2230
27
0.1630
28
0.1139
29
0.0799
30
0.0587
31
0.0465
32
0.0313
33
0.0230
34
0.0193
35
0.0145
36
0.0106
37
0.0075
38
0.0064
39
0.0054
40
0.0048
41
0.0034
42
0.0043
43
0.0032
44
0.0023
45
0.0022
46
0.0024
47
0.0011
48
0.0013
36
Appendix to nld news 2008: Words by length without multiplicity
49
0.0015
50
0.0012
Appendix to nld news 2009: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 11.1920
word length percentage 1
0.0157
2
0.2058
3
1.5526
4
3.1669
5
5.2559
6
6.4795
7
7.5120
8
7.8891
9
8.4613
37
Appendix to nld news 2009: Words by length without multiplicity
10
8.6247
11
8.2826
12
7.5479
13
6.7628
14
5.8368
15
4.9075
16
4.0706
17
3.2789
18
2.5990
19
2.0070
20
1.5209
21
1.1117
22
0.8135
23
0.5885
24
0.4207
25
0.3043
26
0.2178
27
0.1574
28
0.1117
29
0.0821
30
0.0596
31
0.0425
32
0.0354
33
0.0255
34
0.0190
35
0.0152
36
0.0121
37
0.0098
38
0.0075
39
0.0062
40
0.0054
41
0.0045
42
0.0044
43
0.0028
44
0.0029
45
0.0027
46
0.0028
47
0.0014
48
0.0024
38
Appendix to nld news 2009: Words by length without multiplicity
49
0.0016
50
0.0022
Appendix to nld news 2010: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 11.1120
word length percentage 1
0.0169
2
0.2124
3
1.6099
4
3.2497
5
5.3313
6
6.5435
7
7.5559
8
8.0007
9
8.5707
39
Appendix to nld news 2010: Words by length without multiplicity
10
8.6657
11
8.3350
12
7.5869
13
6.7303
14
5.7792
15
4.8381
16
4.0160
17
3.2179
18
2.5363
19
1.9614
20
1.4529
21
1.0697
22
0.7573
23
0.5592
24
0.3854
25
0.2800
26
0.2037
27
0.1445
28
0.1032
29
0.0752
30
0.0550
31
0.0404
32
0.0327
33
0.0251
34
0.0205
35
0.0165
36
0.0127
37
0.0097
38
0.0066
39
0.0069
40
0.0059
41
0.0048
42
0.0050
43
0.0024
44
0.0038
45
0.0030
46
0.0022
47
0.0021
48
0.0025
40
Appendix to nld news 2010: Words by length without multiplicity
49
0.0016
50
0.0025
Appendix to nld news 2011: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 10.4738
word length percentage 0
0.0001
1
0.0265
2
0.2992
3
2.1456
4
4.2001
5
6.3650
6
7.5968
7
8.5455
8
8.8200
41
Appendix to nld news 2011: Words by length without multiplicity
9
8.9837
10
8.7880
11
8.0628
12
7.0741
13
6.0773
14
5.0544
15
4.1898
16
3.3757
17
2.6859
18
2.0841
19
1.5966
20
1.1726
21
0.8385
22
0.5777
23
0.4238
24
0.2949
25
0.2018
26
0.1386
27
0.1105
28
0.0748
29
0.0538
30
0.0409
31
0.0297
32
0.0239
33
0.0182
34
0.0150
35
0.0106
36
0.0088
37
0.0073
38
0.0087
39
0.0052
40
0.0059
41
0.0047
42
0.0040
43
0.0038
44
0.0029
45
0.0026
46
0.0023
47
0.0030
42
Appendix to nld news 2011: Words by length without multiplicity
48
0.0019
49
0.0012
Appendix to nld newscrawl 2011: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 11.1857
word length percentage 1
0.0180
2
0.2157
3
1.6277
4
3.3424
5
5.2522
6
6.2887
7
7.3170
8
7.8659
9
8.4288
43
Appendix to nld newscrawl 2011: Words by length without multiplicity
10
8.6429
11
8.2492
12
7.5525
13
6.7083
14
5.8045
15
4.9403
16
4.1452
17
3.3901
18
2.6730
19
2.0774
20
1.5511
21
1.1474
22
0.8235
23
0.5891
24
0.4112
25
0.2983
26
0.2008
27
0.1422
28
0.0970
29
0.0674
30
0.0487
31
0.0320
32
0.0260
33
0.0193
34
0.0128
35
0.0102
36
0.0082
37
0.0057
38
0.0042
39
0.0037
40
0.0036
41
0.0023
42
0.0018
43
0.0018
44
0.0021
45
0.0013
46
0.0014
47
0.0009
48
0.0010
44
Appendix to nld newscrawl 2011: Words by length without multiplicity
49
0.0012
50
0.0009
Appendix to nld wikipedia 2007: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 10.3847
word length percentage 1
0.0686
2
0.3829
3
1.9180
4
4.1803
5
6.1790
6
8.1284
7
9.0363
8
8.9919
9
9.8748
45
Appendix to nld wikipedia 2007: Words by length without multiplicity
10
8.6152
11
7.7401
12
6.6536
13
5.7080
14
4.7512
15
3.9759
16
3.2724
17
2.6617
18
2.0883
19
1.5819
20
1.1825
21
0.8682
22
0.6348
23
0.4562
24
0.3186
25
0.2198
26
0.1524
27
0.0995
28
0.0686
29
0.0483
30
0.0315
31
0.0245
32
0.0183
33
0.0130
34
0.0100
35
0.0071
36
0.0064
37
0.0055
38
0.0040
39
0.0031
40
0.0032
41
0.0027
42
0.0024
43
0.0020
44
0.0017
45
0.0017
46
0.0005
47
0.0008
48
0.0011
46
Appendix to nld wikipedia 2007: Words by length without multiplicity
49
0.0010
50
0.0009
Appendix to nld wikipedia 2012: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 10.4863
word length percentage 1
0.0562
2
0.2777
3
1.5467
4
3.6108
5
6.2725
6
8.0616
7
9.0222
8
8.9813
9
9.8934
47
Appendix to nld wikipedia 2012: Words by length without multiplicity
10
8.7490
11
7.9284
12
6.8290
13
5.8972
14
4.8742
15
4.0611
16
3.3430
17
2.6817
18
2.1083
19
1.6215
20
1.2039
21
0.8666
22
0.6432
23
0.4593
24
0.3217
25
0.2243
26
0.1507
27
0.1071
28
0.0716
29
0.0475
30
0.0357
31
0.0250
32
0.0169
33
0.0122
34
0.0105
35
0.0077
36
0.0058
37
0.0047
38
0.0033
39
0.0023
40
0.0018
41
0.0015
42
0.0018
43
0.0020
44
0.0010
45
0.0012
46
0.0012
47
0.0005
48
0.0009
48
Appendix to nld wikipedia 2012: Words by length without multiplicity
49
0.0007
50
0.0005
Appendix to nld web 2002: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 12.0273
word length percentage 1
0.0054
2
0.1015
3
1.0616
4
2.6727
5
4.4414
6
5.3595
7
6.5139
8
7.1957
9
7.8998
49
Appendix to nld web 2002: Words by length without multiplicity
10
8.2863
11
8.1738
12
7.3024
13
6.7357
14
5.9865
15
5.3332
16
4.6310
17
3.9159
18
3.2105
19
2.5981
20
2.0642
21
1.5831
22
1.2020
23
0.9167
24
0.6799
25
0.5069
26
0.3747
27
0.2773
28
0.2095
29
0.1564
30
0.1183
31
0.0878
32
0.0683
33
0.0531
34
0.0399
35
0.0337
36
0.0271
37
0.0214
38
0.0179
39
0.0159
40
0.0131
41
0.0118
42
0.0105
43
0.0097
44
0.0083
45
0.0075
46
0.0067
47
0.0060
48
0.0048
50
Appendix to nld web 2002: Words by length without multiplicity
49
0.0049
50
0.0043
Appendix to nld web 2011: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 11.9264
word length percentage 0
0.0003
1
0.0112
2
0.0972
3
0.9954
4
2.5703
5
4.3354
6
5.4065
7
6.4770
8
7.3030
51
Appendix to nld web 2011: Words by length without multiplicity
9
8.0430
10
8.4047
11
8.4141
12
7.5040
13
6.9273
14
6.1415
15
5.4109
16
4.6365
17
3.8673
18
3.1413
19
2.4910
20
1.9555
21
1.4840
22
1.1143
23
0.8359
24
0.6175
25
0.4595
26
0.3358
27
0.2484
28
0.1843
29
0.1359
30
0.1034
31
0.0764
32
0.0564
33
0.0446
34
0.0334
35
0.0259
36
0.0218
37
0.0172
38
0.0132
39
0.0112
40
0.0089
41
0.0064
42
0.0060
43
0.0055
44
0.0045
45
0.0043
46
0.0031
47
0.0028
52
Appendix to nld web 2011: Words by length without multiplicity
48
0.0024
49
0.0021
Appendix to nld mixed 2012: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 12.1834
word length percentage 1
0.0142
2
0.0832
3
0.7115
4
2.0866
5
3.9761
6
5.5129
7
6.6445
8
7.2550
9
7.9345
53
Appendix to nld mixed 2012: Words by length without multiplicity
10
8.1936
11
8.1925
12
7.4028
13
6.8905
14
6.1630
15
5.4687
16
4.7328
17
3.9911
18
3.2745
19
2.6475
20
2.0950
21
1.6155
22
1.2374
23
0.9470
24
0.7065
25
0.5301
26
0.3957
27
0.2961
28
0.2209
29
0.1650
30
0.1251
31
0.0930
32
0.0717
33
0.0550
34
0.0422
35
0.0341
36
0.0277
37
0.0220
38
0.0176
39
0.0153
40
0.0125
41
0.0108
42
0.0096
43
0.0086
44
0.0075
45
0.0069
46
0.0057
47
0.0052
48
0.0049
54
Appendix to nld mixed 2012: Words by length without multiplicity
49
0.0042
50
0.0042
Appendix to nld news 2007: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.2734
word length percentage 1
0.4716
2
18.7506
3
21.0872
4
13.1713
5
8.4842
6
9.4752
7
6.9892
8
5.5479
9
4.9634
55
Appendix to nld news 2007: Words by length with multiplicity
56
10
3.2342
11
2.4147
12
1.8034
13
1.0931
14
0.7204
15
0.5074
16
0.3700
17
0.2511
18
0.2029
19
0.1395
20
0.1032
21
0.0629
22
0.0548
23
0.0294
24
0.0253
25
0.0195
26
0.0085
27
0.0057
28
0.0043
29
0.0023
30
0.0017
Appendix to nld news 2008: Words by length with multiplicity
57
Appendix to nld news 2008: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.1503
word length percentage 1
0.5826
2
18.8651
3
21.5158
4
13.9391
5
8.4978
6
9.6320
7
6.8092
8
5.3717
9
4.7107
10
3.0287
11
2.2459
12
1.6112
Appendix to nld news 2008: Words by length with multiplicity
58
13
1.0116
14
0.6519
15
0.4381
16
0.3259
17
0.2106
18
0.1711
19
0.1165
20
0.0875
21
0.0545
22
0.0462
23
0.0232
24
0.0190
25
0.0139
26
0.0062
27
0.0041
28
0.0032
29
0.0019
30
0.0012
Appendix to nld news 2009: Words by length with multiplicity
59
Appendix to nld news 2009: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.0941
word length percentage 1
0.6061
2
18.9783
3
21.7644
4
14.3201
5
8.4617
6
9.6667
7
6.6660
8
5.2970
9
4.5685
10
2.9366
11
2.1779
12
1.5543
Appendix to nld news 2009: Words by length with multiplicity
60
13
0.9567
14
0.6151
15
0.4217
16
0.3010
17
0.1995
18
0.1588
19
0.1070
20
0.0819
21
0.0489
22
0.0404
23
0.0214
24
0.0176
25
0.0129
26
0.0059
27
0.0039
28
0.0032
29
0.0019
30
0.0012
Appendix to nld news 2010: Words by length with multiplicity
61
Appendix to nld news 2010: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.0530
word length percentage 1
0.6134
2
19.0962
3
21.9284
4
14.5191
5
8.4774
6
9.6966
7
6.5703
8
5.2407
9
4.5026
10
2.8714
11
2.1223
12
1.5097
Appendix to nld news 2010: Words by length with multiplicity
62
13
0.9205
14
0.5881
15
0.3962
16
0.2836
17
0.1888
18
0.1495
19
0.1010
20
0.0783
21
0.0445
22
0.0363
23
0.0198
24
0.0159
25
0.0123
26
0.0051
27
0.0035
28
0.0024
29
0.0017
30
0.0010
Appendix to nld news 2011: Words by length with multiplicity
63
Appendix to nld news 2011: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 4.9598
word length percentage 0
0.0000
1
0.5542
2
19.3232
3
21.1112
4
15.8247
5
8.7327
6
9.9719
7
6.5956
8
5.2977
9
4.2470
10
2.7562
11
1.9434
Appendix to nld news 2011: Words by length with multiplicity
64
12
1.3186
13
0.7895
14
0.4936
15
0.3168
16
0.2222
17
0.1467
18
0.1141
19
0.0786
20
0.0581
21
0.0331
22
0.0243
23
0.0147
24
0.0109
25
0.0072
26
0.0037
27
0.0027
28
0.0017
29
0.0013
30
0.0009
Appendix to nld newscrawl 2011: Words by length with multiplicity
Appendix to nld newscrawl 2011: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.1176
word length percentage 1
0.6811
2
19.2534
3
21.4788
4
14.2762
5
8.3106
6
9.4674
7
6.4339
8
5.3980
9
4.5858
10
3.0903
11
2.2351
12
1.6308
65
Appendix to nld newscrawl 2011: Words by length with multiplicity
13
1.0249
14
0.6408
15
0.4320
16
0.3185
17
0.2105
18
0.1698
19
0.1124
20
0.0882
21
0.0494
22
0.0405
23
0.0235
24
0.0168
25
0.0140
26
0.0054
27
0.0038
28
0.0027
29
0.0018
30
0.0011
66
Appendix to nld wikipedia 2007: Words by length with multiplicity
Appendix to nld wikipedia 2007: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.2755
word length percentage 1
0.6887
2
19.1561
3
20.5828
4
13.2141
5
8.1789
6
9.2446
7
6.5751
8
5.9723
9
5.0766
10
3.2526
11
2.5826
12
1.9316
67
Appendix to nld wikipedia 2007: Words by length with multiplicity
13
1.1861
14
0.7399
15
0.4287
16
0.3302
17
0.2584
18
0.1700
19
0.1345
20
0.1255
21
0.0518
22
0.0414
23
0.0231
24
0.0192
25
0.0135
26
0.0064
27
0.0039
28
0.0041
29
0.0019
30
0.0010
68
Appendix to nld wikipedia 2012: Words by length with multiplicity
Appendix to nld wikipedia 2012: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.2927
word length percentage 1
0.4649
2
18.8617
3
20.3814
4
13.7785
5
8.3608
6
9.1110
7
6.7532
8
5.8769
9
4.7665
10
3.6043
11
2.5840
12
1.9022
69
Appendix to nld wikipedia 2012: Words by length with multiplicity
13
1.1519
14
0.7466
15
0.4482
16
0.4506
17
0.2107
18
0.1583
19
0.1572
20
0.0765
21
0.0480
22
0.0378
23
0.0232
24
0.0159
25
0.0112
26
0.0057
27
0.0037
28
0.0026
29
0.0018
30
0.0011
70
Appendix to nld web 2002: Words by length with multiplicity
71
Appendix to nld web 2002: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.2508
word length percentage 1
1.2555
2
19.0946
3
20.9832
4
13.2865
5
8.0615
6
9.1920
7
6.1640
8
5.5176
9
4.7478
10
3.4539
11
2.5575
12
1.8675
Appendix to nld web 2002: Words by length with multiplicity
72
13
1.1857
14
0.7455
15
0.5071
16
0.3816
17
0.2713
18
0.2115
19
0.1499
20
0.1193
21
0.0801
22
0.0508
23
0.0343
24
0.0250
25
0.0187
26
0.0107
27
0.0070
28
0.0049
29
0.0034
30
0.0024
Appendix to nld web 2011: Words by length with multiplicity
73
Appendix to nld web 2011: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.1966
word length percentage 0
0.0000
1
1.2295
2
19.5972
3
20.2788
4
13.6680
5
8.2738
6
9.3169
7
6.2487
8
5.5327
9
4.6505
10
3.3900
11
2.5171
Appendix to nld web 2011: Words by length with multiplicity
74
12
1.7993
13
1.1556
14
0.6959
15
0.4698
16
0.3389
17
0.2405
18
0.1798
19
0.1271
20
0.0971
21
0.0618
22
0.0407
23
0.0270
24
0.0196
25
0.0143
26
0.0084
27
0.0057
28
0.0039
29
0.0029
30
0.0018
Appendix to nld mixed 2012: Words by length with multiplicity
75
Appendix to nld mixed 2012: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 5.2125
word length percentage 1
0.8744
2
19.2679
3
20.8539
4
13.6595
5
8.2532
6
9.3500
7
6.3963
8
5.5314
9
4.7104
10
3.3267
11
2.4705
12
1.7863
Appendix to nld mixed 2012: Words by length with multiplicity
76
13
1.1241
14
0.7024
15
0.4716
16
0.3563
17
0.2414
18
0.1859
19
0.1336
20
0.1019
21
0.0636
22
0.0448
23
0.0281
24
0.0211
25
0.0157
26
0.0084
27
0.0056
28
0.0040
29
0.0027
30
0.0018
Appendix to nld news 2007: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
door
2
van
27
naar
3
het
28
maar
4
een
29
nog
5
in
30
over
6
en
31
jaar
7
De
32
dan
8
is
33
worden
9
op
34
hij
10
dat
35
was
11
te
36
hebben
12
voor
37
ze
13
zijn
38
meer
14
met
39
tot
15
die
40
wordt
Appendix to nld news 2007: The most frequent 50 words
77
16
niet
41
je
17
aan
42
al
18
Het
43
of
19
om
44
In
20
heeft
45
Dat
21
er
46
zich
22
bij
47
geen
23
ook
48
werd
24
als
49
dit
25
uit
50
hun
Appendix to nld news 2008: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
bij
2
van
27
nog
3
een
28
dan
4
het
29
uit
5
in
30
door
6
en
31
naar
7
is
32
ze
8
dat
33
over
9
op
34
ik
10
te
35
hij
11
De
36
worden
12
zijn
37
hebben
13
voor
38
was
14
met
39
jaar
15
niet
40
meer
16
die
41
al
17
aan
42
of
18
om
43
wel
19
er
44
wordt
20
heeft
45
geen
21
ook
46
tot
22
je
47
Dat
23
Het
48
dit
Appendix to nld news 2008: The most frequent 50 words
78
24
als
49
zo
25
maar
50
In
Appendix to nld news 2009: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
nog
2
van
27
dan
3
een
28
bij
4
het
29
ze
5
in
30
ik
6
en
31
uit
7
is
32
naar
8
dat
33
door
9
op
34
over
10
te
35
hij
11
De
36
hebben
12
zijn
37
worden
13
voor
38
wel
14
met
39
was
15
niet
40
geen
16
die
41
al
17
aan
42
of
18
je
43
meer
19
om
44
jaar
20
er
45
wordt
21
ook
46
zo
22
maar
47
dit
23
heeft
48
Dat
24
als
49
tot
25
Het
50
kan
Appendix to nld news 2010: The most frequent 50 words
79
Appendix to nld news 2010: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
nog
2
van
27
dan
3
een
28
bij
4
het
29
ik
5
in
30
ze
6
en
31
naar
7
is
32
uit
8
dat
33
door
9
op
34
over
10
te
35
wel
11
zijn
36
hebben
12
De
37
hij
13
niet
38
worden
14
met
39
was
15
voor
40
geen
16
die
41
al
17
je
42
of
18
aan
43
meer
19
er
44
wordt
20
om
45
jaar
21
ook
46
zo
22
maar
47
dit
23
heeft
48
Ik
24
als
49
wat
25
Het
50
kan
Appendix to nld news 2011: The most frequent 50 words
80
Appendix to nld news 2011: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
nog
2
een
27
ze
3
van
28
wel
4
het
29
bij
5
en
30
2011
6
in
31
hebben
7
is
32
al
8
dat
33
naar
9
op
34
Ik
10
te
35
door
11
zijn
36
geen
12
niet
37
of
13
die
38
over
14
voor
39
heeft
15
met
40
meer
16
je
41
worden
17
De
42
Door
18
ook
43
uit
19
ik
44
was
20
er
45
kan
21
maar
46
hij
22
aan
47
wat
23
als
48
dit
24
dan
49
deze
25
om
50
kunnen
Appendix to nld newscrawl 2011: The most frequent 50 words
81
Appendix to nld newscrawl 2011: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
bij
2
van
27
ik
3
het
28
uit
4
een
29
over
5
in
30
dan
6
en
31
naar
7
is
32
door
8
dat
33
nog
9
op
34
worden
10
te
35
ze
11
De
36
hij
12
zijn
37
was
13
voor
38
of
14
met
39
hebben
15
niet
40
wordt
16
die
41
meer
17
aan
42
deze
18
er
43
geen
19
om
44
wel
20
ook
45
al
21
Het
46
dit
22
je
47
jaar
23
als
48
In
24
maar
49
Ik
25
heeft
50
tot
Appendix to nld wikipedia 2007: The most frequent 50 words
82
Appendix to nld wikipedia 2007: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
tot
2
van
27
wordt
3
een
28
om
4
en
29
bij
5
in
30
naar
6
het
31
worden
7
is
32
of
8
De
33
niet
9
zijn
34
er
10
op
35
deze
11
met
36
maar
12
te
37
heeft
13
die
38
Hij
14
voor
39
zich
15
werd
40
ze
16
hij
41
gemeente
17
was
42
inwoners
18
door
43
dan
19
dat
44
kan
20
In
45
over
21
aan
46
nog
22
als
47
dit
23
Het
48
onder
24
uit
49
Een
25
ook
50
Dit
Appendix to nld wikipedia 2012: The most frequent 50 words
83
Appendix to nld wikipedia 2012: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
om
2
van
27
wordt
3
een
28
tot
4
het
29
niet
5
in
30
naar
6
en
31
bij
7
is
32
worden
8
De
33
er
9
zijn
34
of
10
op
35
maar
11
te
36
ze
12
met
37
heeft
13
voor
38
deze
14
werd
39
Hij
15
door
40
zich
16
die
41
familie
17
dat
42
dan
18
hij
43
nog
19
uit
44
haar
20
In
45
over
21
aan
46
inwoners
22
was
47
beschreven
23
als
48
eerst
24
Het
49
eerste
25
ook
50
meer
Appendix to nld web 2002: The most frequent 50 words
84
Appendix to nld web 2002: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist Word
1
de
26
je
2
van
27
u
3
en
28
door
4
het
29
wordt
5
een
30
naar
6
in
31
dan
7
is
32
deze
8
te
33
over
9
op
34
uit
10
met
35
heeft
11
voor
36
maar
12
De
37
ik
13
zijn
38
tot
14
dat
39
In
15
die
40
kan
16
aan
41
nog
17
niet
42
dit
18
om
43
was
19
worden 44
hebben
20
er
45
we
21
ook
46
kunnen
22
Het
47
meer
23
bij
48
zich
24
of
49
wat
25
als
50
Een
Appendix to nld web 2011: The most frequent 50 words
85
Appendix to nld web 2011: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
als
2
van
27
worden
3
en
28
door
4
een
29
naar
5
het
30
deze
6
in
31
dan
7
is
32
wordt
8
op
33
ik
9
te
34
uit
10
met
35
heeft
11
voor
36
maar
12
zijn
37
we
13
De
38
over
14
dat
39
kan
15
je
40
tot
16
aan
41
uw
17
die
42
hebben
18
u
43
nog
19
om
44
In
20
of
45
dit
21
niet
46
was
22
ook
47
kunnen
23
bij
48
meer
24
er
49
ons
25
Het
50
wat
Appendix to nld mixed 2012: The most frequent 50 words
86
Appendix to nld mixed 2012: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
de
26
of
2
van
27
worden
3
een
28
naar
4
en
29
uit
5
het
30
heeft
6
in
31
dan
7
is
32
maar
8
op
33
u
9
te
34
wordt
10
met
35
over
11
voor
36
deze
12
De
37
nog
13
zijn
38
was
14
dat
39
ik
15
die
40
In
16
aan
41
tot
17
niet
42
hij
18
om
43
hebben
19
ook
44
kan
20
je
45
ze
21
er
46
meer
22
Het
47
dit
23
als
48
we
24
bij
49
werd
25
door
50
jaar
Appendix to nld news 2007: Longest words in top-1.000 by rank
87
Appendix to nld news 2007: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
270
woordvoerder
12
2
337
verschillende
13
3
377
bijvoorbeeld
12
4
475
internationale
14
5
531
verkiezingen
12
6
538
waarschijnlijk
14
7
542
bekendgemaakt
13
8
562
slachtoffers
12
9
564
burgemeester
12
10
587
Nederlanders
12
11
634
belangrijkste
13
12
661
uiteindelijk
12
13
753
autoriteiten
12
14
758
telegraaf.nl
12
15
778
samenwerking
12
16
863
buitenlandse
12
17
888
Buitenlandse
12
18
894
activiteiten
12
19
924
ontwikkeling
12
20
925
verantwoordelijk 16
Appendix to nld news 2008: Longest words in top-1.000 by rank
88
Appendix to nld news 2008: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
124
Amerikaanse
11
2
330
woordvoerder
12
3
337
bijvoorbeeld
12
4
349
verschillende
13
5
453
waarschijnlijk
14
6
532
internationale
14
7
572
Nederlanders
12
8
604
uiteindelijk
12
9
686
bekendgemaakt
13
10
710
maatregelen
11
11
713
belangrijkste
13
12
721
slachtoffers
12
13
722
verkiezingen
12
14
773
beschikbaar
11
15
896
buitenlandse
12
16
897
Afghanistan
11
17
912
samenwerking
12
18
944
verantwoordelijk 16
19
947
ontwikkeling
12
20
948
burgemeester
12
Appendix to nld news 2009: Longest words in top-1.000 by rank
89
Appendix to nld news 2009: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
144
Nederlandse
11
2
153
Amerikaanse
11
3
344
bijvoorbeeld
12
4
369
woordvoerder
12
5
374
verschillende
13
6
450
economische
11
7
456
waarschijnlijk
14
8
514
organisatie
11
9
597
uiteindelijk
12
10
618
Nederlanders
12
11
620
internationale
14
12
639
slachtoffers
12
13
647
slachtoffer
11
14
654
verkiezingen
12
15
717
maatregelen
11
16
744
Afghanistan
11
17
771
belangrijke
11
18
830
belangrijkste
13
19
837
burgemeester
12
20
893
bekendgemaakt 13
Appendix to nld news 2010: Longest words in top-1.000 by rank
90
Appendix to nld news 2010: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
151
Nederlandse
11
2
181
Amerikaanse
11
3
368
bijvoorbeeld
12
4
388
verschillende
13
5
406
woordvoerder
12
6
432
waarschijnlijk
14
7
525
verkiezingen
12
8
529
organisatie
11
9
563
uiteindelijk
12
10
582
slachtoffers
12
11
612
slachtoffer
11
12
632
Nederlanders
12
13
669
internationale
14
14
705
aangehouden
11
15
804
beschikbaar
11
16
874
burgemeester
12
17
916
belangrijkste
13
18
934
bekendgemaakt 13
19
936
tegenwoordig
12
20
948
samenwerking
12
Appendix to nld news 2011: Longest words in top-1.000 by rank
91
Appendix to nld news 2011: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
206
Nederlandse
11
2
218
natuurlijk
10
3
287
bijvoorbeeld
12
4
334
Amerikaanse
11
5
380
waarschijnlijk 14
6
416
verschillende
13
7
466
vervolgens
10
8
528
informatie
10
9
545
woordvoerder 12
10
637
uiteindelijk
12
11
655
Nederlanders
12
12
658
beschikbaar
11
13
753
Griekenland
11
14
817
tegenwoordig 12
15
847
organisatie
11
16
909
belangrijke
11
17
942
Nederlander
11
18
947
slachtoffers
12
19
968
aangehouden
11
20
987
mogelijkheid
12
Appendix to nld newscrawl 2011: Longest words in top-1.000 by rank
92
Appendix to nld newscrawl 2011: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
166
Nederlandse
11
2
318
Amerikaanse
11
3
340
verschillende
13
4
357
bijvoorbeeld
12
5
432
aangehouden
11
6
528
verkiezingen
12
7
559
organisatie
11
8
608
economische
11
9
621
maatregelen
11
10
624
waarschijnlijk 14
11
654
uiteindelijk
12
12
695
slachtoffers
12
13
706
Nederlanders
12
14
709
internationale
14
15
787
burgemeester
12
16
789
samenwerking 12
17
832
geschiedenis
12
18
916
ontwikkeling
12
19
928
woordvoerder 12
20
989
belangrijkste
13
Appendix to nld wikipedia 2007: Longest words in top-1.000 by rank
93
Appendix to nld wikipedia 2007: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
58
verschillende
13
2
101
betekenissen
12
3
179
Wikipediagebruiker(s 20
4
185
bijvoorbeeld
12
5
205
verwijzingen
12
6
206
doorverwijspagina
17
7
301
Wereldoorlog
12
8
321
belangrijkste
13
9
351
uiteindelijk
12
10
387
voornamelijk
12
11
405
afbeeldingen
12
12
444
bevolkingsdichtheid
19
13
454
waarschijnlijk
14
14
486
geschiedenis
12
15
539
tegenwoordig
12
16
585
Universiteit
12
17
645
internationale
14
18
734
oorspronkelijk
14
19
761
tegenstelling
13
20
821
oorspronkelijke
15
Appendix to nld wikipedia 2012: Longest words in top-1.000 by rank
94
Appendix to nld wikipedia 2012: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
61
wetenschappelijk
16
2
118
verschillende
13
3
156
bevolkingsdichtheid 19
4
241
bijvoorbeeld
12
5
278
uiteindelijk
12
6
352
straalvinnige
13
7
422
belangrijkste
13
8
437
tweevleugelige
14
9
462
nabijgelegen
12
10
477
onderstaande
12
11
479
Chrysomelidae
13
12
546
waarschijnlijk
14
13
615
internationale
14
14
617
tegenwoordig
12
15
621
ontwikkeling
12
16
726
oorspronkelijke
15
17
808
oorspronkelijk
14
18
809
tegenstelling
13
19
916
Universiteit
12
20
928
aanvankelijk
12
Appendix to nld web 2002: Longest words in top-1.000 by rank
95
Appendix to nld web 2002: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
148
verschillende
13
2
184
bijvoorbeeld
12
3
275
mogelijkheden
13
4
338
activiteiten
12
5
377
ontwikkeling
12
6
402
mogelijkheid
12
7
450
samenwerking
12
8
649
organisaties
12
9
665
belangrijkste
13
10
697
ontwikkelingen
14
11
703
persoonlijke
12
12
720
uiteindelijk
12
13
873
werkzaamheden 13
14
881
internationale
14
15
884
noodzakelijk
12
16
888
geschiedenis
12
17
897
georganiseerd
13
18
913
ondersteuning
13
19
925
waarschijnlijk
14
20
958
instellingen
12
Appendix to nld web 2011: Longest words in top-1.000 by rank
96
Appendix to nld web 2011: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
127
verschillende
13
2
228
bijvoorbeeld
12
3
266
mogelijkheden
13
4
284
Nederlandse
11
5
334
activiteiten
12
6
424
persoonlijke
12
7
431
mogelijkheid
12
8
446
samenwerking
12
9
469
ontwikkeling
12
10
778
belangrijkste
13
11
802
uiteindelijk
12
12
804
georganiseerd
13
13
805
professionele
13
14
814
organisaties
12
15
835
werkzaamheden 13
16
900
geschiedenis
12
17
917
ondersteuning
13
18
944
opdrachtgever
13
19
974
onderstaande
12
20
976
internationale
14
Appendix to nld mixed 2012: Longest words in top-1.000 by rank
97
Appendix to nld mixed 2012: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
153
verschillende
13
2
189
Nederlandse
11
3
229
bijvoorbeeld
12
4
329
organisatie
11
5
365
Amerikaanse
11
6
386
mogelijkheden
13
7
454
activiteiten
12
8
485
belangrijke
11
9
520
ontwikkeling
12
10
557
mogelijkheid
12
11
559
samenwerking
12
12
592
beschikbaar
11
13
642
uiteindelijk
12
14
696
belangrijkste
13
15
724
persoonlijke
12
16
760
waarschijnlijk
14
17
779
internationale
14
18
791
wetenschappelijk 16
19
877
geschiedenis
12
20
880
organisaties
12
98
Character N-gram details Appendix to nld news 2007: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition &
0.72
0.18
,
1.08
0.31
-
4.84
1.13
.
1.25
0.74
/
0.23
0.07
;
0.73
0.19
a
72.67
77.88
b
20.23
15.52
c
22.71
13.59
d
41.41
59.1
e
153.62
182.9
f
10.86
8.38
g
34.63
30.76
h
21.6
24.04
i
68.4
64.75
j
11.47
14.8
k
25.39
21.57
l
43.86
36.65
m
24.63
23.55
n
77.54
97.96
o
59.17
58.98
p
22.28
15.96
q
0.95
0.31
r
75.93
63.53
s
57.63
40.16
t
60.68
65.66
u
25.25
18.29
v
19.43
25.64
w
11.92
14.39
Appendix to nld news 2007: Alphabet as used in the top-100.000 words
x
1.47
0.63
y
3.13
1
z
8.01
11.91
é
0.43
0.35
ë
0.57
0.52
ö
0.11
0.02
ď
0.16
0.05
Appendix to nld news 2008: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 0.58
0.36
&
0.23
0.05
,
1.07
0.3
-
4.64
1.01
.
1.24
0.76
/
0.15
0.03
:
0.53
0.03
;
0.22
0.04
a
72.42
78.02
b
20.25
15.54
c
23.29
13.85
d
40.84
57.55
e
153.35
183.04
f
11.32
8.64
g
34.25
30.01
h
21.36
23.95
i
68.82
65.34
j
11.66
15.76
k
25.45
22.61
l
44.32
37.17
m
24.72
24.26
n
76.81
97.08
o
58.72
59.39
p
22.81
15.86
99
Appendix to nld news 2008: Alphabet as used in the top-100.000 words
q
0.65
0.16
r
74.95
62.33
s
56.98
40.07
t
61.02
65.59
u
25.03
18.15
v
19.1
24.69
w
11.46
14.65
x
1.63
0.66
y
3.51
1.17
z
7.91
12.43
é
0.29
0.22
ë
0.43
0.3
ï
0.16
0.05
Appendix to nld news 2009: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 0.57
0.34
&
0.12
0.03
,
0.87
0.23
-
4.36
0.93
.
1.3
0.82
/
0.18
0.04
;
0.11
0.02
a
72.71
78.15
b
20.23
15.46
c
22.94
13.65
d
40.94
57.02
e
154.9
183.67
f
11.23
8.51
g
34.52
30.11
h
21.45
24.13
i
68.55
65.26
j
11.91
16.27
k
25.86
23.06
100
Appendix to nld news 2009: Alphabet as used in the top-100.000 words
l
44.53
37.39
m
24.74
24.42
n
77.26
97.24
o
58.94
59.48
p
22.85
15.72
q
0.55
0.14
r
75.27
61.73
s
56.72
39.76
t
61.62
65.77
u
25.2
18.14
v
19.12
24.21
w
11.69
15.05
x
1.55
0.65
y
3.35
1.07
z
7.96
12.81
ã
0.2
0.04
é
0.37
0.3
ë
0.52
0.37
ï
0.18
0.06
Appendix to nld news 2010: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 0.57
0.31
,
0.8
0.21
-
4.69
1
.
1.34
0.86
/
0.23
0.05
:
0.11
0.01
a
72.54
78.25
b
20.36
15.45
c
23.21
13.44
d
40.93
57.06
e
154.59
183.61
f
11.28
8.54
101
Appendix to nld news 2010: Alphabet as used in the top-100.000 words
g
34.43
30.03
h
21.56
24.3
i
68.34
65.27
j
11.93
16.42
k
25.97
23.35
l
45.09
37.69
m
24.6
24.52
n
76.74
96.88
o
59.14
59.33
p
23.06
15.83
q
0.54
0.13
r
74.77
61.32
s
56.67
39.51
t
61.66
65.99
u
24.98
18.14
v
19.08
24.13
w
11.73
15.29
x
1.62
0.65
y
3.46
1.1
z
7.92
12.85
ã
0.23
0.05
è
0.11
0.03
é
0.39
0.33
ë
0.55
0.38
ï
0.18
0.08
ö
0.12
0.02
102
Appendix to nld news 2011: Alphabet as used in the top-100.000 words
Appendix to nld news 2011: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 0.55
0.72
'
0.96
0.5
,
0.54
0.13
-
5.34
1.29
.
1.42
1.44
/
0.24
0.06
:
1.69
0.98
a
71.64
76.82
b
20.62
16.24
c
23.18
12.99
d
41.1
55.67
e
150.93
180.35
f
11.75
8.52
g
33.76
30.18
h
21.63
22.37
i
66.71
64.86
j
12.23
17.59
k
26.22
24.66
l
44.81
38.69
m
25.11
25.09
n
74.78
95.7
o
58.8
61.08
p
23.47
15.88
q
0.58
0.16
r
73.41
61.16
s
56.42
38.62
t
56.23
56.38
u
24.72
18.65
v
18.34
23.18
w
11.68
15.53
x
2.08
0.78
y
4.11
1.34
z
7.93
13.54
103
Appendix to nld news 2011: Alphabet as used in the top-100.000 words
é
0.39
0.35
ë
0.51
0.33
ï
0.19
0.07
Appendix to nld newscrawl 2011: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 0.55
0.38
,
0.47
0.1
-
3.61
0.76
.
1.34
1.04
/
0.13
0.04
:
0.78
0.09
a
71.19
76.59
b
20.33
15.67
c
21.4
12.87
d
41.39
56.72
e
157.38
184.91
f
10.65
7.97
g
35.84
30.55
h
21.69
24.47
i
68.3
65.46
j
12.19
15.91
k
26.19
23.05
l
44.53
37.19
m
24.54
24.54
n
78.39
97.7
o
58.65
59.2
p
21.77
15.15
q
0.37
0.11
r
75.41
62.31
s
56.38
39.18
t
60.89
65.48
u
25.05
18.77
v
19.66
24.98
104
Appendix to nld newscrawl 2011: Alphabet as used in the top-100.000 words
w
12.36
15.36
x
1.16
0.47
y
2.75
0.8
z
8.19
12.72
é
0.4
0.39
ë
0.6
0.45
ï
0.19
0.07
Appendix to nld wikipedia 2007: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition ,
0.55
0.11
-
4.09
1.21
.
0.86
0.64
/
0.18
0.06
a
78.51
74.81
b
20.15
15.33
c
25.4
14.46
d
39.21
58.49
e
145.69
181.62
f
10.66
7.76
g
32.76
27.74
h
23.51
24.65
i
69.46
67.37
j
10.17
14.02
k
23.43
20.21
l
46.85
36.5
m
26.63
22.81
n
76.33
96.99
o
60.86
58.01
p
21.24
15.14
q
0.61
0.17
r
75.02
63.54
s
58.29
42.74
t
59.44
63.34
105
Appendix to nld wikipedia 2007: Alphabet as used in the top-100.000 words
u
27
17.7
v
18.03
25.3
w
10.79
15.41
x
1.52
0.63
y
4.77
1.54
z
7.82
10.75
²
0.01
0.13
á
0.21
0.04
è
0.17
0.08
é
0.61
0.52
ë
0.89
0.73
ï
0.28
0.11
ó
0.11
0.05
ö
0.22
0.04
ü
0.24
0.07
Appendix to nld wikipedia 2012: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 0.59
0.39
'
0.58
0.19
,
0.8
0.23
-
3.45
0.81
.
0.93
0.62
/
0.23
0.07
a
76.73
72.81
b
19.14
14.97
c
25.77
14.77
d
39.79
58.31
e
146.33
182.91
f
10.43
8.06
g
33.22
27.7
h
23.69
25.75
i
70.54
66.71
j
9.91
14.11
106
Appendix to nld wikipedia 2012: Alphabet as used in the top-100.000 words
k
22.65
19.93
l
46.78
36.69
m
25.97
22.63
n
75.89
94.57
o
60.57
59.12
p
22.08
15.76
q
0.54
0.12
r
74.58
64.15
s
58.74
41.76
t
60.15
63.65
u
27.18
17.65
v
17.92
25.47
w
10.73
15.79
x
1.5
0.58
y
5.06
1.63
z
7.3
10.83
²
0.01
0.26
á
0.15
0.02
è
0.18
0.1
é
0.53
0.46
ë
0.74
0.52
ï
0.25
0.11
ö
0.19
0.04
ü
0.17
0.04
107
Appendix to nld web 2002: Alphabet as used in the top-100.000 words
108
Appendix to nld web 2002: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition ,
0.53
0.11
-
3.6
0.65
.
1.48
1.24
/
0.27
0.11
a
69.57
73.14
b
20.11
15.98
c
23.14
13.41
d
41.21
54.94
e
157.65
187.62
f
10.81
8.33
g
36.18
30.56
h
21.21
23.36
i
70.2
65.85
j
11.89
15.31
k
26.09
23.77
l
43.83
36.57
m
24.65
23.29
n
79.25
100.05
o
58.02
59.35
p
22.24
15.33
q
0.34
0.1
r
75.3
61.84
s
56.32
38.08
t
62.1
65.71
u
25.24
19.75
v
19.98
26.53
w
12.33
15.71
x
1.26
0.57
y
2.72
0.78
z
7.68
12.14
0.22
0.08
0.15
0.02
0.28
0.4
é
Appendix to nld web 2002: Alphabet as used in the top-100.000 words
109
ë
0.65
0.38
ï
0.21
0.09
Appendix to nld web 2011: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 0.5
0.32
'
0.4
0.25
,
0.48
0.11
-
3.35
0.55
.
1.36
1.34
/
0.2
0.12
a
70.68
72.62
b
20.12
16.13
c
23.01
13.29
d
40.1
52.58
e
156.33
187.75
f
10.9
8.62
g
35.39
29.69
h
21.42
23.02
i
68.64
65.43
j
12.06
16.27
k
26.71
24.81
l
44.14
36.74
m
24.77
23.52
n
78.28
100
o
58.36
59.8
p
22.72
15.73
q
0.4
0.1
r
74.73
61.05
s
56.71
38.33
t
61.58
64.56
u
25.76
20.78
v
19.36
25.63
w
12.26
16.09
Appendix to nld web 2011: Alphabet as used in the top-100.000 words
110
x
1.27
0.58
y
3.04
0.86
z
7.85
12.41
½
0.73
0.31
¿
0.73
0.31
é
0.33
0.41
ë
0.57
0.34
ï
0.9
0.38
Appendix to nld mixed 2012: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 0.56
0.35
'
0.5
0.26
,
0.56
0.14
-
3.23
0.64
.
1.29
1.1
/
0.19
0.09
a
71.35
74.23
b
20.02
15.76
c
23.03
13.32
d
40.92
55.56
e
155.97
186.67
f
10.85
8.35
g
35.45
29.9
h
21.61
23.66
i
69.17
65.54
j
11.89
15.73
k
25.91
23.39
l
44.45
36.69
m
24.65
23.56
n
77.91
99.03
o
58.52
59.32
p
22.24
15.49
q
0.43
0.11
Appendix to nld mixed 2012: Alphabet as used in the top-100.000 words
r
75.4
61.73
s
56.84
38.67
t
61.36
65.13
u
25.41
19.39
v
19.42
25.69
w
12.06
15.66
x
1.29
0.57
y
3.1
0.9
z
7.83
12.25
½
0.26
0.09
¿
0.26
0.09
è
0.11
0.03
é
0.36
0.39
ë
0.65
0.4
ï
0.45
0.16
111
112
Abbreviation details Appendix to nld news 2007: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 149
is.
45875
324
op.
22361
1058
..
7420
1071
...
7349
2510
dag.
2923
3044
etc.
2378
3200
dr.
2237
3415
kan.
2073
4224
bank.
1628
4262
dat.
1613
4352
werkt.
1582
4860
St.
1392
5545
prof.
1179
5870
....
1102
5927
al.
1089
6090
enz.
1054
6162
na.
1040
6316
Dr.
1011
7048
vol.
884
7528
Ds.
812
Appendix to nld news 2008: Most frequent abbreviations
113
Appendix to nld news 2008: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 125
is.
54342
280
..
25618
329
op.
21858
1621
etc.
4480
2306
dag.
3070
2758
kan.
2519
3387
werkt.
2024
3565
bank.
1912
3588
dat.
1901
4213
dr.
1577
4267
al.
1551
4411
St.
1488
4434
me.
1480
4758
enz.
1360
5524
na.
1131
6238
Dr.
967
6247
kop.
966
7190
ver.
809
7199
prof.
808
7446
pk.
775
Appendix to nld news 2009: Most frequent abbreviations
114
Appendix to nld news 2009: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 119
is.
63284
242
..
33811
318
op.
25013
1434
etc.
5542
2149
dag.
3573
2283
kan.
3339
3010
dat.
2486
3103
werkt.
2410
3209
bank.
2320
3885
me.
1873
3890
al.
1871
4258
enz.
1675
4466
dr.
1576
4873
na.
1417
4950
St.
1394
6152
Dr.
1062
6265
kop.
1042
6603
ver.
976
6979
vol.
912
7356
prof.
851
Appendix to nld news 2010: Most frequent abbreviations
115
Appendix to nld news 2010: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 119
is.
64127
217
..
36091
322
op.
24841
1310
etc.
6111
2174
dag.
3404
2220
kan.
3330
2822
dat.
2574
2859
werkt.
2544
3595
al.
1974
3786
me.
1850
3996
enz.
1734
4261
bank.
1608
4744
na.
1426
5721
St.
1115
5805
dr.
1099
5906
kop.
1074
6048
ver.
1039
6625
vol.
929
7401
u.
814
7793
Dr.
761
Appendix to nld news 2011: Most frequent abbreviations
116
Appendix to nld news 2011: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 67
..
72450
121
is.
35638
340
op.
13278
1013
etc.
4251
1909
kan.
2096
2207
dag.
1783
2249
werkt.
1741
2409
dat.
1603
2769
me.
1356
2886
al.
1294
3194
enz.
1154
3553
na.
1025
3729
bank.
969
5742
kop.
591
5942
u.
568
5992
gek.
563
6133
red.
547
6182
vol.
542
6298
ver.
530
6673
St.
494
Appendix to nld newscrawl 2011: Most frequent abbreviations
117
Appendix to nld newscrawl 2011: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 118
..
62435
130
is.
57738
314
op.
23247
1856
dr.
4014
2048
dag.
3659
2155
etc.
3464
2520
kan.
2886
2988
dat.
2392
3204
Ds.
2214
3656
prof.
1907
3755
enz.
1853
3979
werkt.
1727
4009
Dr.
1709
4920
St.
1340
5139
na.
1265
5257
al.
1231
5312
me.
1215
5663
bank.
1123
6189
Prof.
1005
6538
vol.
941
Appendix to nld wikipedia 2007: Most frequent abbreviations
118
Appendix to nld wikipedia 2007: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 162
is.
20703
461
op.
8009
540
Chr.
6844
669
v.
5630
1076
ca.
3535
1310
St.
2913
1837
...
2044
1873
Dr.
1985
2759
etc.
1305
3267
..
1072
3301
enz.
1063
3467
Mr.
1010
3519
m.
994
4013
cm.
861
4609
mm.
740
4615
vorm.
739
4690
km.
725
4795
dag.
706
5106
dr.
656
5866
na.
556
Appendix to nld wikipedia 2012: Most frequent abbreviations
119
Appendix to nld wikipedia 2012: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 143
is.
44098
293
op.
21849
1154
ca.
6286
1424
p.
4940
1618
..
4412
1675
St.
4279
1852
Dr.
3883
3062
Mr.
2227
3538
m.
1889
4230
vorm.
1542
4242
dag.
1537
4360
km.
1483
4473
cm.
1435
4543
etc.
1411
4987
Chr.
1270
5142
na.
1226
5224
s.
1204
5557
dr.
1116
5747
mm.
1067
5930
enz.
1027
Appendix to nld web 2002: Most frequent abbreviations
120
Appendix to nld web 2002: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 132
is.
232210
384
op.
78893
457
...
68319
885
etc.
37827
900
..
37064
953
ca.
34649
1399
enz.
23051
1851
dag.
16900
1940
St.
16118
2331
cm.
13140
2385
p.
12919
2537
tel.
12133
2820
....
10736
3082
kan.
9645
3175
Dr.
9318
3274
u.
9007
3277
incl.
8990
3466
dr.
8370
3643
werkt.
7872
3830
km.
7389
Appendix to nld web 2011: Most frequent abbreviations
121
Appendix to nld web 2011: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 142
..
231026
146
is.
228263
365
op.
89633
875
etc.
40954
1196
ca.
29551
1412
enz.
24597
1477
dag.
23708
1934
St.
17574
2042
u.
16552
2518
incl.
13034
2820
cm.
11545
2972
Dr.
10837
3006
kan.
10669
3193
past.
9869
3475
werkt.
8862
3717
km.
8121
4536
min.
6370
4843
max.
5872
4910
dr.
5751
4993
m.
5638
Appendix to nld mixed 2012: Most frequent abbreviations
122
Appendix to nld mixed 2012: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 135
is.
736667
233
..
412461
333
op.
284036
1090
etc.
97826
1360
...
77703
1421
ca.
74814
1869
enz.
55346
1871
dag.
55151
2222
St.
45941
3047
kan.
32372
3289
Dr.
29633
3432
u.
28262
3571
cm.
26929
3706
werkt.
25765
3911
dr.
24202
4030
incl.
23341
4431
p.
20776
4782
km.
18904
5003
tel.
17909
5057
dat.
17650
Appendix to nld news 2007: Left neighbors of the full stop
123
Appendix to nld news 2007: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 512
halen
6195
14246
43
715
gezet
4680
10632
44
1267
B
3434
6208
55
1905
J
3751
3884
97
2043
W
2726
3611
75
2132
M
2898
3463
84
2153
D
1976
3434
58
2243
H
3046
3278
93
2396
C
2040
3061
67
2657
S
2342
2754
85
2847
G
2126
2542
84
3078
R
1984
2344
85
3387
P
1792
2088
86
3407
K
1890
2078
91
3533
L
1161
2004
58
3749
ds
1851
1876
99
3880
E
1215
1794
68
4194
T
1207
1639
74
4282
F
1277
1607
79
4428
varen
625
1547
40
4741
V
1010
1435
70
6058
N
525
1062
49
6125
mr
961
1047
92
6830
weren 376
919
41
7510
bijv
814
78
634
Appendix to nld news 2008: Left neighbors of the full stop
124
Appendix to nld news 2008: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 441
halen
6786
16210
42
699
gezet
4593
10642
43
1402
B
2898
5261
55
2255
R
2537
3150
81
2661
D
1197
2616
46
2732
C
1402
2533
55
2794
S
1783
2483
72
2954
W
1682
2334
72
2979
M
1704
2311
74
3099
P
1643
2232
74
3236
J
1957
2125
92
3696
H
1599
1840
87
3940
bijv
1336
1716
78
4004
G
1254
1683
75
4461
T
964
1470
66
4470
L
798
1467
54
4583
K
1105
1423
78
4731
ds
1327
1372
97
5068
V
787
1263
62
5333
E
594
1179
50
5441
F
893
1151
78
6018
enzo
440
1012
43
7582
baten
386
758
51
8836
Z
285
623
46
8880
mr
550
619
89
Appendix to nld news 2009: Left neighbors of the full stop
125
Appendix to nld news 2009: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 417
halen
7814
18952
41
679
gezet
5019
11875
42
1590
B
2476
4968
50
2678
S
1914
2802
68
2964
L
1132
2514
45
3076
P
1928
2429
79
3239
W
1497
2299
65
3337
M
1390
2219
63
3513
R
1511
2106
72
3699
T
1372
1989
69
3757
bijv
1557
1951
80
3760
J
1786
1949
92
3769
K
1414
1940
73
3840
C
790
1902
42
4058
H
1531
1773
86
4363
ds
1589
1620
98
4376
G
1117
1615
69
5137
E
586
1329
44
5170
V
812
1319
62
5640
enzo
570
1183
48
5705
F
898
1165
77
7175
weren 360
882
41
7285
Z
415
863
48
7888
baten
377
780
48
8248
oid
296
738
40
Appendix to nld news 2010: Left neighbors of the full stop
126
Appendix to nld news 2010: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 421
halen
7750
18809
41
656
gezet
5056
12029
42
1707
B
2373
4442
53
2818
S
1534
2577
60
3011
R
1591
2408
66
3216
M
1449
2236
65
3236
V
1681
2221
76
3276
H
1863
2194
85
3299
bijv
1691
2172
78
3464
C
890
2049
43
3657
L
891
1932
46
3850
P
1342
1811
74
4039
W
1126
1714
66
4284
G
1008
1601
63
4505
J
1326
1510
88
5012
K
948
1333
71
5374
enzo
568
1217
47
5542
F
799
1165
69
5543
T
587
1165
50
5659
ds
1105
1132
98
7128
baten
439
855
51
7176
duwen 347
847
41
7665
oid
314
778
40
7998
Bild
301
736
41
8556
zgn
377
677
56
Appendix to nld news 2011: Left neighbors of the full stop
127
Appendix to nld news 2011: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 719
gezet
2405
6011
40
1874
bijv
1561
2149
73
2617
M
961
1454
66
3246
P
528
1126
47
3289
V
692
1113
62
3435
enzo
447
1064
42
4005
G
401
892
45
4037
R
576
885
65
4124
AD
410
864
47
4287
W
495
829
60
4294
K
466
827
56
4458
H
571
791
72
5650
J
446
604
74
6148
L
338
545
62
7285
F
241
445
54
7628
zgn
221
422
52
8537
N
153
366
42
9479
TMZ
178
320
56
10381 baten
158
286
55
11005 nr
126
266
47
11084 Bild
122
263
46
11253 Dhr
149
259
58
11652 dhr
164
249
66
14153 klos
85
200
43
14633 Ned
95
192
49
Appendix to nld newscrawl 2011: Left neighbors of the full stop
128
Appendix to nld newscrawl 2011: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 464
halen
6685
16382
41
746
gezet
4612
10869
42
1477
B
2766
5220
53
1700
M
3389
4393
77
1786
J
3892
4172
93
1893
ds
3917
3939
99
2271
D
1648
3222
51
2298
H
2617
3195
82
2514
C
1817
2900
63
2571
S
1914
2816
68
2650
P
1860
2716
68
2730
W
2063
2627
79
2806
R
2079
2552
81
3004
bv
998
2375
42
3131
G
2006
2276
88
3261
K
1709
2169
79
4117
V
1198
1663
72
4334
T
1054
1569
67
4539
login
1463
1483
99
4734
E
867
1401
62
4883
bijv
1036
1352
77
5244
mr
1091
1236
88
5422
F
900
1180
76
5447
ug/l
869
1176
74
5867
loep
437
1073
41
Appendix to nld wikipedia 2007: Left neighbors of the full stop
129
Appendix to nld wikipedia 2007: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank
Word Frequency before Full Stop Frequency overall Amount
129
km²
13112
25650
51
2021
H
1412
1850
76
2274
M
898
1630
55
2495
P
907
1462
62
2755
J
1017
1308
78
2859
E
592
1255
47
2916
S
681
1228
55
2983
R
680
1193
57
3533
F
507
988
51
3565
W
701
978
72
3654
G
469
950
49
3715
zgn
885
935
95
3988
art
633
867
73
4049
Luzon
656
853
77
4119
bijv
803
838
96
4775
bv
544
709
77
4967
ISTAT 673
679
99
5565
nr
512
590
87
5567
Wiske
292
589
50
6028
Tirol
229
537
43
8860
Fame
146
333
44
10921 oa
123
255
48
10974 vs
187
254
74
11091 m3
186
251
74
11935 mr
217
229
95
Appendix to nld wikipedia 2012: Left neighbors of the full stop
130
Appendix to nld wikipedia 2012: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 65
km²
49732
98805
50
892
C
3465
7991
43
976
halen
3076
7349
42
998
gezet
3009
7211
42
1692
J
3772
4238
89
1704
H
2824
4214
67
1881
M
2728
3818
71
2063
S
2112
3492
60
2114
Pic
3364
3417
98
2180
D
1666
3294
51
2186
R
1626
3285
49
2213
P
2258
3238
70
2537
E
1630
2795
58
2638
G
1577
2648
60
2880
L
1694
2369
72
2948
F
1251
2311
54
3070
nr
2017
2222
91
3084
heten
940
2216
42
3106
K
947
2191
43
3237
Clark
1233
2089
59
3435
W
1511
1955
77
3563
art
1409
1870
75
3595
T
1121
1850
61
4092
blz
1501
1593
94
4165
N
697
1566
45
Appendix to nld web 2002: Left neighbors of the full stop
131
Appendix to nld web 2002: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 710
halen
18507
45622
41
908
gezet
15803
36685
43
1617
J
17558
19763
89
1808
nr
14846
17427
85
1862
H
13097
16853
78
2063
bijv
14328
15090
95
2199
bv
6951
14120
49
2421
M
8105
12731
64
2520
W
7212
12209
59
2540
P
7462
12123
62
2694
blz
9717
11273
86
2886
G
6095
10440
58
2908
R
6218
10340
60
3164
L
5106
9361
55
3220
F
4252
9201
46
3312
jl
8425
8868
95
3317
S
4327
8841
49
3788
art
5345
7502
71
3832
zgn
6864
7387
93
3986
K
3678
7044
52
4087
T
2843
6826
42
4270
dhr
5679
6475
88
4318
excl
6121
6391
96
6611
Dhr
2682
3740
72
6613
drs
3240
3739
87
Appendix to nld web 2011: Left neighbors of the full stop
132
Appendix to nld web 2011: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 919
gezet
16366
39256
42
1945
bv
8570
17497
49
2297
bijv
13628
14446
94
2589
nr
9247
12679
73
2961
H
7700
10888
71
3140
J
8386
10049
83
3335
M
4830
9305
52
3818
excl
7272
7885
92
3876
www
7343
7698
95
4194
R
3535
6995
51
4324
jl
6201
6735
92
4327
W
3433
6733
51
4340
P
3791
6701
57
4395
G
3690
6604
56
4964
L
2671
5682
47
5129
zgn
4806
5436
88
5325
K
2175
5185
42
5646
Dhr
4065
4787
85
5752
art
2141
4643
46
5823
oa
1977
4574
43
6081
dhr
3761
4332
87
7747
wils
1521
3176
48
9002
blz
2205
2622
84
9690
mtr
1285
2383
54
9731
mr
1908
2371
80
Appendix to nld mixed 2012: Left neighbors of the full stop
133
Appendix to nld mixed 2012: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 615
halen
69982
173778
40
836
gezet
54450
128947
42
980
km²
53281
107468
50
2233
J
40746
45850
89
2374
H
33385
42838
78
2478
bv
19598
41076
48
2687
M
25106
37210
67
2713
bijv
33757
36756
92
2892
nr
27380
34292
80
2984
E
13708
33167
41
3135
P
20761
31440
66
3143
W
19887
31352
63
3254
S
17338
29990
58
3269
R
18871
29844
63
3506
G
17669
27557
64
3730
F
12507
25601
49
4166
L
14159
22388
63
4208
K
12823
22084
58
4408
T
10058
20896
48
5217
zgn
14725
17104
86
5281
jl
15639
16773
93
5461
blz
13917
16086
87
5484
art
10142
15992
63
5948
excl
13616
14543
94
6295
dhr
11215
13490
83
Appendix to nld news 2007: Left neighbors of the full stop with additional internal full stops
Appendix to nld news 2007: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
758
telegraaf.nl
10091
1714
Telegraaf.nl
4389
4493
o.a
1516
5144
SP.A
1291
5239
sp.a
1265
6529
qlik.nl
968
8103
e.d
731
8181
OneWorld.nl 721
9834
i.p.v
561
11839 b.v
439
11858 a.s
438
13541 m.i
370
14904 Unibet.com
326
15485 t.o.v
309
17701 c.q
257
18751 t.a.v
238
19810 a.u.b
220
19831 m.b.t
220
23146 Jaap.nl
176
23504 procent.De
173
24105 B.V
166
24515 Amazon.com 162 25084 c.s
157
25297 Tweakers.net 155 25581 K.U.Leuven
152
134
Appendix to nld news 2008: Left neighbors of the full stop with additional internal full stops
Appendix to nld news 2008: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
3613
o.a
1887
4811
e.d
1340
7152
i.p.v
814
8904
m.i
617
9407
sp.a
576
9914
b.v
539
10442 SP.A
504
12245 t.o.v
410
14577 c.q
323
14666 a.u.b
320
15185 a.s
306
15801 o.i.d
291
16301 Tweakers.net
279
17152 m.b.t
261
17577 Otto.nl
252
18922 M.a.w
229
19090 Hardware.Info 226 19211 Nu.nl
224
20042 e.e.a
212
21690 d.m.v
190
21797 t.a.v
189
22143 Bol.com
184
22484 Marktplaats.nl 180 23100 i.v.m
174
23253 c.s
172
135
Appendix to nld news 2009: Left neighbors of the full stop with additional internal full stops
Appendix to nld news 2009: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
3598
o.a
2058
4410
e.d
1601
6023
i.p.v
1092
7142
SP.A
887
7237
sp.a
872
8375
m.i
724
9281
b.v
634
9636
t.o.v
601
11354 c.q
487
11985 o.i.d
454
12436 Bol.com
431
13489 a.u.b
386
14456 procent.De
352
14706 Tweakers.net
343
14960 M.a.w
335
15031 m.b.t
333
16145 a.s
301
16596 e.e.a
290
17119 Hardware.Info 278 17616 i.v.m
268
18301 d.m.v
254
19613 NU.nl
232
20542 c.s
218
20718 t.a.v
216
21257 B.V
208
136
Appendix to nld news 2010: Left neighbors of the full stop with additional internal full stops
Appendix to nld news 2010: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
3252
o.a
2213
3972
e.d
1748
5051
i.p.v
1318
7030
m.i
870
8086
b.v
726
8843
t.o.v
650
9389
sp.a
599
9936
SP.A
560
10055 c.q
552
10610 o.i.d
516
11076 a.u.b
487
11506 Tweakers.net
463
12816 m.b.t
403
12893 NU.nl
399
14018 procent.De
354
14350 a.s
343
14911 M.a.w
325
15212 Bol.com
317
15241 Hardware.Info 316 16497 d.m.v
284
16541 e.e.a
283
16590 i.v.m
282
18346 t.a.v
244
20256 nu.nl
213
21583 c.s
195
137
Appendix to nld news 2011: Left neighbors of the full stop with additional internal full stops
Appendix to nld news 2011: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
2532
o.a
1514
2734
e.d
1374
3509
NUzakelijk.nl 1037
4264
i.p.v
835
5666
b.v
602
6379
Tweakers.net
522
6536
t.o.v
507
7153
m.i
456
7324
M.a.w
443
8626
c.q
362
9223
o.i.d
333
9481
a.u.b
320
10113 NU.nl
295
10540 m.b.t
281
12091 e.e.a
239
13179 Joop.nl
217
13411 R.I.P
213
13587 d.m.v
210
13627 BRIGHT.app 209 13865 i.v.m
205
14374 P.S
196
15057 Bol.com
185
17044 a.s
158
17298 nu.nl
155
17620 RedNeck.nl
151
138
Appendix to nld newscrawl 2011: Left neighbors of the full stop with additional internal full stops
Appendix to nld newscrawl 2011: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
1510
o.a
5080
4105
sp.a
1668
5129
o.m
1268
5940
i.p.v
1059
5956
Stand.nl 1055
6282
J.van
987
6866
a.s
886
7528
e.d
789
8049
b.v
722
8355
m.b.t
689
8566
c.q
665
8887
m.i
633
9196
t.o.v
606
9553
i.v.m
578
10830 SP.a
490
10904 a.u.b
486
13615 t.a.v
364
14795 B.U.B
326
14881 n.a.v
324
15297 e.e.a
312
15600 M.a.w
303
16381 e.a
284
17118 d.m.v
267
18076 v.d
249
18869 B.V
234
139
Appendix to nld wikipedia 2007: Left neighbors of the full stop with additional internal full stops
Appendix to nld wikipedia 2007: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
652
o.a
5752
4798
o.m
706
6067
b.v
534
6210
d.w.z
519
7501
V.S
412
7594
J.R.R
406
7874
e.d
387
8211
v.Chr
369
8862
N.V
333
9852
d.i
292
10453 v.C
270
10557 D.C
266
11698 t.o.v
235
12717 i.p.v
211
12748 J.K
210
12897 d.m.v
207
13193 e.a
201
15171 U.S
169
15689 c.q
162
15785 o.l.v
161
16659 B.V
150
17923 z.g
138
20201 G.Lanting
118
20978 sp.a
113
21182 K.U.Leuven 111
140
Appendix to nld wikipedia 2012: Left neighbors of the full stop with additional internal full stops
Appendix to nld wikipedia 2012: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
1052
v.Chr
6873
1406
o.a
5008
7508
N.V
768
8423
n.Chr
662
9637
b.v
560
11034 e.d
473
11299 B.V
458
11813 V.S
433
12035 D.C
422
12405 H.L
408
13653 http://www.statoids.com/yin.html 363 14014 U.S
352
14246 t.o.v
346
16048 c.q
299
16531 e.a
289
16701 A.J
285
17973 N.E.C
260
18104 d.i
258
19637 J.J
233
19700 J.R
232
19993 d.m.v
228
20253 F.C
224
20409 L.A
222
21617 o.l.v
206
22303 z.g
198
141
Appendix to nld web 2002: Left neighbors of the full stop with additional internal full stops
Appendix to nld web 2002: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank Word Frequency 473
o.a
66465
1928
B.V
16226
1934
b.v
16176
1980
e.d
15710
2213
a.s
14041
3009
c.q
9855
3458
m.b.t
8387
3504
d.m.v 8252
4024
t.n.v
6967
4517
i.v.m
6084
4559
v.d
6015
5362
t.a.v
4869
5446
t.b.v
4782
5686
d.w.z
4547
5830
d.d
4404
6064
j.l
4186
6169
p.p
4106
6447
t.o.v
3866
7024
i.p.v
3437
7044
e.a
3426
7309
v.v
3263
7511
o.m
3146
7827
N.V
2979
7871
o.l.v
2960
8412
m.b.v 2711
142
Appendix to nld web 2011: Left neighbors of the full stop with additional internal full stops
Appendix to nld web 2011: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank Word Frequency 466
o.a
72319
1763
B.V
19570
2380
b.v
13818
2440
e.d
13467
2793
a.s
11636
3545
d.m.v 8634
3723
p.p
8111
4099
c.q
7178
4369
i.v.m
6643
4670
m.b.t
6146
6183
i.s.m
4256
7256
o.l.v
3464
7679
t.o.v
3209
7887
a.u.b
3104
7919
j.l
3090
7922
t.b.v
3089
8128
o.m
2988
8156
v.d
2974
8178
t.n.v
2964
8252
t.a.v
2929
8267
d.w.z
2923
8325
i.p.v
2895
9280
e.a
2516
9820
N.B
2346
10125 N.V
2240
143
Appendix to nld mixed 2012: Left neighbors of the full stop with additional internal full stops
Appendix to nld mixed 2012: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
682
o.a
158109
2710
B.V
36814
2877
e.d
34452
2990
b.v
33063
3502
a.s
27605
4731
c.q
19156
4988
d.m.v
17989
5411
m.b.t
16296
6073
i.v.m
14117
6676
p.p
12477
7586
i.p.v
10610
7742
telegraaf.nl 10350
7960
t.n.v
9961
8103
v.d
9697
8134
t.o.v
9657
8705
t.a.v
8888
8997
v.Chr
8520
9097
o.m
8400
9201
t.b.v
8290
9241
d.w.z
8231
9875
j.l
7543
10346 a.u.b
7116
10400 o.l.v
7076
10543 e.a
6955
11178 N.V
6441
144
145
Sentences details Appendix to nld news 2007: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Dat zure hoofd.
15
Tot zover MPEG.
15
Dat zou kunnen.
15
Het zou kunnen.
15
Dat zou helpen.
15
Men zong graag.
15
Kip zonder kop.
15
Tot zondag dan.
15
Hij zoekt rust.
15
;"; zo zei hij.
Shortest exclamatory sentences Length
Sentence
15
Dat zoveel FOK!
15
Oh, zit het zo!
15
Nou zie je wel!
15
Wij willen wel!
15
Wat wil je nou!
15
Dat wil ik ook!
15
Die wil altijd!
15
Weg wezen daar!
15
Het werkt echt!
15
Het was de kok!
Appendix to nld news 2007: Shortest sentences
146
Shortest interrogative sentences Length
Sentence
15
Wat zou u doen?
15
Hoe zo verwend?
15
Hoe zit dat nu?
15
Hoe ziet u dat?
15
Wat zeur je nu?
15
Wat zegt u dat?
15
Wat zegt u dan?
15
Wat zegt dat u?
15
Wat zeg je dan?
15
Jij zeg is man?
Appendix to nld news 2008: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
Hij zweeft weg.
15
Een zware tijd.
15
Dat zou kunnen.
15
Het zou kunnen.
15
Hm, zou kunnen.
15
Dat zou helpen.
15
Wel zorgvuldig.
15
Ook zonder mij.
15
Zou zonde zijn.
15
Net zoals eten.
Appendix to nld news 2008: Shortest sentences
147
Length
Sentence
15
Wel zo prettig!
15
Wel zo eerlijk!
15
Wij zijn tegen!
15
Met zijn hoofd!
15
Wij Zijn Breed!
15
Dit zegt alles!
15
Zal ze krijgen!
15
DAT zal helpen!
15
Het wordt tijd!
15
Dat wordt mooi!
Shortest interrogative sentences Length
Sentence
15
Het zwarte gat?
15
Een zware last?
15
Ah, zo zat het?
15
Hoe zo op tijd?
15
Hoe zit het nu?
15
Hoe ziet u dat?
15
Wat zie ik nou?
15
Wat zei je nou?
15
Wat zei ik nou?
15
Wat zegt u dan?
Appendix to nld news 2009: Shortest sentences
148
Appendix to nld news 2009: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Een zuur einde.
15
Dat zou kunnen.
15
Het zou kunnen.
15
Ook zonder zon.
15
Kip zonder kop.
15
Ook zonder GPS.
15
Dus zonder "i".
15
Dus zonder "a".
15
Zou zonde zijn.
15
Dat zoiets kan.
Shortest exclamatory sentences Length
Shortest interrogative sentences
Sentence
15
Het zou me wat!
15
Nog zo'n licht!
15
Zij zijn lager!
15
Wij zijn erbij!
15
Wat zien ik nu!
15
Dat zei ik dus!
15
Hij zei het al!
15
Hij zei damned!
15
Dat zegt Groen!
15
Dat zegt alles!
Appendix to nld news 2009: Shortest sentences
149
Length
Sentence
15
Een zwarte wat?
15
Een zwarte SUV?
15
Een zwarte dag?
15
Ook zwaar werk?
15
Wat zou u doen?
15
Wat zou U doen?
15
Jij zit op CU2?
15
Hoe zit het nu?
15
Hoe ziet u dit?
15
Hoe ziet u dat?
Appendix to nld news 2010: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
Esmée is leuk.
15
Het zwarte gat.
15
Het zwarte Gat.
15
Een zwarte dag.
15
Een zwakte bod.
15
Hij zucht diep.
15
Tot zover Nova.
15
Tot zover eens.
15
Het zout is op.
15
Wat zou u doen.
Appendix to nld news 2010: Shortest sentences
150
Length
Sentence
15
Het zou kunnen!
15
Wel zo eerlijk!
15
Het zit anders!
15
Met zijn hoofd!
15
Dan zij het zo!
15
God ziet alles!
15
Ja, zeker doen!
15
Wat zeg ik nou!
15
Dan zeg ik dat!
15
Het zal me wat!
Shortest interrogative sentences Length
Sentence
15
Een zware last?
15
Wat zou u doen?
15
Hoe zit het nu?
15
Wat zijn we 12?
15
Via zijn navel?
15
Met zijn allen?
15
Wij zijn Ajax.?
15
Wat zij je dan?
15
Hoe ziet u dit?
15
Hoe ziet u dat?
Appendix to nld news 2011: Shortest sentences
151
Appendix to nld news 2011: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Hij zucht diep.
15
Ja, zou kunnen.
15
Ja, zou kunnen.
15
Men zou denken.
15
Zou zonde zijn.
15
Ook zo zinloos.
15
Die zo ziek is.
15
Ook zo het CDA.
15
Wel zo eerlijk.
15
Wel zo eerlijk.
Shortest exclamatory sentences Length
Shortest interrogative sentences
Sentence
15
Die zomer Uggs!
15
Die zomer Uggs!
15
Ha, zie je wel!
15
CDA zet hem op!
15
"Ik word vader!
15
"Ik word vader!
15
Die wil ik ook!
15
Die wil ik ook!
15
Die wil ik ook!
15
Die wil ik ook!
Appendix to nld news 2011: Shortest sentences
152
Length
Sentence
15
Doe ze dat dan?
15
Wie wil er LTE?
15
Een week straf?
15
"Je vriend dan?
15
"Je vriend dan?
15
Wie vind U laf?
15
Oh, vind u dat?
15
Goh verrassing?
15
Tis vast zo hè?
15
Dus uw punt is?
Appendix to nld newscrawl 2011: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
En m’n man ook.
15
Ook zwart geld.
15
Een zware taak.
15
Hij zucht diep.
15
Dat zou kunnen.
15
Het zou kunnen.
15
Dat zou helpen.
15
Ook zonder ons.
15
Ook zonder BHV.
15
Erg zonde weer.
Appendix to nld newscrawl 2011: Shortest sentences
153
Length
Sentence
15
Wij zijn beter!
15
Met zijn allen!
15
"Op zeker niet!
15
Dat zegt Groen!
15
Het wordt niks!
15
Het wordt mooi!
15
Hij wordt boos!
15
Wat wil je dan!
15
Dat wil ik ook!
15
Weg wezen daar!
Shortest interrogative sentences Length
Sentence
15
Een zware last?
15
Wat zou u doen?
15
Hoe zit het nu?
15
Hoe zit dat nu?
15
Hoe ziet u dit?
15
Hoe ziet u dat?
15
Wat zien we nu?
15
Hoe zie je God?
15
Wat zie ik dan?
15
Wat zei ik nou?
Appendix to nld wikipedia 2007: Shortest sentences
154
Appendix to nld wikipedia 2007: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
14
Of toch niet….
15
Een zware film.
15
Dit zijn er 79.
15
Dat zijn er 43.
15
Hij wordt ziek.
15
Dit wordt Seth.
15
Hij won er zes.
15
Dit werkte wel.
15
Dat werd Trouw.
15
Het werd de MI.
Shortest exclamatory sentences Length
Shortest interrogative sentences
Sentence
15
Een vurig hart!
15
Looft onze God!
15
Loven boven al!
15
Hierin staat n!
15
Ik Wil Knallen!
15
Ja, ik doe het!
15
Het heet The H!
15
Het groot kind!
15
Zoveel te zien!
15
Zoveel te doen!
Appendix to nld wikipedia 2007: Shortest sentences
155
Length
Sentence
15
Wie zijn beter?
15
Wat wil je nou?
15
Hoe werkt DHCP?
15
Wat voor joden?
15
Wat staat erin?
15
Is er nog bier?
15
Wat nu te doen?
15
Wat maakt stof?
15
Is dit correct?
15
Wat is vintage?
Appendix to nld wikipedia 2012: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
000m³) per dag.
15
Dat zou kunnen.
15
000 zou hebben.
15
Het zit in ons.
15
Hij zegt niets.
15
000 zal kosten.
15
Bij zacht (max.
15
Hij wurgt haar.
15
Hij won meteen.
15
Hij won het $5.
Appendix to nld wikipedia 2012: Shortest sentences
156
Length
Sentence
15
Hij zal spelen!
15
“Ik wil zingen!
15
Zie ook * Kort!
15
De zon schijnt!
15
Bij Mijn leven!
15
Ja, ik doe het!
15
Zo biedt Groen!
15
Wat een moeder!
15
Op de cd "Bijt!
15
Van dat dak af!
Shortest interrogative sentences Length
Sentence
15
Waarom een ESB?
15
Ben je erg nat?
15
Wat is een ASD?
15
In welk Athene?
15
Voor zes weken?
15
Waar woont hij?
16
Wat ze nu wenst?
16
Wat wil jij nou?
16
Het was (is nog?
16
Een unieke kans?
Appendix to nld web 2002: Shortest sentences
157
Appendix to nld web 2002: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Ja, zegt hij.
15
Ook s morgens.
15
Oké, sprak ze.
15
Dan zwijgt hij.
15
Hij zweeg even.
15
Een zwatte kop.
15
Een zwarte dag.
15
Het zware werk.
15
Een zware taak.
15
Een zware race.
Shortest exclamatory sentences Length
Shortest interrogative sentences
Sentence
15
Het gaat heen!
15
Dat zweren wij!
15
Een zware klus!
15
Tot Zondag dan!
15
Wij zoeken JOU!
15
Wij zoeken jou!
15
Dan zit u goed!
15
Dat zit lekker!
15
Oh, zit dat zo!
15
Wij zijn trots!
Appendix to nld web 2002: Shortest sentences
158
Length
Sentence
15
Tot zover Jaap?
15
Wat zou u doen?
15
Wie zoekt Reym?
15
Wat zoeken zij?
15
Wat zoeken wij?
15
Wie zoeken wij?
15
Wij zoeken Nog?
15
Net zoals deze?
15
Ook zo genoten?
15
Hoe zit het nu?
Appendix to nld web 2011: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
‘Nep’, zegt ze.
15
‘Ja,’ zegt hij.
15
€ 5,– per tent.
15
80 m³ per uur).
15
Een zwatte kop.
15
Het zwarte gat.
15
Een zware moto.
15
Een zware klus.
15
Het zwakt A af.
15
Was zum lachen.
Appendix to nld web 2011: Shortest sentences
159
Length
Sentence
15
Met ‘Ten afval!
15
Een zwaar jaar!
15
Het zou kunnen!
15
'De zon is weg!
15
Dat zoiets kan!
15
Wij zoeken jou!
15
Wij zoeken JOU!
15
Dus zoeken aub!
15
Dat zoek ik op!
15
Wel zo prettig!
Shortest interrogative sentences Length
Sentence
15
Wat zou u doen?
15
Wat zou U doen?
15
Wat zit er bij?
15
Hoe zit dit nu?
15
Hoe zit dat nu?
15
Wat zijn we nu?
15
Wie zijn we nu?
15
Wij zijn sinds?
15
Wij zijn Maik,?
15
Hoe ziet u dit?
Appendix to nld mixed 2012: Shortest sentences
160
Appendix to nld mixed 2012: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
En m’n man ook.
15
‘Nep’, zegt ze.
15
‘Ja,’ zegt hij.
15
€ 5,– per tent.
15
000m³) per dag.
15
80 m³ per uur).
15
Ja, zegt hij.
15
Ook s morgens.
15
Oké, sprak ze.
15
Dan zwijgt hij.
Shortest exclamatory sentences Length
Shortest interrogative sentences
Sentence
15
Met ‘Ten afval!
15
Het gaat heen!
15
Dat zweren wij!
15
Een zware klus!
15
Een zwaar jaar!
15
Dat zoveel FOK!
15
Het zou me wat!
15
Het zou kunnen!
15
Tot Zondag dan!
15
'De zon is weg!
Appendix to nld mixed 2012: Shortest sentences
161
Length
Sentence
15
Een zwarte wat?
15
Een zwarte SUV?
15
Een zwarte dag?
15
Een zware last?
15
Ook zwaar werk?
15
Tot zover Jaap?
15
Wat zou u doen?
15
Wat zou U doen?
15
Wie zoekt Reym?
15
Wat zoeken zij?
Appendix to nld news 2007: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Het gaat om meelevende christenen, die al een aantal jaren lid zijn van een kerk De alleenstaande vrouw zou zich al in 2004 hebben laten dopen.Huizinga wijst op de afspraak dat Iraanse christenen, onder wie bekeerde ex-moslims, niet uitgezet mogen worden.
255
Goh, komt men daar nu al achter.Hopelijk worden de gegevens dan wel accuraat aangeleverd want nu heb je zo af en toe het idee dat de ""verkeersleiders"" zitten te pitten bij Tunnels en bij de informatieborden die opstoppingen moeten aangeven op bv de A10.
255
Nixon Osman begon op de bank, de krachtige aanvaller viel na rust in voor Ferdi de Boer, die normaliter zijn partijen speelt in het tweede elftal van Vitesse.RKAVV kon nagenoeg op volle oorlogssterkte aantreden, maar kon in de eerste helft niet domineren.
255
Als zij verder kunnen aantonen dat ze gedurende hun verblijf in de VS belasting hebben betaald, krijgen ze een plaats op een wachtlijst en zullen ze na waarschijnlijk zes jaar een legale status krijgen, zonder in de tussentijd het land te hoeven verlaten.
255
Daarnaast biedt het een voordelige en leuke kennismaking met besturingssysteem Linux, voor wie met dat systeem nog niet bekend is, en is het een geschikte computer voor het aansturen van allerlei hobbyprojecten waarbij een kleine, voordelige pc handig is.
255
Tegelijk eisten ze het ontslag van de pro-Syrische president Emile Lahoud en protesteerden ze tegen de Syrische inlichtingendienst, die ondanks de terugtrekking van de Syrische troepen volgens critici nog steeds een hand in het spel zou hebben in Libanon.
255
Met kantoren in Rotterdam, London, Hamburg, Parijs en Madrid en vanaf vandaag ook in Utrecht voert MetrixLab onderzoeken uit in 39 verschillende landen en werkt het voor 41 top 100-merken, waaronder Microsoft, Philips, Unilever, Siemens, PespiCo en Canon.
255
Nadat de VN-Veiligheidsraad het wegens het veto van China op een spoedzitting in New York niet eens kon worden over een veroordeling van het bloedvergieten in Myanmar, waarschuwde Peking donderdag het bevriende militaire regime voor een verdere escalatie.
255
Recalcico overweegt deze cum prefs om te zetten in gewone aandelen omdat Dico, 'gelet op haar vigerende winstcapaciteit - anders dan het huidig bestuur suggereert - niet binnen redelijk termijn aan haar verplichtingen jegens cum pref houders kan voldoen'.
255
Het geld wordt besteed op alle Antilliaanse eilanden aan in totaal meer dan dertig projecten, waaronder wijkprojecten, renovatie van wijkgebouwen, jeugdontwikkeling, ouderenzorg, verslavingszorg, economische bedrijvigheid en het opknappen van sportvelden.
Appendix to nld news 2007: Longest sentences
162
Longest exclamatory sentences Length
Sentence
255
Hij gaat beslist niet terug uit eigen beweging want zijn Syrische president zit in Serie niet op deze fanaticus te wachten.Nederland is nog steeds het land, waar de beroemde Duitse-Parijse schrijver Heinrigh Heine over zeiIn Holland gebeurd alles 50 jaar!
255
Wat een goedkope stunt.Rutte weet bij voorbaat al dat de Tweede Kamer hier nooit mee akkoord zal gaan.Een goedkope manier om kiezertjes binnen te halen.Hij weet van gekkigheid niet meer wat hij moet verzinnen om zijn kiezers niet te verliezen aan Verdonk!
255
Ik als ontaarde moeder zoek met de ontaarde vader van mijn twee kinderen in de regio De meern voor twee middagen in de week Buitenschoolse opvang per eind maart 2007, we staan al sinds juni 2005 ingeschreven, en er is nog geen plaats dat schiet lekker op!
255
Misschien is het wel goed dat hij ook eens ondervindt hoe het is te moeten opboksen tegen gedoceerd uitgelekte gegevens, halve waarheden,verdachtmakingen, de publiciteit zoeken als het je past en allerlei andere trucjes waar hijzelf een meester in is/was!
255
Zo komen er weer meer ambtenaren(ze worden niet zo genoemd maar zijn het wel) door middel van een zogenaamd onafhankelijk orgaan dat betaald wordt door de overheid en dus wel degelijk afhankelijk is van die overheid Houd jezelf voor de gek, wat een onzin!
255
Electric Emotions en Treble zetten de trancy touch behoorlijk door maar het zijn eerder de nummers die daarop volgen (Hit & Run, Different Day Different Light, Wirewood) die vrij sterk uit de hoek komen: de pure Progression sound zoals we die graag horen!
254
De oplossing is een nauwkeurige, doch spoedige injectie van geld in het hoger/voortgezet onderwijs, zodat er meer leraren aan de slag gaan, scholen geld hebben om leraren ook aan de slag te laten gaan, er minder nutteloze uren zijn, probleem opgelost is!
254
Bij flottielje bent u schipper op uw gehuurde jacht en u maakt onder leiding van de flottieljeleiding met andere jachten een zeiltocht van 1 of 2 weken, waarbij elke dag de route en andere bijzonderheden met elkaar worden besproken, gezellig en leerzaam!
254
Weet nog dat meneer Koenders door collega's tot grootste "zwetser" werd gekozen.Nu speelt meneer Koenders Sinterklaas met onze belastinggelden.Flinke reclame, info spotjes het mag wat kosten van meneer Koenders.Makkelijk geld uitgeven van andermans geld!
254
Tja, het zou natuurlijk mooier zijn, als ze het gewoon open zouden stellen voor ook open source, of andere woorden gratis programma's, van hobby developers, zoals al die gratis appz die nu al beschikbaar zijn, maar waarvoor je eerst je iPhone openbreken!
Longest interrogative sentences Length
Sentence
255
Opvallend detail: toen ik een rekening opende bij Unibet en daar vanuit mijn creditcard 100 euro op stortte, kreeg ik de dag nadien een telefoontje van mijn creditcard-maatschappij: of ik wel wist en besefte dat ik geld had overgemaakt aan een gokkantoor?
255
Is het normaliter niet zo dat de hypotheekgever (huizenbezitter) kapitaal genoeg heeft in de vorm van onroerend goed of krijgt men in de toekomst na de 3e onregelmatige betaling van het BKR een aanschrijving dat men zijn huis moet verkopen op straffe van?
255
Ik vind het goed dat aan dit soort zaken hier bij tweakers aandacht aan wordt geschonken, ik heb het gevoel dat onze privacy wordt verkwanseld onder het mom van terreurbestrijding. dit gaat nog weer verder, kom op automatische detectie van kwaadwillenden?
255
Behalve het verlengen van de roadmap deed Intel een andere belangrijke aankondiging: toekomstige generaties van de Itanium zullen niet meer met verouderde productietechnieken gebouwd worden, maar gewoon met x86 mogen meedoen.Kan iemand deze zin uitleggen?
255
De wereld is niet vergaan, je hebt geen huur/hypotheekachterstand, je hebt een baan, een vrouw, twee bloedjes van kinderen, het is bijna zomervakantie (lekker met de sleurhut naar Frankrijk); dus het leven is prachtig, en dan meld je je ziek over voetbal?
255
Ik kan me voorstellen dat 30.000 playstations niet super-handig is in je super-computing center, maar hoe komen ze in hemelsnaam aan de 210 miljoen voor dat ibm-geval als je dezelfde petaflop met de PS3 oplossing voor een tiende van de prijs kunt krijgen?
255
Ik had het laatst met een vriend over de emancipatie waar de vrouwen in Nederland zo heldhaftig voor hebben gestreden, waar zijn deze heldinnen nu dan Altijd weer dat gezeur over respect voor anders denkende en hoe zit het dan met die anders denkende dan?
255
Daarnaast is de VVD ook nog eens debet aan het fiasco met de LPF en hebben ze afgelopen jaren met het CDA geregeerd en dat was ook waardeloos, maar Rotterdam heeft weer goede criminaliteitcijfers en dat hebben we dan ook alleen te danken aan de PVDA toch?
255
Zat eraan te komen en wanneer word de technische staf en het bestuur ter verantwoording geroepen omtrent alle spelers die ze laten gaan transfervrij en die nu voor een habbekrats naar de concurrent gaan en vandaar uit weer met grote winst verkocht worden?
254
Indien de Nederlandse bevolking af zou nemen hoeften wij ook minder van deze producten in te voeren.Als wij eens wat minder zouden vretenjuist nog weer minder.Zonder ons eigen aandeel van de schuld te willen minimaliseren,hoe zit het met de buitenlanden?
Appendix to nld news 2008: Longest sentences
163
Appendix to nld news 2008: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Met de ondertekening van een overeenkomst tussen de Amerikaanse minister van Buitenlandse Zaken Condoleezza Rice en haar Poolse ambtgenoot Radoslaw Sikorski is de plaatsing van een Amerikaanse raketschild op Pools grondgebied gisteren definitief geworden.
255
Minister van Buitenlandse Zaken Maxime Verhagen zei maandag: Hij heeft zijn krediet meer dan verspeeld, zowel binnenlands als buitenlands.Volgens voormalig secretaris-generaal van de Verenigde Naties, Kofi Annan is Zimbabwe is ernstig toe aan verandering.
255
@Maurice, Heerlen, stomme fout? ik noem met 6x de toegestane hoeveelheid drank op achter het stuur gaan zitten geen stomme fout meer, die is gewoon moord, je weet dat je te veel gedronken hebt en als je dan gaat rijden kies je ervoor dat het mis kan gaan.
255
De Franse minister van Buitenlandse Zaken Bernard Kouchner, wiens land de EU momenteel voorzit, sprak deze week over het uitsturen van een militaire wacht van tussen 400 en 1.500 manschappen die namens Europa binnen tien dagen zou ontplooid kunnen worden.
255
1. een gestolen auto2. een poging tot beroving juwelier3. pompstation beroving.Politie heeft geen van deze gevallen kunnen voorkomen.De burger heeft 2 van de 3 misdaden kunnen voorkomen.Iedereen moet zichzelf kunnen beveiligen tegen dit soort misdadigers.
255
Ik heb zelf, en volgens mij vele andere roomblanke exemplaren, nooit enigerlei aanleiding gegeven tot deze ellende, slechts mijn kleurtje vrees ik gaf 'ze' het idee dat ik a.) een makkelijk slachtoffer was en b.) dat ik waarschijnlijk wel poen bij me had.
255
' Positief is wel dat een deel van de bloemen en planten in dollars zijn gekocht in Kenia of Ecuador en worden verkocht in euro's.Een duurdere euro betekent dat bloemen- en plantenexporteurs meer moeten vragen en dat hun marktaandeel in Amerika verkleint.
255
En met de toenemende energieprijs (zelfs m'n oude pa die niet slecht verdient en zweert bij gloeilampen wil nu wat meer uitgeven aan LED of spaarlampen), en bewustwording van het verbruik van apparaten, kon dit er wel eens voor zorgen dat Oled doorbreekt.
255
Het is echt een bizar jaar geworden: tijdens de Laureus Awards in het Russische Sint Petersburg werd ik wereldwijd uitgeroepen tot Gehandicaptensporter van het Jaar, nationaal kreeg ik die prijs, goud in Peking, goud tijdens de Masters, het officieuze WK.
255
De missies bestaan vooral uit het doden danwel ontvoeren van bepaalde personen, het verwoesten van gebouwen of een combinatie van daarvan, maar er zijn ook races en andere uitdagingen waarmee je weer extra wapens, voertuigen en airstrikes kunt vrijspelen.
Longest exclamatory sentences Length
Sentence
255
Wat denk je zelf, alle bedrijven gaan hun reclamefilmpjes er dan zo opzetten wat weer een wildgroei aan premium filmpjes geeft op de frontpage enzo, waardoor de user generated content helemaal niet meer opvalt, en dat is juist waar YouTube zo sterk in is!
255
In de Koran staat ook,dat duivels altijd zullen proberen het geloof van gelovigen te willen doen ontnemen.Dat lukt ze niet.Dus ook deze uitspreken daar lach ik om.De Moslims blijven Moslim de Islam is mijn Geloof en dat blijft zo!Dikke vinger voor de PVV!
255
Het is Microsoft enkel te doen in de diensten/klanten van Yahoo, of het bedrijf nu tegenwerkt of niet kan hen niet veel schelen, aangezien ze geen interesse hebben in het bedrijf Yahoo, hoe eerder het weg is hoe beter voor hen: weer een concurrent minder!
255
'Beide wijzen erop dat het nog niet zo lang geleden was dat er met de rug naar het water werd gebouwd, omdat we het allemaal maar vies en gevaarlijk vonden'Ik geloof dat er wel enig verschil zit in de CO2 en fijnstof concentratie van water of een snelweg!
255
Terwijl de bemanning je aan boord verwent, verblijf je in september 2008 een week lang op een comfortabel klassiek houten zeilschip langs de Turkse kust om bijvoorbeeld heerlijk te zingen en te zeilen tijdens de muzikale vakantieworkshop van Leoni Jansen!
255
Watson is een levensgevaarlijke piraat, laten hij en zijn piraten het dierenwelzijn dienen met een biologische farm, maar waarschijnlijk verkiest men het zelfbenoemde pseudeo-martelaarschap ver boven de realiteit van het dagelijkse uitmesten van een stal!
255
En omdat we deze week toch met prijzen aan het smijten zijn, is er een extra prijs voor de winnaar van de Foto Fuck Vrijdag deze week, want we mogen, met dank aan Allard, twee kaarten weggeven voor de Europese premiere van eerdergenoemde Beautiful Losers!
Appendix to nld news 2008: Longest sentences
164
255
Ook dit blijft in een sombere stemming,Ook hier zal in de komende maanden en misschien denk ik nog wel jaren voor dat daar weer een beetje schot inkomt, Want de hele Economie heeft een behoorlijke deuk op geleverd, en dat is niet zomaar even weg gepoetst!
255
Op eigen erf is er heel veel werk te doen en ik ben de Heer Jezus zeer dankbaar, om in hetzelfde Lichaam me verbonden te weten met alle medebroeders en -zusters, waar dan ook, zelfs ook als ze mij wantrouwen, omdat ik allereerst tussen de RK-afgoden werk!
255
Hoewel veel mensen Microsoft als de "grote boze macht" zien en Google als "het goede bedrijf zonder boze bedoelingen" (hoezo oogkleppen?) is concurrentie altijd gezond, en MS kan pas echt goed concurreren met Google als dat samen met een partij als Yahoo!
Longest interrogative sentences Length
Sentence
255
Xerxes, vergeet je de vele kerkmensen niet, die vanavond de straat op gaan na de kerkdienst om aan dit nutteloze geknal mee te doen en eveneens de rommel laten liggen en morgenochtend zonodig moeten uitslapen of slaperig nog plaats nemen in de kerkdienst?
255
De SI stelt expliciet dat deze termen niet gelden voor eenheden van informatie en stelt bovendien dat wat hen betreft de IT deze grootheden over zou mogen nemen, maar dat de SI hier niet over gaat.Welk ander vakgebied worden binaire getallen gebruikt dan?
255
Dat blijkt wel een beetje uit jouw houding, vooral wanneer je deze community leden bestempeld als de pest en een stelletje prutsers.Moet je zelf van top-niveau zijn om te beseffen dat een driver zoals die van NVIDIA een niveau te hoog is voor open-source?
255
Zouden we ons niet drukker moeten maken over alle projecten bij de overheid, die ergens over gaan en waarbij er veel meer belangen op het spel staan, die nu mislukken/handenvol geld kosten ipv van dit gereutel van een paar monomane consultants en politci?
255
Als jij je auto 6 maand niet gebruikt, door omstandigheden, en de buurman confisqueert deze dan maar voor het gemak om er gratis in te kunnen rijden, terwijl jij je verzekeringen en belastingen gewoon nog netjes betaalt, zou je het daar dan mee eens zijn?
255
Staat ook een beetje haaks op de Hippocratische eed die artsen afleggen, want jij suggereert om mensen op basis van burgelijke ongehoorzaamheid (er is namelijk geen wet die het strafbaar maakt om daar te roken) maar het recht op medische zorg te ontnemen?
255
Zo'n simulator kost een hoop geld ja, maar had je nou zelf niet kunnen bedenken dat het de hardware is die het meeste kost, en dat de driver toch gewoon dezelfde is als die ze voor desktops gebruiken, alleen dan met support voor de simulator er ingebouwd?
255
Mag ik u er even aan herinneren dat juist in de Puttense moordzaak er sprake van is dat mensen onschuldig zijn veroordeeld en vervolgens door het apparaat dat deze veroordeling tot in het absurde heeft verdedigd letterlijk aan de schandpaal zijn genageld?
255
Vroeg me ook al af waarom er zoveel sirenes door de straat galmden, maarre, how about beide ventjes op het bureau houden tot ze vertellen wie het wapen heeft en waar ze het vandaan hebben? en niet vertellen betekent linea recta terug richting de antillen?
255
Als 25% van de omzet van bijvoorbeeld de H&M (ooit gehoord van iemand die daar werkte, misschien niet meer actueel) verdwijnt door diefstal, dan zet je toch de dieven voor steeds langere tijd vast, ongeacht of het hun eerste arrestatie voor dat delict is?
Appendix to nld news 2009: Longest sentences
165
Appendix to nld news 2009: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Iedereen die ik heb gesproken is vol lof en ze zeggen dat het beeld er fantastisch uitziet en dat we er zoveel werk in gestoken hebben, aldus de voorganger van de Oensta Gryta kerk in Vaesteras, 110 kilometer ten westen van de Zweedse hoofdstad Stockholm.
255
Maar het zou wel kantje boord zijn, aldus Maurice de Hond na een peiling onder 1200 burgers: 49 procent zou voor stemmen (en dus tegen het kabinet) en 51 procent tegen.De motie van VVD-voorman Mark Rutte haalde het niet bij de stemmingen in het parlement.
255
Het blijft voorlopig moeilijk in te schatten wat er waar is van de geruchten, maar volgens Britse media zou Angelina alvast het volledige hoederecht over de zes kinderen hebben aangevraagd, ook over de drie biologische kinderen die ze met Brad Pitt heeft.
255
De brandweercommandant vertelt: "Het gaat om een terrein van ongeveer tienduizend vierkante meter en er zijn plaatsen waar de ene tegen de andere auto opeengepakt is." Vanuit het depot steeg een dikke rookpluim op en vlammen ontsnapten vanachter de muren.
255
DSM wil het nieuwe beloningsbeleid voorleggen op de aandeelhoudersvergadering in maart 2010. De plannen zijn nog onvoldoende uitgewerkt om al op de aanstaande vergadering, op 25 maart, te kunnen worden gepresenteerd, zegt personeelsdirecteur Ben van Dijk.
255
Verhagen dreigde met opstappen, omdat hij de VS al had beloofd dat Nederland troepen zou sturen naar Uruzgan en als hij z'n belofte niet waarmaakt mag Balkenende niet naar een hoge positie bij de VN of de EU en kan Verhagen geen minister president worden.
255
Met 206,8 miljoen ton over de eerste acht maanden bleef het vervoer over water 0,8 procent achter bij dezelfde periode in 2007. De vervoersprestatie nam volgens het Statistische Bundesamt in die periode met 0,4 procent af naar 54,186 miljoen tonkilometer.
255
Juist wanneer de Kamer weer praat over de ontbossing in Nederland, schrijft de baas van de Vereniging Onze Bossen iets over de teloorgang van de wilde den, een cultuurhistorische zichtbepalende boom, die uitsluitend kan worden gered door strengere regels.
255
Militairen zullen niet alleen vaker worden ingezet na natuurrampen zoals overstromingen en orkanen, ook zal het leger in toenemende mate worden ingezet om conflicten te bestrijden die het gevolg zijn van klimaatverandering of die er door worden verergerd.
255
De NMBS-Groep - dat is het geheel van NMBS-Holding, operator NMBS en infrastructuurbeheerder Infrabel - zag de omzet nog stijgen (+1,5 procent procent tot 2,94 miljard euro) en kon de schuld afbouwen tot 2,4 miljard euro of onder het niveau van eind 2005.
Longest exclamatory sentences Length
Sentence
255
Nu raak je toch supergefrustreerd als aangever en denk je meteen: Volgende keer "corrigeer" ik het zelf wel of je denkt "dit meld ik dus nooit meer" en allebei vind ik slecht.Nederland aggressief? dat komt dan door dit soort laffe reacties van de politie!
255
In een ontwikkelingsland worden de mensen nog beter behandeld in eenziekenhuis dan bij ons in Nerdland, want daar zitten de beste artsen welke door ons uitgezonden wordt(dito verpleging)Graag de ziekenfondspremie halveren gezien bovenstaande feiten graag!
255
Als we het zaad van mensen die historisch wat betekent hebben (Ceasar, Socrates, Nietzsche, Napoleon, Hitler, Stalin, Mozart enz.) nu zouden hebben kunnen we nog een hoop leren wat voor ziekten ze bijv. hadden of waarom ze zo geniaal/gek/sadistisch waren!
255
De beste website van Nederland (echt waar) biedt weinig duidelijkheid, maar het zal iets worden met reportages over de verkiezing van Miss Kroeshaar 2009 en de verkiezing van Miss Suriname Holland 2009 en die hadden we nog niet binnen het publieke bestel!
255
Ook ondernemers en burgers moeten alert zijn.Dat wil ik wel, maar als ik iets wil ondernemen wordt ik zelf opgepakt omdat je in Nederland overvallers zelfs geen rugmassage mag geven welke hun niet helemaal 100% goed bevalt want dan ga je gewoon de bak in!
255
Hij zou veel meer constructief bezig moeten zijn met oplossen van problemen nu hij in de kamer zit, in plaats daarvan is hij alleen maar bezig met zoveel mogelijk populairiteit vergaren en daar wordt hij, van ons belastinggeld, helemaal niet voor betaald!
255
Vastgesteld kan worden dat de rechterT er ook van uit gaat dat ME-erTs degenen zijn die bij uitstek beschikt en bedoeld zijn om tegen aan te schoppen aangezien zij er voor betaald worden en tevens een opleiding hebben genoten om keihard terug te schoppen!
255
Blijkbaar zijn alle soorten recht die in Nederland worden uitgesproken lachertjes, snel en normaal.Dit hele toneel spelletje heeft vanouds de burger meer gekost dan het in recht of vermaak heeft opgebracht.Justitie is en blijft een schaamte voor het land!
Appendix to nld news 2009: Longest sentences
166
255
De EU en alle regeringen in de EU hebben alleen de banken gered, zonder daarbij geen enkele voorwaarde te stellen, dat deze banken het bedrijfsleven moeten bijstaan en redden, integendeel de banken lenen goedkoop geld en de marges houden ze voor hun zelf!
255
Denkende aan BPM/ kwartje van kok, wegenbelasting en extreme accijnzen op brandstof terwijl de gemiddelde Pool al in een nieuwere lees> zuinigere en milieuvriendelijkere auto rijdt dan wij met ons geld blijf ik lekker vervuilend rijden in mijn golf'96!
Longest interrogative sentences Length
Sentence
255
Welk recht van klagen heeft iemand die op zn 16e gaat werken en bijvoorbeeld een tevreden timmerman is over het salaris van iemand die tot pakweg zn 28e aan het leren is en daarna nog 20 jaar moet knokken voor de positie die hij dan uiteindelijk bekleedt?
255
Tja als aboutaleb aangifte hiervan doet moet hij ineens zijn mede marokanen vervolgen voor het zelfde vergrijp een maandje terug.En toen wist hij zich er ook vanaf te maken met onsamenhangend gebazel.Yeah we hebben een tweede cohen hier.kopje thee iemand?
255
Zomaar een gedachtegang: wat zou er gebeuren als Manchester United, Real Madrid en Barcelona, om een paar van de grootste voetbalclubs ter wereld te noemen, zich zouden keren tegen het concept van de Champions League en zijn machtige organisator, de UEFA?
255
Is het niet heel toevallig dat deze hack-aanval uitgerekend vandaag, de dag waarop Pieter Lakeman, de voorzitter van Stichting Hypotheekleed, een oproep deed op televisie aan spaarders om hun geld zo snel mogelijk van de DSB Bank af te halen, plaatsvindt?
255
Ik geef je daar gelijk in, maar als er een video functie komt geeft dat wel weer nieuwe ervaringen. persoonlijk denk ik dat deze functie gaat floppen aangezien ik niet verwacht dat mensen op het station even lekker tegen hun mobiel staan te praten ofniet?
255
Zoals het gevaar van de VS dat ze de nazi's weggeschopt hebben, onze demcoratie hersteld hebben en ons nog veel geld gegeven hebben (Marshallhulp hebben wij nooit terugbetaald) en ons ook nog eens beschermd hebben tegen een eventuele communistische inval?
255
Waarom wordt deze man als 'pedo' bestempeld, als hij valt op 16/17-jarige jongens waar men overigens in Nederland zonder strafrechtelijke vervolging seksuele relaties mee mag onderhouden, op voorwaarde dat het niet tegen de wil van de jongens (of man) is?
255
Door er op het moment dat het daadwerkelijk gebeurde aan te gaan rommelen, op het eerste gezicht om de klap nog wat te verzachten, heeft hij de echte problemen zoals een goed PvdA-er betaamt mogelijk alleen maar voor zich, en erger, voor ons uitgeschoven?
255
Dat komt hier duidelijk niets tekort, geniet van alle vrijheden die je je maar kunt wensen, heeft waarschijnlijk meer kansen gekregen dan de gemiddelde autochtoon, en toch spat de haat ervan af: dat krijg je toch niet meer verkocht aan de hopeloze burger?
255
Heb overigens je eigen recept maar eens gehanteerd en gewikiet op Marcel Roele: "Verder betoogt hij dat het wetenschappelijk bewezen is zwarten en vrouwen dommer zijn en dat gehandicapten de mensheid ziek maken." Nog meer "wetenschappelijke onderbouwing"?
Appendix to nld news 2010: Longest sentences
167
Appendix to nld news 2010: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
De weigering van BP om over een succes van Top Kill te spreken komt op een moment dat het concern onder zware druk van de autoriteiten staat om nu eindelijk het lek te dichten, dat half april na een explosie op het boorplatform Deepwater Horizon ontstond.
255
Maar als elke automobilist die hier reageerd eens plaats neemt achter het stuur van een vrachtwagen dan zullen ze merken dat je zo hoog zit, en vlak voor je en naast je zo weinig ziet dat ze misschien eens wat meer begrijpen hebben voor deze grote wagens.
255
Eerder werd al bekend dat de onderzoeksrechter geen gebruik mag maken van de 475 dossiers die in beslag zijn genomen bij een interne vertrouwenscommissie naar misbruik in de kerk.Toch gaat de operatie door, onder leiding van onderzoeksrechter Wim De Troy.
255
Over straatnaamborden van faciliteitengemeenten stelde die dat die eentalig Nederlands moeten zijn aangezien ze niet enkel bedoeld zijn voor inwoners van de eigen gemeente, maar ook voor anderen, en dat faciliteiten er slechts zijn voor de eigen inwoners.
255
Da Costas boekje Bezwaren tegen de geest der eeuw, waarin de 25-jarige jurist en dichter het verlichte, zelfgenoegzame klimaat van zijn tijd in felle pennenstreken aan de kaak stelde, leidde bij verschijning tot ongelooflijk heftige reacties, zegt Dubois.
255
Moet toch pijn doen dat moslims daar tegenover een groep staan dat net zo religieus gestoord is als zij zelf, en wie de ellende van de Islam overduidelijk niet accepteert.Moge het duidelijk zijn dat die mentale ziekte waar je het over hebt 'religie' heet.
255
De grootste dam en waterkrachtcentrale ter wereld werd vorig jaar volledig in gebruik genomen en blijkt zelf de eerste grote test goed door staan te hebben, maar het traditionele probleem van de overstromingen in de Yangzi-delta is daarmee niet verholpen.
255
JOHANNESBURG - Terwijl bondscoach Bert van Marwijk zich buigt over de laatste stukjes in zijn Oranje-puzzel, worden in Sandton de meest chique wijk van Johannesburg - de laatste voorbereidingen getroffen voor de ontvangst van de Nederlandse WK-selectie.
255
Met de recente onthulingen van de verschrikkelijke leugens die het IPCC over ons uitstort en de klakkeloze volgzame houding die de Nerlandse politiek EN media zien de meesten wel in dat er op zijn zachtst gezegd een keerzijde aan het hele Co2 verhaal zit.
255
Volgens de organisatie belanden jaarlijks 16.000 Nederlanders in het buitenland in een ziekenhuis omdat ze niet op de juiste manier hun geneesmiddelen hebben ingenomen.Iedereen met vragen over medicijnen kan de komende week bij de bus naar binnen stappen.
Longest exclamatory sentences Length
Sentence
255
Als specialist in zonwering, rolluiken en screens adviseren wij u graag over de beste oplossing voor zonwering binnen en buiten en verkopen wij u graag producten die zonder uitzondering montagevriendelijk, onderhouds-arm en kwalitatief onovertroffen zijn!
255
En niet van tevoren aankondigen dat ze komen nee zo er naar toe en streng controleren,het gaat om etens waren en daar verdienen ze aan,en een paar uur geen koeling of vloer schoonmaken komen heus geen muisen of maden op.Dan is het al een tijdje versmeerd!
255
Vreemd hoor, wel kinderen dopen om van de zogenaamde erfzonde (gedaan door mensen die mogelijk geleefd zouden hebben) verlost te worden), terwijl ze nog helemaal niets gedaan hebben, behalve dan om geboren te worden, en dan spreekt men niet van verjaring!
255
Als Teeven lak heeft aan privacywetgeving, waarom dan niet bij geboorte een rfid-chip en een gsm-transponder implanteren, vanuit de burgerij hoef je toch geen tegenstand meer te verwachten, die zijn al voldoende geconditioneerd dat ze er om zullen smeken!
255
De KMAR is nu noodgedwongen extra onnodige kosten te maken door deze plaaggeest, maak liever een programma over viezeriken als loverboys of iets dergelijks, dat zijn tenslotte criminelen die veel leed veroorzaken onder de slachtoffers en hun nabestaanden!
255
Als moeder heb ik vervolgens de leerkracht aangesproken en hem gevraagd hoe hij het zou vinden als hij bij aangifte van diefstal van zijn portemonnee door de politie op vergelijkbare wijze zou worden toegesproken: Mijnheer, u moet beter op uw geld passen!
255
Persoonlijk vind ik het principe/de filosofie welke aan de methodiek ten grondslag ligt vele malen belangrijker en bovendien voor een leek wat beter te begrijpen dan termen als H0 en H1 die de meesten na de middelbare school het liefst snel weer vergeten!
255
Dat is nu precies een van de redenen waarom gemiddeld 80% van de kiezers zo blij is met dit gedoog kabinet!Word er eindelijk eens opgetreden tegen dit tuig!Weet links ook meteen wat al vele jaren de wens van het volk is geweest waar niets aan gedaan werd!
Appendix to nld news 2010: Longest sentences
168
255
Dat jullie dat durven te zeggent egen gompie! omdat het jullie zelf niet is overkomen! dus omdat die ouders belazerd zijn moeten de kinderen maar ONSCHULDIGE mensen gijzelen? dat praten jullie gewoon goed? donder ook lekker op met al die probleemgezinnen!
255
Denk aan catering, salaris administratie, ARBO arts, etc. Het verschil met werkplekbeheer, ict-infrastructuurbeheer of servicedesk, is dat deze laatste in bijna alle gevallen cruciaal zijn voor het functioneren van het primaire proces van een organisatie!
Longest interrogative sentences Length
Sentence
255
Wat moet Israel zeggen: "Sorry dat we onszelf hebben verdedigd tegen die aardige mannen met baarden die van te voren stonden te schreeuwen dat ze alle Joden wilden doden en toen wij aan boord kwamen ons begonnen aan te vallen met messen en ijzeren staven?
255
Bovendien, stel dat je met een kapotte auto naar een monteur zou gaan, en die zou je vertellen dat de "aura" van je linker voorwiel niet goed is, en dat hij het met ingestraalde radiatorvloeistof a 100 euro de liter weer goedmaakt, zou jij ervoor betalen?
255
Aangezien Maxime Verhagen over de CDA-ministers voor Bruin I gaat vrees ik met groten vreze voor splattergamers en downloadwinkeldieven dat de eminente Prof. dr. Ernst Maurits Henricus Hirsch Ballin dit dossier de komende jaren (correctie, maanden, dagen?
255
Ik betaal nu als gezond levend mens voor de huidige of toekomstige klachten van de eet, rook of drinkgewoonten van mijn medemens, dat vindt ik asociaal, ik doe d'r alles aan om gezond te zijn en te blijven en een ander vreet zich helemaal de ziektewet in?
255
Ik zit hier in mijn Playboy Mansionachtige Schillenhut omringt door een kudde zeekoeien, je kent me ey, once a player enzovoorts, met uitpuilende bikiniachtige iets op leven en dood teksten in elkaar te tiepelen voor den ghoede saeck, je kent me toch, ey?
255
Ik snap jouw redeneertrant heel goed, maar wat zou jij doen als jij een eigen bedrijf had gehad en er een beroep op jou werd gedaan om een kudde "Finnen" in dienst te nemen, na afloop van hun schoffeldwangarbeidsweek-wegens-het-beroven-van-oude-vrouwtjes?
255
Noord-Korea zegt dat het verlangt naar "langdurige vrede op het Koreaanse schiereiland en het atoomvrij houden ervan door dialoog en onderhandelingen." De gehele wereld is opgebouwd uit atomen dus hoe willen ze het Koreaanse schiereiland atoomvrij houden?
255
Het feit dat ie keihard op de trappers gaat staan is toch ook wel tekenend dat die vent GODSblij is dat hij er even uit die malaise kan, weg van dat eeuwige gezeik aan zn kop en die microfoons in zijn gezicht die alleen maar bijdehandte kakvragen stellen?
255
Kunnen we gewoon niet het uitkeringstrekkende, gehandicapte, zich kunstenaar noemende, etc deel van de bevolking over de kling jagen en de lusten van het leven delen met diegenen die daar feitelijk toe bijdragen of daar aantoonbaar aan bijgedragen hebben?
255
Om een simpel voorbeeld te nemen een Afrikaan die nu als geitenhoeder werkt en in een hutje woont, als je die persoon zeg 100M zou geven denk je echt dat hij zou zeggen nou ja, dat hutje is altijd goed genoeg geweest voor me dus waarom zou ik meer willen?
Appendix to nld news 2011: Longest sentences
169
Appendix to nld news 2011: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Maar Metro 2033 is wel een recent DirectX 11 game, dat o.a. gebruik maakt van DOF wat de videokaart wel zwaar belast. 10 maart 2011, 17:20 Valt toch op dat er niet heel veel verschil tussen tussen AMD en Nvidia kaartjes zit op performance/watt verhouding.
255
Ook de propaganda daarna verkondigd door de staatstv die zei bewijzen te hebben dat Hernandez kopstoten zou hebben uitgedeeld was een hoax, de nos kroop met de staart tussen de benen terug wegens gebrek aan bewijs, omdat er geen kopstoten zijn uitgedeeld.
255
Live uit St Anton am Arlberg Verslag Großglockner Resort Helikopter 'Avalanche control' Alpenweerpraat: zonnig, in het weekend zachter Live Report: Veel beter dan verwacht Ontvang onze wekelijks nieuwsbrief met de laatste berichten, weer en sneeuwhoogtes.
255
Neelie Kroes, die verantwoordelijk is voor de portefeuille Digitale Agenda van de Europese Commissie, bezocht samen met een delegatie van de Europese Commissie een aantal standhouders op de CeBIT 2011, waaronder het Nederlandse Force Fusion uit Terneuzen.
255
Door com2,1ghz, vrijdag 26 augustus 2011 10:05 Home laptops zijn brak maar business laptops daarintegen zijn wel stevig Door bytemaster889, vrijdag 26 augustus 2011 11:04 Je kon beter een Asus Home laptop kopen dan de 8510 of 6510 Businessmodellen van HP.
255
Door Hari-Bo, woensdag 16 februari 2011 13:48 Ik ben juist blij dat Nokia voor Windows Mobile heeft gekozen, want nu heeft Windows een grote partij achter het OS staan, want de lineup die er aan gaat komen met Windows Mobile 7 devices is redelijk summier.
255
Waar de krachtige Chevrolet Rally conceptcar een voorproefje is van de volgende generatie van deze midsize pick-up-truck, is de futuristisch ogende Chevrolet Miray een combinatie van een op een straaljager gebaseerd uiterlijk met een hybride aandrijflijn.
255
Door Yucko, woensdag 23 november 2011 14:18 Zegt iemand iets over niet beginnen aan bepaalde dingen als ze het niet begrijpen, terwijl nu toch al vaak genoeg gezegd is dat het onzichtbaar maken van je SSID niet werkt en toch gewoon opgepikt kunnen worden.
255
We willen er alles aan doen om haar zo snel mogelijk terug te krijgen en willen later niet zoals bij de zaak van Jennefer van Oostende het verwijt krijgen dat we het Amber Alert niet hebben benut”, aldus een woordvoerder van de politie Rotterdam-Rijnmond.
255
En ook over OCen gesproken dat gaat een heel stuk makkelijker met een 1155 dan een 1366, en dat ik 4.8GHz haal met mijn watergekoelde i7 970 betekend nog steeds niet dat het sneller is dan een 2600K want daar haalde ik de 5.2GHz en kon ik niet meer veder.
Longest exclamatory sentences Length
Sentence
255
Klik hier en vul de vragenlijst in Terug naar de nieuwslijst Stuur door via email Printen E-mailadres afzender * E-mailadres ontvanger * Hieronder zie je een weergave van de e-mail die verstuurd gaat worden Nieuwe cao Postbezorgers: vul de vragenlijst in!
255
’ /wonen :: nieuws onderverdeeld 28 oktober 2010 14 oktober 2008 4 oktober 2009 21 augustus 2009 17 augustus 2009 11 september 2008 Teken ook het manifest ‘Armoede werkt niet’ Brussel, handen af van onze lonen en pensioenen, zorg en sociale voorzieningen!
255
DrDarwin 28-09-2011 @ 07:13 Ik ben hier een beetje ambivalent in, aan de ene kant is pesten natuurlijk not done, maar aan de andere kant, sommige homo's zijn wel zo erg 'homo' dat ik persoonlijk de neiging krijg om ze toe te roepen 'Doe eens normaal man'!
255
Om vervolgens als je op strand ligt ineens een kernraket uit het water op te zien stijgen die naar je hoofdstad gaat neu, denk niet dat dat nou zo snel zal gebeuren Denenigeikke 19-04-2011 @ 09:55 Niet slim dat zulke landen dat in handen krijgen en maken!
255
" 1226 views / 10 reacties Reacties op dit bericht 10 van 10 reacties op deze pagina Pagina 1 paterkroepoep 24-11-2011 @ 13:51 Hahaha, ik wil bij deze ook mijn oprechte excuses aanbieden aan de drogist, waar ik vroeger een handvol dropjes geleend heb!
255
Zwelgje - "I know I can wil mensen inspireren het maximale uit hun leven te halen door het brengen van inspirerend nieuws, het geven van handige tips maar vooral door het waarmaken van mensen hun kleine en grote dromen en door het doen van bizarre stunts!
255
" Als je er echt zo mee zit, dan begin je toch een pet-itie? gatochkrassen 22-11-2011 @ 23:59 Ach hier in NL doen ze schuren, doen ze eerst een condoom om en dan dansen maar. hehe Quantore 23-11-2011 @ 00:45 Sneay Cap, Daar gooien we niet met de pet naar!
255
Als Brein naar de rechter was gestapt en gelijk had gekregen dan wordt die payment provider opgedragen om de gegevens door te geven, maar ze krijgen geen boete of wat dan ook; hoewel ze de zaak "verliezen" betekent dat niet dat ze iets fout gedaan hebben!
Appendix to nld news 2011: Longest sentences
170
255
Maar van mij mag-ie, hij doet niemand kwaad met z'n spelletjes. 1: Hij doet er niemand kwaad mee! 2: De kleding van de gemiddelde kraker zorgt voor meer aanstoot dan deze kleding! 3: Dit soor gevoelens komen vaak voort uit het gemis van een moeder figuur!
255
Niks advocaten, begeleiding, geitenwollensokkenagoochelaars en overige geldhongerige subsidietrekkende niksnutten die op de kosten vd belastigbetaler hun baantje in stand willen houden door die zogenaamde arme kansenjongeren uit de bak proberen te houden!
Longest interrogative sentences Length
Sentence
255
Waarom zou ik net als jij meters en meters aan DVD's en BluRays aanschaffen als ik nu al weet dat ik me wéér door die diarree aan niet-skipbare waarschuwingen, verdachtmakingen en dergelijke heen moet worstelen, als ik er de volle mep voor heb neergeteld?
255
Draai de vraag dus eens om: denk je dat het aantal usb 3.0-aansluitingen op dit bord echt te weinig is, waardoor je bepaalde usb 3.0-apparatuur gedwongen aan moet sluiten op een langzamer poortje (en waardoor dat apparaat ook echt trager gaat werken dus)?
255
Door L702, donderdag 21 april 2011 22:06 Hij zegt "veel mensen", het ligt er dus aan wat jij onder veel verstaat, misschien vind hij het aantal mensen die hij in de media zag veel, misschien is het percentage hoog van de mensen in de media die dat zeggen?
255
Men neme een inspecteur die even de pieken bij Chello en Ziggo pakt, en de miljarden zijn binnen Door Nounours, woensdag 30 november 2011 00:11 En die Miljarden wil je gaan halen bij Jan student die geen geld heeft om DVD's te kopen dus een film download?
255
Ze realiseren zich alleen hopelijk ook dat er al heel lang een "analoog" PD met deels electronische aanvullingen bestaat dat op allerlei niet gestandaardiseerde, primitieve, foutgevoelige en door ontbreken van standaarden dure manieren wordt overgedragen?
255
Welke gevangenis zit hij nu, mag ik pls ff weten Ik heb de heer Dealani Bouterse Getwitterd, dit mag niet in ons land gebeuren en moet een strengere wet komen met hogere straffen, @master u bent zeker een ZWARTE. wat heeft blank hier nu weer mee te maken?
255
Sony: Vaio Z met Thunderbolt Microsoft: wifi via tv-frequenties Google Nexus Prime, eerste Ice Cream-toestel Google’s automatisch bestuurde auto’s toegelaten Ovi Maps ook in Windows Phone 7 Mango HTC brengt Evo 3D naar Nederland Wordt Newzbin geblokkeerd?
255
Zelfs dries en tim en die andere aankopen kunnen psv niet helpen, Denk weer een 3e plaats voor psv Dat is ook leuk Links van de kampioen staan :P Ow ik lees net dat de toppers niet welkom zijn in Amsterdam Waar moeten al die psv'ers dan spelen? 3e plaats?
255
Sorry, maar Notion Ink heeft als start-up totaal geen imago als je het gaat vergelijken met bedrijven als Microsoft, Google en Apple, terwijl als er bij hun wat fout gaat dan zal hooguit 5% van de klanten weglopen en nu is het hele bedrijf ineens corrupt?
255
Is iemand het ook opgevallen dat iOS 5 veel meer kleur op het scherm naar buiten bracht als iOS 4? Door ronaldmathies, dinsdag 29 november 2011 10:42 Wel eens over nagedacht dat er mischien toch verbeteringen in het scherm zijn doorgevoerd t.o.v. vroeger?
Appendix to nld newscrawl 2011: Longest sentences
171
Appendix to nld newscrawl 2011: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Constantijn verbood zondagsarbeid » Constantijn verbood zondagsarbeid Constantijn verbood zondagsarbeid „Zij die leefden onder een oude toestand zijn tot nieuwe verwachting gekomen en houden daarom de sabbat niet meer maar nemen de dag des Heeren in acht.
255
» Zuid–Koreaan nieuwe VN–chef NEW YORK (ANP/DPA) – De VN–Veiligheidsraad heeft maandag de 62–jarige Zuid–Koreaan Ban Ki Moon aanbevolen als opvolger van de huidige secretaris–generaal van de Verenigde Naties, Kofi Annan, wiens mandaat 31 december afloopt.
255
V-raad voert druk op Israël op » V-raad voert druk op Israël op V-raad voert druk op Israël op NEW YORK – De druk op Israël om serieus werk te maken van onderzoek naar mogelijke oorlogsmisdaden van militairen tijdens de Gazaoorlog neemt steeds verder toe.
255
14.30 uur: kater van gisteren avond - check telefoon naast de haak - check mobiel op stil, nummer van pizzaria onder de sneltoets - check alle wedstrijden worden afgelast wegens faillissement van KNVB bv afd voetbal zolang 020 verliest vind ik alles best.
255
Echter, uw energieleverancier zorgt dat de Vleermuizenonderzoek in Zuid-Limburg Vleermuizenonderzoek in Zuid-Limburg Staatsbosbeheer liet eind juni weten dat het goed gaat met de vleermuizen in ons land: het aantal vleermuizen zou explosief zijn gestegen.
255
Immers, tijdens de demissionaire periode sluimert de ministeriële verantwoordelijkheid; zij vervalt voorzover de demissionaire bewindspersonen niet terugkeren; zij herleeft of wordt actueel als en voorzover de demissionaire bewindspersonen wél terugkeren.
255
Crimeroute door Amsterdam-Zuid De Holleeder Connectie Browser Diashow: kindertekeningen uit Darfur Onderzoekers van mensenrechtenorganisatie Human Right Watch in Darfur gaven kinderen schetsboeken om zich mee te vermaken terwijl hun ouders werden gehoord.
255
Binnenkort zal de commissie Landsverdediging (nadat ik de voorzitter hierover vatte met een concreet verzoek tot bezoek aan de kazerne in Diest) een bezoek brengen aan een aantal kazernes die getroffen worden door de herstructurering van minister De Crem.
255
Kunstenaar Johan van der Dong 'Mensen met bakfietsen stemmen anders dan mensen met rolluiken' Het verkiezingsprogramma 'De Stemming van Nederland' vanuit de Radio 1-bus wordt vandaag gepresenteerd vanaf het Tournooiveld in Den Haag, vlakbij het Binnenhof.
255
Voor de eerste 2 jaar dient een woonplaatsverklaring te worden voorgelegd ofwel dient bewezen dat het gezin gedurende het volledige kalenderjaar in het buitenland is gevestigd en de sportbeoefenaar minder dan 10 maand per kalenderjaar in België verblijft.
Longest exclamatory sentences Length
Sentence
255
Vb. fijn als je in Goes binnengebracht wordt in het weekend, 3 artsen ruzieen boven je bed, 1 met een borrel op van Golfbaan, 1 ass. weekend arts, en een dame die al 20 achter de geraniums zou moeten zitten, Snel weg en naar Dirksland, daarom leef ik nog!
255
Toen ik naar de verantwoordelijke van de parkeergarage belde om na te gaan wie er tegen mijn auto was gereden (het hangt daar toch vol met bewakingscamera's) lachte hij mij uit en vertelde dat de kentekens van de auto's niet te lezen zijn met de camera's!
255
Met lekker een bootje aan het water; recreatie en aanleg van " nieuwe natuur" (alhoewel de huidige natuur in dat gebied al heel prachtig is van nature met de meer dan 700 jaar oude Zwartendijk) en dit alles is bedoeld om mensen te trekken uit de Randstad!
255
Elke passant kan zien dat ze dealen zeker als je even toekijkt(op afstand),'blauw en toezicht' loopt gewoon voorbij zonder iets te vragen of in te grijpen,willen zeker de dag zonder incident doorkomen of heeft geen prioriteit want bekeuren levert meer op!
255
Wire) 22 mei 2010 Ee - (8 reacties) flaamsegaai (wieger jellema) 21 mei 2010 Beetsterzwaag - één van de ooievaars op de gerdyksterwei te beetsterzwaag (Margriet Klerks) 21 mei 2010 Broeksterwâld - (3 reacties) Je ziet het wel he echt smoordruk heb ik het!
255
We moeten idd allemaal rekening met elkaar houden, en als we allemaal wat minder lichtontvlambaar zijn en ook onze kinderen laten zien dat we met zijn allen op een klein stukje aarde leven en dus op (elkaar) moeten letten zal het een stuk aangenamer zijn!
Appendix to nld newscrawl 2011: Longest sentences
172
255
Links onderaan deze pagina Beluister de jongste uitzending De nieuwe single van The Rolling Stones alleen bij Radio 1 Volume 1 Exile on Main Street Exit muziek nieuwe single Plundered my soul the rolling stones The Rolling Stones hebben een nieuwe single!
255
EXCLUSIEF- Trailer De Heineken Ontvoering James Blunt naar Night of the Proms Red Hot Chili Peppers - I’m with you Gordon krijgt hulp van Dan Karaty Weather Report - Live in Offenbach 1978 Jaap van Zweden dirigeert twee keer Bruckner Trommelvuur is terug!
255
Alles wat wij waarnemen zelfs de sterren die miljoenen lichtjaren ver weg van ons staan zijn allemaal afkomstig uit 1 punt, waar de big bang begon. dit punt is in de aller eerste momenten na het uitbarsten van de big bang niet groter geweest dan een erwt!
255
De kliek is bang dat ze dadelijk verantwoording moeten gaan afleggen. heb trouwens bij de landelijke verkiezing ook op de PVV gestemd, maar nu ze mij belazerd hebben en 180 graden zijn gedraaid en achter de VVD aanlopen, ga ik nu niet meer op hun stemmen!
Longest interrogative sentences Length
Sentence
255
Vis staat klaar op CSY-terminal IJmuiden Vervoerders en verladers ‘daten’ in Parijs Kantoor Binnenvaart wordt BinnenvaartUnie Groei binnenvaart naar beneden bijgesteld 'Sinds de maatregel is verschenen hoor ik hier reacties als: "Zijn ze nou helemaal gek?
255
En welke toerist gaat naar een land als Kameroen als er nauwelijks wegen zijn, de elektriciteit onbetrouwbaar is, je niet naar een goede arts kunt als je ziek wordt, het risico overvallen te worden levensgroot is en je op het vliegveld al opgelicht wordt?
255
De site wordt continu ververst: met blogs, tweets, filmpjes van optredens van lijsttrekker Job Cohen en videoreacties van PvdA’ers op vragen van potentiële kiezers (‘Wat betekent “Iedereen telt mee” concreet voor homoseksuelen, lesbiennes en transgenders?
255
Gelukkig was dat buiten Hendrik Jan Schoo gerekend, die het aftasten, evenals elke andere formaliteit, oversloeg – wie je leest, ken je immers al – en bulderde: ‘Ik begrijp dat je dit voor Vrij Nederland doet, maar da’s toch niks voor jou, die cijfertjes?
255
Noord-Europese politici en bestuurders kunnen geen stap in de richting van de armlastige Grieken en Portugezen zetten zonder permanent over hun schouder te moeten kijken: lopen hun kiezers uit protest niet weg naar de PVV, Marine Le Pen en de Ware Finnen?
255
Ontruiming na gaslek Amsterdam ZO Gaslek na verzakking weg in A'dam Gaslek Westergasterrein gedicht Zoektocht naar gaslek duurt voort Nieuw oefencentrum brandweer A'dam Gezin A'dam onwel door koolmonoxide Heb je een foto gemaakt die hoort bij dit bericht?
255
Exemplaren met diesels bestaan niet eens, alleen slurpende achtcilinders, hij zwabbert meer dan een politicus in verkiezingstijd en hoest er meer CO2 uit dan een Boeing 747. Begrijpt u nu waarom dealers en mensen met smaak het niet zo op deze yank hebben?
255
Vertelt uw achterban waarom zij, kinderen van het land, toevallig niets krijgen van hun eigen stamhoofd terwijl juist de vreemdelingen een koninklijke ontvangst krijgen, met tal van privileges, zoals binnen een dag de Surinaamse nationaliteit en paspoort?
255
Δ Ik heb een klacht over deze reactie Dan rijst (uiteraard) de vraag:Hoe komen al die jongeren, die meestal geen cent te makke hebben, aan die zg. 'Dure merkkleding'en 'waardevolle apparatuur', is dit voor de verzekeringen bedoeld of wat is hier van waar?
255
Δ Ik heb een klacht over deze reactie Omdat er een vergunning was verleend mocht essent ervan uitgaan dat ze konden bouwen dat het nu gestopt word is weer het bewijs van een onbetrouwbare overheid en een strop voor het bouwbedrijf,en wie gaat dit betalen?
Appendix to nld wikipedia 2007: Longest sentences
173
Appendix to nld wikipedia 2007: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
In 1996 werd voor het eerst bij een Britse vleermuis het vleermuizen-hondsdolheidvirus EBLV-2 gevonden[4] en in 2002 overleed een vleermuisenthousiast aan hondsdolheid na een beet[5], het eerste Britse inheemse geval van hondsdolheid sinds bijna een eeuw.
255
Dat was een traag en moeizaam proces maar men had geen haast: Von Tiedeman was al blij dat zonder al te zware verliezen een inbraak gemaakt was in de vijandelijke hoofdweerstandsstelling en dat het 2e Bataljon zich tijdens zijn vuurdoop goed gehouden had.
255
Door filmregiseur Sergej Eisenstein werden de Opritsjniks in zijn film Ivan de Verschrikkelijke I neergezet als gezonde, loyale en schoon-lijkende personages, om ze in zijn film Ivan de Verschrikkelijke II neer te zetten op een wat minder positieve wijze.
255
En tot slot de vrij jonge Den Oudsten Alliances van de eerste generatie serie 5500 en rolden er ook nog zelf na de fusie de 1100 serie binnen Een serie NEOPLAN bussen van de serie 2000 en een serie Bova Futura bussen uit het voormalige Shuttlebus netwerk.
255
Procopius hanteert in dit werk een classicistisch getint Grieks, en probeert op stilistisch gebied een synthese te vormen van de grootste Griekse historici, Thucydides en (vooral) Herodotus, maar ook van latere geschiedschrijvers als Polybius en Arrianus.
255
Generaal Charles De Gaulle, lid van het Franse oorlogskabinet tijdens de Duitse invasie, was met Paul Reynaud, de voorzitter van het Franse kabinet en enkele andere leden van het kabinet sterk gekant tegen elke onderhandeling met de Duitsers en Italianen.
255
Ajahn Chah bijvoorbeeld was een bhikkhu in de Maha Nikaya en wilde lid worden van de Dhammayoettika Nikaya om zo dichter bij Ajahn Mun te kunnen zijn, maar Ajahn Mun zei dat dat niet nodig was en overtuigde Ajahn Chah om lid van de Maha Nikaya te blijven.
255
Het vasteland China (of vasteland van China) is een politiek-geografische term die verwijst naar China exclusief de beide Speciale Bestuurlijke Regio's Hongkong en Macau en ook exclusief de Republiek China (Taiwan, Matsu, Pratas, Quemoy, Taiping, Wuchiu).
255
Een speciale commissie deed uitvoerig onderzoek en haar aanbevelingen in het zgn. Windsor Report (2004) worden thans wereldwijd bestudeerd en zullen wellicht in 2008 (Lambethconferentie van alle bisschoppen) tot nadere regelingen en/of maatregelen leiden.
255
Haar handschrift lijkt echter zo erg op dat van haar echtgenoot dat men pas in de jaren vijftig van de twintigste eeuw ontdekte dat een deel van het bewaard gebleven oeuvre niet geschreven was door de hand van de meester, maar door de hand van zijn vrouw.
Longest exclamatory sentences Length
Sentence
254
Amusant is dat Cornelis de Witt nog hun neef, de legerkapitein Jacob van Meeuwen, naar voren probeert te schuiven, maar dit wordt door Johan afgewezen: hun niet al te snuggere familielid acht hij volmaakt voor het leger geschikt maar niet voor de marine!
253
Als tegenactie zal maatschappij B daarom de accountants ook aan het werk zetten om te snijden in de kosten, en waarempel: de week na de aankondiging van de lagere prijs van maatschappij A komt maatschappij B met een tegenadvertentie: 35 euro per vlucht!
253
Toen echter het loopwerk van onderen wat afgerond was, liep de rupsband er bij iedere oneffenheid in het terrein nog steeds af - Field had al gemeld dat de schakels zo slecht pasten dat de arbeiders bij Bullock ze met voorhamers in het loopwerk sloegen!
252
In Giswil vind je alles op het gebied van recreatie, ontspanning en sport; strandbad, tennis, folkloreavonden, rondrit met de koets, goed onderhouden wandelwegen, fiets- en biketouren waarbij je van de alpen met zijn prachtige alpenflora zult genieten!
251
Deze sterke golflengte-afhankelijkheid zorgt ervoor dat blauw licht veel meer wordt verstrooid dan rood licht: blauw licht heeft een golflengte die ongeveer twee keer zo kort is als rood licht, en blauw licht wordt daardoor 16 keer zo goed verstrooid!
251
Mar die kist had men vóór eenige jaren ter bewaring aan H. H. Diakenen overgegeven. en daar zij ongelukkig niet slotvast was, had de moeder in het oude-mannen-huis de boeken, daarin voorhanden, tot allerlei huishoudelijk gebruik tot patronen verknipt!
250
Naast een grondige afkeer voor haar broer, toont de schrijfster van de Alexiade een duidelijk misprijzen voor de West-Europese kruisvaarders, die zij beschouwt als een zootje ongemanierde barbaren die zij ervan verdenkt - niet ten onrechte overigens!
Appendix to nld wikipedia 2007: Longest sentences
174
249
Waar velen dachten dat hij verantwoordelijk was voor oa. het financieren van de "Next Block" video, blijkt uit betrouwbare bronnen dat de Most Official-facade betaald is door Rotterdamse gangsters, die nu ook een appeltje met hem te schillen hebben!
249
Ook de twee nog overblijvende FT-17's, die eerder met Italiaanse machinegeweren waren uitgerust, werden in de jaren dertig omgebouwd met een lang 37mm kanon; één daarvan staat nog als monument in Italië - met een plaquette die "FIAT 3000B" vermeldt!
248
Deze laatste kreeg op 14 maart 2002 bij de presentatie van zijn boek annex verkiezingsprogramma De puinhopen van acht jaar Paars een taart van kippenstront en braaksel in het gezicht gedrukt door individuen die daarbij riepen Op naar de NUL zetels!
Longest interrogative sentences Length
Sentence
254
De oude Indiërs, meende Gonda, "hebben ons iets te zeggen": was op het subcontinent immers niet, ondanks de wetenschappelijk bloei, een cultuurscheiding achterwege gebleven zoals die in het Westen de twintigste-eeuwse cultuurhistorici tot wanhoop bracht?
253
De goden zouden hun afkeur daarover trouwens hebben laten merken door rond het beeld een massa dollekervel te laten opschieten, een giftig kruid dat elders in de stad maar nauwelijks wilde groeien… Is dit allemaal roddel van gefrustreerde tegenstanders?
251
Kolja Krasotkin, een jonge ondeugende socialist: U zult het toch wel met me eens wezen dat bijvoorbeeld het christendom altijd twee handen op een buik gespeeld heeft met de rijken en aanzienlijken om de lagere klassen in slavernij te houden, nietwaar?
249
Hoe zullen we deze mensen bereiken met het goede nieuws van het evangelie en het hen mogelijk maken er op hun eigen manier op te reageren, als we niet delen in de cultuur van de tijd en van de straat en tegelijkertijd er kritisch bij betrokken zijn?
248
Of was het bombardement een product van een dolgedraaide militaire bureaucratie, in de zin van 'wat zullen we vandaag eens doen' zoals Kurt Vonnegut, een Amerikaan die als krijgsgevangene het bombardement meemaakt, in ‘Slaughterhouse 5’ beschrijft?
247
Een van de bekendste programma's was "De Uitdaging". het jongeren programma 'Sex met Angela' krijgt wereldwijde aandacht met als hoogtepunt een uitnodiging in de talkshow van Phil Donahue in New York.Vanaf 2000 presenteert ze ook Wie is... de mol?
247
En zo heb ik ook de serie "Medea" gemaakt voor de AVRO, die volgend jaar zou worden uitgezonden maar die door de netcoördinator vergeten is, althans, vijftig AVRO-uren zijn per ongeluk niet begroot en waar moeten dìe centjes nu weer vandaan komen?
246
Nadat de professor zijn waanbeeld heeft vermoord is de film afgelopen, tijdens de aftiteling wordt verteld dat professor Humbert veroordeeld werd voor moord en in de gevangenis aan een hartstilstand overleed, zou het personage dan toch echt zijn?
245
Maar ook als men dit aanneemt, dat Thomas dus ontstaan zou zijn vóór de Nieuwtestamentische evangeliën, evenals Q, dan rest nog de vraag: is de teruggevonden Thomas gelijk aan de oorspronkelijke verzameling zoals die in Odessa zou zijn ontstaan?
245
We zullen daarvoor eerst een aantal gegevens moeten hebben: Wat is de kans dat de taxi blauw was zonder dat we iets weten, wat is de kans dat de voorbijganger een blauwe taxi als blauw ziet, en wat is de kans dat dat met een groene taxi gebeurt?
Appendix to nld wikipedia 2012: Longest sentences
175
Appendix to nld wikipedia 2012: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Nederlandsche kolonisatie in Europa * Hans Venatier, Baljuw Bartold, de groote trek naar het oosten (minstens vijf herdrukken) Boek over de kolonisatie van germaanse (lees: Duitse Nederlandse en Vlaamse) kolonisten in oost europa tijdens de middeleeuwen.
255
Een kruis rozdarty Een kruis rozdarty met gouden penningen Een kruis półtorakrzyż Een kruis półtrzeciakrzyż Kruizen van de orthodoxe christenen De orthodoxe en geünieerde kerken gebruiken vooral kruizen met meerdere armen waarvan soms één arm scheefstaat.
255
Hij groeide op in de buurt van de Donaustad Brăila, verliet zijn moeder op jonge leeftijd en leidde een zwerversbestaan, waarbij hij door grote delen van Europa en het Nabije Oosten trok en talloze beroepen uitoefende, van slotenmaker tot strandfotograaf.
255
Het leger is moeilijker te financieren, omdat dat een collectief goed is, maar het idee is dat het toch zou kunnen worden betaald door donaties of doordat men sociale druk (of boycot-acties ) gebruikt om iedereen over te halen zijn steentje bij te dragen.
255
Industriezone Tussen de wijken Overpelt-Fabriek en Holheide werd na de Tweede Wereldoorlog een industriezone voor heel Noordwest-Limburg aangelegd op de weidse heidegronden: het zogenaamde intercommunale Nolim-park, waarbij Nolim voor Noord-Limburg staat.
255
In de hoop de waterkwaliteit te verbeteren heeft men begin jaren 1990 een aantal maatregelen uitgevoerd zoals uitbaggeren van de vervuilde bodem, het weren van vervuild water uit de omgeving en het inlaten van gedefosfateerd buitenwater uit het Aarkanaal.
255
De geslachtsnaam is afgeleid van het Klassiek Griekse metrikos, "matig", en akantha, "doorn", een verwijzing naar de matig lange doornuitsteeksels op de wervels die volgens Parker een duidelijk onderscheid vormden met de lange uitsteeksels bij Altipsinax.
255
Een jaar later neemt hij onder leiding van de Engelse top-producer Mike Vernon (onder andere bekend van zijn werk met Fleetwood Mac ) voor hetzelfde label zijn tweede elpee op in de Engelse Chipping Norton Studios, getiteld "I'm The Worst Partner I Know".
255
Hij koos eerst voor het Nederlands elftal, maar omdat hij daarna niet meer werd uitverkozen en omdat al zijn wedstrijden voor het Nederlands elftal vriendschappelijk waren heeft hij ook nog 3 interlands voor het Marokkaanse nationale elftal kunnen spelen.
255
Biografie Frisch werd vooral bekend door zijn debuutfilm uit 2001, Vergeef me, waarin hij zelf en onder zijn eigen naam de rol van duivels regisseur speelt die schijnbaar ten koste van de geestelijke gezondheid van zijn "acteurs" een spannende film maakt.
Longest exclamatory sentences Length
Sentence
255
Priesters en priesteressen - steeds verbonden aan de cultus van één bepaalde godheid - werden, voor zover het ambt niet erfelijk was, in een bepaalde familie, door loting of verkiezing aangewezen (in de hellenistische tijd kon het ambt ook gekocht worden!
255
Er zijn goede redenen om aan te nemen dat de auslautverhärtung besproken in §2 via lexicale diffusie tot stand gekomen is; zie Cor van Bree "Auslautverscherping bij de oude grammatici en in de dialecten en het Fries" in Bon jours Neef, ghoeden dagh Cozyn!
254
Op 24 november kwam er een akkoord: Jean-Luc Dehaene werd aangesteld als koninklijk opdrachthouder en gevraagd een oplossing te zoeken voor het probleem rond de kieskring Brussel-Halle-Vilvoorde in de schoot van de regeringspartijen, aangevuld met Groen!
254
Levenscyclus De lintwormeieren worden door de mond opgenomen door varkens en andere dieren en komen in de maag uit, waarbij een oncospheer vrijkomt die door de darmwand heen migreert en in spierweefsel of in andere organen van het varken (of van de mens!
254
Bij zijn uitvaart zei zijn broer Frans, ook priester, dat ze hem in familie en congregatie wel eens de raad gaven: "Doe wat rustig aan, doe van jouw kant ook eens wat water bij de wijn", waarop de bisschop dan antwoordde: "Maar dan is het geen wijn meer!
254
Amusant is dat Cornelis de Witt nog hun neef, de legerkapitein Jacob van Meeuwen, naar voren probeert te schuiven, maar dit wordt door Johan afgewezen: hun niet al te snuggere familielid acht hij volmaakt voor het leger geschikt maar niet voor de marine!
Appendix to nld wikipedia 2012: Longest sentences
176
254
Tot de eerste groep behoren mandatarissen, ook in Vlaamse partijen, die zich achter de ideeën van B-Plus scharen, zoals onder meer ( Freddy Willockx ( SP.a ), Herman De Croo ( VLD ), Mark Eyskens en ( Wilfried Martens ) ( CD&V ) en Ludo Dierickx ( Groen!
254
Als Rubben huiswaarts is gekeerd om voor zijn vrouw te zorgen, verwijt Gosen dat zijn echtgenote (Dwijf) Rubben wat op de mouw gespeld heeft en dat, net als de dochter, zijzelf ook geen maagd was bij de huwelijksnacht (si es doer haer boschkijn gejaecht!
253
Als lid van de oorspronkelijke kring van de ’80-dichters, die gegroepeerd waren rondom Poul Borum, redacteur van het tijdschrift Hvedekorn, organiseerde Jens Fink-Jensen in 1980 onder andere samen met collega-dichter Michael Strunge de manifestatie "NÅ!
253
Media Afleveringen :Zie: Lijst van afleveringen van The Dukes of Hazzard Films Er werden twee televisiefilms gemaakt welke direct aansloten op de serie en waarin dezelfde acteurs als in de serie de hoofdrollen vertolken: * The Dukes of Hazzard: Reunion!
Longest interrogative sentences Length
Sentence
255
Net als destijds bij de Ombudsman en de Konsumentenman konden de kijkers brieven insturen waarbij men dan thuis voor de camera de brief voorlas en begon met de woorden: "Geachte Vakantieman" en eindigde met de woorden "Wat vindt U hier nu van Vakantieman?
255
' ('Mijn God, mijn God, waarom hebt Gij mij verlaten'; Marcus 15:34) zouden geen letterlijke overname van psalmen 22:2 zijn, maar zijn terug te voeren op de woorden die werden gesproken bij de dood van Caesar: 'Men(e) servasse, ut essent qui me perderent?
255
Van belang is het denkmodel van de handeling, waarbij de handeling wordt uiteengerafeld in: * De persoon (het subject), met zijn zielsvermogens (rede, wil en gevoel) * De handeling (het object), onder bepaalde omstandigheden (wie, waar, hoe, bewust, vrij?
254
Het lukt hem om Gutrune aan Siegfried te koppelen, Siegfried en Gunther sluiten een bloedbroederschap, Brünnhilde wijst de smeekbede van Waltraute (evenals zijzelf een Walküre) om de ring aan de Rijn terug te geven verontwaardigd af ("bist Du von Sinnen?
254
Verder zijn er aanwijzingen dat bij obsessieve-compulsieve stoornissen of paniekstoornisen genetische componenten een rol spelen Collier (2002) FISH: flexible joints and panic: Are anxiety disorders really expressions of instability in the human genomen?
254
Op 11 juli daalden de koersen van Italiaanse en Spaanse staatsleningen zeer sterk, De marktcommentaren van dinsdagochtend 12 juli bevatten termen als "bloodbath again", "Cape Fear", "Spain and Italy succumbing to contagion", "The endgame looms into view?
254
Zijn roman Conjure Wife, waarin een man ontdekt dat zijn vrouw (en alle andere vrouwen) regelmatig magie gebruikt, werd driemaal verfilmd als Weird Woman (1944), Burn Witch, Burn (ook Night of the Eagle) (1962) en Witches' Brew (ook Which Witch is Which?
254
De oude Indiërs, meende Gonda, "hebben ons iets te zeggen": was op het subcontinent immers niet, ondanks de wetenschappelijk bloei, een cultuurscheiding achterwege gebleven zoals die in het Westen de twintigste-eeuwse cultuurhistorici tot wanhoop bracht?
253
Sonnet 2 Parafrasering :Wanneer veertig jaar jou tekenen, :En je gelaat doorploegd van rimpels is, :De trots van je jeugd, zoveel bewonderd nu, :Niets meer waard is dan een versleten gewaad: :Wat zeg je dan, als men je vraagt: "Waar is je schoonheid nu?
253
De goden zouden hun afkeur daarover trouwens hebben laten merken door rond het beeld een massa dollekervel te laten opschieten, een giftig kruid dat elders in de stad maar nauwelijks wilde groeien… Is dit allemaal roddel van gefrustreerde tegenstanders?
Appendix to nld web 2002: Longest sentences
177
Appendix to nld web 2002: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Helmut Schmidt bleef bondskanselier en Genscher (FDP) vice-kanselier en minister van buitenlandse zaken.Dgoldhahn (Diskussion) De Oost-Duitse cabaretier en tekstdichter Wolf Biermann (*1936) mocht op uitnodiging van de DGB de DDR verlaten voor een tournee in West-Duitsland.
255
Deze hebben met elkaar gemeen dat persoonlijke aandacht, zich in bepaalde situaties uit in o.a. blozen, zweten, trillen, bevriezen, dichtgesnoerde keel, slikproblemen, stokkende stem, stotteren of dichtklappen en dat het denken in alle gevallen blokkeert.
255
In Clerks, Mallrats, Chasing Amy en Dogma hadden Jay (Jason Mewes) en Silent Bob (Kevin Smith) het soms zwaar te verduren, maar altijd konden ze terugvallen op hun vaste stek, de Quick Stop convenience store in de oneindige strip mall die New Jersey heet.
255
Voor veel mensen is dat een bijna onmogelijke opgave zonder hulp van een eigen expert.” Is er van zowel de verzekeringsmaatschappij als van een onafhankelijk expert een rapport, dan moet de maatschappij over het algemeen weer schuld kunnen bewijzen.
255
Het zou misschien goed zijn dat de priesters, om hun spiritualiteit zuiver te houden, ertoe aangespoord zouden worden bij wijze van recollectie zich van tijd tot tijd heel meditatief in te leven in de oude ritus, inclusief de voorbereiding en dankzegging.
255
Volgens de 'Beschrijving in hoofdlijnen' mogen de aangegeven gronden uitsluitend worden gebruikt als verzorgingsplaats voor het gemotoriseerd verkeer annex verkooppunt voor motorbrandstoffen, smeermiddelen c.a. met inbegrip van bijbehorende overkappingen.
255
Met twee fraaie doelpunten, keurig verdeeld over beide helften, wist Thijs van de D. er nog wel voor te zorgen dat de hatelijke nul van het scorebord verdween, maar verder dat dit kwam Gassel C1, dat nog zoekende is naar de ideale opstelling, helaas niet.
255
Patrick : Bent u voor een volledige privatisering, en dus volledige invoering van de marktwerking in de zorg, waarbij mensen zich volledig zullen moeten verzekeren om geholpen te worden, waarbij het bijna zeker is dat de kwaliteit van de zorg zal stijgen.
255
SPIJKENISSE, NL - Sunday, December 22, 2002 at 19:11:28 (MET) Fijne feestdagen toegewenst voor vader en zoon, van de week een mooi jasje gekocht met 30% dat is mooi meegenomen en ben zeer tevreden over de service die hier verleend wordt, ga zo door heren.
255
Niet alleen het reguliere transport is voor VSW een dagelijkse bezigheid, maar ook het verzorgen van uitzonderlijke transporten zoals o.a. het North Sea Jazz Festival, International Piano Contests en het Songfestival staan op de referentie- lijst van VSW.
Longest exclamatory sentences Length
Sentence
255
Een uniek gelegen groepsaccommodatie, waar vriendelijkheid en gastvrijheid vanzelfsprekend zijn. http:/ / www. berghof. nlVillapark Makkumerstrand - Prachtige zandstranden, sfeervolle vissersplaatsjes, uitgestrekte natuurgebieden, vakantie vieren op z'n best!
255
De camping is gelegen aan de rand van het bos, nabij Ommen in het mooie Overijsselse Vechtdal. [1] Makkumerstrand -Prachtige zandstranden, sfeervolle vissersplaatsjes, uitgestrekte natuurgebieden, vakantie vieren op z'n best!
255
Na het doorlezen van dit hoofdstuk en dan met name als we rekening houden met alle gevaren en problemen van het abseilen, is het op zijn plaats nog een keer te herhalen: Abseilen is leuk en makkelijk, vaak zelfs noodzakelijk, maar zeker niet ongevaarlijk!
255
Als men niet weet dat een trojan op de PC is geinstalleerd, hem dus niet heeft verwijderd, blijft het altijd mogelijk dat derden op een later tijdstip alsnog de controle over uw computer overnemen om te gebruiken voor andere zaken, dan wel te beschadigen!
255
U krijgt dan een uitgebreide huisbeschrijving, een overzicht van de eigenschappen, land- en regioinformatie, een prijzentabel, de kosten ter plaatse en een mooie fotoreportage van het interieur, exterieur en de omgeving.Zonvakanties Voordelig naar de zon!
255
U krijgt dan een uitgebreide huisbeschrijving, een overzicht van de eigenschappen, land- en regioinformatie, een prijzentabel, de kosten ter plaatse en een mooie fotoreportage van het interieur, exterieur en de omgeving.Aanbiedingen Voordelig op vakantie!
255
Omdat Carlo het talent heeft om te groeien en om echt een formule 1 coureur te worden heeft hij begin dit jaar al wat aan mediatraining gedaan " Ik ken Engels,Duits Frans en een klein beetje Nederlands en doe heel soms wat aan media training" aldus Carlo!
Appendix to nld web 2002: Longest sentences
178
255
Wat hebben wij gelachen toen we daar aankwamen en gelukkig had niet al1 ik een camera bij me zodat ik wat foto's kon maken voor op deze beruchte voorpagina, maar bleken die 2 zelf ook de videocamera meegenomen te hebben en alles ligt dus ook op film vast!
255
Iemand in je bedrijf die dat dagelijks of zelfs per uur bijhoudt, dat staat goed tegenover de commissarissen en de bank, het mooiste bewijs voor millennium-proofness is toch als je een eigen site begint waarin je over de problemen bij anderen rapporteert!
255
Dat betekend dat de aarde niet veel ouder kan zijn dan 10.000 jaar, want anders had de aarde een magnetisch veld gehad dat even sterk was als dat van een "magnetische ster", en was de aarde uit elkaar gebarst onder invloed van zijn eigen magnetische veld!
Longest interrogative sentences Length
Sentence
255
Ligt hieraan de verwachting ten grondslag dat veel uitkeringsgerechtigden zich eerst op de arbeidsmarkt zullen begeven als werk voor hen meer lonend wordt en dat werkgevers bereid zijn meer voor deze werknemers te betalen dan onder het regime van de SPAK?
255
Er is natuurlijk niets mis met het woord 'strelen', maar hoe voorkom je met een dynamisch filter en een woordenboek dat er een tekst als: 'hij vond het heerlijk om kleine meisjes te strelen en prefereerde daarbij de geheime delen', op de krant verschijnt?
255
Want als je wilt dat de mensen die het aanbod moeten aanleveren, het nieuwe medium leren kennen, is het voor de hand liggend om te zeggen: we hebben Willem Wever, dat is een televisieprogramma, hoe gaan we dat vertalen naar een werkend concept op het web?
255
Willem van der Paard: Het is te vroeg om op deze vraag een stellig antwoord te kunnen geven: wat is het vervolg op de Vijfde nota R.O., wat gebeurt er met het besturen van de grootstedelijke agglomeraties, krijgt de provincie er taken en bevoegdheden bij?
255
Smit (LA) inzake leegstand kantoorgebouwen in Amersfoort 1. Heeft het college van B en W kennis genomen van de publicaties over de oplopende leegstand bij pas opgeleverde of op stapel staande kantoorgebouwen in Amersfoort die intussen 73 procent bedraagt?
255
Het model heeft wat van een bijenkorf en echt mooi rond is hij niet, als enige versiering zitten er 3 touwranden op, 2 aan de bovenste rand en 1 boven de slagrand geen bijzondere schoonheid dus, maar wat maakt deze kleine onooglijke klok dan zo bijzonder?
255
Is dan het ene punt van de vraag of we nu wat de zaterdagnacht betreft de instaptijd op uiterlijk 03.00 uur moeten bepalen en er overal om 04.00 uur moet worden gesloten, zo bepalend om te kunnen spreken over het wel of niet gelukt zijn van Twents beleid?
255
Om de informatie die wij sturen (indien u heeft aangegeven informatie te willen ontvangen) nog beter af te kunnen stemmen op uw situatie, verzoeken wij u onderstaande vragen ook te beantwoorden: Indien u een bloedglucosemeter gebruikt, welke meter is dit?
255
From: Leontine Waleboer (
[email protected]) Hoi Daan, Is het ook mogelijk om die persoon van Gewest tot Gewest via E-mail te bombarderen met RH-aanvragen, zodat de kans groter wordt dat ze de RH-fragmenten ook daadwerkelijk gaan uitzenden met Kerst?
255
Is het u bekend dat mevrouw ML Tiesinga, voorzitter van de begeleidingscommissie in de media zegt dat het feit dat verarmd uranium is vrijgekomen niet hoeft te betekenen dat mensen daarmee besmet zijn geraakt en dat zij nu juist bezig zijn te onderzoeken?
Quellennachweise [1] http:/ / www. kleinewolf. nlVillapark
Appendix to nld web 2011: Longest sentences
179
Appendix to nld web 2011: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Je komt dan op een pagina terecht waar je een titel voor je feedback kan ingeven (standaard is de titel “Snelle feedback”), je feedback zelf kan aanpassen, het icoon dat bij de feedback hoort kan aanpassen en een bijlage aan je feedbackitem kan toevoegen.
255
Hoewel er van alles over hooggevoelige kinderen gezegd kan worden, is het onmogelijk het karakter van zo’n kind precies te beschrijven, aangezien alle kinderen als gevolg van erfelijke aanleg en de opvoeding thuis en op school immers anders en uniek zijn.
255
Geboorte Synergiebrood Tijdens het schrijven van mijn tweede boek ‘Gezond eten, makkelijker dan je denkt’ heb ik mij volledig verdiept in wat voeding met je lichaam doet en de ontegensprekelijke invloed ervan op je gedrag, je fit voelen én je slanke lijn.
255
Diletto Design is in dat geval – ongeacht de oorzaak van het niet totstandkomen van de Koopovereenkomst – niet gehouden het product of een vergelijkbaar product aan koper te leveren, noch is Diletto Design in dat geval tot enige schadevergoeding gehouden.
255
Sponsoring van een totaalpakket van ondersteuning en daadwerkelijke inzet van een bij de Stichting E·S·I·E·A ® Foundation ingeschreven specifieke E·S·I·E·A- expert voor een projectinzet buiten Europa voor maximaal 4 weken kan binnen het World Wide pakket.
255
Daarbij wordt onder andere gebruik gemaakt van de door ViaZorg ontwikkelde en beheerde vacaturesite www.zz.nl. Verder bieden wij een breed scala aan diensten op het gebied van vraag en aanbod, loopbaan en reïntegratie, casemanagement en P&O-ondersteuning.
255
Lees het allemaal in de nieuwste nieuwsbriefvan Emigratieboek.nl Lees het artikel over een gehandicapte Zweedse sportman die enkele weken geleden meedeed aan een wedstrijd waarbij hij de de baai van San Francisco overzwom van Alcatraz naar het vaste land.
255
De VVAB heeft bezwaar aangetekend bij de Raad van State tegen het bestemmingsplan BG-terrein e.o. Het bezwaar wordt ondersteund door het Koninklijk Oudheidkundige Genootschap, het Genootschap Amstelodamum, het Cuypers Genootschap en de Stichting Diogenes.
255
Echter liep er nu een enorme mooie straat richting het zuiden die ervoor zorgde dat ik zo weer 35km ten zuiden van Venlo zat. Helaas hield de straat het toen een beetje voor gezien dus draaide ik me om weer onder dezelde straat door te vliegen naar Horst.
255
Zenuwziektes, bleekzucht, verkoudheden met hoest en slijmafscheiding, astma, verteringsklachten met windzucht en krampen, neusverkoudheid, hooikoorts, ontstekingen van mondslijmvlies, tandvleesbloedingen worden bestreden met een mixtuur met marjoleinthee.
Longest exclamatory sentences Length
Sentence
255
Het zijn 2 prachtige meisjes, Lavender mag lekker van haar "pensioen" genieten op 9-jarige leeftijd nog zwanger worden is niet niks, en misschien dat ik met Blossom in de toekomst nog eens een nestje doe, dan zoek ik echter wel een HB kater voor haar uit!
255
En er spookten een boel gedachten door mijn hoofd: een kennis, een versvleesklantje die nijpend zat met zijn voorraad voer, maar vooral: shit, de buren klagen over het wolvengehuil van Beau die voor de tweede morgen om een uur of 6/7 daarmee begonnen was!
255
Bestuurders die eerder deelnamen aan deze intervisie waren enthousiast over de toegevoegde waarde van deze vorm van interactie en contact met collega- bestuurders; "In relatief weinig tijd veel van elkaar leren en concrete vraagstukken bespreekbaar maken!
255
Dus ben jij een enthousiaste elektromonteur die alleen genoegen neemt met het afleveren van de hoogste kwaliteit en graag zichzelf nog verder wil ontwikkelen, dan ben jij misschien wel de nieuwe collega die wij graag aan ons team toe zouden willen voegen!
255
1-02-2009 toepassing waterstofperoxyde positief 1-05-2009 vernieuwing belichting F-red 1-07-2009 lichtniveau passion van 8000 lux naar 12000 lux 15-11-2010 hergebruik proceswater 25-03-2011 Nieuw sponsor contract Economische resessie Valentijn komt eraan!
255
De winnaar ontvangt een prijzenpakket bestaande uit het boek Getekend door een academisch leven, een halve eeuw Kees Willemen, inclusief de film 'De woede van Willemen' van filmmaker Remy Vlek, en een originele tekening van de hand van Kees Willemen zelf!
255
Home Nieuws Agenda Biografie Erelijst Anky's paarden Sponsors Goede doelen Contact Overzicht Laatste nieuws 25-10 Anky en Sjef momenteel in New York 25-10 Uitzending gemist: Anky in Studio Sport deel 2 24-10 Leerlingen presteren geweldig door heel Europa!
Appendix to nld web 2011: Longest sentences
180
255
Winkelautomatisering RetailIntelligence met QlikView Webshop / E-commerce Financiele administratie Verhuur pinautomaten Maatwerk Hardware Kassasysteem Consultant Business Intelligence Vanaf heden hebben wij een gloednieuwe website speciaal voor FlexeSHOP!
255
Heerlijke tent, elke week na uitgaan nog even lekker een frietje nemen bij de Piramide, gister nog een uur lopen praten, beschuit met muisjes (nogmaals gefeliciteerd:D) Echt een aanrader voor een heerlijk eetcafeetje met gezellig personeel en lekker eten!
255
Voorbeelden hiervan zijn: Bartinfo van Bartele I, feb 2011, en Bartinfo van Bartele 2. Juli 2011: Eind juli zal een flinke onderhoudsbeurt plaatsvinden met tevens een paar wijzigingen van de ruimteindeling zodat een beter overzicht op de groepen ontstaat!
Longest interrogative sentences Length
Sentence
255
Als ICT-dienstverlener hopen we ook uiteraard met onze diensten de branche te ondersteunen. meer over onze activiteiten in de kinderopvangbranche 2010-10-26 - Verzekeringsbranchedag 2010 - Hoe ziet het (virtuele) verzekeringskantoor van de toekomst eruit?
255
Boek nu bij VVV Kop van Noord-Holland en VVV Wieringen, tel.: (0227) 59 2220 of
[email protected] www.wadvissersgilde.nl In de zomermaanden juli en augustus & de herfstvakantie kan er kan elke dag worden geboekt op Wilt u specifiek met mij meevaren?
255
Er zijn altijd dingen waar hij van geniet,ruiken aan dingen en raden wat het is,proefjes doen met water,vliegen met een gans en van boven de aarde zien en er zijn dingen waar hij erg bang van word,opgezette dieren,hij roept dan meteen: "deze zijn dood,he?
255
En welk pasgetrouwd stel vindt het niet leuk om als huwelijkscadeau een handbeschilderd, persoonlijk servies te ontvangen, bijvoorbeeld in de stijl van Amsterdam Blond, PIP, of juist klassiek of met bloemen of naar aanleiding van de huwelijksaankondiging?
255
Overijssel, LED-proeftuin Handhavingsmonitor verkeer '08 Enkelvoudige fietsongevallen Milieuvriendelijk verkeermanagement Fietsgebruik slim stimuleren Brabant pioniert met parkeren Subjectieve verkeersveiligheid Realisatie door Liones Andere uitgaven van?
255
” Zondag 19 oktober 2008 om 16:24 de boer uit wergea heeft het volgende geschreven: “wat zijn de kosten van de kaarten van mooi wark ” Maandag 13 oktober 2008 om 17:44 Lady uit Grou heeft het volgende geschreven: “Waar staan de letters RBJ eigenlijk voor?
255
Natuurgeneeskundige therapie arnhem- Massage arnhem- Alternatieve therapie Arnhem- Zingeving arnhem- Bewustwording arnhem Door niet te verlangen Waarvan ze droomt - Stef Bos Voel je ook weleens de behoefte om met aandacht bij jezelf naar binnen te kijken?
255
Acusti-LED zorgt voor een esthetische, sfeervolle verbetering van het akoestisch klimaat in grote open ruimten als kantoren, entrees, vergaderruimten etc. Bent u benieuwd naar de innovatieve producten van Merford en wilt u dit evenement zeker niet missen?
255
Vacatures Medewerker postregistratie in Noord-Holland (boven het Noordzeekanaal) Medewerker postregistratie in Noord-Holland (boven het Noordzeekanaal) Recordbeheerder in Amsterdam Archiefmedewerker in Friesland Alle vacatures Actuele vacatures ontvangen?
255
Terug naar manifestaties en congressen Manifestatie 2005 armoede, empowerment, inclusie, kunst, mvo, multiculturalisme, onderzoek, uitsluiting, stigma Manifestatie Kwartiermaken met Kunst en Debat 2005 Aankondiging vier Symposia 1. Ben ik (goed) in beeld?
Appendix to nld mixed 2012: Longest sentences
181
Appendix to nld mixed 2012: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Constantijn verbood zondagsarbeid » Constantijn verbood zondagsarbeid Constantijn verbood zondagsarbeid „Zij die leefden onder een oude toestand zijn tot nieuwe verwachting gekomen en houden daarom de sabbat niet meer maar nemen de dag des Heeren in acht.
255
Je komt dan op een pagina terecht waar je een titel voor je feedback kan ingeven (standaard is de titel “Snelle feedback”), je feedback zelf kan aanpassen, het icoon dat bij de feedback hoort kan aanpassen en een bijlage aan je feedbackitem kan toevoegen.
255
Hoewel er van alles over hooggevoelige kinderen gezegd kan worden, is het onmogelijk het karakter van zo’n kind precies te beschrijven, aangezien alle kinderen als gevolg van erfelijke aanleg en de opvoeding thuis en op school immers anders en uniek zijn.
255
Geboorte Synergiebrood Tijdens het schrijven van mijn tweede boek ‘Gezond eten, makkelijker dan je denkt’ heb ik mij volledig verdiept in wat voeding met je lichaam doet en de ontegensprekelijke invloed ervan op je gedrag, je fit voelen én je slanke lijn.
255
» Zuid–Koreaan nieuwe VN–chef NEW YORK (ANP/DPA) – De VN–Veiligheidsraad heeft maandag de 62–jarige Zuid–Koreaan Ban Ki Moon aanbevolen als opvolger van de huidige secretaris–generaal van de Verenigde Naties, Kofi Annan, wiens mandaat 31 december afloopt.
255
Diletto Design is in dat geval – ongeacht de oorzaak van het niet totstandkomen van de Koopovereenkomst – niet gehouden het product of een vergelijkbaar product aan koper te leveren, noch is Diletto Design in dat geval tot enige schadevergoeding gehouden.
255
V-raad voert druk op Israël op » V-raad voert druk op Israël op V-raad voert druk op Israël op NEW YORK – De druk op Israël om serieus werk te maken van onderzoek naar mogelijke oorlogsmisdaden van militairen tijdens de Gazaoorlog neemt steeds verder toe.
255
Sponsoring van een totaalpakket van ondersteuning en daadwerkelijke inzet van een bij de Stichting E·S·I·E·A ® Foundation ingeschreven specifieke E·S·I·E·A- expert voor een projectinzet buiten Europa voor maximaal 4 weken kan binnen het World Wide pakket.
255
Nederlandsche kolonisatie in Europa * Hans Venatier, Baljuw Bartold, de groote trek naar het oosten (minstens vijf herdrukken) Boek over de kolonisatie van germaanse (lees: Duitse Nederlandse en Vlaamse) kolonisten in oost europa tijdens de middeleeuwen.
255
Helmut Schmidt bleef bondskanselier en Genscher (FDP) vice-kanselier en minister van buitenlandse zaken.Dgoldhahn (Diskussion) De Oost-Duitse cabaretier en tekstdichter Wolf Biermann (*1936) mocht op uitnodiging van de DGB de DDR verlaten voor een tournee in West-Duitsland.
Longest exclamatory sentences Length
Sentence
255
Het zijn 2 prachtige meisjes, Lavender mag lekker van haar "pensioen" genieten op 9-jarige leeftijd nog zwanger worden is niet niks, en misschien dat ik met Blossom in de toekomst nog eens een nestje doe, dan zoek ik echter wel een HB kater voor haar uit!
255
En er spookten een boel gedachten door mijn hoofd: een kennis, een versvleesklantje die nijpend zat met zijn voorraad voer, maar vooral: shit, de buren klagen over het wolvengehuil van Beau die voor de tweede morgen om een uur of 6/7 daarmee begonnen was!
255
Bestuurders die eerder deelnamen aan deze intervisie waren enthousiast over de toegevoegde waarde van deze vorm van interactie en contact met collega- bestuurders; "In relatief weinig tijd veel van elkaar leren en concrete vraagstukken bespreekbaar maken!
255
Een uniek gelegen groepsaccommodatie, waar vriendelijkheid en gastvrijheid vanzelfsprekend zijn. http:/ / www. berghof. nlVillapark Makkumerstrand - Prachtige zandstranden, sfeervolle vissersplaatsjes, uitgestrekte natuurgebieden, vakantie vieren op z'n best!
255
Als specialist in zonwering, rolluiken en screens adviseren wij u graag over de beste oplossing voor zonwering binnen en buiten en verkopen wij u graag producten die zonder uitzondering montagevriendelijk, onderhouds-arm en kwalitatief onovertroffen zijn!
255
Nu raak je toch supergefrustreerd als aangever en denk je meteen: Volgende keer "corrigeer" ik het zelf wel of je denkt "dit meld ik dus nooit meer" en allebei vind ik slecht.Nederland aggressief? dat komt dan door dit soort laffe reacties van de politie!
255
En niet van tevoren aankondigen dat ze komen nee zo er naar toe en streng controleren,het gaat om etens waren en daar verdienen ze aan,en een paar uur geen koeling of vloer schoonmaken komen heus geen muisen of maden op.Dan is het al een tijdje versmeerd!
Appendix to nld mixed 2012: Longest sentences
182
255
In een ontwikkelingsland worden de mensen nog beter behandeld in eenziekenhuis dan bij ons in Nerdland, want daar zitten de beste artsen welke door ons uitgezonden wordt(dito verpleging)Graag de ziekenfondspremie halveren gezien bovenstaande feiten graag!
255
Dus ben jij een enthousiaste elektromonteur die alleen genoegen neemt met het afleveren van de hoogste kwaliteit en graag zichzelf nog verder wil ontwikkelen, dan ben jij misschien wel de nieuwe collega die wij graag aan ons team toe zouden willen voegen!
255
De camping is gelegen aan de rand van het bos, nabij Ommen in het mooie Overijsselse Vechtdal. [1] Makkumerstrand -Prachtige zandstranden, sfeervolle vissersplaatsjes, uitgestrekte natuurgebieden, vakantie vieren op z'n best!
Longest interrogative sentences Length
Sentence
255
Ligt hieraan de verwachting ten grondslag dat veel uitkeringsgerechtigden zich eerst op de arbeidsmarkt zullen begeven als werk voor hen meer lonend wordt en dat werkgevers bereid zijn meer voor deze werknemers te betalen dan onder het regime van de SPAK?
255
Als ICT-dienstverlener hopen we ook uiteraard met onze diensten de branche te ondersteunen. meer over onze activiteiten in de kinderopvangbranche 2010-10-26 - Verzekeringsbranchedag 2010 - Hoe ziet het (virtuele) verzekeringskantoor van de toekomst eruit?
255
Vis staat klaar op CSY-terminal IJmuiden Vervoerders en verladers ‘daten’ in Parijs Kantoor Binnenvaart wordt BinnenvaartUnie Groei binnenvaart naar beneden bijgesteld 'Sinds de maatregel is verschenen hoor ik hier reacties als: "Zijn ze nou helemaal gek?
255
Er is natuurlijk niets mis met het woord 'strelen', maar hoe voorkom je met een dynamisch filter en een woordenboek dat er een tekst als: 'hij vond het heerlijk om kleine meisjes te strelen en prefereerde daarbij de geheime delen', op de krant verschijnt?
255
En welke toerist gaat naar een land als Kameroen als er nauwelijks wegen zijn, de elektriciteit onbetrouwbaar is, je niet naar een goede arts kunt als je ziek wordt, het risico overvallen te worden levensgroot is en je op het vliegveld al opgelicht wordt?
255
Boek nu bij VVV Kop van Noord-Holland en VVV Wieringen, tel.: (0227) 59 2220 of
[email protected] www.wadvissersgilde.nl In de zomermaanden juli en augustus & de herfstvakantie kan er kan elke dag worden geboekt op Wilt u specifiek met mij meevaren?
255
Want als je wilt dat de mensen die het aanbod moeten aanleveren, het nieuwe medium leren kennen, is het voor de hand liggend om te zeggen: we hebben Willem Wever, dat is een televisieprogramma, hoe gaan we dat vertalen naar een werkend concept op het web?
255
Er zijn altijd dingen waar hij van geniet,ruiken aan dingen en raden wat het is,proefjes doen met water,vliegen met een gans en van boven de aarde zien en er zijn dingen waar hij erg bang van word,opgezette dieren,hij roept dan meteen: "deze zijn dood,he?
255
En welk pasgetrouwd stel vindt het niet leuk om als huwelijkscadeau een handbeschilderd, persoonlijk servies te ontvangen, bijvoorbeeld in de stijl van Amsterdam Blond, PIP, of juist klassiek of met bloemen of naar aanleiding van de huwelijksaankondiging?
255
De site wordt continu ververst: met blogs, tweets, filmpjes van optredens van lijsttrekker Job Cohen en videoreacties van PvdA’ers op vragen van potentiële kiezers (‘Wat betekent “Iedereen telt mee” concreet voor homoseksuelen, lesbiennes en transgenders?
Appendix to nld news 2007: Length of sentences in characters
Appendix to nld news 2007: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 99.2138
Standard deviation 47.1084
183
Appendix to nld news 2008: Length of sentences in characters
Appendix to nld news 2008: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 96.3545
Standard deviation 47.1459
184
Appendix to nld news 2009: Length of sentences in characters
Appendix to nld news 2009: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 93.8569
Standard deviation 47.2083
185
Appendix to nld news 2010: Length of sentences in characters
Appendix to nld news 2010: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 92.6259
Standard deviation 47.0286
186
Appendix to nld news 2011: Length of sentences in characters
Appendix to nld news 2011: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 92.8886
Standard deviation 48.3876
187
Appendix to nld newscrawl 2011: Length of sentences in characters
Appendix to nld newscrawl 2011: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 98.3805
Standard deviation 49.7592
188
Appendix to nld wikipedia 2007: Length of sentences in characters
Appendix to nld wikipedia 2007: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 102.8943
Standard deviation 46.6972
189
Appendix to nld wikipedia 2012: Length of sentences in characters
Appendix to nld wikipedia 2012: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 105.9420
Standard deviation 46.5491
190
Appendix to nld web 2002: Length of sentences in characters
Appendix to nld web 2002: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 96.8341
Standard deviation 49.0154
191
Appendix to nld web 2011: Length of sentences in characters
Appendix to nld web 2011: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 96.1822
Standard deviation 47.5492
192
Appendix to nld mixed 2012: Length of sentences in characters
Appendix to nld mixed 2012: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 97.3102
Standard deviation 48.0263
193
Appendix to nld news 2007: Length of sentences in words
Appendix to nld news 2007: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.7495
Standard deviation 7.3300
194
Appendix to nld news 2008: Length of sentences in words
Appendix to nld news 2008: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.5699
Standard deviation 7.4395
195
Appendix to nld news 2009: Length of sentences in words
Appendix to nld news 2009: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.2928
Standard deviation 7.4881
196
Appendix to nld news 2010: Length of sentences in words
Appendix to nld news 2010: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.1863
Standard deviation 7.5036
197
Appendix to nld news 2011: Length of sentences in words
Appendix to nld news 2011: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.5007
Standard deviation 7.9418
198
Appendix to nld newscrawl 2011: Length of sentences in words
Appendix to nld newscrawl 2011: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.9834
Standard deviation 7.8436
199
Appendix to nld wikipedia 2007: Length of sentences in words
Appendix to nld wikipedia 2007: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 16.1989
Standard deviation 7.3779
200
Appendix to nld wikipedia 2012: Length of sentences in words
Appendix to nld wikipedia 2012: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 16.7682
Standard deviation 7.3814
201
Appendix to nld web 2002: Length of sentences in words
Appendix to nld web 2002: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.3592
Standard deviation 7.6594
202
Appendix to nld web 2011: Length of sentences in words
Appendix to nld web 2011: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.4513
Standard deviation 7.4592
203
Appendix to nld mixed 2012: Length of sentences in words
Appendix to nld mixed 2012: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.5832
Standard deviation 7.5414
204
205
Oddities details Appendix to nld news 2007: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
63
2
http://www.een.be/televisie1_master/home/e_homepage/index.shtml
60
4
Kindercarnavalsoptochtvoorbereidingswerkzaamhedencomitéleden
53
2
onrecht–honger–haat–en–geweld
47
2
http://www.ecrypt.eu.org/stream/phorum/read.php
45
2
http://noorderlicht.vpro.nl/dossiers/34750150
45
2
www.pauljansen.eu/materiaal/iDNA-Manifest.pdf
42
2
httpwww.cnvinternationaal.nl/wereldvrouwen
42
2
incassobureau/advocatenkantoor/deurwaarder
41
2
Weert-Roermond-Sittard/Heerlen-Maastricht
41
2
assistent–secretaris–generaal
Appendix to nld news 2008: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
50
2
ik-ben-zwanger-en-daar-heb-ik-nu-even-geen-zin-in-
48
2
Apple-kritiekloze-kauwgomkauwende-mega-consument
46
2
Rotterdam.’’PvdA-fractievoorzitter
46
2
www.weljongniethetero.be/dagvandejeugdbeweging
42
10
urn:schemas-microsoft-com:office:smarttags
41
2
buggy/incompatable/intrusieve/draconische
40
2
het-ontnemen-van-de-voorrang-bij-stoppen
40
2
https://fc-utrecht.voetbalticket-shop.nl
40
2
Macht/Beluste/Overste/Generaal/Than/Shwe
39
2
Sint-Michiels-en-Sint-Goedelekathedraal
Appendix to nld news 2009: Longest words
206
Appendix to nld news 2009: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
49
2
Nederlanders-die-denken-geen-identiteit-te-hebben
46
2
www.ontdekislam.nl/forum/viewtopic.php?t=43630
46
2
Amsterdam-Schiphol-Rotterdam-Antwerpen-Brussel
45
2
www.checkit.nl/bestpracticesinonlineretailing
45
4
Chargoggagoggmanchauggagoggchaubunagungamaugg
43
2
Jachtlaan/Amersfoortseweg/Loolaan/Zwolseweg
40
2
www.asielenrijnmond.dierenbescherming.nl
39
2
www.bureauinternationalesamenwerking.nl
39
2
Sint-Michiels-en-Sint-Goedelekathedraal
38
3
[email protected]
Appendix to nld news 2010: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
63
2
leasemiddenklasserzonderwinterbandenmaarmetusbenipodaansluiting
51
2
eenderde-strafvermindering-bij-goed-gedrag-regeling
43
2
Rotterdam-Dordrecht-Breda-Tilburg-Eindhoven
42
2
vrouw/maitresse/fractiemedewerker/whatever
42
3
islamitische/socialistische/communistische
40
2
6.1.7601.16537.amd64fre.win7.100327-0053
40
2
www.noordhollandsplattelandsparlement.nl
40
2
Naomi-van-Asch-en-haar-twee-klonen-topic
40
4
Eenoudervakantiegids.nl/Eenoudervakantie
39
2
www.bureauinternationalesamenwerking.nl
Appendix to nld news 2011: Longest words
207
Appendix to nld news 2011: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
62
2
Trraaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaag
52
2
zielige-Palestijnen-die-door-de-Joden-zijn-verdreven
51
2
filosofie,kunstgeschiedenis,geschiedenis,sociologie
42
2
boxerzwembroekuitvoeringofhoejedatooknoemt
41
2
burkapvvwildersnikabjodenmoslimsdraaikont
41
2
hondtdierenmishandelingoloherderketshondt
40
2
gladder-dan-een-aal-in-een-emmer-snot-De
40
2
GemistTeletekstTelevisieRadioSportNieuws
40
2
winterwortelwortelpeterselieuienstamppot
39
2
www.huiselijkgeweldnoordhollandnoord.nl
Appendix to nld newscrawl 2011: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
65
2
Staten,Engeland,Ierland,Schotland,Belgie,Frankrijk,Portugal,Polen
58
2
ik-doe-nerveus-met-mijn-pen-zodat-ik-intellectueel-overkom
51
3
een-“surinamer”-moet-niet-onderdoen-voor-een-“bakra
50
2
hahahahahahahahahahahahahahahahahhahahhahahahahaha
47
2
politici-die-door-buitenaardsen-ontvoerd-worden
46
2
schilder-beeldhouwer-architect-anatoom-musicus
41
2
blooooooooooooooooooooooooooooooooooowing
39
2
duurzame-ontwikkelingseffectbeoordeling
39
2
kandidaat-ChristenUnievertegenwoordiger
39
2
nutriëntenemissierechten-mestverwerking
Appendix to nld wikipedia 2007: Longest words
208
Appendix to nld wikipedia 2007: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
75
2
Hendrik-Ido-Oostendam-Schildmanskinderen-Groot-en-Klein-Sandelingen-Ambacht
58
6
Llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch
56
2
Onze-Lieve-Vrouw-van-La-Trappe-van-de-Heilige-Benedictus
45
5
Saint-Remy-en-Bouzemont-Saint-Genest-et-Isson
45
2
Chargoggagoggmanchauggagoggchaubunagungamaugg
44
3
Saint-Germain-de-Tallevende-la-Lande-Vaumont
44
170
Image:{{{regioAfk}}}-Mappa.png|300px|Locatie
43
3
Beaujeu-Saint-Vallier-Pierrejux-et-Quitteur
43
2
Diffie-Hellman-sleuteluitwisselingsprotocol
43
2
http://www.prachtbanden.nl/boeken/detail/86
Appendix to nld wikipedia 2012: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
74
3
http://www.hoogstraten.be/Waar-komt-de-plaatsnaam-vandaan-(Toponymie).html
68
5
geiten-bokken-poots-opper-en-onder-generaal-krijgscommandeersergeant
47
3
http://www.heenvliet.nieuwesluis.nl/Binder8.pdf
45
4
Saint-Remy-en-Bouzemont-Saint-Genest-et-Isson
45
2
Eindhoven-Veghel/Uden-Arnhem-Apeldoorn-Zwolle
44
4
Saint-Germain-de-Tallevende-la-Lande-Vaumont
43
4
Beaujeu-Saint-Vallier-Pierrejux-et-Quitteur
43
4
Diffie-Hellman-sleuteluitwisselingsprotocol
43
2
horden-kogel-hoog-200m-ver-speerwerpen-800m
42
2
Oneindige-onwaarschijnlijkheidsaandrijving
Appendix to nld web 2002: Longest words
209
Appendix to nld web 2002: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
107
2
kantoorvakhandel,kantoorapparatuur,kantoorartikelen,kantoor,kantoormachines,kantooromgeving,kantoorsupplies
96
18
garage,garages,betongarage,garagebouw,mavogarage,garagebox,garageboxen,berging,bergingen,aanbouw
86
2
http://www.ol2000.nl/download/handboek%20I%20Van%20vraagpatroon%20naar%20loketidee.pdf
84
6
garage,garages,garagebouw,mavogarage,garagebox,garageboxen,berging,bergingen,aanbouw
78
2
http://www.ol2000.nl/download/handboek%20Een%20loket%20op%20het%20internet.pdf
71
2
ik-wil-perse-niet-aantrekkelijk-gevonden-worden-want-ik-ben-intelligent
70
2
http://www.frg.eur.nl/channel/www.frg.eur.nl/sys/properties/index.html
70
2
Lijsten,passepartouts,glas,plexiglas,opplakken,lamineren,ophangsysteem
68
2
http://www1.wapforum.org/tech/documents/WAP-192-WBXML-20000306-a.pdf
67
2
Personeelsfeest,Verjaardag,Bruiloft,Productpresentatie,Seniorenreis
Appendix to nld web 2011: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
118
3
Home-Introductie-DeDames-DeHeren-Catstraten-Planning-Nazaten-Outcross-Polydactylie-Links-Coonkleuren-Kattenkunst-Email
113
2
HomeKettingenArmbandenOorbellenHorloge'sSetjesHerensieradenKindersieradentashangersMobielhangersBoekleggersStrass
105
2
Home-Introductie-DeDames-DeHeren-Catstraten-Planning-Nazaten-Outcross-Links-Coonkleuren-Kattenkunst-Email
101
2
HomeBiografieNieuwswereldkampioenschapUitslagendansleraar/leraresAgendaLinksFotoboekGastenboekContact
96
4
wijBehandelingenTarievenWorkshopsNIEUWSCadeaubonnenGeschenken/GiftsLINKPARTNERSGastenboekContact
94
4
HomeMeisjesPrijzenReserveringenContactServicesMembersVacatureskadobonnenGastenboekLinksSexshop
93
3
HomeNieuwsServiceSchilderenGlaszettenTimmerwerkContactOrganisatieGeschiedenisVacaturesklanten
89
2
HomeNieuwsPuppysTeefjesReutjesFotogalerieStamboomKarakterVerzorgingLinksGastenboekContact
88
3
herderVegasB-nestE-nestH-nestI-nestJ-nestL-nestM-nestFoto'svoedingLinksGastenboekContact
88
2
infoZomercompetitiedressuurSpringentinker-derbyAanmeldendressuurproevenGastenboekContact
Appendix to nld mixed 2012: Longest words
210
Appendix to nld mixed 2012: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
118
3
Home-Introductie-DeDames-DeHeren-Catstraten-Planning-Nazaten-Outcross-Polydactylie-Links-Coonkleuren-Kattenkunst-Email
113
2
HomeKettingenArmbandenOorbellenHorloge'sSetjesHerensieradenKindersieradentashangersMobielhangersBoekleggersStrass
107
2
kantoorvakhandel,kantoorapparatuur,kantoorartikelen,kantoor,kantoormachines,kantooromgeving,kantoorsupplies
105
2
Home-Introductie-DeDames-DeHeren-Catstraten-Planning-Nazaten-Outcross-Links-Coonkleuren-Kattenkunst-Email
101
2
HomeBiografieNieuwswereldkampioenschapUitslagendansleraar/leraresAgendaLinksFotoboekGastenboekContact
96
4
wijBehandelingenTarievenWorkshopsNIEUWSCadeaubonnenGeschenken/GiftsLINKPARTNERSGastenboekContact
96
18
garage,garages,betongarage,garagebouw,mavogarage,garagebox,garageboxen,berging,bergingen,aanbouw
94
4
HomeMeisjesPrijzenReserveringenContactServicesMembersVacatureskadobonnenGastenboekLinksSexshop
93
3
HomeNieuwsServiceSchilderenGlaszettenTimmerwerkContactOrganisatieGeschiedenisVacaturesklanten
89
2
HomeNieuwsPuppysTeefjesReutjesFotogalerieStamboomKarakterVerzorgingLinksGastenboekContact
Appendix to nld news 2007: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
28.0000
Volgens de [url=http://tweakers.net/nieuws/35583/opta-geen-toegang-tot-upc-netwerk-voor-kpn.html]OPTA[/url niet.
20.2500
Kindercarnavalsoptochtvoorbereidingswerkzaamhedencomitéleden telt zestig letters.
20.2500
Nijmegen=Links=naief=niet reeel=wereldvreemd=goedbedoelend=slecht voor Nederland.
19.1429
Het rapport kan worden gedownload op httpwww.globalreporting.org/Services/ResearchLibrary/GRIPublications/GRIPublications.htm#supPubs.
18.5000
Met je kijk-mij-op-m'n-zoveelvijftigste-nog-eens-hip-en-jong-zijn t-shirt.
18.4000
Een landgenoot koos voor thisisthelongesteuropeandomainnameallovertheworldandnowitismine.eu.
18.3333
Een soort brandende-braambossende-one-woman-armageddon.
18.0000
Voor meer informatie: www.opus1.com/www/whitepapers/antispamfeb2007.pdf.
17.6000
Die gast is gestoord.'); r('4037640','nieuws','82528','11019','Boris-The-Blade',,'FOK!
17.6000
Pfff, neem eens de tijd voor dingen, generatie Ik-ben-geboren-op-het-internet-en-kan-niet-langer-dan-2 minuten-naar-iets-kijken-omdat-ik-heel-de-dag-nog-moet-surfen-enchatten.'
17.2500
Nu ook gewoon via software te cracken;) http://www.engadget.com/2007/08/24/iphone-unlocked-atandt-loses-iphone-exclusivity-august-24-2007/
17.1000
Spoorassen die prioriteit krijgen zijn Berlijn-Milaan-Napels-Palermo, Parijs-Lyon-Turijn-Ljubljana-Boedapest, Parijs-Madrid-Lissabon en Parijs-Straatsburg-Stuttgart-Wenen.
17.0000
Voor het uitgebreide programma:www.jeugdtheaterhofplein.nl/peuter06.
Appendix to nld news 2007: Sentences with high average word length
16.9167
De volledige loting: Zwammerdam-Moordrecht/UNIO, ESTO-Alkmania, Sportlust’46-Alphia, GSV-Linschoten, NSV’46/Koudekerk-WSE/Gouda (za),Floreant (za)-Alphen/Woerden,Jodan Boys-Alphense Boys/Haz.
16.8571
Rukken in een stadsbus is zooooo vrijdagmiddag-wanneer-alle-studentes-met-volle-tassen-ondergoed-naar-hun-ouders-gaan!
16.8333
Hij is toch minister van jouw-kinderen-zijn-mijn-zorg-en-ik-bepaal-hoe-opvoeding-dient-te-geschieden?
16.6000
Meer info: www.landmacht.nl/materieel/ en www.army-technology.com/projects/fennek/.
16.2500
Kijk eens bij http://www.nagios.org/products/nagiospowered/azeti/
16.0000
Veel bezoek zal llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogochuchaf.eu niet trekken.
15.8750
Conceptueel vermogen, Adviesvaardigheden, overtuigingskracht, resultaatgerichtheid, samenwerking, communicatie, projectleiding.
15.7500
Tolerantie,normen,waarden,liefde,begrip,res pect en integratie.
15.5455
Die 17 man zijn waarschijnlijk wildplassers, geen-voorranggevers, niet-kunnen-legitimeerders, softdrugs-meenemerts en niet-de-strikte-instructies-van-de-agenten-opvolgers.
15.5000
Het spel is echter een First-Person-Kijk-Hoe-Je-Iemand-Anders-Je-Probleem-Kan-Laten-Oplossen.
15.2857
"Deze Nokiaaaaaaaaaaaaaaaaaaaaaaaaaaa heeft een drie megaaaaaaapixellllllllllllllll cameraaaaaaaaaaaaaaaa!"
15.2500
Oordeel zelf via http://www.eurovision.tv/addons/mediaplayer/
Appendix to nld news 2008: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
35.2857 Ik baal van mensen die een ´ik-ben-zo-zielig-want-ik-heb-niet-het-ideale-leventje-zoals-in-die-leuke-amerikaanse-serie-meteen-leuke-vent-lieve-slimme-kindertjes-een-geweldig-huis-en-een-voldoening-gevende-baan-toffe-vriendinnen-en-leuke-hobbies´. 32.6667 Het heet hardwerkende-minimumloon-arbeider-die-moeite-heeft-om-zijn-3-kinderen-te-vreten-te-geven. 20.0000 Of gewoon Ik-ben-bewust-maagd-want-kieskeurig-echt-hoor-dag? 19.0000 Bron: http://arstechnica.com/news.ars/post/20080110-amazon-rounds-out-drm-free-music-offering-with-sony-bmg.html Nu alleen Itunes nog volledig DRM-vrij. 18.2857 Het zijn altijd weer dezelfde geitenwollensokkendragendelinkselullersrechtsvullersCO2spaardersbroeikasteffectbestrijders gasten. 18.0000 "Alleen de ik-ben-zwanger-en-daar-heb-ik-nu-even-geen-zin-in- gevallen." 17.5556 Voor actuele informatie en aanmelding zie: www.refdag.nl/verhalenwedstrijd2009; www.uitgeverijmozaiek.nl; www.driestar-educatief.nl/algemeen/studium+generale. 17.5000 Alleen de ik-ben-zwanger-en-daar-heb-ik-nu-even-geen-zin-in- gevallen. 17.3333 Met je beter-weet-ik-ben-verontwaardigd-verhaaltjes. 16.7143 Net zoals de pendelvlieg met zijn ik-ben-heel-eng-en-gevaarlijk-met-mijn-wespenjas-aan-maar-stel-eigenlijk-niks-voor. 16.6250 En welk geytenwollensokken-houtjetouwtjejasdragende-opensandalenlopende-ongetwijfeld(s)linksdenkendemensch heeft dit nu weer bedacht? 16.5000 Dus herzie ik mijn eerdere omschrijving naar: semi-illegaal-danalswel-quasi-gedoog-al-dan-wel-gesubsidieerde-leunhoreca-gelegenheid. 16.2500 Waar blijft het ANWB-Weer-Spits-Rijkswaterstaat-KNMI-totaalalarm? 16.2000 'brainpower stopt met produceren bagger-waar-zelfs-wiggers-geen-worst-van-lusten'
211
Appendix to nld news 2008: Sentences with high average word length
16.1667 Maar hij blijft leuk http://weblog.fok.nl/viewSingleItem/2276/Matrix-Ping-Pong.htm, bijvoorbeeld. 16.1429 Vliegtax,ecotax,paktax,co2tax,rooktax,benzinetax,energietax,alcoholtax,enzovoortstax Bos zet ons allemaal te kax. 16.0000 Henk-Jan-Barend-Peter-Hein-Wim-Zus-Jet-Aap Smith's heeft gelijk. 16.0000 Het verhaal heeft wel een hoog ik-viel-in-de-badkamer-op-een-blikje-cola-en-nu-zit-ie-vast-in-mijn-reet-gehalte. 15.8000 Fileprobleem, gezondheidszorg, onderwijs, integratiebeleid, zeespiegelstijging. 15.6667 16000000:63x100=25396825,40euro ongeveer waard. 15.5000 Het pu-raaaaaaaaaaaa-tuuuuhn gaat traaaaaaaaaaaaaaaaaaaaaaaag! 15.4000 Alle refo-christenhonden/moslims/hindu's/scientology wackjobs moeten sterven! 15.3333 Op condoleance.politie-amsterdam-amstelland.nl kunnen steunbetuigingen worden achtergelaten. 15.1667 Amy vergelijken met milly v. hahahahahahahahahahahahahahahahahahahahahahhahahahahahahahaha. 15.1429 Functiewaarderingssystemen, beoordelingssystemen en personeelsinformatiessystemen zijn bekend werkterrein.
Appendix to nld news 2009: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
24.3333
Het spui-vrijelijke-je-ongenuanceerde-meningen-opdat-slimmere-mensen-je-misschien-van-het-tegendeel-kunnen-overtuigen-board is open voor iedereen.
20.8000
Plaatselijke randdebielen beginnen aan-de-rechtmatige-eigenaar-toebehorende-scooter-terug-breng service.
20.5714
Hee, dat klinkt precies als dat "in-het-echte-socialisme-zetten-we-niemand-tegen-de-muur-maar-het-duurt-nog-even-voordat-we-daar-zijn"-argument!
20.0000
Wat is dat nou voor een stekeltjeshaar-roze-vhals-nep-diamanten-oorbelletjes-bontkraag-opgevoerde-scooter-lloret-baantje-bij-de-zeeman-naam?
19.5000
Socialisten zijn gevaarlijk (Nationaal-Socialistische-Duitse-Arbeiders-Partij)
18.8000
D'r is toch zo'n alleen-maar-vrouwen-die-een-zielige-imitatie-doen-van-een-talkshow-programma?
18.8000
Oorzaak: privatisering/winstmaximalisatie/kostenbesparing (op het net)/bonussen/topsalarissen.
18.6667
Zakenmannen,waarrrrrrrrrrrr,zakkenvullers liever gezegd.
18.6250
Al noemen ze het "nationale we-hebben-te-veel-geld-uitgegeven-en-om-die-kosten -te-dekken-kloppen-we-nog-meer-geld-uit-de-zakken- van-de-burger-dag".
18.4286
Maar het ís toch tenenkrommend, die weg-met-ons-en-het-mag-niks-kosten-maar-moet-wel-alles-opleveren-in-ons-voordeel-mentaliteit?
18.4000
6666666 (zesmiljoenzeshonderdzesenzestigduizendzeshonderdzesenzestig) reacties zijn geweest.
18.1667
Naar keuze enkele ontroerende bij-alle-luxe-denken-we-ook-heus-af- en-toe-aan-de-zielige-negertjes-projecten.
18.0000
Is dit het alternatieve-dronken-drosophila-melanogaster-met-hosmo-topic?
18.0000
Weerklimaat is voor luielinksegeitenwollenhersengespoeldenzakkenvullers.
17.2857
De-in-het-kader-van-de-bond-voor-de-nederlandse-huisvrouwen-Libelle-Zomerweek-Nu.nl-krant! Heb ik nu een LCD-tv gewonnen?
17.2500
FraudTool.Win32.SpywareProtect2009.s is een nep-antispywareprogramma.
212
Appendix to nld news 2009: Sentences with high average word length
17.2500
Olequer,Kennedy,Silva,Rommedahl,Urzaiz,Delorge,Perez en vele anderen.
16.5000
Uitkeringen,huursubsidie,misdrijven,overvallen,dit zijn de feiten.
16.1667
Taliban,Hamas,Hezbollah,Syrie,Iran,Noord-korea,Turkije,een groot gezellig praatgroepje wordt dat.
16.0000
Lieveheersbeestjesplaag Groningen, monotheïstenplaag wereldwijd.
15.8750
Mijn alternatief: Suez heikard aanpakken, zie op httprudidierick.wordpress.com/2009/10/19/suez-vraagt-om-een-ma-bell-scenario/.
15.8333
Deze vallen in de categorie steek-deze-toorts-in-de-fik-en-een-deur-opent-zodat-je-verder-kunt.
15.7500
Ik ken het zondagavond-bord-op-schoot-en-voetbal-kijken-gevoel.
15.7500
Neeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee, daar valt weer een droom in duigen!
15.7500
Stelletje soepschaatsgekkeoranjemutsopjekop-hoeren zijn jullie.
Appendix to nld news 2010: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
25.6667
In Nederland is vooral alles-wat-niet-deugt-onder-het-kleed-vegen-en-bedekken-met-de-mantel-der-liefde-maar-wel-een-grote-bek-over-anderen-opzetten groot.
24.2500
Natuurlijk zegt 'landbouwsubsidie-grootverbruiker-en-grote-belangen-in-Griekenland-Frankijk' dat.
22.5714
Deze stad zit gewoon tjokvol met cultureel-verantwoorde-azijnbode-lezende-zichzelf-progressief-noemende-sandaal-dragende-multikul-kraken-is-een-recht-rakkers!
22.2500
Misschien een broertje/achterkleindochter/bet-schoon-overgroot(oom/tante/neef/nicht) van?
22.0000
Oprotten met die communicatieadviesbureauxsubsidieslurpendenitwitomhooggevallensnotneusprietpraatslijmendeknippendeenplakkendesocialistenchristenliberalenscheerders maar nog meer hun opdrachtgevers.
21.2500
Waarschijnlijk opzettelijk het-gaat-niet-om-mijn-uiterlijk-maar-om-wat-ik-zeg gedrag.
19.7143
Nee, maar ze hebben wel een person-in-another-car-who-cuts-you-off-to-get-to-the-next-lane-and-almost-hits-you-while-talking-on-the-phone.
19.5000
Het is een 'Vraag-Om-Een-Key-En-Dan-Heb-Je-Toegang-Zolang-Wij-Dat-Willen'-API.
19.3333
Daarna komt branstof=transport=bevoorrading=hulpverlening.
19.0000
Het iedereen-doet-het-dus-het-zal-wel-waar-zijn principe.
19.0000
Sensatie-zoekende-op-advertentie-inkomsten-afrukkende-plakstift die je bent.
18.4444
Verder is dit weer zo een typisch: ik-bezuinig-sterk-op-korte-termijn-en-als-op-lange-termijn-problemen-ontstaan-ben-ik-al-weg-en-mag-iemand-anders-het-oplossen idee!
18.3333
Neenee, ik heb het over JOOP.nl-NRCnext-GrettaDuisenberg-InternationaleSocialisten-NederlandBekentKleur-links.
18.0000
Of minst effectief-maar-wel-leuk-om-te-kijken-voetbal?
17.8333
Het meest,vernietigende,verachtelijke,kwaadwillende,zelfdestructieve,hoogmoedige organisme op deze planeet!
17.8000
Of een uitspraak van veel-te-hard-ouwehoerende-cyberwitches-met-een-eyefohn-in-McDonalds.
17.7500
Meer woorden als islam,halal,hollandsvarken,sharia,pvda,uitkering,hoer.
213
Appendix to nld news 2010: Sentences with high average word length
17.6667
De Peetvader signaleert een hoog ik-blaas-hoog-van-de-toren-maar-heb-geen-inhoudelijke-mededeling-gehalte.
17.6667
Mwhaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaahhhhhhhhhhhhhhhhhhhhhhhhhhhh (om met belita te spreken)
17.6250
Wij moeten saampjes integreren tot een joods-christelijk-mohammedaans-homofoob-homolievende-geëmancipeerde-vrouwenonderdrukkende samenleving.
17.5000
Misschien zijn alle eenheidsworst-kookprogramma-RTL4/5/6-Xfactor-talentenjachtSMSstemmers wel hersendood.
17.1000
Scheelt ook weer in de kosten verkiezingen-organisatorisch-technisch en eerste-en-tweede-kamerleden-,-provinciale-statenleden-en-gemeentelijke-raadsleden-technisch gezien.
17.0000
Iets met triljoen,triljard,billioen,miljard,jampot!
16.5714
Ik zou er spontaan van gaan rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrillen.
16.2857
Gezondheidszorg, Openbaar vervoer, Energiemaatschappijen, Woningbouwverenigingen, Zorgverzekeringen, Kinderopvang.
Appendix to nld news 2011: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
29.2500
Waarrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr is mijn fiets?
28.2500
Of zeg gewoon Godverdegodverdegodvergodvergloeiendegodverjezuswatjeuktmijnlulgodverdegloeiendegloeiendegloeiende.
25.6000
We willen dubbeltjes,kwartjes,pieken,knaken,5-guldenmunten,vijfjes/vondeltjes,joetjes,geeltjes,50-piekpapieren,meiers en rooien.
23.1111
Eigenlijk ben ik dus een polemische-zeikerige-zwetserige-inhoudelijke-zweverige-aardse-narcistische-inhoudelijkeconsequente-hypocriete-sportieve-gemene-harde-zachte-slimme-domme-vervelende en lieve Moralfag.
22.6000
Ik bekijk dit dan ook meer als een gevalletje we-moeten-toch-met-iets-anders-in-het-nieuws-komen-dan-meteen-wereldrecord-onderhandelen-waarvan-wij-liberalen-aan-de-basis-liggen-door-het-vertrouwen-in-de-regering-op-te-zeggen.
20.5000
Eén ziekenhuis voor D-B/Rosmalen/Empel/Vlijmen/St-Michaelsgestel/Boxtel/Schijndel.
19.0000
▬▬▬▬▬▬▬▬▬▬▬ஜ۩۞۩ஜ▬▬▬▬▬▬▬▬▬▬▬▬▬ ▬▬▬▬▬▬▬▬▬▬▬ஜ۩۞۩ஜ▬▬▬▬▬▬▬▬▬▬▬▬▬ Goed initiatief!
18.6667
Zeker wel mevrouwtje-australischevlagbikinimetmooieteen!
18.6364
Hieronder enkele FOTO'S van Jessica. mooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooolllllllleeeeeeeeeeee geef mij mevr. krem maar.
18.1111
Heerlijk hoe die partij van betwetende-babyboomende-neerbuigende-paternalistische-uit-de-subsidiepot-vretendeen-graaiende-wanbestuurders zichzelf laat imploderen.
18.0000
Is "RobertM" een leuke naam? zijnernogtelangdroogstaandemoedersdiezinhebbenineenbeurtvoordatzedekidsophalen?
17.8333
Tip: bel niet met die malloten-die-alleen-kunnen-zeggen-dat-zie-ik-niet-in-het-systeem-dat-was-een-collega.
17.6250
Waar blijven de 'iedereen-heeft-het-recht-zichzelf-te-verdedigen-dus-iedereen-moet-een-wapen-reaguurders' uit het schietvereniging-topic nou?
17.6000
! maaskantjeplaszaknspvvzeikengriekenlandoccupywallstreetbbcfoxnews Niet Seiken, mensen.
17.4000
Trraaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaag Maar eerlijk is eerlijk.
17.4000
Zie de schokkende vijftig-procent-kans-dat-een-Marokkaanse-jongen-crimineel-is cijfers.
17.0000
Die kinderen zien natuurlijk auto's,horloges,mobieltjes,televisies,boeken,medicijnen.
214
Appendix to nld news 2011: Sentences with high average word length
17.0000
Minder kantoren/loketten/service/duidelijkheid/leraren per leerling.
16.6667
Zuidplein,afrikaanderplein,koopgoot keuzes keuzes.
16.4000
Doe maar een "lesbische-negerin-in-een-rolstoel-met-burka-aan-fonds" aanschrijven.
16.2857
Bij iedere melding krijg je een 'Ik-zou-lid-geweest-zijn-van-de-nsb-want-ik-lap-anderen-er-graag-bij'-certificaat.
15.8000
Er zijn weer nazi-ariërs-'haataanjodenenalleswatnietblankis'-heaumeau's actief.
15.7500
Zowel symptoombestrijding/schijnveiligheid als bronbestrijding.
15.6667
Frameworks/modellen/methoden zijn hulpmiddelen.
Appendix to nld newscrawl 2011: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
22.8750
Ben ik de enige in het licht-autistische-blonde-amateursporters-die-roken-en-ook-wel-van-een-goed-boek-houdenoverdag-hard-werkend-maar-'s avonds-ook-wel-eens-een-jointje-lusten-dorp?
21.4000
Brengt dit beestje zijn jasje ook nog wat op oooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooo!
21.0000
Route: Winterswijkseweg-Mattelierstraat-Markt-Beltrumsestraat-Ziekenhuisstraat-Kerkwal-Lievelderstraat-Lichtenvoordseweg richting Winterswijkseweg waar het eindpunt is.
20.3333
Eerder conservatief-geiten-wollen-sokken-populistisch rechts.
18.7778
Route: Winterswijkseweg-Mattelierstraat-Markt-Beltrumsestraat- Ziekenhuisstraat-Kerkwal-Lievelderstraat-Lichtenvoordseweg richting Winterswijkseweg waar het eindpunt is.
18.7500
Volgende bedragen worden voorzien:OpvangvormAantalEuroTotaalOnthaalouders8.
18.7500
Wel voor zijn levens-partij-power-loop-eigen-point-belang-targets-carriere!
18.6667
Zeker wel mevrouwtje-australischevlagbikinimetmooieteen!
18.3333
Niet over wie-deed-het-met-wie-in-Andy-Warhols-Factory.
18.2500
Advocatuur,rechters,dure gevangenissen,eufemistisch instellingen genoemd.
18.1429
Conjucturele schommelingen ( voorheen tijdelijke vercapaciteit),vervoersgarantie,samenwerking,economisch infosysteem,kostprijs.
18.0000
De-zon-gaat-voor-niets-op-mentaliteit moet verdwijnen.
18.0000
Straks komen Jeandepedo en Arische1ooggazabordelijnjuliandusennogmeernicknamenwantikhebeenschizofrenischeafwijking weer terug.
17.6250
Waar blijven de 'iedereen-heeft-het-recht-zichzelf-te-verdedigen-dus-iedereen-moet-een-wapen-reaguurders' uit het schietvereniging-topic nou?
17.3333
Verleden:hulpverlening, geestelijke gezondheidszorg.
16.8333
Je heb fictieve Hindoe,-islamitische,-christelijke,-boeddhistische,-joodse,en atheïstische wetgeving.
16.5714
Zoals dodehoekwaarschuwingssystemen, achteruitrijsignalering, camera’s of anti-in-slaap-sukkeldetectie bijvoorbeeld.
16.5000
Dan heb ik hier nog een woord voor hem: Snoopjebenteenmongeauldieredelijkgoedenoulatenwezeggenbestweltoffenummersmaaktmaarernietuitzietenheeeeeeeeeldommeideeënheeft.
215
Appendix to nld newscrawl 2011: Sentences with high average word length
16.2857
Bij iedere melding krijg je een 'Ik-zou-lid-geweest-zijn-van-de-nsb-want-ik-lap-anderen-er-graag-bij'-certificaat.
15.8750
Onberechte mensenrechtenschenders, moordenaars,drugbazen,terroristen,geweldenaars,bankrovers hebben jullie gekozen als leiders.
15.8000
Er zijn weer nazi-ariërs-'haataanjodenenalleswatnietblankis'-heaumeau's actief.
15.6667
Verloedering letterlijk en figuurlijk toegestaan door deze niets-met-het-land-hebbende-eigen-belang-denkende-ongeinteresseerdelandverrader!
15.6667
Waarom (g)een ongevalleninzittendenverzekering?
15.6000
Verschillende natuurorganisaties, waaronder Natuurmonumenten, Staatsbosbeheer.
15.4000
Verkeer wordt omgeleid via Oldenzaalsestraat-Lasondersingel-Deurningerstraat.
Appendix to nld wikipedia 2007: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
25.6000
De scheikundige naam is ethyl4-(8-chloro-5,6-dihydro-11H-benzo[5,6]cyclohepta[1,2-b]pyridin-11-ylidene)-1-piperidinecarboxylaat.
24.0000
De systematische naam is (3-beta,20-beta)-20-carboxy-11-oxo-30-norolean-12-en-3-yl 2-O-beta-D-glucopyraanuronosyl-alfa-D-glucopyranosiduronzuur.
21.8889
ELINCS-nummers beginnen bij 400-010-9 [en wel voor tetranatrium-3,3'-(piperazine-1,4-diylbis((6-chloor-1,3,5-triazine-4,2-diyl)imino(2-aceetamido)-4,1-fenyleenazo))bis(naftaleen-1,5disulfonaat)].
21.1667
2-(acetyloxy)-N,N,N-trimethylethanaminium 2-(acetyloxy)-N,N,N-trimethylethanaminium Acetylcholine als ruimtelijke voorstelling.
20.6250
Afbeelding:SleutelG.pngAfbeelding:Kwartnoot00.jpgAfbeelding:Balk.pngAfbeelding:Kruis01.pngAfbeelding:Kwartnoot01.jpg een overmatige secunde (klinkt als kleine terts)
20.4286
De volgende reden is hiervoor opgegeven: http://www.l1.nl/L1NWS/_rp_links4_firstElementId/1_1135662/_rp_links4_hasclickpage/1_1013/_pid/links4.
19.6667
Enkele alternatieve omschrijvingen/correcties/aanvullingen:
19.0000
Zie: http://www.talk2000.nl/mediawiki/index.php/Overschotten_teisteren_weggeefwinkels voor een discussie hierover.
17.2857
De volgende reden is hiervoor opgegeven: http://darrenshan.web-log.nl/darrenshan/samenvattingen_van_de_boeken/index.html.
17.1667
IJsland gaat weer op walvisjacht (http://www.nos.nl/nos/artikelen/2006/10/art000001C6F218431037D1.html)
17.0000
De systematische naam van hyoscyamine is α-(hydroxymethyl)-,8-methyl-8-azabicyclo[3.2.1]oct-3-ylester, [3(S)-endo]-1αH,5αH-tropan-3α-ol.
17.0000
Officieel heet het klooster Onze-Lieve-Vrouw-van-La-Trappe-van-de-Heilige-Benedictus.
16.6667
De volgende reden is hiervoor opgegeven: afkomstig van http://borstkankertrefpunt.web-log.nl/borstkankertrefpunt/nieuws_media_maatschappij/index.html.
16.6000
Ook te vinden op http://www.science.leidenuniv.nl/content_docs/trots/trots2005.pdf.
16.5714
De volgende reden is hiervoor opgegeven: http://japanologie.arts.kuleuven.be/society/index.php/Japan-ASEAN_relaties.
16.5714
De volgende reden is hiervoor opgegeven: http://www.talpa.nl/web/show/id=47920/langid=43/dbid=8069/typeofpage=51230.
16.5000
Kroon van het Keizerrijk Brazilië: http://en.wikipedia.org/wiki/Image:Brazilian_Imperial_Crown.jpg]
16.4286
De volgende reden is hiervoor opgegeven: http://www.tien.tv/web/show/id=47920/langid=43/dbid=9429/typeofpage=51230.
216
Appendix to nld wikipedia 2007: Sentences with high average word length
16.2000
Chemisch gezien is het Fluoromethyl-2,2,2-trifluoro-1-trifluoromethyl-ethylether.
16.2000
Officieel heet de abdij Onze-Lieve-Vrouw-van-La-Trappe-van-de-Heilige-Benedictus.
15.7143
Lichtblauw:Verspreiding buiten voortplantingstijd Verspreidingsgebied muskusrat (Ondathra zibethicus)Rood:Oorspronkelijk verspreidingsgebiedGroen:Verspreiding als exoot Verspreidingsgebied muskusrat (Ondathra zibethicus)
15.4000
Verschillende maatschappijen gebruikten verschillende filterkarakteristieken.
15.3750
De chemische naam van karmijnzuur is: 7-β-D-glucopyranosyl-3,5,6,8-tetrahydroxy-1-methyl- 9,10-dioxo-2-antraceencarbonzuur.
15.2500
Theepot-gelovigen stenigen geen theepot-ongelovigen, theepot-geloofsafvalligen, theepot-ketters en theepot-godslasteraars.
15.2000
Serieuze tekstverwerkingsprogramma's beschikken over mailmergemogelijkheden.
Appendix to nld wikipedia 2012: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
27.5000
Openbaar vervoer Lijn 76 Emmeloord-Marknesse-Luttelgeest-Kuinre-Slijkenburg-Spanga-Ossenzijl-Oldemarkt-Blesdijke-De Blesse-Willemsoord-Steenwijkerwold-Tuk-Steenwijk.
18.3333
Hierbij ontstaat 3,4,5-dimethoxy-fenyl-(n-butyl)-keton.
17.0000
De chemische naam is 3-amino-2,±9-dimethyl-5-fenyl-7-(p-tolylamino)fenaziniumacetaat.
16.7500
Economische ontwikkeling Irrigatie Bestand:Turkey-cotton-by-region.
16.7143
De chemische naam van acitretine is (all-E)-9-(4-methoxy-2,3,6-trimethylfenyl)-3,7-dimethylnona-2,4,6,8-tetraeenzuur.
16.5000
Postzegelverzamelaars onderscheiden verschillende perforatiematen.
16.2500
Afbeeldingen: verschillende soorten Afbeelding:Voetwortelknobbel.
16.1667
Wel worden significante hoeveelheden diethylstilbestrol-monosulfaat-monoglucuronide aangetroffen.
16.0000
Het lint is oranje-vlootblauw-luchtmachtblauw-vlootblauw-oranje.
16.0000
Patiënt-controle-onderzoek (case-control-onderzoek, Fall-Kontroll-Studie) is een observationele epidemiologische onderzoeksvorm.
16.0000
SpeciesPages/AlyteObste.htm Enkele afbeeldingen.
15.6667
Zie ook Bestand:Nieuwkoninklijkpaleistetilburg.
15.4000
Sandwichverbindingen zoals tetracarbonyl(norbornadieen)chroom(0) zijn bekend.
15.4000
Verschillende maatschappijen gebruikten verschillende filterkarakteristieken.
15.2500
Galerij met voorbeelden Bestand:RabulaGospelsFol13vAscension.
15.2500
Het lint is hemelsblauw-oranje-vlootblauw-oranje-hemelsblauw.
15.0000
Lange-termijnresultaten ontbreken vooralsnog.
14.8750
Veel organo-iridiumverbindingen worden gesynthetiseerd op basis van pentamethylcyclopentadienyliridiumdichloridedimeer.
14.8000
Een glasinstrumentenmaker vervaardigt voornamelijk laboratoriumapparatuur.
14.6923
Het bevat MTT (3-(4, 5-dimethyl-2-thiazolyl)-2, 5-dihphenyl-2H-tetrazolium bromide) en het beter wateroplosbare XTT (2,3-bis-(2-methoxy-4-nitro-5-sulfophenyl)-2H-tetrazolium-5-carboxanilide).
14.6667
Er vielen negen doden http://www.zie.nl/video/algemeen/Dodental-milieuramp-Hongarije-loopt-op/m1azqq5finuz en ongeveer 123 gewonden.
217
Appendix to nld wikipedia 2012: Sentences with high average word length
14.6667
Mensenrechtenschendingen werden veroordeeld.
14.6000
Diverse besturingssystemen ondersteunen verschillende partitietabelsoort.
14.5000
Daarop verzorgen zij een cursus Brabants onder de titel: Heddegijdagezeedgehadjamindedawerkelukwoarhoedoedegijdahoedoedegijdahoeheddegijdagedoan.
14.5000
Herdenkingsdecoratie, particuliere verzameling, Groningen.
Appendix to nld web 2002: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
28.3333
Voor de woonkamer,slaapkamer,badkamer,toilet,keuken,zolder,kelder,tuin,terras,balkon.
28.1667
InleidingAnatomie prostaatGoedaardige prostaatvergrotingProstaatontstekingProstaatkankerPijnbestrijdingProstaatpijnErectiestoornissenOveractieve blaasPSA (meer hierover)
28.0000
Europa (Institutionen/Organisationen/Programme/Websites) Europa (Instellingen/Organisaties/Programmas/Websites)
28.0000
Meer informatie via http://www.andersenlegal.com/WebSiteLegal.nsf/Content/MarketOfferingsLegalServicesDealsight?
26.3333
Zoals bijvoorbeeld http://provider.nl/users/pietpietersen/voetbalclub/home.htm.
25.8000
Door hier te klikken kantoorvakhandel,kantoorapparatuur,kantoorartikelen,kantoor,kantoormachines,kantooromgeving,kantoorsupplies,
25.6667
De op-een-zeer-onverkiesbare-plek-gezette-maar-zogenaamd-belangrijke persoon.
24.4000
Twee ingangen: http://www.knltb.nl/competities/spelersprofiel.html en http://www.knltb.nl/servit/wcspelersprofieltoon.asp.
24.0000
26-11-2002SupermooieSplinternieuwe Lingeriesetjes.Richard(+31619176668)SupermooieSplinternieuwe lingeriesetjes met kant!
23.8000
Ik wil terug naar: breadCrumbs("www.interbrewhoreca.nl","-","index.htm","breadcrumbs","breadcrumbs","breadcrumbs","0");
23.6667
Mijn vrienden zijn:Axel,Ferdi,Deshe,Bart,Maikel,Jeffrey,Roy,Niall,Dirk.
23.2857
Pr.Beatrixsingel-Pr.Bernhardlaan-Kon.Julianalaan-Oranjelaan-Wilhelminalaan-Plenkertstraat-Grendelplein-Cauberg, vervolgens wordt het WK tijdrijdenparcours gevolgd.
23.0000
En liedjes vind ik heeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeel leuk.
23.0000
Uit de broncode: http://www.isw.agro.nl/Dossiers/JADE/Voorbeeldprojecten/Educatie/wonen.htm.
22.8333
Route: Patronaat-Nieuwkuijksestraat-Pastoor Becxstraat-Esdoornstraat-Eikenstraat-Nieuwkuijksestraat-Onsenoortsestraat (dan naar Vlijmen).
22.8000
Europa (Institutionen/Organisationen/Programme/Websites) / Europa (Instellingen/Organisaties/Programma�s/Websites)
22.6667
De pagina http://www.vrouwenverdrag.nl/mailinglists/berichten%20vrouwenverdrag/archief%20tem%20juli%202001/index.htm werd niet gevonden.
22.4000
Airbag,Alarm,trekhaak,stuurbekrachtiging,Centrale deurvergrendeling,5-bak,zeer goede auto,wegens omstandigheden.
22.1667
De pagina http://www.vrouwenverdrag.nl/mailinglists/berichten%20vrouwenverdrag/vrouwenverdrag-berichten-nieuw.htm werd niet gevonden.
22.1429
Definitieve ontwerpen doorstroomas Vossenbelt, gedeelte Beneluxlaan/Esbjergstraat/Europalaan/Dijksweg/Kopenhagenstraat/Belgradostraat/Levantstraat (29145).
22.0000
Federatie van Kunstenaarsverenigingen http://www.federatievankunstenaarsverenigingen.nl/
218
Appendix to nld web 2002: Sentences with high average word length
22.0000
SKOA - Stichting Kinderopvang Alkmaar,kinderdagverblijf,peuterspeelzaal,buitenschoolseopvang,gastouderopvang, Kinderopvang,kinderdagverblijven,peuterspeelzalen,gastouderopvangen in Alkmaar en Heiloo.
21.8571
Ahorn-systeembouw zijn specialisten voor prefab garages garage,garages,betongarage,garagebouw,mavogarage,garagebox, garageboxen,berging,bergingen,aanbouw.
21.6000
Warenhuis met kleding,accessoires,parfum,schoenen,laarzen,huishoudtextiel,zonnebrillen,lingerie en horloges.
21.5714
Ahorn-systeembouw zijn specialist voor prefab garages garage,garages,betongarage,garagebouw,mavogarage,garagebox, garageboxen,berging,bergingen,aanbouw.
219
Appendix to nld web 2011: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
26.5000 Welkom bij HAPPYGIFTAwardsAwards 2009BeschermengelenCarnavalDierendagDiversenGeluksbrengerHalloweenHerfst. 26.4286 HomeBloemschikkenPasenKerstKerstdecoratieKerkBruidswerkCreatief met kinderenLood en fietsenbandenLenteZomerHerfstWinterMijn tuinKruidenNatuurWeetjesLinksFotoboekGastenboekContact Nieuw! 26.0000 Hallo wij zijn groep 6a: Dito-Stephany-Ocker-Maud-Stijn-Daantje-Ties-Chiel-Rick-Fleur-Lieke-Pim-Britt-Ruud-Sam-Farisa-Anne-Zoë-Joris-Floris-Bram-Hilde-Stan. 25.7500 HomeKaartenEtenBeautySMSOverigLinksNieuwsbriefGeocachinghintsGastenboekContact Welkom op gratisspullen. 24.7500 Voor meer informatie: http://www.eea.europa.eu/data-and-maps/explore-interactive-maps/eye-on-earth. 24.3333 Vervolgens naar Bangladesh-Myanmar-Thailand-Maleisie-indonesie-australie. 24.2500 MagnetiserenPsychometrieOverledenenAutomatisch schriftNieuwetijdskinderenHuiskamersessiesVerenigingenBeurzenMijn GedichtjeSlotwoordLinksInzichtkaart trekkenGastenboekContact Welkom op mijn site! 23.7500 OpeningstijdenTarievenContactRoutebeschrijving KinderspeelparadijsBowlenOverdekt zwembad Nieuw! 23.4000 OnbekendAlkmaarAmstelveenAmsterdamHaarlemHoofddorpZaanstad Geen voorkeurKaalGestoffeerdGemeubileerd Geen voorkeurMin. 23.0000 De route loopt via HeemstedestraatWoestduinstraat-Rietwijkerstraat-Aalsmeerweg-Sassenheimstraat-Rijnsburgstraat-Sloterkade-Hoofddorpweg. 23.0000 Ga naar www.hetccv.nl/instrumenten/Interne+criminaliteit/Stappenplan. 23.0000 VoorpaginaBodyontspannings-massageErotische massageStoelmassageSpelregelsKostenWerktijdenMail adresFotoboekGastenboekContact Wat is een Bodyontspannings-massage? 22.8000 Inschrijven kunt u via http://www.contourtilburg.nl/Persberichten/2011/Vrijwilligerswerk/www.beursvloertilburg.nl. 22.8000 Rijksuniversiteit Groningen www.rug.nlmedewerkers/voorzieningen/verenigingen/vrouwennetwerk Vrouwennetwerk Bureau. 22.7143 Andere mogelijke activiteiten:wandelen,paardrijden,para-gliding,off roadritten,motorboten, vogel-spotting,quad-rijden,zweefvliegen,paint-ball shooting, jagen…. 22.6667 A+A-ProclaimerZoekenOpeningstijdenContactSitemapRSSLinksHome Let op! 22.5714 Home-Introductie-DeDames-DeHeren-Catstraten-Planning-Nazaten-Outcross-Polydactylie-Links-Coonkleuren-Kattenkunst-Email, klik hier Momenteel geen kittens meer. 22.5000 Alternatief: http://www.schouwenweb.nl/Webwinkel-Product-1782962/Engenius-802.11b-g-Outdoor-AP-CB-CR--(27dBm).html met lange UTP kabel.
Appendix to nld web 2011: Sentences with high average word length
220
22.5000 Zie ook operette-mozaiek-noordwijk, muziektheater-mozaiek-noordwijk, amateur-muziektheater-mozaiek-noordwijk, operette-mozaiek-maske-in-blau en muziektheater-mozaiek-maske-in-blau. 22.1111 IntroductieUpdatesElvis-BorisHjalmarBoris/HjalmarTraining HjalmarActiviteitenBezoekSpelenWeblogVakantiesLinksDierenleed(acties)GastenboekContact We zijn afgelopen zaterdag teruggekomen uit Frankrijk! 22.0000 HomeBloemschikkenPasenKerstKerstdecoratieKerkBruidswerkCreatief met kinderenLood en fietsenbandenLenteZomerHerfstWinterMijn tuinKruidenNatuurWeetjesLinksFotoboekGastenboekContact Nieuwe foto's 2010! 22.0000 Tevens zijn zij bekwaam in massages:-bindweefselmassage-totaalbalansmassage-thaise massage-ontspanningsmassage-voetzoolreflexmassage-hotstonemassage-stoelmassage-babymassage en zwangerschapsmassage. 21.7500 WelkomNieuwsBapuBryceBossBacoBrynnBoomseyBlissBreezerpups en planningBehendigheidFamilieVriendenfoto'sUnikumlinksFotoboekGastenboekContact Voorlopig verwachten wij geen pups. 21.7143 Wat jullie gaan leren; belichting,scherpstelling,diafragma,sluitertijd, scherptediepte,belichtingstijd,compositie,isowaarde,witbalans,lichtvoering etc….
Appendix to nld mixed 2012: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
28.3333 Voor de woonkamer,slaapkamer,badkamer,toilet,keuken,zolder,kelder,tuin,terras,balkon. 28.1667 InleidingAnatomie prostaatGoedaardige prostaatvergrotingProstaatontstekingProstaatkankerPijnbestrijdingProstaatpijnErectiestoornissenOveractieve blaasPSA (meer hierover) 28.0000 Europa (Institutionen/Organisationen/Programme/Websites) Europa (Instellingen/Organisaties/Programma�s/Websites) 28.0000 Meer informatie via http://www.andersenlegal.com/WebSiteLegal.nsf/Content/MarketOfferingsLegalServicesDealsight? 28.0000 Volgens de [url=http://tweakers.net/nieuws/35583/opta-geen-toegang-tot-upc-netwerk-voor-kpn.html]OPTA[/url niet. 27.5000 Openbaar vervoer Lijn 76 Emmeloord-Marknesse-Luttelgeest-Kuinre-Slijkenburg-Spanga-Ossenzijl-Oldemarkt-Blesdijke-De Blesse-Willemsoord-Steenwijkerwold-Tuk-Steenwijk. 26.5000 Welkom bij HAPPYGIFTAwardsAwards 2009BeschermengelenCarnavalDierendagDiversenGeluksbrengerHalloweenHerfst. 26.4286 HomeBloemschikkenPasenKerstKerstdecoratieKerkBruidswerkCreatief met kinderenLood en fietsenbandenLenteZomerHerfstWinterMijn tuinKruidenNatuurWeetjesLinksFotoboekGastenboekContact Nieuw! 26.3333 Zoals bijvoorbeeld http://provider.nl/users/pietpietersen/voetbalclub/home.htm. 26.0000 Hallo wij zijn groep 6a: Dito-Stephany-Ocker-Maud-Stijn-Daantje-Ties-Chiel-Rick-Fleur-Lieke-Pim-Britt-Ruud-Sam-Farisa-Anne-Zoë-Joris-Floris-Bram-Hilde-Stan. 25.8000 Door hier te klikken kantoorvakhandel,kantoorapparatuur,kantoorartikelen,kantoor,kantoormachines,kantooromgeving,kantoorsupplies, 25.7500 HomeKaartenEtenBeautySMSOverigLinksNieuwsbriefGeocachinghintsGastenboekContact Welkom op gratisspullen. 25.6667 De op-een-zeer-onverkiesbare-plek-gezette-maar-zogenaamd-belangrijke persoon. 25.6667 In Nederland is vooral alles-wat-niet-deugt-onder-het-kleed-vegen-en-bedekken-met-de-mantel-der-liefde-maar-wel-een-grote-bek-over-anderen-opzetten groot. 25.6000 De scheikundige naam is ethyl4-(8-chloro-5,6-dihydro-11H-benzo[5,6]cyclohepta[1,2-b]pyridin-11-ylidene)-1-piperidinecarboxylaat. 24.7500 Voor meer informatie: http://www.eea.europa.eu/data-and-maps/explore-interactive-maps/eye-on-earth.
Appendix to nld mixed 2012: Sentences with high average word length
221
24.4000 Twee ingangen: http://www.knltb.nl/competities/spelersprofiel.html en http://www.knltb.nl/servit/wcspelersprofieltoon.asp. 24.3333 Het spui-vrijelijke-je-ongenuanceerde-meningen-opdat-slimmere-mensen-je-misschien-van-het-tegendeel-kunnen-overtuigen-board is open voor iedereen. 24.3333 Vervolgens naar Bangladesh-Myanmar-Thailand-Maleisie-indonesie-australie. 24.2500 MagnetiserenPsychometrieOverledenenAutomatisch schriftNieuwetijdskinderenHuiskamersessiesVerenigingenBeurzenMijn GedichtjeSlotwoordLinksInzichtkaart trekkenGastenboekContact Welkom op mijn site! 24.2500 Natuurlijk zegt 'landbouwsubsidie-grootverbruiker-en-grote-belangen-in-Griekenland-Frankijk' dat. 24.0000 26-11-2002SupermooieSplinternieuwe Lingeriesetjes.Richard(+31619176668)SupermooieSplinternieuwe lingeriesetjes met kant! 24.0000 De systematische naam is (3-beta,20-beta)-20-carboxy-11-oxo-30-norolean-12-en-3-yl 2-O-beta-D-glucopyraanuronosyl-alfa-D-glucopyranosiduronzuur. 23.8000 Ik wil terug naar: breadCrumbs("www.interbrewhoreca.nl","-","index.htm","breadcrumbs","breadcrumbs","breadcrumbs","0"); 23.7500 OpeningstijdenTarievenContactRoutebeschrijving KinderspeelparadijsBowlenOverdekt zwembad Nieuw!
Appendix to nld news 2007: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word De
rsquo;’De
974956
2176
Het
rsquo;’Het
390828
757
In
rsquo;’In
182671
353
De
lsquo;De
974956
300
Het
lsquo;Het
390828
283
Volgens
rsquo;’Volgens
81937
276
Een
rsquo;’Een
139898
240
Ik
lsquo;Ik
86464
232
Ook
rsquo;’Ook
80557
225
Van
rsquo;’Van
75828
197
Dat
rsquo;’Dat
175777
195
De
procent.De
974956
173
De
zijn.De
974956
151
De
rsquo;De
974956
146
Op
rsquo;’Op
64083
134
Voor
rsquo;’Voor
41178
128
De
is.De
974956
123
De
ROTTERDAMDe
974956
122
Appendix to nld news 2007: Problems with sentence segmentation - words ending in a stopword
Met
rsquo;’Met
39465
122
Bij
rsquo;’Bij
44016
119
Appendix to nld news 2008: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word In
LinkedIn
161652
314
De
�?De
811505
127
De
lsquo;De
811505
125
Het
lsquo;Het
347287
99
Ik
lsquo;Ik
138109
88
De
procent.De
811505
79
De
zijn.De
811505
74
De
�De
811505
68
De
âDe
811505
56
Het
�?Het
347287
55
De
is.De
811505
52
De
euro.De
811505
44
De
worden.De
811505
43
Dat
lsquo;Dat
168236
37
De
jaar.De
811505
36
Het
worden.Het
347287
35
Ze
EliZe
53932
34
Het
is.Het
347287
34
De
op.De
811505
34
Ik
�Ik
138109
34
222
Appendix to nld news 2009: Problems with sentence segmentation - words ending in a stopword
Appendix to nld news 2009: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word De
reactiesDe
829244
766
De
procent.De
829244
352
In
LinkedIn
167086
327
Een
reactiesEen
138315
260
De
lsquo;De
829244
230
De
âDe
829244
230
De
zijn.De
829244
172
Het
âHet
373333
165
Ik
âIk
178785
161
In
reactiesIn
167086
153
Nederland reactiesNederland
83122
152
Het
lsquo;Het
373333
142
De
euro.De
829244
125
De
is.De
829244
121
Ik
lsquo;Ik
178785
112
De
punten.De
829244
103
De
bekend.De
829244
100
In
procent.In
167086
86
De
jaar.De
829244
83
De
worden.De
829244
78
223
Appendix to nld news 2010: Problems with sentence segmentation - words ending in a stopword
Appendix to nld news 2010: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word In
LinkedIn
158428
408
De
procent.De
785706
354
De
âDe
785706
244
De
lsquo;De
785706
226
Het
lsquo;Het
360359
188
Ik
lsquo;Ik
190807
184
Het
âHet
360359
176
Ik
âIk
190807
147
De
zijn.De
785706
112
De
is.De
785706
111
Het
reactiesHet
360359
111
De
reactiesDe
785706
84
In
procent.In
158428
83
De
worden.De
785706
79
De
euro.De
785706
76
De
hoger.De
785706
69
Dat
lsquo;Dat
183376
68
De
uit.De
785706
66
In
âIn
158428
66
Er
âEr
83968
65
224
Appendix to nld news 2011: Problems with sentence segmentation - words ending in a stopword
Appendix to nld news 2011: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word In
LinkedIn
70650
507
Ook
ZoKanIkHetOok
50782
56
Er
reactieEr
38704
28
Van
HomeNieuwsVan
31676
22
De
HomeNieuwsDe
356038
15
In
LogMeIn
70650
6
De
•De
356038
6
In
TuneIn
70650
4
De
WegMetDe
356038
4
Van
WordErZoMoeVan
31676
4
De
BaLaDe
356038
3
Ook
HomeNieuwsOok
50782
3
In
LinkeIn
70650
3
Ze
PlukZe
39042
3
We
SoZaWe
30341
3
En
etc.En
94776
3
Ik
etc.Ik
144653
3
Maar
etc.Maar
77276
3
225
Appendix to nld newscrawl 2011: Problems with sentence segmentation - words ending in a stopword
Appendix to nld newscrawl 2011: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword
Concatenated word
Frequency of stopword Frequency of concatenated word
In
LinkedIn
178496
210
De
SoLiDe
768283
26
Nederland
112Nederland
80345
15
De
commissie–De
768283
14
Een
Remigratie:Een
136576
13
Nederland
MKB–Nederland
80345
11
De
u17(De
768283
10
Dit
u17(Dit
63055
10
Een
Zwolle–Een
136576
9
We
SoZaWe
45127
8
Een
u2018Een
136576
8
Nederlandse Belgisch–Nederlandse
43404
7
De
“De
768283
7
De
‘De
768283
7
De
–De
768283
7
De
…De
768283
7
Nederland
Buitenlandpanel:Nederland 80345
5
In
NieuwsquizIn
178496
5
De
VerdraaiDe
768283
5
De
artikelen:De
768283
5
226
Appendix to nld wikipedia 2007: Problems with sentence segmentation - words ending in a stopword
Appendix to nld wikipedia 2007: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word Dit
Dit
68822
145
Ze
EliZe
33506
12
De
SoLiDe
444242
7
Een
Finistère.Een
69755
4
Een
Gironde.Een
69755
4
De
██ De
444242
4
Een
Gers.Een
69755
3
Een
Hérault.Een
69755
3
Voor
LuxVoor
17159
3
In
SkypeIn
227745
3
Van
VanVan
29832
3
De
geplaatst.De
444242
3
De
hals.De
444242
3
De
hervormd.De
444242
3
De
nl:De
444242
3
Op
rechterschouder.Op
66092
3
Ook
toegekend.Ook
40815
3
De
zijn.De
444242
3
227
Appendix to nld wikipedia 2012: Problems with sentence segmentation - words ending in a stopword
Appendix to nld wikipedia 2012: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word In
LinkedIn
451732
12
Ze
EliZe
71139
11
De
Bestand:De
939866
7
De
RABDe
939866
5
De
uur:De
939866
5
In
DroidIn
451732
4
Voor
LuxVoor
33344
4
In
SkypeIn
451732
4
The
Byzantium:The
40374
3
De
SoLiDe
939866
3
Een
Wet:Een
115964
3
228
Appendix to nld web 2002: Problems with sentence segmentation - words ending in a stopword
Appendix to nld web 2002: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word We
SoZaWe
225617
639
In
BijOnsIn
903879
142
De
39;De
2910437
114
De
worden.De
2910437
83
De
zijn.De
2910437
75
De
is.De
2910437
57
Het
zijn.Het
1525146
49
Het
39;Het
1525146
44
In
Labyrint~In
903879
41
Het
worden.Het
1525146
39
Ik
Comments:Ik
406421
37
Op
KomOp
398244
33
De
maken.De
2910437
32
De
2003De
2910437
30
In
CadWIn
903879
30
Het
is.Het
1525146
30
Een
39;Een
630612
28
Op
NetOp
398244
26
Deze
homepage:Deze
372744
26
De
jaar.De
2910437
26
229
Appendix to nld web 2011: Problems with sentence segmentation - words ending in a stopword
Appendix to nld web 2011: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word De
�De
2760904
3475
In
LinkedIn
880352
1825
Het
�Het
1537696
1319
Ik
�Ik
439355
1125
Een
�Een
689226
373
Wat
�Wat
172111
368
We
�We
329874
340
In
�In
880352
338
Als
�Als
375388
272
Op
�Op
485725
208
Je
�Je
236685
194
Van
�Van
184802
174
Wij
�Wij
320798
167
Dat
�Dat
244587
150
Dit
�Dit
453707
134
Er
�Er
318033
127
Met
�Met
286668
103
En
�En
288539
102
De
•De
2760904
89
Voor
�Voor
392717
85
230
Appendix to nld mixed 2012: Problems with sentence segmentation - words ending in a stopword
Appendix to nld mixed 2012: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word De
�De
10111165
3475
In
LinkedIn
3023260
2831
De
rsquo;’De
10111165
2180
Het
�Het
4991463
1319
Ik
�Ik
1467235
1125
De
procent.De
10111165
880
De
reactiesDe
10111165
850
De
lsquo;De
10111165
792
Het
rsquo;’Het
4991463
758
We
SoZaWe
704025
753
Ik
8220;Ik
1467235
704
De
8220;De
10111165
659
Het
8220;Het
4991463
644
Het
lsquo;Het
4991463
624
Ik
lsquo;Ik
1467235
545
De
âDe
10111165
519
De
zijn.De
10111165
512
We
lsquo;We
704025
507
De
is.De
10111165
414
We
âWe
704025
403
231