Technical Report Series on Corpus Building
Vol. 7 (April 2013)
Indonesian Corpora
Uwe Quasthoff Dirk Goldhahn
Abteilung Automatische Sprachverarbeitung, Institut für Informatik, Universität Leipzig
Affiliation of the authors: Uwe Quasthoff, Dirk Goldhahn: Institut für Informatik,Universität Leipzig {quasthoff, dgoldhahn}@informatik.uni-leipzig.de
Copyright: Abteilung Automatische Sprachverarbeitung, Institut für Informatik, Universität Leipzig, http://asv.informatik.uni-leipzig.de/
Technical Report Series on Corpus Building Vol. 1: Deutscher Wortschatz 2013 Vol. 2: Danish Corpora Vol. 3: Dutch Corpora Vol. 4: Icelandic Corpora Vol. 5: Hungarian Corpora Vol. 6: Ukrainian Corpora Vol. 7: Indonesian Corpora
This PDF document was created using the open source tool mwlib. For more infotmation, see http://code.pediapress.com/ PDF generated at: Wed, 15 May 2013
Indonesean corpora
1
Introduction to corpus creation
1
IND - a processing related language description
2
IND corpora
3
IND corpus comparison
8
Processing details
10
Appendix to ind news 2007: Database summary
10
Appendix to ind news 2008: Database summary
10
Appendix to ind news 2009: Database summary
11
Appendix to ind news 2010: Database summary
11
Appendix to ind news 2011: Database summary
12
Appendix to ind news 2012: Database summary
12
Appendix to ind newscrawl 2011: Database summary
13
Appendix to ind newscrawl 2012: Database summary
13
Appendix to ind wikipedia 2007: Database summary
14
Appendix to ind wikipedia 2012: Database summary
14
Appendix to ind web 2011: Database summary
15
Appendix to ind web 2012: Database summary
15
Appendix to ind mixed 2012: Database summary
16
Content details
17
Appendix to ind news 2007: Size of different TLDs
17
Appendix to ind news 2008: Size of different TLDs
17
Appendix to ind news 2009: Size of different TLDs
18
Appendix to ind news 2010: Size of different TLDs
18
Appendix to ind news 2011: Size of different TLDs
18
Appendix to ind news 2012: Size of different TLDs
19
Appendix to ind newscrawl 2011: Size of different TLDs
19
Appendix to ind newscrawl 2012: Size of different TLDs
19
Appendix to ind web 2011: Size of different TLDs
20
Appendix to ind web 2012: Size of different TLDs
20
Appendix to ind mixed 2012: Size of different TLDs
20
Appendix to ind news 2007: Size of largest domains
21
Appendix to ind news 2008: Size of largest domains
21
Appendix to ind news 2009: Size of largest domains
22
Appendix to ind news 2010: Size of largest domains
22
Appendix to ind news 2011: Size of largest domains
23
Appendix to ind news 2012: Size of largest domains
23
Appendix to ind newscrawl 2011: Size of largest domains
24
Appendix to ind newscrawl 2012: Size of largest domains
24
Appendix to ind web 2011: Size of largest domains
25
Appendix to ind web 2012: Size of largest domains
26
Appendix to ind mixed 2012: Size of largest domains
26
Appendix to ind news 2007: Number of sources by time period
27
Appendix to ind news 2008: Number of sources by time period
28
Appendix to ind news 2009: Number of sources by time period
29
Appendix to ind news 2010: Number of sources by time period
31
Appendix to ind news 2011: Number of sources by time period
32
Appendix to ind news 2012: Number of sources by time period
33
Word details
35
Appendix to ind news 2007: Words by length without multiplicity
35
Appendix to ind news 2008: Words by length without multiplicity
36
Appendix to ind news 2009: Words by length without multiplicity
38
Appendix to ind news 2010: Words by length without multiplicity
40
Appendix to ind news 2011: Words by length without multiplicity
42
Appendix to ind news 2012: Words by length without multiplicity
44
Appendix to ind newscrawl 2011: Words by length without multiplicity
46
Appendix to ind newscrawl 2012: Words by length without multiplicity
48
Appendix to ind wikipedia 2007: Words by length without multiplicity
50
Appendix to ind wikipedia 2012: Words by length without multiplicity
52
Appendix to ind web 2011: Words by length without multiplicity
54
Appendix to ind web 2012: Words by length without multiplicity
56
Appendix to ind mixed 2012: Words by length without multiplicity
58
Appendix to ind news 2007: Words by length with multiplicity
60
Appendix to ind news 2008: Words by length with multiplicity
62
Appendix to ind news 2009: Words by length with multiplicity
64
Appendix to ind news 2010: Words by length with multiplicity
66
Appendix to ind news 2011: Words by length with multiplicity
68
Appendix to ind news 2012: Words by length with multiplicity
70
Appendix to ind newscrawl 2011: Words by length with multiplicity
72
Appendix to ind newscrawl 2012: Words by length with multiplicity
74
Appendix to ind wikipedia 2007: Words by length with multiplicity
76
Appendix to ind wikipedia 2012: Words by length with multiplicity
78
Appendix to ind web 2011: Words by length with multiplicity
80
Appendix to ind web 2012: Words by length with multiplicity
82
Appendix to ind mixed 2012: Words by length with multiplicity
84
Appendix to ind news 2007: The most frequent 50 words
85
Appendix to ind news 2008: The most frequent 50 words
86
Appendix to ind news 2009: The most frequent 50 words
87
Appendix to ind news 2010: The most frequent 50 words
88
Appendix to ind news 2011: The most frequent 50 words
89
Appendix to ind news 2012: The most frequent 50 words
90
Appendix to ind newscrawl 2011: The most frequent 50 words
91
Appendix to ind newscrawl 2012: The most frequent 50 words
92
Appendix to ind wikipedia 2007: The most frequent 50 words
93
Appendix to ind wikipedia 2012: The most frequent 50 words
94
Appendix to ind web 2011: The most frequent 50 words
95
Appendix to ind web 2012: The most frequent 50 words
96
Appendix to ind mixed 2012: The most frequent 50 words
97
Appendix to ind news 2007: Longest words in top-1.000 by rank
98
Appendix to ind news 2008: Longest words in top-1.000 by rank
99
Appendix to ind news 2009: Longest words in top-1.000 by rank
100
Appendix to ind news 2010: Longest words in top-1.000 by rank
101
Appendix to ind news 2011: Longest words in top-1.000 by rank
102
Appendix to ind news 2012: Longest words in top-1.000 by rank
103
Appendix to ind newscrawl 2011: Longest words in top-1.000 by rank
104
Appendix to ind newscrawl 2012: Longest words in top-1.000 by rank
105
Appendix to ind wikipedia 2007: Longest words in top-1.000 by rank
106
Appendix to ind wikipedia 2012: Longest words in top-1.000 by rank
107
Appendix to ind web 2011: Longest words in top-1.000 by rank
108
Appendix to ind web 2012: Longest words in top-1.000 by rank
109
Appendix to ind mixed 2012: Longest words in top-1.000 by rank
110
Character N-gram details
111
Appendix to ind news 2007: Alphabet as used in the top-100.000 words
111
Appendix to ind news 2008: Alphabet as used in the top-100.000 words
112
Appendix to ind news 2009: Alphabet as used in the top-100.000 words
113
Appendix to ind news 2010: Alphabet as used in the top-100.000 words
114
Appendix to ind news 2011: Alphabet as used in the top-100.000 words
115
Appendix to ind news 2012: Alphabet as used in the top-100.000 words
116
Appendix to ind newscrawl 2011: Alphabet as used in the top-100.000 words
117
Appendix to ind newscrawl 2012: Alphabet as used in the top-100.000 words
118
Appendix to ind wikipedia 2007: Alphabet as used in the top-100.000 words
119
Appendix to ind wikipedia 2012: Alphabet as used in the top-100.000 words
121
Appendix to ind web 2011: Alphabet as used in the top-100.000 words
122
Appendix to ind web 2012: Alphabet as used in the top-100.000 words
123
Appendix to ind mixed 2012: Alphabet as used in the top-100.000 words
124
Abbreviation details
126
Appendix to ind news 2007: Most frequent abbreviations
126
Appendix to ind news 2008: Most frequent abbreviations
127
Appendix to ind news 2009: Most frequent abbreviations
128
Appendix to ind news 2010: Most frequent abbreviations
129
Appendix to ind news 2011: Most frequent abbreviations
130
Appendix to ind news 2012: Most frequent abbreviations
131
Appendix to ind newscrawl 2011: Most frequent abbreviations
132
Appendix to ind newscrawl 2012: Most frequent abbreviations
133
Appendix to ind wikipedia 2007: Most frequent abbreviations
134
Appendix to ind wikipedia 2012: Most frequent abbreviations
135
Appendix to ind web 2011: Most frequent abbreviations
136
Appendix to ind web 2012: Most frequent abbreviations
137
Appendix to ind mixed 2012: Most frequent abbreviations
138
Appendix to ind news 2007: Left neighbors of the full stop
139
Appendix to ind news 2008: Left neighbors of the full stop
140
Appendix to ind news 2009: Left neighbors of the full stop
141
Appendix to ind news 2010: Left neighbors of the full stop
142
Appendix to ind news 2011: Left neighbors of the full stop
143
Appendix to ind news 2012: Left neighbors of the full stop
144
Appendix to ind newscrawl 2011: Left neighbors of the full stop
145
Appendix to ind newscrawl 2012: Left neighbors of the full stop
146
Appendix to ind wikipedia 2007: Left neighbors of the full stop
147
Appendix to ind wikipedia 2012: Left neighbors of the full stop
148
Appendix to ind web 2011: Left neighbors of the full stop
149
Appendix to ind web 2012: Left neighbors of the full stop
150
Appendix to ind mixed 2012: Left neighbors of the full stop
151
Appendix to ind news 2007: Left neighbors of the full stop with additional internal full stops
152
Appendix to ind news 2008: Left neighbors of the full stop with additional internal full stops
152
Appendix to ind news 2009: Left neighbors of the full stop with additional internal full stops
153
Appendix to ind news 2010: Left neighbors of the full stop with additional internal full stops
154
Appendix to ind news 2011: Left neighbors of the full stop with additional internal full stops
155
Appendix to ind news 2012: Left neighbors of the full stop with additional internal full stops
156
Appendix to ind newscrawl 2011: Left neighbors of the full stop with additional internal full stops 157 Appendix to ind newscrawl 2012: Left neighbors of the full stop with additional internal full stops 158 Appendix to ind wikipedia 2007: Left neighbors of the full stop with additional internal full stops
159
Appendix to ind wikipedia 2012: Left neighbors of the full stop with additional internal full stops
160
Appendix to ind web 2011: Left neighbors of the full stop with additional internal full stops
161
Appendix to ind web 2012: Left neighbors of the full stop with additional internal full stops
162
Appendix to ind mixed 2012: Left neighbors of the full stop with additional internal full stops
163
Sentences details
164
Appendix to ind news 2007: Shortest sentences
164
Appendix to ind news 2008: Shortest sentences
165
Appendix to ind news 2009: Shortest sentences
166
Appendix to ind news 2010: Shortest sentences
168
Appendix to ind news 2011: Shortest sentences
169
Appendix to ind news 2012: Shortest sentences
171
Appendix to ind newscrawl 2011: Shortest sentences
172
Appendix to ind newscrawl 2012: Shortest sentences
174
Appendix to ind wikipedia 2007: Shortest sentences
175
Appendix to ind wikipedia 2012: Shortest sentences
177
Appendix to ind web 2011: Shortest sentences
178
Appendix to ind web 2012: Shortest sentences
180
Appendix to ind mixed 2012: Shortest sentences
181
Appendix to ind news 2007: Longest sentences
183
Appendix to ind news 2008: Longest sentences
184
Appendix to ind news 2009: Longest sentences
186
Appendix to ind news 2010: Longest sentences
187
Appendix to ind news 2011: Longest sentences
189
Appendix to ind news 2012: Longest sentences
191
Appendix to ind newscrawl 2011: Longest sentences
193
Appendix to ind newscrawl 2012: Longest sentences
195
Appendix to ind wikipedia 2007: Longest sentences
197
Appendix to ind wikipedia 2012: Longest sentences
199
Appendix to ind web 2011: Longest sentences
201
Appendix to ind web 2012: Longest sentences
203
Appendix to ind mixed 2012: Longest sentences
205
Appendix to ind news 2007: Length of sentences in characters
207
Appendix to ind news 2008: Length of sentences in characters
208
Appendix to ind news 2009: Length of sentences in characters
209
Appendix to ind news 2010: Length of sentences in characters
210
Appendix to ind news 2011: Length of sentences in characters
211
Appendix to ind news 2012: Length of sentences in characters
212
Appendix to ind newscrawl 2011: Length of sentences in characters
213
Appendix to ind newscrawl 2012: Length of sentences in characters
214
Appendix to ind wikipedia 2007: Length of sentences in characters
215
Appendix to ind wikipedia 2012: Length of sentences in characters
216
Appendix to ind web 2011: Length of sentences in characters
217
Appendix to ind web 2012: Length of sentences in characters
218
Appendix to ind mixed 2012: Length of sentences in characters
219
Appendix to ind news 2007: Length of sentences in words
220
Appendix to ind news 2008: Length of sentences in words
221
Appendix to ind news 2009: Length of sentences in words
222
Appendix to ind news 2010: Length of sentences in words
223
Appendix to ind news 2011: Length of sentences in words
224
Appendix to ind news 2012: Length of sentences in words
225
Appendix to ind newscrawl 2011: Length of sentences in words
226
Appendix to ind newscrawl 2012: Length of sentences in words
227
Appendix to ind wikipedia 2007: Length of sentences in words
228
Appendix to ind wikipedia 2012: Length of sentences in words
229
Appendix to ind web 2011: Length of sentences in words
230
Appendix to ind web 2012: Length of sentences in words
231
Appendix to ind mixed 2012: Length of sentences in words
232
Oddities details
233
Appendix to ind news 2007: Longest words
233
Appendix to ind news 2008: Longest words
233
Appendix to ind news 2009: Longest words
234
Appendix to ind news 2010: Longest words
234
Appendix to ind news 2011: Longest words
235
Appendix to ind news 2012: Longest words
235
Appendix to ind newscrawl 2011: Longest words
236
Appendix to ind newscrawl 2012: Longest words
236
Appendix to ind wikipedia 2007: Longest words
237
Appendix to ind wikipedia 2012: Longest words
237
Appendix to ind web 2011: Longest words
238
Appendix to ind web 2012: Longest words
238
Appendix to ind mixed 2012: Longest words
239
Appendix to ind news 2007: Sentences with high average word length
239
Appendix to ind news 2008: Sentences with high average word length
240
Appendix to ind news 2009: Sentences with high average word length
241
Appendix to ind news 2010: Sentences with high average word length
242
Appendix to ind news 2011: Sentences with high average word length
243
Appendix to ind news 2012: Sentences with high average word length
244
Appendix to ind newscrawl 2011: Sentences with high average word length
245
Appendix to ind newscrawl 2012: Sentences with high average word length
246
Appendix to ind wikipedia 2007: Sentences with high average word length
247
Appendix to ind wikipedia 2012: Sentences with high average word length
248
Appendix to ind web 2011: Sentences with high average word length
249
Appendix to ind web 2012: Sentences with high average word length
250
Appendix to ind mixed 2012: Sentences with high average word length
251
Appendix to ind news 2007: Problems with sentence segmentation - words ending in a stopword
252
Appendix to ind news 2008: Problems with sentence segmentation - words ending in a stopword
253
Appendix to ind news 2009: Problems with sentence segmentation - words ending in a stopword
253
Appendix to ind news 2010: Problems with sentence segmentation - words ending in a stopword
254
Appendix to ind news 2011: Problems with sentence segmentation - words ending in a stopword
255
Appendix to ind news 2012: Problems with sentence segmentation - words ending in a stopword
255
Appendix to ind newscrawl 2011: Problems with sentence segmentation - words ending in a stopword 256 Appendix to ind newscrawl 2012: Problems with sentence segmentation - words ending in a stopword 257 Appendix to ind wikipedia 2007: Problems with sentence segmentation - words ending in a stopword 258 Appendix to ind wikipedia 2012: Problems with sentence segmentation - words ending in a stopword 258 Appendix to ind web 2011: Problems with sentence segmentation - words ending in a stopword
259
Appendix to ind web 2012: Problems with sentence segmentation - words ending in a stopword
259
Appendix to ind mixed 2012: Problems with sentence segmentation - words ending in a stopword 260
1
Indonesean corpora Introduction to corpus creation The Leipzig Corpora Collection (LCC) collects Web based corpora for many different languages. The main text genres are newspaper texts, Wikipedias and randomly collected web pages. All corpora are processed in the same way: • • • • • • •
Crawling Web pages HTML stripping Language identifikation Sentence segmentation Cleaning: Removal of ill-formed sentences Duplicate removal Calculation of word frequences and word co-occurrences
As result we have a corpus containing only well-formed sentences in the language under consideration. The sentences are in random order; hence, sharing the corpus does not violate copyright law because it is impossible to reconstruct the original texts. The pre-processing steps contain both language independent steps (like HTML stripping and duplicate removal) and language dependent steps (like language identification and sentence segmentation). Especially the language specific parts are vulnerable to specific processing problems. The aim of the paper is to identify possible problems and evaluate the results. The following problems are adressed: • • • • • •
A processing-focused language description Language size: How much text is available for this language? What are the biggest sources? Corpus description: Genre, size, crawling and processing date. Possible problems in language identification: Which languages are similar? Character set and alphabet Inspecting the word list: Most frequent words, longer high frequent words and longest words at all. Word length distribution. • Can abbreviations confuse sentence segmentation? Information about the abbreviation list. • Inspecting sentences: Inspect shortest and longest sentences to identify possible segmentation problems. Sentence length distribution. The paper describes the result of these inspections; the appendices show the exact results for the different corpora. This helps to compare the corpora with respect to quality. In the section quality overview, an overall quality description for each corpus is given. All corpora contain only minor problems which are irrelevant for most applications. Otherwise the corpus creation has been iterated.
IND - a processing related language description
IND - a processing related language description Language description: Indonesian General properties of the language • • • • •
Native Name: Bahasa Indonesia Classifiation: Austronesian, Malayo-Polynesian, Malayo-Chamic, Malayic, Malay Total Number of Speakers: 23M Largest countries with number of spakers: Indonesia (22.8M) Source: http://www.ethnologue.com/language/ind
Properties important for processing Alphabet and punctuation • The script is latin • Usual latin punctuation • Usage of uppercase letters: • At sentence beginnings and • for proper names (of persons, organisations, countries etc.).
Sentence segmentation and word tokenization • Sentence beginnings • Usually, sentencees begin with a capitalized first word. • Abbreviations • Abbreviations confusing with sentence boundaries: Special abbreviation list has to be inspected. • Sources for abbreviations: ??? • Abbreviations with full stop may appear in the word list without full stop. • Apostrophes • Use of apostrophes: infrequent. • Frequency ratio compared with comma in ukr_mixed_2012: '/, = 323.478 / 24.755.368 • Multiwords • Number of multiwords: 50.965 • source: Wikipedia
2
IND - a processing related language description
Sources • Estimated number of webpages containing text
• • • • •
• Google.com top-5 words: 4,940,000 results for +"yang" +"dan" +"di" +"dengan" +"ini" • Google.com top-10 words: 6,160,000 results for +"yang" +"dan" +"di" +"dengan" +"ini" +"itu" +"untuk" +"dari" +"tidak" +"dalam" Rank according to number of speakers (Ethnologue): 42 Rank according to Wikipedia size 3/2013 (see http://de.wikipedia.org/wiki/Wikipedia:Sprachen): Rank 26 with 205.000 articles. Rank according to number of newspapers as found by AbyZ (5/2012): 82 newspapers, rank 25. Rank according to number of newspapers with RSS feeds (5/2012): 14 newspapers, rank 33. Rank according to our corpus size (9/2012): 13
IND corpora Quality Overview Quality Ratings • A: Very good quality. Ready to use (or already used) for frequency dictionary. • Size as large as possible • Only minimal errors • Multiple genres (if possible) • A-: Small problems identified. They should not affect usage. • B: Native speaker quality. • Information about abbreviations and sentence boundaries by native speaker • Resulting statistics checked by native speaker, possible errors corrected • C: Non-native speaker quality • Obvious problems shown in corpus statistics are corrected • D: First version • Pre-processing with default abbreviation list and default sentence boundaries • E: Poor Quality: Old, outdated or faulty.
Corpus Quality
3
IND corpora
4
Corpus
Quality rating Known problems
to-dos
ind_news_2007
A-
very small corpus, only BBC -
ind_news_2008
A
-
-
ind_news_2009
A
-
-
ind_news_2010
A
-
-
ind_news_2011
A
-
-
ind_news_2012
A
-
-
ind_newscrawl_2011 A
-
-
ind_newscrawl_2012 A
-
-
ind_wikipedia_2007
A
-
-
ind_wikipedia_2012
A
-
-
ind_web_2011
A
-
-
ind_web_2012
A
-
-
ind_mixed_2012
A
-
-
Processing Overview For more details, see Appendix: Database Summary and Appendix: Number of sources by time period. Corpus
Size (M sentences) Size (M running words) Multiwords Crawling date
Production date
ind_news_2007
0.007
0.13
0
daily March to May 2007 2012
ind_news_2008
0.34
6.5
10229
daily 2008
2012
ind_news_2009
0.32
6.2
9124
daily 2009
2012
ind_news_2010
0.44
8.5
10171
daily 2010
2012
ind_news_2011
0.41
7.9
10008
daily 2011
2012
ind_news_2012
0.47
9.1
11119
daily 2012
2012
ind_newscrawl_2011 5.9
97
24931
batch crawling 2011
2012
ind_newscrawl_2012 6.1
102
24414
batch crawling 2012
2012
ind_wikipedia_2007
0.3
4.8
30105
dump 2007
2007
ind_wikipedia_2012
0.4
7.1
29579
dump 2012
2012
ind_web_2011
0.5
8.3
7925
randomly 2011
2012
ind_web_2012
17.5
276
40463
randomly 2012
2013
ind_mixed_2012
25.5
409
50828
-
2012
IND corpora
5
Content Overview For more details, see Appendix: Size of different TLDs and Appendix: Size of different domains. Corpus
Type of sources Countries
Number of sources Publishing date Biggest source
ind_news_2007
News
uk
1 newspapers
2007
www.bbc.co.uk
ind_news_2008
News
id, uk
3 newspapers
2008
www.antara.co.id
ind_news_2009
News
com, id, uk
6 newspapers
2009
www.antaranews.com
ind_news_2010
News
com
6 newspapers
2010
www.antaranews.com
ind_news_2011
News
com
3 newspapers
2011
www.antaranews.com
ind_news_2012
News
com
6 newspapers
2011
www.antaranews.com
ind_newscrawl_2011 News
com, id
41 newspapers
2011 and before www.surya.co.id
ind_newscrawl_2012 News
com, id
33 newspapers
2011 and before www.suarakarya-online.com
ind_wikipedia_2007
Wikipedia
-
1
2007 and before wikipedia.org
ind_wikipedia_2010
Wikipedia
-
1
2010 and before wikipedia.org
ind_web_2011
Web
id, com
3723
2002 and before adbmcadangan.wordpress.com
ind_web_2012
Web
com, org, id. 33992 domains
2011 and before www.skyscrapercity.com
ind_mixed_2012
combined
combined
2012 and before www.surya.co.id
88072 domains
Words Appendix: Words by Length without multiplicity shows a plot of the corresponding length distribution. A smooth asymetric bell-shaped curve is expected. Appendix: Words by Length with multiplicity shows a plot of the corresponding length distribution. A smooth asymetric bell-shaped curve is expected. Appendix: The Most Frequent 50 Words shows the most frequent stopwords as well as one or more words related to the region. Appendix: Longest Words in Top-1000 by rank shows the 25 longest words within the top-1000. They usually give an impression of the main topics treated in the corpus. Appendix: Longest Words with minimum frequency 2 should give an idea of very long words. In the case of processing problems, different types of non-words may appear. This might help to improve the word definition. Corpus
Word length graph without multiplicity
Word length graph with multiplicity
Most Frequent 50 Words
Longest Words in Top-1000
Longest Words with minimum frequency 2
ind_news_2007
okay
okay
okay
okay
E-mail adress
ind_news_2008
okay
okay
okay
okay
routes
ind_news_2009
okay
okay
okay
okay
missing blanks, URLs, routes
ind_news_2010
okay
okay
okay
okay
routes
ind_news_2011
okay
okay
okay
okay
routes
ind_news_2012
okay
okay
okay
okay
routes, URLs, numbers and special characters
ind_newscrawl_2011 okay
okay
okay
okay
routes, URLs, special characters
IND corpora
6
ind_newscrawl_2012 okay
okay
okay
okay
routes
ind_wikipedia_2007
okay
okay
okay
Pengguna(-pengguna included
routes
ind_wikipedia_2010
okay
okay
okay
okay
routes, numbers and special characters
ind_web_2011
okay
okay
okay
okay
missing blanks, chemicals, non-utf8
ind_web_2012
okay
okay
okay
okay
missing blanks
ind_mixed_2012
okay
okay
okay
okay
all above
Abbreviations Abbreviations are usually not used as sentence boundaries. Conversely, missing abbreviations can overgenerate sentence boundaries. Due to limitations in the processing chain, the list of abbreviations used for sentence boundary detection can differ from the abbreviations in the word list. • Appendix: Most Frequent Abbreviations shows possible under-generation of sentence boundaries by wrong abbreviations (i.e. words ending in a full stop) in the word list.
Sentences Appendix: Shortest sentences shows the shortest declarative, exclamatory and interrogative sentences. In preprocessing, a minimal length for sentences might be specified. And missing abbreviations are often visible as faulty sentence engings. Appendix: Longest sentences shows the longest declarative, exclamatory and interrogative sentences. Usually, the maximun sentence length is defined as 256 characters (not 256 bytes). Very long exclamatory or interrogative sentences often contain an overseen sentence boundary. Appendix: Length of sentences in characters shows the distribution of the sentence length. A large and balanced corpus will result in a smooth and bell-shaped curve. Isolated local maxima usually result from large sets of near duplicate sentences. Corpus
Shortest sentences Longest sentences Length distribution (in characters) Length distribution (in words)
ind_news_2007
okay
okay
okay
okay
ind_news_2008
okay
okay
okay
okay
ind_news_2009
okay
okay
okay
okay
ind_news_2010
okay
okay
okay
okay
ind_news_2011
okay
okay
okay
okay
ind_news_2012
okay
okay
okay
okay
ind_newscrawl_2011 okay
okay
okay
okay
ind_newscrawl_2012 okay
okay
okay
okay
ind_wikipedia_2007
okay
okay
okay
okay
ind_wikipedia_2010
okay
okay
okay
okay
ind_web_2011
okay
okay
okay
okay
ind_web_2012
okay
non-utf8
okay
okay
IND corpora
ind_mixed_2012
7 okay
non-utf8
okay
okay
Oddities Appendix: Sentences with high average word length: Average sentences contain many stopwords, and these stopwords are usually short. Hence, they restrict the average word length in a sentence. Conversely, sentences with high average word length are often ill formed. They may be used to improve pre-processing. Appendix: Problems with sentence segmentation - Words ending in a stopword: If there are many ill-formed word or sentence boundaries witout a blank between two words, they will generate new ill-formed words. The appendix shows the most frequent words ending in an uppercase stopword. If they are infrequent then the date were of high quality. Corpus
Sentences with high average word length Words ending in a stopword
ind_news_2007
okay
okay
ind_news_2008
okay
okay
ind_news_2009
okay
maxfreq=7
ind_news_2010
okay
maxfreq=10
ind_news_2011
okay
maxfreq=43
ind_news_2012
okay
maxfreq=11
ind_newscrawl_2011 special characters included
maxfreq=30
ind_newscrawl_2012 okay
maxfreq=117
ind_wikipedia_2007
okay
okay
ind_wikipedia_2010
okay
okay
ind_web_2011
okay
maxfreq=24
ind_web_2012
special characters, missing blanks
maxfreq=33
ind_mixed_2012
as above
maxfreq=49
IND corpus comparison
IND corpus comparison Automated Corpus comparison For the conducted comparisons, the following tests on the top-1000 words are performed: • Vectors based on the frequencies of the top-1000 words are created for the analysed languages. The cosine of the angle between these vectors is computed. Identical languages receive a value of 0, distinct languages get a value of 1. • The same analysis is conducted using the frequencies of the top-1000 typical letter trigrams of the languages.
Monolingual word list comparison (top-1000 words) As one can expect the comparisons show: • • • •
The different news corpora have word lists with maximum distance 0.26 (newscrawl_2012 and news_2007) The web corpora have word lists with distance 0.14 The wikipedia corpora are similar with distance 0.06 The biggest distance of 0.40 can be found between web_2011 and news_2007
• The mixed corpus ind_mixed_2012 has a central position within the corpora and has a maximum distance of 0.30 to the news_2007 corpus
Multilingual word list comparison (top-1000 words) Both the comparison of the top-1000 words and the comparison of the letter trigrams used in these words were conducted to find the most similar languages to Indonesian based on these features. The distance of Indonesian to the next languages Malay are 0.50 for the words and 0.25 for the letter trigrams. These distances are below average. On average the value for the most similar language to a language in question is 0.58 for trigrams. • The most similar languages based on words: Malay, Minangkabau, Aceh +--------+---------------------+---------------+-------------+ | source | language_short_name | language_name | cos_logfreq | +--------+---------------------+---------------+-------------+ | ind | zlm | Malay | 0.495258 | | ind | min | Minangkabau | 0.808961 | | ind | ace | Aceh | 0.902675 | | ind | iba | Iban | 0.915809 | | ind | kyk | Kamayo | 0.929115 | +--------+---------------------+---------------+-------------+ • The most similar languages based on letter trigrams: Malay, Iban, Sunda +--------+---------------------+---------------+-------------+ | source | language_short_name | language_name | cos_logfreq | +--------+---------------------+---------------+-------------+ | ind | zlm | Malay | 0.251768 | | ind | iba | Iban | 0.383402 | | ind | sun | Sunda | 0.46436 | | ind | ban | Bali | 0.467682 | | ind | min | Minangkabau | 0.484185 | +--------+---------------------+---------------+-------------+
8
IND corpus comparison .
9
10
Processing details Appendix to ind news 2007: Database summary Values for some general parameters Parameter
Value
Number of sentences
7236
Number of running word forms
125296
Number of distinct word forms
13719
Number of multiwords
0
Percentage of words with frequency=1
46.3080
Number of sentence based co-occurrences 35018 Number of neighbour co-occurrences
6013
Appendix to ind news 2008: Database summary Values for some general parameters Parameter
Value
Number of sentences
336592
Number of running word forms
6541878
Number of distinct word forms
155705
Number of multiwords
10229
Percentage of words with frequency=1
48.8758
Number of sentence based co-occurrences 2107370 Number of neighbour co-occurrences
249877
Appendix to ind news 2009: Database summary
11
Appendix to ind news 2009: Database summary Values for some general parameters Parameter
Value
Number of sentences
317910
Number of running word forms
6173814
Number of distinct word forms
147413
Number of multiwords
9124
Percentage of words with frequency=1
48.9726
Number of sentence based co-occurrences 2003644 Number of neighbour co-occurrences
237754
Appendix to ind news 2010: Database summary Values for some general parameters Parameter
Value
Number of sentences
439195
Number of running word forms
8534823
Number of distinct word forms
186328
Number of multiwords
10171
Percentage of words with frequency=1
48.9857
Number of sentence based co-occurrences 2703582 Number of neighbour co-occurrences
311564
Appendix to ind news 2011: Database summary
12
Appendix to ind news 2011: Database summary Values for some general parameters Parameter
Value
Number of sentences
405881
Number of running word forms
7866451
Number of distinct word forms
179256
Number of multiwords
10008
Percentage of words with frequency=1
49.2056
Number of sentence based co-occurrences 2468252 Number of neighbour co-occurrences
290163
Appendix to ind news 2012: Database summary Values for some general parameters Parameter
Value
Number of sentences
471052
Number of running word forms
9148998
Number of distinct word forms
195999
Number of multiwords
11119
Percentage of words with frequency=1
48.5666
Number of sentence based co-occurrences 2958708 Number of neighbour co-occurrences
329015
Appendix to ind newscrawl 2011: Database summary
13
Appendix to ind newscrawl 2011: Database summary Values for some general parameters Parameter
Value
Number of sentences
5886082
Number of running word forms
97241502
Number of distinct word forms
939597
Number of multiwords
24931
Percentage of words with frequency=1
53.2411
Number of sentence based co-occurrences 20860270 Number of neighbour co-occurrences
2115857
Appendix to ind newscrawl 2012: Database summary Values for some general parameters Parameter
Value
Number of sentences
6100367
Number of running word forms
102416303
Number of distinct word forms
932486
Number of multiwords
24414
Percentage of words with frequency=1
53.3653
Number of sentence based co-occurrences 20647936 Number of neighbour co-occurrences
2100839
Appendix to ind wikipedia 2007: Database summary
14
Appendix to ind wikipedia 2007: Database summary Values for some general parameters Parameter
Value
Number of sentences
309021
Number of running word forms
4817254
Number of distinct word forms
222059
Number of multiwords
30105
Percentage of words with frequency=1
54.4981
Number of sentence based co-occurrences 1455618 Number of neighbour co-occurrences
180186
Appendix to ind wikipedia 2012: Database summary Values for some general parameters Parameter
Value
Number of sentences
431240
Number of running word forms
7114024
Number of distinct word forms
311339
Number of multiwords
29579
Percentage of words with frequency=1
56.0906
Number of sentence based co-occurrences 1762738 Number of neighbour co-occurrences
244838
Appendix to ind web 2011: Database summary
15
Appendix to ind web 2011: Database summary Values for some general parameters Parameter
Value
Number of sentences
553001
Number of running word forms
8291866
Number of distinct word forms
226687
Number of multiwords
7925
Percentage of words with frequency=1
52.3647
Number of sentence based co-occurrences 2373432 Number of neighbour co-occurrences
278583
Appendix to ind web 2012: Database summary Values for some general parameters Parameter
Value
Number of sentences
17530141
Number of running word forms
276435833
Number of distinct word forms
2903844
Number of multiwords
40463
Percentage of words with frequency=1
62.1105
Number of sentence based co-occurrences
42485420
Number of neighbour co-occurrences
4567597
Number of distributional similar word pairs (NOT READY) 0 Number of similar sentence pairs (NOT READY)
0
Appendix to ind mixed 2012: Database summary
16
Appendix to ind mixed 2012: Database summary Values for some general parameters Parameter
Value
Number of sentences
25454531
Number of running word forms
408948133
Number of distinct word forms
3523306
Number of multiwords
50828
Percentage of words with frequency=1
61.0046
Number of sentence based co-occurrences 63488686 Number of neighbour co-occurrences
6250104
17
Content details Appendix to ind news 2007: Size of different TLDs TLDs larger than 1% TLD # of sources .uk/
568
% 100.00
Appendix to ind news 2008: Size of different TLDs TLDs larger than 1% TLD # of sources
%
.id/
33260
90.24
.uk/
3599
9.76
Appendix to ind news 2009: Size of different TLDs
18
Appendix to ind news 2009: Size of different TLDs TLDs larger than 1% TLD # of sources
%
com/ 14692
46.30
.id/
13561
42.74
.uk/
3479
10.96
Appendix to ind news 2010: Size of different TLDs TLDs larger than 1% TLD # of sources com/ 44032
% 99.38
Appendix to ind news 2011: Size of different TLDs TLDs larger than 1% TLD # of sources com/ 43221
% 99.56
Appendix to ind news 2012: Size of different TLDs
19
Appendix to ind news 2012: Size of different TLDs TLDs larger than 1% TLD # of sources com/ 48439
% 99.09
Appendix to ind newscrawl 2011: Size of different TLDs TLDs larger than 1% TLD # of sources
%
com/ 341420
64.94
.id/
35.06
184318
Appendix to ind newscrawl 2012: Size of different TLDs TLDs larger than 1% TLD # of sources
%
com/ 439848
84.55
.id/
14.69
76425
Appendix to ind web 2011: Size of different TLDs
20
Appendix to ind web 2011: Size of different TLDs TLDs larger than 1% TLD # of sources .id/
%
23752
59.02
com/ 12700
31.56
.my/
3.20
1287
Appendix to ind web 2012: Size of different TLDs TLDs larger than 1% TLD # of sources
%
com/ 169935
85.94
org/
11421
5.78
.id/
5755
2.91
net/
4848
2.45
Appendix to ind mixed 2012: Size of different TLDs TLDs larger than 1% TLD # of sources
%
com/ 624666
65.66
.id/
257106
27.02
tp:/
36620
3.85
org/
11776
1.24
Appendix to ind news 2007: Size of largest domains
21
Appendix to ind news 2007: Size of largest domains Largest domains Source
# of sentences
www.bbc.co.uk/ 7259
# of distinct sources 1
Appendix to ind news 2008: Size of largest domains Largest domains Source
# of sentences
www.antara.co.id/
296203
www.bbc.co.uk/
38114
euro2008.antara.co.id/ 2452
# of distinct sources 3
Appendix to ind news 2009: Size of largest domains
22
Appendix to ind news 2009: Size of largest domains Largest domains Source
# of sentences
www.antaranews.com/
140514
www.antara.co.id/
112139
www.bbc.co.uk/
41384
pemilu.antara.co.id/
19595
pemilu.antaranews.com/ 4525 newsforums.bbc.co.uk/
8
# of distinct sources 6
Appendix to ind news 2010: Size of largest domains Largest domains Source www.antaranews.com/
# of sentences 417063
pialadunia.antaranews.com/ 9917 otomotif.antaranews.com/
4117
ramadhan.antaranews.com/ 3596 infohaji.antaranews.com/
2512
www.bbc.co.uk/
1990
# of distinct sources 6
Appendix to ind news 2011: Size of largest domains
23
Appendix to ind news 2011: Size of largest domains Largest domains Source www.antaranews.com/
# of sentences 400028
otomotif.antaranews.com/ 4080 www.bbc.co.uk/
1773
# of distinct sources 3
Appendix to ind news 2012: Size of largest domains Largest domains Source www.antaranews.com/
# of sentences 445521
ramadhan.antaranews.com/ 9154 otomotif.antaranews.com/
6632
olimpiade.antaranews.com/ 6490 www.bbc.co.uk/
1778
www.radioaustralia.net.au/ 1477
# of distinct sources 6
Appendix to ind newscrawl 2011: Size of largest domains
24
Appendix to ind newscrawl 2011: Size of largest domains Largest domains Source
# of sentences
www.surya.co.id/
1075214
www.indosiar.com/
598017
www.sinarharapan.co.id/
513160
www.lampungpost.com/
505303
www.hariankomentar.com/
462231
www.suarakarya-online.com/ 436711 www.equator-news.com/
355870
www.tempointeraktif.com/
354872
www.kr.co.id/
327543
www.mediaindonesia.com/
226426
# of distinct sources 41
Appendix to ind newscrawl 2012: Size of largest domains Largest domains Source
# of sentences
www.suarakarya-online.com/ 1339274 www.bisnis.com/
726615
www.analisadaily.com/
722667
www.suaramerdeka.com/
642605
www.hariankomentar.com/
487580
www.republika.co.id/
381672
www.indosiar.com/
314614
www.waspada.co.id/
291627
www.bolanews.com/
209659
www.gatra.com/
181135
# of distinct sources 33
Appendix to ind newscrawl 2012: Size of largest domains
25
Appendix to ind web 2011: Size of largest domains Largest domains Source
# of sentences
adbmcadangan.wordpress.com/ 253858 adln.lib.unair.ac.id/
41758
abusalma.wordpress.com/
12021
adesiti.multiply.com/
7392
adhisimon.or.id/
7102
adinfopluit.blogspot.com/
6788
abumie.wordpress.com/
5712
abumuslimsalafi.multiply.com/ 4418 abunyasyamil.multiply.com/
4335
www.kelola.or.id/
3869
# of distinct sources 3723
Appendix to ind web 2012: Size of largest domains
26
Appendix to ind web 2012: Size of largest domains Largest domains Source
# of sentences
www.skyscrapercity.com/
363876
id.wikipedia.org/
127353
indonesia.faithfreedom.org/
111909
www.scribd.com/
104045
jakarta45.wordpress.com/
74735
katolisitas.org/
67260
www.sabdaspace.org/
63252
forumm.wgaul.com/
56487
www.sarapanpagi.org/
48165
www.cahayapengharapan.org/ 46592
# of distinct sources 84669
Appendix to ind mixed 2012: Size of largest domains Largest domains Source
# of sentences
www.surya.co.id/
1022913
www.antaranews.com/
957828
www.indosiar.com/
593197
www.sinarharapan.co.id/
509516
www.lampungpost.com/
497058
www.hariankomentar.com/
461589
www.suarakarya-online.com/ 426732 www.antara.co.id/
406389
www.tempointeraktif.com/
352781
www.skyscrapercity.com/
348581
# of distinct sources 88072
Appendix to ind mixed 2012: Size of largest domains
27
Appendix to ind news 2007: Number of sources by time period Number of sources by year, month, and day
Number of sources per year year # of sources 2007 568
Number of sources per month
% 100.00
Appendix to ind news 2007: Number of sources by time period
month
28
# of sources
%
2007-03 208
36.62
2007-04 222
39.08
2007-05 138
24.30
Appendix to ind news 2008: Number of sources by time period Number of sources by year, month, and day
Number of sources per year year # of sources 2008 36859
Number of sources per month
% 100.00
Appendix to ind news 2008: Number of sources by time period
month
# of sources
29
%
2008-01 2122
5.76
2008-02 2172
5.89
2008-03 3070
8.33
2008-04 2930
7.95
2008-05 3453
9.37
2008-06 3344
9.07
2008-07 3701
10.04
2008-08 3569
9.68
2008-09 3688
10.01
2008-10 3283
8.91
2008-11 2886
7.83
2008-12 2641
7.17
Appendix to ind news 2009: Number of sources by time period Number of sources by year, month, and day
Appendix to ind news 2009: Number of sources by time period
30
Number of sources per year year # of sources 2009 31732
% 100.00
Number of sources per month month
# of sources
%
2009-01 2981
9.39
2009-02 2818
8.88
2009-03 2872
9.05
2009-04 3222
10.15
2009-05 3318
10.46
2009-06 2827
8.91
2009-07 3026
9.54
2009-08 2597
8.18
2009-09 2580
8.13
2009-10 3180
10.02
2009-12 1878
5.92
Appendix to ind news 2010: Number of sources by time period
31
Appendix to ind news 2010: Number of sources by time period Number of sources by year, month, and day
Number of sources per year year # of sources 2010 44305
% 100.00
Number of sources per month month
# of sources
%
2010-01 3073
6.94
2010-02 2634
5.95
2010-03 3495
7.89
2010-04 3458
7.80
2010-05 3215
7.26
2010-06 3787
8.55
2010-07 3973
8.97
2010-08 4781
10.79
2010-09 3774
8.52
Appendix to ind news 2010: Number of sources by time period
32
2010-10 4386
9.90
2010-11 4075
9.20
2010-12 3654
8.25
Appendix to ind news 2011: Number of sources by time period Number of sources by year, month, and day
Number of sources per year year # of sources 2011 43410
Number of sources per month
% 100.00
Appendix to ind news 2011: Number of sources by time period
month
# of sources
33
%
2011-01 1083
2.49
2011-02 3795
8.74
2011-03 3934
9.06
2011-04 4074
9.38
2011-05 4208
9.69
2011-06 3862
8.90
2011-07 3790
8.73
2011-08 3805
8.77
2011-09 3370
7.76
2011-10 4191
9.65
2011-11 4308
9.92
2011-12 2990
6.89
Appendix to ind news 2012: Number of sources by time period Number of sources by year, month, and day
Appendix to ind news 2012: Number of sources by time period
34
Number of sources per year year # of sources 2012 48884
% 100.00
Number of sources per month month
# of sources
%
2012-01 4043
8.27
2012-02 3920
8.02
2012-03 4259
8.71
2012-04 3820
7.81
2012-05 4274
8.74
2012-06 3704
7.58
2012-07 3373
6.90
2012-08 4593
9.40
2012-09 3204
6.55
2012-10 4793
9.80
2012-11 4384
8.97
2012-12 4517
9.24
35
Word details Appendix to ind news 2007: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 7.3900
word length percentage 1
0.8091
2
1.4214
3
4.1402
4
8.4408
5
13.5724
6
12.6540
7
14.2576
8
12.6102
9
10.6932
Appendix to ind news 2007: Words by length without multiplicity
10
8.2586
11
5.7147
12
3.2874
13
2.2232
14
0.8528
15
0.7727
16
0.3863
17
0.1895
18
0.0948
19
0.1093
20
0.0364
21
0.0437
23
0.0073
25
0.0219
Appendix to ind news 2008: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length
36
Appendix to ind news 2008: Words by length without multiplicity
7.7257
word length percentage 1
0.0559
2
0.7444
3
4.1547
4
7.8597
5
13.4247
6
13.6521
7
13.8942
8
12.0227
9
10.4550
10
7.8334
11
6.2117
12
4.1572
13
3.4026
14
2.2832
15
1.7154
16
1.1053
17
0.9120
18
0.5992
19
0.5112
20
0.3134
21
0.2563
22
0.1766
23
0.1766
24
0.1188
25
0.1047
26
0.0706
27
0.0662
28
0.0533
29
0.0392
30
0.0340
31
0.0206
32
0.0206
33
0.0289
34
0.0206
35
0.0199
36
0.0128
37
0.0096
37
Appendix to ind news 2008: Words by length without multiplicity
38
0.0103
39
0.0090
40
0.0103
41
0.0045
42
0.0032
43
0.0006
44
0.0051
46
0.0013
47
0.0026
48
0.0006
Appendix to ind news 2009: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 7.7254
38
Appendix to ind news 2009: Words by length without multiplicity
word length percentage 1
0.0604
2
0.7828
3
4.1740
4
7.9138
5
13.8658
6
13.3251
7
13.6650
8
12.0274
9
10.1402
10
7.8616
11
6.1989
12
4.1950
13
3.3464
14
2.2393
15
1.6864
16
1.1254
17
0.9070
18
0.5766
19
0.4844
20
0.2971
21
0.2775
22
0.1852
23
0.1825
24
0.1167
25
0.1031
26
0.0787
27
0.0665
28
0.0563
29
0.0448
30
0.0326
31
0.0271
32
0.0217
33
0.0258
34
0.0231
35
0.0156
36
0.0088
37
0.0129
38
0.0102
39
Appendix to ind news 2009: Words by length without multiplicity
39
0.0136
40
0.0075
41
0.0061
42
0.0027
43
0.0027
44
0.0047
45
0.0014
46
0.0014
47
0.0014
48
0.0014
50
0.0007
Appendix to ind news 2010: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 7.8140
40
Appendix to ind news 2010: Words by length without multiplicity
word length percentage 1
0.0483
2
0.6735
3
4.0042
4
7.5566
5
13.4253
6
13.2412
7
13.8669
8
12.2258
9
10.2223
10
7.8222
11
6.2004
12
4.2431
13
3.3554
14
2.1832
15
1.7249
16
1.1093
17
0.9258
18
0.6011
19
0.4798
20
0.2877
21
0.2667
22
0.1927
23
0.1621
24
0.1030
25
0.0939
26
0.0810
27
0.0569
28
0.0515
29
0.0360
30
0.0360
31
0.0268
32
0.0236
33
0.0317
34
0.0225
35
0.0166
36
0.0123
37
0.0097
38
0.0118
41
Appendix to ind news 2010: Words by length without multiplicity
39
0.0123
40
0.0081
41
0.0043
42
0.0054
43
0.0016
44
0.0027
45
0.0011
46
0.0005
47
0.0032
48
0.0005
50
0.0011
Appendix to ind news 2011: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 7.7809
42
Appendix to ind news 2011: Words by length without multiplicity
word length percentage 1
0.0519
2
0.6806
3
4.0082
4
7.7292
5
13.4523
6
13.3418
7
13.8366
8
12.2902
9
10.2111
10
7.9155
11
6.1515
12
4.1656
13
3.3260
14
2.1734
15
1.6557
16
1.1202
17
0.8937
18
0.5528
19
0.5015
20
0.3029
21
0.2683
22
0.1729
23
0.1629
24
0.1116
25
0.0948
26
0.0681
27
0.0569
28
0.0530
29
0.0396
30
0.0285
31
0.0257
32
0.0212
33
0.0218
34
0.0223
35
0.0206
36
0.0095
37
0.0117
38
0.0117
43
Appendix to ind news 2011: Words by length without multiplicity
39
0.0078
40
0.0067
41
0.0061
42
0.0033
43
0.0017
44
0.0039
45
0.0011
46
0.0017
47
0.0022
48
0.0006
Appendix to ind news 2012: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 7.7786
44
Appendix to ind news 2012: Words by length without multiplicity
word length percentage 1
0.0459
2
0.6602
3
3.8949
4
7.6454
5
13.5154
6
13.4781
7
14.0205
8
12.3587
9
10.1975
10
7.8138
11
6.1633
12
4.1618
13
3.2633
14
2.1444
15
1.7107
16
1.0939
17
0.8745
18
0.5597
19
0.4949
20
0.3010
21
0.2607
22
0.1811
23
0.1750
24
0.1199
25
0.0980
26
0.0704
27
0.0622
28
0.0526
29
0.0454
30
0.0352
31
0.0240
32
0.0235
33
0.0281
34
0.0224
35
0.0199
36
0.0122
37
0.0071
38
0.0082
45
Appendix to ind news 2012: Words by length without multiplicity
39
0.0112
40
0.0097
41
0.0051
42
0.0031
43
0.0020
44
0.0046
45
0.0010
46
0.0026
47
0.0015
48
0.0005
50
0.0005
Appendix to ind newscrawl 2011: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 8.6916
46
Appendix to ind newscrawl 2011: Words by length without multiplicity
word length percentage 1
0.0151
2
0.2647
3
2.1586
4
5.2091
5
10.5363
6
12.1605
7
12.9858
8
13.0064
9
10.4251
10
8.3986
11
6.9669
12
4.9622
13
3.9819
14
2.8824
15
2.2704
16
1.6644
17
1.3042
18
0.9396
19
0.6939
20
0.4979
21
0.3728
22
0.2487
23
0.1860
24
0.1246
25
0.0877
26
0.0666
27
0.0454
28
0.0346
29
0.0302
30
0.0221
31
0.0188
32
0.0143
33
0.0147
34
0.0115
35
0.0097
36
0.0078
37
0.0055
38
0.0050
47
Appendix to ind newscrawl 2011: Words by length without multiplicity
39
0.0050
40
0.0038
41
0.0036
42
0.0022
43
0.0015
44
0.0023
45
0.0012
46
0.0010
47
0.0009
48
0.0011
50
0.0013
Appendix to ind newscrawl 2012: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 8.6439
48
Appendix to ind newscrawl 2012: Words by length without multiplicity
word length percentage 1
0.0151
2
0.2413
3
2.0050
4
4.9738
5
10.5115
6
12.4005
7
13.4518
8
12.8235
9
10.8530
10
8.3251
11
6.9596
12
5.0031
13
3.9988
14
2.8949
15
2.2490
16
1.6184
17
1.2325
18
0.8434
19
0.6453
20
0.4299
21
0.3045
22
0.2143
23
0.1558
24
0.1070
25
0.0746
26
0.0524
27
0.0411
28
0.0343
29
0.0253
30
0.0211
31
0.0172
32
0.0138
33
0.0145
34
0.0123
35
0.0101
36
0.0075
37
0.0063
38
0.0044
49
Appendix to ind newscrawl 2012: Words by length without multiplicity
39
0.0063
40
0.0043
41
0.0045
42
0.0031
43
0.0012
44
0.0028
45
0.0013
46
0.0013
47
0.0014
48
0.0010
49
0.0002
50
0.0005
Appendix to ind wikipedia 2007: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 7.8842
50
Appendix to ind wikipedia 2007: Words by length without multiplicity
word length percentage 1
0.1815
2
1.0574
3
4.0188
4
7.4539
5
11.8050
6
13.3541
7
13.8702
8
12.1189
9
11.4596
10
8.3203
11
6.8833
12
4.9325
13
4.1313
14
2.9821
15
2.4385
16
1.7027
17
1.4699
18
1.0038
19
0.8390
20
0.5922
21
0.5620
22
0.4026
23
0.3459
24
0.2679
25
0.2346
26
0.2026
27
0.1572
28
0.1355
29
0.1207
30
0.0950
31
0.0721
32
0.0635
33
0.0504
34
0.0527
35
0.0459
36
0.0284
37
0.0270
38
0.0198
51
Appendix to ind wikipedia 2007: Words by length without multiplicity
39
0.0221
40
0.0140
41
0.0131
42
0.0059
43
0.0063
44
0.0063
45
0.0014
46
0.0036
47
0.0027
48
0.0009
49
0.0009
50
0.0014
Appendix to ind wikipedia 2012: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 7.8926
52
Appendix to ind wikipedia 2012: Words by length without multiplicity
word length percentage 1
0.1539
2
0.8094
3
3.8665
4
7.3528
5
12.0942
6
13.1281
7
13.8502
8
12.4456
9
11.4342
10
8.2797
11
6.7001
12
4.6817
13
3.7734
14
2.5814
15
2.0367
16
1.3949
17
1.1550
18
0.7677
19
0.6530
20
0.4413
21
0.4041
22
0.2804
23
0.2399
24
0.1744
25
0.1439
26
0.1070
27
0.0931
28
0.0797
29
0.0697
30
0.0556
31
0.0469
32
0.0366
33
0.0360
34
0.0334
35
0.0225
36
0.0167
37
0.0119
38
0.0100
53
Appendix to ind wikipedia 2012: Words by length without multiplicity
39
0.0145
40
0.0112
41
0.0084
42
0.0035
43
0.0032
44
0.0035
45
0.0016
46
0.0019
47
0.0029
48
0.0006
49
0.0006
50
0.0013
Appendix to ind web 2011: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 8.2548
54
Appendix to ind web 2011: Words by length without multiplicity
word length percentage 1
0.0662
2
0.7513
3
4.1171
4
7.3652
5
11.3518
6
10.9570
7
12.2760
8
11.8026
9
10.6870
10
8.7155
11
7.1874
12
4.8759
13
3.8895
14
2.4757
15
1.9520
16
1.2325
17
1.0234
18
0.6551
19
0.5739
20
0.3392
21
0.3026
22
0.1879
23
0.1707
24
0.1019
25
0.0975
26
0.0653
27
0.0547
28
0.0348
29
0.0291
30
0.0212
31
0.0203
32
0.0176
33
0.0207
34
0.0185
35
0.0137
36
0.0115
37
0.0062
38
0.0079
55
Appendix to ind web 2011: Words by length without multiplicity
39
0.0088
40
0.0066
41
0.0071
42
0.0031
43
0.0013
44
0.0035
45
0.0013
46
0.0022
47
0.0004
48
0.0009
49
0.0004
Appendix to ind web 2012: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 9.7062
56
Appendix to ind web 2012: Words by length without multiplicity
word length percentage 1
0.0372
2
0.1812
3
1.3515
4
3.6815
5
7.3154
6
9.4442
7
11.1648
8
11.3780
9
10.7964
10
9.3428
11
8.2643
12
6.4588
13
5.3583
14
4.0512
15
3.2539
16
2.3903
17
1.8624
18
1.3392
19
1.0396
20
0.7118
21
0.5350
22
0.3642
23
0.2700
24
0.1822
25
0.1351
26
0.0948
27
0.0722
28
0.0551
29
0.0454
30
0.0342
31
0.0290
32
0.0230
33
0.0205
34
0.0153
35
0.0126
36
0.0108
37
0.0098
38
0.0088
57
Appendix to ind web 2012: Words by length without multiplicity
39
0.0071
40
0.0059
41
0.0049
42
0.0046
43
0.0032
44
0.0031
45
0.0026
46
0.0020
47
0.0019
48
0.0017
49
0.0017
50
0.0014
Appendix to ind mixed 2012: Words by length without multiplicity Percentage of words of fixed length in characters, counted without multiplicty
Average word length 9.6520
58
Appendix to ind mixed 2012: Words by length without multiplicity
word length percentage 1
0.0351
2
0.1701
3
1.2451
4
3.5454
5
7.3556
6
9.9559
7
11.5787
8
11.7182
9
10.7519
10
9.1627
11
8.0485
12
6.2616
13
5.1925
14
3.9656
15
3.1835
16
2.3696
17
1.8491
18
1.3447
19
1.0276
20
0.7148
21
0.5340
22
0.3651
23
0.2675
24
0.1818
25
0.1338
26
0.0962
27
0.0709
28
0.0551
29
0.0460
30
0.0345
31
0.0287
32
0.0232
33
0.0202
34
0.0159
35
0.0131
36
0.0112
37
0.0099
38
0.0086
59
Appendix to ind mixed 2012: Words by length without multiplicity
39
0.0072
40
0.0057
41
0.0050
42
0.0042
43
0.0031
44
0.0031
45
0.0024
46
0.0018
47
0.0017
48
0.0016
49
0.0014
50
0.0015
Appendix to ind news 2007: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.1588
60
Appendix to ind news 2007: Words by length with multiplicity
61
word length percentage 1
0.2083
2
4.0456
3
8.1295
4
16.5512
5
17.6398
6
12.6492
7
13.4849
8
9.4616
9
6.4415
10
5.7592
11
2.8405
12
1.4374
13
0.8029
14
0.2658
15
0.1301
16
0.0742
17
0.0335
18
0.0112
19
0.0136
20
0.0088
21
0.0080
23
0.0008
25
0.0024
Appendix to ind news 2008: Words by length with multiplicity
62
Appendix to ind news 2008: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.2462
word length percentage 1
0.2605
2
4.3769
3
8.3477
4
16.3824
5
17.5820
6
13.0794
7
11.7866
8
9.1142
9
6.8428
10
5.2260
11
2.9163
12
1.5676
Appendix to ind news 2008: Words by length with multiplicity
63
13
0.9960
14
0.4676
15
0.3569
16
0.1704
17
0.1344
18
0.0801
19
0.0712
20
0.0438
21
0.0361
22
0.0296
23
0.0240
24
0.0257
25
0.0176
26
0.0121
27
0.0065
28
0.0121
29
0.0041
30
0.0041
Appendix to ind news 2009: Words by length with multiplicity
64
Appendix to ind news 2009: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.2691
word length percentage 1
0.2687
2
4.2451
3
8.3416
4
16.1962
5
17.6424
6
13.0921
7
11.7778
8
9.1728
9
6.8222
10
5.2496
11
3.0011
12
1.6154
Appendix to ind news 2009: Words by length with multiplicity
65
13
1.0086
14
0.4731
15
0.3829
16
0.1694
17
0.1317
18
0.0821
19
0.0672
20
0.0368
21
0.0434
22
0.0374
23
0.0259
24
0.0305
25
0.0217
26
0.0137
27
0.0066
28
0.0135
29
0.0042
30
0.0029
Appendix to ind news 2010: Words by length with multiplicity
66
Appendix to ind news 2010: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.2569
word length percentage 1
0.2512
2
4.1888
3
8.1651
4
16.4477
5
17.6968
6
13.2523
7
11.7778
8
9.0617
9
6.9600
10
5.1342
11
3.0025
12
1.6059
Appendix to ind news 2010: Words by length with multiplicity
67
13
0.9859
14
0.4416
15
0.3554
16
0.1655
17
0.1246
18
0.0813
19
0.0677
20
0.0364
21
0.0323
22
0.0277
23
0.0254
24
0.0261
25
0.0181
26
0.0174
27
0.0077
28
0.0130
29
0.0027
30
0.0027
Appendix to ind news 2011: Words by length with multiplicity
68
Appendix to ind news 2011: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.2461
word length percentage 1
0.2481
2
4.1461
3
8.3544
4
16.7708
5
17.4959
6
13.0659
7
11.6743
8
9.0238
9
7.0025
10
5.1976
11
2.9826
12
1.6010
Appendix to ind news 2011: Words by length with multiplicity
69
13
0.9760
14
0.4385
15
0.3683
16
0.1621
17
0.1236
18
0.0823
19
0.0684
20
0.0351
21
0.0327
22
0.0269
23
0.0226
24
0.0252
25
0.0158
26
0.0132
27
0.0074
28
0.0117
29
0.0030
30
0.0026
Appendix to ind news 2012: Words by length with multiplicity
70
Appendix to ind news 2012: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.2373
word length percentage 1
0.2559
2
4.1994
3
8.1009
4
17.0957
5
17.5534
6
13.1577
7
11.7166
8
8.9443
9
6.9871
10
5.0109
11
2.9330
12
1.5633
Appendix to ind news 2012: Words by length with multiplicity
71
13
0.9657
14
0.4472
15
0.3672
16
0.1698
17
0.1223
18
0.0865
19
0.0737
20
0.0442
21
0.0380
22
0.0322
23
0.0257
24
0.0267
25
0.0182
26
0.0142
27
0.0088
28
0.0109
29
0.0038
30
0.0031
Appendix to ind newscrawl 2011: Words by length with multiplicity
Appendix to ind newscrawl 2011: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.1473
word length percentage 1
0.4395
2
4.4953
3
8.3678
4
16.6880
5
18.1267
6
13.5092
7
11.4336
8
8.9507
9
6.8623
10
4.6822
11
2.7548
12
1.4587
72
Appendix to ind newscrawl 2011: Words by length with multiplicity
13
0.9124
14
0.4277
15
0.2988
16
0.1665
17
0.1131
18
0.0677
19
0.0609
20
0.0327
21
0.0283
22
0.0235
23
0.0195
24
0.0206
25
0.0134
26
0.0103
27
0.0048
28
0.0090
29
0.0024
30
0.0027
73
Appendix to ind newscrawl 2012: Words by length with multiplicity
Appendix to ind newscrawl 2012: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.2275
word length percentage 1
0.3853
2
4.0721
3
8.3060
4
16.5783
5
17.9307
6
13.1848
7
11.4705
8
9.0745
9
7.0714
10
5.0410
11
2.9543
12
1.5541
74
Appendix to ind newscrawl 2012: Words by length with multiplicity
13
0.9706
14
0.4504
15
0.3280
16
0.1591
17
0.1169
18
0.0724
19
0.0600
20
0.0393
21
0.0316
22
0.0248
23
0.0235
24
0.0259
25
0.0151
26
0.0124
27
0.0062
28
0.0135
29
0.0030
30
0.0027
75
Appendix to ind wikipedia 2007: Words by length with multiplicity
Appendix to ind wikipedia 2007: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.3486
word length percentage 1
0.5708
2
4.6067
3
7.2611
4
16.9233
5
15.6990
6
14.2319
7
12.2958
8
9.4419
9
6.6161
10
4.2325
11
2.9324
12
1.6063
76
Appendix to ind wikipedia 2007: Words by length with multiplicity
13
1.1962
14
0.5923
15
0.5320
16
0.2670
17
0.2329
18
0.1901
19
0.1313
20
0.0742
21
0.0769
22
0.0497
23
0.0427
24
0.0388
25
0.0280
26
0.0262
27
0.0187
28
0.0136
29
0.0133
30
0.0118
77
Appendix to ind wikipedia 2012: Words by length with multiplicity
Appendix to ind wikipedia 2012: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.2242
word length percentage 1
0.6699
2
4.3038
3
7.5772
4
17.1726
5
16.5759
6
13.9800
7
12.2628
8
9.5437
9
6.5058
10
4.2377
11
2.9271
12
1.5467
78
Appendix to ind wikipedia 2012: Words by length with multiplicity
13
1.0747
14
0.4797
15
0.3923
16
0.1804
17
0.1516
18
0.0998
19
0.0816
20
0.0433
21
0.0462
22
0.0283
23
0.0242
24
0.0177
25
0.0137
26
0.0116
27
0.0093
28
0.0061
29
0.0067
30
0.0060
79
Appendix to ind web 2011: Words by length with multiplicity
80
Appendix to ind web 2011: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.1480
word length percentage 1
0.4528
2
4.4610
3
7.9982
4
17.2623
5
17.9712
6
14.0295
7
10.6995
8
9.0738
9
6.8012
10
4.4741
11
2.9436
12
1.5561
Appendix to ind web 2011: Words by length with multiplicity
81
13
0.9522
14
0.4949
15
0.2729
16
0.1429
17
0.1342
18
0.0582
19
0.0795
20
0.0311
21
0.0316
22
0.0112
23
0.0189
24
0.0094
25
0.0123
26
0.0063
27
0.0043
28
0.0022
29
0.0020
30
0.0019
Appendix to ind web 2012: Words by length with multiplicity
82
Appendix to ind web 2012: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.0947
word length percentage 1
0.5353
2
3.6581
3
8.6157
4
18.4137
5
17.8683
6
13.8226
7
11.0509
8
8.5867
9
6.6026
10
4.4196
11
2.8249
12
1.5131
Appendix to ind web 2012: Words by length with multiplicity
83
13
0.9196
14
0.3875
15
0.2864
16
0.1387
17
0.1084
18
0.0630
19
0.0620
20
0.0241
21
0.0302
22
0.0135
23
0.0136
24
0.0086
25
0.0086
26
0.0050
27
0.0035
28
0.0028
29
0.0017
30
0.0018
Appendix to ind mixed 2012: Words by length with multiplicity
84
Appendix to ind mixed 2012: Words by length with multiplicity Percentage of words of fixed length in characters, counted with multiplicty
Average word length 6.1214
word length percentage 1
0.4946
2
3.8925
3
8.5172
4
17.8519
5
17.8973
6
13.7147
7
11.1920
8
8.7227
9
6.6892
10
4.5333
11
2.8219
12
1.5083
Appendix to ind mixed 2012: Words by length with multiplicity
85
13
0.9262
14
0.4053
15
0.2963
16
0.1480
17
0.1122
18
0.0663
19
0.0630
20
0.0275
21
0.0305
22
0.0172
23
0.0160
24
0.0128
25
0.0104
26
0.0070
27
0.0042
28
0.0049
29
0.0021
30
0.0022
Appendix to ind news 2007: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
Irak
2
di
27
bahwa
3
dan
28
tersebut
4
ini
29
orang
5
untuk
30
menjadi
6
itu
31
lebih
7
mengatakan 32
bisa
8
dengan
33
kepada
9
dari
34
adalah
10
akan
35
sebagai
11
dalam
36
satu
12
tidak
37
dua
13
tahun
38
pemerintah
14
mereka
39
lalu
15
dia
40
karena
Appendix to ind news 2007: The most frequent 50 words
86
16
pada
41
bulan
17
ke
42
negara
18
kata
43
baru
19
juga
44
Namun
20
setelah
45
warga
21
Inggris
46
bagi
22
para
47
saya
23
Amerika
48
telah
24
oleh
49
Dia
25
hari
50
besar
Appendix to ind news 2008: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
oleh
2
dan
27
sudah
3
di
28
mereka
4
itu
29
bahwa
5
untuk
30
saat
6
dengan
31
sebagai
7
dari
32
kepada
8
tidak
33
lebih
9
ini
34
adalah
10
akan
35
dia
11
dalam
36
para
12
pada
37
masih
13
juga
38
atau
14
tersebut
39
pemerintah
15
kata
40
satu
16
ke
41
persen
17
mengatakan 42
orang
18
katanya
43
negara
19
karena
44
Jakarta
20
Indonesia
45
harus
21
tahun
46
AS
22
menjadi
47
setelah
23
ada
48
melakukan
Appendix to ind news 2008: The most frequent 50 words
87
24
telah
49
dua
25
bisa
50
hanya
Appendix to ind news 2009: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
sudah
2
dan
27
oleh
3
di
28
mereka
4
itu
29
sebagai
5
untuk
30
lebih
6
dengan
31
saat
7
dari
32
bahwa
8
ini
33
orang
9
tidak
34
kepada
10
dalam
35
dia
11
akan
36
adalah
12
pada
37
satu
13
juga
38
masih
14
tersebut
39
negara
15
kata
40
atau
16
ke
41
para
17
mengatakan 42
persen
18
katanya
43
harus
19
karena
44
Jakarta
20
ada
45
setelah
21
Indonesia
46
dua
22
telah
47
melakukan
23
menjadi
48
hanya
24
tahun
49
Ia
25
bisa
50
pemerintah
Appendix to ind news 2010: The most frequent 50 words
88
Appendix to ind news 2010: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
oleh
2
dan
27
tahun
3
di
28
saat
4
itu
29
dia
5
untuk
30
mereka
6
dengan
31
lebih
7
dari
32
sebagai
8
tidak
33
kepada
9
ini
34
bahwa
10
pada
35
masih
11
akan
36
adalah
12
dalam
37
orang
13
tersebut
38
satu
14
kata
39
atau
15
juga
40
Ia
16
ke
41
harus
17
katanya
42
melakukan
18
karena
43
para
19
mengatakan 44
Jakarta
20
Indonesia
45
dua
21
ada
46
hanya
22
menjadi
47
persen
23
sudah
48
masyarakat
24
bisa
49
Menurut
25
telah
50
dapat
Appendix to ind news 2011: The most frequent 50 words
89
Appendix to ind news 2011: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
sudah
2
dan
27
tahun
3
di
28
dia
4
itu
29
lebih
5
untuk
30
mereka
6
dengan
31
saat
7
dari
32
bahwa
8
ini
33
sebagai
9
pada
34
adalah
10
tidak
35
kepada
11
akan
36
satu
12
dalam
37
atau
13
juga
38
orang
14
tersebut
39
masih
15
kata
40
harus
16
ke
41
Ia
17
katanya
42
negara
18
Indonesia
43
para
19
mengatakan 44
melakukan
20
karena
45
persen
21
ada
46
dapat
22
telah
47
pemerintah
23
menjadi
48
masyarakat
24
bisa
49
dua
25
oleh
50
kami
Appendix to ind news 2012: The most frequent 50 words
90
Appendix to ind news 2012: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
Jakarta
2
dan
27
sudah
3
di
28
saat
4
itu
29
telah
5
untuk
30
oleh
6
dengan
31
lebih
7
dari
32
satu
8
ini
33
mereka
9
pada
34
sebagai
10
akan
35
adalah
11
tidak
36
atau
12
dalam
37
bahwa
13
kata
38
masih
14
juga
39
kepada
15
tersebut
40
persen
16
ke
41
orang
17
Indonesia
42
harus
18
karena
43
dapat
19
mengatakan 44
ANTARA
20
katanya
45
Ia
21
ada
46
melakukan
22
tahun
47
kami
23
bisa
48
dua
24
menjadi
49
para
25
dia
50
seperti
Appendix to ind newscrawl 2011: The most frequent 50 words
91
Appendix to ind newscrawl 2011: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
kata
2
dan
27
masih
3
di
28
atau
4
ini
29
oleh
5
itu
30
Indonesia
6
dengan
31
harus
7
untuk
32
telah
8
dari
33
adalah
9
tidak
34
hanya
10
akan
35
tak
11
dalam
36
satu
12
juga
37
orang
13
ke
38
kepada
14
pada
39
para
15
tersebut 40
Namun
16
bisa
41
warga
17
ada
42
belum
18
sudah
43
saya
19
karena
44
mengatakan
20
menjadi 45
lalu
21
saat
46
dua
22
tahun
47
seperti
23
mereka
48
melakukan
24
sebagai 49
Rp
25
lebih
saja
50
Appendix to ind newscrawl 2012: The most frequent 50 words
92
Appendix to ind newscrawl 2012: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
lebih
2
dan
27
telah
3
di
28
atau
4
ini
29
harus
5
itu
30
mereka
6
dengan
31
masih
7
untuk
32
kata
8
dari
33
adalah
9
tidak
34
mengatakan
10
akan
35
kepada
11
dalam
36
hanya
12
pada
37
satu
13
juga
38
para
14
tersebut
39
orang
15
ke
40
masyarakat
16
bisa
41
melakukan
17
ada
42
dia
18
menjadi
43
seperti
19
sudah
44
tak
20
karena
45
lalu
21
tahun
46
dapat
22
Indonesia 47
bahwa
23
saat
48
belum
24
oleh
49
pemerintah
25
sebagai
50
Jakarta
Appendix to ind wikipedia 2007: The most frequent 50 words
93
Appendix to ind wikipedia 2007: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
lebih
2
dan
27
mereka
3
di
28
satu
4
dari
29
dapat
5
dengan
30
karena
6
ini
31
Ia
7
adalah
32
orang
8
pada
33
kota
9
dalam
34
telah
10
untuk
35
tersebut
11
sebagai
36
bahasa
12
tahun
37
seorang
13
oleh
38
akan
14
itu
39
seperti
15
juga
40
bahwa
16
atau
41
banyak
17
menjadi
42
Di
18
tidak
43
bagian
19
sebuah
44
nama
20
ke
45
kemudian
21
merupakan 46
secara
22
ia
47
lain
23
Pada
48
ada
24
Indonesia
49
negara
25
memiliki
50
besar
Appendix to ind wikipedia 2012: The most frequent 50 words
94
Appendix to ind wikipedia 2012: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
lebih
2
dan
27
merupakan
3
di
28
bahwa
4
dengan
29
tersebut
5
dari
30
sebuah
6
ini
31
orang
7
pada
32
Pada
8
untuk
33
telah
9
dalam
34
Ia
10
adalah
35
satu
11
sebagai
36
kemudian
12
oleh
37
ada
13
tahun
38
secara
14
tidak
39
seorang
15
juga
40
besar
16
menjadi
41
banyak
17
ke
42
Indonesia
18
atau
43
seperti
19
itu
44
beberapa
20
memiliki 45
saat
21
ia
46
Di
22
mereka
47
lain
23
dapat
48
hanya
24
karena
49
pertama
25
akan
50
sangat
Appendix to ind web 2011: The most frequent 50 words
95
Appendix to ind web 2011: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
juga
2
dan
27
sudah
3
itu
28
karena
4
di
29
masih
5
dengan
30
atau
6
tidak
31
lebih
7
untuk
32
Namun
8
dari
33
kita
9
ini
34
harus
10
akan
35
para
11
dalam
36
pun
12
telah
37
saja
13
mereka
38
Tetapi
14
pada
39
bisa
15
dapat
40
kemudian
16
orang
41
sebagai
17
maka
42
saya
18
ia
43
Agung
19
adalah
44
tersebut
20
Ki
45
sangat
21
ke
46
Sedayu
22
menjadi 47
kepada
23
bahwa
48
aku
24
oleh
49
lagi
25
ada
50
lain
Appendix to ind web 2012: The most frequent 50 words
96
Appendix to ind web 2012: The most frequent 50 words Rank in Wordlist Word Rank in Wordlist
Word
1
yang
26
menjadi
2
dan
27
sebagai
3
di
28
bahwa
4
dengan 29
lebih
5
ini
30
tersebut
6
untuk
31
sudah
7
dari
32
harus
8
itu
33
telah
9
tidak
34
seperti
10
dalam
35
lain
11
pada
36
tahun
12
akan
37
sangat
13
adalah
38
hanya
14
atau
39
banyak
15
kita
40
kepada
16
ada
41
secara
17
saya
42
satu
18
juga
43
saja
19
ke
44
tak
20
bisa
45
ia
21
dapat
46
dia
22
oleh
47
saat
23
mereka 48
Indonesia
24
karena
49
aku
25
orang
50
baik
Appendix to ind mixed 2012: The most frequent 50 words
97
Appendix to ind mixed 2012: The most frequent 50 words Rank in Wordlist
Word
Rank in Wordlist
Word
1
yang
26
orang
2
dan
27
dapat
3
di
28
sudah
4
dengan
29
sebagai
5
ini
30
lebih
6
itu
31
bahwa
7
untuk
32
tahun
8
dari
33
telah
9
tidak
34
harus
10
dalam
35
saat
11
pada
36
hanya
12
akan
37
seperti
13
adalah
38
satu
14
juga
39
kepada
15
ada
40
Indonesia
16
ke
41
lain
17
atau
42
sangat
18
bisa
43
tak
19
karena
44
banyak
20
kita
45
saja
21
tersebut 46
masih
22
oleh
47
dia
23
mereka
48
secara
24
saya
49
ia
25
menjadi 50
para
Appendix to ind news 2007: Longest words in top-1.000 by rank
98
Appendix to ind news 2007: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
52
pertandingan
12
2
224
internasional
13
3
266
diperkirakan
12
4
369
negara-negara
13
5
395
meninggalkan
12
6
437
menghentikan
12
7
442
undang-undang
13
8
451
mengeluarkan
12
9
511
pemerintahan
12
10
526
memperlihatkan
14
11
581
menyelesaikan
13
12
616
kekhawatiran
12
13
619
memperingatkan 14
14
688
mempertahankan 14
15
716
memperkirakan
13
16
717
meningkatkan
12
17
794
menggantikan
12
18
798
perkembangan
12
19
819
mengundurkan
12
20
851
menggambarkan 13
Appendix to ind news 2008: Longest words in top-1.000 by rank
99
Appendix to ind news 2008: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
131
pertandingan
12
2
325
internasional
13
3
364
diperkirakan
12
4
390
meningkatkan
12
5
426
masing-masing
13
6
546
negara-negara
13
7
578
menyampaikan
12
8
629
mengungkapkan 13
9
676
mengemukakan
12
10
679
pemerintahan
12
11
692
mengeluarkan
12
12
715
dibandingkan
12
13
786
kesepakatan
11
14
805
perekonomian
12
15
807
meninggalkan
12
16
823
perkembangan
12
17
837
dilaksanakan
12
18
851
menyelesaikan
13
19
971
memperkirakan
13
20
980
menghentikan
12
Appendix to ind news 2009: Longest words in top-1.000 by rank
100
Appendix to ind news 2009: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
139
pertandingan
12
2
334
internasional
13
3
392
meningkatkan
12
4
409
masing-masing
13
5
422
pemerintahan
12
6
523
menyampaikan
12
7
561
negara-negara
13
8
606
mengungkapkan 13
9
669
dibandingkan
12
10
676
mengeluarkan
12
11
734
dilaksanakan
12
12
767
meninggalkan
12
13
853
perekonomian
12
14
884
penghitungan
12
15
911
menghentikan
12
16
928
menyelesaikan
13
17
929
perkembangan
12
18
973
memperkirakan
13
19
984
mengemukakan
12
20
989
melaksanakan
12
Appendix to ind news 2010: Longest words in top-1.000 by rank
101
Appendix to ind news 2010: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
144
pertandingan
12
2
307
meningkatkan
12
3
355
internasional
13
4
411
masing-masing
13
5
431
diperkirakan
12
6
518
menyampaikan
12
7
643
mengungkapkan 13
8
650
dibandingkan
12
9
743
pemerintahan
12
10
749
mengeluarkan
12
11
807
pengembangan
12
12
812
negara-negara
13
13
815
dilaksanakan
12
14
836
meninggalkan
12
15
872
perkembangan
12
16
896
Muhammadiyah
12
17
922
mengemukakan
12
18
926
mengharapkan
12
19
948
penyelidikan
12
20
998
mengembangkan 13
Appendix to ind news 2011: Longest words in top-1.000 by rank
102
Appendix to ind news 2011: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
130
pertandingan
12
2
241
meningkatkan
12
3
297
internasional
13
4
378
masing-masing
13
5
441
diperkirakan
12
6
542
negara-negara
13
7
643
pemerintahan
12
8
648
dibandingkan
12
9
692
pengembangan
12
10
709
dilaksanakan
12
11
731
mengungkapkan 13
12
749
mengeluarkan
12
13
783
mengemukakan
12
14
791
perkembangan
12
15
819
meninggalkan
12
16
853
menyelesaikan
13
17
888
melaksanakan
12
18
911
infrastruktur
13
19
922
mengharapkan
12
20
953
mengembangkan 13
Appendix to ind news 2012: Longest words in top-1.000 by rank
103
Appendix to ind news 2012: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
109
pertandingan
12
2
325
internasional
13
3
402
masing-masing
13
4
457
diperkirakan
12
5
505
dibandingkan
12
6
560
menyampaikan
12
7
612
pengembangan
12
8
686
mengungkapkan 13
9
777
negara-negara
13
10
785
dilaksanakan
12
11
791
mengembangkan 13
12
808
mengemukakan
12
13
829
infrastruktur
13
14
836
menyelesaikan
13
15
893
memanfaatkan
12
16
898
mengeluarkan
12
17
906
perkembangan
12
18
935
mengharapkan
12
19
954
perekonomian
12
20
955
meninggalkan
12
Appendix to ind newscrawl 2011: Longest words in top-1.000 by rank
104
Appendix to ind newscrawl 2011: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
212
pertandingan
12
2
289
pembangunan
11
3
327
menjelaskan
11
4
391
masing-masing
13
5
443
menambahkan
11
6
465
meningkatkan
12
7
472
menunjukkan
11
8
569
menyebutkan
11
9
591
mengungkapkan 13
10
622
pelaksanaan
11
11
705
internasional
13
12
714
berdasarkan
11
13
740
LampostOnline
13
14
755
diperkirakan
12
15
781
dilaksanakan
12
16
795
mengeluarkan
12
17
805
dibandingkan
12
18
831
pemerintahan
12
19
932
meninggalkan
12
20
947
menyampaikan
12
Appendix to ind newscrawl 2012: Longest words in top-1.000 by rank
105
Appendix to ind newscrawl 2012: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
228
mendapatkan
11
2
241
pertandingan
12
3
289
meningkatkan
12
4
416
masing-masing
13
5
497
dibandingkan
12
6
511
internasional
13
7
526
mengungkapkan 13
8
615
diperkirakan
12
9
694
pengembangan
12
10
707
dilaksanakan
12
11
747
pemerintahan
12
12
754
menyampaikan
12
13
816
infrastruktur
13
14
869
menimbulkan
11
15
871
mengeluarkan
12
16
888
perkembangan
12
17
911
menyelesaikan
13
18
934
mengembangkan 13
19
951
perekonomian
12
20
962
melaksanakan
12
Appendix to ind wikipedia 2007: Longest words in top-1.000 by rank
106
Appendix to ind wikipedia 2007: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
155
pemerintahan
12
2
293
mendapatkan
11
3
407
internasional
13
4
410
menghasilkan
12
5
499
masing-masing
13
6
511
penerbangan
11
7
524
meninggalkan
12
8
534
Pengguna(-pengguna 18
9
678
negara-negara
13
10
723
perkembangan
12
11
728
menggantikan
12
12
731
Internasional
13
13
764
dibandingkan
12
14
773
mengembangkan
13
15
786
pertandingan
12
16
795
satu-satunya
12
17
906
mempelajari
11
18
922
mengeluarkan
12
19
926
pengembangan
12
20
939
dikembangkan
12
Appendix to ind wikipedia 2012: Longest words in top-1.000 by rank
107
Appendix to ind wikipedia 2012: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
248
pemerintahan
12
2
401
internasional
13
3
424
masing-masing
13
4
514
meninggalkan
12
5
589
dibandingkan
12
6
601
perkembangan
12
7
679
memungkinkan
12
8
721
pertandingan
12
9
733
meningkatkan
12
10
755
mengembangkan 13
11
798
satu-satunya
12
12
838
dikembangkan
12
13
850
diperkirakan
12
14
878
menggantikan
12
15
881
kadang-kadang
13
16
897
menggambarkan 13
17
936
mengeluarkan
12
18
937
Internasional
13
19
953
negara-negara
13
20
968
mempertahankan 14
Appendix to ind web 2011: Longest words in top-1.000 by rank
108
Appendix to ind web 2011: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
224
dipublikasikan
14
2
283
meningkatkan
12
3
321
masing-masing
13
4
524
perkembangan
12
5
581
pengembangan
12
6
659
mempersiapkan
13
7
665
memperhatikan
13
8
708
kemampuannya
12
9
733
dibandingkan
12
10
775
beristirahat
12
11
785
mengembangkan 13
12
809
menyelesaikan
13
814
mempergunakan 13
14
816
internasional
13
15
827
kadang-kadang
13
16
919
mempengaruhi
12
17
923
pemerintahan
12
18
945
Sebenarnyalah
13
19
948
bersama-sama
12
20
971
diselenggarakan
15
13
Appendix to ind web 2012: Longest words in top-1.000 by rank
109
Appendix to ind web 2012: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
148
menggunakan
11
2
214
orang-orang
11
3
236
mendapatkan
11
4
424
masing-masing
13
5
433
perkembangan
12
6
447
meningkatkan
12
7
585
pemerintahan
12
8
624
menghasilkan
12
9
674
meninggalkan
12
10
690
dibandingkan
12
11
716
pengembangan
12
12
729
mengembangkan 13
13
752
sesungguhnya
12
14
785
internasional
13
15
803
melaksanakan
12
16
842
mempengaruhi
12
17
865
dilaksanakan
12
18
873
mengeluarkan
12
19
925
pembelajaran
12
20
946
memperhatikan
13
Appendix to ind mixed 2012: Longest words in top-1.000 by rank
110
Appendix to ind mixed 2012: Longest words in top-1.000 by rank The 20 words of maximal string length ordered by rank Local Rank Rank in Wordlist
Word
Length
1
404
masing-masing
13
2
425
meningkatkan
12
3
525
perkembangan
12
4
554
pertandingan
12
5
559
kemungkinan
11
6
561
benar-benar
11
7
608
pemerintahan
12
8
665
membutuhkan
11
9
673
menciptakan
11
10
674
internasional
13
11
696
dibandingkan
12
12
699
meninggalkan
12
13
745
menghasilkan
12
14
776
pengembangan
12
15
811
dilaksanakan
12
16
835
mengeluarkan
12
17
840
mengembangkan 13
18
868
melaksanakan
19
959
mengungkapkan 13
20
997
menyampaikan
12
12
111
Character N-gram details Appendix to ind news 2007: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition ,
0.89
0.15
-
6.74
2.1
.
1.55
0.34
/
0.23
0.04
a
159.64
186.45
b
26.06
25.76
c
10.93
6.77
d
29.37
39.27
e
87.96
86.09
f
5.45
2.6
g
33.67
36.64
h
21.47
22.64
i
73.73
78.56
j
8.91
8.7
k
45.94
48.35
l
36.2
33.75
m
45.83
47.28
n
101.14
103.18
o
31.1
19.46
p
30.97
30.42
q
0.36
0.12
r
59.43
54.99
s
46.32
40.51
t
45.85
50.08
u
42.78
45.54
v
3.48
1.69
w
5.78
5.84
x
0.49
0.15
y
17.02
13.76
Appendix to ind news 2007: Alphabet as used in the top-100.000 words
z
1.75
0.75
Appendix to ind news 2008: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 11.66
3.91
,
10.42
0.47
-
8.72
1.7
.
7.16
0.44
/
2.8
0.25
:
0.57
0.02
`
0.24
0.03
a
138.04
187.41
b
22.16
25.14
c
11.38
5.15
d
26.93
38.42
e
68.22
81.16
f
6.13
2.88
g
26.92
35.62
h
19.5
20.87
i
69.33
75.78
j
8.37
10.14
k
35.26
48.62
l
31.95
31.86
m
36.28
44.24
n
82.66
99.13
o
35.31
19.8
p
28.35
32.71
q
0.72
0.13
r
55.06
53.2
s
44.78
44.43
t
41.77
52.08
u
37.2
48.52
v
3.97
1.45
w
6.56
4.97
112
Appendix to ind news 2008: Alphabet as used in the top-100.000 words
x
0.93
0.17
y
16.43
15.31
z
2.41
0.65
Appendix to ind news 2009: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 11.26
4.02
'
0.11
0.01
,
8.68
0.42
-
8.47
1.71
.
6.9
0.44
/
2.59
0.25
:
0.65
0.03
`
0.22
0.03
a
141.82
187.83
b
24.97
24.71
c
13.4
5.35
d
29.25
38.47
e
68.42
80.91
f
6.05
2.86
g
26.8
35.52
h
20.04
20.64
i
70.41
75.69
j
8.3
10.3
k
35.17
48.55
l
32.62
32.34
m
35.85
44.13
n
83.22
98.87
o
35.58
19.8
p
27.44
32.99
q
0.7
0.11
r
55.79
53.13
s
44.72
44.45
t
42.01
52.36
113
Appendix to ind news 2009: Alphabet as used in the top-100.000 words
u
37.63
48.6
v
3.9
1.35
w
6.72
5.17
x
0.85
0.15
y
16.29
15.33
z
2.49
0.72
Appendix to ind news 2010: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 11.2
3.7
,
3.33
0.29
-
7.11
1.56
.
2.5
0.36
/
1.49
0.22
:
0.16
0.01
`
0.24
0.03
a
149.81
189.71
b
24.18
25.08
c
12.49
5.12
d
29.39
38.39
e
74.85
80.67
f
6.76
2.82
g
30.18
36.22
h
21.07
20.54
i
75.88
75.72
j
9.18
10.35
k
39.09
49.3
l
34.48
31.65
m
39.87
43.95
n
91.15
99.52
o
38.83
19.66
p
31.02
32.44
q
0.72
0.12
r
59.48
52.62
114
Appendix to ind news 2010: Alphabet as used in the top-100.000 words
s
48.73
44.88
t
45.58
52.53
u
41
48.91
v
4.26
1.43
w
7.43
5.11
x
0.87
0.14
y
17.94
15.58
z
2.49
0.59
Appendix to ind news 2011: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 11.1
3.44
,
4.4
0.33
-
8.79
1.75
.
3.22
0.34
/
1.57
0.21
:
0.32
0.01
`
0.19
0.02
a
147.16
189.55
b
23.65
24.96
c
12.59
5.02
d
28.47
38.62
e
74.69
81.46
f
6.99
3.07
g
29.55
35.76
h
20.69
20.56
i
74.7
76.56
j
8.7
9.98
k
38.36
48.82
l
33.96
31.51
m
38.48
44.21
n
89.46
99.53
o
38.3
19.72
p
30.61
32.41
115
Appendix to ind news 2011: Alphabet as used in the top-100.000 words
q
0.76
0.13
r
59.39
52.75
s
48.27
45.25
t
46.15
52.81
u
39.94
48.13
v
4.48
1.52
w
7.46
4.94
x
0.9
0.17
y
17.61
15.35
z
2.47
0.63
Appendix to ind news 2012: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 12.75
3.74
,
3.61
0.33
-
7.32
1.64
.
3.31
0.4
/
1.5
0.23
`
0.17
0.01
a
145.9
188.71
b
23.93
25.29
c
13.47
5.21
d
28.65
38.28
e
73.39
81.1
f
7.17
2.88
g
29.27
35.64
h
21.27
20.34
i
75.08
76.22
j
9.09
10.47
k
37.28
48.51
l
35.04
31.87
m
38.25
43.92
n
87.27
99.43
o
40.57
20.41
116
Appendix to ind news 2012: Alphabet as used in the top-100.000 words
p
31.25
32.57
q
0.8
0.12
r
60.71
53.24
s
49.67
45.11
t
46.47
52.71
u
40.57
48.16
v
4.65
1.55
w
7.83
5.25
x
1.04
0.19
y
17.27
14.87
z
2.58
0.6
Appendix to ind newscrawl 2011: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 10.61
3.18
'
0.11
0.01
,
1.07
0.15
-
11.65
2.36
.
1.14
0.69
/
1.15
0.35
:
1.83
0.13
a
150.95
187.02
b
24.56
26.07
c
11.85
5.29
d
30
38.09
e
76.42
78.46
f
6.02
2.72
g
31.94
36.53
h
20.15
20.92
i
74.96
77.09
j
9.64
10.62
k
41.62
49.06
l
34.09
32.84
m
40.32
43.66
117
Appendix to ind newscrawl 2011: Alphabet as used in the top-100.000 words
n
93.8
97.88
o
38.08
19.79
p
31.32
32.23
q
0.55
0.09
r
58.34
51.94
s
48.52
46.11
t
46.18
51.38
u
41.92
49.64
v
3.74
1.34
w
7.42
5.11
x
0.72
0.19
y
18.36
16.14
z
2.02
0.55
Appendix to ind newscrawl 2012: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 11.26
3.26
$
0.15
0.01
,
2.07
0.25
-
12.14
2.25
.
1.33
0.29
/
1.2
0.34
a
151.47
187.55
b
24.55
25.55
c
11.91
5.29
d
29.62
38.29
e
76.92
79.93
f
6.36
2.77
g
31.17
35.9
h
20.07
21.17
i
75.39
77.32
j
9.31
10.5
k
41.08
49.18
l
34.19
32.36
118
Appendix to ind newscrawl 2012: Alphabet as used in the top-100.000 words
m
40.56
43.75
n
94.03
99.1
o
38.21
19.99
p
32.32
32.62
q
0.57
0.09
r
59.07
52.84
s
49.22
46.25
t
46.43
51.72
u
41.26
48.88
v
3.84
1.44
w
7.38
4.71
x
0.78
0.17
y
18.1
15.67
z
2.08
0.54
Appendix to ind wikipedia 2007: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 23.18
6.01
'
0.12
0.02
,
0.47
0.06
-
6.63
2.4
.
1.44
0.39
/
0.44
0.08
:
0.15
0.01
a
146.94
186.9
b
24.59
26.73
c
15.38
6.22
d
28.64
43.35
e
76.65
78.69
f
7.67
3.46
g
29.69
35.89
h
23.97
23.89
i
77.23
79.62
j
8.73
9.27
119
Appendix to ind wikipedia 2007: Alphabet as used in the top-100.000 words
k
37.66
42.51
l
38.09
34.8
m
37.71
40.27
n
85.64
95.15
o
43.23
22.33
p
27.18
28.42
q
0.82
0.21
r
60.13
53.1
s
50.16
43.95
t
46.53
48.34
u
41.92
47.69
v
5.26
2.26
w
7.11
5.17
x
1.22
0.35
y
15.48
15.46
z
3.16
0.91
á
0.19
0.03
é
0.36
0.06
í
0.13
0.02
ó
0.11
0.02
ö
0.12
0.02
ü
0.13
0.03
ō
0.28
0.05
120
Appendix to ind wikipedia 2012: Alphabet as used in the top-100.000 words
Appendix to ind wikipedia 2012: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 16.12
3.34
,
0.34
0.06
-
6
2.16
.
1.67
0.49
/
0.28
0.04
a
144.33
185.43
b
23.96
26.89
c
15.79
6.49
d
28.44
43.7
e
79.38
81.27
f
7.89
3.59
g
30.79
37.26
h
23.27
22.81
i
77.88
79.21
j
8.58
9.39
k
37.52
43.66
l
38.27
34.7
m
38.32
42.94
n
86.76
98.32
o
44.4
20.93
p
28.54
28.88
q
0.79
0.16
r
61.22
52.85
s
53.26
44.23
t
45.03
44.7
u
41.74
47.87
v
5.56
2.11
w
7.8
5.06
x
1.37
0.33
y
16.91
16.26
z
3
0.71
á
0.12
0.01
é
0.3
0.05
121
Appendix to ind wikipedia 2012: Alphabet as used in the top-100.000 words
ō
0.25
0.03
Appendix to ind web 2011: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 7.58
1.64
'
0.22
0.02
,
1.4
0.1
-
8.96
2.95
.
1.86
0.68
/
1.31
0.09
:
2.24
0.21
a
149.15
194.83
b
25.61
25.13
c
12.66
5.19
d
28.52
39.56
e
77.43
79.74
f
6.85
2.61
g
31.6
40.37
h
21.84
23.17
i
75.76
75.61
j
8.3
9.35
k
41.73
49.69
l
34.8
31.67
m
39.72
43.69
n
91.93
100.89
o
35.12
15.87
p
32.15
30.98
q
0.88
0.12
r
56.54
49.13
s
49.26
41.92
t
48.39
50.89
u
42.68
50.24
v
3.77
1.15
w
7.13
5.08
122
Appendix to ind web 2011: Alphabet as used in the top-100.000 words
123
x
1.08
0.16
y
17.99
17.88
z
1.82
0.27
Appendix to ind web 2012: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 7.62
1.3
,
0.3
0.05
-
7.26
2.36
.
1.12
0.63
/
0.56
0.04
:
1.35
0.09
a
156.07
198.88
b
25.25
26.96
c
11.02
5.23
d
27.96
40.63
e
79.3
77.14
f
6.67
2.82
g
31.59
37.51
h
23.89
24.25
i
77.74
77.29
j
8.81
9.47
k
45.41
49.55
l
36.17
33.32
m
42.32
43.4
n
94.75
99.46
o
33.89
16.3
p
30.65
28.95
q
0.98
0.2
r
57.05
47.69
s
49.73
44.81
t
47.86
50.47
u
44.32
50.18
v
3.28
1.08
Appendix to ind web 2012: Alphabet as used in the top-100.000 words
124
w
6.31
4.33
x
0.74
0.12
y
19.35
18.46
z
1.95
0.44
Appendix to ind mixed 2012: Alphabet as used in the top-100.000 words Characters and their frequencies with and without repetition. All converted to lowercase. Character Frequency without repetition Frequency with repetition 9.15
1.91
,
0.5
0.07
-
7.98
2.22
.
1.1
0.53
/
0.67
0.11
:
1.58
0.08
a
154.67
195.52
b
25.26
26.6
c
11.28
5.2
d
28.44
39.96
e
78.23
77.85
f
6.45
2.78
g
31.63
37.26
h
22.84
23.17
i
76.87
77.16
j
8.92
9.79
k
44.28
49.41
l
35.61
33.07
m
41.55
43.52
n
94.05
99.16
o
35.17
17.26
p
31.09
30.05
q
0.84
0.16
r
57.67
49.1
s
49.52
45.03
t
47.39
50.86
u
43.68
49.97
Appendix to ind mixed 2012: Alphabet as used in the top-100.000 words
v
3.5
1.16
w
6.67
4.57
x
0.74
0.14
y
18.86
17.66
z
1.99
0.46
125
126
Abbreviation details Appendix to ind news 2007: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 1703
...
11
2289
berat.
8
5210
pers.
3
5358
..
2
5440
Abe.
2
6063
Sar.
2
7719
Air.
1
7830
Aso.
1
8230
Dr.
1
9367
Pen.
1
10075 Uefa.
1
10099 Val.
1
10378 bank.
1
11193 fan.
1
11438 kan.
1
11679 kg.
1
11699 km.
1
13237 sel.
1
13261 sen.
1
Appendix to ind news 2008: Most frequent abbreviations
127
Appendix to ind news 2008: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 3662
berat.
224
3784
Dr.
214
4260
No.
181
4674
..
159
5685
Prof.
123
5951
Air.
115
7200
bank.
89
7269
kg.
88
7405
Ny.
85
7931
pers.
78
8293
km.
73
9004
red.
65
9028
Km.
64
9568
dr.
59
10318 ha.
53
10837 St.
49
12698 Ir.
38
13375 Drs.
35
13499 cm.
35
13733 Tbk.
34
Appendix to ind news 2009: Most frequent abbreviations
128
Appendix to ind news 2009: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 3363
..
234
3713
berat.
205
3851
Dr.
195
4180
No.
175
4775
dr.
147
6274
Air.
101
6724
Prof.
92
7244
Km.
82
7756
red.
75
7861
bank.
73
8177
km.
69
9901
pers.
52
10852 Ny.
45
11410 kg.
42
11932 cm.
39
12543 Tbk.
36
14826 solid.
28
14935 Ir.
27
15205 pos.
27
16219 St.
24
Appendix to ind news 2010: Most frequent abbreviations
129
Appendix to ind news 2010: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 3455
Dr.
311
3790
dr.
280
4039
berat.
259
4552
No.
220
5287
Prof.
178
5938
Air.
150
6858
bank.
124
7004
red.
121
8222
km.
96
9265
kg.
81
9966
pers.
73
10024 cm.
72
11278 Ny.
60
12976 Ir.
48
13011 Pers.
48
13986 St.
43
14086 solid.
43
14634 Tbk.
40
15596 Ito.
36
16775 Din.
32
Appendix to ind news 2011: Most frequent abbreviations
130
Appendix to ind news 2011: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 4160
Dr.
223
4278
berat.
216
4297
Air.
214
4592
No.
196
6486
bank.
122
7547
Prof.
98
8130
pers.
89
8217
red.
88
9574
kg.
71
10016 km.
66
10772 Tbk.
59
11123 Dua.
56
12025 St.
50
13626 Ny.
41
14967 solid.
36
15561 Co.
33
16263 Kg.
31
16380 dr.
31
18162 Ito.
26
18322 cm.
26
Appendix to ind news 2012: Most frequent abbreviations
131
Appendix to ind news 2012: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 3720
Dr.
305
3881
berat.
289
4132
No.
266
4512
Air.
234
5941
pers.
163
6356
Prof.
148
7024
km.
130
7464
kg.
120
7661
red.
116
8892
bank.
93
10327 dr.
75
11111 Tbk.
67
11226 cm.
66
11356 gram.
65
11937 St.
60
13264 Inc.
51
14771 Co.
43
14812 Ny.
43
17624 Mr.
33
17935 Ir.
32
Appendix to ind newscrawl 2011: Most frequent abbreviations
132
Appendix to ind newscrawl 2011: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 88
..
104619
2666
No.
5007
2835
berat.
4618
3494
Kab.
3567
4664
kg.
2472
5797
Dr.
1880
5828
bank.
1866
6119
Air.
1738
7922
pers.
1245
8645
cm.
1106
9075
km.
1033
10156 gram.
882
10320 Prof.
863
10989 Ny.
787
11462 dr.
745
11621 Drs.
729
12662 Inter.
647
13253 Tbk.
607
13863 Mr.
570
15264 solid.
499
Appendix to ind newscrawl 2012: Most frequent abbreviations
133
Appendix to ind newscrawl 2012: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 2991
berat.
4474
4043
Air.
3075
4261
kg.
2880
4406
No.
2751
5448
bank.
2078
6351
Dr.
1694
7557
Tbk.
1347
8656
km.
1115
9204
pers.
1026
10149 Kab.
895
10252 ha.
883
10973 cm.
799
11304 Prof.
766
11559 gram.
740
11563 Co.
739
11915 Ltd.
710
12193 Inc.
685
12436 Drs.
665
12968 Inter.
624
14338 solid.
543
Appendix to ind wikipedia 2007: Most frequent abbreviations
134
Appendix to ind wikipedia 2007: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 1444
St.
425
1461
Dr.
419
1639
cm.
372
1714
No.
357
2135
m.
287
3412
km.
169
3680
Prof.
154
3902
Mr.
143
4221
Ph.
130
4938
berat.
108
5376
Ir.
98
5542
Drs.
94
5628
sel.
93
6187
Inc.
82
6248
Jr.
81
7461
Mgr.
65
7512
no.
65
7904
mm.
61
7997
kg.
60
8271
Co.
57
Appendix to ind wikipedia 2012: Most frequent abbreviations
135
Appendix to ind wikipedia 2012: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 1215
No.
749
1397
St.
650
1427
p.
635
1500
Dr.
602
2280
Mr.
391
2493
cm.
358
2678
Drs.
330
2985
Prof.
293
3717
km.
224
4033
berat.
203
4124
Inc.
197
4578
Hal.
174
5222
Ir.
148
5363
Jr.
143
5836
sel.
128
6036
m.
122
6185
dr.
118
6191
kg.
118
6641
pp.
107
6738
no.
105
Appendix to ind web 2011: Most frequent abbreviations
136
Appendix to ind web 2011: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 271
..
3798
1362
No.
814
1417
Dr.
773
2290
berat.
460
2903
Prof.
349
3826
Ir.
241
4442
ra.
200
4554
Drs.
193
5169
a.
162
5468
no.
151
6330
Mr.
123
7015
bank.
107
7273
dr.
102
7616
al.
96
7855
cm.
92
7912
St.
91
8567
Ph.
82
8610
sp.
82
8937
Tbk.
77
9890
b.
67
Appendix to ind web 2012: Most frequent abbreviations
137
Appendix to ind web 2012: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 1709
Dr.
21433
1942
a.
18355
2071
No.
17144
3070
berat.
10569
3588
b.
8807
3743
Prof.
8355
4688
St.
6218
4897
Mr.
5876
5407
cm.
5167
5455
no.
5112
5809
Drs.
4719
6084
dr.
4429
6524
Ir.
4034
7232
bank.
3522
7423
Dia.
3400
7839
Kab.
3145
8284
d.
2926
8713
sel.
2738
9019
Ny.
2615
9181
km.
2558
Appendix to ind mixed 2012: Most frequent abbreviations
138
Appendix to ind mixed 2012: Most frequent abbreviations Top 20 words ending with period Rank Abbreviation Frequency 2161
Dr.
25302
2282
No.
23943
2770
a.
18626
3066
berat.
16433
4511
Prof.
10155
4973
b.
8978
5784
St.
7342
6119
Kab.
6842
6150
cm.
6793
6179
Mr.
6761
6882
bank.
5855
6908
dr.
5830
6928
Drs.
5814
7026
no.
5692
7609
kg.
5135
7816
Ir.
4955
9151
km.
4030
9305
Air.
3943
9778
Ny.
3687
10196 Dia.
3485
Appendix to ind news 2007: Left neighbors of the full stop
139
Appendix to ind news 2007: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 305
2005
24
59
41
458
2008
20
43
47
628
2004
13
32
41
940
2002
12
21
57
941
2003
9
21
43
1038
sana
9
20
45
1111
AFP
13
18
72
1245
Press
9
16
56
1309
2001
9
15
60
1582
1999
5
12
42
1699
tenis
5
12
42
1708
Bali
7
11
64
2039
1997
5
9
56
2040
2000
4
9
44
2041
6-2
6
9
67
2066
Jolo
4
9
44
2195
puas
4
9
44
2224
2010
4
8
50
2435
2009
6
7
86
2517
Tech
3
7
43
2518
Times 3
7
43
2527
York
3
7
43
2618
medis 3
7
43
2730
1992
3
6
50
2731
1993
3
6
50
Appendix to ind news 2008: Left neighbors of the full stop
140
Appendix to ind news 2008: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 646
AFP
1099
1482
74
831
Rp9
1125
1161
97
1511
Rp1
353
627
56
1981
Rp2
311
473
66
2038
Rp5
270
460
59
2212
Rp10
190
419
45
2365
Rp3
219
385
57
2508
DPA
256
359
71
2776
W
166
318
52
2881
Rp6
210
303
69
3060
Rp4
187
283
66
3812
Rp12
164
212
77
3882
Rp7
149
207
72
4770
Rp11
130
155
84
5564
Rp8
81
127
64
6038
www
114
114
100
6455
21-16 46
103
45
6560
21-12 42
101
42
6989
21-18 39
92
42
7418
buron 35
85
41
8670
Rp13
37
68
54
9613
21-11 24
58
41
10372 1972
22
52
42
11095 21-8
21
47
45
12074 1948
17
41
41
Appendix to ind news 2009: Left neighbors of the full stop
141
Appendix to ind news 2009: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 750
AFP
775
1243
62
1588
Rp10
401
578
69
2160
Rp1
167
403
41
2518
Rp9
302
331
91
2984
Rp2
127
270
47
3086
2011
105
260
40
3344
Rp11
215
237
91
3757
W
115
201
57
4322
Rp4
112
168
67
4509
Rp12
110
158
70
5037
Rp6
85
137
62
5841
Rp7
68
112
61
6702
www
93
93
100
6866
2020
36
89
40
6867
21-18 39
89
44
7203
Rp8
58
83
70
7500
21-13 35
78
45
7704
21-11 38
75
51
10046 2013
26
50
52
11631 2050
17
40
43
13930 14-21 13
30
43
14519 18-21 13
28
46
15636 1947
13
25
52
15746 Loew 11
25
44
17024 ISNA 11
22
50
Appendix to ind news 2010: Left neighbors of the full stop
142
Appendix to ind news 2010: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 883
AFP
1003
1430
70
1121
Rp9
1066
1126
95
1821
Rp1
355
683
52
2398
Rp8
433
495
87
2762
Rp2
170
416
41
3833
Rp3
111
275
40
4306
2015
102
236
43
5152
2013
82
184
45
5384
Rp6
86
173
50
5496
knot
87
168
52
6088
Rp7
83
145
57
8131
www
98
98
100
10572 1988
29
66
44
11187 Rp11
34
61
56
12047 IRNA
22
54
41
14575 Jln
20
40
50
16195 Kep
31
34
91
18604 1947
12
27
44
18617 7-5
11
27
41
18772 Pitoy
15
27
56
19071 Fars
11
26
42
19442 1948
11
25
44
19531 Erna
11
25
44
19602 Kyodo 12
25
48
Appendix to ind news 2011: Left neighbors of the full stop
143
Appendix to ind news 2011: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 373
AFP
1744
2811
62
1397
Rp8
759
825
92
1918
Rp1
301
585
51
3005
Boy
143
338
42
3111
Rp2
132
325
41
3405
silam
118
290
41
4061
Rp9
187
231
81
5258
Rp6
98
163
60
5415
Rp4
72
156
46
5451
knot
99
155
64
5465
Rp7
94
154
61
9132
2016
38
75
51
9544
Neta
35
71
49
9624
Jl
29
70
41
10887 Saud
32
58
55
13542 www
42
42
100
14395 labil
16
38
42
15129 bbc
35
35
100
15246 1963
20
34
59
16514 2017
13
30
43
16875 21-17 12
29
41
17640 21-14 15
27
56
17945 knots
18
27
67
18030 siur
14
27
52
19702 Sokou 11
23
48
Appendix to ind news 2012: Left neighbors of the full stop
144
Appendix to ind news 2012: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 142
Rabu
2985
7050
42
148
Jumat
2796
6878
41
159
Kamis 2768
6607
42
464
AFP
2099
2771
76
2966
BBC
164
403
41
4995
Sun
108
207
52
6814
Jl
57
135
42
6894
Saud
56
133
42
7072
knot
62
129
48
8261
Mail
69
103
67
8602
2017
41
97
42
9100
Rp9
41
90
46
9600
IRNA
44
83
53
27
67
40
11203 SANA 34
66
52
11976 knots
30
60
50
13256 First
21
51
41
13412 1968
21
50
42
13468 Marca 35
50
70
14126 www
47
47
100
14155 Coeng 22
46
48
15219 ESPN
17
41
41
15440 21-19
17
40
43
15473 CNET 21
40
53
16259 2022
37
49
11070 2018
18
Appendix to ind newscrawl 2011: Left neighbors of the full stop
145
Appendix to ind newscrawl 2011: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 1922
silam
3484
7199
48
4774
Kec
1298
2398
54
5543
Jln
1794
1988
90
5863
surya
995
1849
54
12011 dll
438
697
63
12277 ricuh
304
676
45
12927 Goal
368
629
59
14381 LKPj
237
542
44
15784 Rp9
316
476
66
16687 Rp6
200
441
45
17243 siur
213
421
51
17426 Rp8
217
414
52
18404 Rp7
193
383
50
18970 www
362
367
99
19103 Kel
185
363
51
19125 lelap
148
363
41
20678 pudar 130
324
40
Appendix to ind newscrawl 2012: Left neighbors of the full stop
146
Appendix to ind newscrawl 2012: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 405
WIB
14517
34611
42
2233
silam
3102
6494
48
3114
2015
1712
4269
40
3311
AFP
1876
3964
47
7192
2016
608
1438
42
11609 lho
301
735
41
12867 2017
266
631
42
13476 ricuh
298
591
50
14088 Goal
337
556
61
14604 Marca 262
528
50
14720 dll
332
522
64
17245 siur
178
411
43
17843 2018
166
389
43
19654 Kec
276
336
82
20467 goal
144
317
45
Appendix to ind wikipedia 2007: Left neighbors of the full stop
147
Appendix to ind wikipedia 2007: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 1399
dll
349
438
80
2076
RRT
130
295
44
2781
Jl
188
213
88
4119
Pdt
127
134
95
4415
2008
71
123
58
4512
WIB
55
120
46
4621
dsb
98
117
84
4954
BT
57
107
53
5885
KH
42
87
48
5910
dpl
54
87
62
6150
koku
39
83
47
7521
silam
31
65
48
7656
List
36
63
57
7666
Piece
37
63
59
8611
saw
26
55
47
10019 dkk
20
46
43
10256 mis
44
45
98
10462 2010
20
43
47
10969 Kec
40
41
98
11203 Seto
17
40
43
12292 1819
15
35
43
12921 Gabon 14
33
42
13989 WITA 15
30
50
14156 1810
12
29
41
14237 Jw
29
29
100
Appendix to ind wikipedia 2012: Left neighbors of the full stop
148
Appendix to ind wikipedia 2012: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 113
jiwa
3245
5758
56
651
PT
629
1426
44
827
M
543
1103
49
846
km²
671
1078
62
1039
H
592
885
67
1380
D
309
658
47
1885
S
314
480
65
2102
R
293
428
68
2192
J
328
407
81
2267
Jl
366
393
93
2336
E
198
381
52
2661
P
207
332
62
2749
L
130
320
41
2814
hlm
295
313
94
2957
dll
227
296
77
3055
F
140
284
49
3212
K
126
267
47
3339
XII
107
256
42
3404
G
132
251
53
3433
W
176
248
71
3664
2012
107
228
47
4029
KH
126
203
62
4477
Hlm
141
179
79
4613
vs
109
173
63
5582
6–4
55
135
41
Appendix to ind web 2011: Left neighbors of the full stop
149
Appendix to ind web 2011: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 247
PT
1863
4150
45
275
Rp
1714
3767
46
635
surut
912
1711
53
1030
parah
468
1048
45
1673
sepi
297
654
45
1683
Jl
574
649
88
1911
dll
342
564
61
2013
H
254
534
48
2035
M
235
527
45
2778
Praga
152
367
41
2784
pedih
152
367
41
3198
P
136
307
44
3695
kabur
110
253
43
3707
Opak
105
251
42
4332
sesak
93
208
45
4557
R
84
193
44
5114
susut
78
165
47
5208
saw
106
161
66
5231
dsb
94
160
59
5593
hehe
80
146
55
5803
G
62
138
45
5969
retak
66
134
49
5970
suram 57
134
43
6385
buram 55
122
45
6578
DR
117
78
91
Appendix to ind web 2012: Left neighbors of the full stop
150
Appendix to ind web 2012: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 1543
H
11138
23873
47
1792
dll
12933
20298
64
2082
saw
7328
17037
43
2532
S
6171
13432
46
2616
Jl
7602
12882
59
3237
swt
4363
9969
44
3504
dsb
5346
9054
59
3517
c
5644
9012
63
3690
E
4051
8515
48
3822
QS
3981
8149
49
3853
R
3834
8071
48
3993
KH
3239
7730
42
5117
G
2241
5541
40
5175
F
2556
5467
47
5819
L
1994
4708
42
6314
Swt
2053
4207
49
6462
W
2280
4083
56
6698
Pdt
3070
3883
79
8176
hehe
1731
2976
58
8681
DR
1704
2749
62
9652
dst
1516
2405
63
9732
hlm
1877
2380
79
10426 Sdr
1155
2169
53
10871 lih
1803
2051
88
10940 Bpk
1152
2034
57
Appendix to ind mixed 2012: Left neighbors of the full stop
151
Appendix to ind mixed 2012: Left neighbors of the full stop Top 25 left neighbour co-occurrences of full stop Rank Word Frequency before Full Stop Frequency overall Amount 2434
dll
13987
21886
64
2940
saw
7570
17422
43
3143
silam
7006
15980
44
4494
swt
4535
10201
44
4644
c
5909
9775
60
4741
dsb
5679
9540
60
4805
AFP
5500
9400
59
5241
QS
4040
8345
48
6058
W
2977
6926
43
6253
Pdt
3254
6668
49
7355
Rp1
2442
5361
46
8654
Kec
3081
4322
71
8672
Swt
2090
4313
48
8757
DR
1985
4256
47
10250 Rp9
3051
3466
88
10546 Rp2
1431
3333
43
10984 Jln
2733
3159
87
11007 hehe
1846
3151
59
12963 dst
1580
2514
63
13106 hlm
1923
2472
78
13662 Sdr
1239
2342
53
14129 Bpk
1265
2229
57
14476 www
2026
2157
94
14549 Rp8
1621
2141
76
14900 lih
1818
2072
88
Appendix to ind news 2007: Left neighbors of the full stop with additional internal full stops
Appendix to ind news 2007: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
2586
[email protected]
7
8634
Israel...untuk
1
10138 Washington...kita
1
10709 computerandvideogames.com 1 10828 dicerna...merisaukan
1
11236 gazeta.ru
1
11692 kita...tengah
1
12962 pihak...merupakan
1
13092 rekomendasi...untuk
1
13673 unjukrasa...seminggu
1
13680 usai...dan
1
Appendix to ind news 2008: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
19722 K.H
19
20351 H.M
18
23055 W.Bush
15
26187 P.T
12
27172 D.C
11
28621 Briefing.com
10
29294 S.H
10
33061 M.Fadli
8
33062 M.S
8
33689 U.S
8
35146 Economy.com
7
35377 J.A
7
35638 M.Hum
7
38325 F.X
6
152
Appendix to ind news 2008: Left neighbors of the full stop with additional internal full stops
39367 R.M
6
39481 S.Arifin
6
41523 A.W
5
41524 A.Yani
5
42206 Dr.Soetomo
5
42453 H.J
5
42736 K.R.H.Dharmodipuro 5 43669 Prov.Papua
5
43863 S.Sos
5
44660 bbcindonesia.com
5
46633 A.A
4
Appendix to ind news 2009: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
12945 K.H
34
16493 Briefing.com
23
18258 arrahmah.com
20
24491 D.C
12
24527 Economy.com
12
25848 H.M
11
26529 icasualties.org
11
27853 U.S
10
28637 A.M
9
31133 M.Si
8
33667 M.S
7
35682 A.J
6
38936 www.antaranews.com 6 39827 F.X
5
40582 M.Hum
5
40583 M.Jamil
5
40584 M.Sc
5
41836 W.Bush
5
44161 Arrahmah.com
4
44238 BBCindonesia.com
4
153
Appendix to ind news 2009: Left neighbors of the full stop with additional internal full stops
44644 D.H
4
45375 J.E
4
45376 J.W
4
45377 J.W.Marriot
4
45779 L.A
4
Appendix to ind news 2010: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
12469 K.H
51
16451 Briefing.com
33
24889 H.M
17
25164 Tokobagus.com
17
26706 FIFA.com
15
27277 icasualties.org
15
27956 M.Jamil
14
30954 U.S
12
31646 A.A
11
31724 B.J
11
33451 BBCindonesia.com 10 33571 D.C
10
33697 Google.cn
10
33944 M.D
10
33945 M.Si
10
34237 S.H
10
35449 Amazon.com
9
36599 TMZ.com
9
37707 A.M
8
38012 Dr.Karen
8
38477 M.S
8
38777 Plasa.com
8
40624 Autonews.com
7
40846 D.L
7
41514 M.Sc
7
154
Appendix to ind news 2011: Left neighbors of the full stop with additional internal full stops
Appendix to ind news 2011: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
17458 antaranews.com
28
19720 Tokobagus.com
23
26444 Antaranews.com
14
27591 Briefing.com
13
27868 M.Si
13
31195 U.S
11
31946 A.M
10
33866 A.S
9
33921 Amazon.com
9
38915 A.A
7
39055 BBCindonesia.com 7 39631 J.J
7
40158 P.J
7
40445 S.H
7
41214 freco.com
7
41271 iCasualties.org
7
41854 s.d
7
42760 D.C
6
42880 E.T
6
43070 H.M
6
43573 M.Eng
6
47888 K.H
5
48625 Ny.Clinton
5
49435 St.Lucia
5
54680 M.Hum
4
155
Appendix to ind news 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ind news 2012: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
11692 Tokobagus.com
62
16903 K.H
35
20540 M.S
26
22676 A.A
22
24917 D.C
19
24960 H.M
19
26691 E.E
17
27896 M.Si
16
30295 R.A
14
32474 A.S
12
32523 B.J
12
35112 U.S
11
40471 BBCindonesia.com 8 40586 Briefing.com
8
41239 M.Djamil
8
42299 detik.com
8
44167 J.R.R
7
45070 S.H
7
45250 St.Petersburg
7
47133 Amazon.com
6
47416 C.K
6
48363 L.P
6
48472 M.Sc
6
49485 So.cl
6
49637 TMZ.com
6
156
Appendix to ind newscrawl 2011: Left neighbors of the full stop with additional internal full stops
Appendix to ind newscrawl 2011: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
17457 M.Si
413
20790 Z.P
321
21575
[email protected] 303 22285 K.H
287
25558 S.H
231
25559 S.Sos
231
28392 H.N
194
28850 M.S
189
29829 M.D
179
31157 Kompas.com
166
37680 Goal.com
120
38084 S.Pd
118
38214 H.M
117
39519 indosiar.com
111
41428 U.S
102
44090 A.S
91
45601 Indosiar.com
86
45636 M.M
86
47076 s.d
82
48546 E.coli
77
48948 M.H
76
49445 detik.com
75
50895 M.Pd
71
52990 D.C
66
56085 M.Z
60
157
Appendix to ind newscrawl 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ind newscrawl 2012: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
4958
suaramerdeka.com 2358
5630
a.l
1993
11673 Indosiar.com
729
16611 Solopos.com
436
21724 D.W
290
24085 M.S
248
24820 M.Si
237
25288 a.m
230
26332 S.Sos
215
37019 M.Hum
119
37415 Tokobagus.com
117
40126 P.S
103
42300 S.Pd
94
43455 p.m
90
44485 S.H
86
44934 s.d
85
47399 U.S
77
47691 Ny.Winka
76
48432 S.Ag
74
50736 M.Pd
68
51917 B.J
65
52396 E.E
64
54494 detik.com
60
55286 H.M
58
56531 Ny.Fatum
56
158
Appendix to ind wikipedia 2007: Left neighbors of the full stop with additional internal full stops
Appendix to ind wikipedia 2007: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
4682
Ph.D
115
4766
s.a.w
113
5513
F.C
95
7142
a.s
69
9406
Andri.h
49
9416
D.C
49
10869 r.a
42
13795 A.S
30
16095 en.wikipedia.org 25 22155 M.Sc
16
23172 M.A
15
23876 s.w.t
15
25184 t.A.T.u
14
25951 R.I
13
26132 U.S
13
26463 l.k
13
30661 B.A
10
32617 s.d
10
33091 CONFIG.SYS
9
33480 J.K
9
33932 OpenOffice.org
9
34183 S.J
9
35326 s.M
9
36704 M.Si
8
37060 Ph.D.nya
8
159
Appendix to ind wikipedia 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ind wikipedia 2012: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank Word Frequency 7504
K.H
91
8147
U.S
82
9984
D.C
63
11487 S.H
53
11791 A.S
51
12382 F.C
48
13842 R.I
42
16493 s.d
34
18281 M.Sc
29
18768 M.Si
28
19810 M.Pd
26
19901 R.A
26
22306 H.M
22
22385 M.A
22
22966 B.J
21
23252 R.O.B 21 24104 S.Pd
20
24570 A.C
19
24604 B.A
19
24636 C.C
19
24992 S.M
19
28115 M.S
16
29352 J.K
15
29353 J.P
15
29679 S.A
15
160
Appendix to ind web 2011: Left neighbors of the full stop with additional internal full stops
Appendix to ind web 2011: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
7091
s.d
106
7183
nhe,.w
104
7209
WordPress.com
103
7661
KOMPAS.com
95
10669 S.H
60
11164 M.Si
56
13968 M.Sc
41
14868 okezone.com
38
15582 NamaDomain.com 35 18677 a.l
27
20654 M.Eng
23
22370 A.S
20
24098 P.T
18
24136 Prof.Dr
18
24573 plazapulsa.com
18
24805 E.coli
17
25843 M.Pd
16
26200 download.thanks
16
27033 S.Pd
15
27293 e.V
15
27324 glagah.putih
15
28405 c.q
14
29355 M.A
13
29514 R.O
13
29550 S.Kom
13
161
Appendix to ind web 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ind web 2012: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank
Word
Frequency
6610
s.a.w
3964
7439
r.a
3389
7918
a.s
3102
8430
s.w.t
2860
12537 K.H
1690
13161 KOMPAS.com 1583 13645 s.d
1505
16741 WordPress.com 1123 18007 S.W.T
1013
19396 A.S
908
20613 katolisitas.org
830
21245 M.Si
794
22053 S.A.W
750
24328 S.H
647
24773 a.l
629
26510 S.Pd
566
26893 S.M
555
28244 A.D
515
29413 R.I
484
29863 a.k.a
473
30751 R.A
452
30787 B.J
451
31966 H.M
426
32028 Q.S
425
32540 M.Pd
415
162
Appendix to ind mixed 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ind mixed 2012: Left neighbors of the full stop with additional internal full stops Top 25 left neighbors of full stop already containing full stops Rank 9044
Word s.a.w
Frequency 4083
10299 r.a
3447
10945 a.s
3175
11816 s.w.t
2876
14909 K.H
2070
17052 s.d
1703
17111 KOMPAS.com 1695 20878 M.Si
1271
21273 WordPress.com 1234 23643 A.S
1055
24128 S.W.T
1024
25433 S.H
948
27739 katolisitas.org
830
29267 S.A.W
764
30981 S.Pd
701
31657 a.l
679
34264 H.M
599
34588 S.M
591
36813 S.Sos
536
37562 A.D
519
37619 Kompas.com
518
37823 R.I
513
37877 a.k.a
512
38007 B.J
509
38122 M.Pd
507
163
164
Sentences details Appendix to ind news 2007: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
16
"Michael cedera.
16
"Dia luar biasa.
16
Dick harus mati.
17
"Ada dua pilihan.
18
"Sikap kami tegas.
19
Itu keputusan Anda.
19
Saya sangat bangga.
20
Tidak ada rasa aman.
20
Tujuh orang ditahan.
20
Saya tidak khawatir.
Length
Sentence
Shortest exclamatory sentences
25
Angkasa, ini saya datang!
Shortest interrogative sentences Length
Sentence
18
Anda tahu ini apa?
29
Akankah uang korupsi kembali?
33
Dan bagaimana proses selanjutnya?
Appendix to ind news 2008: Shortest sentences
165
Appendix to ind news 2008: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Itu wajar saja.
15
90 juta rupiah.
15
"Belum selesai.
15
Itu tergantung.
15
050 per lembar.
15
300 per lembar.
15
500 per lembar.
15
Bukan itu saja.
15
000 menjadi Rp.
15
150 menjadi Rp.
Shortest exclamatory sentences Length
Shortest interrogative sentences
Sentence
15
Itu tidak adil!
16
"Indonesia Bisa!
17
"Akan saya gebuk!
18
"Jawab yang jujur!
18
Buka akses publik!
19
Polri harus berani!
19
Sangat kurang ajar!
20
Tapi dibiarkan saja!
21
Tak ragu bela rakyat!
22
Tak dukung Pemerintah!
Appendix to ind news 2008: Shortest sentences
166
Length
Sentence
17
Masih mau meragu?
17
"Kau mau ke mana?
18
"Siapa yang pakai?
18
Apa komentar anda?
18
"Tadi soal apa ya?
18
Masih juga meragu?
18
Siapa saja mereka?
18
Semua bisa dijual?
18
Jadi kita ke tepi?
20
"Saya ini siapa sih?
Appendix to ind news 2009: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
" katanya juga.
15
19 orang tewas.
15
23 orang tewas.
15
Rendra dari SD.
15
Itu pesan saya.
15
050 per lembar.
15
Bukan itu saja.
15
Tidak tentunya.
15
Tidak itu saja.
15
Selain itu, PT.
Appendix to ind news 2009: Shortest sentences
167
Length
Sentence
19
Dasar bangsa tolol!
19
Dasar bangsa bodoh!
19
! mna ada flu babi!
23
Untuk kali kedua, maaf!
25
Merdeka, Hidup Indonesia!
28
Buktikan dgn karya km donk.!
28
Terlihat sejak kuliah di AS!
28
Di sana juga ada masalahnya!
28
Dengan demikian, "Mamma Mia!
28
Terlalu besar, terlalu luas!
Shortest interrogative sentences Length
Sentence
15
Apa mau dikata?
15
"Ayah sakit ya?
15
"Apa kabar Pak?
16
Apakah flu babi?
16
Siapa yang tahu?
17
"Pemain muda apa?
17
Saat tidak tepat?
18
Apa komentar anda?
18
"Tapi, coba tebak?
18
Bila mereka kalah?
Appendix to ind news 2010: Shortest sentences
168
Appendix to ind news 2010: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Itu `kan biasa.
15
Ternyata tidak.
15
"Spanyol hebat.
15
Bukan itu saja.
15
Sebelumnya, PT.
15
Itu luar biasa.
15
Tidak itu saja.
15
Selain Spanyol.
15
Chili tim kuat.
15
"Jalan aja lah.
Shortest exclamatory sentences Length
Shortest interrogative sentences
Sentence
15
Itu tak kutahu!
15
Jadi pas benar!
16
Itu sudah cukup!
16
Hidup Indonesia!
16
Yang benar saja!
16
Saya belum mati!
18
Itu seperti 'Woow!
18
Karena anda sibuk!
19
" (Hidup Indonesia!
20
1-0 untuk Indonesia!
Appendix to ind news 2010: Shortest sentences
169
Length
Sentence
15
Uang yang mana?
16
Itu salah siapa?
17
Apa harus begitu?
17
Jadi ini ada apa?
17
Bisa dilihat apa?
18
Apa komentar anda?
18
Apa jawab Gus Dur?
18
Apakah sudah siap?
18
Siapa yang peduli?
20
Apa saja kendalanya?
Appendix to ind news 2011: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
Ternyata tidak.
15
Ternyata benar.
15
Itu wajar saja.
15
Itu tidak baik.
15
" katanya juga.
15
088 per lembar.
15
950 per lembar.
15
Ia sosok bebas.
15
Sebelumnya, PT.
15
Itu luar biasa.
Appendix to ind news 2011: Shortest sentences
170
Length
Sentence
17
Pelayanan publik!
18
"Kami masih hidup!
19
Fulitik akal tikus!
19
Hidup rakyat Libya!
19
Gerakan massa "Ayo!
19
"Duta Besar Keluar!
20
1-0 untuk Indonesia!
20
Sampai saya kembali!
21
Ini sepak bola, Bung!
21
"Tidak setuju, titik!
Shortest interrogative sentences Length
Sentence
15
Apa kabar Bali?
16
Tentu tidak kan?
16
"Apa kabar Bali?
17
Masih tidak puas?
17
Ke mana uang ini?
17
"Masa depan saya?
17
"Itu nama kue ya?
18
Apa komentar anda?
18
Masih mau tawuran?
18
Kan ada nomor dua?
Appendix to ind news 2012: Shortest sentences
171
Appendix to ind news 2012: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Ternyata tidak.
15
Ternyata belum.
15
"Baru dua kali.
15
Itu tidak adil.
15
Itu selalu ada.
15
Sekarang belum.
15
Bukan itu saja.
15
Itu mudah saja.
15
Itu masuk akal.
15
Sebelumnya, PT.
Length
Sentence
Shortest exclamatory sentences
Shortest interrogative sentences
15
2-0 untuk City!
15
3-2 untuk City!
15
Saat ini Yahoo!
17
Kita tunggu saja!
18
Petruk naik motor!
18
Sekitar Rp12 juta!
19
Selamat Tahun Baru!
20
2-0 untuk Newcastle!
21
Ibu-ibu tidak peduli!
22
"Jakarta selamat sore!
Appendix to ind news 2012: Shortest sentences
172
Length
Sentence
16
Artinya apa ini?
16
Siapa yang tahu?
16
Siapa orang ini?
17
Apa jawaban guru?
17
"Masa depan saya?
18
Apa komentar anda?
18
Loh itu dari mana?
19
Bahkan impor garam?
19
"Saya harus kemana?
19
Dari komisi berapa?
Appendix to ind newscrawl 2011: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
Itu zaman dulu.
15
Ternyata tidak.
15
Ternyata salah.
15
Ternyata palsu.
15
Ternyata bukan.
15
Ternyata benar.
15
Ternyata belum.
15
Itu yang wajar.
15
Itu yang utama.
15
Itu yang perlu.
Appendix to ind newscrawl 2011: Shortest sentences
173
Length
Sentence
15
Ternyata tidak!
15
Ternyata salah!
15
" "Bukan mimpi!
15
DI luar dugaan!
15
Kalau mau bisa!
15
" "Itu awalnya!
15
”O, tidak bisa!
15
Tak setuju aku!
15
Jelas tak bisa!
15
Dasar sok suci!
Shortest interrogative sentences Length
Sentence
15
Namun apa bisa?
15
"Ke mana Kasan?
15
"Ke mana Akang?
15
Dia kuliah S-2?
15
Apa kabar juga?
15
Apa jawab papa?
15
"Tapi, ke mana?
15
Sudah bisa kan?
15
Minggu ini Pak?
15
Om mau ke mana?
Appendix to ind newscrawl 2012: Shortest sentences
174
Appendix to ind newscrawl 2012: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Malaysia nanti.
15
Ternyata tidak.
15
Ternyata sulit.
15
Ternyata salah.
15
Ternyata palsu.
15
Ternyata mudah.
15
Ternyata bukan.
15
Ternyata benar.
15
Ternyata belum.
15
Itu yang utama.
Shortest exclamatory sentences Length
Shortest interrogative sentences
Sentence
15
Ternyata tidak!
15
Ternyata salah!
15
Tak tahu pasti!
15
Ibu sudah mati!
15
Sekarang tidak!
15
Karena beracun!
15
Tuhan tak adil!
15
Kau mulai lagi!
15
Belum maksimal!
15
Ambil uang itu!
Appendix to ind newscrawl 2012: Shortest sentences
Length
175
Sentence
15
Sakit gigi kah?
15
"Siapa itu IPL?
15
Apa mimpi kamu?
15
"Ke anggota KB?
15
Siapa yang mau?
15
Siapa juga aku?
15
Siapa itu Suju?
15
Siapa akar itu?
15
Tapi, kapan ya?
15
Dari siapa itu?
Appendix to ind wikipedia 2007: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
New York. 1990.
15
Tim yang hebat.
15
Gejayan dan Jl.
15
Lampung Tengah.
15
Ia pun mencoba.
15
Ia pun "jatuh".
15
Pulau Tawas 35.
15
Pulau Macan 34.
15
Pulau Bulat 25.
15
Tepatnya di Jl.
Appendix to ind wikipedia 2007: Shortest sentences
Length
176
Sentence
15
Sebuah obyek O!
15
Kami rela mati!
17
Di AS, Smackdown!
17
Hidup Yugoslavia!
18
Tahun 2004, Yahoo!
18
Selain itu, 3DNow!
18
Dengan izin Tuhan!
18
Pada 2004, Arisan!
19
Menurut AMD, 3DNow!
19
O manusia, bangkit!
Shortest interrogative sentences Length
Sentence
15
Apa yang salah?
15
Apa itu ibadah?
16
Tuhan atau Dewa?
16
Di mana bedanya?
17
Ada Apa Denganmu?
17
Apakah Tuhan ada?
17
Baik, dan engkau?
18
Namun apa itu BSD?
18
Di mana toiletnya?
18
Dengan alasan apa?
Appendix to ind wikipedia 2012: Shortest sentences
177
Appendix to ind wikipedia 2012: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Ia pun mencoba.
15
Ia pun "jatuh".
15
Museum Vatikan.
15
Bahasa Spanyol.
15
Krabs saat itu.
15
Besar TNI Purn.
15
Kadipolo ke RS.
15
Kuningan barat.
15
Pemandangan St.
15
Tahun 1998, PT.
Length
Sentence
Shortest exclamatory sentences
Shortest interrogative sentences
15
Mereka kembali!
16
Hidup Sang Ratu!
17
Hidup Yugoslavia!
18
Sejak awalnya Hey!
18
Di sisi kiri kita!
18
" "Sekarang pergi!
18
Tapi aku suka itu!
19
Yakin Usaha Sampai!
19
Jumlah medali emas!
20
" (semua) "semuanya!
Appendix to ind wikipedia 2012: Shortest sentences
178
Length
Sentence
17
Kamu mau ke mana?
18
Masih belum cukup?
18
Dengan alasan apa?
19
Apa saja agendanya?
19
" (Siapa itu Tommy?
19
Siapa Lebih Berani?
20
Apakah hal ini adil?
21
Apa kamu mau sekarat?
21
Siapa pelanggan kita?
22
A: Perusahaan apa tuh?
Appendix to ind web 2011: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
Ternyata tidak.
15
Ternyata padat.
15
Ternyata lolos.
15
Ternyata bukan.
15
Ternyata belum.
15
10 juta - < Rp.
15
50 juta - < Rp.
15
Ia cukup setia.
15
Ia sudah pergi.
15
Ia sudah kawin.
Appendix to ind web 2011: Shortest sentences
179
Length
Sentence
15
Apa tidak gila!
15
Met Tahun Baru!
15
Sekarang pergi!
15
Selama mencoba!
15
Ia tidak marah!
15
Dan benar saja!
15
" atau "Polisi!
15
Hayo kita coba!
15
Tapi kebetulan!
15
Uang buat Anda!
Shortest interrogative sentences Length
Sentence
15
Ternyata ia me?
15
Tentu saja hal?
15
Tentu saja Asy?
15
Tentu ada dian?
15
Tugas para Ras?
15
Tak percaya ya?
15
1. Apa Itu PHP?
15
Memang ada kah?
15
Karena yang mu?
15
Karena kami su?
Appendix to ind web 2012: Shortest sentences
180
Appendix to ind web 2012: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Sentence
15
Aahh~ baik lah.
15
Itu zaman dulu.
15
"Menyusul saja.
15
B-boys pun ada.
15
II, Yogyakarta.
15
Apa yg terjadi.
15
Itu yg terbaik.
15
Itu yg penting.
15
800 yg mana Rp.
15
Ternyata tutup.
Shortest exclamatory sentences Length
Shortest interrogative sentences
Sentence
15
Dato’ tak adil!
15
Ternyata tidak!
15
Ternyata Tidak!
15
Ternyata mudah!
15
Ternyata bukan!
15
Ternyata boleh!
15
Ternyata benar!
15
Ternyata belum!
15
Itu yang pasti!
15
Ayo yang jujur!
Appendix to ind web 2012: Shortest sentences
181
Length
Sentence
15
Apa yg aneh ya?
15
Ibu yang mulai?
15
Itu yang benar?
15
Itu ungu bukan?
15
Ke Rumah Sakit?
15
Ia juara kedua?
15
! mau kaya dia?
15
Tentu ada lagi?
15
Tak tidur lagi?
15
Dia teroris ya?
Appendix to ind mixed 2012: Shortest sentences The shortest sentences by string length Shortest declarative sentences Length
Shortest exclamatory sentences
Sentence
15
Aahh~ baik lah.
15
Itu `kan biasa.
15
Itu zaman dulu.
15
"Menyusul saja.
15
B-boys pun ada.
15
New York. 1990.
15
II, Yogyakarta.
15
Apa yg terjadi.
15
Itu yg terbaik.
15
Itu yg penting.
Appendix to ind mixed 2012: Shortest sentences
182
Length
Sentence
15
Dato’ tak adil!
15
Ternyata tidak!
15
Ternyata Tidak!
15
Ternyata salah!
15
Ternyata mudah!
15
Ternyata bukan!
15
Ternyata boleh!
15
Ternyata benar!
15
Ternyata belum!
15
Itu yang pasti!
Shortest interrogative sentences Length
Sentence
15
Apa yg aneh ya?
15
Ternyata ia me?
15
Apa yang salah?
15
Ibu yang mulai?
15
Itu yang benar?
15
Itu ungu bukan?
15
Ke Rumah Sakit?
15
Ia juara kedua?
15
Tentu saja hal?
15
Tentu saja Asy?
Appendix to ind news 2007: Longest sentences
183
Appendix to ind news 2007: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Akhir minggu kemarin terjadi perundingan serius yang melibatkan kelompok mereka, yaitu kelompok Paisley, Uni Demokratik yang menginginkan Irlandia Utara bagian dari Inggris raya, dan kelompok Sinn Fein Gerry Adams yang ingin diakhirinya kekuasaan Inggris.
254
Manajer Manchester United Sir Alex Ferguson mengalami kesulitan mencari kiper yang handal setelah Peter Schmeichel pindah dari klub tersebut di tahun 1999.Berbagai kiper dicoba, dan akhirnya di musim ini, Ferguson menemukan yang cocok, Edwin van der Sar.
254
Suratkabar Etemad melaporkan polisi moral menyebarkan pengumumuman ke tempat potong rambut laki dan perempuan, memerintahkan mereka untuk tidak melayani pelanggan yang mengenakan dasi, jika tidak usaha mereka dapat ditutup sementara atau dicabut izinnya.
254
Dalam perkembangan terkait, Mentri Luar Negri Amerika Condoleeza Rice mengatakan, peringatan Rusia tidak masuk akal bahwa rencana Amerika untuk menempatkan sistem pertahanan peluru kendali di Polandia dan Republik Ceko bisa mengganggu keseimbangan Eropa.
254
Salah satu yang disimpan dalam arsip rahasia ini adalah surat cinta Raja Inggris, Henry ke-8 kepada Anne Boleyn, yang dicuri oleh seorang mata-mata Vatikan sebagai bukti yang diajukan kepada Paus ketika upaya Raja Henry membatalkan perkawinannya di Roma.
254
"Jam 9 datang seorang letnan kolonel [untuk] berbicara kepada saya yang memberi jaminan kami bisa tenang bahwa tidak akan ada penyerangan atas kediaman uskup," kata Belo dalam pernyataan dalam bahasa portugis yang diterjemahkan ke dalam bahasa Indonesia.
253
Menurut kesepakatan yang dicapai tanggal 13 Februari - yang ditandatangani oleh Korea Selatan, Korea Utara, Jepang, Cina, Rusia dan Amerika Serikat - Utara setuju untuk "mematikan dan menutup" reaktor Yongbyon dalam waktu 60 hari dengan imbalan bantuan.
253
Seorang anggota parlemen terkemuka dari unsur Kurdi, Mahmoud Othman mengatakan, para politisi Amerika hanya mempersiapkan pijakan untuk pemilihan presiden mendatang, meski seorang wakil Sunni mengatakan, pemberian suara di Amerika itu bukan urusan Irak.
253
"Rumah paku" - demikian julukan yang diberikan kepada rumah keluarga Wu Ping yang menolak bangunannya digusur dan dirobohkan, menjadi bangunan terisolasi di sebuah kawasan proyek konstruksi berskala besar setelah ribuan pemilik rumah lain setuju pindah.
253
Namun meski perdebatan berpusat pada masalah Irak, para politisi Partai Republik menyoroti subsidi sebesar jutaan dollar yang terkait dengan RUU itu, yang dikatakan sebagai upaya untuk meraih dukungan dari kalangan Demokrat yang ragu dengan rencana itu.
Appendix to ind news 2008: Longest sentences
184
Appendix to ind news 2008: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
"Krisis pangan yang melanda Indonesia saat ini telah memasuki tahap `food trap` `jebakan pangan` bahkan `killing ground` jika kita sangat mengandalkan impor sementara devisa tidak mendukung," kata anggota Presidium ICMI Muslimin Nasution di Jakarta, Rabu.
255
Sebelumnya, saat tiba di Bandar Udara Halim Perdanakusuma, Kamis (20/3) malam dari mendampingi Presiden Yudhoyono melakukan lawatan ke luar negeri, Andi Mallarangeng mengatakan hingga Kamis malam Presiden belum menerima surat dari Ketua DPR Agung Laksono.
255
Ia sendiri menyatakan siap lahir-bathin untuk meraih dukungan para peserta kongres, kendati salah satu syarat untuk menjadi ketua umum itu harus berdomisili di wilayah Jabotabek, karena untuk mengabdi dan kebesaran organisasi tentu dibutuhkan pengorbanan.
255
Selain itu, maraknya pengalihan fungsi lahan, tekanan politis atas kebijakan Rencana Tata Ruang dan Wilayah sangat mempengaruhi kondisi ini, ujar Sudarsono seusai berdiskusi di Kantor Dewan Pemerhati Kehutanan dan Lingkungan Tatar Sunda di Bandung, Jumat.
255
"Kami menunggu penilaian (kondisi dan situasi) yang dilakukan oleh pemerintah RI dan Afghanistan," katanya seraya menambahkan bahwa gedung KBRI yang terletak tepat di sebelah Kedubes India di Malalai Watt, Shah-Re-Now mengalami kerusakan yang cukup parah.
255
Kasubdin Energi dan Kelistrikan, Dinas Pertambangan Sultra, Asep Subrata mengatakan, masyarakat seharusnya mengerti dengan keadaan PLN saat ini, sebab kebutuhan listrik tidak dapat dipenuhi oleh PLN secara bersamaan akibat ketidakmampuan mesin pembangkit.
255
"Sidang dilanjutkan pada 15 Desember 2008 dengan pemeriksaan saksi," katanya Sebelumnya dilaporkan, Ferry Joko Juliantono, menyatakan dakwaan Jaksa Penuntut Umum (JPU) terhadap dirinya terkait aksi penolakkan kenaikan harga BBM yang berujung rusuh, salah.
255
"Jika demokrasi bisa bertahan dan berkembang biak di tiga negara itu, maka akan sangat berarti bagi (terwujudnya) impian demokratisasi di dunia Arab," kata mantan editor the Monitor dan profesor komunikasi internasional pada Universitas Brigham Young itu.
255
Unjuk rasa yang berlangsung di halaman Kantor Kejaksaan Tinggi Bangka Belitung Kamis (11/9) pukul 16.00 WIB itu diikuti empat LSM yaitu, LSM kampak babel LSM Antik, LSM Masyarakat Peduli Bangka Belitung dan LSM Ikambat dengan jumlah anggota puluhan orang.
255
Sebelumnya, ke-13 negara tersebut sepakat untuk membentuk sebuah skema pertukaraan mata uang (currency swap scheme), atau Chiang Mai Initiative (CMI) pascakrisis finansial Asia 1997-1998 untuk melindungi mata uang mereka dari krisis serupa di masa datang.
Longest exclamatory sentences Length
Sentence
228
Meryl Streep mengatakan, prospek bernyanyi dalam film itu memang membuat bersemangat ikut dalam proyek tersebut, karena dia pernah berperan dalam teater musikal ketika sekolah menengah, termasuk dalam pagelaran musikal Oklahoma!
227
Film komedi karya Will Farrell dari Sony/Columbia diperkirakan mengantungi 16,3 juta dolar AS dari penjualan tiket pekan lalu, dan total perolehan selama dua-pekan diperkirakan mencapai 63 juta dolar AS. Film musikal "Mama Mia!
226
Judul-judul esai yang termuat dalam buku tersebut antara lain "Kalau Presiden Punya Face Book", "Orang Bodoh Dilarang Jadi Presiden", "Tidak Hanya Perkasa Tapi Bisa Juga Orgasme", "Apa Iya Kita Butuh Presiden", "Minggir, dong!
226
Perempuan kelahiran 19 Juni 1980 ini mengungkapkan dibawah bendera Alenia Pictures ia makin mantap untuk terus memproduksi film-film untuk keluarga atau yang dia sebut "family movie" seperti film "Denias" dan "Liburan Seruuuu!
225
"Kita harus mempercepat terwujudnya impian itu di mana seluruh anak-anak Tuhan: kulit hitam dan kulit putih, Yahudi dan Muslim, Protestan dan Khatolik, bisa bergandeng tangan dan bernyanyi seperti hymne spritual Negro: Bebas!
212
" "Yang lebih seram lagi adalah isteri-isteri para penguasa tertinggi yang secara sendiri menguras kekayaan negara untuk memuaskan nafsu pribadinya, berfoya-foya di luar negeri, menimbun kekayaan di dalam negeri!
Appendix to ind news 2008: Longest sentences
185
211
Dia pun memelopori kaum nasionalis Indonesia untuk konsisten kepada dasar negara Pancasila serta mendorong Bung Karno mengeluarkan Dekrit Presiden, 5 Juli 1959 berisi: "Kembali ke Undang Undang Dasar (UUD) 1945!
209
Enam bintang itu baru saja terpilih lewat ajang Honda Jazz Stars Search2 2008 yang merupakan ajang pencarian remaja berbakat untuk menjadi pendamping All New Jazz bekerja sama dengan majalah remaja Aneka Yess!
207
Film "The Mummy: Tomb of The Dragon Emperor" diluncurkan dengan kuat, saat film produksi Universal tersebut diperkirakan meraih tiket penjualan sebesar 42,5 juta dolar AS. Film "Step Brothers" dan "Mama Mia!
206
Memang banyak warga China yang tidak memasang senyumannya, tapi beberapa di antaranya benar-benar berusaha untuk tampil ramah, dan tanpa segan-segan mendatangi orang asing hanya untuk menyapa "hallo, hallo!
Longest interrogative sentences Length
Sentence
254
Ketika diwawancarai oleh National Public Radio (NPR) mengenai pendiriannya, Ahmadinejad menjawab, "Saya ingin bertanya kepada anda, apakah itu (tentara) Iran yang mengepung wilayah di sekeliling negeri itu, atau apakah itu tentara AS yang berada di sana?
254
"Sebab setelah mengikuti pendidikan militer di sana, mereka biasanya menjalani pekerjaannya semula di negaranya masing-masing," kata Wawan H. Purwanto dalam acara "Bedah Buku:Terorisme Undercover; Memberantas Terorisme hingga ke Akar-Akarnya, Mungkinkah?
247
Karena itu, lembaga survei yang melakukan quick count harus mendapat sertifikasi dari pemerintah agar lebih kredibel, sehingga hasil surveinya bisa dipertanggungjawabkan kepada publik," katanya dalam seminar bertema "Quick Count Bisakah Dipercaya?
244
Tapi ada misteri mengapa uang asing demikian mudah mengaliri kantong ekonomi AS. Apa yang membuat investor asing rela meminjami Amerika dengan modal demikian banyak hanya karena janji untung para pengelola dana yang terbukti banyak membual itu?
242
Dalam pemungutan suara yang dipimpin oleh Duta Besar Rusia untuk PBB di Markas Besar PBB Vitaly Churkin, New York, hanya juru runding Indonesia Marty Natalegawa yang mengacungkan tangan saat Churkin bertanya dalam sidang "Adakah yang abstain?
238
Mungkinkah dari perilaku saling mencurigai membangun rangkaian saling mempercayai (from a series of distrust to a network of trust) juga dalam antar-relasi dan interaksi sisi persediaan supply side dan sisi permintaan demand side ekonomi?
238
Dalam pemungutan suara yang dipimpin Duta Besar Rusia untuk PBB, Vitaly Churkin, di Markas Besar PBB New York, hanya juru runding Indonesia Marty Natalegawa yang mengacungkan tangan saat Churkin bertanya dalam sidang "Adakah yang abstain?
238
"Kita tak melakukan pengayaan Uranium sendiri, kita memilih membelinya," kata Kepala Badan Tenaga Nuklir Nasional (Batan), Dr Hudi Hastowo, seusai Seminar Internasional "Iran`s Nuclear Program: What is It For, Can Indonesia Take A Lesson?
232
Tegur sapa itu dilontarkan setelah terjadi ketegangan diplomatik singkat, yang berawal November 2007 saat pertemuan tingkat tinggi di Santiago, Chile, ketika Raja Spanyol tersebut memberitahu Chavez, "Mengapa anda tidak tutup mulut?
232
Padahal, bukannya "apa" jiwa kewirausahaan dapat ditumbuhkan melalui pendidikan, tetapi "maukah" melalui diskusi kelompok jiwa kewirausahaan baru disambut dengan sikap positif dengan pengorbanan investasi dalam waktu, daya dan dana?
Appendix to ind news 2009: Longest sentences
186
Appendix to ind news 2009: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Siaran pers Kedutaan Besar Amerika Serikat di Jakarta yang diterima ANTARA di Denpasar, Jumat petang menyebutkan kompetisi itu untuk menyuarakan pemikiran para siswa sekolah menengah di Indonesia mengenai pengaruh tradisi budaya di tengah perubahan dunia.
255
"Petugas sudah melakukan tembakan peringatan ke udara, bahkan petugas sudah melakukan tembakan ke mobil yang mereka tumpangi, namun kawanan perampok tetap berusaha kabur, bukan malah menepikan kendaraanya, justru laju kendaraannya semakin cepat," katanya.
255
Ia mengatakan, kondisi iklim yang ada di Indonesia sudah cukup parah, tetapi pada pertemuan Klimatologi yang diikutinya berkata lain dan berkesimpulan jika potensi alam yang dimiliki Indonesia, khususnya Makassar merupakan aset ekologi untuk umat manusia.
255
Hal itu diungkapkan Anggota Komisi Nasional Hak Asasi Nasional (Komnas HAM), Syafruddin Ngulma Simeulue yang dihubungi ANTARA dari Surabaya, Kamis, di sela-sela melakukan pemantauan kegiatan pemilu di kawasan perbatasan Indonesia dengan Malaysia tersebut.
255
Para pejabat pemerintah Obama berkeras bahwa batas waktu penutupan penjara itu bisa dipenuhi, tetapi banyak anggota legislatif yang menyatakan perlu diyakini lebih jauh dengan rencana Gedung Putih memindahkan sejumlah besar tahanan itu ke daratan Amerika.
255
Polisi telah menyelidiki sejumlah dokter yang merawat Michael, dengan fokus tertuju pada dokter pribadinya dr. Conrad Murray, yang berada di samping tempat tidurnya ketika Michael menderita serangan jantung di rumah peristirahatan mewahnya di Los Angeles.
255
Pada SEA Games 2007 Thailand, cabang olahraga biliar berhasil menyumbangkan dua medali emas melalui Ricky Yang (nomor bola-9) dan Angeline Magdalena Ticoalu (bola-8), satu perak dari Angeline Magdalena, serta satu perunggu dari Tan Kiong An (nomor carom).
255
Kelima nama tersebut Jusuf Kalla, Akbar Tandjung, Surya Paloh, Agung Laksono dan Sultan Hamengku Buwono X. Alasan utama menyodorkan beberapa nama tersebut untuk menghindari sikap SBY jika nama tunggal yang diajukan itu ternyata tidak berkenan di hati SBY.
255
Klub finalis Piala Raja, Athletic Bilbao, menang dalam pertandingan melawan saingan berat mereka dari kawasan pantai utara, Racing Santander 2-1, ketika lima pemain dikeluarkan dari lapangan pada babak kedua, tiga pemain dari Racing dan dua dari Athletic.
255
Namun dalam aksi perampokan itu, para tersangka gagal merampas uang Rp400 juta yang merupakan gaji karyawan RSUD Kayuagung, setelah bungkusan tebal dalam kantong plastik yang diambil perampok hanya berisi ratusan amplop serta slip gaji dan berkas lainnya.
Longest exclamatory sentences Length
Sentence
254
Beberapa pemuda Palestina yang bekerja pada sebuah penginapan di Amman, setiap melihat gerakan pasukan Israel masuk ke Gaza melalui siaran televisi, langsun mengajak rekan-rekan dan tamu-tamunya yang masih terjaga untuk meneriakkan takbir, "Allahu Akbar!
231
" Sektor teknologi dalam fokus setelah Yahoo! dan Microsoft meluncurkan Web pencarian yang lama ditunggu pada kemitraan yang akan mempertemukan dua perusahaan pemimpin pasar terhadap Google, namun tidak ada suntikkan uang ke Yahoo!
229
Dalam salah satu penampilan puisi terkenalnya pada Mei 1998, di ruang gedung DPR RI semasa awal reformasi, almarhum berorasi dengan membacakan puisi karya aktivis dan penyair Wiji Thukul yang kesohor, "Hanya ada satu kata, Lawan!
Longest interrogative sentences
Appendix to ind news 2009: Longest sentences
Length
187
Sentence
251
Masih ingat saat Korps Pasukan Sandhi Yudha TNI-AD bisa menggulung pembajak DC-9 "Woyla" Garuda Indonesia di Bandar Udara Internasional Don Muang, Bangkok, Thailand, pada masa tokoh intelijen Indonesia, Benny Moerdani, memiliki kekuasaan begitu besar?
250
Karena sikapnya yang eksentrik pulakah yang membuat Surya Paloh rela mengeluarkan uang satu miliar rupiah dan berani terbang dengan helikopter dalam cuaca buruk hanya untuk berpidato 15 menit di kabupaten terpencil yang tidak banyak dikunjungi orang?
249
Keputusan FIFA mungkin bisa membuat Abramovich tidak perlu mengeluarkan dana untuk transfer pemain - bahkan bisa membuat Kakuta kehilangan kesempatan bermain di beberapa pertandingan dengan tim inti - tetapi apa kerugiannya jika menyangkut prestasi?
246
Jumlah gedung yang disewa sebanyak 407 rumah terdiri dari, (1) sebanyak 115 rumah di ring I, jarak sampai dengan 2000 M ke Masjidil Haram dengan kapasitas 52.499 (26,36%) mencakup wilayah Hafair, Jarwal, Sulaimaniah, Jumaizah, Misfalah dan Syari?
244
"Permasalahannya, partai-partai Islam hanya membicarakan masalah-masalah agama dan moral," kata Peneliti Lembaga Survei Indonesia (LSI) Burhanuddin Muhtadi dalam acara peluncuran hasil survei dan diskusi dengan tema "Mengapa Partai Islam Kalah?
242
"Umurnya diperkirakan setengah baya, namun identitasnya masih sementara dicari, termasuk meminta para keluarga penumpang yang menunggu di Parepare dan Majene untuk mengenali ciri-cirinya, apakah korban tersebut anggota keluarganya atau bukan?
242
Bagaimana bisa, kedigdayaan tim Spanyol yang begitu perkasa sejak laga perdana mereka di Piala Konfesderasi ini bisa dipecundangi kesebelasan yang dalam laga penyisihan menderita dua kekalahan telak dari tiga pertandingan yang mereka mainkan?
240
Mansour I. Selanjutnya, (2) sebanyak 292 rumah di ring II, jarak 2001 M s/d 7000 M ke Masjidil Haram dengan kapasitas 143.603 (72,90%) yang tersebar di wilayah Mahbas Jin, Aziziyah Syimaliah, Aziziyah Janubiah, Syisa/Raudhah, Bakhutmah, Ma?
240
Bagaimana membaca perjuangan puluhan pedagang pernak pernik keperluan Imlek di kawasan Pancoran, Glodok, Jakarta Barat, apalagi ada yang menggelar obat-obatan, voucer pulsa telepon, dan menjual kue keranjang yang dikemas dalam ukuran kecil?
238
" Ini menimbulkan pertanyaan: Jika pemilik Liverpool Tom Hicks dan George Gillet tiba-tiba memberi Benitez dana £100 juta untuk membeli pemain, apakah dia akan mengembalikannya dengan alasan dana itu akan membuat cabang olahraga ini gila?
Appendix to ind news 2010: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Kapuspenkum menyatakan permohonan surat yang dilayangkan oleh Mabes Polri ke Kejagung itu, bukan surat izin pemeriksaan melainkan surat pemberitahuan kepada pimpinan Kejagung mengenai akan diperiksanya jaksa peneliti dan jaksa penuntut umum sebagai saksi.
255
Ketua DPRD Kota Banjarbaru, Arie Sophian, Sabtu, mengatakan, alokasi anggaran yang disiapkan untuk membayar tunjangan kinerja bagi ribuan PNS di lingkup Pemkot Banjarbaru itu tidak tercantum dalam APBD Perubahan 2010 yang telah disahkan sehari sebelumnya.
255
"Yang terpenting, konsumen tidak perlu berinvestasi besar untuk memulai usaha," jelas dia. Selain harga yang menguntungkan, Foton Loader mempunyai tenaga yang besar dengan mesin diesel berkapasitas 2.200 cc Diesel dan standar Euro 2 yang ramah lingkungan.
255
"Khusus di laut, saya pernah nyatakan urgensi pengadaan kapal-kapal selam dan kapal-kapal perang modern yang ditempatkan di titik-titik strategis untuk mengawal wilayah Nusantara sebagai `archupelagic state` (negara kepulauan terbesar) di dunia," katanya.
255
"Presiden Obama juga menegaskan tentang pentingnya AS dan Rusia bekerja sama untuk mendukung referendum yang damai di Sudan dan satu resolusi untuk menedsak Pantai Gading menghrmaato hasil-hasil pemilu yang dmokratis barubaru-baru ini," kata gedung Putih.
255
Hubungannya dengan Venezuela semakin memburuk tahun lalu setelah Chavez membekukan hubungan perdagangan yang bernilai tujuh miliar dolar setahun untuk memperotes satu perjanjian yang mengizinkan pasukan AS menggunakan pangkalan-pangkalan militer Kolombia.
255
Sebelumnya perusahaan yang sama telah melakukan penanaman pohon di bantaran kali Banglio Cilincing sebanyak 1.168 batang, di taman kota Jalan Galunggung sebanyak 1.728 pohon, di kawasan Senayan 1.000 pohon, di bantaran Kali Banjir Kanal Barat 1.007 pohon.
Appendix to ind news 2010: Longest sentences
188
255
Menurutnya, tindakan Andi dalam ekspos dan melaporkan dugaan L/C fiktif Bank Century bukanlah kapasitasnya selaku Staf Khusus Presiden, tapi Andi melakukannya dalam kapasitas sebagai warga negara yang wajib melaporkan jika mengetahui adanya tindak pidana.
255
Spurs menempati posisi keempat dengan 38 poin, namun Liverpool, yang naik dari posisi tujuh ke enam, hanya berselisih satu poin di bawahnya setelah dua gol Dirk Kuyt memberi mereka kemenangan untuk mengurangi tekanan terhadap pelatih mereka, Rafa Benitez.
255
Jenderal-jenderal lainnya yang turut dilaporkan adalah Kepala Korps Brigade Mobil (Brimob) Irjen Pol SY Wenas, Kepala Divisi Profesi dan Pengamanan Kepolisian Irjen Pol Budi Gunawan, dan mantan Kepala Badan Reserse Kriminal Polri, Komjen Pol Susno Duadji.
Longest exclamatory sentences Length
Sentence
251
Bahkan, Bintang Grup pada hari ulang tahun ke-13, tepatnya 24 Agustus 2010, mengeluarkan empat produk baru, yakni klinik kesehatan Bamed, Helmy Yahya Broadcating Academy, www.cekricek.co.id, serta bergabung ke portal jejaring infotainmen OMG di Yahoo!
249
Karyawan di Breckland Council di Norfolk, Inggris timur, takkan lagi mendapat bayaran untuk waktu yang dihabiskan buat menghisap rokok, setelah beberapa usul yang disepakati awal tahun ini mulai berlaku, Senin, sebagaimana dikutip dari Reuters Life!
248
Produk www.cekricek.co.id dan merupakan versi online dari edisi cetak, sedangkan OMG Yahoo! wujud dari kinerja informasi seketika (realtime) dari tim kerja Cek&Ricek melalui jejaring Internet hasil kerja sama dengan pengelola database online Yahoo!
248
Para pejabat di pengadilan Los Angeles mengatakan, hukuman percobaan Lindsay telah dicabut dan surat pengkapan resmi buat dia telah dikeluarkan, tapi ditunda sampai Jumat, ketika ia harus tampil di pengadilan, sebagaimana dikutip dari Reuters Life!
248
Jack Jordan ditangkap di rumahnya di Montgomery County, Maryland, Amerika Serikat saat ia sedang mencari aktris yang pernah dinominasikan sebagai peraih Oscar tersebut di Google, kata wanita jurubicara polisi, sebagaimana dikutip dari Reuters Life!
246
Sejak itu, pengacara lama Lindsay, Shawn Chapman Holley, mengundurkan diri dan laporan media muncul pada Kamis pekan ini (15/7) bahwa Lindsay menyewa Robert Shapiro tapi mungkin berusaha menghindari hukuman penjara, demikian laporan Reuters Life!
242
Kebetulan saat itu sedang ada bayi Panda usia 6 hari. disitu saya bertemu dng 2 orang Inggris yg khusus datang setelah ada pemberitaan kelahiran anak Panda tsb. bayangkan mereka terbang dari Inggris ke Sichuan hanya utk melihat si bayi Panda!
237
Model cantik kelahiran Jerman tersebut membuat terperangah penonton tahun lalu, ketika ia tampil di panggung untuk memperagakan pakaian dalam kreasi Victoria`s Secret hanya lima pekan setelah ia melahirkan, demikian laporan Reuters Life!
235
" Yahoo! mengatakan pihaknya saat ini bermitra dengan Dapper dan memiliki perusahaan itu akan "menghasilkan solusi inovatif bahkan terhadap pengiklan yang lebih beragam dan mengintegrasikan pelayanan iklan dinamis dalam properti Yahoo!
230
"Tangan yang diangsur dengan kejujuran akan disambut warga Iran, namun bila tangan itu dipenuhi kecurangan dan persekongkolan, warga Iran akan menyingkirkannya, selalu," katanya kepada penontonnya, yang berteriak, "Mampus Amerika!
Longest interrogative sentences Length
Sentence
254
Mengapa dalam era keterbukaan dan inovasi informasi komunikasi melalui sarana Internet, facebook dan twitter yang serba cepat, ada yang sampai hati sengaja lupa diri demi egoisme ala Barat menjatuhkan martabat orang lain yang ujung-ujungnya diri sendiri?
254
Dalam seminar yang diselenggarakan oleh FEMA IPB bekerja sama dengan Kementerian Pertanian RI membahas tentang food estate dengan tema "Food Estate di Indonesia: mampukah mewujudkan pembangunan pertanian yang berkelanjutan, berkedaulatan dan berkeadilan?
252
"Rocklamasi" Kali Gajah WongTim Kesenian Maluku Akan Tampil di Belanda Saat Kunjungan Presiden SBYKuntoro: Sebarkan Inspirasi bagi Anak-Anak IndonesiaSultan Berharap Koleksi Sonobudoyo Dikembalikan UtuhTerkiniTerpopulerTerhebohAktivis atau Profesional?
252
Filsuf Michel Foucault dalam bukunya "History of Sexuality" menuturkan segala sesuatu yang menyentuh diskursus soal seksualitas tampil sebagai anak sah dari modernisme yang menuntut jawaban dari pertanyaan kritis, "mengapa ini dilarang, itu dibolehkan?
249
Mereka (para malaikat) saling mencatatkan kebaikan dari setiap langkah kita untuk kemudian menuntun, mengantarkan kita ke taman firdaus di mana dalam metafor keseharian kita (mungkin) diberikan kesempatan membuka tirai tipis dan memandang wajah-Nya?
Appendix to ind news 2010: Longest sentences
189
248
"Melengkapi posisi pimpinan Kelompok Kerja dari Instansi Terkait sesuai dengan bidang keahlian yang diperlukan dan ketersediaan waktu untuk bekerja di DNPI, serta mempertimbangkan keterwakilan yang berimbang dari lembaga anggota dan `stake-holders?
248
"Pendidikan karakter dapat membentuk perilaku yang baik, jujur, dan berakhlak mulia," kata salah satu pendiri Indonesia Heritage Foundation (IHF) itu saat menjadi pembicara di acara "Nasionalisme Kita: Berharap pada Pendidikan Karakter, Mungkinkah?
244
Ada tiga topik diskusi yang akan diangkat yaitu `New Media: antara ekspresi, informasi dan kerja sosial`; `Post Sinema, Post Theater, Post Visual Art dan Masa Depan Seni Pertunjukkan Seni Indonesia`; dan `Apa kabar Pendidikan Seni di Indonesia?
243
Hal ini perlu dimulai dari manajemen puncak sendiri, apalagi yang terhitung keluarga pemilik, dengan melibatkan manajemen menengah yang terhitung inti, dan pelatihan diarahkan untuk "bagaimana memimpin pengembangan suatu lingkungan kerja baru?
243
Oleh karena itu, saran Tarman, masyarakat harus memantau keseharian dari para calon, atau mencari informasi dari mulut-kemulut tentang kehidupan keluarganya bagaimana, apakah berpoya-poya, anaknya terurus dengan baik dan keluarganya bagaimana?
Appendix to ind news 2011: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
"Para penggemar yang beruntung itu bisa berlibur dengan SMASH karena mereka yang terpilih dalam program `Liburan Asyik Dengan Kartu AS Bareng Smash`," kata Bran Kartu AS Telkomsel Santoso di sela-sela acara Gala Dinner bersama Smash di Kuta, Selasa malam.
255
116 Milyar DPR Tetapkan 9 Anggota Ombudsman Jakarta (ANTARA News) - Rapat paripurna Dewan Perwakilan Rakyat (DPR) yang baru saja dibuka Wakil Ketua Priyo Budi Santoso langsung diwarnai hujan interupsi dan perdebatan soal usulan Hak Angket atas perpajakan.
255
Gubernur Jawa Tengah Bibit Waluyo dalam sambutan tertulis yang dibacakan Staf Ahlinya Bidang Politik Maryanto mengatakan bahwa keris memang pada awalnya sebagai senjata untuk melindungi diri, tetapi sekarang sudah tidak terbatas pada fungsi tersebut saja.
255
Air suci dan api yang menjadi sarana utama puja bakti detik-detik Waisak itu bersama perangkat persembahyangan lainnya mulai sekitar pukul 09.00 WIB diarak oleh umat dari Candi Mendut menuju Borobudur dengan berjalan kaki sepanjang sekitar tiga kilometer.
255
Insiden itu merupakan serangan terburuk terhadap militer AS di Afghanistan dalam beberapa tahun ini dan yang paling mematikan bagi pasukan asing dalam satu insiden tunggal sejak September, ketika sembilan prajurit koalisi tewas dalam kecelakaan helikoper.
255
Pernyataan itu juga menyebutkan perekrutan TKI akan terus berlangsung dalam kerangka polis asuransi TKI yang menanggung hak-hak TKI dan pengguna jasa yang diusulkan oleh Komite Nasional Perekrutan Arab Saudi (Saudi Arabian National Recruitment Committee).
255
"Kegiatan ini sesuai dengan gerakan semangat gotong royong `agawe majune Ngayogyakarta (Segoro Amarto)` yang dicanangkan beberapa waktu lalu untuk mengentaskan kemiskinan," katanya, yang juga berharap masjid bisa menjadi bagian dari pencerahan masyarakat.
255
Ia menambahkan, perilaku sadar lingkungan di industri telekomunikasi diyakini memiliki beberapa manfaat yakni efisiensi melalui pengurangan biaya operasi, memperkuat nilai budaya perusahaan dan menciptakan daya saing perusahaan di tengah persaingan usaha.
255
Karena itu, menurut dia, pengawasan harus diutamakan pada penggunaan merkuri yang berdampak pada rakyat yaitu penambangan emas rakyat karena air yang mengandung merkuri dibuang ke sungai sehingga mencemari sungai yang digunakan untuk kegiatan sehari-hari.
255
Taman Buaya Samutphrakan memiliki reputasi buruk terutama dalam hal kesejahteraan satwa yang dipeliharanya, selain juga telah terbukti memelihara satwa liar selundupan termasuk orangutan dan gibbon yang diduga dari Indonesia pada tahun 2004, demikian COP.
Appendix to ind news 2011: Longest sentences
190
Longest exclamatory sentences Length
Sentence
244
Sebelumnya bom paket yang meledak Sabtu (18/6) sekitar pukul 09.25 WIB dilantai tiga SM Swalayan Lubuklinggau, yang terletak di jalan Yos Sudarso, Kelurahan Talang jawa Kiri I, Kecamatan Lubuklinggau Timur I. Aldi Angebote jetzt hier anschauen!
244
"Saya bukan pahlawan, kalian semua yang pahlawan, kalian yang bertahan di bundaran ini," kata Ghonim kepada kerumunan massa yang berkumpul di sekelilingnya, sebagian besar menangis, bertepuk tangan dan berteriak : "Jayalah Mesir, jayalah Mesir!
242
Dalam suasana memabukkan sebelum pidato Mubarak, sejoli bahkan menikah di panggung demo, pengantin perempuan berpakaian putih melemparkan karangan bunga kepada kerumunan di bawah ketika para pemuda secara bercanda meneriakkan "Kami mau nikah!
240
Seperti dikutip dari Hollyscoop dalam acara On Piers Morgan Tonight, Silverman mengungkapkan bahwa ketika ia bertemu dengan Obama, dirinya keceplosan bicara dan mengatakan kepada Presiden AS itu bahwa "saya akan telanjang dalam sebuah film!
237
Rumah lelang Profiles in History, Rabu (13/4), menyatakan rumah lelang itu menduga lembaran lirik tersebut akan terjual dengan harga lebih dari 200.000 dolar AS dalam penjualan Mei di Beverly Hills, sebagaimana dikutip dari Reuters Life!
236
Apakah dia mengobral kalimat, 'Nanti dulu, kita harus menjunjung asas praduga tak bersalah" atau "Hey, fakta hukum itu tak boleh katanya, katanya, dan katanya" atau "Ini konspirasi untuk menjatuhkan saya", dan bla bla bla Tidak saudara!
232
Setelah sebulan menduduki jabatan Menteri Negara Badan Usaha Milik Negara (BUMN), kemudian mengunjungi lebih dari 30 unit usaha milik publik ini, saya bertekad untuk lebih dahulu membangun industri yang satu ini: manufacturing hope!
229
Kabar ini mengutip sejumlah sumber anonim yang menandakan Yahoo! mungkin membidik miliaran dolar AS dengan memangkas kepemilikannya di Alibaba sampai 15 persen dari sebelumnya 40 persen dan melepaskan 35 persen sahamnya di Yahoo!
225
Kebanyakan demonstran menyerukan pemogokan total dan dengan marah bertanya kepada militer yang menggelarkan sejumlah besar tentara dan tank di sekitar lapangan itu, "Militer Mesir, pilihanmu sekarang adalah rezim atau rakyat!
221
Koprol Satya Witoelar mengatakan bahwa visi utama Koprol menghubungkan sesama orang dan banyaknya pengguna ponsel pintar Google Android peluang bagus untuk mengembangkan aplikasi bagi Google Android "Dengan bangga, Yahoo!
Longest interrogative sentences Length
Sentence
253
Saya lupa apakah Bapak membeli tembakau itu atau tidak tetapi, ada pertanyaan yang menarik dari Bapak saya: “Kalau sampeyan jauh-jauh datang dari Madura dengan alasan nyari sumbangan membangun masjid, lalu, ongkos jalan, ongkos makan, diambil dari mana?
253
Mungkin tiupannya signifikan, valid, tetapi motif Vincent mesti dipertanyakan: apakah untuk membongkar kejahatan pajak demi bangsa Indonesia; atau semata-mata membalas dendam pada perusahaannya sendiri yang memasukkannya ke dalam penjara karena mencuri?
253
Namun ada pihak-pihak yang gerah dengan kicauan Nazarudin (terutama Partai Demokrat tentunya), dan mencoba mengkritik perilaku media massa, khususnya televisi, yang dianggap memberi porsi berlebihan pada N. Bila pertanyaannya "apakah N narasumber valid?
253
Lantas, apakah perlu bagi KPK untuk memperdebatkan bisa atau berhargakah isi BBM Nazaruddin padahal dengan cara menyadap pun KPK sering berupaya untuk mendapatkan informasi dan lalu melakukan penangkapan-penangkapan seperti yang dilakukannya selama ini?
252
Apakah peristiwa-peristiwa politik kita dewasa ini sudah demikian mencemaskannya, setidaknya apabila kita bandingkan dengan praktik demokrasi liberal tahun 1950-an yang diwarnai konflik ideologis, tetapi kini yang menonjol lebih pada konflik pragmatis?
250
Di kolom rutin Rosihan yang ada di tabloid itu, dia melaporkan tentang acara UNESCO yang dihadirinya, lengkap dengan sentilannya: “Bagaimana menerapkan jurnalisme investigatif dan memerangi korupsi jika bayaran untuk wartawan masih jauh dari memadai?
247
Pada 1996, tepat 100 tahun setelah orang Indonesia pertama datang ke NC, Komisaris Tinggi NC yang dipegang Bernard Grasset mengumumkan bahwa budaya Indonesia menjadi bagian dari warisan budaya Caledonia dan mendirikan tugu peringatan di Baei-de-l?
246
Berdasarkan daftar peringkat yang dikeluarkan WBA per Januari 2011 ini, Daud Yordan menempati penantang peringkat kelima kelas bulu (57,1 kilogram) WBA di bawah Calestino Caballero (Panama/1), Eduardo Escobedo (Meksiko/2), Matt Remilard (Meksiko?
244
Anehnya, adil kah untuk mempertanyakan mengapa pemerintah-demi-pemerintah Israel gagal mewujudkan keamanan sejati, sedangkan negara Yahudi tersebut tak terbantahkan memiliki kemampuan nuklir untuk melindungi negeri itu dari setiap penghancuran?
243
Pertanyaan mendasar lainnya, apakah Kemenlu RI membutuhkan konsorsium perusahaan asuransi perlindungan TKI untuk melaksanakan tugasnya sebagai pihak yang bertanggung jawab atas kepentingan badan hukum dan warga negera Indonesia di luar negeri?
Appendix to ind news 2012: Longest sentences
191
Appendix to ind news 2012: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Untuk mendorong pertumbuhan ekonomi yang inklusif, maka dalam target tersebut juga termasuk `kredit UMKM` sebesar minimum 20 persen," kata Gubernur BI Darmin Nasution saat memberikan pidato dalam "Pertemuan Perbankan Tahunan 2012" di Jakarta, Jumat malam.
255
Guardiola mengaku, dirinya mengalami kekeringan budi dan kerontang hati ketika hendak meneruskan pernik ziarah di laga bola bersama Lionel Messi dan kawan-kawan, menyusul pengumuman kepastian pengunduran dirinya dari Nou Camp di akhir musim kompetisi ini.
255
Pembicaraan nuklir pada Sabtu antara pejabat dari Iran dan diplomat dari apa yang disebut kelompok P5+1 yang terdiri dari Amerika Serikat, Rusia, China, Inggris, Prancis dan Jerman sebagian besar telah digambarkan sebagai "positif" oleh kedua belah pihak.
255
"Sikap Fraksi PDIP yang tidak setuju dilakukan revisi UU KPK tersebut bukan karena menilai bahwa UU KPK yang sekarang sudah sempurna atau tidak memerlukan perbaikan karena pada kenyataan memang masih banyak terdapat kelemahan dalam UU itu," jelas Basarah.
255
Menurut dia, sejak 2007 petani tembakau tergabung kelompok "Surya Tani" bisa langsung menjual ke pabrik yang harga per kwintal mencapai Rp3,7 juta, sedang rata-rata per ha menghasilkan 15 kwintal tembakau, sehingga pendapatnya kotor mencapai Rp55 juta/ha.
255
Langkah itu mencerminkan "berbagai profil risiko lebih tinggi" dari 16 bank tabungan dalam konfederasi, yang dibentuk dalam sebuah restrukturisasi oleh pemerintah pada 2010 untuk menyelamatkan sektor perbankan Spanyol yang terjereat utang dari kehancuran.
255
"Kereta tambahan akan beroperasi hingga H+5 nanti, kereta tersebut akan melayani berbagai tujuan di wilayah Pulau Jawa," kata Kepala Humas PT Kereta Api Indonesia (KAI) Daerah Operasional I, Mateta Rijalulhaq, di Stasiun Besar Pasar Senen, Jakarta, Jumat.
255
Sedangkan delapan BUMN memasuki tahapan pencairan dana meliputi PT MNA, PT PAL Indonesia, PT Waskita Karya, PT Kertas Kraft Aceh (KKA), PT Industri Gelas (Iglas), PT Dirgantara Indonesia, PT Bahana Pembinaan Usaha Indonesia (BPUI) dan PT Industri Sandang.
255
Berdasarkan data sementara, kata dia, korban akibat minuman keras tersebut sebanyak 32 orang, di antaranya enam orang menjalani rawat jalan, 19 orang menjalani rawat inap di dua rumah sakit di Grobogan, serta tiga orang menjalani rawat inap di RSUD Kudus.
255
Menurut Deputi Menteri Bidang Sarana dan Prasarana pada Kementerian Perencanaan Pembangunan Nasional Dedy Supriadi Priatna seusai rapat mengatakan dalam rapat tersebut untuk mengatasi pembebasan lahan juga diusulkan membangun jalur rel atas atau elevated.
Longest exclamatory sentences Length
Sentence
241
Jika di dalam orkestrasi, posisinya mirip dengan bass yang menjadi ritme dasar lagu dan dialah yang bertanggung jawab menciptakan bass kreasi manusia sambil mereproduksi suara gemerincing treble dari simbals --sebagai misal-- perangkat drum!
241
Perusahaan yang bermarkas di Espoo, Finlandia, tersebut membeli perusahaan penyedia peta Chicago, Navteq, dengan harga 8,1 miliar dolar pada 2008, dan melanjutkan pengembangan bisnis layanan peta untuk konsumen seperti Amazon.com Inc, Yahoo!
236
Pemanfaatan teknologi mutakhir dan canggih ternyata tidak hanya bermanfaat untuk meningkatkan kualitas kesejahteraan dan kehidupan suatu masyarakat, tetapi dapat pula disalahgunakan oleh teroris dan penjahat yang merugikan umat manusia!
222
"Kita berhasil, kita memilih Anda, kini silakan yang terhormat Presiden Obama untuk melakukan apa yang akan Anda lakukan, buatlah kami bangga: Education (pendidian), Health Care (pelayanan kesehatan), Green Energy for USA!
221
Penggunan normal itu mencakup menerima atau melakukan panggilan telepon sekitar sejam; pengiriman pesan singkat (SMS); pengaktifan sejumlah aplikasi yang terhubung Intenet seperti Gmail, Twitter, Facebook, Google+, Yahoo!
213
Tidak banyak generasi masa kini yang tahu bahwa pada waktu nama hotel Des Indes masih ada di Jakarta, pada dasawarsa '50-an, dia sudah sepanggung dengan Bill Saragih, salah satu pilar jazz Indonesia pada masa itu!
Appendix to ind news 2012: Longest sentences
192
212
Sebuah negara mantan adidaya yang malang melintang menguasai teknologi ruang angkasa dan persenjataan ternyata kini tidak lagi memproduksi barang kebutuhan warganya walaupun itu sekedar handphone dan tali sepatu!
212
Pertandingan sepertinya akan selesai dengan hasil seri 2-2, namun di menit tambahan babak kedua (menit 95), Mario Balotelli yang dimasukkan Mancini di menit 65 mengubah keadaan dari titik penalti. 3-2 untuk City!
205
"Situs ini juga dapat dipercaya, mudah diakses dan menjadi referensi yang baik bagi perempuan dengan menyediakan konten dan percakapan tentang berbagai topik yang mereka peduli," kata Country Editor Yahoo!
201
Dalam pernyataannya belum lama ini yang dipublikasikan di lamannya, Yahoo mengatakan, Pengadilan Sipil ke-49 Distrik Federal Meksiko telah memasuki putusan non-final 2,7 miliar dolar AS terhadap Yahoo!
Longest interrogative sentences Length
Sentence
255
Tawa bola-bola Eropa 2012 menawarkan pertanyaan pamungkas, apakah Anda sedang menonton acara Teve dan membuka-buka warta media sosial bersama dengan teman-teman untuk merayakan tawa manakala menyaksikan 11 lawan 11 saling berkejar dan saling berebut bola?
255
Sekalipun upacara tiap tahun dilaksanakan di Jakarta dan seluruh tanah air, tetap saja muncul pertanyaan-pertanyaan amat sederhana, antara lain sekalipun PKI dibubarkan, secara otomotis sudah hilangkah pikiran dan ajaran komunis di Tanah Air tercinta ini?
254
Maka yang menjadi pertanyaan adalah, apakah rencana pemerintah dalam mengejar pasokan listrik 10.000 Mega Watt untuk menyediakan listrik bagi 35 persen Warga Indonesia yang belum mendapatkan listrik harus mengorbankan ribuan penduduk di Kabupaten Batang?
249
"Myanmar mempelajari bagaimana transisi politik dan ekonomi terjadi di negara tetangganya, karena di bawah kepemimpinan mantan Presiden B.J. Habibie, Indonesia cukup sukses menjalankan hal tersebut," kata Welsh pada diskusi buku `Democracy Take-Off?
246
Pertanyaan demi pertanyaan dari benak jutaan orang Indonesia, apakah KPK dalam waktu yang sangat singkat ini mampu merekrut puluhan penyidik yang andal dengan "jam terbang" tinggi sehingga bisa langsung bekerja tanpa dihambat oleh alasan apa pun?
245
Washington (ANTARA News) - Keyakinan Mitt Romney muncul sedikit melebihi masalah remeh dalam jejak kampanye AS, namun dengan menggenggam aman nominasi Republikan dalam tangannya, apakah pemilih Amerika kini siap menerima seorang presiden Mormon?
243
Oleh MonalisaJakarta (ANTARA News) - Kalau Kusno berani mengatakan 'Tidak' pada kolonialisme dan imperialisme, mengapa aku mesti tidak berani mengucapkan kata yang sama padanya ketika ia ingin menjadikan perempuan sebagai koloni-koloni lelaki?
240
"Vaksin yang diproduksi PT Bio Farma (Persero) Bandung itu sudah mendapatkan fatwa halal oleh Majelis Ulama Indonesia (MUI), sehingga aman digunakan untuk imnunisasi bayi dan anak balita," katanya usai seminar "Imunisasi Lumpuhkan Generasi?
238
Muncul pertanyaan mengapa India yang lama terbelenggu dengan sistem ekonomi tertutup, kemiskinan dan infrastruktur yang tidak memadai mampu melahirkan para wirausahawan global semacam Ratan Tata, Narayan Murthy maupun Kiran Mazumdar-Shaw?
234
Setelah dianggap memenuhi standar emisi oleh PT SMK, akankah prototipe mobil Esemka ini menempuh kembali 1.200 km Solo-Jakarta pergi pulang plus berkeliling ke kota Jakarta nonsetop seperti kali pertama menuju BTMP Serpong, Tangerang?
Appendix to ind newscrawl 2011: Longest sentences
193
Appendix to ind newscrawl 2011: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Ketika ditemui di rumah, sekaligus tempat memproduksi kerajinan plus ruang pamer produknya “Kerang Indah” di Desa Rangai Tritunggal, Kecamatan Katibung, Lampung Selatan di pinggir Jalan Lintas Sumatera, Mang Ihin lebih banyak menganggur ketimbang bekerja.
255
Dengan tagline “The House of Knowledge” kelak akan bersinergi dengan Agung Podomoro Recruitment Centre, “where the great career starts” akan menjadi the power of now bagi Agung Podomoro untuk lebih menempatkan dirinya sebagai pemain unggul di industrinya.
255
36 Lintasan KA di Grobogan tanpa palang pintu By Ahmad Mufid Aryono on 7 September 2009 Grobogan (Espos)–Pemkab dan Polres Grobogan mewaspadai adanya 36 perlintasan kereta api (KA) tanpa palang pintu yang tersebar di sejumlah tempat di kabupaten setempat.
255
Dishub Gelar Operasi Surat Angkutan Umum BARADATU—Dalam rangka penegakan hukum dan penertiban surat perizinan bagi seluruh mobil angkutan, selama lima hari kerja Dinas Perhubungan Kabupaten Way Kanan menggelar operasi kelengkapan surat bagi angkutan umum.
255
Sementara di bagian kursi very-very important person (VVIP, Wakil Bupati Y Alexander, MSi, Kapolres Eka Yuda Satriawan, Danyonif 644 Walet Sakti (WS), Letkol Esy Suharto, Ketua Pengadilan Putussibau, Kajari Putussibau dan perwakilan Kodim 1206 Putussibau.
255
Apalagi popularitas pak Thomas sudah tidak diragukan lagi,” kata Sekretaris PAC Simpang Dua, Kanisius Rayok, A.Md. Menurutnya, sebagai pengurus partai pihaknya juga tidak mau tinggal diam untuk melihat mana calon bupati yang patut menggunakan perahu PDIP.
255
Belum lagi ponsel buatan China yang akan semakin membanjiri Indonesia," kata Managing Director Global Taylor Nelson Solfres (TNS) Digital Technology Division James Fergusson dalam acara seminar bertajuk “TNS Digital Nation 2011”, baru-baru ini di Jakarta.
255
Di saat sedang memperingati HUT ke-14 kabupaten itu, seorang putra terbaik Bumi Begawi Jejama, Imran Rasyid bin Rasyid Ramli, wakil ketua DPRD Tanggamus, meninggal dunia di usia 52 tahun, di Rumah Sakit Dharmais Jakarta, Senin (21-3), sekitar pukul 00.45.
255
Seharusnya dalam membuat atau menentukan HPS, panitia seharusnya mengacu pada Kepres 80/2003 yang berbunyi dalam menentukan harga barang, panitia terlebih dahulu melakukan survey harga di pasaran, sehingga didapatkan perkiraan harga yang layak dan pantas.
255
Dalam event JTM nanti, akan digelar program table top, di mana seller akan berhadapan langsung dengan buyer secara bergantian dengan menggunakan round robin system dalam beberapa menit bertemu dengan seluruh buyer yang telah memesan meja di dalam ruangan.
Longest exclamatory sentences Length
Sentence
255
"Dalam memutus PK kasus Pilbup Lampura, MA justru konsisten dengan putusannya atas Pilgub Maluku Utara, yakni hanya mengakui perhitungan pertama yang dilakukan lembaga yang berwenang untuk itu--menafikan semua putusan di luar itu yang dilakukan siapa pun!
255
"Apalagi dengan advantage®MDUL¯ pendidikan yang lebih dahulu maju berkat pencerahan Nommensen, bukan hanya mendidik penginjil, melainkan juga guru, dibanding dengan wilayah Sumatera Timur yang zaman itu baru mulai dibuka jadi onderneming perkebunan asing!
255
Vonis Gayus 7 tahun: Jaksa banding, kuasa hukum pikir-pikir Gayus: Jangan politisasi kasus saya Gayus divonis 7 tahun denda Rp 300 juta Jagal Kartasura, isteri korban Santoso beri kesaksian Wozniacki, Henin ke babak ketiga Pramono: Nurdin Halid keblinger!
255
"Dana itu dipecah dalam beraneka program yang melibatkan banyak lembaga dan orang ikut menanganinya, harus pula bisa digunakan para pejabat teras untuk membangun citra pemerintah yang murah hati dengan menyerahkan langsung paket bantuan pada warga miskin!
255
Jadi, pola pendidikan seperti yang ada sekarang di negeri kita, yang menghimpun biji sebanyak-banyaknya untuk disimpan rapat seperti jagung, yang lebih berorientasi menjadikan manusia sempurna, serbatahu, tapi tak bisa apa-apa, tak terpengaruh signifikan!
255
"Karena itu, pengacara Ba'asyir menyatakan tuduhan kasus terorisme terhadap kliennya itu nebis in idem atau double jeopardy, yang secara universal dan juga berlaku di Indonesia, seseorang tidak bisa diadili atau dihukum dua kali untuk kesalahan yang sama!
Appendix to ind newscrawl 2011: Longest sentences
194
255
"PAK Harto wafat dengan menyisakan sebuah pekerjaan besar--salah satu obsesinya, yang ternyata tidak tuntas dia lakukan selama 32 tahun berkuasa--penghayatan dan pengamalan Pancasila dalam bernegara-bangsa dan dalam kehidupan sehari-hari rakyat Indonesia!
255
" "Guna bisa lepas dari kekhawatiran yang terkesan dibuat berlebihan itu, kembali faktor penghambat investasi tadi yang harus dibereskan, agar usaha mengejar ketertinggalan lewat memacu investasi dalam bidang industri, perdagangan, dan SDM bisa dilakukan!
255
"Itu terjadi karena matahari melintas di jalur 17 derajat lintang selatan, pemanasan Samudera Hindia maksimal hingga membentuk awan-awan besar yang oleh angin dari arah barat daya didorong melintas kawasan tadi yang dengan cepat meluas jadi mendung gelap!
255
"Apalagi banyak hal dari tujuan dan cita-cita kemerdekaan itu terbengkalai akibat maraknya korupsi, disertai ketakpedulian elite pada rakyat karena mengutamakan kepentingan pribadi dan parpolnya, bertentangan dengan tujuan pembentukan pemerintahan negara!
Longest interrogative sentences Length
Sentence
255
Other news from this category: Cetak artikel ini Simpan ke PDF 1. Kisah Tragis Seorang "Dewa" Berjuluk "The Messiah" 2. Yoga-Yogi Akhirnya Pindah Sekolah 3. PTS Kekurangan Mahasiswa 4. Jepang Juara Piala Dunia Wanita 6. Masihkah Ada Harapan untuk Berubah?
255
Other news from this category: Cetak artikel ini Simpan ke PDF 1. Kisah Tragis Seorang "Dewa" Berjuluk "The Messiah" 2. PTS Kekurangan Mahasiswa 3. Yoga-Yogi Akhirnya Pindah Sekolah 4. Jepang Juara Piala Dunia Wanita 6. Masihkah Ada Harapan untuk Berubah?
255
Minggu, 10 Juli 2011 12:44 WIB Sistem Alert Beritahu Pembajakan Online Hati-Hati Serangan Malware Lebih Terarah Jumat, 08 Juli 2011 17:00 WIB Asyik, 'Update' Status Facebook bisa via Google+ Jumat, 08 Juli 2011 15:00 WIB Sportive, Jam Tangan atau Telepon?
255
Dalam kondisi asam, tanaman akan menjadi lemah shg ketika ada hama akan sangat mudah sekali terserang. kondisi ini makin parah dg dimasukan pestisida kimia dan pupuk kimia ke tanah. lengkap sudah penderitaan tanah. mau hidup gmn tanaman? apalagi produksi?
255
20-May-2006 16:36:03 WIB by yustina maaf numpang komentar. kenapa rumah itu bisa dimasuki oleh orang2 yang tidak bertanggung jawab seperti mereka? dan knp juga barabg2 yang hilang ada dikamar pembantu itu? adakah simajikan bekerja sama dengan sipemerkosa?
255
38, Fax: (0431) 879795 (Redaksi), (0431) Bantuan Bencana tak Kunjung Tiba, Pemkab Dituding Ingkar Janji Masih ingat kejadian kebaka-ran 20 bangunan tempat usaha dan rumah tinggal di Pusat Kota Tondano atau tepatnya di kom-pleks Plaza, beberapa waktu lalu?
255
Anggap Napoli Rival Utama, Bukan Inter MILAN l SURYA Online - Pernyataan pedas dilontarkan pelatih AC Milan, Massimilano Allegri setelah timnya kembali menjauh dari kejaran Inter Milan lewat kemenangan 2-1 atas Chievo Verona Ranieri Mundur,Montella masuk?
255
162 Manado 95111 Phone: (0431) 851030 (Hunting) Fax (0431) 851031 (Redaksi), (0431) 850955 Maxi Sigarlaki SH MH (Hakim Sidang PT NMR dan Humas PN Manado) Bagaimana bukti yang di-ajukan JPU maupun terdakwa apa dapat mendukung dakwaan atau pembelaan mereka?
255
Sekarang Chin Hui-kong tidak memegang aturan, semua rakyat negeri ingin sekali mengangkat Kong-cu menjadi raja, tetapi jika Kong-cu sendiri tidak mau mencari jalan supaya bisa masuk ke negeri sendiri, siapa yang nanti mau menjemput Pangeran ke negeri Cee?
255
Jangan lupa, meskipun kita menyimpan di fasilitas publik, tetapi tetap ada aturan dan proteksinya, sehingga tidak mudah untuk dijebol orang lain (bukankah komputer di dalam perusahaan juga tidak terlepas dari ancaman para pencuri data dan pelaku sabotase?
Appendix to ind newscrawl 2012: Longest sentences
195
Appendix to ind newscrawl 2012: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Mulai dari menabung semenjak dari muda, bekerja keras, berdoa siang dan malam bahkan harus ”menggadaikan”, jika bukannya ”menjual” harta warisan pun diikhlaskan, semata-mata mengobati kerinduan mengunjungi bumi yang paling dicintai Allah dan RasulNya itu.
255
Konser kejutan di tengah-tengah penumpang umum itu dipersembahkan oleh “Hosiana Children and Youth Choir” yang dibina Gereja Kristen Indonesia (GKI) Kebayoran Baru, Jakarta, saat penerbangan dari Jakarta menuju Surabaya pada Jumat siang, 21 Desember 2012.
255
“Kita sarankan agar pengelola hotel dan restoran bisa menyajikan makanan khas Kalbar di menu makanannya,” seru Suzarsono Soekran, Kepala Diperindag Kalbar, dijumpai Equator di sela menghadiri peresmian pusat oleh-oleh dan makanan khas Kalbar, Rabu (27/7).
255
Dengan tagline “The House of Knowledge” kelak akan bersinergi dengan Agung Podomoro Recruitment Centre, “where the great career starts” akan menjadi the power of now bagi Agung Podomoro untuk lebih menempatkan dirinya sebagai pemain unggul di industrinya.
255
Mengenai permasalah wanita haidh dan nifas yang suci di waktu shalat kedua, seperti waktu Ashar dan Isya’ lantas ia diwajibkan mengerjakan dua shalat sekaligus (Zhuhur dan Ashar atau Maghrib dan Isya’), insya Allah ada tulisan tersendiri mengenai hal ini.
255
Setelah berjam-jam pembicaraan mendalam hingga malam hari untuk berusaha menandatangani perjanjian itu, Yushchenko mengatakan dalam pidato yang disiarkan televisi: "Saya memutuskan untuk mengajukan Victor Yanukovich untuk jabatan Perdana Menteri Ukraina".
255
Khusus penggarapan program KB di wilayah tertinggal, terpencil dan perbatasan (galciltas), menurut Subagyo, diarahkan pada peningkatan kesertaan KB metode kontrasepsi jangka panjang (MKJP) terutama KB metode operasi pria (vasektomi) di 183 kabupaten/kota.
255
KLATEN (Suara Karya): Kecelakaan antara kereta api (KA) Argo Lawu jurusan Jakarta-Solo dan truk Toyota Dyna nomor polisi AD 1371 SV di palang pintu perlintasan di Desa Sumyang, Kecamatan Jogonalan, Kabupaten Klaten, Kamis, mengakibatkan satu korban tewas.
255
Kapolresta Langsa, AKBP Hariadi SIK saat dikonfirmasi Analisa melalui telepon selulernya mengatakan, penyidikan masih lanjut dan sejauh ini sudah ada lima tersangka, namun identitasnya baru akan diekpos setelah hasil Laboratorium Forensik (Labfor) keluar.
255
Maradona, yang selalu berbicara `ceplas-ce-plos` mengeritik pemerintahan presiden AS George W. Bush, menyerahkan kaos sepak bola yang sudah ditandatanganinya kepada diplomat Iran Sabtu setelah pertandingan mini di turnamen Showbol yang disiarkan televisi.
Longest exclamatory sentences Length
Sentence
255
Kualitas kompetisi menurun bahkan berbagai kasus kericuhan di lapangan tidak ada kejelasan penanganan dan hukumannya, sebagian besar pemain tidak bisa membela tim nasional, dan yang lebih miris banyak klub belum membayar gaji pemain hingga berbulan-bulan!
255
Di samping karena mobnas listrik sudah masuk istana, dalam sidang kabinet sore itu Presiden SBY juga menggunakan bahasa terang: Seluruh menteri dan anak buahnya, termasuk seluruh jajaran BUMN, tidak boleh main kongkalikong dengan DPR soal anggaran negara!
254
Oia, di Manila pun kawan saya pernah kena dikemplang sopir taxi yang ternyata disana juga sudah seperti sindikat, karena hotel kami di Holiday Inn ke Hard Rock Makati itu ternyata tdk kurang dari 20 menit, tapi waktu berangkat kami diputar2 sampai 1 jam!
254
Pertanyaan-pertanyaan ini masih dan akan tetap relevan diajukan apabila kita menginsyafi bahwa bencana banjir yang terjadi tidak semata-mata karena iklim, akan tetapi juga berhubungan erat dengan kearifan kita dalam mengelola dan menata alam itu sendiri!
253
Yakni, ulah para elite pemimpin negeri ini yang tanpa malu atau sungkan bancakan -- bagi-bagi -- uang rakyat dengan alasan "mulia" untuk keperluan operasional, guna menunjang kinerja mereka agar dapat menjalankan tugas melayani rakyat dengan lebih baik!
252
Perusahaan mi instan bisa memprediksi bahwa yang bakal jadi pesaingnya juga berasal dari perusahaan mi instan juga, tapi begitu masuk era ekonomi kreatif, prediksi ini salah, karena yang masuk ke bisnis mi instan berasal dari perusahaan sabun deterjen!
Appendix to ind newscrawl 2012: Longest sentences
196
252
Entah mengapa, tiga suaminya tak mampu menghamili, tapi dengan kumpul kebonya, Uturseiq, berusia tujuh belas tahun-yang sebenarnya cucu meski tak ada hubungan pertalian darah - mampu menghamili saat usia Kodokbura sudah mencapai empat puluh tiga tahun!
251
Di saat mengantre di loket kantor pos, sejak puluhan tahun silam sampai pada dekade 90-an, tak pernah terbayangkan betapa akan maju dan pesatnya ilmu pengetahuan, khususnya di bidang teknologi informasi, seperti yang kita alami dan rasakan dewasa ini!
251
Kedua, pertunjukkan barongsai juga mengajarkan pentingnya konsentrasi dan koordinasi, terutama saat pemain tahu kapan saat harus melompat, bersalto atau melakukan gerakan-gerakan tertentu bertepatan dengan suara musik yang ditabuh dari para pengiring!
251
Aku juga gila bola dan kesebelasan yang ku kagumi justru adalah Belanda yang dahulu ku perangi, tetapi pantang aku mengibarkan bendera peserta lomba Piala Dunia maupun bendera kebangsaan negara asiang maupun di halaman rumahku, di tanah tumpa darahku!
Longest interrogative sentences Length
Sentence
255
Bagaimana penggunaan dana BOS yang dialokasikan kepada setiap sekolah negeri pada tiap tahun, dengan tujuan utama membantu para siswa dalam kelancaran belajar, di mana setiap siswa dibolehkan meminjam buku yang dibeli sekolah dari dana BOS setiap sekolah?
255
PERTANYAAN yang kemudian muncul adalah, mengapa perguruan tinggi (PT) sebagai pendidik akuntan dan auditor malah terjerembab dalam ketidakmampuan membuat laporan keuangan yang baik dan memenuhi standar ilmiah yang bisa dipertanggungjawabkan kepada publik?
255
1. Pada kesempatan ini mari bersama-sama kita panjatkan puji syukur ke hadirat Allah SWT karena atas rahmatNya sajalah kita diberi kesempatan untuk dapat hadir dan berdiskusi dalam seminar dengan tema: Financial Lecture: Pasca-Investment Grade: What Next?
255
Jelas-jelas adalah olok-olok dan pelecehan terhadap peraturan dengan banyaknya pedagang kaki lima yang berjualan justru di bawah dan di sekitar plang yang dipasang oleh Pemerintah Kota Makassar yang bertuliskan “Dilarang Berjualan di Sepanjang Jalan Ini”?
255
Sesungguhnya, Badan Narkotika Nasional (BNN), aparat Kepolisian, Imigrasi, dan Bea Cukai, telah banyak menangkap produsen, distributor, dan pengedar, serta menggagalkan peredaran barang haram tersebut, tetapi mengapa kasus-kasus sejenis masih bermunculan?
255
Itulah sebabnya di Indonesia sulit bagi partai politik untuk melaksanakan salah satu fungsinya yaitu pendidikan politik bagi rakyat, karena para elit politik banyak yang tidak tahu politik, bagai-mana dia bisa melaksanakan pendidikan politik bagi rak-yat?
255
Apabila di wilayah Kota Semarang, ibu kota Provinsi Jawa Tengah, masih terjadi kerepotan-kerepotan semacam itu dalam penanganan bencana, bagaimana pula apabila terjadi bencana pada lokasi yang jauh dari pusat pemerintahan dan dalam skala yang lebih besar?
255
Jika seorang presiden hampir pada setiap kesempatan melontarkan unek-unek terkait kritik, ancaman, dan hal-hal lain terkait dirinya sendiri, wajar banyak di antara anak negeri bertanya-tanya apakah presiden masih sempat memikirkan nasib rakyatnya sendiri?
255
Benarkah relasi damai antara umat Kristen dan Islam di Aceh Singkil terkoyak akibat demonstrasi sejumlah anggota Front Pembela Islam (FPI) yang menuntut penyegelan sejumlah undung-undung atau rumah yang difungsikan sebagai tempat ibadah oleh umat Kristen?
254
Bagaimana tak benci mati, karena harus meninggalkan kenikmatan dunia yang telah dibangun dengan susah payah, meninggalkan rumah mewah, harta berlimpah, apalagi kalau semuanya itu diperoleh dari jalan atau cara yang tidak seharusnya dan ibadah pun kurang?
Appendix to ind wikipedia 2007: Longest sentences
197
Appendix to ind wikipedia 2007: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Ia berhasil terutama karena bantuan Richard McKeon, seorang relativis filsafat, dan Charles Hartshorne, yang memperkenalkannya dengan metafisika dan filsafat Whitehead, yang dipadukan oleh Hartshorne ke dalam apa yang kelak dikenal sebagai teologi proses.
255
Yang bisa dipastikan adalah tiga orang putra beliau meneruskan dakwah di Asia Tenggara hingga Nusantara yaitu Ibrahim Akbar (ayahanda Sunan Ampel) bermarkas di Champa, Ali Nuralam Akbar (kakek Sunan Gunung Jati) bermarkas di Pasai dan Zainal Alam Barakat.
255
Daerah utara tetap di bawah pemerintahan langsung sebagai Protektorat Bechuanaland dan kini menjadi Botswana, sedangkan daerah selatan menjadi bagian Koloni Tanjung dan kini menjadi bagian provinsi AfSel; manyoritas penutur Setswana kini tinggal di AfSel.
255
Yellow Dog Linux versi 5.0 yang dijual di Situs Terrasoft seharga US$50 termasuk Manual dan DVD untuk sources dan aplikasi yang belum dikompilasi ke dalam sistem operasi tersebut( seperti Linux kernel, GNU Compiler Collection, Firefox, dan OpenOffice.org.
255
Hakim pemeriksa (Trintignant), dengan bantuan wartawan foto (Perrin) mengungkapkan cukup bukti untuk menuntut bukan hanya dua orang anggota militan sayap kanan yang melakukan pembunuhan itu, tetapi juga empat perwira polisi militer yang berpangkat tinggi.
255
Gerakan ini muncul sebagai tanggapan terhadap Kepausan Avignon - ketika paus dipindahkan dari Roma dan tunduk kepada tekanan-tekanan dari raja-raja Prancis - serta skisma yang terjadi sesudah itu, yang menyebabkan diadakannya Konsili Konstanz (1414-1418).
255
Dengan angka ini ia menyimpulkan bahwa kubus besar itu terbagi dari 26 ruangan di setiap sisinya (walaupun tidak disebutkan dalam film, Leaven mengambil asumsi bahwa sisi luar setiap ruangan adalah 1,5 kaki lebih besar dari sisi dalamnya, yaitu 15,5 kaki.
255
Hal ini termasuk mengundang pengamat tambahan dari kaum awam Katolik dan Non-Katolik, serta mengurangi jumlah skema yang diusulkan menjadi 17 saja; dengan demikian keseluruhan Skema menjadi lebih umum, sehingga dapat mempertahankan sifat Pastoral Konsili.
255
Menurut beberapa legenda, Ntare Rushatsi, pendiri dinasti pertama, datang dari Rwanda pada abad ke-17; sumber-sumber lain yang lebih terpercaya memberikan kemungkinan bahwa Ntara berasal dari Buha, di tenggara, dan mendirikan kerajaannya di wilayah Nkoma.
255
Hal itu memberi keuntungan baginya karena di akhir tahun yang sama, seorang kimiawan lain dari Jerman, Julius Lothar Meyer, juga berhasil menyusun tabel yang sama, namun karena berhasil lebih dulu, Mendeleevlah yang dianggap sebagai penemu daftar berkala.
Longest exclamatory sentences Length
Sentence
253
John menjadi A road with no end, London, 1968), mendapat Hadiah Sastra BMKN 1952; cerpennya Musim Gugur menggondol hadiah majalah Kisah tahun 1953; kumpulan cerpennya Perempuan (1956) mendapatkan Hadiah Sastra Nasional BMKN 1955-1956; novelnya, Harimau!
245
Para penulis Israel tampaknya mengambil dan memanfaatkan teks-teks Mesopotamia itu untuk mengungkap keyakinan mereka, sekaligus menyesuaikannya dengan keyakinan itu, terutama di bidang monoteisme: segala yang berbau politeisme dibuang jauh-jauh!
243
Weekblad „Sin Po” telah lahir dan langsung menjerit; tuan Lauw Giok Lan redacteur’nya; tuan Yu Sin Gi sebage administrateur; dicitak oleh percetakan „Kho ceng Bie & Co” di Pancuran jakarta-Kota; harga abonnementnya cuma R 1,50 buat tiga bulan!
238
Buddha menceritakan kembali kepada Raja Sakra secara seksama, “Jika seseorang dapat menulis Dharani ini dan meletakkan-Nya di puncak dari panji tinggi, gunung tinggi atau dalam bangunan tinggi atau menyimpannya di dalam stupa; Raja Surga!
233
Athlon memiliki beberapa kemampuan, seperti system bus berkecepatan 200Mhz, sembilan execution pipelines (tiga pipeline untuk kalkulasi alamat, tiga untuk kalkulasi integer dan tiga untuk kalkulasi floating point dan instruksi 3DNow!
Appendix to ind wikipedia 2007: Longest sentences
198
209
Laporan politik kepada sidang pleno ke-II CCPKI jang diperluas dengan Komisi Verifikasi dan Komisi Kontrol Central di Djakarta tanggal 23-26 Desember 1963 (1964) / bahasa Inggris: Set afire the banteng spirit!
206
Namun selama masih ada anak-anak dan orang dewasa yang tertawa melihat atraksi badut, melempar kacang ke gajah, dan berteriak penuh kegirangan menyaksikan orang meniti tali di udara, sirkus akan selalu ada!
205
Saat dia berjalan-jalan ke Disneyland, ia mendengar lagu "it's A Small World", sesampainya di rumah, Carlton kecil langsung ke depan piano, dan mencari nada lagu tersebut sendiri, dan usianya baru 2 tahun!
203
Dia dikatakan telah berkata, "Saya bimbang apa yang kita lakukan adalah membangunkan raksasa yang tidur dan memberikannya tekad yang dashyat", tetapi ini dikatakan petikan yang dicipta untuk filem, Tora!
Longest interrogative sentences Length
Sentence
243
Namun, bila kitab Kejadian disusun oleh para penulis Israel pada awal masa kerajaan, kira-kira abad 10 SM, sementara sampai saat itu tidak ada kontak langsung antara Israel dengan Mesopotamia, lalu dari mana datangnya pengaruh Mesopotamia itu?
243
Apa yang terjadi dengan burung gagak yang dikeluarkan dari Bahtera pada saat yang bersamaan dengan burung merpati itu dan " terbang pulang pergi, sampai air itu menjadi kering dari atas bumi" sekitar dua atau tiga minggu berikutnya (Kej. 8:7)?
229
Dayan menggabungkan identitas sekular kibbutznik dan dan pragmatisme (menurut laporan, ketika ia melihat para rabi berduyun-duyun ke Gunung Bait Suci (al-Ḥaram aš-Šarīf) setelah Yerusalem direbut tahun 1967, ia bertanya "Ini apa?
228
Tertinggallah hanya satu hal yang masih disangsikan: apakah tujuan Arjuna dengan mengadakan yoga semata-mata untuk memperoleh kebahagiaan dan kekuasaan bagi dirinya sendiri, sehingga ia tidak menghiraukan keselamatan orang lain?
223
Atau lebih tepat lagi, untuk mendapatkan satu rentang ketelitian tertentu dari prediksi dan pengamatan, dapat ditanyakan: adakah suatu "rentang" harga rasio baryon terhadap foton yang dapat berlaku untuk seluruh pengamatan?
216
Sejak tahun 2000, band ini telah tur di AS dan Eropa dan muncul di berbagai acara televisi, termasuk Jimmy Kimmel Live, Fox News Channel, CNN, dan sebagai house band dari Last Call with Carson Daly dan seri Say What?
215
"Paris Dapatkah seorang ibu yang tidak menikah, dengan empat orang anak, yang ditolak oleh para pemimpin partainya sendiri dan dianggap hanya sebagai sebuah wajah cantik, menjadi presiden perempuan pertama Perancis?
214
Dalam pertemuan-pertemuan tersebut intinya wakil federasi KSV yaitu Gan Keng Soei mengajak dan membahas keinginan ”Mengapa kita tidak berhimpun saja dalam satu wadah organisasi nasional mahasiswa Katolik Indonesia?
210
Pemikiran mendasar ini merupakan akumulasi jawaban atas pertanyaan dari mana, untuk apa dan mau kemana alam, manusia dan kehidupan ini yang dihubungkan dengan asal muasal penciptaannya dan kehidupan setelahnya?
207
Pada akhir tahun 1960-an Küng menjadi teolog penting pertama Katolik Roma setelah skisma Gereja Katolik Lama pada akhir abad ke-19 yang menolak doktrin infalibilitas paus, khususnya dalam bukunya Infallible?
Appendix to ind wikipedia 2012: Longest sentences
199
Appendix to ind wikipedia 2012: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Tasha, Tyrone, dan Uniqua berhaap mereka semua bisa mandi dan bersih, tapi walikota mereka, Austin Stinkypants telah melarang kebersihan dan mengunci semua sabun dan sampo mereka (termasuk bebek karet Tyrone dan 'Mitty' Robin Hood) di penjara bawah tanah.
255
Hasil rekomendasi DKP yang paling nyata adalah pencopotan Mayjen Sintong Panjaitan - salah satu perwira yang bersinar saat itu - dari jabatan Pangdam Udayana, juga diberhentikannya Brigjen Rudolf Warouw dari Panglima Komando Pelaksana Operasi Timor Timur.
255
Di lagu Pak Tani dimana ada keributan tersebut, Slank mengajak penonton untuk melakukan semacam tanya jawab di tengah-tengah lagu dan yang menarik adalah saat Kaka bertanya apakah mungkin jika Slank menjadi presiden, dan jawabannya ternyata tidak mungkin.
255
Mungkin disinilah uniknya, kecamatan ini letaknya tidak jauh dari ibukota negara, juga masih di pulau Jawa, akan tetapi fasilitas-fasilitas standard seperti (Listrik, jaringan telepon, jalan raya, dll), dapat dinikmati secara merata setelah era reformasi.
255
Kirenius menikah dengan Claudia Appia, tapi bercerai pada tahun 3 M dan menikah dengan Aemilia Lepida, putri Marcus Aemilius Lepidus (salah satu triumvir) dan saudara perempuan konsul Manius Aemilius Lepidus, yang asalnya bertunangan dengan Lucius Caesar.
255
Dalam komentar modern, kolomnya dilabeli huruf a sampai h dari kanan ke kiri dari sudut pandang pemain putih, dan barisnya dengan bilangan 1 sampai 8, di mana 1 lebih dekat ke pemain putih, sehingga menciptakan notasi standar bernama notasi catur aljabar.
255
Di samping perbendaharaan kata, berbagai variasi tutur seperti ragam, dialek, tingkat tutur, register khusus, genre dan tata format yang ada di dalam bahasa itu pun dengan baik mencerminkan apa yang dialami oleh bangsa di dalam berbagai segi kehidupannya.
255
STTIF-Bogor memang, dipersiapkan untuk menghadapi era indusrialisasi di mana Indonesia mau tidak mau harus mampu menghasilkan manusia-manusia yang berkarakter masyarakat industri agar bisa menjadi bagian yang diperhitungkan oleh masyarakat industri dunia.
255
Mesin webkit menyediakan sekumpulan kelas untuk menampilkan isi pada jendela, dan menerapkannya pada fitur penjelajah web, misalnya : mengikuti link ketika di-klik oleh pengguna, mengatur daftar kembali-maju, dan rekaman halaman yang baru saja dikunjungi.
255
Di Taiwan, kata Kaoshan dipakai sebagai istilah untuk merujuk kelompok-kelompok pribumi yang dilihat hidup di pegunungan Taiwan, berbeda dengan istilah Pingpu (Hanzi: 平埔族; py: píngpǔ zú; wg: p'ing-p'u tsu; tw: pêⁿ-po-cho̍k; harafiah "suku bangsa ladang").
Longest exclamatory sentences Length
Sentence
250
Diskografi Solo Singel * "Hitomi no Naka ni" (29 Desember 2001) - lagu tema permainan Playstation Sister Princess ~Pure Stories~) * "Yasashii Ai no Hane/Nemunemu Tenshi" (23 April 2003) - lagu pembuka dan penutup di serial anime Tenshi no Shippo CHU!
248
Di sini ikan napoleon jantan ada dua tipe, yakni mereka yang terlahir sebagai jantan dan tetap sebagai jantan sejati sampai akhir hayat, dan mereka yang memulai hidup sebagai betina dan dalam masa kehidupan berikutnya berubah fungsi sebagai jantan!
246
Ahmad dan Haitsami ) Dalam Tawarikh ( Doa Salomo 6:12-42 ) disebutkan mengenai doa ini dimana pada awalnya Nabi Sulaiman berdiri di mezbah Allah di depan segenap jamaah Israel sembari menadahkan tangan dan lantas berdoa ; ”Ya Tuhan, Allah Israel!
246
" ( ) *Ketika Pilatus melihat bahwa segala usaha akan sia-sia, malah sudah mulai timbul kekacauan, ia mengambil air dan membasuh tangannya di hadapan orang banyak dan berkata: "Aku tidak bersalah terhadap darah orang ini; itu urusan kamu sendiri!
245
Bada bahsa Suomi colloquial, bentuk indefinit dari kata kerja digunakan setelah me untuk mengatakan "kita melakukan (sesuatu)" seperti contohnya, me tullaan (kita datang) dan digunakan secara mandiri untuk menunjukan saran seperti dalam Mennään!
243
Mereka bukan saja mengungkapkan suatu roh yang tidak kristiani, melainkan juga menciptakan pelanggaran-pelanggaran jahat yang serius, melakukan penyerangan terhadap kami karena kami menolak meninggalkan acara-acara sabat di gereja-gereja kami!
242
Geng BANGER bener-bener jadi sosok lelaki-lelaki harapan, elit, punya pacar dan selalu dikelilingi anggota geng Blink-blink yaitu Gadis (Cinta Laura Kiehl), Geschell (Nindy), Gendis (Karmela) yang terkenal cantik, populer, tenar, super metal!
Appendix to ind wikipedia 2012: Longest sentences
200
239
Si Unyil telah menjadi salah satu bagian tak terpisahkan dari budaya populer di Indonesia, dan banyak orang tidak dapat melupakan berbagai unsur seri ini, mulai dari lagu temanya yang dimulai dengan kata-kata "Hom-pim-pah alaiyum gambreng!
239
Pada awal abad ke-20, musikal Princess Theatre dan acara cerdas lain seperti Of Thee I Sing adalah tahap artistik yang selangkah di depan revue dan hiburan-hiburan lain yang mendorong munculnya gebrakan baru seperti Show Boat dan Oklahoma!
236
Aslinya mengudara selama lima belas menit tetapi diperpanjang menjadi dua puluh menit pada seri 11. Ia sering memperlihatkan sebuah bagian acara dengan menampilkan karya seni yang sudah jadi, sambil mengatakan "Come have a look at this!
Longest interrogative sentences Length
Sentence
255
" ( ; ) *Lalu orang-orang yang menahan Yesus mengolok-olokkan Dia dan memukuli-Nya, meludahi muka-Nya dan meninju-Nya; orang-orang lain menutupi muka-Nya dan memukul Dia, dan berkata: "Cobalah katakan kepada kami, hai Mesias, siapakah yang memukul Engkau?
253
Supersel berkolaborasi dalam sebuah album kompilasi berjudul TamStar Rekor Koleksi Vol. 0 dirilis sebagai edisi terbatas di Comiket 79 pada bulan Desember 2010; di album ini Supersel itu "Kibo tidak Neiro" dinyanyikan oleh Hatsune Miku dan "Ashita e" (?
253
Ia pernah muncul di dalam episode "The Bull" (Awas Banteng Galak), saat ia mengganggu kawanan domba, juga pernah muncul di episode "Saturday Night Shaun", saat ia menjadi "tamu tak terduga" ke pesta Malam Minggu Shaun, di dalam episode "Who's The Mummy?
250
" Yesus membuat rujukan pada kalimat-kalimat dari Kitab Kejadian dalam khotbah-khotbahnya mengenai pernikahan di dalam Kitab Matius 19:4-6: "Tidakkah kamu baca, bahwa Ia yang menciptakan manusia sejak semula menjadikan mereka laki-laki dan perempuan?
248
Di dalam Nikaya, Sang Buddha dan para pengikutnya seringkali mempertanyakan atau menyatakan "Sesuatu yang tidak sejati, dapat berubah, dapat menderita, yang sesuai untuk dipertimbangkan demikian: 'Inilah saya, ini milik saya, ini adalah diri saya'?
247
Adakah itu merupakan bukti bahwa peran dan fungsi lukisan cadas khususnya masyarakat Nusantara tengah dan timur tiada berbeda dengan peran dan fungsi bahasa tulisan dengan kata lain aksara yang dikenal lingkungan masyarakat Nusantara bagian barat?
247
Apa yang dapat dilakukan untuk membujuk pekerja pertanian itu, jauh dari kalah dengan orang lain, mereka memiliki setiap kesempatan mengembangkan kepribadian mereka melalui pekerjaan mereka, dan dapat berharap untuk masa depan dengan percaya diri?
246
” Selain itu, ia takut parade akan mempromosikan "gaya hidup homoseksual" dan mengeluh bahwa polisi tidak menggunakan cukup kekuatan dalam memecahkan itu dengan menyatakan "Mengapa kekuatan tidak digunakan untuk memecah sebuah demonstrasi ilegal?
246
Abad ke-21 G.A.Wells Graham Stanton menulis pada tahun 2002 bahwa argumen-argumen yang paling sempurna dan rumit dari para tokoh dikemukakan oleh G.A.Wells, pensiunan professor Jerman di Birkbeck College, London, dan penulis buku Did Jesus Exist?
244
Dengan jogetnya yang asyik - yang hanya boleh dilihat, tapi jangan dipegang - Salma memang mampu berhasil membuat bakso yang lezatnya bukan main, namun bagaimana caranya merebut pelanggan lama mereka yang sekarang telah beralih pada bakso lain?
Appendix to ind web 2011: Longest sentences
201
Appendix to ind web 2011: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Perdana Menteri Xanana Gusmao punya cara lain: tampil sebagai tamu khusus dalam acara populer ‘Kick Andy’ dengan santai, simpatik dan penuh kelakar, dan mencuri hati pemirsa Indonesia ketika ia berlinangan air mata menceritakan pengalamannya di masa lalu.
255
VoIP (Voice over Internet Protocol) dengan IPPBX Jaringan Telpon Analog Telpon yang kita gunakan sehari – hari, baik di rumah maupun kantor sebenarnya tersambung oleh saklar (switch) yang terintegrasi dengan saklar lain, sehingga membentuk suatu jaringan.
255
Di samping untuk melihat "Status Congregationis" dan beberapa hal yang berkaitan dengan masalah-masalah yuridis, telah diputuskan untuk membahas sebuah tema khusus yang diharapkan menjadi pedoman arah bagi Kongregasi kita untuk tahun-tahun yang mendatang.
255
Siapa saja yang melakukan salah satu dari hal-hal yang dapat mengkafirkan, maka ia telah kafir, dengan syarat apabila ia telah mengetahui (ditegakkan hujjah padanya) namun ia tetap membangkang, tidak dalam keadaan terpaksa atau tidak kehilangan kesadaran.
255
TERKUAKNYA pembicaraan via telepon yang melibatkan sejumlah petinggi Kejaksaan Agung dengan Artalyta Suryani alias Ayin, terdakwa kasus dugaan suap jaksa BLBI Urip Tri Gunawan senilai Rp6 miliar, oleh Komisi Pemberantasan Korupsi (KPK) cukup membuat jera.
255
Saya memang sempat terharu sewaktu membaca surat itu, karena isinya yang polos, tulus dan penuh kasih sayang yang murni dari seorang anak kecil, dan langsung ada perasaan di hati saya bahwa akan ada peristiwa yang spesial kelak—namun baru sekedar firasat.
255
Karena itu, maka iapun telah menyatakan diri bersedia melakukannya, tetapi bersama-sama dengan Ki Lurah yang memiliki pengalaman yang luas untuk membentuk anak-anak muda bagi salah seorang di antara sepasukan pengawal, tidak untuk berdiri sendiri-sendiri.
255
Namun, bagi yang meninggalkannya karena malas, terlebih lagi ia masih mengimani bahwa shalat itu amalan yang disyariatkan, ada perbedaan pendapat di kalangan ulama, antara yang mengkafirkan dengan yang tidak mengkafirkan dan apakah ia dibunuh1 atau tidak.
255
Merupakan layanan pencari dari detikcom untuk membantu para pembaca detikcom untuk mencari artikel/data yang ada di seluruh properti milik detikcom dengan hasil pencarian yang lebih mendalam, tepat, dan lengkap dibandingkan dengan layanan pencari lainnya.
255
2. Dari proAccess: data kehadiran karyawan (berpengaruh bagi perusahaan yang menghitung pendapatan karyawan sistem 3. Semua data tersebut dirangkum pada proFee dan kemudian bisa dilakukan penambahan (bonus/tunjangan) ataupun pengurangan (potongan/hutang).
Longest exclamatory sentences Length
Sentence
255
Belajar di Amerika Serikat (dalam bahasa Inggris) Persyaratan Visa untuk warga negara non-AS yang berkeinginan belajar di A.S. Pendidikan AS merupakan investasi yang sangat baik bagi masa depan Anda, dan mahasiswa internasional disambut sangat baik di AS!
255
Bila anda pekerja keras, bayangkan komunisme sebagai rekan usaha anda yang tidak pernah muncul membantu namun ada komitmen moral untuk tetap membagi keuntungan usaha dengannya, belum lagi ketika merugi, ia tidak dapat diminta berbagi (trust me, its sucks!
255
Satu tentang Film satu lagi tentang Jadwal MotoGp, namun bagaimana jika kedua kalimat tersebut disambung secara paksa, jadinya akan seperti ini: Nonton Film Bidadari Jakarta sembari melihat Jadwal MotoGP 2010 Nah sekarang terlihat lebih baik dan nyambung!
254
On 31 Desember 2008 at 21:06 Djati said: tahun baruan ikut ngantri On 31 Desember 2008 at 21:25 GlagahPutih said: antriiiiiiiiiiii On 31 Desember 2008 at 22:03 glagah putih said: enaknya buka kitab lembaran baru juga nih masih ditunggu petunjuknya Ki GD!
254
Kalau anda merasa paket Sales Letter Ampuh ini tidak ada manfaat sama sekali, atau dengan alasan apapun anda mau minta uang anda kembali, anda hanya perlu kontak saya di support desk (link ada di paling bawah), dan saya akan mengembalikan uang anda 100%!
253
5. Mengirimkan surat kepada anggota lain menggunakan fasilitas surat di JO dimana isinya berupa ajakan perselingkuhan, perzinahan, atau jelas-jelas mengarah kepada hubungan seks dan kemudian anggota penerima surat melaporkan surat tersebut kepada admin!
252
" Meskipun saya tidak dapat menyimpulkan bahwa meditasi dan visualisasi kreatiflah yang menghilangkan bintik tersebut, tapi saya yakin bahwa pikiran saya memiliki kekuatan untuk menstimulasi sistem kekebalan tubuh yang menghasilkan 'mujizat kecil' ini!
Appendix to ind web 2011: Longest sentences
202
252
Duka keluargaku memang tidak dapat menghentikan matahari yang berputar sesuai dengan iramanya sendiri, tetapi aku dapat berlindung dibawah rimbunnya dedaunan untuk menghindari terik sinarnya, hanya untuk sementara di saat hatiku belum siap menerimanya!
252
Dan ia berharap presiden sesegera mungkin mengangkat pejabat baru untuk gantikan Sri Mulyani, agar program kerja yang sedang di jalankan, tidak terhambat oleh permasalahan ini, dan sebagai tambahan dari saya sebaiknya calon pengganti bukan dari Parpol!
252
Kini siapapun asal tinggal di Jakarta dan kebetulan anak orang jet set sehingga bisa kuliah perfilman di Amrik mak bedunduk bisa jadi sutradara atau DoP dan menghasilkan tontonan-tontonan yang membuat para budayawan dan pakar pendidikan mendelik marah!
Longest interrogative sentences Length
Sentence
255
Haduh2xx Dengan kendala empat bulan tadi, terpaksa saya harus keluar lagi uang untuk membeli mainboard MSI K92VM-F V2 sekitar 68$ hal ini memnyebabkan saya jadi minus pengeluarkan yang tidak terduga dan cukup bikin kacau pengeluaran bulanan saya,, hikz4x?
255
Bagaimana nilai-nilai komunisme sebagai sebuah strategi untuk meredam gejolak masyarakat Indonesia yang pernah mengalami trauma panjang akibat propaganda anti-komunis yang dilakukan di sepanjang era Orba diartikulasikan dalam film-film komersial tersebut?
255
Semoga Allah SWT selalu memberinya kekuatan dan ketabahan melalui cobaan hidup, Amien. adesiti wrote on Nov 17, '07 Tolong renungkan kembali, pantaskan laki laki yang berada di samping mu itu menjadi imam rumah tangga yang akan membimbing akhlak keluarga?
255
Penulis menemukan permasalahan, yang menurut hemat penulis adalah menarik untuk diangkat menjadi permasalahan penelitian, yaitu: Bagaimana penerimaan keluarga etnis Cina terhadap anggota keluarga yang melakukan perkawinan dengan etnis lainnya di Surabaya?
255
Tidak halal darah seorang muslim yang bersyahadat An Laa Ilaha Illa-Alloh wa Anna Muhammadan Rosululloh kecuali dengan satu dari tiga hal: jiwa dengan jiwa, orang yang sudah menikah yang berzina, dan orang yang meninggalkan agamanya dan meninggalkan jama?
255
Adi Nugroho Artikel ini juga dimuat di www.ilmukomputer.org Di salah satu mailinglist yang saya ikuti, sering ada member yang komplain inbox emailnya penuh karena mendapat email postingan dari member lain lalu bertanya bagaimana caranya keluar dari milis?
255
Desember 27, 2007 pukul 7:36 am kk caranya chating bagimanaa kk Januari 11, 2008 pukul 9:25 pm bekerja dengan cinta adalah kunci dari kesuksesan Januari 26, 2008 pukul 8:05 pm hy aQ mO ikutan gabing donk,,, Februari 14, 2008 pukul 1:53 pm keren juga sich?
255
Yang tampak dari makna hadits ini bahwasanya hal-hal seperti ini (penentuan awal puasa, Idul Fitri dan Idul Adha) bukan urusan perorangan dan mereka tidak bisa berbuat secara sendirian, akan tetapi urusannya diserahkan kepada penguasa/pemerintah dan jama?
255
Ya tersedia, dan informasi tersebut meliputi Judul, tahun produksi, format, ringkasan serta daftar isi dari sebuah CD/VCD/DVD baik merupakan produksi Pustaka maupuan hasil kerjasam dengan pihak lain 2. Bagaimana cara mendapatkan produk Multimedia dan VCD?
255
October 17, 2009 at 7:30 am wah akhirnya dapat juga komunitas anak2 dari pulau seram yang indah. eh pada tahu daerah kobisonta g.aku rahma yang sedang study di bandung.duh kangen ni ma kampung halaman.ni nomor hp aku ntar hubungi aja biar bisa kenalan ya?
Appendix to ind web 2012: Longest sentences
203
Appendix to ind web 2012: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Ajendam II sriwijaya 2. Di ikuti oleh 9 kelas di smk PGRI 2 palembang Mengunakan sistem gugur tunggal Peraturan permainan mengarah pada peraturan PSSI Jln sapta marga No.30 bukit sangkal Telp 812013 Palembang Kelas 3.1 semi final 6 sep,2010 juara III.
255
Suka duka hidup ini membuat kami semakin menyatu Antiklimaks : pengungkapan yang makin turun/ melemah Presiden, gubernur, bupati harus menaati hukum Asosiasi : perbandingan terhadap suatu hal sehingga muncul suatu gambaran terhadap keadaan sebenarnya.
255
Hal ini sesuai dengan firman Allah swt, dalam Q.S. Ash-Shaff (61): 3, yaitu ( ﺍﻠﺼﻒ : ٣) Artinya: Amat besar kebencian di sisi Allah bahwa kamu mengatakan apa-apa yang tidak kamu kerjakan” (R.
255
” Tentang tafakkur akan ciptaan Allah, dalam buku “Nikmatnya Hidangan Al-Qur’an (‘Alâ Mâidati Al-Qur’an)”, ‘Aidh al-Qarni mengajak kita untuk merenungkan ayat Al-Qur’an yang membahas salah satu makhluk Allah yang menyapa kita tiap hari, yaitu waktu Subuh.
255
Sekali lagi, tidak pernah ada cita-cita para nasionalis Papua itu untuk mendirikan “negara Kristen Papua”, walaupun nilai-nilai yang terkandung dalam ajaran Kristen tentu saja mengilhami para nasionalis Papua yang memperjuangkan kemerdekaan negeri mereka.
255
Setiap doa (Tonggo-tonggo) dalam kepercayaan Ugamo Malim ditutup dengan pernyataan “Nabonar Jungjunganku”, artinya : bahwa Raja Nasiakbagi-Sisingamangaraja adalah Jungjungan Parmalim yang diutus oleh Tuhan Yang Maha Esa mengajarkan kesucian dan kebenaran.
255
Bersama dengan susunan sistematik justru ciri alkitabiah tersebut menjadikan karya Matius sebuah “Piagam” tata penyelamatan baru yang menggenapi rencara Allah melalui Kristus: Yesus adalah Anak Allah, hal mana lebih ditekankan oleh Mat dari pada oleh Mrk.
255
” Seketika itu awan itu pecah berantakan dan saya mendengar dari belakangku ada suara yang memanggilku, “Wahai Abdul Qadir, kamu selamat dariku karena kefahamanmu terhadap agama dan aku telah berhasil menfitnah tujuh puluh orang dengan cara ini sebelummu.
255
Dekrit Konsili Vatikan II tentang Pelayanan dan Kehidupan Para Imam “Presbyterorum Ordinis” menegaskan, “Sakramen-sakramen lainnya, begitu pula semua pelayanan gerejawi serta karya kerasulan, berhubungan erat dengan Ekaristi suci dan terarahkan kepadanya.
255
Metode pemilihannya berdasarkan pada spesifikasi pompa dari supplier seperti diuraikan dalam Manual MHP “PAT: Pumps as Turbines (Pompa sebagai Turbin)” pada dasarnya faktor head dan debit menentukan dalam pemilihan pompa yang sesuai dari katalog pabrikan.
Longest exclamatory sentences Length
Sentence
255
Sebagian besar orang tidak menyadari bahwa apa yang mereka makan, seperti rambut dan kuku merupakan zat yang tidak dapat dicerna oleh tubuh sehingga dapat menyumbat dan merusak pencernaan mereka, bahkan tumbuh dan menjadi besar seperti bola rambut diatas!
255
Dan disaat itu engganlah ia menyembah dan memuja apa-apa yang lain dari Allah sehingga runtuhlah setiap yang berupa berhala, sekalipun berhala itu berupa longgokan atau timbunan kebendaan bernilai puluhan, ratusan, ribuan malah jutaan juta Dollar Amerika!
255
Percayakanlah semua urusan pribadimu ke dalam tangan kasihNya, dan tetap jagalah hatimu dengan segala kewaspadaan karena dari situlah terpancar kehidupan :) Diposkan oleh Generation Of Jesus di 8:38:00 AM 0 komentar Link ke posting ini Email ThisBlogThis!
255
Mengapa dia memilih bersepeda, mengapa dia digambarkan sebagai seorang guru dan mengapa kostumnya penuh warna seperti itu (perhatikan pakaian dalam yang dia kenakan ketika mengikuti terapi, bh pink, celana dalam oranye dan memakai stocking jarring-jaring!
255
Create an account Kesan Negatif Kelalaian Ibubapa Terhadap Anak-anak Tuesday, 05 October 2010 21:56 ummuuswah Jelaskan beberapa efek negatif yang timbul dikarenakan kedua orang tua sibuk hingga tidak sempat memperhatikan pendidikan agama anak-anak mereka!
255
“Dana itu dipecah dalam beraneka program yang melibatkan banyak lembaga dan orang ikut menanganinya, harus pula bisa digunakan para pejabat teras untuk membangun citra pemerintah yang murah hati dengan menyerahkan langsung paket bantuan pada warga miskin!
255
28. Dan ingatkanlah mereka akan suatu hari, di mana Kami mengumpulkan mereka semua Baik yang pernah berbuat kebaikan, maupun yang berdosa., lalu Kami katakan kepada mereka yang telah mempersekutukan Kami: "Diamilah tempatmu itu olehmu dan sekutu-sekutumu!
Appendix to ind web 2012: Longest sentences
204
255
Tubuh Si Kwi berkelebat, tombak menyambar akan tetapi Si Kwi menendang gagang tombak, sehingga serangan tombak menyeleweng dan sebelum Coa Lok dapat mengulangi serangan sambil berlutut itu, pedang di tangan Si Kwi telah menempel di lehernya dari belakang!
255
Sikap ini dapat ditafsirkan sebagai suatu harapan kepada agama-agama yang ada untuk bertumpu pada suatu titik pertemuan, common platform, kalimah sawa, sebagaimana firman Allah, yang Muhammad Asad terjemahkan sbb: Say: “O followers of earlier revelations!
255
Janganlah percaya kepadanya, karena tidak ada allah ('ELOAH) dari bangsa atau kerajaan manapun yang dapat melepaskan bangsanya dari tanganku dan dari tangan nenek moyangku, lebih-lebih lagi Allahmu ('ELOHIM) itu takkan dapat melepaskan kamu dari tanganku!
Longest interrogative sentences Length
Sentence
255
ٌ ﻧَﺎﺭٌ ﺣَﺎﻣِﻴَﺔ، ْ ﻭَﻣَﺎ ﺃَﺩْﺭَﺍﻙَ ﻣَﺎ ﻫِﻴَﻪ، ٌ ﻓَﺄُﻣُّﻪُ ﻫَﺎﻭِﻳَﺔ، ُ “ ﻭَﺃَﻣَّﺎ ﻣَﻦْ ﺧَﻔَّﺖْ ﻣَﻮَﺍﺯِﻳﻨُﻪDan adapun orang-orang yang ringan timbangan (kebaikan)nya, maka tempat kembalinya adalah neraka Hawiyah, dan tahukah kamu apakah neraka Hawiyah itu?
255
14 Sebagai pesantren yang tidak lahir dari pemikiran seorang kiai, ditambah dengan kuantitasnya yang menyebar ke hampir seluruh kota di nusantara dengan pendidikan yang menjadi ikon gerakannya, timbul pertanyaan mendasar bagaimana semua itu dapat terjadi?
255
Bagaimana cara Allah membekali Nabi Adam dengan ilmu pengetahuan, bisa anda baca pada Surat Al Baqarah ayat 30 – 33. Tapi kalau tidak mau repot mencari, anda bisa membaca ayat-ayat tersebut di postingan saya yang lain, yang berjudul ‘Apakah Alien itu ada?
255
Mengekor produk yang sudah ada tentu saja ada risiko yang harus dibayar, isu seputar HAKI menjadi topik yang paling menarik, banyak kasus berakhir tragis di atas meja hijau terkait perlindungan hak cipta, bagaimana dengan kasus ponsel berdesain mirip ini?
255
Untuk mengetahui kesalahan atau kekurangan yang mengakibatkan gugurnya perusahaan bapak, sebaiknya ditanyakan langsung ke panitia pengadaan-nya atau dapat langsung mengajukan surat sanggahan dengan materi mempertanyakan kenapa perusahaan bapak digugurkan?
255
Wakil dari Lutheran World Federation ini, dengan sebuah kerah pendeta dan salib yang melingkar di lehernya, dan ia merupakan pejabat penting di organisasinya - apa yang terjadi ketika setelah empat puluh tahun, pendeta resmi ini berdiri di hadapan mereka?
255
"Kalau masalah ini akan segera dimeetingkan, dan kamu tidak usah terlalu kuatir, karena keputusan akhirnya tetap ada di tangan Ibu, yang penting jika hari minggu nanti kamu bersedia menemani Ibu check in, minggu depan masalah itu pasti selesai, bagaimana?
255
“Kalau masalah ini akan segera dimeetingkan, dan kamu tidak usah terlalu kuatir, karena keputusan akhirnya tetap ada di tangan Ibu, yang penting jika hari minggu nanti kamu bersedia menemani Ibu check in, minggu depan masalah itu pasti selesai, bagaimana?
255
Sinful Trinity Mamon-Kaisar-Kenisah (yang merupakan proyeksi dari sinful trinity Hartawan-Penguasa-Agamawan yang dikutuk habis-habisan oleh Nabi-nabi Perjanjian Lama) atau Allah-nya kaum miskin-tertindas alias kaum paupertariat, atau minjung dalit anawim?
255
Engkau menginginkan kemesuman masa mudamu, waktu orang Mesir memegang-megang dadamu dan menjamah-jamah susu kegadisanmu” (Yehezkiel 23:20-21) "Ia mengendarai kerub, lalu terbang, dan tampak di atas sayap Anda percayakah jika Tuhan terbang dengan Cherubim?
Appendix to ind mixed 2012: Longest sentences
205
Appendix to ind mixed 2012: Longest sentences The longest sentences by string length Longest declarative sentences Length
Sentence
255
Ajendam II sriwijaya 2. Di ikuti oleh 9 kelas di smk PGRI 2 palembang Mengunakan sistem gugur tunggal Peraturan permainan mengarah pada peraturan PSSI Jln sapta marga No.30 bukit sangkal Telp 812013 Palembang Kelas 3.1 semi final 6 sep,2010 juara III.
255
Suka duka hidup ini membuat kami semakin menyatu Antiklimaks : pengungkapan yang makin turun/ melemah Presiden, gubernur, bupati harus menaati hukum Asosiasi : perbandingan terhadap suatu hal sehingga muncul suatu gambaran terhadap keadaan sebenarnya.
255
Hal ini sesuai dengan firman Allah swt, dalam Q.S. Ash-Shaff (61): 3, yaitu ( ﺍﻠﺼﻒ : ٣) Artinya: Amat besar kebencian di sisi Allah bahwa kamu mengatakan apa-apa yang tidak kamu kerjakan” (R.
255
” Tentang tafakkur akan ciptaan Allah, dalam buku “Nikmatnya Hidangan Al-Qur’an (‘Alâ Mâidati Al-Qur’an)”, ‘Aidh al-Qarni mengajak kita untuk merenungkan ayat Al-Qur’an yang membahas salah satu makhluk Allah yang menyapa kita tiap hari, yaitu waktu Subuh.
255
Sekali lagi, tidak pernah ada cita-cita para nasionalis Papua itu untuk mendirikan “negara Kristen Papua”, walaupun nilai-nilai yang terkandung dalam ajaran Kristen tentu saja mengilhami para nasionalis Papua yang memperjuangkan kemerdekaan negeri mereka.
255
Setiap doa (Tonggo-tonggo) dalam kepercayaan Ugamo Malim ditutup dengan pernyataan “Nabonar Jungjunganku”, artinya : bahwa Raja Nasiakbagi-Sisingamangaraja adalah Jungjungan Parmalim yang diutus oleh Tuhan Yang Maha Esa mengajarkan kesucian dan kebenaran.
255
Bersama dengan susunan sistematik justru ciri alkitabiah tersebut menjadikan karya Matius sebuah “Piagam” tata penyelamatan baru yang menggenapi rencara Allah melalui Kristus: Yesus adalah Anak Allah, hal mana lebih ditekankan oleh Mat dari pada oleh Mrk.
255
Ketika ditemui di rumah, sekaligus tempat memproduksi kerajinan plus ruang pamer produknya “Kerang Indah” di Desa Rangai Tritunggal, Kecamatan Katibung, Lampung Selatan di pinggir Jalan Lintas Sumatera, Mang Ihin lebih banyak menganggur ketimbang bekerja.
255
Dengan tagline “The House of Knowledge” kelak akan bersinergi dengan Agung Podomoro Recruitment Centre, “where the great career starts” akan menjadi the power of now bagi Agung Podomoro untuk lebih menempatkan dirinya sebagai pemain unggul di industrinya.
255
” Seketika itu awan itu pecah berantakan dan saya mendengar dari belakangku ada suara yang memanggilku, “Wahai Abdul Qadir, kamu selamat dariku karena kefahamanmu terhadap agama dan aku telah berhasil menfitnah tujuh puluh orang dengan cara ini sebelummu.
Longest exclamatory sentences Length
Sentence
255
Sebagian besar orang tidak menyadari bahwa apa yang mereka makan, seperti rambut dan kuku merupakan zat yang tidak dapat dicerna oleh tubuh sehingga dapat menyumbat dan merusak pencernaan mereka, bahkan tumbuh dan menjadi besar seperti bola rambut diatas!
255
Dan disaat itu engganlah ia menyembah dan memuja apa-apa yang lain dari Allah sehingga runtuhlah setiap yang berupa berhala, sekalipun berhala itu berupa longgokan atau timbunan kebendaan bernilai puluhan, ratusan, ribuan malah jutaan juta Dollar Amerika!
255
"Dalam memutus PK kasus Pilbup Lampura, MA justru konsisten dengan putusannya atas Pilgub Maluku Utara, yakni hanya mengakui perhitungan pertama yang dilakukan lembaga yang berwenang untuk itu--menafikan semua putusan di luar itu yang dilakukan siapa pun!
255
"Apalagi dengan advantage®MDUL¯ pendidikan yang lebih dahulu maju berkat pencerahan Nommensen, bukan hanya mendidik penginjil, melainkan juga guru, dibanding dengan wilayah Sumatera Timur yang zaman itu baru mulai dibuka jadi onderneming perkebunan asing!
255
Percayakanlah semua urusan pribadimu ke dalam tangan kasihNya, dan tetap jagalah hatimu dengan segala kewaspadaan karena dari situlah terpancar kehidupan :) Diposkan oleh Generation Of Jesus di 8:38:00 AM 0 komentar Link ke posting ini Email ThisBlogThis!
255
Mengapa dia memilih bersepeda, mengapa dia digambarkan sebagai seorang guru dan mengapa kostumnya penuh warna seperti itu (perhatikan pakaian dalam yang dia kenakan ketika mengikuti terapi, bh pink, celana dalam oranye dan memakai stocking jarring-jaring!
255
Vonis Gayus 7 tahun: Jaksa banding, kuasa hukum pikir-pikir Gayus: Jangan politisasi kasus saya Gayus divonis 7 tahun denda Rp 300 juta Jagal Kartasura, isteri korban Santoso beri kesaksian Wozniacki, Henin ke babak ketiga Pramono: Nurdin Halid keblinger!
Appendix to ind mixed 2012: Longest sentences
206
255
Create an account Kesan Negatif Kelalaian Ibubapa Terhadap Anak-anak Tuesday, 05 October 2010 21:56 ummuuswah Jelaskan beberapa efek negatif yang timbul dikarenakan kedua orang tua sibuk hingga tidak sempat memperhatikan pendidikan agama anak-anak mereka!
255
"Dana itu dipecah dalam beraneka program yang melibatkan banyak lembaga dan orang ikut menanganinya, harus pula bisa digunakan para pejabat teras untuk membangun citra pemerintah yang murah hati dengan menyerahkan langsung paket bantuan pada warga miskin!
255
“Dana itu dipecah dalam beraneka program yang melibatkan banyak lembaga dan orang ikut menanganinya, harus pula bisa digunakan para pejabat teras untuk membangun citra pemerintah yang murah hati dengan menyerahkan langsung paket bantuan pada warga miskin!
Longest interrogative sentences Length
Sentence
255
ٌ ﻧَﺎﺭٌ ﺣَﺎﻣِﻴَﺔ، ْ ﻭَﻣَﺎ ﺃَﺩْﺭَﺍﻙَ ﻣَﺎ ﻫِﻴَﻪ، ٌ ﻓَﺄُﻣُّﻪُ ﻫَﺎﻭِﻳَﺔ، ُ “ ﻭَﺃَﻣَّﺎ ﻣَﻦْ ﺧَﻔَّﺖْ ﻣَﻮَﺍﺯِﻳﻨُﻪDan adapun orang-orang yang ringan timbangan (kebaikan)nya, maka tempat kembalinya adalah neraka Hawiyah, dan tahukah kamu apakah neraka Hawiyah itu?
255
14 Sebagai pesantren yang tidak lahir dari pemikiran seorang kiai, ditambah dengan kuantitasnya yang menyebar ke hampir seluruh kota di nusantara dengan pendidikan yang menjadi ikon gerakannya, timbul pertanyaan mendasar bagaimana semua itu dapat terjadi?
255
Bagaimana cara Allah membekali Nabi Adam dengan ilmu pengetahuan, bisa anda baca pada Surat Al Baqarah ayat 30 – 33. Tapi kalau tidak mau repot mencari, anda bisa membaca ayat-ayat tersebut di postingan saya yang lain, yang berjudul ‘Apakah Alien itu ada?
255
Mengekor produk yang sudah ada tentu saja ada risiko yang harus dibayar, isu seputar HAKI menjadi topik yang paling menarik, banyak kasus berakhir tragis di atas meja hijau terkait perlindungan hak cipta, bagaimana dengan kasus ponsel berdesain mirip ini?
255
Untuk mengetahui kesalahan atau kekurangan yang mengakibatkan gugurnya perusahaan bapak, sebaiknya ditanyakan langsung ke panitia pengadaan-nya atau dapat langsung mengajukan surat sanggahan dengan materi mempertanyakan kenapa perusahaan bapak digugurkan?
255
Wakil dari Lutheran World Federation ini, dengan sebuah kerah pendeta dan salib yang melingkar di lehernya, dan ia merupakan pejabat penting di organisasinya - apa yang terjadi ketika setelah empat puluh tahun, pendeta resmi ini berdiri di hadapan mereka?
255
"Kalau masalah ini akan segera dimeetingkan, dan kamu tidak usah terlalu kuatir, karena keputusan akhirnya tetap ada di tangan Ibu, yang penting jika hari minggu nanti kamu bersedia menemani Ibu check in, minggu depan masalah itu pasti selesai, bagaimana?
255
“Kalau masalah ini akan segera dimeetingkan, dan kamu tidak usah terlalu kuatir, karena keputusan akhirnya tetap ada di tangan Ibu, yang penting jika hari minggu nanti kamu bersedia menemani Ibu check in, minggu depan masalah itu pasti selesai, bagaimana?
255
Sinful Trinity Mamon-Kaisar-Kenisah (yang merupakan proyeksi dari sinful trinity Hartawan-Penguasa-Agamawan yang dikutuk habis-habisan oleh Nabi-nabi Perjanjian Lama) atau Allah-nya kaum miskin-tertindas alias kaum paupertariat, atau minjung dalit anawim?
255
Engkau menginginkan kemesuman masa mudamu, waktu orang Mesir memegang-megang dadamu dan menjamah-jamah susu kegadisanmu” (Yehezkiel 23:20-21) "Ia mengendarai kerub, lalu terbang, dan tampak di atas sayap Anda percayakah jika Tuhan terbang dengan Cherubim?
Appendix to ind news 2007: Length of sentences in characters
Appendix to ind news 2007: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 124.8411
Standard deviation 47.3196
207
Appendix to ind news 2008: Length of sentences in characters
Appendix to ind news 2008: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 139.8119
Standard deviation 53.6457
208
Appendix to ind news 2009: Length of sentences in characters
Appendix to ind news 2009: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 139.9945
Standard deviation 53.0478
209
Appendix to ind news 2010: Length of sentences in characters
Appendix to ind news 2010: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 140.2100
Standard deviation 53.2520
210
Appendix to ind news 2011: Length of sentences in characters
Appendix to ind news 2011: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 139.8260
Standard deviation 53.8712
211
Appendix to ind news 2012: Length of sentences in characters
Appendix to ind news 2012: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 139.8108
Standard deviation 53.8101
212
Appendix to ind newscrawl 2011: Length of sentences in characters
Appendix to ind newscrawl 2011: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 115.8863
Standard deviation 50.5902
213
Appendix to ind newscrawl 2012: Length of sentences in characters
Appendix to ind newscrawl 2012: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 120.8113
Standard deviation 51.3122
214
Appendix to ind wikipedia 2007: Length of sentences in characters
Appendix to ind wikipedia 2007: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 111.8219
Standard deviation 51.1439
215
Appendix to ind wikipedia 2012: Length of sentences in characters
Appendix to ind wikipedia 2012: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 118.1521
Standard deviation 51.1244
216
Appendix to ind web 2011: Length of sentences in characters
Appendix to ind web 2011: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 106.1264
Standard deviation 53.1343
217
Appendix to ind web 2012: Length of sentences in characters
Appendix to ind web 2012: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 112.3962
Standard deviation 53.8947
218
Appendix to ind mixed 2012: Length of sentences in characters
Appendix to ind mixed 2012: Length of sentences in characters Sentence length in characters: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 114.6106
Standard deviation 53.4859
219
Appendix to ind news 2007: Length of sentences in words
Appendix to ind news 2007: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 17.2662
Standard deviation 6.5609
220
Appendix to ind news 2008: Length of sentences in words
Appendix to ind news 2008: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 19.4490
Standard deviation 7.4473
221
Appendix to ind news 2009: Length of sentences in words
Appendix to ind news 2009: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 19.4316
Standard deviation 7.3642
222
Appendix to ind news 2010: Length of sentences in words
Appendix to ind news 2010: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 19.4502
Standard deviation 7.3721
223
Appendix to ind news 2011: Length of sentences in words
Appendix to ind news 2011: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 19.4008
Standard deviation 7.4557
224
Appendix to ind news 2012: Length of sentences in words
Appendix to ind news 2012: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 19.4588
Standard deviation 7.4759
225
Appendix to ind newscrawl 2011: Length of sentences in words
Appendix to ind newscrawl 2011: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 16.2888
Standard deviation 7.0781
226
Appendix to ind newscrawl 2012: Length of sentences in words
Appendix to ind newscrawl 2012: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 16.8051
Standard deviation 7.0824
227
Appendix to ind wikipedia 2007: Length of sentences in words
Appendix to ind wikipedia 2007: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.5978
Standard deviation 7.0444
228
Appendix to ind wikipedia 2012: Length of sentences in words
Appendix to ind wikipedia 2012: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 16.5934
Standard deviation 7.1230
229
Appendix to ind web 2011: Length of sentences in words
Appendix to ind web 2011: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 14.8640
Standard deviation 7.3336
230
Appendix to ind web 2012: Length of sentences in words
Appendix to ind web 2012: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 15.8294
Standard deviation 7.4156
231
Appendix to ind mixed 2012: Length of sentences in words
Appendix to ind mixed 2012: Length of sentences in words Sentence length in words: Distribution, average, and standard diviation Percentage of sentences for fixed sentence length
Average sentence length 16.1158
Standard deviation 7.3840
232
233
Oddities details Appendix to ind news 2007: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
21
3
pemerintah-pemerintah
21
3
perusahaan-perusahaan
20
7
[email protected]
19
2
kebijakan-kebijakan
19
2
persoalan-persoalan
18
2
melambai-lambaikan
17
3
Kelompok-kelompok
17
3
serangan-serangan
17
13
kelompok-kelompok
16
18
bertanggungjawab
Appendix to ind news 2008: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
37
2
Manggarai-Sudirman-Tanahabang-Serpong
27
2
pebulutangkis-pebulutangkis
25
2
pembongkaran-pembongkaran
25
2
perlengkapan-perlengkapan
25
3
laboratorium-laboratorium
25
3
penyelidikan-penyelidikan
25
3
penyimpangan-penyimpangan
25
2
Pertandingan-pertandingan
25
27
pertandingan-pertandingan
25
11
perkembangan-perkembangan
Appendix to ind news 2009: Longest words
234
Appendix to ind news 2009: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
34
2
Brunei-Indonesia-Malaysia-Thailand
27
3
www.privateislandonline.com
27
6
Pertamina)Singapura,(ANTARA
26
2
FotoANTARA)Jakarta,(ANTARA
26
2
kepentingan-kepentingannya
26
2
persyaratan-persyaratannya
25
2
pemerintahan-pemerintahan
25
2
penyelidikan-penyelidikan
25
2
permasalahan-permasalahan
25
2
Pertandingan-pertandingan
Appendix to ind news 2010: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
32
3
Jakarta-Denpasar-Timika-Jayapura
32
3
Jayapura-Timika-Denpasar-Jakarta
30
7
Ludwig-Maximilians-Universitat
29
2
Garabashi-Barrels-Pastukhov`s
28
2
pertimbangan-pertimbangannya
27
2
Leutheusser-Schnarrenberger
26
2
Wringinharjo-Gandrungmangu
26
2
masyarakat-ceritakan-semua
25
2
keterbatasan-keterbatasan
25
2
laboratorium-laboratorium
Appendix to ind news 2011: Longest words
235
Appendix to ind news 2011: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
29
2
Jakarta-Yogyakarta-Balikpapan
28
2
Jayapura-Biak-Nabire-Kaimana
27
4
Infrastructure-as-a-Service
27
3
pemberontakan-pemberontakan
27
2
Indonesia-Malaysia-Thailand
26
2
kepentingan-kepentingannya
25
2
Permasalahan-permasalahan
25
2
Pertandingan-pertandingan
25
2
pengecualian-pengecualian
25
2
penyelamatan-penyelamatan
Appendix to ind news 2012: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
35
4
Johar-Lamaran-Telagasari-Lemahabang
33
3
www.infokerja.depnakertrans.go.id
33
2
Sadang-Kalijati-Subang-Cikamurang
30
2
Abang-Duri-Angke-Pluit-Bandara
29
2
Solo-Semarang-Cirebon-Jakarta
29
2
Lamaran-Telagasari-Lemahabang
29
2
Mengger-Mandalawangi-Caringin
29
2
3929/XI/2012/PMJ/DITRESKRIMUM
28
3
SBP-34A/WBC.12/KPP.0502/2011
28
3
Timika-Potowayburu-Enarotali
Appendix to ind newscrawl 2011: Longest words
236
Appendix to ind newscrawl 2011: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
57
2
heeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee
44
2
Rangkasbitung-Warunggunung-Pandeglang-Serang
41
2
Balidwipamandala-Nuswantara-Nusantararaya
40
2
www.pharmaceutical-technology.com/images
40
2
Surabaya-Pasuruan-Probolinggo-Banyuwangi
38
2
www.sports-council-wales.org.uk/images
37
2
buffaloniagararealestatehomesales.com
36
2
GEDONGTATAAN(LampostOnline):Kejadian
36
3
Jakarta-Bogor-Depok-Tangerang-Bekasi
35
7
———————————————————————————————————
Appendix to ind newscrawl 2012: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
72
2
Cirebon-Prupuk-Purwokerto-Kroya-Kutoarjo-Yogyakarta-Solo-Madiun-Surabaya
59
2
Solo-Sragen-Ngawi-Madiun-Nganjuk-Jombang-Mojokerto-Surabaya
57
2
Prambanan-Piyungan-Palbapang-Pandak-Sedayu-Sentolo-Tempel
47
2
Kutamendala-Karangjongkeng-Purwodadi-Linggapura
46
2
Shanghai-Hochiminh-Bangkok-Laemchabang-Jakarta
45
2
Banjar—Padaherang—Kalipucang—Sidareja—Cilacap
44
2
Rangkasbitung-Warunggunung-Pandeglang-Serang
44
2
Jakarta-Bogor-Depok-Tangerang-Bekasi-Cianjur
44
2
Jantho-Cumcum-Siron-Indrapuri-Samahani-Banda
42
2
Pedrosa—Lorenzo—Dovizioso—Crutchlow—Stoner
Appendix to ind wikipedia 2007: Longest words
237
Appendix to ind wikipedia 2007: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
58
2
Llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch
46
2
Jakarta-Cirebon-Purwokerto-Yogyakarta-Surabaya
41
2
Surabaya-Malang-Blitar-Kertosono-Surabaya
31
2
Melayu-Johor-Pahang-Riau-Lingga
30
2
Yogyakarta-Surabaya-Banyuwangi
28
2
Surabaya-Banyuwangi-Denpasar
27
2
Surabaya-Yogyakarta-Jakarta
27
2
Kaiser-Wilhelm-Gesellschaft
27
7
pemberontakan-pemberontakan
27
6
kecenderungan-kecenderungan
Appendix to ind wikipedia 2012: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
29
3
Löwenstein-Wertheim-Rochefort
29
2
Reichsdeputationshauptschluss
27
2
munisipalitas-munisipalitas
27
2
penyelewengan-penyelewengan
27
2
penyempurnaan-penyempurnaan
27
2
kebijaksanaan-kebijaksanaan
27
9
pemberontakan-pemberontakan
27
6
kecenderungan-kecenderungan
27
2
006/BAN-PT/Ak-XI/S1I/V/2008
27
2
Kaleipaihala-Kalanikuimamao
Appendix to ind web 2011: Longest words
238
Appendix to ind web 2011: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
49
3
HomeNotesBlogPhotosVideoMusicCalendarReviewsLinks
45
3
N-(3,4-diklorobenzoil)-N'-(3,4-diklorobenzoil
41
5
O-(3',4'-diklorobenzoil)-5-klorosalisilat
40
2
Dodotan,sumbermulyo,bambanglipuro,bantul
36
3
pengaduan/usulan/pertanyaan/komentar
36
2
N-(4-hidroksifenil)-4-nitrobenzamida
33
2
Copyrigh�yourhighschoolhere2010
33
2
[email protected]
32
7
N-fenil-N'-2-klorobenzoiltiourea
32
2
N-(3,4-diklorobenzoil)sefaleksin
Appendix to ind web 2012: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
81
3
TonsilitisLeptospirosisHepatitisUTIPeritonitisCataractAnemiaGastritisPneumoniaPre
74
2
Solo-Palembang-Pekanbaru-Balikpapan-Bekasi-Tangerang-Denpasar-Bogor-Malang
66
2
CewekYangTurunDariAngkotGara2DyJatuhCintaMaGuePadaPandanganPertama
64
2
Pancasila-yang-beserta-kelima-silanya-yang-dibuat-dengan-bingkai
63
3
HomeProductsNotesBlogPhotosVideoMusicCalendarReviewsMarketLinks
63
13
TVEntertainmentTeknoOtomotifFemaleHealthPropertiKompasianaUrban
62
14
HomeNotesBlogPhotosVideoMusicCalendarReviewsMarketRecipesLinks
61
15
TVBolaEntertainmentTeknoOtomotifHealthPropertiKompasianaUrban
61
2
saudara,Syairah,Syafiqah,Zikry,Hareez,Syahmi,Zufayri,terhibur
61
10
TVBolaEntertainmentTeknoOtomotifFemalePropertiKompasianaUrban
Appendix to ind mixed 2012: Longest words
239
Appendix to ind mixed 2012: Longest words The 10 longest words with frequency>1, ordered by length Length Frequency
Word
81
3
TonsilitisLeptospirosisHepatitisUTIPeritonitisCataractAnemiaGastritisPneumoniaPre
74
2
Solo-Palembang-Pekanbaru-Balikpapan-Bekasi-Tangerang-Denpasar-Bogor-Malang
66
2
CewekYangTurunDariAngkotGara2DyJatuhCintaMaGuePadaPandanganPertama
64
2
Pancasila-yang-beserta-kelima-silanya-yang-dibuat-dengan-bingkai
63
3
HomeProductsNotesBlogPhotosVideoMusicCalendarReviewsMarketLinks
63
13
TVEntertainmentTeknoOtomotifFemaleHealthPropertiKompasianaUrban
62
14
HomeNotesBlogPhotosVideoMusicCalendarReviewsMarketRecipesLinks
61
15
TVBolaEntertainmentTeknoOtomotifHealthPropertiKompasianaUrban
61
10
TVBolaEntertainmentTeknoOtomotifFemalePropertiKompasianaUrban
61
2
saudara,Syairah,Syafiqah,Zikry,Hareez,Syahmi,Zufayri,terhibur
Appendix to ind news 2007: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
10.6000
Amerika sangat mendukung peninjauan terhadap kebijakan penghapusan pengaruh Baathism (de-Ba'athification).
10.5000
Ketrampilan menentukan hasil pertarungan."
10.4444
Pertandingan menggantikan pertandingan persahabatan yang sedianya berlangsung dengan Yordania.
10.4000
Departemen Perhubungan baru saja mengumumkan klasifikasi perusahaan-perusahaan penerbangan di Indonesia.
10.3333
Pentagon menyatakan, klaim sebelumnya sering dibesar-besarkan.
10.2727
PBB menghimbau masyarakat internasional untuk mengatasi peningkatan serangan terhadap lembaga-lembaga pendidikan.
10.2500
Negara-negara Asia, termasuk Indonesia, dilaporkan sudah berupaya menindaklanjutinya dengan proyek-proyek ramah lingkungan.
10.0000
Bagaimanapun implikasi insiden ini tersebut mengkhawatirkan.
10.0000
Mereka mengatakan, pemerintah mendukung kelompok paramiliter tersebut.
9.9167
Negara-negara Barat sedang mempertimbangkan perpanjangan sanksi terhadap Zimbabwe sebagai tanggapan terhadap kekerasan.
9.8000
Departemen Perhubungan mengumumkan peringkat maskapai penerbangan diantaranya berdasarkan kualifikasi sumber daya manusia dan pemeliharaan pesawat.
9.7500
Dia berhasil mempertahankan pertumbuhan ekonomi Inggris yang berkesinambungan.
9.6000
Masalahnya hanyalah terbatasnya pemain cadangan.
9.6000
Penggundulan hutan menyebabkan pemanasan global.
9.5714
Aparat penyiaran Pakistan, PEMRA, melarang demonstrasi diberitakan.
Appendix to ind news 2007: Sentences with high average word length
9.5263
Sebelumnya pembentukan provinsi Irian Jaya Barat menimbulkan polemik setelah Mahkamah Konstitusi membatalkan pemberlakuan undang-undang yang mendasari pembentukan provinsi tersebut.
9.5000
"Tidak mungkin lawan-lawan Manchester United mendapatkan penalti," tegasnya.
9.5000
Laporan-laporan mengatakan beberapa petugas polisi tewas.
9.5000
Para pendukung Ranaridh mengatakan dakwaan dilatarbelakangi masalah politik.
9.5000
Partai-partai yang menuduh, Gul memiliki agenda Islami tersembunyi, mempermasalahkan keabsahanan pemungutan suara.
9.5000
Universitas Virginia Tech dan lonceng-lonceng dibunyikan.
9.4667
Organisasi pembangunan internasional, Oxfam, menyebut keberadaan Wolfowitz dalam melanjutkan jabatannya sudah "tidak bisa dipertahankan" lagi.
9.4667
Sebelumnya, panglima tertinggi Amerika, Jenderal David Petraeus mengatakan, mengurangi pasukan mungkin menyebabkan tindak kekerasan meningkat.
9.4444
Hanya beberapa jam sebelum pertandingan, gereja mengeluarkan pertandingan dibatalkan.
9.4444
Jurubicara perdana menteri Inggris mengatakan, Iran perlu memperlihatkan "posisinya".
Appendix to ind news 2008: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
12.8000
Perkembangan selanjutnya, antisekularisme Kartosuwiryo mengeras.
12.3846
Gangguan itu dideteksi juga mengganggu jalur komunikasi di area Ring Jasuka (Jakarta-Tanjung andan-Pontianak-Batam-Pekanbaru-Palembang-Baturaja-Lampung-Jakarta).
12.1429
Untuk informasi lebih lanjut silahkan mengunjungi: www.bbcworldservice.com/radioplay.
12.1250
Pada koridor Tanahabang-Serpong, PT KA mengandalkan lintas Manggarai-Sudirman-Tanahabang-Serpong.
11.8571
Pemerintah melakukan langkah-langkah dengan mempertimbangkan ketersediaan anggaran.
11.7778
"Negara-negara lain menginginkan penggantian kebijakanyang berorientasi perang, pendudukan, penggencetan,.
11.7500
"Kadang-kadang mengejutkan pengendara bermotor.
11.7500
"Teruslah mengembangkan varietas-varietas baru.
11.5000
Harus dipersiapkan langkah-langkah berikutnya.
11.3333
"Warisan-warisannya ini akan menghantui penggantinya bertahun-tahun.
11.2500
Apalagi undang-undang memungkinkan," ujarnya.
11.2500
"Kami menargetkan sebesar-besarnya," katanya.
11.2500
Pastika-Puspayoga sementara memperoleh 1.083.
11.2500
Sementara Khofifah-Mudjiono memperoleh 7.669.
11.2000
Keduanya, menurut Kalla, memiliki kekurangan-kekurangan.
11.2000
"Kita ingin melakukan penyesuaiannya sekaligus,"katanya.
11.2000
Rahardi mencoba menyodorkan pertanyaan-pertanyaan besar.
11.1667
Pro-kehidupan adalah memperhatikan kesinambungan untuk kebersamaan.
240
Appendix to ind news 2008: Sentences with high average word length
11.0000
Belakangan pandangannya semakin konservatif.
11.0000
"Kami masih bersama-sama melakukan perbaikan-perbaikan.
11.0000
"Pembantu-pembantunya, kawan-kawannya tidak bisa masuk.
11.0000
Pemerintah menerapkan stratehi menghindari konfrontasi.
11.0000
"Profesionalisme dengan nasionalis religius.
10.9167
"Semburan ini akibat adanya patahan yang terjadi di Arjuna-Penanggungan-Welirang (gunung)-Porong-Kalanganyar-Madura," kata Mazzini.
10.9091
Negara-negara Barat memperketat sanksi-sanksi dan mengeluarkan pernyataan-pernyataan yang mencerminkan kekesalan mereka.
Appendix to ind news 2009: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
16.5000
Terakhir, Fokker A-2708 bertujuan penerbangan Iswahyudi-Halim-Adi Sucipto-Iswahyudi-Balikpapan-Palu-Hasanuddin (Magetan-Jakarta- Yogyakarta-Magetan-Balikpapan-Palu-Makassar) mengangkut lima jenazah.
14.6154
KMP Amukti Palapa melayani lintasan Surabaya-Masalembu-Kalianget-Kangean-Sapeken-Banyuwangi, sedang KM Kumala Abadi melayani lintasan Banyuwangi-Sapeken-Kangean-Kalianget-Masalembu-Surabaya.
14.0000
Untuk rute baru domestik antara lain Tanjungkarang-Jakarta, Jakarta-Malang, Jakarta-Ujungpandang-Kendari, Menado-Ternate, Balikpapan-Tarakan, Denpasar-lombok, Jakarta-Jambi, Jakarta-Bengkulu, Jakarta-Gorontalo.
13.6667
Perundingan-perundingan sedang dilakukan.
13.4375
Hercules kedua bertujuan penerbangan Abdurrahman Saleh-Husein Sastranegara-Iswahyudi-Halim Perdanakusuma - Iswahyudi-Adi Sucipto-Halim Perdanakusuma (Malang-Bandung-Magetan-Jakarta-Yogyakarta) mengangkut 15 jenazah.
13.1538
Sementara Hercules ketiga yang mengambil rute Iswahyudi-Rambiga-Hasanudin-Walter Monginsidi-Pattimura (Magetan-Mataram-Makassar-Kendari-Maluku) yang mengangkut 15 jenazah.
12.5000
Ketentuan-ketentuan keuangannya tidak diungkapkan.
12.1429
Untuk informasi lebih lanjut silahkan mengunjungi: www.bbcworldservice.com/radioplay.
12.0000
"Menurut penyidik,Muhammadong sangat kooperatif.
12.0000
"Pertandingan-pertandingan selanjutnya harus kami menangkan.
11.7500
Pasangan Yudhoyono-Boediono mendapatkan 73.874.
11.5000
Jukir tersebut bisa mempertanggungjawabkannya.
11.4000
"Jangan masing-masing gubernur membangun sendiri-sendiri.
11.3750
Pernyataan-pernyataan keras presiden menyebabkan masyarakat internasional mengucilkan Iran.
11.2857
Pemenang Barcelona-Bayern akan bertemu pemenang pertandingan Liverpool-Chelsea.
11.2500
Bagaimanakah kualitas kepemimpinan Roosevelt?
11.2500
"bergantung konvensi (kesepakatan)," ujarnya.
11.2000
Transparansi, akuntabilitas, harus dipulihkan," katanya.
11.1667
Mahkamah Internasional mengatakan permukiman-permukiman itu ilegal.
11.1429
Freeport menyusuri jalan Timika-Tembagapura dengan pengawalan ketat/ilustrasi.
241
Appendix to ind news 2009: Sentences with high average word length
11.0000
Capres-Cawapres Megawati Soekarnoputri-Prabowo dan Jusuf Kalla-Wiranto masing-masing menjalani pemeriksaan Minggu (17/5).
11.0000
"Dulu-kan `disclaimer` sekarang menjadi non-disclaimer.
11.0000
Indonesia menggarisbawahi pentingnya pengelolaan hutan.
11.0000
Laporan-laporan menyebutkan, keamanan penjara Insein ditingkatkan.
11.0000
"Menyerahkan operasi pembersihan (kebocoran minyak-red.
Appendix to ind news 2010: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
13.4000
Terjawab SudahTerkiniTerpopulerTerhebohPahlawan Super Atau Pemalas?
13.0000
Untuk melintasi jalur tengah, pemudik bisa melewati Sadang-Kalijati-Subang-Cikamurang-Kadipaten-Cirebon.
12.5000
Drive test dilakukan pada 4 rute yakni Jakarta-Cirebon-Losari, Jakarta-Merak, Jakarta-Cileunyi-Nagreg-Garut-Tasikmalaya, dan Semarang-Yogyakarta-Solo.
12.1000
Yakni, mulai dari Tumompaso-Langoan, Kumanonang dan sekitarnya, Kumawangkoan dan sekitarnya, Kiowa-Sumonder, Tumareran-Suluun dan sekitarnya, Tumpaan-Amurang-Tengah, Kumelembuay-Motoling, Pontak-Poopo-Ranoiyapo hingga Tompaso Baru-Modoinding.
12.0000
Sementara untuk gelombang kedua yakni Lampung-Jakarta-Jeddah-Makkah-Madinah-Jakarta dan Lampung.
11.8750
"Mereka melancarkan pemboman-pemboman dan menghancurkan tempat-tempat persembunyian gerilyawan.
11.6364
Festival Lima Gunung Dibuka Dengan Sesaji di Kayangan SuroloyoKesengsaraan Yang MembelengguTerkiniTerpopulerTerhebohKeterlaluan!
11.6000
Dan ia memperingatkan kepadalawan-lawannyaagar berwaspada.
11.6000
"Persoalan-persoalan kehutanan harus didiskusikan bersama.
11.5000
Mudah-mudahan sidang ini menghasilkan vonis seadil-adilnya,"tegasnya.
11.5000
"(Penyembuhannya) diharapkan berlangsung baik.
11.3750
DK juga berharap segera dilanjutkannya perundingan-perundingan perdamaian Palestina-Israel.
11.3333
Perundingan-perundingan itu, terakhir diselenggarakan Desember 2008.
11.2500
"Penambahan tersebut diperbolehkan," katanya.
11.2500
Selain berjubel, terkesan berbondong-bondong.
11.2500
TerkiniTerpopulerTerhebohParsel dari Mahasiswa untuk Presiden SBYAktivis atau Profesional?
11.2000
"Persiapan-persiapan sudah rampung," katanya menegaskan.
11.1667
Kemungkinan kecenderungannya memberikan teguran tertulis," ujarnya.
11.1429
Buku tersebut akan berisi berbagai gambar yang-tak-pernah-terlihat-sebelumnya.
11.1429
Namun, pelaksanaannyanauzubillahi mindzalik: "tidak semudah bibir mengucapkan.
11.1250
Kemeriahan yang diselenggarakan berupa urban sport,art,exhibition,competition, dan musik.
11.0000
000 Per DolarTerkiniTerpopulerTerhebohPahlawan Super Atau Pemalas?
11.0000
Beberapa diantaranya mendapatkan penghargaan Kalpataru.
242
Appendix to ind news 2010: Sentences with high average word length
11.0000
Feodalisme, diekspresikan dalam hubungan-hubungan klientalisme, familiisme, dan dengan mengajukan sentimen-sentimen primordial lain.
11.0000
Indonesia berupaya memenangkan pertandingan.
Appendix to ind news 2011: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
24.5556
Rombongan melewati jalur Surabaya-Gresik-Lamongan-Tuban-Rembang-Pati-Kudus-Demak-Semarang-KendalBatang-Pekalongan-Pemalang-Tegal-Brebes-Cirebon-Indramayu-Subang-Karawang-Bekasi-Jakarta Timur-Kantor PBNU di Jakarta Pusat.
12.7500
Untuk mengetahui lebih lanjut mengenai solusi bisnis ini Anda bisa mengunjungi www.sap.com/solutions/sapbusinessobjects/large/governance-risk-compliance.
12.5000
Pertama mengurangi/mengatasi berbagai penyebab kerusakan/tekanan ekosistem.
12.0000
Hal serupa juga dialami maskapai Merpati Nusantara yang melayani rute Jakarta-Makassar-Timika-Jayapura dan sebaliknya terpaksa mengubah rute menjadi Jakarta-Makassar-Biak-Timika-Jayapura-Timika-Biak-Makassar-Jakarta.
12.0000
"Perdebatan-perdebatan konseptual sudah terjadi.
11.8333
Ketiga, ketidakmampuan pemerintah mengelola pelayanan-pelayanan publik.
11.6667
Ini membuktikan pemerintah setengah-setengah memberantasnya," katanya.
11.5714
Computradetech Technology International, penyedia solusi infrastruktur teknologi.
11.5000
Apalagi pertimbangannya kemanusiaan," ujarnya.
11.5000
Beberapa diplomat lainnya mengonfirmasikannya.
11.5000
Pesawat menempuh rute Jakarta-Makassar-Timika.
11.5000
Sebelumnya, fraksi-fraksi menyampaikan pandangannya masing-masing melalui perwakilan fraksi.
11.4545
Sebelumnya, pada 21 Februari 2011 diadakan pertemuan-pertemuan bilateral antara negara-negara ASEAN, antara lain Indonesia-Singapura, Indonesia-Brunei Darussalam, Indonesia-Malaysia, Indonesia-Thailand, Brunei Darussalam-Malaysia; dan Thailand-Myanmar.
11.4000
Kegiatan diselenggarakan oleh Kementerian Perencanaan Pembangunan Nasional/Badan Perencanaan Pembangunan Nasional.
11.3333
"Perundingan-perundingan perdamaian sedang dilakukan dengan Taliban.
11.2857
Ke-12 ruas yang dimaksud antara lain, ruas Cikampek-Palimanan, Pejagan-Pemalang, Pemalang-Batang, Semarang-Solo serta Surabaya-Mojokerto, Mojokerjo-Kertosono.
11.2778
Pasangan Songphon Anugritayawon/Kunchala Voravichitchaikul menantang Ahmad Tantowi/Liliyana Natsir, kemudian unggulan kedua Sudket Prapakamol/Saralee Thoungthongkam menjajal Muhammad Rijal/Debby Susanto.
11.2500
Perbanyaklah mengajukan pertanyaan "mengapa".
11.2500
Perundingan-perundingan terhenti setelah pembekuan pembangunan permukiman Israel berakhir.
11.2000
"Ketidakpuasan tersebut dilampiaskan dengan melakukan perusakan-perusakan, pembakaran, dan pelemparan," katanya.
11.2000
Kontroversi kemudian menyelimuti rencana pembangunannya.
11.2000
"Membangkitkan pelajar berarti membangkitkan masyarakat.
243
Appendix to ind news 2011: Sentences with high average word length
11.1667
Beberapa ruang direksi BUMN--beberapa saja--sangat-sangat mewahnya.
11.1667
Keputusannya Indonesia memakai seragam Merah-Putih-Putih," katanya.
11.1667
Pemerintah bisa membuat gebrakan-gebrakan atau terobosan-terobosan.
Appendix to ind news 2012: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
13.0000
"Semestinya kebijakan-kebijakan strategis harus dibicarakan inter-kementerian.
12.8000
Berdasarkan Laporan Polisi Nomor: LP/1775/V/2012/PMJ/Ditreksrim.
12.7500
"Mereka menyajikan pertandingan-pertandingan sulit.
12.3636
Maksudnya, antara shipping-forwarding-port-inland transport-consolidation/distribution center adalah sebuah rangkaian yang tak terputus.
12.2500
"Ia bersungguh-sungguh memperbaiki penampilannya.
12.1111
Ada frustrasi-dan-bingung, kesedihan tidak-tahu-mengapa-jadi-berakhir, ada kesedihan yang diwarnai kemarahan.
12.0000
"Pemerintah menggunakan pendekatan kemasyarakatan," katanya.
12.0000
Sony mempersilakan pengguna untuk mendaftarkan perangkatnya melalui https:/ / productregistration.
11.8333
Sedangkan, Rangkasbitung-Tanahabang dan Tigaraksa-Tanahabang Rp30 ribu.
11.8000
Menurut dia, direncanakan ada sembilan ruas yang akan dikembangkan meliputi Cikampek-Palimanan, Pejagan-Pemalang, Pemalang-Batang, Batang-Semarang, Semarang-Solo, Solo-Ngawi, Ngawi-Kertosono, Kertosono-Mojokerto, dan Mojokerto-Surabaya.
11.6923
Merpati juga akan membuka penerbangan terusan Semarang-Jakarta-Makassar, Semarang-Jakarta Biak, Semarang Jakarta-Jayapura, dan Semarang-Jakarta-Merauke.
11.6667
Penonton tampak menggangguk-anggukan kepala, bergoyang menikmati instrumen-instrumen yang diperdengarkan.
11.5000
"Buktinya, pemerintah belum merealisasikannya.
11.5000
Ditambahkannya,"konsultasi tahunan (Annual Consultations) merupakan forum tertinggi dalam mekanisme hubungan bilateral Indonesia-Malaysia.
11.5000
"Sebaiknya pemerintah memaksimalkan pemanfaatan sumber-sumber energi terbarukan," tambhanya.
11.5000
Tidak bisa dipertanggungjawabkan kebenarannya.
11.4545
Kemendag memberikan kelengkapan informasi dan prosedur administrasi pendaftaran di situs www.kompetisidesainrotandanbambu.com.
11.4545
"Sementara, pembinaan berwirausaha dilakukan melalui pendidikan berwirausaha,pendampingan berwirausaha, dan promosi," katanya.
11.4286
Berikutnya rute Jakarta-Surabaya via jalur selatan, Jakarta-Surabaya via Pantura, Jakarta-Cilacap, Jakarta-Wonogiri, Jakarta-Semarang, serta Jakarta-Pekalongan.
11.4000
Upaya-upaya pelanggaran perbatasan dicegah terus-menerus.
11.3333
Teman-temannya mengungkapkan, Guagua sengaja mengisolasikan dirinya.
11.3000
Dikatakannya, Muhammadiyah memandang perlunya langkah-langkah penyelamatan bangsa melalui penguatan kepemimpinan.
244
Appendix to ind news 2012: Sentences with high average word length
11.2857
Dengan demikian,diharapkan masyarakat desa setempat meningkat kesejahteraannya.
11.2000
Alangkah berkembangnya kemampuan insinyur-insinyur kita.
11.2000
Angka-angka mewakili tingkat pertumbuhan tahun-ke-tahun.
Appendix to ind newscrawl 2011: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
18.5833 Terbukti dengan rute perjalanan yang sudah mereka lalui, antara lain Pulau Jawa-Bali-NTB-NTT-Makassar-AmbonJayapura-Manokwari-Sorong-Ternate-Manado-Gorontalo-Palu-Mamuju-Balikpapan-Samarinda-Banjarmasin-Semarang-Pontianak. 17.6250 Rute yang ditempuh yaitu Darwin-Kupang-Alor-Lembata-Maumere-Riung-Labuhan Bajo-Mataram-Makassar-Bali Utara-Karimun Jawa-Kumai-Belitung-Batam. 17.2500 Dari mulai Sekda-Kadis-Camat-Lurah-RW-RT-Tokoh Masarakat-KPU-Dst-Dst. 16.4545 Selain itu, juga melayani trayek Surabaya-Madiun-Magetan, Surabaya-Madiun/Karangjati-Ngawi, Surabaya-Bojonegoro-Tuban, Surabaya-Pamekasan-Sumenep, Surabaya-Nganjuk, Surabaya-Kediri. 16.4000 Jalur alternatif lainnya melalui Sidoarjo-Wonoayu-Krian-Mojosari-Japanan-Pasuruan. 16.0000 Kemampuannya,mencengkeram-mulai dari Sekda-Dinas-Camat-Lurah-Rw-Rt,melibatkan para seponsor Para Pemborong-Kadin,para tokoh,dll. 15.9375 Etape ini akan melewati rute Ngandul-Kowang-Ngargotirto, Alas Kuncen (Purwodadi)-Stasiun Goprak-Jurang Nongo-Ngrandu-Gosek-Baleharjo-Cerme/Slendro (Gesi)-Blangu-Pilangsari-lapangan Gesi-Poleng-Bawang-Denanyar (Tangen)-Ngepringan-Galeh-Lapangan Desa Jenar. 15.6667 Kemudian, jalur Palang–Brondong–Paciran–Gresik. 15.5714 Seperti rute Juanda-Malang-Blitar, Juanda-Kediri-Tulungagung, Juanda-Jember-Banyuwangi dan Juanda-Bojonegoro. 15.5000 Selain itu, juga melayani trayek Surabaya-Madiun-Magetan, Surabaya-Madiun/Karangjati-Ngawi, Surabaya-Bojonegoro-Tuban, Surabaya-Nganjuk, Surabaya-Kediri, dan Surabaya-Pamekasan-Sumenep. 15.4545 Terutama di wilayah sepanjang stasiun yang dilewati, mulai Surabaya Kota-Gubeng-Wonokromo-Sepanjang-Kumendung-Boharan-Krian-Kedinding-Tarik-Mojoanyar (Darmasi)-Mojokerto. 15.2500 Juga jalur Gempol-Bangil-Pasuruan-Nguling-hingga Probolinggo. 15.1667 Selanjutnya menuju Sidorame-Sidotopo Lor-Simokerto-Kenjeran-Kedung Cowek-Jembatan Suramadu. 14.8571 Untuk trayek pelayanan angkutan mudik dan balik dilakukan pada Surabaya-Situbondo-Banyuwangi, Surabaya-Jember-Banyuwangi, Surabaya-Bondowoso, Surabaya-Malang-Blitar, Surabaya-Kertosono-Tulungagung-Trenggalek. 14.8000 Ia akan melalui Merak-Jakarta-Bandung-Tasikmalaya-Purwokerto-Yogyakarta-Solo-Madiun-Probolinggo-Banyuwangi-menyeberang ke Bali dan berakhir di Kuta. 14.7500 Road race akan mengambil rute Bandung-Tasik-Purwokerto-Semarang-DIY-Madiun-Surabaya-Probolinggo-Banyuwangi-Gilimanuk-Denpasar, sedangkan criterium digelar di lingkaran tertentu. 14.7143 Pemogokan kali ini dilakukan awak mikrobus jurusan Purwokerto-Bumiayu, Purwokerto-Tegal, Purwokerto-Wangon-Cilacap, Purwokerto-Ajibarang-Sidareja, Purwokerto-Banjarpatoman, serta Purwokerto-Sampang-Cilacap. 14.6667 Jalur alternatif Subang-Bantarwaru-Cikamurang-Cijelag-Jatitujuh-Cirebon sepanjang 35 km.
245
Appendix to ind newscrawl 2011: Sentences with high average word length
14.6667 Masyarakat sangat memanfaatkannya,"tuturnya. 14.6667 Saya menikmati pertandingan-pertandingannya. 14.5556 Para pemain yang cocok al:Dadang Sudrajat,Abanda,Wildansyah,Yudi Khoerudin,Isnan,Hariono,Siswanto,Eka,Mildjan,Airlangga dan Shohei. 14.3750 Sedangkan rute yang akan ditempuh, yaitu dari Pontianak-Tayan-Palangkaraya-Buntok-Balikpapan-Banjarmasin-Pontianak. 14.2727 Antara lain, rute Surabaya-Makassar, Surabaya-Bandung, Surabaya-Semarang, Surabaya-Pontianak, Balikpapan-Tarakan, Makassar-Kendari, serta Makassar-Gorontalo. 14.1250 Selanjutnya, kendaraan akan melewati Desa Kalisampurno-Wunut-Pamotan-Kesambi-Juwet Kenongo-Porong-dan Kebonagung. 14.0909 Kemudian wilayah Surakarta terdiri dari jalur Boyolali-Jatinom-Klaten, Sruweng-Andong-Sragen, Klaten-Cawas-Sukoharjo dan Surakarta-Karanganyar-Tawangmangu.
Appendix to ind newscrawl 2012: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
19.2500
Jalur itu meliputi Prambanan-Piyungan-Palbapang-Pandak-Sedayu-Sentolo-Tempel.
17.6250
Rute yang ditempuh yaitu Darwin-Kupang-Alor-Lembata-Maumere-Riung-Labuhan Bajo-Mataram-Makassar-Bali Utara-Karimun Jawa-Kumai-Belitung-Batam.
16.4000
Setelah istirahat di Kendal, rombongan lanjut ke Batang-Pekalongan-Pemalang-Tegal-Brebes-Cirebon-Indramayu-Sukamandi (Subang)-Cikampek-Bekasi-Kalimalang (endpoint).
16.0000
Beberapa di antaranya sepertiArgentina,Australia, Belarusia,Kolombia,Malaysia,Nigeria, danIndia.
15.9000
Bisa juga melalui jalur Tengah (Cikampek-Subang-Cikamurang-Kadipaten-Palimanan) atau jalur Selatan (Cikampek-Padalarang-Cileunyi-Sumedang-Kadipaten-Palimanan).
15.7500
Mungkin memunculkan restrukturisasi-restrukturisasi berikutnya.
15.7500
Untuk Bison diantaranya mempunyai trayek Malang-Kepanjen-Blitar, Malang-Kepanjen-Gunung Kawi, Malang-Kepanjen-Dampit, Malang-Kepanjen-Karangkates, serta Malang-Batu-Pujon-Ngantang-Kasembon.
15.6250
Bagipelajarmahasiswadanpemuda di Indonesia, saatnyabangkituntukmenempadiridenganberbagaiaktivitas yang positif dan prestatif.
15.2500
Rute yang ditempuh yakni Malang-Blitar-Ponorogo-Cemoro Sewu (Magetan)-Karang Anyar-Solo-Boyolali-Salatiga-Semarang-Kendal.
15.1667
Jalan alternatif di jalur selatan yakni Karangsawah-Karangjongkeng-Purwodadi-Langgapura di Cilacap, serta Patimuan-Sidoreja-Jeruklegi-Gumilir-Adipala-Karangbolong-Congot-Batas Jogja.
15.0000
Sedangkan Ubaid melewati rute Sidoarjo-Madiun-Tasikmalaya- Bandung-Riau-Medan-Aceh-Pamulang-Pasar Minggu.
15.0000
Seharusnya, kereta api itu melewati Stasiun Gambringan-Ngrombo-Sedadi-Karangjati-Gubug-Tegowanu-Brumbung.
14.8571
Tiketnya dapat diubah dengan rute baru: Riyadh-Jeddah-Frankfurt-Denhaag-London-Paris-Roma-Jeddah-Riyadh.
14.7500
Road race akan mengambil rute Bandung-Tasik-Purwokerto-Semarang-DIY-Madiun-Surabaya-Probolinggo-Banyuwangi-Gilimanuk-Denpasar, sedangkan criterium digelar di lingkaran tertentu.
14.5000
Bus ini akan melalui rute Ragunan-Cilandak-TB Simatupang-Lebak Bulus-Pondok Indah-Gandaria-Velbak-Pakubuwono-CSW-Ratu Plaza-Senayan-Slipi-Grogol.
246
Appendix to ind newscrawl 2012: Sentences with high average word length
14.4615
Start akan dimulai di Jakarta kemudian menyusuri Bandung-Ciamis-Cirebon-tegal-Semarang-Surakarta-Pacitan-Madiun-Surabaya-Probolinggo-Banyuwangi-Gilimanuk-dan finish di kota Denpasar, Bali.
14.4000
Pengecekan di lapangan dilakukan 15-17 Agustus 2011, jalur pengecekan Jakarta-Cirebon-Pemalang, Jakarta-Merak-Bandar lampung, Jakarta-Cileunyi-Nagrek-Garut-Tasikmalaya, serta Semarang-Yogyakarta-Solo-Madiun-Surabaya.
14.3750
Sedangkan rute yang akan ditempuh, yaitu dari Pontianak-Tayan-Palangkaraya-Buntok-Balikpapan-Banjarmasin-Pontianak.
14.3333
"Perundingan-perundingan masih dilanjutkan.
14.2500
Rute jalur pendakian Semeru, yakni Ranu Pani--Watu Rejeng--Ranu Kumbolo--Oro-Oro Ombo--Cemoro Kandang--Jambangan--Sumbermani--Kalimati--Arcopodo--Cemoro Tunggal--Mahameru.
14.2500
Rute penerbangan dari Surabaya meliputi tujuan Surabaya-Semarang-Pangkalan Bun-Semarang–Bandung-Semarang-Surabaya.
14.0714
Kesembilan rute tersebut adalah Surabaya-Balikpapan, Denpasar-Surabaya, Jakarta-Surabaya, Jakarta-Semarang, Jakarta-Pekanbaru, Jakarta-Yogyakarta, Jakarta-Medan, Jakarta-Padang, serta Jakarta-Solo.
14.0714
Penanganan tersebut merupakan salah satu penanganan jalan lintas timur Sumatera, melintasi Banda Aceh-Sigli-Lhokseumawe-Langsa-Medan-Kisaran-Rantau Prapat-Dumai-Pekanbaru-Jambi-Palembang-Bakauheni.
14.0000
Antara lain jalur Gombong-Buayan, Kuwarasan-Puring, Petanahan-Puring, Guyangan-Petanahan, Tamanwinangun-Buluspesantren, Kutowinangun-Kambalan sampai jalur Gentan-Mirit.
14.0000
Mereka menjalankan kebijakan trilogi pembangunan: pertumbuhan-pemerataan-stabilitas.
Appendix to ind wikipedia 2007: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
17.7143
Jalur kereta api termasuk jurusan Surabaya-Malang-Blitar, Surabaya-Kertosono-Blitar, Surabaya-Bojonegoro-Cepu, Surabaya-Jember-Banyuwangi, Surabaya-Yogyakarta-Purwokerto, Surabaya-Bandung, Surabaya-Yogyakarta-Jakarta, dan Surabaya-Semarang-Jakarta.
14.6667
Sebelumnya, plastik dilobangi/ditusuk-tusuk.
14.6250
Angkutan bis antarkota yang melewati Banjarnegara antara lain adalah jurusan Solo-Bawen-Wonosobo-Purwokerto, Semarang-Bawen-Wonosobo-Purwokerto, Wonosobo-Banjarnegara-Bandung, Wonosobo-Banjarnegara-Banyumas serta Banjarnegara-Jakarta.
14.3333
Kemudian menyusul Yogyakarta-Jakarta-Merak.
13.7000
Kereta api di antaranya jurusan Semarang-Jakarta, Semarang-Bandung, Semarang-Surabaya, Jakarta-Semarang-Jombang, Jakarta-Semarang-Malang.
13.6667
Rekomendasi-rekomendasi ini dilaksanakan.
13.5000
Bentuk negatif むずかしくない(muzukashikunai),tidaklah sulit.
13.3333
Perbedaan kondisi demografi,meliputi jumlah,kepadatan,serta persebaran penduduk.
13.1429
Skrip diciptakan untuk mempersingkat proses tradisional suntingan-kompilasi-tautan-jalankan.
12.7143
Neoliberalisme bertolakbelakang dengan sosialisme, proteksionisme, dan environmentalisme.
12.6000
Kereta api yang melintasi Blitar: Gajayana (Malang-Yogyakarta-Jakarta), Matarmaja (Malang-Semarang-Jakarta), Rapih Dhoho (Blitar-Kertosono-Surabaya), dan Penataran (Blitar-Malang-Surabaya).
12.5000
Abelard juga men-sistematika-kan analisis kontradiksi-kontradiksi filsafat.
247
Appendix to ind wikipedia 2007: Sentences with high average word length
12.5000
Jakarta:Fakultas Kedokteran Universitas Indonesia.
12.5000
Schwarzenegger awalnya berkewarganegaraan Austria.
12.5000
Terhadap penyihir, Hogwarts dilindungi dari "penyihir-yang-tidak-diundang".
12.5000
Trayek yang pertama dibuka adalah Yogyakarta-Kretek, menyusul Yogyakarta-Srandakan, Yogyakarta-Parangtritis, Yogyakarta-Solo.
12.4000
Undang-undang memperbaharui/menghidupkan kembali gedung Senat.
12.3750
Selama revolusi kemerdekaan,sistem pemerintahan berubah menjadi semi-presidensiil/double executive.
12.3000
Terdiri 9 kelurahan yaitu panjang wetan,kandang panjang,kraton lor,dukuh,bandengan,pabean,krapyak lor,krapyak kidul,degayu.
12.3000
Yosefus menyampaikan informasi tentang pribadi-pribadi, kelompok-kelompok, kebiasaan-kebiasaan dan tempat-tempat geografis.
12.2500
Tanggal-tanggal berdasarkan penanggalan Tionghoa.
12.1250
Biasanya ensiklopedia-ensiklopedia ini merupakan ensiklopedia-ensiklopedia remaja atau anak-anak.
12.1250
Terminal ini melayani rute jarak dekat dan menengah antara lain Surabaya-Malang-Blitar, Surabaya-Kediri-Trenggalek, Surabaya-Madiun-Yogyakarta, Surabaya-Semarang, dan Surabaya-Jember-Banyuwangi.
12.0000
Akibatnya, dibangunlah pabrik-pabrik, gereja-gereja dan sekolah-sekolah.
12.0000
Elshinta bekerjasama network/berjaringan/strategic partnership dengan stasiun televisi Indosiar.
Appendix to ind wikipedia 2012: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
18.0000
Galeri ruangan ini Berkas:MuseumSumpahPemuda-10-PartaiNasionalIndonesia.
16.2500
Desa baleraksa di bagi menjadi 7 dusun,yaitu karangwringin,karanggude,karangduren,karangrandu,karangsawah,karangmiri,karangemplak.
15.5714
Terdiri dari beberapa dusun antara lain mrisen,jonggrangan,kalisat,karangmanis,ngadisari,bakungan,dimoro,dll.
15.0000
Jalan penghubung Bondowoso – Situbondo (Bondowoso-Tenggarang-Wonosari-Tapen-Klabang-Prajekan-Widuri); 2).
15.0000
Penduduk Congerville-Thionville disebut sebagai Congervillois-Thionvillois.
14.5000
Michael yang merupakan bagian biara image:Neunkirchen-am-Brand-Christuskirche-Umgebung.
14.2000
Kirchenthumbach adalah anggota Verwaltungsgemeinschaft Kirchenthumbach.
14.2000
Penduduk D'Huison-Longueville disebut sebagai Huisonnais-Longuevillois.
14.0000
Jalan penghubung Bondowoso – Banyuwangi (Bondowoso-Tenggarang Wonosari-Garduatak-Sukosari-Sempol-Paltuding); 3).
14.0000
Pemandangan historis lainnya Berkas:StPeterChartersNOLA.
14.0000
Schlammersdorf adalah anggota Verwaltungsgemeinschaft Kirchenthumbach.
14.0000
Terminal Gadang melayani rute Malang-Lumajang, Malang-Blitar-Tulungagung-Trenggalek.
13.8571
Mulai dari rumah-rumahan,mobil,teman,peliharaan,bahkan terdapat"butik mini"khusus pakaian Barbie.
13.8000
Kirchehrenbach adalah ibukota Verwaltungsgemeinschaft Kirchehrenbach.
13.8000
Kleinwallstadt adalah ibukota Verwaltungsgemeinschaft Kleinwallstadt.
13.6667
B.VII.2009,%2012%20AGUSTUS%20%20%202009.pdf Risalah sidang perkara nomor 108/PHPU.
248
Appendix to ind wikipedia 2012: Sentences with high average word length
13.5000
CMOS juga sering disebut complementary-symmetry metal–oxide–semiconductor or COSMOS (semikonduktor–logam–oksida komplementer-simetris).
13.2000
Oberschweinbach adalah anggota Verwaltungsgemeinschaft Mammendorf.
13.2000
Weilersbach adalah anggota Verwaltungsgemeinschaft Kirchehrenbach.
13.1667
Senden merupakan anggota persatuan transportasi Donau-Iller-Nahverkehrsverbund.
13.0000
Birkenfeld adalah bagian Verwaltungsgemeinschaft Marktheidenfeld.
13.0000
Bischbrunn adalah bagian Verwaltungsgemeinschaft Marktheidenfeld.
13.0000
Kleinheubach adalah ibukota Verwaltungsgemeinschaft Kleinheubach.
13.0000
Naskah Carita Parahiyangan menyebutkan ¬Sri Kadatwan Bima-Punta-Narayana-Madura-Suradipati.
13.0000
Penduduk Courdimanche-sur-Essonne disebut sebagai Courdimanchois.
Appendix to ind web 2011: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
16.0000
Konsultan-seo-indonesia.com Laboratorium bahasa.
13.6667
Perintah-perintah-pun segera disampaikan.
13.6667
Serangan-serangannyapun sangat berbahaya.
13.5000
5) Hukum melakukannya bersama pasangan doa-doa-menguatkan-zakar-dan-tenaga-batin.
13.0000
Penelitian ini menggunakan paradigma interpretatif-fenomenologis.
13.0000
Swandarupun kemudian mengangguk-anggukkan kepalanya.
12.8333
1.Tua-muda,pria-wanita,cantrik-mentrik pasti berbahagia bila memperoleh KAMU.
12.8000
Mengenang perjalanan hidupnya, mengenang perbuatan-pcrbuatannya.
12.7500
Freedownload software,program,games,Antivirus,Music,mp3,Video,Film Darmawan° - Hidup Itu Penuh Cerita.
12.6000
Prajurit-prajuritnya hanya mengangguk-anggukkan kepalanya saja.
12.6000
Tahun Tulisan blog Ngajari com http://www.ngajari.com/tulisan/contoh-susunan-acara-ulang-tahun. Susunan Dewan Redaksi Majalah.
12.5000
Kembali Sutawijaya mengangguk-anggukkan kepalanya.
12.5000
Para pengiringnya, mengangguk-anggukkan kepalanya.
12.5000
Pengawal-pengawalnya hanya mengangguk-angguk saja.
12.3333
Peneliti mengklasifikasikan kelompok/kategori konsepsi, yaitu sebagai berikut: Konsepsi Konservatif-Fatalistik.
12.2500
Kemudian keduanya mengangguk-anggukkan kepalanya.
12.2500
Para pengiringnya mengangguk-anggukkan kepalanya.
12.2500
Perlahan-lahan ia mengangguk-anggukkan kepalanya.
12.2500
Segala-galanya berjalan sebagaimana direncanakan.
12.2000
Penghubung-penghubung itu pun mengangguk-anggukkan kepalanya.
249
Appendix to ind web 2011: Sentences with high average word length
12.1667
Ketidaksanggupannya mengatasi tantangan diidentikkan dengan kelemahannya.
12.1667
Pertimbangan-pertimbangannya sudah tidak dapat mempengaruhi kemarahannya.
12.1429
Ceritanya(pendeknya) begini,Dibyo(dimainkan oleh Ringo) sebagai seorang pengangguran.
12.0000
Dengan panel LED yang sudahbebaszatberacunyaitumerkuri (Hg) sehinggaramahlingkungan.
12.0000
Fakultas Kedokteran Universitas Diponegoro,1983.
Appendix to ind web 2012: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
47.7500 Alasan kami mengambilkeputusantersebutkarenaselainmalangmerupakansalahsatukotabesarjawatimur, malangjugaterkenalsebagaikotapelajardanpariwisatasehinggakotamalangsangatpotensialuntukusaha café. 31.2500 Denganadanya system informasiyang dapatdiaksesolehpetugas-petugassertapemerintah yang bertanggubgjawabterhadiniapketahananmiliterdapatdengancepatmemberikankeputusansertamemberikaninformasikesemuapihak agar semualinidapatbersatudalammenghadapiancaman. 31.0000 Padaatomisasidengannyala, kebanyakansampelcairdapatdisemprotkanlangsungkedalamnyalastelahdiencerkandenganpelarut yang cocok. 30.5000 Penguatandengancaramendekatiinidapatdilakukantatkalapesertadidikmenjawapertanyaan, bertanya, diskusi, atauaktivitaslainya. 29.3333 Apa punya turrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr. 29.0000 Jalur yang dilalui adalah Pasteur-Cimahi-Padalarang-Cianjur-Cipanas-Puncak-Tajur-Bogor-Leuwiliang-Jasinga-Kopo-Maja-Cisoka-Cikande-Ciruas-Serang. 28.6667 Tahunlaludalamkesempatanyangsama,diajugasempat mencoba menyerang Paus sebelumaksinyadigagalkanpetugas Kemarin,MaiolotampakmeloncatmelewatipagarpembatassebelummendorongPaus. 28.3333 Jika dibandingkan denganHsistemGpemantulankgelombangklangit,kperbedaannyahcukuphjauh. 28.1250 Dengankenyamanandankecepatan yang dimilikiolehjasatransportasiudara, jasatransportasilautdandarat pun mulaidikesampingkankarenaselainlebihmemakanwaktujugatidakmemilikikenyamanansenyaman yang dimilikiolehjasatransportasiudara. 26.1667 "Jalur Megamendoeng tersebut terletak antara Seuseupan-Gadok-Pasirangin-Tjikopo-Tjisaroea-Tjimatjan-Sindanglaja-Tjipanas-Patjet-Tjiherang-Babakan-Tjiandjoer. 26.0000 Potrait,Feature,Profile,Biografi,Sejarah,Diary,Discovery,Rekonstruksi,Instruksional,Perjalanan adalah jenis-jenis film documenter. 25.8333 Angka-angkapertumbuhanpasarpenerbangandomestikiniterungkapdalamriset Marketing Research Indonesia (MRI) bertajukKonsumendanPasarJasaPenerbanganDalamNegeri. 25.8333 Supra strukturpolitikdisiniadalahsegalasesuatuyang bersangkutandenganapayang disebutalat–alatperlengkapannegaratermasuksegalahalyang berhubungan dengannya. 25.7143 BolaKOMPAS.comCetakePaperKompas TVEntertainmentTeknoOtomotifFemaleHealthPropertiKompasianaUrban SerpongImagesMore GamesKompasKarierPasangIklanGramediaShopForum "Saya sudah mencoba. 25.4000 Dari Timur : Palur-Sekatrpace-Panggung-Gladak-PGS/BTC-Kapten Mulyadi-Baturono-Gading-Tipes-Baron-Gendengan-Purwosari-Kartosuro. 24.8889 Semuabisadiangkatmenjadisejarahbaikatauburuknya yang bisamenggemparkanmasyarakatkitasepertikasusGayus yang menggemparkanpihakkepolisiandankasustersebutbisadibilangmenjadisejarahbangsa Indonesia karenaulahnya yang tidakbiasa. 24.7500 Khususnyateknologiinformasidankomunikasi yang seharusnyasangatberperanbagikeutuhanbangsa Indonesia.
250
Appendix to ind web 2012: Sentences with high average word length
24.1111 Susilo Bambang Yudoyono atau SBY mengunjungi tempat gempa Presiden%20SBY%20menijau%20proses%20evakuasi %20yang%20dilakukan%20oleh%20para%20relawan%20yang%20terdiri%20dari%20TNI,%20Polri, %20Tim%20SAR%20dan%20masyarakat. 23.1250 FemaleKOMPAS.comCetakePaperKompas TVBolaEntertainmentTeknoOtomotifHealthPropertiKompasianaUrban SerpongImagesMore GamesKompasKarierPasangIklanGramediaShopForum Sedang mencari nama bayi? 23.0000 Untuk jalur Utara melalui Jakarta-Cirebon-Tegal-Pemalang-Pekalongan-Semarang-Kudus-Rembang-Tuban-Lamongan-Surabaya. 22.0000 Namun di Indonesia penggunaanteknologiinformasidankomunikasiuntukgeostrategimasihkurang. 21.6667 FemaleKOMPAS.comCetakePaperKompas TVBolaEntertainmentTeknoOtomotifHealthPropertiKompasianaUrban SerpongImagesMore GamesKompasKarierPasangIklanGramediaShopForum Cemburu bisa memicu emosi pasangan. 21.6000 Delegasi2 yg hadir dari Amerika,Afrika,Indonesia,filipina,Nepal,Bangladesh,Indi,Pakistan,Australia,Malaysia. 21.5000 Apakah dalam hal keimanan,kesehatan,kepintaran,kerajinan,kekayaan,kenekatan,ketakutan. 21.5000 Daerah kekuasaannya mencakup Thailand,siam,Burma,Malaysia,madagaskar(Nagarakertagama).
Appendix to ind mixed 2012: Sentences with high average word length 25 sentences with highest average word length avg. word length
sentence
47.7500 Alasan kami mengambilkeputusantersebutkarenaselainmalangmerupakansalahsatukotabesarjawatimur, malangjugaterkenalsebagaikotapelajardanpariwisatasehinggakotamalangsangatpotensialuntukusaha café. 31.2500 Denganadanya system informasiyang dapatdiaksesolehpetugas-petugassertapemerintah yang bertanggubgjawabterhadiniapketahananmiliterdapatdengancepatmemberikankeputusansertamemberikaninformasikesemuapihak agar semualinidapatbersatudalammenghadapiancaman. 31.0000 Padaatomisasidengannyala, kebanyakansampelcairdapatdisemprotkanlangsungkedalamnyalastelahdiencerkandenganpelarut yang cocok. 30.5000 Penguatandengancaramendekatiinidapatdilakukantatkalapesertadidikmenjawapertanyaan, bertanya, diskusi, atauaktivitaslainya. 29.3333 Apa punya turrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr. 29.0000 Jalur yang dilalui adalah Pasteur-Cimahi-Padalarang-Cianjur-Cipanas-Puncak-Tajur-Bogor-Leuwiliang-Jasinga-Kopo-Maja-Cisoka-Cikande-Ciruas-Serang. 28.6667 Tahunlaludalamkesempatanyangsama,diajugasempat mencoba menyerang Paus sebelumaksinyadigagalkanpetugas Kemarin,MaiolotampakmeloncatmelewatipagarpembatassebelummendorongPaus. 28.3333 Jika dibandingkan denganHsistemGpemantulankgelombangklangit,kperbedaannyahcukuphjauh. 28.1250 Dengankenyamanandankecepatan yang dimilikiolehjasatransportasiudara, jasatransportasilautdandarat pun mulaidikesampingkankarenaselainlebihmemakanwaktujugatidakmemilikikenyamanansenyaman yang dimilikiolehjasatransportasiudara. 26.1667 "Jalur Megamendoeng tersebut terletak antara Seuseupan-Gadok-Pasirangin-Tjikopo-Tjisaroea-Tjimatjan-Sindanglaja-Tjipanas-Patjet-Tjiherang-Babakan-Tjiandjoer. 26.0000 Potrait,Feature,Profile,Biografi,Sejarah,Diary,Discovery,Rekonstruksi,Instruksional,Perjalanan adalah jenis-jenis film documenter. 25.8333 Angka-angkapertumbuhanpasarpenerbangandomestikiniterungkapdalamriset Marketing Research Indonesia (MRI) bertajukKonsumendanPasarJasaPenerbanganDalamNegeri. 25.8333 Supra strukturpolitikdisiniadalahsegalasesuatuyang bersangkutandenganapayang disebutalat–alatperlengkapannegaratermasuksegalahalyang berhubungan dengannya.
251
Appendix to ind mixed 2012: Sentences with high average word length
252
25.7143 BolaKOMPAS.comCetakePaperKompas TVEntertainmentTeknoOtomotifFemaleHealthPropertiKompasianaUrban SerpongImagesMore GamesKompasKarierPasangIklanGramediaShopForum "Saya sudah mencoba. 25.4000 Dari Timur : Palur-Sekatrpace-Panggung-Gladak-PGS/BTC-Kapten Mulyadi-Baturono-Gading-Tipes-Baron-Gendengan-Purwosari-Kartosuro. 24.8889 Semuabisadiangkatmenjadisejarahbaikatauburuknya yang bisamenggemparkanmasyarakatkitasepertikasusGayus yang menggemparkanpihakkepolisiandankasustersebutbisadibilangmenjadisejarahbangsa Indonesia karenaulahnya yang tidakbiasa. 24.7500 Khususnyateknologiinformasidankomunikasi yang seharusnyasangatberperanbagikeutuhanbangsa Indonesia. 24.5556 Rombongan melewati jalur Surabaya-Gresik-Lamongan-Tuban-Rembang-Pati-Kudus-Demak-Semarang-Kendal-BatangPekalongan-Pemalang-Tegal-Brebes-Cirebon-Indramayu-Subang-Karawang-Bekasi-Jakarta Timur-Kantor PBNU di Jakarta Pusat. 24.1111 Susilo Bambang Yudoyono atau SBY mengunjungi tempat gempa Presiden%20SBY%20menijau%20proses%20evakuasi %20yang%20dilakukan%20oleh%20para%20relawan%20yang%20terdiri%20dari%20TNI, %20Polri,%20Tim%20SAR%20dan%20masyarakat. 23.1250 FemaleKOMPAS.comCetakePaperKompas TVBolaEntertainmentTeknoOtomotifHealthPropertiKompasianaUrban SerpongImagesMore GamesKompasKarierPasangIklanGramediaShopForum Sedang mencari nama bayi? 23.0000 Untuk jalur Utara melalui Jakarta-Cirebon-Tegal-Pemalang-Pekalongan-Semarang-Kudus-Rembang-Tuban-Lamongan-Surabaya. 22.0000 Namun di Indonesia penggunaanteknologiinformasidankomunikasiuntukgeostrategimasihkurang. 21.6667 FemaleKOMPAS.comCetakePaperKompas TVBolaEntertainmentTeknoOtomotifHealthPropertiKompasianaUrban SerpongImagesMore GamesKompasKarierPasangIklanGramediaShopForum Cemburu bisa memicu emosi pasangan. 21.6000 Delegasi2 yg hadir dari Amerika,Afrika,Indonesia,filipina,Nepal,Bangladesh,Indi,Pakistan,Australia,Malaysia. 21.5000 Apakah dalam hal keimanan,kesehatan,kepintaran,kerajinan,kekayaan,kenekatan,ketakutan.
Appendix to ind news 2007: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word United
ManUnited
118
37
Appendix to ind news 2008: Problems with sentence segmentation - words ending in a stopword
Appendix to ind news 2008: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word Jakarta
TransJakarta
13104
12
Appendix to ind news 2009: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word Jakarta
TransJakarta
12025
14
Jakarta
Rekotomo)Jakarta
12025
7
Jakarta
Wahyu)Jakarta
12025
4
Jakarta
Pertamina)Jakarta
12025
3
253
Appendix to ind news 2010: Problems with sentence segmentation - words ending in a stopword
Appendix to ind news 2010: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word Jakarta
TransJakarta
15665
14
Jakarta
Rekotomo)Jakarta
15665
10
Jakarta
Panggabean)Jakarta
15665
8
Bank
PaninBank
5475
6
Jakarta
ANTARA)Jakarta
15665
5
Jakarta
Khumaini)Jakarta
15665
4
Kabupaten Mutiara,Kabupaten
6560
4
Jakarta
Budhiana)Jakarta
15665
3
Jakarta
Wahyu)Jakarta
15665
3
Dia
dia.Dia
6336
3
Jakarta
ist)Jakarta
15665
3
254
Appendix to ind news 2011: Problems with sentence segmentation - words ending in a stopword
Appendix to ind news 2011: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word Jakarta
TransJakarta
12914
15
Jakarta
AriwibowoJakarta
12914
6
Kami
mengatakan,"Kami
9188
4
Appendix to ind news 2012: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word Jakarta
TransJakarta
26618
53
News
ANTARANews
15197
37
Jakarta
MonalisaJakarta
26618
36
News
AntaraNews
15197
27
Jakarta
AriwibowoJakarta
26618
21
Jakarta
MarboenJakarta
26618
15
Jakarta
PutriJakarta
26618
13
Jakarta
Iskan*Jakarta
26618
11
Jakarta
AndarningtyasJakarta 26618
8
Jakarta
LodraJakarta
26618
8
Jakarta
YuliansariJakarta
26618
8
Kami
mengatakan,"Kami
11486
7
Saya
mengatakan,"Saya
9632
6
Jakarta
FardaniahJakarta
26618
5
Jakarta
SunyotoJakarta
26618
5
Jakarta
SyafputriJakarta
26618
5
Jakarta
SantosoJakarta
26618
4
Jakarta
SofiaJakarta
26618
4
255
Appendix to ind news 2012: Problems with sentence segmentation - words ending in a stopword
Jakarta
WijayaJakarta
26618
4
Jakarta
DewantoJakarta
26618
3
Appendix to ind newscrawl 2011: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword
Concatenated word
Frequency of stopword Frequency of concatenated word
Jakarta
TransJakarta
136824
412
Ketua
Jakarta–Ketua
97286
73
Presiden
Jakarta–Presiden
58400
68
Presiden
LampostOnline):Presiden 58400
30
Saya
mengatakan,"Saya
84527
26
Presiden
ID,Presiden
58400
25
Ketua
LampostOnline):Ketua
97286
22
Rp
juta–Rp
158783
19
Indonesia
Jakarta–Indonesia
213544
18
Ketua
JAKARTA—Ketua
97286
15
Ketua
Espos)–Ketua
97286
14
Jakarta
Interaktif,Jakarta
136824
13
Kepala
Jakarta–Kepala
57724
12
Presiden
Jakarta—Presiden
58400
11
Kota
WaliKota
93151
11
Kepala
ID,Kepala
57724
10
Ketua
Jakarta—Ketua
97286
10
Indonesia
d’Indonesia
213544
10
Kepala
Espos)–Kepala
57724
9
Jakarta
ID,Jakarta
136824
9
256
Appendix to ind newscrawl 2012: Problems with sentence segmentation - words ending in a stopword
Appendix to ind newscrawl 2012: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword
Concatenated word
Frequency of stopword Frequency of concatenated word
Jakarta
TransJakarta
164145
167
Presiden
JAKARTA:Presiden
78625
117
Saya
mengatakan,"Saya
85678
20
Presiden
JAKARTA—Presiden
78625
17
Ketua
JAKARTA–Ketua
99888
12
Ketua
JAKARTA—Ketua
99888
12
Indonesia
KlikIndonesia
310807
12
Kota
WaliKota
89319
11
Untuk
JAKARTA—Untuk
74507
9
Saya
Pertanyaan:Saya
85678
9
Kami
mengatakan,"Kami
78330
8
Presiden
JAKARTA–Presiden
78625
7
Ketua
Karya):Ketua
99888
6
Saya
alaikumSaya
85678
6
Saya
menambahkan,"Saya
85678
6
Di
JAKARTA–Di
100102
5
Untuk
JAKARTA–Untuk
74507
5
Dalam
JAKARTA—Dalam
89908
5
Indonesia
JAKARTA—Indonesia 310807
5
Ketua
BANTUL—Ketua
4
99888
257
Appendix to ind wikipedia 2007: Problems with sentence segmentation - words ending in a stopword
Appendix to ind wikipedia 2007: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word Jakarta
TransJakarta
2996
25
Appendix to ind wikipedia 2012: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word The
Disney:The
5417
3
258
Appendix to ind web 2011: Problems with sentence segmentation - words ending in a stopword
Appendix to ind web 2011: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word On
BlankOn
7535
21
Putih
AirPutih
9974
10
Putih
GlagahPutih
9974
6
Sedayu
AgungSedayu
15641
5
Indonesia
�Indonesia
14514
3
Appendix to ind web 2012: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word Allah
InsyaAllah
430086
1962
Allah
insyaAllah
430086
1219
Allah
MasyaAllah
430086
106
Indonesia
KabarIndonesia
479195
81
Tuhan
berTuhan
239734
70
Allah
Insya’Allah
430086
48
Allah
InshaAllah
430086
47
Allah
kepadaAllah
430086
43
Islam
berIslam
310232
40
Saya
berkata,”Saya
285390
33
Dia
dia.Dia
182170
32
Allah
inshaAllah
430086
32
Saya
wrote:Saya
285390
31
Saya
berkata,"Saya
285390
30
Allah
insyAllah
430086
30
Allah
masyaAllah
430086
29
259
Appendix to ind web 2012: Problems with sentence segmentation - words ending in a stopword
Indonesia
bangsaIndonesia
479195
28
Islam
umatIslam
310232
28
Allah
insya’Allah
430086
26
Allah
RasulAllah
430086
24
Appendix to ind mixed 2012: Problems with sentence segmentation - words ending in a stopword Most frequent words ending in a stopword. They usually contain uppercase letters as result form missing blanks. Stopword Concatenated word Frequency of stopword Frequency of concatenated word Allah
InsyaAllah
442410
2003
Allah
insyaAllah
442410
1241
Jakarta
TransJakarta
319937
667
Allah
MasyaAllah
442410
108
Indonesia
KabarIndonesia
802457
81
Tuhan
berTuhan
249540
72
Allah
Insya’Allah
442410
49
Allah
InshaAllah
442410
47
Allah
kepadaAllah
442410
43
Jakarta
COM,Jakarta
319937
40
Islam
berIslam
344680
40
Saya
berkata,”Saya
400470
37
Dia
dia.Dia
262354
35
Saya
berkata,"Saya
400470
33
Saya
mengatakan,"Saya
400470
33
Allah
inshaAllah
442410
32
Rp
juta–Rp
270987
31
Saya
wrote:Saya
400470
31
Allah
insyAllah
442410
30
Allah
masyaAllah
442410
30
260