1 ARTIKEL SEJARAH MARKUP LANGUAGE Disusun Untuk Memenuhi Tugas Mata Kuliah Sekuriti Komputer Disusun oleh : NAMA : FAUZAN BEKTI NUGOHO NIM : Dosen Pen...
ARTIKEL SEJARAH MARKUP LANGUAGE Disusun Untuk Memenuhi Tugas Mata Kuliah Sekuriti Komputer
Disusun oleh : NAMA
: FAUZAN BEKTI NUGOHO
NIM
: 3085113013
Dosen Pengampu : IKRIMACH, S.Kom
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS TEKNOLOGI YOGYAKARTA 2010
SEJARAH MARKUP LANGUAGE
Istilah markup berasal dari praktek penerbitan tradisional "menandai" 'sebuah naskah, yang melibatkan tulisan tangan menambahkan penjelasan dalam bentuk simbolis konvensional printer' s petunjuk dalam marjin dan teks pada kertas naskah atau dicetak bukti. Selama berabad-abad, tugas ini dilakukan terutama oleh typographers terampil yang dikenal sebagai "markup laki-laki" atau "salinan spidol" yang mark up teks untuk menunjukkan apa jenis huruf, gaya, dan ukuran harus diterapkan untuk setiap bagian, dan kemudian melewati naskah kepada orang lain untuk penyusunan huruf dengan tangan. Markup juga sering diterapkan oleh editor, proofreader, penerbit, dan desainer grafis, dan memang oleh penulis dokumen. Sebuah bahasa markup adalah suatu sistem untuk annotating teks dengan cara yang sintaksis dibedakan dari teks. Contohnya termasuk instruksi revisi oleh editor, yang biasanya ditulis dengan pensil biru pada penulis naskah, typesetting instruksi seperti yang ditemukan dalam troff dan LaTeX, dan penanda struktural seperti XML tag. Markup biasanya dihilangkan dari versi dari teks yang ditampilkan untuk pengguna akhir konsumsi. Beberapa bahasa markup, seperti HTML memiliki presentasi semantik, yang berarti spesifikasi mereka menentukan bagaimana data terstruktur yang akan disajikan, tapi bahasa markup lainnya, seperti XML, tidak memiliki standar semantik. Sebuah contoh terkenal dari sebuah bahasa markup yang digunakan secara luas saat ini adalah HyperText Markup Language (HTML), salah satu format dokumen di World Wide Web. HTML adalah contoh sebagian besar dari SGML (meski, keras, tidak mematuhi semua aturan SGML) dan mengikuti banyak konvensi markup yang digunakan dalam industri penerbitan dalam pekerjaan cetakan komunikasi antara penulis, editor, dan printer.Markup Language adalah jenis coding atau “tag” yang disisipkan kedalam teks yang memuat tentang detail dan struktur teks. Tag adalah kode dalam dokumen HTML yang dibaca oleh browser lalu menterjemahkannya untuk memberikan tampilan pada pengguna.Bahasa markup memiliki kode untuk menunjukan tata letak dan styling (seperti cetak tebal, cetak miring, paragraf, penyisipan grafis, dan sebagainya) dalam suatu file teks- misalnya HTML. Nama “markup” diambil dari praktik penerbitan tradisional yaitu “marking up” suatu manuskrip, yakni menambahkan instruksi printer printer pada marjin-marjin suatu manuskrip. Bahasa markah (markup language) mengkombinasikan teks dan informasi tambahan mengenai teks tersebut. Informasi ekstra tersebut, contohnya mengenai struktur dan presentasi teks, diekspresikan menggunakan markah, yang bercampur dengan teks utama. Bahasa
markah utama yang dikenal dalam penggunaan modern adalah HTML (HyperText Markup Language), salah satu pondasi World Wide Web. Awalnya, bahasa markah digunakan dalam industri penerbitan untuk komunikasi karya cetak antara pengarang, editor, dan pencetak. Hypertext Markup Language (HTML) adalah bahasa yang digunakan untuk menulis halaman web. HTML merupakan pengembangan dari standar pemformatan dokumen teks yaitu Standard Generalized Markup Language (SGML). HTML sebenarnya adalah dokumen ASCII atau teks biasa, yang dirancang untuk tidak tergantung pada suatu sistem operasi tertentu. HTML dibuat oleh Tim Berners-Lee ketika masih bekerja untuk CERN dan dipopulerkan pertama kali oleh browser Mosaic. Selama awal tahun 1990 HTML mengalami perkembangan yang sangat pesat. Setiap pengembangan HTML pasti akan menambahkan kemampuan dan fasilitas yang lebih baik dari versi sebelumnya. Namun perkembangan resmi dikeluarkan pada bulan November 1995 oleh IETF (Internet Engineering Task Force). HTML 2.0 ini merupakan penyempurnaan dari HTML+ (1993). HTML 3.0 (1995) memberikan kemampuan lebih daripada versi sebelumnya. Sebuah usaha dari World Wide Web Consortium’s (W3C) HTML Working Group pada tahun 1996 menghasilkan HTML 3.2. HTML versi ini secara resmi diterbitkan pada bulan Januari 1997. HTML versi terbaru adalah HTML 4.01 yang dikeluarkan secara resmi oleh W3C pada tanggal 24 April 1998. HTML merupakan perbaikan dari HTML 4.0 yang lebih dulu diterbitkan. (18 Desember 1997). Mendesain HTML berarti melakukan suatu tindakan pemrograman. Namun HTML bukanlah sebuah bahasa pemrograman. Namun HTML hanyalah berisi perintah-perintah yang telah terstruktur berupa tag-tag penyusun. Menuliskan tag-tag HTML tidaklah sebatas hanya memasukkan perintah-perintah tertentu agar HTML kita dapat di akses oleh browser. Mendesain HTML adalah adalah sebuah seni tersendiri. Homepage yang merupakan implementasi dari HTML adalah refleksi dari orang yang membuatnya. Untuk itu kita perlu mendesainnya dengan baik agar para pengunjung homepage yang kita buat merasa senang dan bermanfaat. Mendesain HTML dapat dilakukan dengan dua cara: Menggunakan HTML Editor, seperti Microsoft FrontPage, Adobe Dreamweaver, dan lain-lain. Dapatkan editor HTML lainnya disini. Dan dengan cara menuliskan sendiri secara manual satu persatu tag-tag HTML ke dalam dokumen HTML. Ada kelebihan dan kekurangan dari dua cara di atas. Cara pertama kelebihannya adalah HTML Editor merupakan sebuah program yang khusus didesain untuk membuat, melakukan editing bahkan mem-publish ke internet. Dengan kemampuannya menggabungkan
kemudahan dan kecanggihan teknologi internet ke dalam dokumen HTML maka cara ini sangat disukai oleh para pemula dan desainer yang tidak ingin belajar lebih mendalam mengenai HTML. Sedangkan cara kedua adalah menuliskan secara manual satu persatu tagtag HTML. Hal ini sangat disarakan sulit dikarenakan akan memakan tenaga dan waktu ekstra untuk melakukannya, ditambah lagi Anda harus melakukan cara-cara konvensional untuk melihat hasilnya pada web browser. Namun pada cara kedua adalah dasar dari segala bentuk HTML yang akan Anda pelajari, karena dengan cara itulah Anda akan lebih paham mengenai cara kerja dan berbagai perintah yang biasa dipakai pada bahasa HTML. Beberapa contoh awal bahasa markup yang tersedia diluar industri penerbitan dapat ditemukan pada piranti typesetting sistem Unix. Dalam sistem tersebut perintah pemformatan disisipkan ke dalam dokumen teks sehingga perangkat lunak typesetting bisa memformat teks berdasarkan keinginan editor. setelah beberapa saat terlihat bahwa kebanyakan bahasa markup memiliki fitur yang umum. inilah yang kemudian memndorong diciptakannya SGML (Standard Generalized Markup Languange), yang menentukan sintaks untuk memasukan markup pada dokumen. Selain SGML, diciptakan juga sistem lain (disebut metabahasa) untuk secara terpisah menjabarkan apa artinya markup. Dengan demikian penulis dapat menciptakan dan menggunakan sebarang markup yang mereka inginkan-memilih tag yang paling sesuai untuk mereka. SGML dikembangkan dan distandarisasi oleh International Standards Organization (ISO) pada tahun 1986.
Jenis-jenis markup elektronik
Ada tiga kategori umum elektronik markup: presentasional, prosedural, dan deskriptif. Presentasional markup yang digunakan oleh tradisional sistem pengolah kata, kode biner tertanam dalam dokumen teks yang menghasilkan WYSIWYG efek. Markup seperti biasanya didesain untuk disembunyikan dari pengguna manusia, bahkan mereka yang penulis atau editor. Prosedural markup tertanam di dalam teks dan memberikan instruksi untuk program yang memproses teks. Contoh terkenal termasuk troff, LaTeX, dan PostScript; diharapkan bahwa prosesor berjalan melalui teks dari awal sampai akhir, mengikuti petunjuk sebagai dijumpai. Teks dengan markup seperti itu sering diedit dengan markup langsung terlihat dan dimanipulasi oleh penulis. Prosedural-markup populer biasanya mencakup pemrograman sistem konstruksi, sehingga makro atau subrutin dapat didefinisikan dan dipanggil dengan
nama. Contoh deskriptif markup akan menjadi troff's. Bd, yang memerintahkan prosesor untuk beralih ke wajah yang berani-font. Dalam Deskriptif markup, markup yang digunakan untuk label bagian dokumen daripada untuk memberikan petunjuk khusus tentang bagaimana mereka harus diproses. Tujuannya adalah untuk decouple struktur yang melekat dokumen dari pengobatan tertentu atau penampakan itu. Markup seperti sering digambarkan sebagai "semantik". Contoh deskriptif markup akan's tag HTML, yang digunakan untuk label kutipan.
Ada banyak kabur dari garis antara jenis markup. Dalam pengolah kata modern sistem, presentasional markup sering disimpan dalam deskriptif-markup-sistem yang berorientasi seperti XML, dan kemudian diproses secara prosedural oleh implementasi. Konstruksi pemrograman di deskriptif-sistem markup seperti TeX dapat digunakan untuk membuat markup yang lebih tinggi tingkat sistem yang lebih deskriptif, seperti LaTeX. Dalam beberapa tahun terakhir, sejumlah kecil dan sebagian besar bahasa markup unstandardized telah dikembangkan untuk memungkinkan penulis untuk membuat teks diformat melalui web browser, untuk digunakan di wiki dan web forum. Bahasa markup yang digunakan oleh Wikipedia adalah salah satu.
GenCode Ide menggunakan bahasa markup dalam pengolahan teks komputer mungkin publik pertama yang diajukan oleh eksekutif penerbitan William W. Tunnicliffe di sebuah konferensi pada tahun 1967, meskipun ia lebih suka menyebutnya "generik pengkodean." Hal ini dapat dilihat sebagai respon terhadap munculnya program-program seperti limpasan bahwa masingmasing menggunakan notasi kendali mereka sendiri, sering kali target khusus untuk perangkat typesetting. Pada 1970-an, memimpin pengembangan Tunnicliffe suatu standar yang disebut GenCode bagi industri penerbitan dan kemudian adalah ketua pertama International Organization for Standardization komite yang menciptakan SGML, yang pertama deskriptif bahasa markup standar. Buku yang diterbitkan Beras desainer Stanley spekulasi sepanjang garis yang sama pada tahun 1970. [5] Brian Reid, dalam disertasinya 1980 di Carnegie Mellon University, mengembangkan teori dan pelaksanaan kerja deskriptif markup dalam penggunaan sebenarnya. Namun, IBM peneliti Charles Goldfarb lebih sering dilihat hari ini sebagai "bapak" dari bahasa markup. Goldfarb memukul pada ide dasar, sementara bekerja pada sebuah sistem manajemen dokumen primitif ditujukan untuk firma hukum pada tahun 1969, dan membantu
menciptakan IBM GML kemudian pada tahun yang sama. GML publik pertama kali diungkapkan pada tahun 1973. Pada tahun 1975, Goldfarb pindah dari Cambridge, Massachusetts untuk Silicon Valley dan menjadi perencana produk di IBM Almaden Research Center. Di sana, dia yakin eksekutif IBM untuk menggunakan GML komersial pada tahun 1978 sebagai bagian dari Dokumen IBM Fasilitas Komposisi produk, dan secara luas digunakan dalam bisnis dalam beberapa tahun. Pembangunan secara informal mulai pada tahun 1978 [rujukan?] Pada apa yang akhirnya menjadi standar SGML, yang didasarkan pada kedua GML dan GenCode; Goldfarb akhirnya menjadi ketua komite SGML. SGML pertama kali dan dirilis oleh ISO sebagai standar ISO 8.879 pada Oktober 1986. Beberapa contoh-contoh awal bahasa markup komputer tersedia di luar industri penerbitan dapat ditemukan dalam tool typesetting pada Unix sistem seperti troff dan nroff. Dalam sistem ini, format perintah yang dimasukkan ke dalam teks dokumen sehingga perangkat lunak typesetting bisa memformat teks editor sesuai dengan spesifikasi. Itu adalah trial and error proses berulang-ulang untuk mendapatkan dokumen dicetak dengan benar. [Rujukan?] Ketersediaan WYSIWYG ( "apa yang Anda lihat adalah apa yang Anda dapatkan") digantikan perangkat lunak penerbitan banyak menggunakan bahasa tersebut di kalangan pengguna biasa, meskipun masih serius kerja penerbitan menggunakan markup untuk menentukan struktur non-visual teks, dan sekarang editor WYSIWYG biasanya menyimpan dokumen dalam bahasa markup berbasis format.
TeX Standar penerbitan besar lain adalah TeX, diciptakan dan terus disempurnakan oleh Donald Knuth pada 1970-an dan '80-an. TeX berkonsentrasi pada tata letak rinci teks dan font deskripsi untuk mengeset buku matematika dalam kualitas profesional. Hal ini diperlukan Knuth untuk menghabiskan banyak waktu menyelidiki seni penyusunan huruf. Namun, TeX memiliki kurva belajar yang curam, sehingga sebagian besar digunakan di dunia akademis, di mana itu adalah standar de facto dalam banyak disiplin ilmu. Sebuah TeX dikenal sebagai paket makro LaTeX menyediakan sistem markup deskriptif di atas TeX, dan secara luas digunakan. LaTeX adalah bahasa markup dokumen dan penyiapan dokumen sistem untuk TeX typesetting program. Dalam sistem typesetting, namanya bergaya sebagai .
LaTeX adalah yang paling banyak digunakan oleh ahli matematika, ilmuwan, insinyur, filsuf, ekonom dan para sarjana lainnya di dunia akademis dan dunia komersial, dan profesional lain. Sebagai perantara utama atau format (misalnya menerjemahkan DocBook dan XML-based format ke PDF), LaTeX digunakan karena kualitas tinggi typesetting dicapai oleh TeX. Yang sistem typesetting diprogram menawarkan desktop publishing fitur dan fasilitas yang luas untuk mengotomatisasi sebagian besar aspek typesetting dan desktop publishing, termasuk penomoran dan lintas-referensi, tabel dan gambar, tata letak halaman dan bibliografi. LaTeX ini dimaksudkan untuk memberikan tingkat tinggi bahasa yang mengakses kekuatan TeX. LaTeX pada dasarnya terdiri dari koleksi TeX macros dan program untuk memproses dokumen LaTeX. Karena perintah format TeX sangat rendah tingkat, biasanya jauh lebih sederhana bagi end-user untuk menggunakan LaTeX. LaTeX pada awalnya ditulis pada awal tahun 1980-an oleh Leslie Lamport di SRI International. Hal ini telah menjadi metode dominan untuk menggunakan TeX-relatif sedikit orang menulis di dataran TeX lagi. Versi terakhir adalah LaTeX2e . Istilah LaTeX hanya mengacu pada bahasa dalam dokumen yang ditulis, bukan kepada editor yang digunakan untuk menulis dokumen-dokumen. Dalam rangka untuk menciptakan sebuah dokumen LaTeX, sebuah. Tex file harus dibuat dengan menggunakan beberapa bentuk dari editor teks. Sementara kebanyakan editor teks dapat digunakan untuk membuat dokumen LaTeX, sejumlah editor telah diciptakan khusus untuk bekerja dengan LaTeX.
Scribe, GML dan SGML Bahasa pertama untuk membuat dan bersih yang jelas perbedaan antara struktur dan presentasi Scribe, yang dikembangkan oleh Brian Reid dan dijelaskan dalam tesis doktoralnya pada tahun 1980. Scribe adalah revolusioner dalam berbagai cara, paling tidak itu memperkenalkan ide gaya dipisahkan dari dokumen mark up, dan dari suatu tata bahasa mengendalikan penggunaan elemen deskriptif. Scribe mempengaruhi perkembangan Generalized Markup Language (kemudian SGML) dan merupakan nenek moyang langsung ke HTML dan LaTeX. Pada awal 1980, gagasan bahwa markup harus difokuskan pada aspek-aspek struktural dan meninggalkan sebuah dokumen presentasi visual struktur itu penafsir mengarah pada penciptaan SGML. Bahasa ini dikembangkan oleh sebuah komite yang diketuai oleh Goldfarb. Itu ide digabungkan dari berbagai sumber, termasuk proyek Tunnicliffe, GenCode. Sharon Adler, Anders Berglund, dan James A. Marke juga kunci SGML anggota komite.
SGML ditentukan sintaks untuk termasuk markup dalam dokumen, serta satu untuk menggambarkan secara terpisah tag apa yang diperbolehkan, dan di mana (Dokumen Type Definition (DTD) atau skema). Hal ini memungkinkan penulis untuk membuat dan menggunakan markup yang mereka inginkan, memilih tag yang membuat paling masuk akal bagi mereka dan diberi nama dalam bahasa alamiah mereka sendiri. Dengan demikian, SGML benar suatu meta-bahasa, dan banyak bahasa markup tertentu berasal dari itu. Dari akhir '80an, sebagian besar bahasa markup baru substansial telah didasarkan pada sistem SGML, termasuk misalnya TEI dan DocBook. SGML diresmikan sebagai Standar Internasional International Organization for Standardization, ISO 8.879, pada tahun 1986. SGML ditemukan penerimaan dan penggunaan luas di bidang-bidang dengan skala yang sangat besar persyaratan dokumentasi. Namun, secara umum ditemukan rumit dan sulit untuk belajar, efek samping berusaha untuk melakukan terlalu banyak dan terlalu fleksibel. Sebagai contoh, SGML dibuat akhir tag (atau buat-tag, atau bahkan keduanya) opsional dalam konteks tertentu, karena ada anggapan bahwa markup akan dilakukan secara manual oleh staf pendukung yang bekerja terlalu keras akan menghargai tabungan keystrokes. Catatan : DocBook adalah semantik bahasa markup untuk teknis dokumentasi. Ini pada awalnya ditujukan untuk menulis dokumen teknis yang berhubungan dengan hardware dan software komputer tetapi dapat digunakan untuk jenis dokumentasi lain. Sebagai bahasa semantik, DocBook memungkinkan para penggunanya untuk membuat konten dokumen dalam bentuk presentasi-netral yang menangkap struktur logis konten konten tersebut kemudian dapat diterbitkan dalam berbagai format, termasuk HTML, XHTML, Epub, PDF, laki-laki halaman dan HTML Help, tanpa mengharuskan pengguna untuk melakukan perubahan apapun pada sumbernya.
HTML HTML adalah singkatan dari HyperText Markup Language, adalah utama bahasa markup untuk halaman web. Menyediakan sarana untuk membuat dokumen terstruktur oleh struktural menunjukkan semantik untuk teks seperti judul, paragraf, daftar etc serta untuk link, kutipan, dan item lainnya. Hal ini memungkinkan gambar dan objek yang akan tertanam dan dapat digunakan untuk membuat bentuk-bentuk interaktif. Hal ini ditulis dalam bentuk elemen HTML terdiri dari "tag" dikelilingi oleh sudut kurung di dalam konten halaman web. Hal ini dapat memasukkan atau dapat memuat skrip dalam bahasa seperti JavaScript yang
mempengaruhi perilaku dari HTML prosesor seperti Web browser dan Cascading Style Sheets (CSS) untuk menentukan tampilan dan tata letak teks dan materi lain. The W3C, pengurus HTML dan CSS standar, mendorong penggunaan CSS lebih eksplisit presentasional markup Publik pertama yang tersedia deskripsi dari HTML adalah sebuah dokumen yang disebut HTML Tag, pertama kali disebutkan di Internet dengan Berners-Lee pada akhir 1991. ini menggambarkan unsur-unsur yang terdiri dari 20 awal, relatif sederhana desain dari HTML. Kecuali untuk hyperlink tag, ini adalah sangat dipengaruhi oleh SGMLguid, sebuah rumah di dokumentasi berbasis SGML format di CERN. Tiga belas elemen ini masih ada dalam HTML 4 HTML adalah format gambar teks dan bahasa yang digunakan oleh web browser untuk memformat halaman web secara dinamis. Banyak elemen teks yang ditemukan dalam laporan teknis ISO 1988 TR 9.537 Teknik untuk menggunakan SGML, yang pada gilirannya meliputi fitur dari format teks awal bahasa seperti yang digunakan oleh perintah limpasan dikembangkan pada awal 1960-an untuk CTSS (Compatible Time -Sharing System) sistem operasi: perintah format ini berasal dari perintah yang digunakan oleh format typesetters dokumen secara manual. Namun SGML markup konsep umum didasarkan pada unsur-unsur (catatan bersarang rentang dengan atribut) daripada sekadar efek titik, dan juga pemisahan struktur dan pengolahan: HTML secara progresif tidak bergerak ke arah ini dengan CSS. Berners-Lee dianggap HTML untuk menjadi sebuah aplikasi dari SGML, dan secara resmi didefinisikan sebagai demikian oleh Internet Engineering Task Force (IETF) dengan pertengahan-1993 publikasi dari proposal pertama untuk spesifikasi HTML: "Hypertext Markup Language (HTML) "Internet-Draft oleh Berners-Lee dan Dan Connolly, yang termasuk sebuah SGML Document Type Definition untuk mendefinisikan tata bahasa. [8] Draft berakhir setelah enam bulan, tapi terkenal karena pengakuan dari NCSA Mosaic browser tag kustom untuk embedding dalam -line gambar, mencerminkan filsafat IETF standar mendasarkan pada prototipe sukses. Demikian pula, Dave bersaing Raggett InternetKonsep, "HTML + (Hypertext Markup Format)", dari akhir 1993, menyarankan standardisasi dilaksanakan sudah-fitur seperti tabel dan mengisi -formulir. Setelah HTML dan HTML + draf berakhir pada awal tahun 1994, IETF menciptakan HTML Working Group, yang pada tahun 1995 selesai "HTML 2.0", spesifikasi HTML pertama dimaksudkan untuk diperlakukan sebagai standar yang implementasi di masa depan harus didasarkan. Dipublikasikan sebagai Request for Comments 1866, termasuk 2,0 HTML
ide-ide dari HTML dan HTML + draf.
Mesin 2.0 penunjukan itu dimaksudkan untuk
membedakan edisi baru dari draf sebelumnya. Perkembangan lebih lanjut di bawah naungan IETF telah terhenti oleh kepentingan yang saling bersaing. Sejak 1996, spesifikasi HTML telah dipertahankan, dengan input dari vendor software komersial, oleh World Wide Web Consortium (W3C). Namun, pada tahun 2000, HTML juga menjadi standar internasional (ISO / IEC 15445:2000). Spesifikasi HTML terakhir diterbitkan oleh W3C adalah HTML 4.01 Rekomendasi, yang diterbitkan pada akhir 1999. Its masalah dan kesalahan itu diakui oleh errata terakhir diterbitkan pada 2001.
Ada beberapa jenis unsur markup yang digunakan dalam HTML. Struktural markup menggambarkan tujuan teks. Sebagai contoh,
Golf
membangun "Golf" sebagai tingkat kedua pos, yang akan ditampilkan dalam browser dalam cara yang mirip dengan "HTML markup" title pada awal bagian ini. Struktural markup tidak menunjukkan rendering tertentu, tetapi kebanyakan Web browser memiliki standar baku elemen gaya untuk pemformatan. Teks mungkin akan lebih ditata dengan Cascading Style Sheets (CSS). Presentasional markup menggambarkan penampilan teks, terlepas dari fungsinya. Sebagai contoh boldface keluaran visual yang menunjukkan bahwa perangkat tersebut harus membuat "tebal" dalam format teks tebal, tetapi tidak memberikan indikasi apa perangkat yang tidak mampu melakukan hal ini (seperti aural perangkat yang membaca teks dengan keras) harus lakukan. Dalam kasus kedua bold dan italic ada unsurunsur yang biasanya memiliki rendering visual yang setara namun lebih semantik di alam, yaitu <strong>strong emphasis dan <em>emphasis masing-masing. Lebih mudah untuk melihat bagaimana sebuah agen pengguna aural harus menafsirkan dua elemen yang terakhir. Namun, mereka tidak setara dengan rekan-rekan presentasional mereka: itu akan tidak diinginkan untuk screen-pembaca untuk menekankan nama sebuah buku, misalnya, tetapi di layar seperti nama akan dicetak miring. Kebanyakan unsur markup presentasional telah menjadi usang di bawah spesifikasi HTML 4.0, yang mendukung CSS berdasarkan desain gaya. Hypertext markup membuat bagian-bagian dari sebuah dokumen ke dalam link ke dokumen lain. Versi HTML melalui XHTML 1,1 memerlukan penggunaan elemen jangkar untuk membuat suatu hyperlink dalam aliran teks: Wikipedia Selain itu, href atribut harus
Atribut Sebagian besar atribut elemen nama-nilai yang berpasangan, dipisahkan dengan "=", dan ditulis di dalam tag awal sebuah elemen, setelah nama elemen. Nilai tersebut mungkin diapit tanda kutip tunggal maupun ganda, meskipun nilai-nilai yang terdiri dari karakter tertentu dapat dibiarkan unquoted dalam HTML (tapi tidak XHTML). Meninggalkan unquoted nilai atribut dianggap tidak aman. Berbeda dengan nama pasangan nilai atribut, ada beberapa atribut yang mempengaruhi elemen hanya dengan kehadiran mereka di start tag dari elemen (seperti ismap atribut untuk img elemen . Kebanyakan unsur dapat mengambil beberapa atribut umum: The id atribut menyediakan dokumen-lebar identifikasi unik untuk sebuah elemen. Ini dapat digunakan oleh stylesheet untuk memberikan presentasi properti, oleh browser untuk memusatkan perhatian pada elemen tertentu, atau dengan skrip untuk mengubah isi atau presentasi dari suatu elemen. Ditambahkan ke URL dari halaman, menyediakan globalidentifikasi unik untuk sebuah elemen; biasanya sub-bagian halaman. Sebagai contoh, ID "Atribut" di http://en.wikipedia.org/wiki/HTML#Attributes The class atribut menyediakan cara untuk mengklasifikasi unsur-unsur serupa. Ini dapat digunakan untuk semantik atau keperluan presentasi. Semantik, misalnya, kelas digunakan dalam Microformats. Presentationally, misalnya, sebuah dokumen HTML dapat menggunakan penunjukan class="notation" untuk menunjukkan bahwa semua elemen dengan nilai kelas ini berada di bawah teks utama dokumen. Mungkin unsur-unsur seperti berkumpul bersama dan disajikan sebagai catatan kaki pada halaman, bukan muncul di tempat di mana mereka terjadi pada kode HTML. Penulis dapat menggunakan style kode non-attributal presentasional properti untuk sebuah elemen tertentu. Hal ini dianggap sebagai praktek yang lebih baik untuk menggunakan elemen id atau class atribut untuk memilih elemen dengan stylesheet, meskipun kadangkadang dapat ini terlalu rumit untuk yang sederhana dan spesifik atau ad hoc penerapan ditata properti. The title Atribut ini digunakan untuk melampirkan penjelasan subtextual elemen. Pada kebanyakan browser atribut ini ditampilkan sebagai apa yang sering disebut sebagai tooltip.
Unsur singkatan, abbr dapat digunakan untuk menunjukkan berbagai atribut: HTML abbr> Contoh ini menampilkan sebagai HTML; dalam kebanyakan browser, mengarahkan kursor pada singkatan harus menampilkan teks judul "Hypertext Markup Language." Kebanyakan unsur juga mengambil atribut terkait bahasa lang dan dir.
Karakter dan entitas referensi Seperti versi 4.0, HTML mendefinisikan satu set 252 karakter entitas referensi dan 1.114.050 satu set karakter angka referensi, baik dari individu yang memungkinkan karakter yang akan ditulis melalui markup sederhana, bukan secara harfiah. Sebuah karakter harfiah dan rekan markup yang dianggap setara dan dianggap identik. Kemampuan untuk "melarikan diri" karakter dengan cara ini memungkinkan untuk karakter
Data jenis
HTML mendefinisikan beberapa tipe data untuk elemen konten, seperti data script dan stylesheet data, dan sejumlah besar jenis untuk atribut nilai-nilai, termasuk ID, nama, URI, angka, satuan panjang, bahasa, media descriptors, warna, karakter encoding, tanggal dan kali, dan seterusnya. Semua tipe data ini adalah spesialisasi data karakter. HTML dokumen yang diperlukan untuk memulai dengan Document Type Deklarasi (informal, sebuah "DOCTYPE"). Di browser, fungsi dari DOCTYPE adalah untuk menunjukkan modus render-terutama untuk menghindari quirks mode. Tujuan awal dari DOCTYPE adalah untuk memungkinkan penguraian dan validasi dokumen HTML dengan SGML alat berdasarkan Document Type Definition (DTD). DTD mana merujuk DOCTYPE dapat dibaca oleh mesin berisi menetapkan tata bahasa yang diperbolehkan dan dilarang untuk konten dokumen sesuai dengan seperti DTD. Browser, di sisi lain, jangan menerapkan HTML sebagai aplikasi dari SGML dan dengan konsekuensi tidak membaca DTD. 5 HTML tidak mendefinisikan suatu DTD, karena keterbatasan teknologi, sehingga dalam DOCTYPE HTML 5, deklarasi, tidak mengacu pada DTD. Contoh dari DOCTYPE HTML 4 adalah Deklarasi ini referensi DTD untuk versi Ketat HTML 4.01, yang tidak termasuk elemen presentasi seperti font meninggalkan format untuk Cascading Style Sheets dan span dan div elemen. SGML Validator berbasis membaca DTD untuk mengurai dengan benar dokumen dan melakukan validasi. Pada browser modern, DOCTYPE ini mengaktifkan modus standar sebagai lawan quirks mode.
Semantic HTML Semantik HTML adalah cara menulis HTML yang menekankan arti dari informasi yang dikodekan selama masa presentasi (lihat). HTML sudah termasuk markup semantik dari awal, tetapi juga termasuk markup presentasional seperti dan
tag. Ada juga yang secara semantik netral span dan div tag. Sejak akhir 1990-an ketika Cascading Style Sheets mulai bekerja pada kebanyakan browser, penulis web telah didorong untuk menghindari penggunaan presentasional HTML markup dengan melihat ke pemisahan presentasi dan konten.
Pada tahun 2001 diskusi mengenai Semantic Web, Tim Berners-Lee dan lain-lain memberi contoh cara di mana perangkat lunak cerdas 'agen' mungkin suatu hari secara otomatis pukat Web dan menemukan, menyaring dan mengkorelasikan sebelumnya tidak berkaitan, fakta-fakta yang diterbitkan untuk kepentingan pengguna manusia . Agen seperti biasa bahkan tidak sekarang, tetapi beberapa ide dari Web 2.0, mashup dan situs perbandingan harga dapat datang dekat. Perbedaan utama antara aplikasi web ini hibrida dan Berners-Lee's semantik agen terletak pada kenyataan bahwa saat ini agregasi dan informasi hibridisasi biasanya dirancang oleh pengembang web, yang sudah tahu lokasi web dan API semantik dari data spesifik yang mereka inginkan untuk mash, membandingkan dan menggabungkan. Jenis penting web agen yang tidak pukat dan membaca halaman web secara otomatis, tanpa pengetahuan tentang apa yang mungkin menemukan, adalah penjelajah web atau labalaba mesin pencarian. Agen perangkat lunak ini tergantung pada kejelasan semantik halaman web mereka temukan ketika mereka menggunakan berbagai teknik dan algoritma untuk membaca dan mengindeks jutaan halaman web sehari dan menyediakan pengguna web dengan fasilitas pencarian yang tanpanya World Wide Web akan menjadi hanya sebagian kecil dari kegunaan saat ini. Agar laba-laba mesin pencarian untuk dapat menilai pentingnya potongan-potongan teks yang mereka temukan dalam dokumen HTML, dan juga bagi mereka yang menciptakan mashup dan hibrida lain, serta untuk lebih otomatis agen seperti yang dikembangkan, struktur semantik yang ada dalam HTML harus diterapkan secara luas dan seragam untuk membawa keluar makna teks diterbitkan. Tag markup presentasional usang dalam HTML dan XHTML saat ini rekomendasi dan ilegal dalam HTML 5. Baik semantik HTML juga meningkatkan aksesibilitas dokumen web (lihat juga Web Content Accessibility Guidelines). Sebagai contoh, ketika seorang pembaca layar browser atau audio dengan benar dapat memastikan struktur dari sebuah dokumen, tidak akan menyianyiakan tunanetra waktu pengguna dengan membacakan berulang-ulang atau informasi yang tidak relevan ketika telah ditandai dengan benar.
HTTP The World Wide Web terdiri terutama dari dokumen HTML dikirimkan dari Web server ke Web browser menggunakan Hypertext Transfer Protocol (HTTP). Namun, HTTP digunakan untuk melayani gambar, suara, dan konten lain selain HTML. Untuk membolehkan
browser Web untuk mengetahui bagaimana menangani setiap dokumen yang diterima, informasi lain ditularkan bersama dengan dokumen. Ini meta data biasanya termasuk tipe MIME (misalnya text / html atau application / xhtml + xml), dan pengkodean karakter (lihat Encoding karakter dalam HTML). Pada browser modern, maka tipe MIME yang dikirimkan dengan dokumen HTML dapat mempengaruhi bagaimana dokumen awalnya ditafsirkan. Sebuah dokumen yang dikirim dengan tipe MIME XHTML diharapkan dapat well-formed XML, dan dapat menyebabkan kesalahan sintaks browser gagal untuk membuat itu. Dokumen yang sama dikirim dengan tipe MIME HTML mungkin akan ditampilkan dengan sukses, karena beberapa browser yang lebih lunak dengan HTML. Rekomendasi W3C menyatakan bahwa XHTML 1.0 dokumen yang mengikuti pedoman yang ditetapkan dalam rekomendasi's Lampiran C dapat diberi label dengan baik Jenis MIME. Saat ini XHTML 1.1 Working Draft juga menyatakan bahwa dokumen XHTML 1.1 seharusnya diberi label dengan baik MIME.
HTML e-mail Kebanyakan grafis e-mail klien mengijinkan penggunaan subset dari HTML (sering sakit-ditentukan) untuk memberikan format dan semantik markup tidak tersedia dengan teks biasa. Ini dapat mencakup informasi seperti berwarna tipografi judul, dan dikutip menekankan teks, gambar dan diagram inline. Banyak klien seperti itu mencakup baik GUI HTML editor untuk menulis pesan e-mail dan mesin render untuk menampilkan mereka. Html dalam e-mail yang kontroversial karena masalah kompatibilitas, karena dapat membantu menyamar phishing serangan, karena dapat membingungkan spam filter dan karena ukuran pesan lebih besar dari teks biasa.
HTML Application HTML Application (HTA; ekstensi file ". Hta") adalah Microsoft Windows aplikasi yang menggunakan HTML dan Dynamic HTML pada browser untuk menyediakan aplikasi antarmuka grafis. Sebuah file HTML biasa hanya terbatas pada model keamanan browser web, hanya berkomunikasi ke web server dan hanya memanipulasi objek halaman Web dan situs cookie. Sebuah HTA berjalan sebagai aplikasi dipercaya sepenuhnya dan karena itu memiliki lebih banyak hak istimewa, seperti ciptaan / pengeditan / penghapusan file dan Windows Registry entri. Karena mereka beroperasi di luar browser model keamanan, HTAs
tidak dapat dijalankan melalui HTTP, tetapi harus di-download (sama seperti file EXE) dan dijalankan dari sistem file lokal. Sejak awal, HTML dan protokol yang terkait penerimaan yang diperoleh relatif cepat. Namun, tidak ada standar yang jelas ada pada tahun-tahun awal bahasa. Meskipun para pencipta awalnya dipahami dari HTML sebagai bahasa semantik presentasi tanpa rincian, praktis menggunakan presentasional mendorong banyak elemen dan atribut ke dalam bahasa, terutama didorong oleh berbagai vendor browser. Standar terbaru sekitarnya HTML mencerminkan upaya untuk mengatasi kacau kadang-kadang perkembangan bahasa dan untuk menciptakan landasan yang rasional untuk membangun kedua bermakna dan disajikan dengan baik dokumen. Untuk kembali HTML untuk perannya sebagai semantik bahasa, W3C telah mengembangkan gaya bahasa seperti CSS dan XSL untuk memikul beban presentasi. Dalam hubungannya, spesifikasi HTML telah perlahan-lahan mengekang dalam elemen presentasi. Ada dua sumbu membedakan berbagai variasi dari HTML karena selama ini ditentukan: SGML berbasis HTML berbasis XML vs HTML (disebut sebagai XHTML) pada satu poros, dan transisi versus ketat (longgar) versus frameset pada sumbu lain.
XML XML disusun oleh sebuah kelompok kerja dari sebelas anggota, didukung oleh (kirakira) 150-member Interest Group. Debat teknis terjadi pada Interest Group mailing list dan masalah diselesaikan secara musyawarah atau, ketika yang gagal, suara mayoritas dari Kelompok Kerja. Sebuah catatan keputusan desain dan alasan-alasan mereka dikompilasi oleh Michael Sperberg-McQueen pada 4 Desember 1997. James Clark menjabat sebagai Lead Teknis dari Kelompok Kerja, khususnya memberikan kontribusi yang kosong-elemen "<empty/>" ialah sintaks perintah dan nama "XML". Nama lain yang telah diajukan untuk dipertimbangkan termasuk "magma" (Minimal Architecture for Generalized Markup Applications), "SLIM" (Structured Language for Internet Markup) dan "MGML" (Minimal Generalized Markup Language). Co-editor dari spesifikasi awalnya Tim Bray dan Michael Sperberg-McQueen. Setengah jalan melalui proyek Bray menerima konsultasi keterlibatan dengan Netscape, memprovokasi hiruk-pikuk protes dari Microsoft. Bray sementara diminta untuk mengundurkan diri dari jabatan redaktur. Hal ini menyebabkan sengketa intens dalam Kelompok Kerja, pada akhirnya diselesaikan oleh penunjukan Microsoft Jean Paoli sebagai ketiga co-editor. Kelompok Kerja XML pernah bertemu tatap muka; desain itu dicapai dengan menggunakan kombinasi email dan mingguan teleconference. Keputusan desain utama yang
dicapai dalam dua puluh minggu yang intens kerja antara Juli dan November 1996, ketika pertama Working Draft dari spesifikasi XML diterbitkan. selanjutnya melanjutkan pekerjaan desain melalui 1997, dan XML 1.0 menjadi W3C Rekomendasi pada tanggal 10 Februari , 1998.XML (Extensible Markup Language) adalah bahasa markup meta yang sekarang banyak digunakan. XML dikembangkan oleh World Wide Web Consortium, dalam sebuah komite yang diciptakan dan dipimpin oleh Jon Bosak. Tujuan utama XML adalah untuk menyederhanakan SGML dengan berfokus pada masalah tertentu - dokumen di Internet. XML tetap merupakan meta-bahasa seperti SGML, memungkinkan pengguna untuk membuat tag apapun yang diperlukan (karenanya "extensible") dan kemudian menggambarkan mereka tag dan mereka diperbolehkan menggunakan. XML adopsi dibantu karena setiap dokumen XML dapat ditulis sedemikian rupa sehingga juga merupakan dokumen SGML, dan yang sudah ada dan software SGML pengguna bisa beralih ke XML cukup mudah. Namun, XML menghilangkan banyak manusia yang lebih kompleks dan fitur berorientasi untuk menyederhanakan implementasi SGML lingkungan seperti dokumen dan publikasi. Namun, tampaknya untuk menyerang medium bahagia antara kesederhanaan dan fleksibilitas, dan dengan cepat diadopsi untuk penggunaan lainnya. XML kini banyak digunakan untuk mengkomunikasikan data di antara aplikasi. Seperti HTML, dapat digambarkan sebagai sebuah 'wadah' bahasa. Tujuan desain XML menekankan kesederhanaan, umum, dan kegunaan melalui internet. Ini adalah format data tekstual, dengan dukungan kuat melalui Unicode untuk bahasa di dunia. Meskipun desain XML berfokus pada dokumen, hal itu secara luas digunakan untuk representasi struktur data yang sewenang-wenang, misalnya dalam layanan Web. Ada berbagai antarmuka pemrograman pengembang perangkat lunak yang dapat digunakan untuk mengakses data XML, dan beberapa sistem skema yang dirancang untuk membantu dalam definisi bahasa berbasis XML. Seperti tahun 2009 ratusan bahasa berbasis XML telah dikembangkan, termasuk RSS, Atom, SOAP, dan XHTML. Format berbasis XML telah menjadi standar bagi sebagian besar kantor-alat produktivitas, termasuk Microsoft Office (Office Open XML), OpenOffice.org (OpenDocument), dan Apple 's iWork. Karakter yang membentuk dokumen XML dibagi menjadi markup dan konten. Markup dan konten dapat dibedakan dengan menerapkan aturan-aturan sintaksis sederhana. Semua string yang merupakan markup yang baik dimulai dengan karakter "<" dan diakhiri
dengan ">", atau dimulai dengan karakter "&" dan diakhiri dengan ";". String karakter yang tidak markup puas. Dokumen XML terdiri sepenuhnya dari karakter dari Unicode repertoar. Kecuali untuk sejumlah kecil khusus tidak termasuk kontrol karakter, setiap karakter didefinisikan oleh Unicode mungkin muncul dalam isi dokumen XML. Pemilihan karakter yang mungkin muncul dalam markup agak lebih terbatas namun masih besar. XML termasuk fasilitas untuk mengidentifikasi pengkodean dari karakter Unicode yang menyusun dokumen, dan untuk mengekspresikan karakter yang, untuk satu alasan atau lainnya, tidak dapat digunakan secara langsung. Spesifikasi XML mendefinisikan dokumen XML sebagai teks yang well-formed, yaitu, memenuhi daftar aturan sintaks yang disediakan dalam spesifikasi. Daftar ini cukup panjang; beberapa poin utama adalah: 1. Hanya berisi hukum dikodekan benar-karakter Unicode. 2. Tak satu pun dari sintaks khusus karakter seperti "<" dan "&" muncul kecuali saat melakukan markup-penggambaran mereka peran. 3. Yang mulai, akhir, dan kosong-elemen tag yang membatasi unsur-unsur benar bersarang, dengan tidak ada yang hilang dan tidak ada yang tumpang tindih. 4. Elemen tag adalah case-sensitive; awal dan akhir tag harus sama persis. 5. Ada satu "root" elemen yang berisi semua unsur-unsur lain.
Definisi dokumen XML termasuk teks-teks yang berisi pelanggaran aturan formedness baik, mereka tidak hanya XML. Prosesor XML yang menemukan pelanggaran seperti itu diperlukan untuk melaporkan kesalahan tersebut dan untuk menghentikan proses normal. Kebijakan ini, kadang-kadang disebut sebagai kejam, berdiri di terkemuka kontras dengan perilaku proses program yang HTML, yang dirancang untuk menghasilkan hasil yang masuk akal, bahkan di hadapan kesalahan markup parah. XML kebijakan di daerah ini telah dikritik sebagai pelanggaran hukum Postel.
DTD Skema tertua bahasa untuk XML adalah Document Type Definition (DTD), yang diwarisi dari SGML. DTDs memiliki keuntungan sebagai berikut: 1. Dukungan DTD mana-mana karena yang dimasukkan dalam standar XML 1.0.
2. DTDs yang singkat dibandingkan dengan unsur skema berbasis bahasa dan akibatnya ada informasi lebih lanjut dalam satu layar. 3. DTDs memungkinkan deklarasi entitas publik standar set untuk penerbitan karakter. 4. DTDs menentukan jenis dokumen bukan jenis yang digunakan oleh sebuah namespace, sehingga kendala pengelompokan semua dokumen dalam satu koleksi.
DTDs memiliki keterbatasan berikut: 1. Mereka tidak memiliki dukungan eksplisit lebih baru fitur XML, yang paling penting namespaces. 2. Mereka kurang ekspresif. XML DTDs lebih sederhana daripada SGML DTDs dan ada struktur tertentu yang tidak dapat diungkapkan dengan tata bahasa teratur. DTDs hanya mendukung rudimenter datatypes. 3. Mereka tidak mudah dibaca. DTD desainer biasanya membuat menggunakan parameter berat badan (yang berperilaku tekstual dasarnya sebagai makro), yang membuatnya lebih mudah untuk menentukan tata bahasa yang rumit, tetapi dengan mengorbankan kejelasan. 4. Mereka menggunakan sintaks yang didasarkan pada regular expression syntax, diwarisi dari SGML, untuk menggambarkan skema. XML API khas seperti SAX tidak berusaha untuk menawarkan aplikasi yang terstruktur representasi sintaks, sehingga kurang dapat diakses oleh programmer daripada elemen sintaks berbasis mungkin. Dua ciri khas yang membedakan DTDs dari jenis skema lain adalah dukungan sintaksis untuk menanamkan DTD dalam XML untuk mendefinisikan dokumen-dokumen dan entitas, yang sewenang-wenang fragmen teks dan / atau markup bahwa prosesor XML memasukkan dalam DTD itu sendiri dan dalam dokumen XML mana pun mereka direferensikan, sifat seperti melarikan diri. Teknologi DTD masih digunakan di banyak aplikasi karena di mana-mana.
XML Schema Seorang yang lebih baru skema bahasa, digambarkan oleh W3C sebagai penerus DTDs, adalah XML Schema, sering disebut oleh initialism untuk XML Schema contoh, XSD (XML Schema Definition). XSDs jauh lebih kuat daripada XML DTDs dalam menggambarkan bahasa. Mereka menggunakan kaya datatyping sistem dan memungkinkan
untuk lebih rinci kendala pada dokumen XML struktur logis. XSDs juga menggunakan format berbasis XML, yang memungkinkan untuk menggunakan XML biasa alat-alat untuk membantu proses mereka.
Penggunaan di Internet Hal ini umum untuk XML yang akan digunakan dalam interchanging data melalui Internet. RFC 3.023 memberikan aturan untuk pembangunan Internet Media Jenis untuk digunakan saat mengirim XML. Ini juga mendefinisikan jenis "application / xml" dan "text / xml", yang hanya mengatakan bahwa data dalam XML, dan apa-apa tentang semantik. Penggunaan "text / xml" telah dikritik sebagai sumber potensial masalah pengkodean dan sekarang dalam proses menjadi usang. [14] RFC 3023 juga merekomendasikan bahwa bahasa berbasis XML akan diberikan tipe-tipe media di awal "application /" dan berakhir di "+ xml", misalnya "application / svg + xml" untuk SVG. Pedoman lebih lanjut untuk penggunaan XML dalam konteks jaringan dapat ditemukan dalam RFC 3470, yang juga dikenal sebagai IETF BCP 70; dokumen ini sangat luas dan mencakup banyak aspek merancang dan menggunakan sebuah bahasa berbasis XML.
XML sebagai tipe data
XML mulai muncul sebagai kelas satu tipe data dalam bahasa lain. The ECMAScript untuk XML (E4X) perluasan ke ECMAScript / bahasa JavaScript secara eksplisit mendefinisikan dua objek tertentu (XML dan XMLList) untuk JavaScript, yang mendukung dokumen XML node dan daftar dokumen XML sebagai objek yang berbeda dan menggunakan notasi dot-menentukan hubungan orangtua-anak . E4X ini didukung oleh Mozilla 2.5 + browser dan Adobe Actionscript, tetapi belum diadopsi lebih universal. Catatan serupa digunakan dalam Microsoft LINQ implementasi untuk Microsoft. NET 3.5 dan di atas, dan di Scala (yang menggunakan Java VM). Open-source xmlsh aplikasi, yang menyediakan Linux-seperti kulit dengan fitur-fitur khusus untuk XML manipulasi, sama memperlakukan XML sebagai tipe data, dengan menggunakan <[]> notasi.
Versi Ada dua versi terbaru XML. Yang pertama, XML 1.0, pada awalnya didefinisikan pada tahun 1998. Telah mengalami revisi kecil sejak saat itu, tanpa diberi nomor versi baru,
dan saat ini dalam edisi kelima, yang diterbitkan pada 26 November 2008. Diterapkan secara luas dan masih direkomendasikan untuk penggunaan umum. Yang kedua, XML 1.1, pada awalnya diterbitkan pada tanggal 4 Februari 2004, hari yang sama XML 1.0 Third Edition dan saat ini dalam edisi kedua, yang diterbitkan pada tanggal 16 Agustus 2006. Ini berisi fitur - beberapa perdebatan - yang dimaksudkan untuk membuat XML lebih mudah untuk digunakan dalam kasus-kasus tertentu - terutama memungkinkan penggunaan mengakhiri garis-karakter yang digunakan pada EBCDIC platform, dan penggunaan skrip dan karakter absen dari Unicode 3.2. XML 1,1 sangat tidak diterapkan secara luas dan dianjurkan untuk digunakan hanya oleh mereka yang membutuhkan fitur yang unik. Sebelum rilis edisi kelima, XML 1.0 XML 1,1 berbeda dalam memiliki persyaratan ketat untuk karakter yang tersedia untuk digunakan dalam elemen dan atribut nama dan pengidentifikasi unik: dalam empat edisi pertama XML 1.0 adalah karakter yang disebutkan secara eksklusif menggunakan versi tertentu Unicode standar (2.0 Unicode Unicode 3.2.) edisi kelima menggantikan mekanisme XML 1.1, yang lebih masa depan-bukti tetapi mengurangi redundansi. Pendekatan yang diambil dalam edisi kelima XML 1.0 dan di semua edisi XML adalah bahwa hanya 1,1 karakter tertentu dilarang di nama, dan segala sesuatu yang lain diperbolehkan, dalam rangka untuk mengakomodasi penggunaan nama sesuai karakter Unicode versi masa depan. Dalam edisi kelima, nama XML dapat berisi karakter di Bali, Cham, atau Phoenecian skrip di antara banyak orang lain yang telah ditambahkan ke Unicode sejak Unicode 3.2. Hampir semua kode Unicode titik dapat digunakan dalam karakter data dan nilai-nilai atribut dari XML 1.0 atau 1.1 dokumen, bahkan jika karakter yang sesuai dengan kode titik tidak didefinisikan dalam Unicode versi saat ini. Dalam karakter data dan nilai-nilai atribut, XML 1,1 memungkinkan penggunaan lebih mengontrol karakter dari XML 1.0, tetapi, karena "Robustness", sebagian besar karakter kontrol diperkenalkan pada 1,1 XML harus dinyatakan sebagai karakter angka referensi (dan # x7F melalui # x9F , yang telah diperbolehkan dalam XML 1.0, yang dalam XML 1,1 bahkan dibutuhkan untuk dapat dinyatakan sebagai karakter numerik referensi ). Di antara yang didukung karakter kendali dalam XML 1,1 istirahat dua baris kode yang harus diperlakukan sebagai spasi. Karakter spasi putih adalah satu-satunya kontrol kode yang dapat ditulis secara langsung. Ada diskusi tentang XML 2.0, meskipun tidak ada organisasi telah mengumumkan rencana untuk bekerja pada proyek tersebut. XML-SW (SW untuk sigung karya), yang ditulis oleh salah satu pengembang asli XML, berisi beberapa proposal untuk apa XML 2,0 akan
terlihat seperti: penghapusan DTDs dari sintaks, integrasi namespaces, XML Base dan XML Information Set (infoset) ke standar dasar. World Wide Web Consortium XML juga memiliki Karakterisasi Binary Kelompok Kerja melakukan penelitian pendahuluan menggunakan kasus dan properti untuk pengkodean biner dari infoset XML. Kelompok kerja tidak disewa untuk menghasilkan standar resmi. Karena XML adalah dengan definisi berbasis teks, ITU-T dan ISO menggunakan nama Fast Infoset untuk infoset biner mereka sendiri untuk menghindari kebingungan (lihat ITU-T Rec. X.891 | ISO / IEC 24824-1).
XHTML XHTML (Extensible Hypertext Markup Language) adalah keluarga XML bahasa markup yang cermin atau memperpanjang versi yang digunakan secara luas Hypertext Markup Language (HTML), bahasa yang digunakan halaman web ditulis. Sementara HTML (sebelum HTML5) didefinisikan sebagai penerapan Standar Generalized Markup Language (SGML), sebuah bahasa markup yang sangat fleksibel kerangka, XHTML adalah aplikasi dari XML, yang lebih ketat subset dari SGML. Karena dokumen XHTML harus terbentuk dengan baik, mereka dapat dipecah menggunakan standar XML parsers-tidak seperti HTML, yang memerlukan lunak khusus HTML parser. XHTML 1.0 menjadi World Wide Web Consortium (W3C) Rekomendasi pada 26 Januari 2000. XHTML 1.1 menjadi Rekomendasi W3C pada tanggal 31 Mei 2001. XHTML5 sedang mengalami perkembangan sampai September 2009, sebagai bagian dari HTML5 spesifikasi. XHTML 1.0 adalah "sebuah reformulasi dari tiga tipe dokumen HTML 4 sebagai aplikasi XML 1.0". The World Wide Web Consortium (W3C) juga terus mempertahankan HTML 4.01 Rekomendasi dan spesifikasi HTML5 dan XHTML5 sedang aktif dikembangkan . Dalam XHTML 1.0 Rekomendasi saat ini dokumen, yang diterbitkan dan direvisi hingga Agustus 2002, W3C berkomentar bahwa, "The XHTML Keluarga adalah langkah berikutnya dalam evolusi Internet. Dengan migrasi ke XHTML hari ini, pengembang konten dapat memasuki dunia dengan XML seluruh petugas manfaat, sementara masih tersisa yakin konten mereka yang terbelakang dan kompatibilitas masa depan. Namun, pada tahun 2004, Web Hypertext Application Technology Working Group (WHATWG) dibentuk, terlepas dari W3C, untuk bekerja pada HTML biasa maju tidak didasarkan pada XHTML. Sebagian besar vendor browser tidak bersedia untuk mengimplementasikan fitur-fitur pada draft W3C XHTML baru, dan merasa bahwa mereka
tidak melayani kebutuhan pengembangan web modern. [Rujukan?] The WHATWG akhirnya mulai bekerja pada standar yang didukung baik XML dan non - serializations XML, HTML 5, secara paralel untuk standar W3C seperti XHTML 2. Pada tahun 2007, W3C HTML kelompok kerja memilih untuk secara resmi mengakui HTML 5 dan bekerja di dalamnya sebagai mendatang yang dihasilkan standar HTML. Pada tahun 2009, mengizinkan W3C XHTML Kelompok Kerja 2 piagam untuk berakhir, mengakui bahwa HTML 5 akan dapat satu-satunya generasi berikutnya HTML standar, termasuk XML dan non-XML serializations.
PERBEDAAN XHTML DENGAN HTML
Satu-satunya perbedaan esensial antara XHTML dan HTML adalah XHTML harus well-formed XML, sedangkan HTML tidak perlu. (HTML 4 dan sebelumnya adalah nominal SGML, sementara HTML 5 mendefinisikan model parsing sendiri dengan sangat rinci.) Beberapa contoh perbedaan ini dalam praktek memaksakan adalah: Dalam HTML, beberapa tag (misalnya, selalu kosong dan mungkin tidak memiliki tag penutup, sedangkan semua elemen harus secara eksplisit ditutup dalam XHTML. XML memungkinkan dua cara menulis elemen kosong: dan Dalam XML ini dipertukarkan, dan juga dapat digunakan secara bebas untuk setiap tag. Namun, jika konten XHTML untuk dilayani dengan teks / html jenis media Internet untuk warisan browser, hanya bentuk menutup diri harus digunakan untuk selalu-elemen kosong. Mereka harus diungkapkan seperti dengan spasi tambahan yang dapat membantu penguraian oleh beberapa tanggal spesifik dari browser. Eksplisit tag penutup harus digunakan untuk elemen kosong yang tidak selalu kosong (seperti <script> Tanpa mengikuti aturan-aturan dan rekomendasi, beberapa browser akan mengurai elemen kosong tidak benar. Demikian pula, izin HTML menghilangkan tag penutup untuk beberapa elemen, seperti
XHTML melarang ini. Dalam HTML, hampir semuanya case-insensitive, sedangkan dalam XML, semua elemen dan nama atribut case-sensitive. XHTML mengharuskan semua elemen dan nama atribut harus huruf kecil, sedangkan di dokumen HTML memang sudah sangat biasa untuk menemukan huruf besar atau bahkan campuran-nama kasus. Berbagai versi dari HTML sering izin penawaran untuk dihilangkan dari nilai atribut, misalnya,
[11] Dalam XHTML, semua nilai atribut harus diapit oleh tanda kutip, baik tunggal maupun ganda: atau
HTML izin "atribut minimisasi", di mana atribut boolean dapat memiliki nilai mereka diabaikan seluruhnya, misalnya,
selected="selected"> Beberapa unsur yang diperlukan dapat dihilangkan dalam HTML, dalam hal ini mereka secara implisit ditambahkan oleh parser. Sebagai contoh, berbagai versi HTML tidak memerlukan atau tag untuk hadir kecuali mereka dimaksudkan untuk memiliki atribut. Di sisi lain, dalam XML yang DOM harus ditentukan tanpa harus mengetahui unsur-unsur yang diperlukan, sehingga tag ini harus ditentukan secara eksplisit. Di samping perbedaan ini, hanya menentukan spesifikasi HTML serialisasi atau hanya sebuah XHTML serialisasi. XHTML 1.0 adalah kira-kira hanya sebuah serialisasi XML HTML 4.0, tetapi XHTML 1.1, 1.2, dan 2.0 tidak memiliki serialisasi HTML, sedangkan versi HTML kurang dari 4 tidak mempunyai serialisasi XML. HTML 5 adalah yang pertama (X) HTML yang dirancang untuk mendukung standar HTML dan XHTML serializations sama.
DAFTAR MARKUP LANGUAGE
Berikut beberapa daftar bahasa markup, yaitu : 1. Daftar bahasa markup XML Berikut adalah daftar bahasa markup XML menurut abjad, yaitu : A •
Automated Test Markup Language (ATML): ATML mendefinisikan sebuah media pertukaran standar untuk berbagi informasi antara komponen-komponen sistem tes otomatis. Informasi ini mencakup data pengujian, data sumber daya, diagnostik data, dan data sejarah.
•
Atom (standar): The Atom Syndication Format adalah suatu bahasa yang digunakan untuk feed web
•
Attention.xml
•
Attention Profiling Mark-up Language (APML): format untuk menangkap seseorang kepentingan dan ketidaksukaan
•
AdsML bahasa Markup yang digunakan untuk pertukaran data antara sistem periklanan.
B •
Format Penjelasan biner bahasa: sebuah perpanjangan dari XSIL yang telah menambahkan conditional dan kemampuan untuk referensi file dengan angka aliran mereka, daripada oleh publik mereka URL
•
Business Process Execution Language: sebuah model proses bisnis bahasa yang executable
C •
COLLADA: sebuah standar untuk bertukar aset digital di antara berbagai aplikasi perangkat lunak grafis
•
CMRL: sebuah bahasa markup isi pesan singkat
•
CXML: sebuah protokol yang dimaksudkan untuk komunikasi dokumen bisnis antara aplikasi pengadaan, e-commerce hub dan pemasok
•
Call Control Extensible Markup Language: sebuah standar yang dirancang untuk menyediakan telepon dukungan kepada VoiceXML
•
CellML: bahasa menjelaskan model matematika
•
Channel Definition Format
•
Chemical Markup Language
•
Clinical Data Interchange Standar Konsorsium
•
Dokumen klinis Arsitektur
•
Common Alerting Protokol (CAP)
•
CookSwing
D •
Mengetik Informasi Darwin Arsitektur
•
dicML untuk satu bahasa dan kamus dua bahasa
•
Dimensi Markup Language
•
Directory Service Markup Language
•
DisplayML
•
DocBook: sebuah bahasa markup dokumentasi teknis.
•
DotML
•
Dokumen Schema Definition Bahasa
•
Struktur Dokumen Keterangan: sebuah skema bahasa untuk XML
•
Diag-ML untuk Diagnostics Terpadu dan Manajemen Kesehatan
E
•
ebXML: koleksi Elektronik Bisnis spesifikasi
•
eLML: eLesson Markup Language
•
EMML Enterprise Markup Language Markup
•
Epub publikasi elektronik, buka e-book format
•
Extensible Application Markup Language
•
Extensible Data Format
•
Extensible Messaging dan Presence Protocol
•
Extensible Provisioning Protocol
•
Extensible Resource Identifier
•
Extensible Stylesheet Language
F •
FXT: transformasi spesifikasi untuk XML Fungsional Transformation Tool
•
FicML: Fiksi Markup Language
•
FictionBook: sebuah e-book format
•
FieldML: Field Modelling / Markup Language
•
FDCML: Lapangan Konfigurasi Device Markup Language
•
FleXML: bahasa transformasi XML
•
FpML: Produk Keuangan Markup Language
•
FreebXML.org
E •
ENML: Electromic Notorazation Markup Language
G •
GJXDM: model acuan data untuk pertukaran informasi dalam keadilan dan keselamatan publik masyarakat
•
GPX: bahasa yang dirancang untuk mentransfer GPS data antara aplikasi software
•
GXA: perpanjangan dari SOAP sedang dikerjakan oleh Microsoft, IBM dan beberapa pengembang lainnya
•
GXL: format pertukaran standar untuk grafik
•
GraphML: format pertukaran standar untuk grafik
•
Geografi Markup Language: sebuah tata bahasa yang didefinisikan oleh Open Geospatial Consortium (OGC) untuk mengungkapkan fitur geografis
• H
GuideML
•
HelpML
•
HumanML: untuk menggambarkan kontekstual (emosional, sosial, pragmatis) informasi tentang contoh komunikasi manusia
I •
Informasi dan Konten Exchange
J •
Pidato java Markup Language: bahasa untuk teks annotating input ke alat bicara.
•
Job Definition Format: sebuah standar yang dikembangkan oleh industri seni grafis lintas untuk memfasilitasi implementasi alur kerja vendor
•
Job Submission Description Language: menggambarkan tugas-tugas sederhana noninteraktif sistem eksekusi komputer
K •
Keyhole Markup Language: geografis annotation
L •
LandXML: non-proprietary standar untuk pertukaran data di antara pengembangan lahan, survei teknik sipil dan masyarakat. LandXML.org
•
LGML: Linguistik Markup Language, untuk menggambarkan bahasa-bahasa alamiah
•
LOGML: Log Markup Language, untuk menggambarkan laporan log web server
•
Lenex: pertukaran format untuk berenang peringkat
•
Link kontrak
M •
Mail Markup Language (MML): bahasa dan struktur yang menggambarkan konten untuk email
•
MathML: bahasa menggambarkan notasi matematika
•
Medical Markup Language
•
Kedokteran Reality Markup Language (MRML)
•
Musik Encoding Initiative (MEI): sebuah bahasa berbasis XML untuk digital notasi musik representasi dokumen.
•
Microformats: sepotong mark up yang memungkinkan ekspresi semantik dalam HTML (atau XHTML) halaman Web
•
MOWL: semantik interaksi dengan konten multimedia
•
MusicXML: XML berbasis format file notasi musik.
•
MXML: bahasa yang digunakan untuk lay-out declaratively antarmuka aplikasi, dan juga untuk mengimplementasikan logika bisnis kompleks dan perilaku aplikasi internet kaya
N •
Namespace Routing Bahasa
•
Model Pertukaran Informasi Nasional
•
Bersarang Konteks Bahasa
•
Namespace Validasi berbasis pengiriman Bahasa
O •
ODD: A 'Satu Dokumen Apakah-it-all' TEI format untuk proyek rekaman dokumentasi secara simultan dan meta-schema definisi dari mana Anda dapat menghasilkan RELAX NG, W3C XML Schema, dan DTDs serta dokumentasi diformat.
•
ODRL: sebuah standar berbasis XML Hak Expression Language (REL) yang digunakan dalam Digital Rights Management sistem
•
Office Open XML: adalah format file Microsoft spesifikasi untuk penyimpanan dokumen elektronik
•
OIOXML: sebuah bahasa markup XML yang diciptakan oleh pemerintah Denmark untuk mempermudah komunikasi dari, untuk dan antara instansi pemerintah Denmark
•
OML: sebuah format XML untuk menjabarkan, berdasarkan OPML.
•
OPML: format XML untuk menjabarkan
•
Buka e-book: the e-book format didefinisikan oleh Open eBook Struktur Publikasi Spesifikasi; digantikan oleh Epub.
•
OpenDocument: format file dokumen yang digunakan untuk menjelaskan dokumen elektronik
•
Buka Mathematical Dokumen (OMDoc), berdasarkan OpenMath dan MathML, tetapi dengan cakupan yang lebih besar.
•
OpenMath - sebuah bahasa markup rumus matematika yang dapat melengkapi MathML.
•
OSIS - Terbuka Kitab Suci Informasi Standar, markup XML-skema yang mendefinisikan tag untuk menandai Alkitab, tafsiran teologis, dan literatur terkait lainnya.
P •
phyloXML - XML untuk filogenetik dan aplikasi phylogenomic
•
PMML - XML untuk prediksi analisis dan data mining
•
PNML - Petri Net Markup Language
R •
RailML
•
RDFa
•
RELAX NG: sebuah skema bahasa
•
RSS (file format)
•
RSS kandang
•
RecipeML
•
Regular Bahasa deskripsi untuk XML
•
Remote Telescope Markup Language
•
Resource Description Framework: sebuah metadata model berdasarkan gagasan untuk membuat pernyataan tentang sumber daya
S •
Format file S5: slideshow data
•
SAML: otentikasi dan otorisasi data yang
•
SBML: model proses biologis
•
SCORM: XML untuk web-based e-learning
•
SCXML: menyediakan mesin negara generik berbasis lingkungan eksekusi berdasarkan Harel statecharts
•
SOAP: sebuah protokol untuk bertukar pesan-pesan berbasis XML melalui jaringan komputer
•
SOAP dengan Lampiran: metode menggunakan Web Services untuk mengirim dan menerima file menggunakan kombinasi SOAP dan MIME, terutama melalui HTTP.
•
SPML: user, sumber daya dan informasi provisioning layanan
•
SXBL: mendefinisikan presentasi dan perilaku interaktif unsur-unsur yang dijelaskan dalam SVG
•
Scalable Vector Graphics: menggambarkan dua dimensi vektor grafik
•
Schematron: validasi struktur XML bahasa untuk membuat pernyataan tentang ada atau tidak adanya pola di atas pohon
•
Shopinfo.xml: menyediakan toko dan data produk
•
Simple Sharing Extensions
•
Speech Application Language Tags
•
Speech Synthesis Markup Language: pidato bahasa untuk aplikasi sintesis
•
StratML: kosakata XML dan skema untuk rencana strategis
•
Streaming
Transformasi
untuk
XML:
sebuah
bahasa
transformasi
XML
dimaksudkan sebagai kecepatan tinggi, konsumsi memori rendah alternatif untuk XSLT. •
Text Encoding Initiative - panduan untuk pengkodean teks, dengan skema dan mekanisme untuk menyesuaikan kebutuhan proyek individual.
•
ThML - Theological Markup Language yang dibuat oleh Christian Classics Ethereal Library (CCEL), untuk membuat teks-teks teologis elektronik.
•
TMX: data memori terjemahan
•
Trex: skema sederhana bahasa
•
Topicmaps
U •
Deskripsi universal Discovery dan Integrasi: registri untuk bisnis di seluruh dunia untuk mendaftarkan diri di Internet
V •
Vector Markup Language: digunakan untuk menghasilkan grafik vektor, diimplementasikan di Microsoft Office 2000 dan lebih tinggi
•
Vexi: upaya internasional untuk menciptakan yang mudah digunakan untuk pengembangan platform dan aplikasi internet pengiriman interface
•
VoiceXML: format untuk menentukan suara interaktif dialog antara manusia dan komputer
•
Penyajian Iklan video Templat luas - Penayangan Iklan Video Template - IAB disponsori bahasa untuk digunakan dalam pengiriman inline / linier dan non-linear video iklan online.
W •
W3C MMI
•
WDDX: Web Distributed Data eXchange
•
WS-Policy
•
Web Ontologi Language: bahasa untuk mendefinisikan dan instantiating Web ontologi (satu set konsep dalam sebuah domain dan hubungan antara konsepkonsep)
•
WSDL: sebuah bahasa berbasis XML yang menyediakan model untuk menggambarkan layanan Web
•
Web Services Dynamic Discovery: spesifikasi teknis yang mendefinisikan sebuah penemuan multicast protokol untuk mencari layanan pada jaringan lokal.
•
Web Services Flow Language: sebuah [bahasa XML yang diusulkan oleh IBM untuk menggambarkan komposisi layanan Web, kemudian digantikan oleh BPEL
•
Web feed
•
Transfer informasi Wellsite bahasa markup standar
•
WiX: Windows installer data
•
WML Wireless Markup Language
•
WordprocessingML: spesifikasi format file untuk menyimpan dokumen elektronik
X •
X3D: sebuah standar untuk real-time 3D komputer grafis, pengganti Virtual Reality Modeling Language (VRML)
•
XAML: sebuah deklaratif XML berbasis grafis vektor markup language
•
XACML: extensible Access Control Markup Language
•
Xap: Antena pola
•
XBEL: XML Bookmark Exchange Bahasa.
•
XBL: digunakan untuk menyatakan perilaku dan penampilan 'XUL'-widget dan elemen XML
•
XBRL: data standar terbuka untuk pelaporan keuangan.
•
xCBL: koleksi spesifikasi XML untuk digunakan dalam e-bisnis.
•
xCal: XML-compliant representasi dari iCalendar standar
•
XCES: standar berbasis XML untuk menata korpus teks
•
XDI: berbagi, menghubungkan, dan sinkronisasi data menggunakan terstruktur dapat dibaca oleh mesin dokumen yang menggunakan RDF kosakata berdasarkan XRI terstruktur pengidentifikasi
•
XDuce: sebuah transformasi XML bahasa
•
XDXF: untuk satu bahasa dan kamus dua bahasa
•
XFA: meningkatkan pemrosesan formulir Web
•
XForms: format untuk spesifikasi model pengolahan data untuk XML data dan user interface (s) untuk data XML, seperti formulir Web
•
XFT: XML bahasa yang digunakan dalam industri perjalanan
•
XHTML: sebuah bahasa markup yang memiliki kedalaman yang sama ekspresi sebagai HTML, tetapi dengan sintaks sesuai dengan XML
•
XHTML Basic
•
XHTML Friends Network
•
XHTML modularisasi
•
XInclude: sebuah model pengolahan dan sintaks untuk tujuan umum inklusi XML
•
XLIFF: XML Localization Interchange File Format, sebuah format yang diciptakan untuk membakukan localization.
•
XLink: bahasa yang digunakan untuk membuat hyperlink di dokumen XML
•
XMLmosaic - Sebuah bahasa pemrograman yang terdapat dalam kode xml. Xml menggambarkan hubungan antara kelas dan berisi prosedur.
•
XMI: sebuah OMG metadata standar untuk bertukar informasi melalui XML. Yang paling umum adalah penggunaan XMI sebagai interchange format untuk UML model
•
XML Encryption: sebuah spesifikasi yang mendefinisikan bagaimana untuk mengenkripsi isi elemen XML
•
XML Information Set: menggambarkan model data abstrak dari dokumen XML dalam bentuk satu set informasi item
•
XML Interface untuk Network Services: definisi dan penerapan aplikasi internet, menegakkan sebuah pendekatan berorientasi spesifikasi.
•
XML Resource: platform independen menyediakan cara menggambarkan jendela di GUI
•
XML Schema: deskripsi jenis dokumen XML, biasanya dinyatakan dalam kendala mengenai struktur dan isi dokumen sejenis, di atas dan di luar kendala sintaks dasar yang dipaksakan oleh XML itu sendiri
•
XML Script: sebuah transformasi XML bahasa, atau teknologi Microsoft preview untuk browser web scripting
•
XML Signature: Sintaks XML untuk tanda tangan digital
•
XML untuk Analisis: analisis akses data di sistem, seperti OLAP dan Data Mining
•
XML pipa: bahasa mengungkapkan bagaimana transformasi XML terhubung bersama-sama
•
XML-RPC: sebuah prosedur remote panggilan protokol yang menggunakan XML untuk mengkodekan dengan panggilan dan HTTP sebagai mekanisme transportasi
•
XMLTerm: Sebuah berbasis Mozilla Semantic User Interface
•
XOMGL: memperoleh data dalam jumlah besar dari instansi pemerintah kota.
•
XOXO: XML microformat untuk penerbitan garis besar, daftar, dan Blogrolls di Web
•
XPDL: interchange Business Process definisi antara berbagai alur kerja produk
•
XPath (atau XPath 1.0): sebuah ekspresi bahasa untuk menangani bagian-bagian dari dokumen XML
•
XPath 2,0: bahasa untuk menangani bagian-bagian dari dokumen XML, XPath penerus 1,0
•
XPointer: sebuah sistem untuk mengatasi komponen dari media internet berbasis XML
•
XQuery: sebuah bahasa query yang dirancang untuk melakukan query data XML koleksi (mirip dengan SQL
•
XRules: sebuah aturan bahasa yang mengungkapkan kendala, perhitungan, saling ketergantungan, dan sifat-sifat yang menggambarkan dan ada di antara elemen dan atribut dari dokumen XML
•
XSIL: XML transportasi berbasis bahasa untuk data ilmiah
•
XSL Formatting Objects: sebuah bahasa markup XML format dokumen yang paling sering digunakan untuk menghasilkan file PDF
•
XSL Transformations: bahasa yang digunakan untuk transformasi dokumen XML.
•
XSPF: sebuah playlist format untuk media digital
•
XMLTV: format untuk mewakili daftar acara TV.
•
XUL: XML antarmuka pengguna bahasa markup yang dikembangkan oleh Mozilla proyek.
•
XUpdate: yang ringan bahasa query untuk memodifikasi data XML
•
XrML: Hak-hak yang Extensible Markup Language, atau Hak Expression Language (REL) untuk MPEG-21
2. Daftar tujuan umum bahasa markup
Tujuan umum bahasa markup adalah bahasa markup yang digunakan untuk lebih dari satu tujuan atau situasi. Lain-lain, yang lebih khusus bahasa markup sering didasarkan pada bahasa-bahasa ini: yaitu, HTML yang berbasis pada sintaks SGML.
3. Daftar bahasa markup dokumen •
Compound Document Format
•
Office Open XML (OOXML) - membuka kantor format standar untuk dokumendokumen:
•
SpreadsheetML - spreadsheet bahasa, bagian Office Open XML.
•
PresentationML - presentasi bahasa, bagian Office Open XML.
•
WordprocessingML wordprocessing bahasa, bagian Office Open XML.
•
Microsoft Office 2003 XML format, pendahulu Office Open XML.
•
OpenDocument (ODF) - membuka kantor format standar untuk dokumen.
•
OpenOffice.org XML - pendahulu OpenDocument.
•
ReportML - Format Laporan bahasa yang berasal dari Microsoft Access. (bukan bagian dari Office Open XML (belum))
•
Uniform Kantor Format (UOF) - terbuka format untuk kantor dokumen, menjadi diselaraskan dengan OpenDocument.
4. Daftar isi bahasa markup sindikasi •
Mayor bahasa markup a. Atom Nama Atom berlaku untuk sepasang standar terkait. Atom Syndication Format adalah sebuah XML bahasa yang digunakan untuk umpan web, sedangkan Atom Publishing Protocol (AtomPub atau APP) adalah sebuah sederhana HTTP berbasis protokol untuk membuat dan memperbarui sumber daya web. b. RSS RSS (paling sering diperluas sebagai "Really Simple Syndication") adalah sebuah keluarga feed web format yang digunakan untuk menerbitkan karya-sering diperbarui, seperti blog entries, berita utama, audio, dan video dalam format standar. Sebuah dokumen RSS (yang disebut "feed", "web feed", atau "channel") mencakup teks penuh atau diringkas, ditambah metadata seperti tanggal penerbitan dan penulisnya.
•
Minor bahasa markup a. FeedSync FeedSync untuk Atom dan RSS, sebelumnya Simple Sharing Extensions, adalah ekstensi untuk RSS dan Atom feed format yang dirancang untuk memungkinkan sinkronisasi informasi dengan menggunakan berbagai sumber data. b. GData [1] GData menyediakan protokol standar yang sederhana untuk membaca dan menulis data pada internet, didesain oleh Google. Common menggabungkan GData XML berbasis format sindikasi (Atom dan RSS) dengan penerbitan feed-sistem yang didasarkan pada Atom Publishing Protocol, ditambah beberapa ekstensi untuk penanganan queries. c. hAtom hAtom adalah konsep Microformat untuk menandai (X) HTML, dengan menggunakan kelas dan atribut rel, konten pada halaman web yang berisi blog entries atau serupa konten kronologis. Ini kemudian dapat diuraikan sebagai feed dalam Atom, sindikasi web standar. d. Hina-Di Hina-Di adalah feed web dibuat dalam format jepang. Ini mentransfer metadata tidak menyusui dalam XML seperti RSS atau Atom feed, tetapi dalam ASCII karakter. e. LIR f. NewsML NewsML adalah sebuah XML standar yang dirancang untuk menyediakan media independen,
kerangka
kerja
struktural
untuk
multi-media.
NewsML
ini
dikembangkan oleh - dan adalah merek dagang terdaftar dari - yang IPTC. Ini adalah berdasarkan struktur, tata letak dan lainnya meninggalkan presentasional fitur untuk style sheet dan presentasi bahasa lain seperti XHTML atau SMIL. g. NewsML-G2 h. EventsML-G2 i. SportsML-G2 j. ICE Informasi dan Konten Exchange (ICE) adalah sebuah XML berbasis protokol yang digunakan untuk konten sindikasi melalui Internet. Dengan menggunakan XML, baik pengirim dan penerima memiliki disepakati bahasa yang digunakan untuk berkomunikasi. Menggunakan sistem Client-Server arsitektur.
k. OCS l. OML OML (O utline M arkup L anguage) merupakan XML format garis. Ini awalnya diusulkan oleh Ray Grieselhuber. Spesifikasi dirancang untuk membangun konsep yang ditemukan dalam OPML, dengan tujuan memperbaiki beberapa keterbatasan. m. OPML OPML (Outline Processor Markup Language) merupakan XML format untuk menguraikan (sering Blogrolls). Awalnya dikembangkan oleh Radio userland sebagai format file asli untuk outliner, aplikasi sejak saat itu telah diadopsi untuk penggunaan lain, yang paling umum adalah untuk bertukar daftar feed web antara umpan web agregator. n. RDF feed RDF feed mengacu pada data feed dalam RDF (dan mungkin sedikit OWL) format. RDF memang bermunculan web semantik bahasa baku ideal untuk menggambarkan benda dunia nyata, dan menghasilkan sumber-sumber data RDF dapat dikonsumsi oleh komputer (yaitu dapat dibaca oleh mesin). Secara teoritis, setiap situs web dapat menciptakan sumber daya RDF untuk semua informasi pada situs web dan membuat mereka tersedia sebagai RDF feed o. RSS kandang RSS kandang adalah cara melampirkan multimedia konten ke RSS feed dengan memberikan URL file yang diasosiasikan dengan sebuah entri, seperti MP3 file ke rekomendasi musik atau foto untuk sebuah catatan harian. Tidak seperti lampiran email, kandang hanyalah hyperlink ke file, file yang sebenarnya data tidak tertanam ke dalam feed p. Sederhana List Extensions List Extensions sederhana diusulkan sebagai perpanjangan teknologi sindikasi yang ada seperti RSS dan Atom untuk memudahkan bagi klien untuk mendukung pemesanan dan menyaring daftar. q. SyncML SyncML (Sinkronisasi Markup Language) adalah nama lama untuk platformindependen standar sinkronisasi informasi. Proyek saat ini disebut sebagai Open Mobile Alliance Data Sinkronisasi dan Device Management. Tujuan SyncML adalah untuk menawarkan sebuah standar terbuka sebagai pengganti yang ada sinkronisasi data solusi, yang kebanyakan agak vendor, aplikasi atau sistem operasi spesifik.
r. XOXO XOXO (extensible Buka XHTML Outlines) adalah sebuah XML microformat untuk menguraikan dibangun di atas XHTML. Dikembangkan oleh beberapa penulis sebagai suatu usaha untuk menggunakan kembali blok bangunan XHTML bukannya tidak perlu menciptakan elemen XML baru / atribut, XOXO didasarkan pada konvensi yang ada untuk menerbitkan garis besar, daftar, dan Blogrolls di Web.
5. Daftar bahasa markup ringan Bahasa markup ringan yang digunakan pada awalnya hanya menampilkan teks yang tidak dapat menampilkan karakter dalam huruf miring atau huruf tebal, jadi metode informal untuk menyampaikan informasi ini harus dikembangkan. Pilihan format ini dilakukan secara alami maju untuk plain-text komunikasi email. 1986 standar internasional SGML menyediakan fasilitas untuk menentukan dan memparsing bahasa markup ringan menggunakan tata bahasa dan tag implikasi. 1998 W3C XML adalah profil SGML yang menghilangkan fasilitas ini. Sebuah bahasa markup ringan adalah bahasa markup dengan sintaks yang sederhana, didesain agar mudah bagi manusia untuk masuk dengan sederhana editor teks, dan mudah dibaca dalam bentuk mentah. Bahasa markup ringan yang digunakan dalam aplikasi di mana orang bisa diharapkan untuk membaca dokumen sumber serta output yang diberikan. Misalnya, seseorang mendownload software perpustakaan mungkin lebih suka untuk membaca dokumentasi di dalam editor teks daripada browser. Aplikasi lain sedang untuk masuk dalam penerbitan berbasis web, seperti weblog dan wiki, di mana antarmuka input sederhana kotak teks. Perangkat lunak server untuk mengkonversi input yang umum bahasa markup dokumen seperti HTML atau XHTML.
6. Daftar user interface markup languages Berikut ini adalah daftar bahasa markup antarmuka pengguna dikategorikan : •
Oleh vendor atau platform
a. Flash 9 MXML 9 OpenLaszlo b. Jawa 9 BML [2]
9 CookSwing 9 SwiXML 9 SwixNG 9 Thinlet 9 Ultrid 9 Vexi 9 Xal 9 XSWT 9 ZUML c. Microsoft 9 XAML 9 MRML 9 [Sunting] 9 Mozilla 9 XUL d. W3C 9 XHTML 9 XFDL 9 XForms e. Lain-lain 9 Curl - juga sebuah bahasa pemrograman 9 GladeXML 9 HTMLR 9 UIML 9 PSML 9 EMML 9 Gul 9 XWT 9 Quix 9 XML Sapiens 9 Bindows 9 Boxely (Website) 9 VTML 9 XHPD
9 Xal 9 MyXaml 9 XRC - digunakan oleh wxWidgets 9 libavg 9 GNUstep Renaissance •
Dengan kualitas dan penerapan 9 UIML UIML adalah pelopor paling awal antarmuka pengguna bahasa markup. Ini adalah standar terbuka dimana pelaksanaan tidak terbatas pada satu vendor. Namun, tidak menarik banyak perhatian. 9 XUL Bahasa antarmuka utama dari Yayasan Mozilla produk XUL. Dokumen XUL yang diberikan oleh Gecko engine, yang juga menjadikan XHTML dan SVG dokumen. Ini bekerja sama dengan banyak standar dan teknologi yang ada, termasuk CSS, JavaScript, DTD dan RDF, yang membuatnya relatif mudah untuk belajar bagi orangorang dengan latar belakang pemrograman web dan desain. 9 Xal Extensible Application Markup Language adalah bahasa Nexaweb's Enterprise Web 2.0 Suite. Pengembang dapat menggunakan bahasa ini untuk menentukan aplikasi yang akan dijalankan sebagai Jawa Klien atau Ajax Klien. 9 EMML EMML adalah Mashup deklaratif Domain Specific Language (DSL) yang bertujuan untuk menciptakan mashup perusahaan. Bahasa yang EMML menyediakan kaya set tingkat tinggi Mashup-domain kosakata untuk mengkonsumsi dan mash berbagai sumber data Web cara yang menarik. EMML menyediakan sintaks yang seragam untuk memohon layanan heterogen gaya: REST, WSDL, RSS / ATOM, RDBMS, dan POJO. EMML juga menyediakan kemampuan untuk mencampur dan mencocokkan data beragam format: XML, JSON, JDBC, JavaObjects, dan tipe primitif. 9 SVG Scalable Vector Graphics adalah sebuah bahasa markup untuk gambar yang diusulkan oleh W3C yang dapat mendukung grafik yang kaya untuk web dan aplikasi mobile. Sementara SVG bukanlah bahasa antarmuka pengguna, itu mencakup dukungan untuk vektor / raster grafik, animasi, interaksi dengan DOM dan CSS, embedded media,
peristiwa dan scriptability. Bila fitur ini digunakan dalam kombinasi, kaya antarmuka pengguna yang mungkin. SVG juga dapat super dipaksakan pada XML lain antarmuka pengguna yang kompatibel bahasa markup, seperti XUL dan XForms, sebagai bagian yang kaya grafis dari antarmuka pengguna. 9 XAML XAML adalah sistem markup yang mendasari komponen antarmuka pengguna Microsoft. NET framework 3.0 dan di atas. Lingkup lebih ambisius daripada kebanyakan antarmuka pengguna bahasa markup, program sejak logika dan gaya juga tertanam dalam XAML dokumen. Fungsional, dapat dilihat sebagai kombinasi XUL, SVG, CSS, dan JavaScript menjadi satu skema XML. Ada orang yang kritis terhadap desain ini, karena banyak standar (seperti yang sudah terdaftar) ada untuk melakukan hal-hal ini. Namun, diharapkan untuk dikembangkan dengan alat visual di mana pengembang bahkan tidak perlu memahami markup yang mendasari. 9 I3ML I3ML adalah hak milik klien tipis mekanisme Pengiriman Aplikasi yang dikembangkan oleh CoKinetic Systems Corp, dengan dukungan yang diberikan oleh klien browser plugin yang akan membuat jendela-seperti aplikasi melalui HTTP bandwidth infrastruktur dengan sedikit kebutuhan. 9 OpenLaszlo (LZX) OpenLaszlo adalah lingkungan runtime yang terdiri dari sebuah lingkungan runtime dan bahasa definisi antarmuka (Laszlo XML - LZX). Deklaratif LZX adalah bahasa antarmuka pengguna yang mendefinisikan widget, aplikasi tata letak dan elemen scripting (menggunakan JavaScript) untuk membuat aplikasi Anda. LZX adalah runtime agnostik dengan runtime yang saat ini sedang dalam mendukung Macromedia / Adobe Flash. Percobaan runtime disebut Laszlo "Legals" yang akan memungkinkan OpenLaszlo (LZX) aplikasi berjalan di beberapa lingkungan runtime, seperti DHTML / AJAX. 9 HMVCUL Hirarkis Model View Controller User Interface Language (HMVCUL) adalah markup XML bahasa antarmuka pengguna yang mendukung penciptaan dan merantai MVC atom komponen tritunggal HMVC digunakan dalam membangun aplikasi GUI. Runtime terkait menyediakan metode yang memungkinkan konfigurasi properti, data
dan peristiwa mengikat masing-masing triad MVC elemen (widget, controller, model). Runtime menyelesaikan pemetaan ini dengan elemen XML didefinisikan dalam sebuah file HMVCUL objek di dalam kerangka, atribut untuk properti atau kejadian. Chaining dicapai dengan mengikuti struktur pohon yang dijelaskan dalam file HMVCUL. 9 Vexi Vexi adalah sebuah aplikasi web antarmuka pengguna platform. Vexi dirancang untuk menjadi "HTML untuk aplikasi" di mana aplikasi kaya mendefinisikan antarmuka lebih sederhana daripada meletakkan halaman web. Aplikasi didefinisikan dalam kombinasi dari XML dan ECMAScript (alias JavaScript). Komunikasi dilakukan melalui HTTP (misalnya xmlrpc, SOAP, REST, dll). Vexi dirancang untuk penciptaan extensible komponen visual dan dilengkapi dengan matang dan penuh fitur widget perpustakaan. 9 WasabiXML XML WasabiXML adalah sebuah bahasa markup yang digunakan untuk mendefinisikan antarmuka grafis di Wasabi powered aplikasi. Hal ini paling sering digunakan dengan Winamp untuk membuat Winamp skins. WasabiXML telah dikembangkan oleh Nullsoft untuk Winamp, tetapi juga dapat digunakan dengan aplikasi lain dengan Wasabi SDK.
7. Daftar bahasa markup grafis vector Berikut ini adalah daftar bahasa markup grafis vektor. •
2D vector graphics 9 Asymptote 9 Computer Graphics Metafile (CGM) 9 Layout Graphics Engine 9 MathML 9 MetaPost 9 NAPLPS (Lapisan presentasi Amerika Utara Protokol Sintaks) 9 Precision Graphics Markup Language (PGML) 9 PSTricks dan PGF / TikZ adalah bahasa untuk menciptakan grafis dalam TeX dokumen. 9 Remote imaging protokol 9 Vector Markup Language (vml)
9 Scalable Vector Graphics (SVG) 9 XAML bahasa antarmuka pengguna grafis untuk menggunakan gambar vektor. 9 Xar 9 Sebuah bahasa deskripsi halaman juga dapat digunakan sebagai grafik vektor 2D markup language. •
3D vector graphics 9 Xgl 9 IGES 9 VRML 9 LANGKAH 9 DWF 9 COLLADA 9 XAML 9 X3D 9 xVRML 9 JT 9 3DXML 9 IPA 9 RRC 9 3D 9 3DF 9 eDrawings 9 HSF 9 XVL 9 STL - Sebuah stereolithography format. 9 U3D - Universal format file 3D 9 Asymptote - Sebuah bahasa yang mengangkat TeX untuk 3D. 9 Media Interaktif Markup Language
8. Daftar bahasa markup layanan Web Jejaring Jagat Jembar ("JJJ") atau World Wide Web ("WWW", atau singkatnya "Web") adalah suatu ruang informasi yang yang dipakai oleh pengenal global yang disebut Uniform Resource Identifier (URI) untuk mengidentifikasi sumber-sumber daya yang
berguna. JJJ sering dianggap sama dengan Internet secara keseluruhan, walaupun sebenarnya ia hanyalah bagian daripadanya.
MARKUP LANGUAGE YANG DAPAT DIGUNAKAN
Berikut bahasa markup yang dapat digunakan : 1. wml (WAP 1.x.) Seperti yang sudah kita ketahui WML suatu markup language yang merupakan pengganti dari HTML untuk media wireless. WML didasari dari XML (eXtensible Markup Language). WML memiliki empat fungsi utama yaitu : •
Presentasi teks dan layout, mencakup teks dan gambar
•
Metafora organisasi Deck/Card (seluruh informasi dalam WML di atur kedalam sekumpulan card dan deck)
•
Navigasi dan hubungan antar Card
•
Parameterisasi String dan manajemen status, seluruh deck WML bisa di parameter WML dibutuhkan untuk menggantikan HTML pada media wireless adalah masalah
kecilnya bandwidth pada jaringan wireless yang akan menyebabkan bottleneck yang hebat apabila tetap digunakan HTML untuk media wireless. 2. xhtml (WAP 2.0) XHTML adalah pada dasarnya gabungan dari HTML (didesain untuk menampilkan data) dan XML (didesain untuk menjelaskan data). XHTML adalah tambahan HTML, ini sangat mirip dengan HTML4.01 dan ini seharusnya untuk mengganti HTML. XHTML lebih “bersih” dibanding HTML dan juga sebuah bahasa mark-up yang disiplin. XHTML adalah sebuah aplikasi dari XML (Extensible Mark-up Languange). XHTML direkomendasikan oleh W2C pada january 2000. 3. chtml (imode, dll.) CHTML (Compact Hypertext Markup Language) – sebuah subsetdari HTML digunakan oleh NTT DoCoMo untuk pelayanan i-mode di Jepang. CHTML ini telah digunakan sejak Februari 1999, dan telah memiliki lebih dari 26 juta pelanggan (terus bertambah) sampai akhir musim panas 2001.
SISTEM MARKUP DAN MASA DEPAN ILMIAH PENGOLAHAN
Dalam beberapa tahun terakhir, pengolahan teks ilmiah telah memasuki tahap reaksioner. Sebelumnya, pengembang sedang bekerja menuju sistem yang akan mendukung sarjana dalam peran mereka sebagai peneliti dan penulis. Membangun ide-ide dari Vannevar Bush, orang-orang seperti Theodor H. Nelson dan Andries van Dam (Drucker, van Dam, Yankelovitch) sistem prototyped dirancang untuk sejajar dengan asosiatif proses berpikir para sarjana meneliti. Demikian pula, Douglas C. Engelbart berusaha untuk meningkatkan akal manusia dengan memberikan bantuan konsep-manipulasi (Engelbart dan bahasa Inggris, Engelbart et al.). Brian K. Reid dikembangkan Scribe, membebaskan penulis dari format keprihatinan dan menyediakan mereka dengan alat terpadu untuk bibliografi dan rujukan manajemen. Meskipun hanya sebagian kecil sarjana yang terpapar ide-ide ini, gerakan ini untuk mengembangkan strategi-strategi baru untuk penelitian dan komposisi. Sejak diperkenalkannya murah dan komputer pribadi yang kuat, kita telah melihat perubahan fokus dari pengembangan strategi-strategi baru tersebut ke arah mencari cara untuk melakukan hal-hal lama dengan lebih cepat. Transisi ini memanifestasikan dirinya dalam bagian melalui perubahan model. Sebelumnya, pengembang bekerja dengan model sarjana sebagai penulis meneliti dan menulis. Baru-baru ini, Namun, model dominan menafsirkan pengarang sebagai juru ketik atau, lebih buruk lagi, sebagai typesetters. Daripada memungkinkan para sarjana untuk melakukan tugas-tugas yang tidak mungkin dilakukan sebelumnya, hari ini meniru sistem mesin ketik. Memang, mesin ketik elektronik ini memiliki built-in search dan cut / paste fasilitas, tapi untuk pengetahuan pengguna, sistem seperti ini hanya menawarkan perbaikan kecil dan mungkin kurang kuat secara keseluruhan dari beberapa sistem yang tersedia sepuluh dan lima belas tahun yang lalu. Ada sejumlah alasan untuk tren ini. Mungkin yang paling penting, transisi dari komputasi terpusat untuk komputasi terdistribusi mulai dalam bisnis dan industri, yang tetap merupakan pasar yang paling menarik untuk pengembang. Secara tradisional, instalasi tersebut mempekerjakan sekretaris untuk mengetikkan dokumen yang sudah substansial lengkap. Satu-satunya alat yang diperlukan dalam lingkungan seperti itu adalah mesin tik, gunting, dan paste-atau sekarang, mereka setara elektronik. Bahkan dalam dunia akademis dikurangi ada dorongan untuk lebih sistem cerdas. Universitas memiliki bisnis mereka sendiri dan kantor-kantor administratif yang membuat baik penggunaan sistem berorientasi bisnis. Selain itu, para sarjana sering kali lebih menyukai sistem ini atas alternatif. Mereka yang memiliki akses ke sistem yang lebih kuat jarang punya
waktu untuk belajar mengeksploitasi mereka sepenuhnya, dan banyak menemukan mereka terlalu rumit untuk digunakan sama sekali. Hal ini cukup dimengerti, karena sebagian besar teks formatters pada minicomputer dan mainframe dikembangkan di bawah model yang bahkan lebih tidak pantas daripada penulis-sebagai-pengetik. Ditulis oleh dan untuk programmer,
sistem
ini
sering
membutuhkan
pemrograman
quasi-keterampilan,
memperlakukan penulis sebagai programer-juru ketik. Kebanyakan sarjana berpengalaman di bidang komputer hanya terlalu senang untuk melarikan diri seperti kasar dan buruk sistem diadaptasi untuk sederhana, praktis program kecil yang membantu mereka mendapatkan teks pada kertas dengan cepat. Karena kurangnya konsep-konsep utama yang diperlukan untuk mengenali beberapa perbaikan dan tidak menyadari kemungkinan-kemungkinan strategi baru untuk penelitian dan komposisi, mereka mundur hujan es gerakan ini sebagai kemajuan besar dalam komputasi ilmiah. Karena tanggapan ini berasal bahkan dari ulama yang paling berpengalaman, ia membawa berat dengan pengembang sistem potensi serta dengan mereka yang baru mulai menggunakan komputer. Semakin banyak sarjana panggilan untuk fasilitas komputasi yang hanya meningkatkan kapasitas mereka untuk mengetik, mereka memberikan tekanan industri menarik dari pembangunan yang signifikan. Konsekuensinya adalah industri yang menempel ke masa lalu; ulama berusaha untuk melakukan apa yang mereka selalu dilakukan, hanya sedikit lebih cepat. 3 Pergeseran dalam menciptakan model-model dominan tiga masalah utama: pertama, insentif bagi penelitian dan pengembangan yang signifikan dalam sistem komputasi menghilang, dan sebagian besar sumber daya telah dialihkan ke dalam peningkatan porsi kecil dari dokumen proses pembangunan. Karena kurangnya waktu untuk melatih diri dalam disiplin lain, banyak dari para ulama yang menetapkan tren dalam pengolahan teks tidak mengerti atau nilai kemungkinan. Selain itu, sumber daya yang diperlukan untuk pengembangan sistem canggih telah sangat underes timated seluruh industri, dan orang-orang menjadi tidak sabar dengan kurangnya segera produk-produk bermanfaat. Dengan demikian, kita melihat jauh lebih banyak perhatian diberikan kepada keyboard, printer, huruf, menampilkan, grafik, warna, dan fitur-fitur yang serupa dibandingkan dengan pengambilan dan penataan informasi atau bahkan untuk verifikasi ejaan dan tata bahasa. 4 Pengembangan alat menyediakan kapasitas baru telah diganti dengan aman dan jelas prosedur tambahan yang nyaman. Kedua, pengembang dan penulis telah kehilangan melihat fakta bahwa ada dua produk dalam pengembangan elektronik dokumen: printout dan "sumber" file. Saat ini semuanya diarahkan menghasilkan cetakan; sumbernya hanya produk, menyia-nyiakan ruang disk yang berharga, berguna untuk sedikit lebih dari menghasilkan
cetakan lain dokumen yang sama. Proprietary format dan kekurangan semantik dan pragmatis coding membuat file-file ini berguna untuk berbagi dengan rekan atau diolah oleh sistem cerdas. Akhirnya, para sarjana 'waktu dan energi dialihkan dari riset dan menulis ke format untuk presentasi akhir. Para penulis artikel ini cukup membayar perhatian pada kualitas pengiriman dan telah mengeset beberapa buku, namun sistem saat ini penulis cenderung untuk memfokuskan perhatian pada penampilan sepanjang waktu, tidak hanya ketika dokumen sudah siap untuk pengiriman. Meskipun tidak ada solusi sederhana untuk semua masalah ini, perbaikan besar di masing-masing dapat dibuat dengan mengkonversi untuk deskriptif markup, yang sudah banyak tersedia. Secara singkat, nilai markup deskriptif telah dikenal karena penulis dan ahli teori percaya dokumen baru sistem pengembangan-yang supertypewriters-tidak memerlukan markup. Goldfarb, salah satu pengembang utama Generalized Markup Language (GML), membuat jelas keuntungan deskriptif markup atas prosedural biasa markup, tetapi karena tidak ada seorang pun telah menganalisis sistem markup sepenuhnya, pengguna percaya bahwa tidak ada markup bahkan lebih baik daripada deskriptif markup. Sebagai analisis kita tentang sistem markup membuat jelas, bagaimanapun, tidak ada yang namanya "tidak ada markup." Semua menulis melibatkan markup. "Tidak ada markup" benar-benar terdiri dari kombinasi presentasi dan punctuational markup. Selain itu, dari jenis bersaing markup, deskriptif markup sebenarnya termudah untuk belajar, mudah untuk digunakan, dan terbaik disesuaikan dengan proses komposisi. Akhirnya, deskriptif markup encode informasi yang diperlukan untuk mengembangkan kedua produk sepenuhnya dalam proses pengembangan dokumen: file sumber serta printout. Karena file sumber berisi kode semantik dan pragmatis, bukan kode untuk memformat, mereka dapat dengan mudah berbagi dengan rekan kerja, diserahkan langsung kepada penerbit, dan diproses oleh aplikasi cerdas jika telah tersedia. 5 Pada bagian pertama dari artikel ini, kami merangkum teori sistem markup dan memperjelas konsep-konsep yang diperlukan untuk mengevaluasi alternatif dengan benar. Sekarang kita akan menyajikan argumen utama untuk keunggulan deskriptif markup atas bentuk-bentuk lain markup.
JENIS MARKUP Punctuational. Punctuational markup terdiri dari penggunaan set yang tertutup tanda sintaksis terutama untuk memberikan informasi tentang ucapan-ucapan tertulis. Tanda baca telah
diteliti selama ratusan tahun dan dianggap sebagai bagian dari sistem tulisan kita. Karena tanda baca relatif stabil, umumnya akrab bagi penulis, dan sangat sering dalam dokumen, harapan yang biasa adalah bahwa penulis akan menekankan file dokumen mereka sama seperti jika mereka mengetik. Sayangnya, markup punctuational menderita dari beberapa kekurangan: sistem ini relatif rumit dan tunduk pada variasi gaya yang cukup besar. Penulis artikel ini, misalnya, tidak setuju tentang penggunaan tanda koma setelah kalimat-kalimat adverbial awal, bahkan, komposisi teratur instruktur tidak setuju pada rincian tersebut. Di samping variasi dalam penggunaan tanda baca yang berbeda-beda dalam penampilan. Sebagai contoh, beberapa orang berkeras strip harus dipisahkan dari kata-kata dengan spasi sekitarnya; lain mengklaim seharusnya tidak ada ruang seperti itu. 8 Bahkan ketika penulis setuju tentang penampilan, ada variasi di perangkat pencetakan. Beberapa perangkat menyediakan kemampuan untuk membedakan terbuka dan menutup-tanda kutip, dan beberapa perangkat membedakan tanda hubung, en dash, dan em tanda hubung. Akhirnya, sistem markup punctuational sangat ambigu. Sebagai contoh, periode digunakan untuk menunjukkan singkatan serta batas-batas kalimat. Ketidakjelasan ini menimbulkan masalah bagi formatters teks, yang sering tidak semestinya memperlakukan kalimat singkatan sebagai batas-batas dan menambahkan spasi tambahan. Authorial bantu seperti ejaan dan tata bahasa yang cukup correctors harus melakukan pengolahan ekstra disambiguate tanda baca dan seringkali harus puas alternatif yang paling mungkin. Mengenali masalah dengan punctuational markup, penulis secara teratur menggunakan markup referensial sebagai gantinya. Sebagai contoh, file sumber untuk artikel ini berisi bukannya "@" atau "-" sehingga penulis akan bebas untuk fokus pada konten dan gaya menunda perundingan sampai akhir. Demikian pula, deskriptif markup yang dapat digunakan untuk mengganti tanda baca di mana markup mengidentifikasi elemen yang logis. Kutipan pendek, misalnya, yang dipisahkan oleh dan q> daripada tanda kutip, teks memungkinkan output formatters untuk membuka dan menutup tanda tanda atau netral, tergantung pada kapasitas layar dan perangkat pencetakan. Selain itu, aplikasi dapat dengan cepat menemukan kutipan, untuk tujuan apa pun keinginan penulis. Jadi tanda baca tidak hanya bagian dari sistem tulisan, yang merupakan jenis dokumen markup yang mungkin berbeda-beda dan digantikan oleh jenis markup. Karena sistem tunduk pada gaya variasi, tergantung pada perangkat pencetakan yang tersedia, dan sangat ambigu, kami berharap untuk melihat lebih banyak dan lebih banyak tanda baca digantikan oleh referensial dan deskriptif markup. Di sisi lain, kita melihat sedikit motivasi untuk penggantian
lengkap punctuational markup. Tidak banyak yang akan diperoleh, misalnya, dengan mengganti standar seperti tanda baca seperti koma dengan markup referensial. Penerbit, atau bahkan formatters teks, bisa menggunakan markup deskriptif untuk menentukan apakah suatu ayat harus ditandai dengan tanda koma atau tanda titik koma, tapi sangat sedikit penulis memiliki cukup pelatihan dalam sintaks untuk mark up frasa dan klausa deskriptif. Akibatnya, punctuational markup akan terus sesuai dan tidak perlu dibahas lebih lanjut dalam artikel ini. Presentasional. Selain untuk menandai elemen-elemen tingkat rendah dengan tanda baca, penulis mark up tingkat yang lebih tinggi entitas dalam berbagai cara untuk membuat presentasi yang lebih jelas. Seperti presentasional markup-markup-horisontal dan vertikal termasuk spasi, folio, halaman istirahat, menyebut satu per satu dari daftar dan catatan, dan sejumlah ad hoc simbol dan perangkat. Sebagai contoh, seorang penulis menandai awal paragraf dengan meninggalkan beberapa ruang vertikal dan horisontal ruang mungkin juga. Kadang-kadang, bahkan penulis nomor paragraf mereka. Demikian pula, sering bab dimulai pada halaman baru, dapat disebutkan dalam berbagai gaya, dan bahkan secara eksplisit diberi label "Bab." Meskipun telah lama dilakukan penulis presentasional markup dalam naskah dan typescripts, kebanyakan sekarang lebih memilih untuk menghasilkan teks yang paling formatters berulang-ulang dan rawan kesalahan markup. Pagination, misalnya, biasanya otomatis bahkan di sebagian besar sistem yang berorientasi pada mesin tik. "Lokal" presentasional markup Namun, seperti garis keterpusatan, masih sering dilakukan oleh penulis, seringkali dengan bantuan perintah edit. Dalam WordStar, misalnya, satu pemogokan urutan kunci Ctrl-OC ke pusat baris saat ini. Prosedural. Dalam banyak sistem pengolahan teks, presentasional markup digantikan oleh prosedural markup, yang terdiri dari perintah-perintah yang menunjukkan bagaimana teks harus diformat. Sebagai contoh, seseorang mungkin mark up kutipan panjang seperti dalam Gambar 1. Markup awal mengarahkan formatter teks untuk melakukan berikut ini (kira-kira): 1. Skip tiga baris-setara dengan jarak dua kali ganda. 2. Indent sepuluh kolom dari kiri dan sepuluh kolom dari kanan. 3. Ubah ke spasi tunggal. 4. Buat halaman baru jika kurang dari dua baris tetap pada halaman saat ini.
Jelas, markup ini khusus untuk teks tertentu formatter dan style sheet. Selain itu, perangkat tergantung; yang melompat, misalnya, mungkin akan diubah ke nilai seperti delapan belas poin untuk printer resolusi tinggi. Prosedural markup khas dikaitkan dengan teks batch formatters, seperti nroff / troff dan TEX. Pengolah kata seperti WordStar, bagaimanapun, suplemen presentasional mereka perintah pengeditan dengan "dot perintah." Sebagai contoh, mereka menggunakan pengeditan baris perintah ke pusat (Ctrl-cc), tetapi termasuk markup dalam file untuk halaman yang ditentukan pengguna istirahat (. Pa). Deskriptif. Di bawah sistem deskriptif markup, penulis mengidentifikasi elemen teks jenis token. Dalam Gambar 1 tag mengidentifikasi teks sebagai berikut kutipan panjang, dan tag lq> mengidentifikasi akhir kutipan. Penulis yang terbiasa markup prosedural sering berpikir deskriptif markup seolah-olah itu prosedural dan mungkin bahkan menggunakan tag prosedural. Perbedaan utama adalah bahwa prosedural markup menunjukkan apa formatter teks tertentu yang harus dilakukan; deskriptif markup menunjukkan apa elemen teks yang bersangkutan, atau dalam istilah yang berbeda, menyatakan bahwa sebagian dari aliran teks adalah anggota kelas tertentu. Ketika teks formatter menghasilkan salinan presentasional deskriptif dokumen bertanda-up, pertama kali dibaca dalam satu set aturan, yang ditulis dalam sistem markup prosedural, yang membentuk apa yang harus dilakukan untuk setiap kemunculan dari setiap elemen tipe. Dengan mengatur seperangkat aturan ini, penulis (atau dukungan orang) menetapkan markup presentasional desain yang akan dijalankan secara otomatis dan secara konsisten. Selain itu, harus ada alasan untuk memodifikasi desain, hanya aturan-aturan akan memerlukan editing; file dokumen tersebut tetap utuh. Tidak hanya akan penulis dibebaskan dari menyakitkan dan monoton jam mekanis mengedit, teks tidak akan terkena korupsi. Kebanyakan sistem berbasis prosedural memberikan fasilitas makro, yang pengguna telah lama dieksploitasi untuk markup deskriptif (misalnya, ms-fasilitas untuk troff), dan bahkan beberapa primitif sistem tersebut dapat deskriptif (misalnya,. Hlm "kata kontrol "untuk paragraf di Waterloo SCRIPT). Generalized Markup Language (GML) memberikan ekspresi suara dasar konseptual untuk penggunaan sistematis deskriptif markup (Goldfarb). Tidak seperti paket-paket makro ad hoc, GML adalah bahasa deskriptif umumnya dilaksanakan di atas jelas berbeda, yang dapat diakses pengguna bahasa prosedural. Selain itu, GML menyumbangkan "atribut" untuk deskriptif bahasa markup, markup yang menyediakan dukungan untuk fungsi-fungsi penting seperti sebagai referensi silang (yang secara otomatis
akan diselesaikan oleh aplikasi). Sistem berpengaruh lain, Scribe, memberlakukan penggunaan deskriptif markup dengan menghilangkan prosedural markup dari normal penulis akses ke sistem. Daripada prosedural tuning markup untuk mengendalikan pemrosesan markup deskriptif, penulis pilih "document format definisi" untuk berbagai jenis dokumen. Pendekatan yang Scribe telah banyak ditiru baru-baru ini, tetapi dengan keberhasilan moderat terbaik. LATEX, misalnya, menyediakan antarmuka tingkat tinggi dengan TEX, yang dirancang untuk menyediakan tingkat rendah typesetting kontrol. Sayangnya, bahkan LATEX awal pengguna harus berpikir dalam hal tingkat rendah markup. Sebagai contoh, tanda kutip berdampingan harus dipisahkan oleh "/,", yang merupakan "perintah typesetting yang menyebabkan TEX untuk memasukkan jumlah ruang yang kecil" (Lamport 13-14). Demikian pula, sejumlah pengolah kata (Microsoft Word, XyWrite, Nota Bene) Scribe yang baru-baru ini mengadopsi dokumen-format definisi di bawah metafora elektronik "style sheet." Nota Bene, misalnya, termasuk perintah pengeditan seperti seperti menggunakan gaya blok untuk kutipan lama dan memiliki kemampuan untuk memformat ulang semua blok ketika style sheet berubah. Sayangnya, gaya-sheet metafora penulis mengarahkan ke presentasi bukan ke arah peran entitas dalam dokumen. Dengan demikian, gaya blok mungkin kelihatannya cocok untuk salah satu dari sejumlah entitas jenis, dan tidak ada yang memotivasi penulis untuk membuat perbedaan yang mungkin penting nanti. Selanjutnya, style sheet cenderung menjadi fitur opsional daripada antarmuka standar. Referensial. Markup referensial mengacu kepada entitas-entitas eksternal terhadap dokumen dan digantikan oleh orang-entitas selama pemrosesan. Kita telah mencatat penggunaan referensial markup device-bergantung tanda baca (misalnya, & mdash; untuk em dash). Karakteristik lain digunakan untuk singkatan, seperti &acm; untuk "Association for Computing Machinery." Referensial markup mungkin juga merujuk kepada entitas-entitas disimpan dalam file terpisah atau bahkan pada sistem komputer yang berbeda. Kebanyakan teks prosedural formatters yang mendukung markup menawarkan fungsi referensial melalui user-defined "variabel" dan file melekatkan atau menyertakan perintah. Sebagian besar Namun, markup referensial dikaitkan dengan sistem markup deskriptif, terutama SGML (ANSI). Metamarkup. Akhirnya, penulis dan metamarkup memberikan dukungan personel dengan fasilitas untuk mengendalikan interpretasi markup dan untuk memperluas kosakata bahasa markup
deskriptif. Prosedural dan sistem deskriptif menyediakan cara untuk mendefinisikan markup karakter pemisah. Selain itu, sistem prosedural meliputi instruksi sebagai define makro, yang biasanya digunakan untuk membuat markup deskriptif yang mewakili serangkaian instruksi pemrosesan. Prosedural markup dalam Gambar 1, misalnya, biasanya akan dimasukkan dalam macro dengan nama-nama seperti quo quo dan akhir. Proses aplikasi yang GML, seperti Waterloo SCRIPT, juga menyediakan tag markup untuk mendefinisikan, untuk menentukan atribut yang valid dan default, dan untuk menunjukkan instruksi apa yang harus dijalankan ketika tag tersebut dijumpai. Akhirnya, pada SGML, metamarkup muncul dalam bentuk "deklarasi markup," yang jumlahnya ada tiga belas macam. Semua dukungan sistem trivial metamarkup, tetapi kebanyakan tidak menyediakan antarmuka yang cocok untuk nonprogrammers. Satu pengecualian yang penting adalah menukelompok yang berorientasi turun dari Xerox Bravo dan Star; InterLeaf, misalnya, memungkinkan penulis untuk membuat tag baru hanya dengan mengetik sampai sekarang belum pengidentifikasi dalam sebuah kotak dialog. Lain telah berusaha untuk menghilangkan perlunya metamarkup dengan menyediakan referensi yang lengkap dan deskriptif kosakata, tetapi upaya semacam itu bertentangan dengan semangat kreativitas manusia.
FITUR
Sebuah fitur umum dari banyak bahasa markup adalah bahwa mereka mencampur teks dari sebuah dokumen dengan markup petunjuk dalam aliran data yang sama atau file. Ini tidak diperlukan; itu adalah mungkin untuk mengisolasi markup dari konten teks, menggunakan pointer, offset, ID, atau metode lain untuk mengkoordinir dua. Seperti "penyanderaan markup" adalah khas untuk representasi internal program yang digunakan untuk bekerja dengan dokumen bertanda-up. Namun, tertanam atau "inline" markup jauh lebih umum di tempat lain. Di sini, misalnya, adalah bagian kecil teks mark up dalam HTML:
Anatidae h1>
Keluarga Anatidae i> meliputi itik, angsa, dan angsa, tapi tidak <em> em> yang erat terkait dengan screamers. p> Kode ditutupi dalam kurung adalah markup instruksi (dikenal sebagai tag), sedangkan teks di antara petunjuk ini adalah teks sebenarnya dari dokumen. Kode h1 p dan em adalah contoh markup semantik, dalam bahwa mereka menggambarkan tujuan yang telah
ditetapkan atau arti dari teks mereka termasuk. Khusus, h1 berarti "ini adalah judul tingkat pertama", p berarti "ini adalah sebuah paragraf", dan em berarti "ini adalah sebuah kata atau frase ditekankan". Suatu program menafsirkan markup struktural seperti dapat menerapkan aturan atau gaya sendiri untuk menyajikan berbagai potongan-potongan teks, menggunakan tipografi diffent, keberanian, ukuran font, lekuk, warna, atau gaya lainnya, seperti yang diinginkan. Sebuah tag seperti "h1" (header level 1) dapat disajikan dalam huruf tebal besar sans-serif typeface, misalnya, atau dalam monospace (mesin tik-gaya) dokumen itu mungkin menggarisbawahi - atau mungkin tidak mengubah presentasi di semua. Sebaliknya, i tag dalam HTML adalah contoh presentasional markup; itu biasanya digunakan untuk menentukan karakteristik tertentu dari teks (dalam hal ini, penggunaan jenis huruf yang miring) tanpa menentukan alasan untuk itu penampilan. The Text Encoding Initiative (TEI) telah menerbitkan pedoman luas untuk cara menyandikan teks yang menarik dalam humaniora dan ilmu sosial, tahun dikembangkan melalui kerjasama internasional. Pedoman ini digunakan oleh proyek-proyek pengkodean dokumen sejarah, karya-karya sarjana tertentu, periode, atau genre, dan sebagainya. Ketika gagasan berasal dari bahasa markup dokumen teks, ada peningkatan penggunaan bahasa markup di daerah lain yang melibatkan presentasi dari berbagai jenis informasi, termasuk playlist, vector graphics, layanan web, sindikasi konten, dan antarmuka pengguna. Sebagian besar aplikasi XML ini karena merupakan yang terdefinisi dengan baik dan bahasa extensible. Penggunaan XML juga menyebabkan kemungkinan menggabungkan beberapa bahasa markup dalam satu profil, seperti XHTML + SMIL dan XHTML + MathML + SVG. Karena bahasa markup, dan lebih umum bahasa deskripsi data (tidak perlu tekstual markup), bukan bahasa pemrograman (mereka adalah data, bukan kode), mereka lebih mudah dimanipulasi daripada pemrograman bahasa - misalnya, halaman web ditampilkan sebagai dokumen HTML, bukan kode C, dan dengan demikian dapat tertanam di dalam halaman web yang lain, ditampilkan ketika hanya sebagian diterima, dan sebagainya. Ini mengarah ke desain web prinsip "Rule of Least Power", yang menganjurkan menggunakan paling tidak (komputasi) kuat yang memenuhi tugas untuk memfasilitasi seperti manipulasi dan digunakan kembali.