Skip to main content

Tag Meta Charset - Tetapkan Pengekodan Watak dalam HTML5

HTML5 Tutorial For Beginners 4 # HTML meta tags (Jun 2026)

HTML5 Tutorial For Beginners 4 # HTML meta tags (Jun 2026)
Anonim

Sebelum pengenalan HTML5, menetapkan pengekodan aksara pada dokumen dengan elemen yang diperlukan untuk menulis garis yang agak kasar di bawah. Ini adalah elemen Meta Charset jika anda menggunakan HTML4 di laman web anda:

Apa yang penting untuk diperhatikan dalam codeare ini ialah tanda petikan yang anda lihat di sekelilingnya kandungan atribut: kandungan = ' teks / html; charset = iso-8859-1 ' . Seperti semua atribut HTML, tanda petikan ini menentukan nilai atribut, menunjukkan bahawa keseluruhan rentetan teks / html; charset = iso-8959-1 adalah kandungan daripada elemen ini.Ini adalah HTML yang betul dan ia adalah bagaimana tali ini dimaksudkan untuk ditulis. Ia juga panjang dan hodoh! Ia juga bukan sesuatu yang anda mungkin ingat dari bahagian atas kepala anda! Dalam kebanyakan kes, pemaju web perlu menyalin dan menyisipkan kod ini dari satu laman web ke mana-mana yang baru yang mereka usahakan kerana menulis ini dari awal adalah banyak bertanya.

HTML5 Memotong Out "Stuff"

HTML5 bukan sahaja menambah beberapa elemen baru kepada bahasa itu, tetapi ia juga memudahkan banyak sintaks HTML, termasuk elemen Meta Charset. Dengan HTML5, anda boleh menambah pengekodan aksara anda dengan lebih mudah untuk mengingati sintaks untukMETA elemen yang anda lihat di bawah:

Bandingkan sintaks yang dipermudahkan kepada apa yang kami tulis pada awal artikel ini, sintaks lama yang digunakan untuk HTML4, dan anda akan melihat betapa mudahnya menulis dan mengingat versi HTML5 sebenarnya. Daripada perlu untuk menyalin dan menampal ini dari tapak yang sedia ada ke mana-mana yang baru anda kerjakan, ini benar-benar sesuatu yang, sebagai pemaju web front-end, anda boleh ingat. Penjimatan masa ini banyak yang tidak banyak, tetapi apabila anda mempertimbangkan kawasan sintaks yang lain yang HTML5 dipermudahkan, penjimatan itu menambah!

Sentiasa Sertakan Pengekodan Watak

Anda harus sentiasa menyertakan pengekodan aksara untuk halaman web anda, walaupun anda tidak pernah bermaksud menggunakan sebarang aksara khas. Jika anda tidak memasukkan pengekodan aksara, tapak anda menjadi rentan terhadap serangan skrip tapak silang menggunakan UTF-7.

Dalam senario ini, anattacker melihat bahawa laman web anda tidak mempunyai pengekodan aksara yang ditakrifkan, jadi ia menipu penyemak imbas memikirkan bahawa pengekodan watak halaman sebenarnya UTF-7. Seterusnya, penyerang menyuntik skrip yang disandikan UTF-7 ke laman web dan tapak anda digodam.Ini jelas bermasalah untuk semua orang yang terlibat, dari syarikat anda kepada pelawat anda. Berita baiknya adalah bahawa ia adalah masalah mudah untuk dielakkan - hanya pastikan anda menambah pengekodan aksara ke semua halaman web anda.

Di mana Tambah Pengekodan Watak

Pengekodan watak untuk laman web harus menjadi baris pertama HTML anda elemen.Ini memastikan bahawa penyemak imbas mengetahui apa pengekodan aksara sebelum ia melakukan apa-apa lagi di halaman selain daripada menentukan doctype dan mengenal pasti bahawa ia adalah halaman HTML. HTML anda harus dibaca:

Menggunakan Pengepala HTTP untuk Keselamatan Tambahan

Anda juga boleh menentukan pengekodan aksara dalam tajuk HTTP. Ini lebih selamat daripada menambahkannya ke halaman HTML, tetapi anda perlu mempunyai akses kepada konfigurasi pelayan atau fail .htaccess, yang bermaksud anda mungkin perlu bekerja dengan penyedia hosting laman web anda untuk mendapatkan akses semacam ini atau memilikinya perubahan untuk anda. Akses adalah benar-benar cabaran di sini. Perubahan itu sendiri adalah mudah, jadi mana-mana penyedia hosting harus dapat membuat perubahan ini untuk anda dengan mudah.

Jika anda menggunakanApache, anda boleh menetapkan set aksara lalai untuk keseluruhan tapak anda dengan menambah: AddDefaultCharset UTF-8 kepada akar anda .htaccess fail. Set aksara lalai Apache adalah ISO-8859-1.