การออกแบบตัวอักษร

เครื่องหมายกำกับเสียง

เครื่องหมายที่เพิ่มบนตัวอักษรเพื่อเปลี่ยนการออกเสียงหรือความหมาย อาจเป็นแบบ precomposed (é U+00E9) หรือ combining (e + ◌́ U+0065+U+0301) ได้แก่ เครื่องหมายเน้นเสียง umlaut cedilla และ tilde

· Updated

What is a Diacritical Mark?

A diacritical mark (also called a diacritic) is a small sign or symbol added to a letter to modify its pronunciation, indicate stress, distinguish between words that would otherwise be spelled identically, or mark grammatical features. Diacritical marks are foundational to most writing systems that use the Latin, Greek, Cyrillic, Arabic, Hebrew, and many other scripts.

Common examples in Latin-script languages include the acute accent (é), grave accent (è), circumflex (ê), umlaut (ü), tilde (ñ), cedilla (ç), and the ring above (å). These are not decorations — they represent distinct sounds and often change the meaning of a word entirely.

Precomposed vs. Combining Forms

Unicode encodes diacritical characters in two ways:

Precomposed characters are single code points that combine a base letter and its diacritic. For example, é is U+00E9 (a single code point). These exist for compatibility with legacy encodings and convenience.

Combining characters are separate diacritical marks (U+0300–U+036F) that attach to the preceding base character. The same é can be represented as U+0065 (e) followed by U+0301 (combining acute accent).

Both representations are canonically equivalent — Unicode Normalization Form C (NFC) prefers precomposed forms, while NFD decomposes them into base + combining sequences.

Diacritic Precomposed Base + Combining
é (e acute) U+00E9 U+0065 + U+0301
ü (u umlaut) U+00FC U+0075 + U+0308
ñ (n tilde) U+00F1 U+006E + U+0303
ç (c cedilla) U+00E7 U+0063 + U+0327

Common Diacritical Marks

Mark Name Example Used In
´ Acute accent é, á, ó French, Spanish, Portuguese, many others
` Grave accent è, à, ù French, Italian
^ Circumflex ê, â, ô French, Romanian
¨ Diaeresis/Umlaut ü, ö, ä German, French, Swedish
~ Tilde ñ, ã, õ Spanish, Portuguese
¸ Cedilla ç, ş French, Turkish, Romanian
° Ring above å, ů Swedish, Norwegian, Czech
ˇ Caron (háček) č, š, ž Czech, Slovak, Slovenian

Typing Diacritical Marks

macOS: Hold a key to see a popover (e.g., hold e to choose é, è, ê). Or use Option key combos: Option+E then E = é.

Windows: Use Alt codes, the Character Map app, or configure a locale keyboard layout.

HTML entities:

&eacute;   <!-- é -->
&Uuml;     <!-- Ü -->
&ntilde;   <!-- ñ -->
&ccedil;   <!-- ç -->

Unicode escape:

"\u00e9"  # é in Python
"\u00fc"  # ü

Quick Facts

Property Value
Unicode block (combining) Combining Diacritical Marks: U+0300–U+036F (112 characters)
Unicode block (extended) Combining Diacritical Marks Extended: U+1AB0–U+1AFF
Precomposed Latin range Latin-1 Supplement U+00C0–U+00FF
Normalization preference NFC (precomposed) for storage; NFD for processing
Languages with most diacritics Vietnamese (5 tone marks + vowel marks), Czech, Polish
Zero-width diacritics Combining characters attach without taking width
Stacking Multiple combining marks can stack on one base character

คำศัพท์ที่เกี่ยวข้อง

เพิ่มเติมใน การออกแบบตัวอักษร

CSS unicode-range

CSS @font-face descriptor specifying which Unicode code points a font should cover. …

Em / En (หน่วยวรรณศิลป์)

Em: ความกว้างเท่ากับขนาดฟอนต์ En: ครึ่งหนึ่งของ em ใช้กำหนดความกว้างของ em dash, em space, en space …

Font Fallback

The mechanism by which a rendering engine substitutes glyphs from a secondary …

OpenType

Modern font format developed by Microsoft and Adobe supporting up to 65,535 …

RTL (Right-to-Left)

ทิศทางของข้อความที่อักขระไหลจากขวาไปซ้าย ใช้กับภาษาอาหรับ ฮีบรู Thaana และอักษรอื่นๆ ต้องใช้อัลกอริทึม Bidirectional เพื่อแสดงผลอย่างถูกต้อง

Web Fonts

Fonts downloaded by the browser to render text, declared via CSS @font-face. …

การปรับระยะอักษร

การปรับระยะห่างระหว่างคู่อักขระเฉพาะเพื่อความสวยงามทางสายตา (เช่น AV, To, LT) เป็นคุณสมบัติของฟอนต์ ไม่ใช่แนวคิด Unicode แต่มีผลต่อการแสดงผลข้อความ Unicode

จุดไข่ปลา

U+2026 HORIZONTAL ELLIPSIS (…) อักขระเดี่ยวที่แทนที่จุดสามจุด ถูกต้องตามหลักการพิมพ์และนับเป็น 1 อักขระแทนที่จะเป็น 3

ช่องว่างที่ไม่ตัดบรรทัด

U+00A0 ช่องว่างที่ป้องกันการขึ้นบรรทัดใหม่ที่ตำแหน่งนั้น HTML: &nbsp; ใช้ระหว่างตัวเลขและหน่วย (100 km) ในชื่อเฉพาะ (Mr. Smith) และหลังคำย่อ

ตัวพิมพ์ใหญ่ขนาดเล็ก

รูปแบบตัวพิมพ์ใหญ่ที่มีความสูงเท่ากับตัวพิมพ์เล็ก CSS: font-variant: small-caps Unicode ยังมีตัวอักษรพิมพ์ใหญ่ขนาดเล็กจริงใน Latin Extended (ᴀ–ᴢ)