สมาคม Unicode
องค์กรไม่แสวงหาผลกำไรที่พัฒนาและดูแล Unicode Standard สมาชิกได้แก่ Apple, Google, Microsoft, Meta และอีกหลายองค์กร
What is the Unicode Consortium?
The Unicode Consortium is the non-profit organization responsible for developing, maintaining, and publishing the Unicode Standard — the universal character encoding used by virtually all modern software. Founded in 1991 in San Jose, California, the Consortium brings together major technology companies, academic institutions, and individual experts to ensure that every writing system in the world is representable in digital text.
Without the Unicode Consortium, every software vendor would maintain its own incompatible encoding, and moving text between systems would require constant conversion. The Consortium eliminated that chaos by creating and stewarding a single, open, royalty-free standard.
Membership and Governance
The Consortium operates on a tiered membership model. Full members (typically large technology corporations) have voting rights on the Unicode Standard itself. Associate members participate in working groups. Supporting members fund the work without voting rights.
Notable full members include: - Apple, Google, Microsoft, IBM, Adobe, SAP - Emojipedia (now Zedge), Netflix, Meta - Government bodies and national standards organizations
The Board of Directors governs the Consortium. Technical decisions are made by the Unicode Technical Committee (UTC), which meets quarterly to review character encoding proposals, emoji submissions, and algorithm changes. Meetings are open for public observation via teleconference.
What the Consortium Produces
| Output | Description |
|---|---|
| Unicode Standard | The core specification (published as a book and online) |
| Unicode Character Database (UCD) | Machine-readable property files for all characters |
| Common Locale Data Repository (CLDR) | Locale data: date formats, currency names, pluralization rules |
| Unicode Collation Algorithm (UCA) | Specification for language-aware text sorting |
| Unicode Technical Standards (UTS) | Extensions to the Standard (e.g., UTS#18: Regular Expressions) |
| Unicode Technical Reports (UTR) | Informative documents on Unicode-related topics |
| Emoji specifications | Official list, names, properties, and ordering of emoji |
The Emoji Process
Emoji are now one of the most visible outputs of the Consortium. Submitting a new emoji requires a formal proposal following documented criteria: uniqueness, anticipated usage, visual distinctiveness, and compatibility. The UTC evaluates proposals at its quarterly meetings; accepted emoji typically appear in a Unicode release 18–24 months after initial acceptance.
Relationship to ISO
The Unicode Consortium co-maintains the character repertoire with ISO/IEC JTC 1/SC 2, which publishes ISO/IEC 10646. The two standards are synchronized at the code point level — every character in Unicode has the same code point in ISO 10646, and vice versa. The standards diverge only in their supplemental specifications (Unicode adds algorithms and properties that 10646 does not).
Contributing to Unicode
Anyone can contribute:
- Propose a character: Submit a formal proposal following the Unicode proposal template
- Report errors: File bugs in the Unicode issue tracker
- Participate in working groups: The Consortium has groups for emoji, CLDR, security, and more
- Attend UTC meetings: Public observers are welcome
Quick Facts
| Property | Value |
|---|---|
| Founded | January 3, 1991 |
| Headquarters | Mountain View, California, USA |
| Legal status | 501(c)(3) non-profit corporation |
| Key output | Unicode Standard |
| Meeting frequency | UTC meets quarterly |
| Co-standard | ISO/IEC 10646 |
| Website | unicode.org |
| Current president | Mark Davis (co-founder) |
คำศัพท์ที่เกี่ยวข้อง
เพิ่มเติมใน มาตรฐาน Unicode
ระนาบ 0 (U+0000–U+FFFF) ประกอบด้วยอักขระที่ใช้บ่อยที่สุด ได้แก่ Latin, Greek, Cyrillic, CJK, Arabic และสัญลักษณ์ส่วนใหญ่ อักขระในระนาบนี้พอดีกับหนึ่งหน่วยรหัส …
จีน ญี่ปุ่น และเกาหลี คำรวมสำหรับบล็อกอักษรจีน Han ที่รวมกันและอักษรที่เกี่ยวข้องใน Unicode CJK Unified Ideographs มีอักขระมากกว่า 20,992 …
The process of mapping Chinese, Japanese, and Korean ideographs that share a …
The individual consonant and vowel components (jamo) of the Korean Hangul writing …
มาตรฐานสากล (ISO/IEC 10646) ที่ซิงโครไนซ์กับ Unicode กำหนดชุดอักขระและจุดรหัสเดียวกัน แต่ไม่มีอัลกอริธึมและคุณสมบัติเพิ่มเติมของ Unicode
มาตรฐานการเข้ารหัสอักขระสากลที่กำหนดหมายเลขเฉพาะ (จุดรหัส) ให้กับทุกอักขระในทุกระบบการเขียน เวอร์ชัน 16.0 มีอักขระที่กำหนดแล้ว 154,998 ตัว
คอลเลกชันไฟล์ข้อมูลที่อ่านได้ด้วยเครื่องซึ่งกำหนดคุณสมบัติอักขระ Unicode ทั้งหมด รวมถึง UnicodeData.txt, Blocks.txt, Scripts.txt และอื่นๆ
Normative or informative documents that are integral parts of the Unicode Standard. …
Informational documents published by the Unicode Consortium covering specific topics like security …
จุดรหัสใดๆ ยกเว้นจุดรหัส surrogate (U+D800–U+DFFF) ชุดค่าที่ถูกต้องซึ่งสามารถแทนอักขระจริงได้ รวมทั้งสิ้น 1,112,064 ค่า