UTF-16/UCS-2
จากวิกิพีเดีย สารานุกรมเสรี
ในคอมพิวเตอร์ UTF-16 (16-bit Unicode Transformation Format) คือการเข้ารหัสตัวอักษรสำหรับยูนิโคด ซึ่งสามารถเข้ารหัสตัวอักษรในยูนิโคดได้ทั้งหมด โดยปกติแล้วแล้วหนึ่งตัวอักษรมีขนาด 16 บิตหรือ 2 ไบต์ ขึ้นอยู่กับวิธีการเข้ารหัสของเครื่อง
[แก้] ตัวอย่าง
รหัส | ตัวอักษร | ค่ารหัส UTF-16 | แบบแสดง* |
---|---|---|---|
122 (hex 7A) | Z ตัวเล็ก (อักษรลาติน) | 007A | z |
27700 (hex 6C34) | น้ำ (ภาษาจีน) | 6C34 | 水 |
119070 (hex 1D11E) | musical G clef | D834 DD1E | 𝄞 |
"水z𝄞" (น้ำ, z, G clef), ในการเข้ารหัสแบบ UTF-16 | ||
---|---|---|
แบบการเข้ารหัส | การเรียงลำดับไบต์ (byte order) | ลำดับไบต์ (byte sequence) |
UTF-16LE | little-endian | 34 6C, 7A 00, 34 D8 1E DD |
UTF-16BE | big-endian | 6C 34, 00 7A, D8 34 DD 1E |
UTF-16 | little-endian, with BOM | FF FE, 34 6C, 7A 00, 34 D8 1E DD |
UTF-16 | big-endian, with BOM | FE FF, 6C 34, 00 7A, D8 34 DD 1E |
* แบบแสดงที่ท่านเห็นอาจไม่ถูกต้อง ขึ้นอยู่กับฟอนต์และซอฟต์แวร์ที่ท่านใช้
[แก้] ดูเพิ่ม
- UTF-8
- Unicode
[แก้] แหล่งข้อมูลอื่น
- บันทึกทางเทคนิค Unicode #12: UTF-16 for Processing
- Unicode FAQ: ความเปลี่ยนแปลงระหว่าง UCS-2 และ UTF-16?
- ติวในสิบนาที แนะนำ UTF-16
- ดัชนีรายชื่อตัวอักษร Unicode
![]() |
UTF-16/UCS-2 เป็นบทความเกี่ยวกับ คอมพิวเตอร์ อุปกรณ์คอมพิวเตอร์ หรือ เครือข่าย ที่ยังไม่สมบูรณ์ ต้องการตรวจสอบ เพิ่มเนื้อหา หรือเพิ่มแหล่งอ้างอิง คุณสามารถช่วยเพิ่มเติมหรือแก้ไข เพื่อให้สมบูรณ์มากขึ้น |
ข้อมูลเกี่ยวกับ UTF-16/UCS-2 ในภาษาอื่น สามารถหาอ่านได้จากเมนู ภาษาอื่น ๆ ด้านซ้ายมือ