การเข้ารหัสข้อมูลข้อความ เหตุใดการเข้ารหัสไบนารี่จึงเป็นสากล วิธีการเขียนโปรแกรม

เรามาดูกันว่าทั้งหมดเสร็จสิ้นอย่างไร แปลงข้อความเป็นรหัสดิจิทัล- อย่างไรก็ตาม บนเว็บไซต์ของเรา คุณสามารถแปลงข้อความใด ๆ ให้เป็นรหัสทศนิยม เลขฐานสิบหก และไบนารี่ได้โดยใช้เครื่องคำนวณโค้ดออนไลน์

การเข้ารหัสข้อความ

ตามทฤษฎีคอมพิวเตอร์ ข้อความใดๆ จะประกอบด้วยอักขระแต่ละตัว อักขระเหล่านี้ได้แก่: ตัวอักษร ตัวเลข เครื่องหมายวรรคตอนตัวพิมพ์เล็ก อักขระพิเศษ (“”, №, () ฯลฯ) และยังมีการเว้นวรรคระหว่างคำด้วย

ฐานความรู้ที่จำเป็น ชุดสัญลักษณ์ที่ฉันเขียนข้อความเรียกว่าตัวอักษร

จำนวนสัญลักษณ์ที่ใช้ในตัวอักษรแสดงถึงพลังของมัน

ปริมาณข้อมูลสามารถกำหนดได้โดยสูตร: N = 2b

  • N คือพลังเดียวกัน (หลายสัญลักษณ์)
  • b - Bit (น้ำหนักของสัญลักษณ์ที่ถ่าย)

ตัวอักษรที่มี 256 สามารถมีอักขระที่จำเป็นได้เกือบทั้งหมด ตัวอักษรดังกล่าวเรียกว่าเพียงพอ

หากเราใช้ตัวอักษรที่มีความจุ 256 และจำไว้ว่า 256 = 28

  • 8 บิตจะเรียกว่า 1 ไบต์เสมอ:
  • 1 ไบต์ = 8 บิต

หากคุณแปลงอักขระแต่ละตัวเป็นรหัสไบนารี่ รหัสข้อความคอมพิวเตอร์นี้จะมีขนาด 1 ไบต์

ข้อมูลข้อความจะมีลักษณะอย่างไรในหน่วยความจำคอมพิวเตอร์?

ข้อความใด ๆ ที่พิมพ์บนแป้นพิมพ์บนแป้นคีย์บอร์ดเราจะเห็นป้ายที่เราคุ้นเคย (ตัวเลขตัวอักษร ฯลฯ ) พวกเขาเข้าสู่ RAM ของคอมพิวเตอร์ในรูปแบบของรหัสไบนารี่เท่านั้น รหัสไบนารี่สำหรับอักขระแต่ละตัวดูเหมือนตัวเลขแปดหลัก เช่น 00111111

เนื่องจากไบต์เป็นหน่วยความจำที่เล็กที่สุดที่สามารถระบุตำแหน่งได้ และหน่วยความจำถูกกำหนดให้กับอักขระแต่ละตัวแยกกัน ความสะดวกในการเข้ารหัสดังกล่าวจึงชัดเจน อย่างไรก็ตาม จำนวนอักขระ 256 ตัวถือเป็นจำนวนที่สะดวกมากสำหรับข้อมูลสัญลักษณ์ใดๆ

โดยปกติแล้ว คำถามก็เกิดขึ้น: อันไหนโดยเฉพาะ? รหัสแปดหลักเป็นของตัวละครแต่ละตัว? และจะแปลงข้อความเป็นรหัสดิจิทัลได้อย่างไร?

กระบวนการนี้มีเงื่อนไขและเรามีสิทธิ์ที่จะคิดสิ่งที่แตกต่างออกไป วิธีการเข้ารหัสอักขระ- อักขระแต่ละตัวมีหมายเลขของตัวเองตั้งแต่ 0 ถึง 255 และแต่ละหมายเลขจะถูกกำหนดรหัสตั้งแต่ 00000000 ถึง 11111111

ตารางการเข้ารหัสคือ "แผ่นโกง" ซึ่งมีการระบุอักขระของตัวอักษรตามหมายเลขซีเรียล คอมพิวเตอร์ประเภทต่างๆ จะใช้ตารางการเข้ารหัสที่แตกต่างกัน

ASCII (หรือ Asci) ได้กลายเป็นมาตรฐานสากลสำหรับคอมพิวเตอร์ส่วนบุคคล โต๊ะมีสองส่วน

ครึ่งแรกเป็นของตาราง ASCII (เป็นครึ่งแรกที่กลายเป็นมาตรฐาน)


การปฏิบัติตามลำดับพจนานุกรมนั่นคือในตารางตัวอักษร (ตัวพิมพ์เล็กและตัวพิมพ์ใหญ่) จะถูกระบุตามลำดับตัวอักษรที่เข้มงวดและตัวเลขเรียงลำดับจากน้อยไปหามากเรียกว่าหลักการของการเข้ารหัสตามลำดับของตัวอักษร

สำหรับอักษรรัสเซียก็มีตามมาด้วย หลักการเข้ารหัสตามลำดับ.

ปัจจุบันนี้ในยุคของเราพวกเขาใช้ทั้งหมด ห้าระบบการเข้ารหัสตัวอักษรรัสเซีย (KOI8-R, Windows, MS-DOS, Macintosh และ ISO) เนื่องจากจำนวนระบบการเข้ารหัสและขาดมาตรฐานเดียวจึงมักเกิดความเข้าใจผิดกับการถ่ายโอนข้อความภาษารัสเซียไปยังรูปแบบคอมพิวเตอร์

หนึ่งในคนแรก มาตรฐานการเข้ารหัสตัวอักษรรัสเซียและบนคอมพิวเตอร์ส่วนบุคคลจะพิจารณา KOI8 (“รหัสแลกเปลี่ยนข้อมูล 8 บิต”) การเข้ารหัสนี้ใช้ในช่วงกลางทศวรรษที่เจ็ดสิบบนคอมพิวเตอร์ ES หลายรุ่น และตั้งแต่กลางทศวรรษที่แปดสิบ เริ่มใช้ในระบบปฏิบัติการ UNIX แรกที่แปลเป็นภาษารัสเซีย

ตั้งแต่ต้นยุค 90 ซึ่งเป็นช่วงเวลาที่ระบบปฏิบัติการ MS DOS ครอบงำ ระบบการเข้ารหัส CP866 ได้ปรากฏขึ้น ("CP" ย่อมาจาก "Code Page")

บริษัทคอมพิวเตอร์ยักษ์ใหญ่ APPLE ซึ่งมีระบบที่เป็นนวัตกรรมใหม่ที่พวกเขาใช้งานอยู่ (Mac OS) กำลังเริ่มใช้ระบบของตนเองในการเข้ารหัสตัวอักษร MAC

องค์การมาตรฐานระหว่างประเทศ (ISO) แต่งตั้งมาตรฐานอื่นสำหรับภาษารัสเซีย ระบบการเข้ารหัสตัวอักษรซึ่งเรียกว่า ISO 8859-5

และระบบการเข้ารหัสตัวอักษรที่พบบ่อยที่สุดในปัจจุบันถูกประดิษฐ์ขึ้นใน Microsoft Windows และเรียกว่า CP1251

ตั้งแต่ช่วงครึ่งหลังของยุค ปัญหาของมาตรฐานในการแปลข้อความเป็นรหัสดิจิทัลสำหรับภาษารัสเซีย และไม่เพียงแต่ได้รับการแก้ไขด้วยการแนะนำระบบที่เรียกว่า Unicode ให้เป็นมาตรฐานเท่านั้น มันถูกแสดงด้วยการเข้ารหัสสิบหกบิต ซึ่งหมายความว่ามีการจัดสรรสองไบต์สำหรับแต่ละอักขระ หน่วยความจำเข้าถึงโดยสุ่ม- แน่นอนว่าด้วยการเข้ารหัสนี้ ต้นทุนหน่วยความจำจะเพิ่มขึ้นสองเท่า อย่างไรก็ตาม ระบบรหัสดังกล่าวอนุญาตให้แปลงอักขระเป็นรหัสอิเล็กทรอนิกส์ได้สูงสุด 65,536 ตัว

ลักษณะเฉพาะของระบบ Unicode มาตรฐานคือการรวมตัวอักษรใดๆ เข้าด้วยกัน ไม่ว่าจะเป็นที่มีอยู่ สูญพันธุ์ หรือถูกประดิษฐ์ขึ้น ท้ายที่สุดแล้ว ตัวอักษรใดๆ ก็ตาม นอกจากนี้ ระบบ Unicode ยังมีสัญลักษณ์ทางคณิตศาสตร์ เคมี ดนตรี และทั่วไปอีกมากมาย

ลองใช้ตาราง ASCII เพื่อดูว่าคำในหน่วยความจำของคอมพิวเตอร์ของคุณมีลักษณะอย่างไร


บ่อยครั้งที่ข้อความของคุณซึ่งเขียนด้วยตัวอักษรจากตัวอักษรรัสเซียไม่สามารถอ่านได้เนื่องจากความแตกต่างในระบบการเข้ารหัสตัวอักษรบนคอมพิวเตอร์ นี่เป็นปัญหาที่พบบ่อยมากซึ่งพบค่อนข้างบ่อย


หน่วยข้อมูลขั้นต่ำคือบิตและไบต์

หนึ่ง bit ช่วยให้คุณสามารถเข้ารหัสได้ 2 ค่า (0 หรือ 1)

โดยใช้ สองบิตสามารถเข้ารหัสได้ 4 ค่า: 00, 01, 10, 11

สามบิตถูกเข้ารหัส 8 ค่าที่แตกต่างกัน: 000, 001, 010, 011, 100, 101, 110, 111

จากตัวอย่างข้างต้นจะเห็นได้ว่าการเพิ่มหนึ่งบิตจะเพิ่มจำนวนค่าที่สามารถเข้ารหัสได้เป็นสองเท่า:

เข้ารหัส 1 บิต -> 2 ค่าที่แตกต่างกัน (2 1 = 2)

เข้ารหัส 2 บิต -> 4 ค่าที่แตกต่างกัน (2 2 = 4)

เข้ารหัส 3 บิต -> 8 ค่าที่แตกต่างกัน (2 3 = 8)

เข้ารหัส 4 บิต -> 16 ค่าที่แตกต่างกัน (2 4 = 16)

เข้ารหัส 5 บิต -> 32 ค่าที่แตกต่างกัน (2 5 = 32)

เข้ารหัส 6 บิต -> 64 ค่าที่แตกต่างกัน (2 6 = 64)

เข้ารหัส 7 บิต -> 128 ค่าที่แตกต่างกัน (2 7 = 128)

เข้ารหัส 8 บิต -> 256 ค่าที่แตกต่างกัน (2 8 = 256)

เข้ารหัส 9 บิต -> 512 ค่าที่แตกต่างกัน (2 9 = 512)

เข้ารหัส 10 บิต -> 1024 ค่าที่แตกต่างกัน (2 10 = 1024)

เราจำได้ว่าหนึ่งไบต์ไม่ใช่ 9 หรือ 10 บิต แต่มีเพียง 8 ดังนั้นการใช้หนึ่งไบต์จึงสามารถเข้ารหัสอักขระที่แตกต่างกันได้ 256 ตัว คุณคิดว่านี่มากหรือน้อย? ลองดูตัวอย่างการเข้ารหัส ข้อมูลข้อความ.

ภาษารัสเซียมีตัวอักษร 33 ตัว ดังนั้นการเข้ารหัสจึงต้องมี 33 ไบต์ คอมพิวเตอร์จะแยกความแตกต่างระหว่างตัวอักษรขนาดใหญ่ (ตัวพิมพ์ใหญ่) และตัวอักษรตัวเล็ก (ตัวพิมพ์เล็ก) เฉพาะในกรณีที่เข้ารหัสด้วยรหัสที่แตกต่างกัน ซึ่งหมายความว่าในการเข้ารหัสตัวอักษรขนาดใหญ่และเล็กของตัวอักษรรัสเซีย ต้องใช้ขนาด 66 ไบต์

สำหรับตัวอักษรภาษาอังกฤษขนาดใหญ่และเล็ก จะต้องเพิ่มอีก 52 ไบต์ ผลลัพธ์คือ 66 + 52 = 118 ไบต์ ที่นี่คุณต้องเพิ่มตัวเลข (ตั้งแต่ 0 ถึง 9) สัญลักษณ์ช่องว่าง เครื่องหมายวรรคตอนทั้งหมด: จุด จุลภาค ขีดกลาง เครื่องหมายอัศเจรีย์และคำถาม วงเล็บ: กลม หยิกและสี่เหลี่ยม รวมถึงสัญลักษณ์ของการดำเนินการทางคณิตศาสตร์: + , –, =, / (นี่คือการหาร), * (นี่คือการคูณ) มาเพิ่มอักขระพิเศษกัน: %, $, &, @, #, No. ฯลฯ เมื่อนำมารวมกันแล้วจะมีอักขระที่แตกต่างกันประมาณ 256 ตัว

แล้วก็เหลืออะไรให้ทำอีกนิดหน่อย จำเป็นต้องตรวจสอบให้แน่ใจว่าทุกคนบนโลกตกลงกันเองว่าจะกำหนดรหัสใด (ตั้งแต่ 0 ถึง 255 หรือทั้งหมดคือ 256 ทั้งหมด) ให้กับสัญลักษณ์ สมมติว่าทุกคนเห็นพ้องต้องกันว่ารหัส 33 หมายถึงเครื่องหมายอัศเจรีย์ (!) และรหัส 63 หมายถึงเครื่องหมายคำถาม (?) และเช่นเดียวกันกับสัญลักษณ์ที่ใช้ทั้งหมด ซึ่งหมายความว่าข้อความที่พิมพ์โดยบุคคลหนึ่งบนคอมพิวเตอร์สามารถอ่านและพิมพ์โดยบุคคลอื่นบนคอมพิวเตอร์เครื่องอื่นได้เสมอ

ตาราง ASCII

ข้อตกลงสากลเกี่ยวกับการใช้บางสิ่งแบบเดียวกันนี้เรียกว่า มาตรฐาน- ในกรณีของเรา มาตรฐานควรเป็นตารางที่บันทึกความสอดคล้องของรหัส (ตั้งแต่ 0 ถึง 255) และสัญลักษณ์ ตารางดังกล่าวเรียกว่า ตารางการเข้ารหัส

แต่มันไม่ง่ายขนาดนั้น อย่างไรก็ตาม สัญลักษณ์ที่ดี เช่น สำหรับกรีซ ไม่เหมาะกับตุรกีเพราะมีการใช้ตัวอักษรอื่นที่นั่น ในทำนองเดียวกัน สิ่งที่ดีสำหรับสหรัฐอเมริกาก็ไม่ดีสำหรับรัสเซีย และสิ่งที่ดีสำหรับรัสเซียก็ไม่ดีสำหรับเยอรมนี

ดังนั้นเราจึงตัดสินใจแบ่งตารางโค้ดออกเป็นสองส่วน

รหัส 128 ตัวแรก (ตั้งแต่ 0 ถึง 127) ควรเป็นรหัสมาตรฐานและบังคับสำหรับทุกประเทศและสำหรับคอมพิวเตอร์ทุกเครื่อง ได้แก่ - ระหว่างประเทศมาตรฐาน.

และด้วยครึ่งหลังของตารางรหัส (จาก 128 ถึง 255) แต่ละประเทศสามารถทำอะไรก็ได้ที่ต้องการและสร้างมาตรฐานของตัวเองในครึ่งนี้ - ระดับชาติ.

ครึ่งแรก (สากล) ของตารางโค้ดเรียกว่า โต๊ะแอสกี, ซึ่งถือกำเนิดขึ้นในประเทศสหรัฐอเมริกาและเป็นที่ยอมรับไปทั่วโลก มาตรฐาน ASCII จะไม่รับผิดชอบต่อครึ่งหลังของตารางโค้ด ประเทศต่างๆ สร้างตารางรหัสประจำชาติของตนเองที่นี่ อาจเป็นไปได้ว่าภายในประเทศหนึ่งมีมาตรฐานที่แตกต่างกันสำหรับระบบคอมพิวเตอร์ที่แตกต่างกัน แต่เฉพาะภายในครึ่งหลังของตารางโค้ดเท่านั้น

รหัสจากตาราง ASCII สากล

0-31 – อักขระพิเศษที่ไม่ได้พิมพ์บนหน้าจอหรือเครื่องพิมพ์ แต่ใช้เพื่อดำเนินการพิเศษ (เช่น สำหรับ "การขึ้นบรรทัดใหม่" - การย้ายข้อความไปยังบรรทัดใหม่ หรือสำหรับ "แท็บ" - วางเคอร์เซอร์ที่ ตำแหน่งพิเศษในข้อความบรรทัด ฯลฯ)

32 – ช่องว่าง (ตัวคั่นระหว่างคำก็เป็นอักขระที่จะเข้ารหัสด้วย แม้ว่าจะแสดงเป็น "ช่องว่าง" ระหว่างคำและอักขระก็ตาม)

33-47 – อักขระพิเศษ (วงเล็บ ฯลฯ) และเครื่องหมายวรรคตอน (จุด จุลภาค ฯลฯ)

48-57 – ตัวเลขตั้งแต่ 0 ถึง 9

58-64 – สัญลักษณ์ทางคณิตศาสตร์ (บวก (+), ลบ (-), คูณ (*), หาร (/) ฯลฯ) และเครื่องหมายวรรคตอน (โคลอน อัฒภาค ฯลฯ)

65-90 – ตัวพิมพ์ใหญ่ (ตัวพิมพ์เล็ก) ตัวอักษรภาษาอังกฤษ

91-96 – อักขระพิเศษ (วงเล็บเหลี่ยม ฯลฯ)

97-122 – ตัวอักษรภาษาอังกฤษตัวเล็ก (ตัวพิมพ์เล็ก)

123-127 – อักขระพิเศษ (วงเล็บปีกกา ฯลฯ)

นอกตาราง ASCII เริ่มจากหมายเลข 128 ถึง 159 มีตัวอักษรรัสเซียตัวพิมพ์ใหญ่ (ตัวพิมพ์ใหญ่) และตั้งแต่ 160 ถึง 170 และตั้งแต่ 224 ถึง 239 มีตัวอักษรรัสเซียตัวเล็ก (ตัวพิมพ์เล็ก)

การเข้ารหัสคำว่า WORLD

เมื่อใช้การเข้ารหัสที่แสดงนี้ เราสามารถจินตนาการได้ว่าคอมพิวเตอร์เข้ารหัสแล้วทำซ้ำอย่างไร เช่น คำว่า WORLD (ด้วยตัวพิมพ์ใหญ่) คำนี้แสดงด้วยรหัสสามรหัส: ตัวอักษร M สอดคล้องกับรหัส 140 (ตามระบบการเข้ารหัสระดับชาติของรัสเซีย) ฉันคือรหัส 136 และ P คือ 144

แต่ดังที่ได้กล่าวไว้ข้างต้น คอมพิวเตอร์รับรู้ข้อมูลในรูปแบบไบนารี่เท่านั้น เช่น เป็นลำดับของเลขศูนย์และเลข แต่ละไบต์ที่สอดคล้องกับตัวอักษรแต่ละตัวของคำว่า WORLD จะมีลำดับของเลขศูนย์และหนึ่งแปดตัว การใช้กฎสำหรับการแปลงข้อมูลทศนิยมเป็นไบนารี่คุณสามารถแทนที่ค่าทศนิยมของรหัสตัวอักษรด้วยไบนารี่ได้

เลขฐานสิบ 140 สอดคล้องกับเลขฐานสอง 10001100 ซึ่งสามารถตรวจสอบได้โดยการคำนวณต่อไปนี้: 2 7 + 2 3 +2 2 = 140 ค่ากำลังที่แต่ละ “2” ยกขึ้นคือหมายเลขตำแหน่งของเลขฐานสอง 10001100 ซึ่งมี “1” " และตำแหน่งจะมีหมายเลขจากขวาไปซ้าย โดยเริ่มจากหมายเลขตำแหน่งศูนย์: 0, 1, 2 ฯลฯ

คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับการแปลงตัวเลขจากระบบตัวเลขหนึ่งไปอีกระบบหนึ่งได้ เช่น จากหนังสือเรียนวิทยาการคอมพิวเตอร์หรือทางอินเทอร์เน็ต

ในทำนองเดียวกัน คุณสามารถตรวจสอบว่าหมายเลข 136 ตรงกับเลขฐานสอง 10001000 (ตรวจสอบ: 2 7 + 2 3 = 136) และหมายเลข 144 ตรงกับเลขฐานสอง 10010000 (ตรวจสอบ: 2 7 + 2 4 = 144)

ดังนั้น คำว่า WORLD จะถูกจัดเก็บไว้ในคอมพิวเตอร์ตามลำดับของศูนย์และหนึ่ง (บิต): 10001100 10001000 10010000

แน่นอนว่าการแปลงข้อมูลทั้งหมดที่แสดงข้างต้นเสร็จสิ้นโดยใช้โปรแกรมคอมพิวเตอร์และผู้ใช้จะมองไม่เห็น พวกเขาสังเกตเฉพาะผลลัพธ์การทำงานของโปรแกรมเหล่านี้ทั้งเมื่อป้อนข้อมูลโดยใช้แป้นพิมพ์และเมื่อแสดงบนหน้าจอมอนิเตอร์หรือบนเครื่องพิมพ์

ควรสังเกตว่าในระดับความรู้คอมพิวเตอร์ ผู้ใช้คอมพิวเตอร์ไม่จำเป็นต้องรู้ระบบเลขฐานสอง ก็เพียงพอแล้วที่จะมีความเข้าใจเกี่ยวกับรหัสอักขระทศนิยม ในทางปฏิบัติมีเพียงโปรแกรมเมอร์ระบบเท่านั้นที่ใช้ระบบเลขฐานสอง เลขฐานสิบหก ฐานแปด และระบบตัวเลขอื่นๆ นี่เป็นสิ่งสำคัญอย่างยิ่งสำหรับพวกเขาเมื่อคอมพิวเตอร์สร้างข้อความแสดงข้อผิดพลาดของซอฟต์แวร์ซึ่งระบุค่าที่ผิดพลาดโดยไม่ต้องแปลงเป็นทศนิยม

แบบฝึกหัดความรู้คอมพิวเตอร์ช่วยให้คุณเห็นและสัมผัสถึงระบบการเข้ารหัสที่อธิบายไว้ในบทความได้อย่างอิสระ

ป.ล.บทความนี้จบลงแล้ว แต่คุณยังสามารถอ่านได้:



พี.พี.เอส.ถึง สมัครสมาชิกเพื่อรับบทความใหม่ซึ่งยังไม่มีในบล็อก:
1) กรอกที่อยู่อีเมลของคุณในแบบฟอร์มนี้

การเข้ารหัสข้อมูลข้อความแบบไบนารี

ตั้งแต่ช่วงปลายทศวรรษที่ 60 เป็นต้นมา คอมพิวเตอร์ได้ถูกนำมาใช้ในการประมวลผลข้อมูลข้อความมากขึ้น และในปัจจุบันคอมพิวเตอร์ส่วนบุคคลส่วนใหญ่ในโลก (และส่วนใหญ่) มีส่วนร่วมในการประมวลผลข้อมูลข้อความ

ตามเนื้อผ้า ในการเข้ารหัสอักขระหนึ่งตัว จะใช้จำนวนข้อมูลเท่ากับ 1 ไบต์ นั่นคือ I = 1 ไบต์ = 8 บิต

ในการเข้ารหัสอักขระหนึ่งตัว จำเป็นต้องมีข้อมูล 1 ไบต์

หากเราถือว่าสัญลักษณ์เป็นเหตุการณ์ที่เป็นไปได้ การใช้สูตร (2.1) เราจะคำนวณได้ว่าสามารถเข้ารหัสสัญลักษณ์ต่างๆ ได้กี่ตัว:

ยังไม่มีข้อความ = 2 ฉัน = 2 8 = 256.

จำนวนอักขระนี้เพียงพอที่จะแสดงข้อมูลข้อความ รวมถึงตัวอักษรตัวพิมพ์ใหญ่และตัวพิมพ์เล็กของตัวอักษรรัสเซียและละติน ตัวเลข เครื่องหมาย สัญลักษณ์กราฟิก ฯลฯ

การเข้ารหัสประกอบด้วยการกำหนดรหัสทศนิยมที่ไม่ซ้ำกันให้กับอักขระแต่ละตัวตั้งแต่ 0 ถึง 255 หรือรหัสไบนารี่ที่เกี่ยวข้องตั้งแต่ 00000000 ถึง 11111111 ดังนั้น บุคคลจึงแยกแยะอักขระตามการออกแบบ และคอมพิวเตอร์ตามรหัส

เมื่อป้อนข้อมูลข้อความลงในคอมพิวเตอร์ ข้อมูลนั้นจะถูกเข้ารหัสแบบไบนารี รูปภาพของสัญลักษณ์จะถูกแปลงเป็นรหัสไบนารี่ ผู้ใช้กดปุ่มที่มีสัญลักษณ์บนแป้นพิมพ์และส่งพัลส์ไฟฟ้าแปดพัลส์ (รหัสไบนารี่ของสัญลักษณ์) ไปยังคอมพิวเตอร์ รหัสอักขระจะถูกจัดเก็บไว้ใน RAM ของคอมพิวเตอร์ ซึ่งใช้พื้นที่หนึ่งไบต์

ในกระบวนการแสดงสัญลักษณ์บนหน้าจอคอมพิวเตอร์ กระบวนการย้อนกลับจะดำเนินการ - ถอดรหัสนั่นคือการแปลงรหัสสัญลักษณ์ให้เป็นรูปภาพ

สิ่งสำคัญคือการกำหนดรหัสเฉพาะให้กับสัญลักษณ์นั้นเป็นเรื่องของข้อตกลง ซึ่งบันทึกไว้ในตารางรหัส รหัส 33 ตัวแรก (ตั้งแต่ 0 ถึง 32) ไม่ตรงกับอักขระ แต่สอดคล้องกับการดำเนินการ (การป้อนบรรทัด การป้อนช่องว่าง และอื่นๆ)

รหัส 33 ถึง 127 เป็นรหัสสากลและสอดคล้องกับอักขระของตัวอักษรละติน ตัวเลข สัญลักษณ์ทางคณิตศาสตร์ และเครื่องหมายวรรคตอน

รหัสตั้งแต่ 128 ถึง 255 เป็นรหัสประจำชาติ กล่าวคือ ในการเข้ารหัสระดับประเทศ อักขระที่แตกต่างกันจะสอดคล้องกับรหัสเดียวกัน ขออภัย ขณะนี้มีตารางการเข้ารหัสที่แตกต่างกันห้าตารางสำหรับตัวอักษรรัสเซีย (KOI8, SR1251, SR866, Mac, ISO - ตาราง 1.3) ดังนั้นข้อความที่สร้างขึ้นในการเข้ารหัสหนึ่งจะไม่แสดงอย่างถูกต้องในอีกอันหนึ่ง

ปัจจุบัน Unicode มาตรฐานสากลใหม่ได้แพร่หลายมากขึ้น ซึ่งไม่ได้จัดสรรหนึ่งไบต์สำหรับแต่ละอักขระ แต่มีสองไบต์ ดังนั้นจึงสามารถใช้เข้ารหัสได้ไม่ใช่ 256 อักขระ แต่ N = 216 = = 65536 อักขระที่แตกต่างกัน การเข้ารหัสนี้รองรับแพลตฟอร์ม Microsoft Windows & Office เวอร์ชันล่าสุด (ตั้งแต่ปี 1997)

การเข้ารหัสแต่ละรายการจะถูกระบุโดยตารางรหัสของตัวเอง ดังที่เห็นได้จากตาราง 1.3 รหัสไบนารี่เดียวกันในการเข้ารหัสที่แตกต่างกันจะได้รับการกำหนดสัญลักษณ์ที่แตกต่างกัน

ตัวอย่างเช่น ลำดับของรหัสตัวเลข 221, 194, 204 ในการเข้ารหัส CP1251 จะสร้างคำว่า "คอมพิวเตอร์" ในขณะที่การเข้ารหัสอื่นๆ จะเป็นชุดอักขระที่ไม่มีความหมาย

โชคดี ในกรณีส่วนใหญ่ผู้ใช้ไม่ต้องกังวลกับการแปลงรหัสเอกสารข้อความ เนื่องจากทำได้โดยโปรแกรมแปลงพิเศษที่มีอยู่ในแอปพลิเคชัน

การกำหนดรหัสตัวเลขของอักขระ

1. เปิดโปรแกรมแก้ไขข้อความ MS Word 2002 ป้อนคำสั่ง [Insert-Symbol...] กล่องโต้ตอบจะปรากฏขึ้นบนหน้าจอ เครื่องหมาย- ส่วนกลางของกล่องโต้ตอบจะถูกครอบครองโดยตารางอักขระสำหรับแบบอักษรเฉพาะ (เช่น Times New Roman)



อักขระจะถูกจัดเรียงตามลำดับจากซ้ายไปขวาและทีละบรรทัดโดยเริ่มจากอักขระ ช่องว่างที่มุมซ้ายบนและลงท้ายด้วยตัวอักษร "I" ที่มุมขวาล่างของตาราง

เลือกสัญลักษณ์จากรายการแบบเลื่อนลง จาก:ประเภทการเข้ารหัส ในช่องข้อความ รหัสลงนาม:รหัสตัวเลขจะปรากฏขึ้น

การป้อนอักขระด้วยรหัสตัวเลข

1. เปิดโปรแกรมมาตรฐาน สมุดบันทึก- ใช้แป้นพิมพ์ตัวเลขเพิ่มเติมขณะกดปุ่ม Alt ค้างไว้ ป้อนหมายเลข 0224 แล้วปล่อยปุ่ม Alt สัญลักษณ์ "a" จะปรากฏในเอกสาร ทำซ้ำขั้นตอนสำหรับรหัสตัวเลขตั้งแต่ 0225 ถึง 0233 ลำดับอักขระ "abvgdezhy" 12 ตัวในการเข้ารหัส Windows (CP1251) จะปรากฏในเอกสาร

2. ใช้แป้นพิมพ์ตัวเลขเพิ่มเติมขณะกดปุ่ม (Alt) ป้อนหมายเลข 224 สัญลักษณ์ "p" จะปรากฏในเอกสาร ทำซ้ำขั้นตอนสำหรับรหัสตัวเลขตั้งแต่ 225 ถึง 233 โดยลำดับอักขระ 12 ตัว “rstufhtchshshch” ในการเข้ารหัส MS-DOS (CP866) จะปรากฏในเอกสาร



งานภาคปฏิบัติ

1.29. ใช้ตารางอักขระ (MS Word) เขียนลำดับรหัสตัวเลขทศนิยมในการเข้ารหัส Windows (CP1251) สำหรับคำว่า "คอมพิวเตอร์"

1.30. ใช้ Notepad กำหนดคำในการเข้ารหัส Windows (CP1251) ที่ระบุตามลำดับรหัสตัวเลข: 225, 224, 233,242

1.31. ลำดับตัวอักษรใดในการเข้ารหัส KOI8 และ ISO จะสอดคล้องกับคำว่า "คอมพิวเตอร์" ที่เขียนด้วยการเข้ารหัส CP1251

กระบวนการทางคอมพิวเตอร์ จำนวนมากข้อมูล. ไฟล์เสียง รูปภาพ ข้อความ ทั้งหมดนี้ต้องเล่นหรือแสดงบนหน้าจอ เหตุใดการเข้ารหัสไบนารี่จึงเป็นวิธีการสากลในการเขียนโปรแกรมข้อมูลของอุปกรณ์ทางเทคนิคใดๆ

ความแตกต่างระหว่างการเข้ารหัสและการเข้ารหัสคืออะไร?

บ่อยครั้งที่ผู้คนถือเอาแนวคิด "การเข้ารหัส" และ "การเข้ารหัส" ทั้งที่จริงๆ แล้วมีความหมายต่างกัน ดังนั้นการเข้ารหัสจึงเป็นกระบวนการในการแปลงข้อมูลเพื่อจุดประสงค์ในการซ่อนข้อมูล คนที่เปลี่ยนข้อความหรือผู้ที่ได้รับการฝึกมาเป็นพิเศษมักจะสามารถถอดรหัสได้ การเข้ารหัสใช้ในการประมวลผลข้อมูลและทำให้การทำงานง่ายขึ้น โดยปกติแล้วจะใช้ตารางการเข้ารหัสทั่วไปที่ทุกคนคุ้นเคย มันมีอยู่ในคอมพิวเตอร์

หลักการเข้ารหัสแบบไบนารี

การเข้ารหัสแบบไบนารีขึ้นอยู่กับการใช้อักขระเพียงสองตัว - 0 และ 1 - เพื่อประมวลผลข้อมูลที่ใช้โดยอุปกรณ์ต่างๆ สัญญาณเหล่านี้เรียกว่าเลขฐานสองในภาษาอังกฤษ - เลขฐานสองหรือบิต อักขระแต่ละตัวใช้หน่วยความจำคอมพิวเตอร์ 1 บิต เหตุใดการเข้ารหัสไบนารี่จึงเป็นวิธีสากลในการประมวลผลข้อมูล ความจริงก็คือคอมพิวเตอร์จะประมวลผลอักขระน้อยลงได้ง่ายกว่า ประสิทธิภาพของพีซีขึ้นอยู่กับสิ่งนี้โดยตรง: ยิ่งอุปกรณ์จำเป็นต้องทำงานน้อยลงเท่าใด ความเร็วและคุณภาพของงานก็จะยิ่งสูงขึ้นเท่านั้น

หลักการของการเข้ารหัสไบนารี่ไม่ได้พบเฉพาะในการเขียนโปรแกรมเท่านั้น ด้วยการสลับจังหวะเสียงกลองที่น่าเบื่อและดังสลับกัน ชาวโพลินีเซียจึงส่งข้อมูลถึงกัน หลักการที่คล้ายกันนี้ใช้กับเสียงที่ยาวและสั้นในการถ่ายทอดข้อความ “อักษรโทรเลข” ยังคงใช้อยู่จนทุกวันนี้

การเข้ารหัสไบนารี่ใช้ที่ไหน?

ไบนารี่ถูกใช้ทุกที่ในคอมพิวเตอร์ แต่ละไฟล์ ไม่ว่าจะเป็นเพลงหรือข้อความ จะต้องได้รับการตั้งโปรแกรมเพื่อให้สามารถประมวลผลและอ่านในภายหลังได้อย่างง่ายดาย ระบบการเข้ารหัสไบนารี่มีประโยชน์สำหรับการทำงานกับสัญลักษณ์และตัวเลข ไฟล์เสียง และกราฟิก

การเข้ารหัสไบนารี่ของตัวเลข

ขณะนี้ในคอมพิวเตอร์ตัวเลขจะถูกนำเสนอในรูปแบบรหัสที่คนทั่วไปไม่สามารถเข้าใจได้ การใช้เลขอารบิคในแบบที่เราจินตนาการนั้นไม่มีเหตุผลสำหรับเทคโนโลยี เหตุผลก็คือจำเป็นต้องกำหนดหมายเลขให้แต่ละหมายเลขเป็นสัญลักษณ์เฉพาะของตัวเอง ซึ่งบางครั้งก็ไม่สามารถทำได้


มีสองระบบตัวเลข: ตำแหน่งและไม่ใช่ตำแหน่ง ระบบที่ไม่ใช่ตำแหน่งจะขึ้นอยู่กับการใช้งาน ตัวอักษรละตินและคุ้นเคยกับเราในรูปแบบการบันทึกนี้ ค่อนข้างเข้าใจยากจึงละทิ้งไป

ระบบเลขตำแหน่งยังคงใช้มาจนถึงทุกวันนี้ ซึ่งรวมถึงการเข้ารหัสข้อมูลแบบไบนารี ทศนิยม ฐานแปด และแม้แต่เลขฐานสิบหก

เราใช้ระบบการเข้ารหัสทศนิยมในชีวิตประจำวัน สิ่งเหล่านี้คุ้นเคยกับเราและทุกคนเข้าใจได้ การเข้ารหัสตัวเลขแบบไบนารีนั้นมีความโดดเด่นด้วยการใช้เพียงศูนย์และหนึ่งเท่านั้น

จำนวนเต็มจะถูกแปลงเป็นระบบการเข้ารหัสแบบไบนารีโดยการหารด้วย 2 ผลหารผลลัพธ์จะค่อยๆ หารด้วย 2 จนกระทั่งผลลัพธ์เป็น 0 หรือ 1 ตัวอย่างเช่น ตัวเลข 123 10 ใน ระบบไบนารี่สามารถแสดงเป็น 1111011 2. และเลข 20 10 จะมีลักษณะเป็น 10100 2.

ดัชนี 10 และ 2 แสดงถึงระบบการเข้ารหัสเลขทศนิยมและเลขฐานสองตามลำดับ สัญลักษณ์การเข้ารหัสไบนารี่ใช้เพื่อให้ง่ายต่อการทำงานกับค่าที่แสดงในระบบตัวเลขต่างๆ

วิธีการเขียนโปรแกรมทศนิยมจะขึ้นอยู่กับจุดลอยตัว ในการแปลงค่าจากระบบการเข้ารหัสทศนิยมเป็นระบบไบนารี่อย่างถูกต้อง ให้ใช้สูตร N = M x qp M คือแมนทิสซา (นิพจน์ของตัวเลขที่ไม่มีลำดับใดๆ) p คือลำดับของค่า N และ q คือฐานของระบบการเข้ารหัส (ในกรณีของเรา 2)

ไม่ใช่ทุกตัวเลขที่เป็นค่าบวก เพื่อแยกความแตกต่างระหว่างตัวเลขบวกและลบ คอมพิวเตอร์จะเว้นพื้นที่ไว้ 1 บิตสำหรับการเข้ารหัสเครื่องหมาย ในที่นี้ 0 แสดงถึงเครื่องหมายบวก และ 1 แสดงถึงเครื่องหมายลบ

การใช้ระบบตัวเลขนี้ช่วยให้คอมพิวเตอร์ทำงานกับตัวเลขได้ง่ายขึ้น นี่คือเหตุผลว่าทำไมการเข้ารหัสแบบไบนารีจึงเป็นสากลในกระบวนการคำนวณ


การเข้ารหัสข้อมูลข้อความแบบไบนารี

อักขระแต่ละตัวในตัวอักษรจะถูกเข้ารหัสด้วยชุดศูนย์และชุดของตัวเอง ข้อความประกอบด้วยอักขระที่แตกต่างกัน: ตัวอักษร (ตัวพิมพ์ใหญ่และตัวพิมพ์เล็ก) สัญลักษณ์ทางคณิตศาสตร์ และความหมายต่าง ๆ อื่น ๆ การเข้ารหัสข้อมูลข้อความต้องใช้ค่าไบนารี 8 ค่าติดต่อกันตั้งแต่ 00000000 ถึง 11111111 ด้วยวิธีนี้จึงสามารถแปลงอักขระที่แตกต่างกันได้ 256 ตัว

เพื่อหลีกเลี่ยงความสับสนในการเข้ารหัสข้อความ อักขระแต่ละตัวจะใช้ตารางค่าพิเศษ ประกอบด้วยตัวอักษรละติน เครื่องหมายทางคณิตศาสตร์ และเครื่องหมายวัตถุประสงค์พิเศษ (เช่น €, ¥ และอื่นๆ) อักขระในช่วง 128-255 เข้ารหัสอักษรประจำชาติของประเทศ

ในการเข้ารหัส 1 อักขระ ต้องใช้หน่วยความจำ 8 บิต เพื่อให้การคำนวณง่ายขึ้น 8 บิตจะเท่ากับ 1 ไบต์ ดังนั้นพื้นที่ดิสก์ทั้งหมดสำหรับข้อมูลข้อความจึงวัดเป็นไบต์


คอมพิวเตอร์ส่วนบุคคลส่วนใหญ่มีโต๊ะมาตรฐาน การเข้ารหัส ASCII(รหัสมาตรฐานอเมริกันสำหรับการแลกเปลี่ยนข้อมูล) นอกจากนี้ยังใช้ตารางอื่น ๆ ซึ่งระบบการเข้ารหัสข้อมูลข้อความมีความแตกต่างกัน ตัวอย่างเช่น การเข้ารหัสอักขระที่รู้จักครั้งแรกเรียกว่า KOI-8 (รหัสแลกเปลี่ยนข้อมูล 8 บิต) และใช้งานได้บนคอมพิวเตอร์ที่ใช้ UNIX OS พบกันอย่างแพร่หลายคือตารางรหัส CP1251 ซึ่งสร้างขึ้นเพื่อ ระบบปฏิบัติการหน้าต่าง

การเข้ารหัสเสียงแบบไบนารี

อีกเหตุผลหนึ่งว่าทำไมการเข้ารหัสไบนารี่จึงเป็นวิธีการสากลในการเขียนโปรแกรมข้อมูลก็คือความง่ายในการทำงานกับไฟล์เสียง เพลงใดๆ ประกอบด้วยคลื่นเสียงที่มีแอมพลิจูดและความถี่การสั่นสะเทือนต่างกัน ระดับเสียงและระดับเสียงขึ้นอยู่กับพารามิเตอร์เหล่านี้

ในการตั้งโปรแกรมคลื่นเสียง คอมพิวเตอร์จะแบ่งออกเป็นหลายส่วนหรือ “ตัวอย่าง” จำนวนตัวอย่างดังกล่าวอาจมีขนาดใหญ่ ดังนั้นจึงมีชุดค่าผสมของศูนย์และจำนวนที่แตกต่างกันได้ 65536 ชุด ดังนั้นคอมพิวเตอร์สมัยใหม่จึงติดตั้งการ์ดเสียง 16 บิตซึ่งหมายความว่าจะใช้เลขฐานสอง 16 หลักในการเข้ารหัสตัวอย่างคลื่นเสียงหนึ่งตัวอย่าง

ในการเล่นไฟล์เสียง คอมพิวเตอร์จะประมวลผลลำดับรหัสไบนารี่ที่ตั้งโปรแกรมไว้และรวมเข้าด้วยกันเป็นคลื่นต่อเนื่องคลื่นเดียว

การเข้ารหัสกราฟิก

ข้อมูลกราฟิกสามารถนำเสนอในรูปแบบภาพวาด แผนภาพ รูปภาพ หรือสไลด์ PowerPoint รูปภาพใด ๆ ประกอบด้วยจุดเล็ก ๆ - พิกเซลซึ่งสามารถวาดด้วยสีที่ต่างกันได้ สีของแต่ละพิกเซลจะถูกเข้ารหัสและจัดเก็บ และในที่สุดเราก็จะได้ภาพเต็ม

ถ้ารูปภาพเป็นขาวดำ รหัสสำหรับแต่ละพิกเซลอาจเป็นหนึ่งหรือศูนย์ก็ได้ หากใช้ 4 สีรหัสสำหรับแต่ละสีจะประกอบด้วยตัวเลขสองตัว: 00, 01, 10 หรือ 11 ตามหลักการนี้คุณภาพของการประมวลผลภาพใด ๆ จะแตกต่างกัน การเพิ่มหรือลดความสว่างยังส่งผลต่อจำนวนสีที่ใช้อีกด้วย ใน สถานการณ์กรณีที่ดีที่สุดคอมพิวเตอร์แยกแยะเฉดสีได้ประมาณ 16,777,216 เฉด

บทสรุป

มีวิธีการเขียนโปรแกรมข้อมูลหลายวิธี โดยการเข้ารหัสแบบไบนารี่มีประสิทธิภาพมากที่สุด ด้วยอักขระเพียงสองตัว - 1 และ 0 - คอมพิวเตอร์จึงสามารถอ่านไฟล์ส่วนใหญ่ได้อย่างง่ายดาย ในเวลาเดียวกัน ความเร็วในการประมวลผลจะสูงกว่ามาก เช่น ใช้ระบบการเขียนโปรแกรมแบบทศนิยม ความเรียบง่ายของวิธีนี้ทำให้ขาดไม่ได้สำหรับเทคนิคใดๆ นี่คือเหตุผลว่าทำไมการเข้ารหัสไบนารี่จึงเป็นสากลในหมู่คู่กัน

ทุกคนรู้ดีว่าคอมพิวเตอร์สามารถคำนวณข้อมูลกลุ่มใหญ่ด้วยความเร็วมหาศาล แต่ไม่ใช่ทุกคนที่รู้ว่าการกระทำเหล่านี้ขึ้นอยู่กับเงื่อนไขเพียงสองประการ: มีกระแสไฟฟ้าหรือไม่และแรงดันไฟฟ้าเท่าใด

คอมพิวเตอร์จัดการประมวลผลข้อมูลที่หลากหลายเช่นนี้ได้อย่างไร?
ความลับอยู่ในระบบเลขฐานสอง ข้อมูลทั้งหมดเข้าสู่คอมพิวเตอร์ซึ่งนำเสนอในรูปแบบของค่าหนึ่งและศูนย์ซึ่งแต่ละค่าจะสอดคล้องกับสถานะหนึ่งของสายไฟฟ้า: ค่า - ไฟฟ้าแรงสูง, ค่าศูนย์ - ต่ำหรือค่า - การมีอยู่ของแรงดันไฟฟ้า, ค่าศูนย์ - ไม่มีอยู่ การแปลงข้อมูลให้เป็นศูนย์และค่าหนึ่งเรียกว่าการแปลงไบนารี่ และการกำหนดขั้นสุดท้ายเรียกว่ารหัสไบนารี่
ในรูปแบบทศนิยมตามระบบเลขทศนิยมที่ใช้ในชีวิตประจำวัน ค่าตัวเลขจะแสดงเป็นตัวเลขสิบหลักตั้งแต่ 0 ถึง 9 และแต่ละตำแหน่งในตัวเลขจะมีค่าสูงกว่าตำแหน่งทางด้านขวาสิบเท่า ในการแทนตัวเลขที่มากกว่าเก้าในระบบทศนิยม ให้วางศูนย์ในตำแหน่งนั้น และวางศูนย์ไว้ในตำแหน่งถัดไปที่มีค่ามากกว่าทางด้านซ้าย ในทำนองเดียวกัน ในระบบไบนารี่ซึ่งใช้ตัวเลขเพียงสองหลักคือ 0 และ 1 แต่ละตำแหน่งมีค่าเป็นสองเท่าของตำแหน่งทางด้านขวาของมัน ดังนั้น ในรหัสไบนารี่ มีเพียงศูนย์และหนึ่งเท่านั้นที่สามารถแสดงเป็นตัวเลขเดี่ยวได้ และจำนวนใดๆ ที่มากกว่าหนึ่งจะต้องมีสองตำแหน่ง หลังจากศูนย์และหนึ่ง เลขฐานสองสามตัวถัดมาคือ 10 (อ่านหนึ่ง-ศูนย์) และ 11 (อ่านหนึ่ง-หนึ่ง) และ 100 (อ่านว่าหนึ่งศูนย์-ศูนย์) 100 ไบนารี่มีค่าเท่ากับทศนิยม 4 ตัว ตารางด้านบนขวาแสดงค่าเทียบเท่า BCD อื่นๆ
ตัวเลขใดๆ สามารถแสดงเป็นเลขฐานสองได้ แต่จะใช้พื้นที่มากกว่าทศนิยม ตัวอักษรยังสามารถเขียนในระบบไบนารี่ได้หากกำหนดเลขฐานสองที่แน่นอนให้กับตัวอักษรแต่ละตัว

สองร่างสำหรับสี่แห่ง
การผสมผสาน 16 แบบสามารถทำได้โดยใช้ลูกบอลสีเข้มและแสงรวมกันเป็นชุด 4 ชุด หากลูกบอลสีเข้มถูกมองว่าเป็นศูนย์และลูกบอลแสงเป็นหนึ่ง ดังนั้น 16 ชุดจะกลายเป็นรหัสไบนารี่ 16 หน่วย ซึ่งเป็นค่าตัวเลขของ ซึ่งมีค่าตั้งแต่ศูนย์ถึงห้า (ดูตารางบนสุดในหน้า 27) แม้ว่าจะมีลูกบอลสองประเภทในระบบไบนารี่ ก็สามารถสร้างชุดค่าผสมได้ไม่จำกัดเพียงโดยการเพิ่มจำนวนลูกบอลในแต่ละกลุ่ม - หรือจำนวนตำแหน่งในตัวเลข

บิตและไบต์

หน่วยที่เล็กที่สุดในการประมวลผลคอมพิวเตอร์ บิตคือหน่วยของข้อมูลที่สามารถมีหนึ่งในสองหน่วยได้ เงื่อนไขที่เป็นไปได้- ตัวอย่างเช่น แต่ละตัวและศูนย์ (ทางด้านขวา) แทน 1 บิต บิตสามารถแสดงด้วยวิธีอื่น: การมีหรือไม่มีกระแสไฟฟ้า, รูหรือไม่มี, ทิศทางของการดึงดูดไปทางขวาหรือซ้าย แปดบิตประกอบเป็นไบต์ 256 ไบต์ที่เป็นไปได้สามารถแทนอักขระและสัญลักษณ์ได้ 256 ตัว คอมพิวเตอร์หลายเครื่องประมวลผลข้อมูลครั้งละหนึ่งไบต์

การแปลงไบนารี รหัสไบนารี่สี่หลักสามารถแทนเลขฐานสิบตั้งแต่ 0 ถึง 15

ตารางรหัส

เมื่อใช้รหัสไบนารี่เพื่อแสดงตัวอักษรของตัวอักษรหรือเครื่องหมายวรรคตอน จำเป็นต้องมีตารางรหัสเพื่อระบุว่ารหัสใดตรงกับอักขระใด มีการรวบรวมรหัสดังกล่าวหลายรหัส พีซีส่วนใหญ่ได้รับการกำหนดค่าด้วยรหัสเจ็ดหลักที่เรียกว่า ASCII หรือรหัส American Standard สำหรับการแลกเปลี่ยนข้อมูล ตารางด้านขวาแสดง รหัส ASCIIสำหรับตัวอักษรภาษาอังกฤษ รหัสอื่นๆ เป็นรหัสสำหรับอักขระและตัวอักษรหลายพันตัวในภาษาอื่น ๆ ของโลก

ส่วนหนึ่งของตารางรหัส ASCII

หากคุณพบข้อผิดพลาด โปรดเลือกส่วนของข้อความแล้วกด Ctrl+Enter