فك شفرة أسكي. ترميز ASCII

مواد للدراسة المستقلة حول موضوع المحاضرات 2

جدول الشفرات ASCII (ASCII - الكود القياسي الأمريكي لتبادل المعلومات).

في المجموع ، باستخدام جدول الترميز ASCII (الشكل 1) ، يمكن ترميز 256 حرفًا مختلفًا. ينقسم هذا الجدول إلى جزأين: الرئيسي (مع رموز من OOh إلى 7Fh) والإضافي (من 80h إلى FFh ، حيث يشير الحرف h إلى أن الكود ينتمي إلى نظام الأرقام السداسي عشري).

الشكل 1

لتشفير حرف واحد من الجدول ، يتم تخصيص 8 بتات (بايت واحد). عند المعالجة المعلومات النصية  قد يحتوي بايت واحد على رمز لبعض الأحرف - الحروف والأرقام وعلامات الترقيم وعلامات الإجراء ، إلخ. كل حرف له رمزه الخاص في شكل عدد صحيح. في هذه الحالة ، يتم جمع جميع الرموز في جداول خاصة تسمى الترميز. بمساعدتهم ، يتم تحويل رمز الرمز إلى تمثيله المرئي على شاشة الشاشة. نتيجة لذلك ، يتم تمثيل أي نص في ذاكرة الكمبيوتر كسلسلة من البايتات مع رموز الأحرف.

على سبيل المثال ، كلمة مرحبا! سيتم تشفيرها على النحو التالي (الجدول 1).

الجدول 1

يوضح الشكل 1 الأحرف المدرجة في تشفير ASCII القياسي (باللغة الإنجليزية) والتشفير المتقدم (الروسي).

يتم توحيد النصف الأول من جدول ASCII. أنه يحتوي على رموز التحكم (من 00h إلى 20h و 77 h). تتم إزالة هذه الرموز من الجدول لأنها لا تنطبق على عناصر النص. يتم وضع علامات الترقيم والعلامات الرياضية هنا أيضًا: 2lh -! ، 26h - & ، 28h - (، 2Bh - + ، ... ، الأحرف الكبيرة والصغيرة اللاتينية: 41h - A ، 61h - a.

يحتوي النصف الثاني من الجدول على خطوط وطنية ، ورموز pseudographic ، والتي يمكن من خلالها بناء الجداول ، أحرف رياضية خاصة. يمكن استبدال الجزء السفلي من جدول الترميز باستخدام برامج التشغيل المناسبة - التحكم في البرامج المساعدة. تتيح لك هذه التقنية استخدام عدة خطوط وسماعاتها.

يجب أن تعرض شاشة كل رمز رمز صورة الرمز - ليس فقط رمز رقمي ، ولكن الصورة المقابلة ، لأن كل رمز له شكله الخاص. يتم تخزين وصف شكل كل رمز في مولد حرف ذا شاشة عرض خاص. يتم عرض الرمز على شاشة عرض IBM PC ، على سبيل المثال ، عن طريق النقاط التي تشكل مصفوفة الرموز. كل بكسل في مثل هذه المصفوفة هو عنصر صورة ويمكن أن يكون مشرقًا أو مظلمًا. يتم ترميز النقطة المظلمة بالرقم 0 ، الضوء (ساطع) - 1. إذا قمت بعرض البكسلات الداكنة كنقطة في حقل المصفوفة الخاص بالحرف وبكسلات الضوء بنجمة ، فيمكنك رسم شكل الحرف بيانياً.

يستخدم الأشخاص في مختلف البلدان الأحرف لكتابة كلمات لغاتهم الأصلية. في الوقت الحاضر ، فإن معظم التطبيقات ، بما في ذلك أنظمة البريد الإلكتروني ومتصفحات الويب ، بحتة 8 بت ، أي أنها يمكن أن تظهر وتقبل أحرف 8 بت فقط بشكل صحيح ، وفقًا لمعيار ISO-8859-1.

هناك أكثر من 256 حرفًا في العالم (مع الأخذ في الاعتبار اللغات السيريلية والعربية والصينية واليابانية والكورية والتايلاندية) ، كما تظهر المزيد والمزيد من الشخصيات الجديدة. وهذا يخلق المساحات التالية للعديد من المستخدمين:

لا يمكن استخدام حروف من مجموعات حروف مختلفة في نفس الوثيقة. نظرًا لأن كل مستند نصي يستخدم مجموعة الترميز الخاصة به ، فهناك صعوبات كبيرة في التعرف التلقائي على النص.

تظهر أحرف جديدة (على سبيل المثال: Euro) ، ونتيجة لذلك تقوم ISO بتطوير معيار ISO-8859-15 جديد ، يشبه إلى حد كبير المعيار ISO-8859-1. الفرق على النحو التالي: من جدول الترميز بالمعيار القديم ISO-8859-1 ، تمت إزالة رموز تسمية العملات القديمة غير المستخدمة حاليًا لإفساح المجال للرموز التي ظهرت حديثًا (مثل اليورو). نتيجة لذلك ، يمكن للمستخدمين الحصول على نفس المستندات على الأقراص ، ولكن في ترميزات مختلفة. الحل لهذه المشاكل هو اعتماد مجموعة دولية واحدة من الترميزات تسمى الترميز العالمي  أو يونيكود.

أثناء تكوين ASCII ، تم تضمين أحرف التحكم المتأصلة في الأنماط الكاتبة والآلات الكاتبة في بداية الترميز ، ومع مرور الوقت ماتوا هناك بإحكام ، على الرغم من أنهم لم يستخدموا عمليا في القرن الحادي والعشرين.

أقدم معلومات مفصلة حول ترميز ASCII:

ASCII  (م. Aميريكان الصورةtandard جقصيدة ل أناتفقد المعلومات أناnterchange ، [s.æs.ki]) - اسم الجدول (تشفير ، مجموعة) الذي ترتبط فيه الرموز الرقمية ببعض الأحرف المطبوعة وغير المطبوعة الشائعة. تم تطوير الجدول وتوحيده في الولايات المتحدة الأمريكية في عام 1963. غالبًا ما يتم نطق اسم "ASCII" باللغة الروسية باسم [ اسأل (ق) و].

يعرّف جدول ASCII رموز الأحرف:

  • أرقام عشرية
  • الأبجدية اللاتينية.
  • الأبجدية الوطنية؛
  • علامات الترقيم ؛
  • شخصيات التحكم.

القصة

في البداية (1963) ، تم تطوير ASCII لتشفير الأحرف التي وضعت رموزها في 7 بت (128 حرفًا ؛ 27 \u003d 128) ، في حين تم استخدام البتة السابعة الأكثر أهمية (الترقيم من نقطة الصفر) للتحكم في الأخطاء التي حدثت أثناء نقل البيانات.

بمرور الوقت ، تم توسيع الترميز إلى 256 حرفًا (28 \u003d 256) ؛ لم تتغير رموز أول 128 حرفًا. بدأ ينظر إلى ASCII على أنه نصف الترميز ذي 8 بتات ، وتم تسمية "ASCII الممتد" باسم ASCII مع البتة الثامنة المعنية (على سبيل المثال ، KOI-8).

تراكب الشخصية

باستخدام حرف Backspace (BS) (إرجاع حرف واحد) ، يمكنك طباعة حرف واحد أعلى الطابعة. في ASCII ، يمكنك إضافة علامات التشكيل إلى الحروف بالطريقة نفسها ، على سبيل المثال:

  • bS ‘→ á
  • bS `→ à
  • bS ^ → â
  • درجة البكالوريوس / → ø
  • c BS، → ç
  • ن BS ~ → ñ

تعليق: في الخطوط القديمة ، تم رسم علامة اقتباس أحادية "» "بمنحدر إلى اليسار (قارن" `" و "´") ، وتم رفع علامة التلدة "~" (قارن "~" و "˜") ، لذا فهي تناسب الدور الأحرف هي "´" و "التلدة في المقدمة".

إذا قمت بطباعة نفس الحرف مرتين في نفس الموضع ، فستحصل على حرف غامق. إذا قمت بطباعة حرف في موضع واحد ثم تسطير "_" ، فسيتم الحصول على حرف تحته خط.

  • بكالوريوس في → ل
  • bS _ → أ

لا تزال تستخدم هذه التقنية ، على سبيل المثال ، في نظام مساعدة الرجل.

خيارات أسكي الوطنية

يسمح معيار ISO 646 (ECMA-6) بوضع الأحرف الوطنية في ASCII. للقيام بذلك ، يُقترح استبدال الأحرف "@" ، "[" ، "\\" ، "]" ، "^" ، "" "،" ("،" شريط عمودي "،") "،" ~ ". أيضًا ، يمكن وضع رمز الجنيه "£" بدلاً من علامة الجنيه "#" ، ويمكن وضع علامة العملة "¤" بدلاً من رمز الدولار "$". مثل هذا النظام مناسب تمامًا للغات الأوروبية ، حيث يستخدمون أحرف لاتينية وبعض الأحرف الإضافية فقط. يسمى متغير ASCII الذي لا يحتوي على أحرف وطنية "US-ASCII" أو "إصدار مرجع دولي."

بالنسبة لبعض اللغات التي تحتوي على نصوص غير لاتينية (الروسية واليونانية والعربية والعبرية) كانت هناك تعديلات أكثر جذرية على ASCII. في أحد هذه التعديلات ، بدلاً من الحروف اللاتينية الصغيرة ، تم وضع الرموز الوطنية (للأحرف الكبيرة الروسية واليونانية). تضمن تعديل آخر التبديل بين US-ASCII والنسخة الوطنية ؛ تم التبديل خارج "على الطاير" - باستخدام الأحرف SO (م. الصورةhift سut) و SI (الإنجليزية الصورةhift أنان)؛ في هذه الحالة ، في النسخة الوطنية ، كان من الممكن استبدال الحروف اللاتينية بالكامل برموز وطنية. انظر أيضًا: KOI-7.

بعد ذلك ، أصبح أكثر ملاءمة لاستخدام ترميزات 8 بت (صفحات الرموز) ، حيث يشغل النصف السفلي من جدول الشفرات (0-127) أحرف US-ASCII ، والجزء العلوي (128-255) عبارة عن أحرف إضافية ، بما في ذلك مجموعة من الأحرف الوطنية.

وهكذا ، تم استخدام النصف العلوي من الجدول ASCII قبل اعتماد يونيكود على نطاق واسع بنشاط لتمثيل الأحرف المترجمة ، حروف اللغة المحلية.

تسبب عدم وجود معيار واحد لوضع الأحرف السيريلية في جدول ASCII في حدوث الكثير من مشاكل الترميز (KOI-8 ، و Windows-1251 ، وما إلى ذلك). كما عانت لغات أخرى بها نصوص غير لاتينية بسبب وجود العديد من الترميزات المختلفة.

تطابق أول 128 حرفًا من معيار Unicode الأحرف US-ASCII المقابلة.

جدول أسكي

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D حدده.د- .F
0. NUL سوه STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1. DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS الولايات المتحدة
2. ! « # $ % & ( ) * + , - . /
3. 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4. @ A B C D E F G H أنا J K L M N O
5. P Q R S تي U V W X Y Z [ \ ] ^ _
6. ` ل ب ج د البريد و ز ح أنا ي ك ل م ن س
7. ص ف ص الصورة تي ش الخامس ث س ذ ض { | } ~ DEL

في الإصدار الأول من معيار ASCII (1963) ، تم وضع رموز "السهم لأعلى" و "السهم الأيسر" في الموضعين 0x5e (94) و 0x5f (95) ، على التوالي. استبدلهم معيار ECMA-6 (1965) بحرف إدراج (والذي يستخدم أيضًا كرمز محيطي "^") ورمز الشرطة السفلية "_" ، على التوالي.

أحرف التحكم

تم إنشاء جدول ASCII لتبادل معلومات teletype. تضمنت المجموعة أحرفًا غير قابلة للطباعة تُستخدم كأوامر للتحكم في جهاز teletype. تم استخدام أوامر مماثلة في أدوات المراسلة السابقة للكمبيوتر (كود مورس ، الأبجدية إشارة) ، مع الأخذ بعين الاعتبار خصوصيات الجهاز.

  • NUL، 00 - فارغة. لطالما تم تجاهل الشخصية الفارغة. على الأشرطة المثقوبة ، تم الإشارة إلى الرقم "1" عن طريق ثقب ، والرقم "0" بسبب عدم وجود ثقب. لم تحتوي أقسام الشريط المثقوب التي لم يتم تسجيل المعلومات فيها على ثقوب ، أي أنها تحتوي على أحرف فارغة ؛ كانت هذه المواقع موجودة في بداية ونهاية الشريط. لا يزال يتم استخدام الحرف الفارغ في العديد من لغات البرمجة ، كعلامة على نهاية السطر ، ويتم الرمز بواسطة "\\ 0". (يشير المصطلح "string" إلى سلسلة من الأحرف.) في بعض أنظمة التشغيل ، تعتبر null هي آخر حرف لأي ملف نصي.

تم تقسيم الرسائل المرسلة عبر قناة الاتصال إلى قسمين:

  • "رأس".
  • "نص".

يحتوي "الرأس" على عناوين المرسل والمستلم ، والمجموع الاختباري ، وما إلى ذلك ، يمكن وضعه قبل "النص" أو بعده. كان مصطلح "النص" هو جزء من الرسالة المخصصة للطباعة.

  • سوه, 01 - الصورةلاذع سو حeading ، بداية "رأس".
  • STX, 02 - الصورةتورتة من تيالبريد سر ، بداية "النص". تم استخدام الرمز كأمر لتشغيل طابعة teletype. يقع النص للطباعة بين الأحرف STX و ETX.
  • ETX, 03 - البريدالثاني من تيالبريد سر ، نهاية "النص". تم استخدام الرمز لإيقاف جهاز الطباعة teletype. في الوقت الحاضر ، يتم استخدام الكود 03 لإرسال إشارة SIGINT إلى العملية. سيجنال الباحثerrupt) ويمكن إرسالها عن طريق الضغط على تركيبة المفاتيح Ctrl + C. بعد تلقي هذه الإشارة ، يجب أن تكمل العملية العمل.
  • EOT, 04 - البريدالثانية سو تيransmission ، نهاية النقل. يتم استخدام الرمز بواسطة المحاكيات الطرفية التي تحمل معنى "نهاية الملف" (EOF، eng. البريدالثانية سو وإيل) ويمكن إرسالها عن طريق الضغط على تركيبة المفاتيح Ctrl + D. بعد تلقي مثل هذا الحرف ، سيحدد المحاكي الطرفي العملية التي تعمل حاليًا مع الجهاز الطرفي ويضع علامة "نهاية الملف" (EOF) لدفق الإدخال القياسي (stdin، eng. شارعأندار د فيوضع تيار) من هذه العملية. نتيجة لذلك ، ستتوقف العملية عن قراءة stdin وتبدأ في معالجة بيانات القراءة.
  • ENQ, 05 - eNQuire. "أطلب التأكيد."
  • ACK, 06 - الكلية الاستراليةnowledgement. "أنا أؤكد" رمز NAK يعني عكس ذلك - "لا أؤكد".
  • BEL, 07 - البلل ، استدعاء ، زمارة. يشار إلى الرمز غالبًا باسم "\\ a" ويستخدم في إصدار صوت إنذار. في جهاز كمبيوتر حديث ، يتم إنتاج الصوت بواسطة السماعة المدمجة. على سبيل المثال ، يمكن للأوامر التالية تشغيل الصوت: echo -e "\\ a" أو echo -e "\\ 007 ″ (bash)؛ echo ^ G (cmd.exe ؛ لإدخال ^ G اضغط Ctrl + G) ، printf ("\\ a")؛ (كود في لغة البرمجة C).
  • BS, 08 - بالكلية الاسترالية الصورةوتيرة ، عودة حرف واحد. ← مفتاح Backspace يمحو الحرف السابق.
  • TAB, 09 - تيأساسها الأفقي. تم تعيينه كـ "\\ t". تسمى أحيانا HT من اللغة الإنجليزية. حorizontal تيabulation.
  • LF، 0A - لالمعهد الوطني للإحصاء وeed ، تغذية الخط. أمر لخفض عربة الطباعة سطر واحد لأسفل. يتم استخدام الحرف للاحتفال بنهاية سطر من ملف نصي على UNIX. يشير تسلسل حروف CR LF إلى نهاية سطر من ملف نصي في Windows. يشار إلى الرمز في العديد من لغات البرمجة باسم "\\ n". يؤدي الضغط على المفتاح ↵ Enter أثناء إخراج النص إلى تغذية سطر.
  • VT، 0B - الخامسertical تيab ، علامة التبويب العمودي.
  • FF، 0C - ومكتب إدارة السجلات وeed ، تشغيل الصفحة ، صفحة جديدة. أمر الطابعة: تابع الطباعة من بداية الورقة التالية.
  • CR، 0D - جarriage صeturn ، عودة النقل. أمر الطابعة: تابع الطباعة من بداية السطر الحالي (وليس من سطر جديد). في العديد من لغات البرمجة ، يتم الرمز بالرمز CR كـ "\\ r". في نظام التشغيل Mac OS ، تشير حرف CR إلى نهاية السطر في ملف نصي. من لوحة المفاتيح ، يمكن إدخال رمز CR بالضغط على مجموعة المفاتيح Ctrl + M.
  • SO، 0E - الصورةhift سut ، قم بالتبديل إلى شريط آخر. شريط آخر عادة ما يكون باللون الأحمر. بعد ذلك ، تم استخدام الرمز للتبديل إلى الترميز الوطني.
  • SI، 0F - الصورةhift أنان. أمر تنفيذ عكس إجراء SO: قم بالتبديل إلى الشريط المصدر أو قم بالتبديل إلى تشفير المصدر.
  • DLE, 10 - دآتا لحبر البريدسكيب ، وتحرير قناة البيانات. يجب تفسير أي أحرف تتبع DLE على أنها بيانات ، وليس كأحرف تحكم.
  • DC1, 11 - دevice جontrol 1 ، 1st الطابع للسيطرة على الجهاز. القيادة: قم بتشغيل قارئ الشريط.
  • DC2, 12 - دevice جontrol 2 ، 2nd الطابع للسيطرة على الجهاز. القيادة: تشغيل لكمة.
  • DC3, 13 - دevice جontrol 3 ، 3rd الطابع للسيطرة على الجهاز. الأمر: إيقاف تشغيل قارئ الشريط.
  • DC4, 14 - دevice جontrol 4 ، 4th الطابع من السيطرة على الجهاز. القيادة: إيقاف تشغيل لكمة.
  • NAK, 15 - نegative لج كالآن ، لا تؤكد. العودة إلى ACK.
  • SYN, 16 - اصطناعيchronization. تم إرسال هذا الرمز عندما كان من الضروري إرسال شيء للتزامن.
  • ETB, 17 - البريدالثاني من تيتحويلة بقفل ، نهاية كتلة النص. في بعض الأحيان ، لأسباب تقنية ، تم تقسيم النص إلى كتل.
  • CAN, 18 - علبةسل ، وإلغاء (ما تم نقله في وقت سابق).
  • EM, 19 - البريدالثاني من مإديوم ، نهاية الحامل (نفاد شريط الورق ، الورق ، إلخ.)
  • SUB، 1A - فرعيةstitute ، بديلا. يتم وضع رمز بدلاً من رمز تم فقد قيمته أو تلفه أثناء الإرسال. أو يتم وضع حرف قبل حرف ، لتفسيره تحتاج إلى التبديل إلى مجموعة إضافية من الأحرف. أو يتم وضع حرف قبل الحرف الذي يجب طباعته بلون مختلف. حاليًا ، يتم إدخال حرف عن طريق الضغط على تركيبة المفاتيح Ctrl + Z ويستخدم لتحديد نهاية الملف في DOS و Windows.
  • ESC، 1B - eSCقرد. الحرف الذي يتبع حرف ESC له معنى مختلف عن المعرف في ASCII. عادةً ما تتبع تسلسل الهروب حرف ESC. في DOS ، يتم تنفيذها بواسطة برنامج تشغيل ANSI.SYS

تم دعم فصل البيانات إلى 4 مستويات:

  • يمكن أن تتكون الرسالة من ملفات ؛
  • يمكن أن تتكون الملفات من مجموعات ؛
  • يمكن أن تتكون المجموعات من السجلات ؛
  • يمكن أن تتكون السجلات من وحدات.
  • FS، 1C - وإيل الصورةeparator ، فاصل الملف.
  • GS، 1D - زroup الصورةeparator ، مجموعة فاصل.
  • RS، 1E - صecord الصورةeparator ، سجل فاصل.
  • الولايات المتحدة، 1F - شأحمق الصورةeparator ، وحدة محدد.
  • DEL، 7F - ديلete ، محو الشخصية الأخيرة. مع رمز DEL ، الذي يتألف من جميع الوحدات في الكود الثنائي ، يمكن إبراز أي حرف. تجاهلت الأجهزة والبرامج DEL كما فعلت NUL. يأتي رمز هذا الرمز من معالجات النصوص الأولى التي تحتوي على ذاكرة على شريط مثقوب: فيها ، تم حذف الرمز من خلال "انسداد" الكود الخاص به مع وجود ثقوب (تدل على الوحدات المنطقية).

جدول الخصائص الهيكلية

  • تبدأ رموز أحرف الأرقام "0" - "9" في نظام الأرقام الثنائية بالرقم 00112 ، وتنتهي بالأرقام الثنائية. على سبيل المثال ، 01012 هو الرقم 5 ، و 0011 01012 هو الحرف "5". مع العلم بذلك ، يمكنك تحويل الأرقام العشرية الثنائية (BCD) إلى سلسلة ASCII ببساطة عن طريق إضافة 00112 إلى كل عشري ثنائي على اليسار.
  • يتم تمييز الأحرف "A" - "Z" في الحالة العلوية والسفلية في تمثيلها بت واحد فقط ، مما يبسط تحويل السجل والتحقق مما إذا كان الكود ينتمي إلى مجموعة من القيم. يتم تمثيل الحروف بأرقامها التسلسلية في الأبجدية ، مكتوبة في خمسة أرقام في النظام الثنائي ، متبوعة 0102 (للأحرف الكبيرة) أو 0112 (للأحرف الصغيرة).

عرض ASCII الكمبيوتر

على الغالبية العظمى من أجهزة الكمبيوتر الحديثة ، فإن وحدة الذاكرة الدنيا القابلة للمعالجة هي بايت 8 بت. لذلك ، يستخدم أحرف 8 بت بدلاً من أحرف 7 بت. عادة ، يتم توسيع حرف ASCII إلى 8 بت ، ببساطة إضافة صفر بت كـ بت عالية.

يتم استخدام أكواد ASCII في البرمجة كرموز متوسطة عبر منصات للمفاتيح المضغوطة (على عكس رموز مسح IBM PC وغيرها من الرموز الداخلية).

بالنسبة لتخطيط لوحة مفاتيح QWERTY ، يبدو جدول الرموز كما يظهر في الجدول التالي:

فرار F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 شاشة الطباعة قفل التمرير وقفة
1 2 3 4 5 6 7 8 9 0 - =+ الفضاء الخلفي إدراج منزل صفحة لأعلى عدد الأسطوانات / أضف. * إضافة. + إضافة.
التبويب Q W E R تي Y U أنا O P [ ] حذف نهاية الصفحة لأسفل 7 إضافة. 8 إضافة. 9 إضافة.
قبعات قفل A S D F G H J K L ؛ ث أدخل 4 إضافة. 5 إضافة. 6 إضافة. أدخل الإضافة.
تغير Z X C V B N M ,< .> / تغير \| فوق 1 إضافة. 2 إضافة. 3 إضافة.
السيطرة فاز البديل شريط الفضاء البديل فاز قائمة السيطرة اليسار إلى حق إنس / 0 ديل /.

46/110

لا توجد أحرف روسية في تخطيط لوحة المفاتيح هذا ، وهناك أيضًا بعض الأخطاء ، ولكن تنعكس الميزات الرئيسية.

أدعو الجميع للتحدث

ترميز معلومات النص. ترميز أسكي. رموز CYRILLIAN المستخدمة الأساسية

أي نص هو سلسلة من الأحرف الأبجدية معينة. إذا تم تشفير كل حرف من الحروف الأبجدية المستخدمة برقم ، فسيتم تقديم النص كسلسلة من الأرقام. عند معالجة النص بواسطة جهاز كمبيوتر ، يتم استخدام تمثيل ثنائي للأرقام.

من أجل التفسير الصحيح للنص المشفر ، تحتاج إلى معرفة أين ينتهي الرمز الثنائي لأحد الأحرف الأبجدية الأصلية ويبدأ الكود الثنائي لحرف آخر. يمكنك تشفير كل حرف في سلسلة من 8 بتات - بايت واحد.

في ثمانية أرقام ، يمكنك كتابة 28 \u003d 256 عدد صحيح ثنائي مختلف - من 000000002 إلى 111111112. هذا يكفي لضمان تطابق كل حرف كبير وحرف صغير من الحروف الأبجدية الإنجليزية والروسية ، وجميع الأرقام العربية وعلامات الترقيم ، وبعض الأحرف الأخرى الضرورية ، وكذلك رموز الخدمة لنقل البيانات ، مع تعيين فريد من نوعه (غير مكرر) مكون من ثمانية بتات.

لتوفير الراحة للتشفير الرقمي وفك الترميز اللاحق ، يتم تجميع جداول الأكواد. أنواع مختلفة من أجهزة الكمبيوتر مع أنظمة تشغيل مختلفة تستخدم جداول رمز مختلفة. أحد معايير ترميز أحرف لوحة مفاتيح الكمبيوتر بأرقام 8 بت هو جدول الرموز الأمريكية القياسية لتبادل المعلومات (ASCII). النصف الأول (الرموز 0-127) ، التي تحتوي على علامات الترقيم والأرقام العربية وأحرف الأبجدية الإنجليزية ، يتم بالاتفاق بشكل عام في جميع أنحاء العالم. تستخدم الرموز 128 - 255 من جدول ASCII (رموز ASCII الموسعة) أساسًا في الحروف الهجائية الوطنية.

يمكنك تشغيل جدول الشفرات عن طريق كتابة الرقم المطلوب من 0 إلى 255 على لوحة المفاتيح الرقمية الصغيرة مع الاستمرار في الضغط على مفتاح Alt ، ويبين الشكل 1 جدول الرموز الذي تم الحصول عليه بهذه الطريقة.

♫ ☼ ◄ ↕

← ∟ ↔

M N O P R S T U V

C H W D F Y S E

الشكل 1 - جدول الكود

يتكون الرمز من رقم الصف ورقم العمود. على سبيل المثال ، يتوافق الكود 50 مع الرقم 2 ، الكود 134 - الحرف J. الرموز من 0 إلى 32 - الخدمة.

يعد وجود العديد من المتغيرات لجداول التعليمات البرمجية الموجهة نحو استخدام الحروف الهجائية باللغات الوطنية المختلفة بحد ذاته إزعاجًا كبيرًا. لتنظيم الجداول ، بدأوا في تعيين أسماء وأرقام خاصة (على سبيل المثال ،

KOI-8) ، لكن هذا لم يحل مشكلة إنشاء نظام موحد للرموز يجمع بين الحروف الهجائية الوطنية المختلفة.

لقد تم التخلص من هذه الإزعاج والقيود بفضل معيار Unicode الدولي الجديد ، المدعوم من أحدث إصدارات نظام التشغيل Microsoft Windows. حاليًا ، يخصص معيار ترميز الأحرف هذا وحدتي بايت لكل حرف. يسمح لك هذا الترميز بتمثيل 216 \u003d 65 536 حرفًا مختلفًا في الأبجدية الثنائية. رموز أول 128 حرفًا هي نفس رموز ASCII.

حجم المعلومات من الرسائل

المهام مع القرارات

المهمة. افترض أن كل حرف تم ترميزه باستخدام بايت واحد (KOI-8). تقدير حجم المعلومات للرسالة

أنا ن ن وث ج أ و ن ايل س ن ق ه د في س ح ن ق س ح ول F.

تحتوي الرسالة على 39 حرفًا ، لذلك ، تتطلب 1 بايت / حرفًا * 39 حرفًا \u003d 39 بايتًا لترميزها ،

أو 8 بت / بايت * 39 بايت \u003d 312 بت.

1. في رسالة المثال السابق ، تم استبدال كلمة "ثنائي" بكلمة "عشري". كيف تم تغيير حجم معلومات الرسالة بالبتات والبايتات؟

الإجابة: زيادة حجم المعلومات للرسالة بمقدار 2 بايت ، بمعدل 16 بت.

2. افترض أن كل حرف تم ترميزه باستخدام بايت واحد (KOI-8). تقدير حجم المعلومات للرسالة

أنا قادر على التواصل ومشاركة الرسالة.

الإجابة: حجم المعلومات للرسالة 48 بايت.

3. افترض أن كل حرف تم ترميزه في 2 بايت (Unicode). تقدير حجم المعلومات للرسالة

أنا مدرك لحقيقة أن KO I - 8.

الإجابة: حجم المعلومات الرسالة 68 بايت.

4. افترض أن كل حرف تم ترميزه في 2 بايت (Unicode). تقدير حجم المعلومات للرسالة

ALGORITMMOZNO S P R S

الإجابة: حجم معلومات الرسالة 92 بايت.

5. تم تحويل رسالة المعلومات باللغة الروسية ، المسجلة أصلاً في رمز Unicode ذي 16 بت ، إلى ترميز KOI-8 ذي 8 بت. في الوقت نفسه ، انخفضت رسالة المعلومات بمقدار 480 بت. ما هو طول الرسالة بالأحرف؟

الجواب: الرسالة 60 حرفا.

6. تم تحويل رسالة المعلومات باللغة الروسية ، المسجلة أصلاً في رمز KOI-8 ذي 8 بت ، إلى تشفير Unicode ذي 16 بت. زاد حجم رسالة المعلومات بمقدار 568 بت. ما هو طول الرسالة بالأحرف؟

الإجابة: طول الرسالة 71 حرفًا.

7. تم تحويل رسالة المعلومات باللغة الروسية ، المسجلة أصلاً في رمز KOI-8 ذي 8 بت ، إلى تشفير Unicode ذي 16 بت. كيف تغير حجم رسالة المعلومات؟

الإجابة: تضاعف حجم رسالة المعلومات.

8. كم عدد الأحرف التي تحتويها الرسالة في Unicode مقابل 200 بت؟

الإجابة: تحتوي الرسالة على 25 حرفًا.

9. كم عدد الأحرف التي تحتوي عليها الرسالة ، حجم وحدة المعلومات بترميز KOI-8 هو 240 بت؟

الإجابة: تحتوي الرسالة على 30 حرفًا.


ترميز المعلومات وترميزها

المهام مع القرارات

1. لترميز الحروف A ، B ، C ، D باستخدام أربعة أرقام الرموز الثنائية  من 1000 إلى 1011 ، على التوالي. لتسلسل من الأحرف B ، D ، B ، A كتابة رمز ثنائي ، تقديم نتيجة الترميز في رمز ثماني.

يتم عرض رموز الأحرف في الجدول 1: الجدول 1

يحتوي الكود الثنائي المقابل على 16 بت: 1001101110101000 ، وهو أكثر ملاءمة لكتابة هذا الرقم للتحويل إلى الكود الثماني مع انهيار في ثالوثات: 1 001 101 110 101 000. ومن الواضح أن الرقم الثماني المقابل له الشكل التالي: 115650.

لتحويل رقم تم تمثيله في الكود الثنائي إلى ست عشري ، من المريح تقسيم السجل الثنائي إلى tetrads (مجموعات من 4 أرقام) ، بدءًا من اليمين.

2. لمدة 5 أحرف من الأبجدية الروسية ، يتم تعيين الرموز الثنائية الخاصة بهم ، والتي يمكن أن تحتوي على 2 أو 3 أرقام. يتم تسجيل الرموز في الجدول 3:

1) 110100000100110111

2) 101010000010010011

3) 110100001001100111

4) 110110000100110010.

سنقوم بفك تشفير كل رسالة من الرسائل الأربع بالتقسيم إلى مجموعات من البتات وفقًا للجدول 3:

1) 11 01 000 001 001 10 111 لا يمكن مطابقة المجموعة الأخيرة من الأرقام بحرف

وفقًا للجدول 3. تحتوي الرسالة على خطأ.

2) 10 10 10 000 01 001 001 1 تحتوي الرسالة على خطأ.

3) 11 01 000 01 001 10 01 11

قد يتم فك تشفير الرسالة. 4) 11 01 10 000 10 01 10 010 تحتوي الرسالة على خطأ.

الإجابة: 3) 110100001001100111

مهام للحل المستقل

1. لتشفير الحروف M ، N ، P ، Q ، يتم استخدام الرموز الثنائية المكونة من أربعة أرقام من 1000 إلى 1011 ، على التوالي. لتسلسل من الأحرف N ، Q ، P ، M ، اكتب شفرة ثنائية ، اعرض نتيجة التشفير في رمز ثماني.

الإجابة: الرمز الثنائي 1 001 101 110 101 000 ، الرمز الثماني 115650.

2. لتشفير الحروف A ، B ، C ، D ، يتم استخدام الرموز الثنائية المكونة من أربعة أرقام من 1000 إلى 1011 ، على التوالي. لتسلسل من الأحرف B ، D ، C ، A كتابة رمز ثنائي ، تقديم نتيجة الترميز في رمز ست عشري.

الإجابة: رمز ثنائي 1001 1011 1010 1000 ، رمز ست عشري 9BA9.

3. لتشفير الحروف M ، N ، O ، P ، استخدم الرموز الثنائية المكونة من ثلاثة أرقام من 000 إلى 111 ، على التوالي. لتسلسل من الأحرف O ، N ، M ، P ، اكتب شفرة ثنائية ، اعرض نتيجة التشفير في رمز ثماني.

الإجابة: الرمز الثنائي 110 101 100 111 ، الرمز الثماني 6547.

4. لتشفير الحروف M ، N ، O ، P ، تستخدم الرموز الثنائية المكونة من ثلاثة أرقام من 100 إلى 111 ، على التوالي. لتسلسل من الأحرف O ، N ، M ، P اكتب رمزًا ثنائيًا ، اعرض نتيجة الترميز بالرمز الست عشري.

الإجابة: الرمز الثنائي 1101 0110 0111 ، الرمز الست عشري B67.

لا يمكن أن يكون الرقم الثاني 3.

6. لتكوين أرقام مكونة من أربعة أرقام ، يتم استخدام الأرقام 1 و 2 و 3 و 4 و 5 ، والقواعد التالية مطلوبة:

في المقام الأول يمكن أن يكون أحد الأرقام 1 ، 3 ، 4 ؛

في سجل الأرقام ، والأرقام الفردية والبديلة ؛

لا يمكن أن يكون الرقم الثالث 4.

تسجيل جميع الأرقام الممكنة التي تم تجميعها وفقا لهذه القواعد.

7. لإنشاء أرقام من أربعة أرقام ، يتم استخدام الأرقام 1 و 2 و 3 و 4 و 5 ، والقواعد التالية مطلوبة:

في المقام الأول يمكن أن يكون أحد الأرقام 2 ، 4 ، 5 ؛

في سجل الأرقام ، والأرقام الفردية والبديلة ؛

لا يمكن أن يكون الرقمان الثاني والأخير كما هو. تسجيل جميع الأرقام الممكنة التي تم تجميعها وفقا لهذه القواعد.

8. لمدة 5 أحرف من الأبجدية الروسية ، يتم تعيين الرموز الثنائية الخاصة بهم ، والتي يمكن أن تحتوي على 2 أو 3 أرقام. تتم كتابة الرموز في الجدول:


من بين الرسائل الأربع في هذا الترميز ، تم تمرير رسالة واحدة فقط دون أخطاء ، فقط يمكن فك تشفيرها بشكل صحيح. ابحث عن هذه الرسالة من القائمة:

1) 110100000100110011

2) 111010000010010011

3) 110100001001100111

4) 110110000100110010. الإجابة: 110100001001100111

9. لمدة 5 أحرف من الأبجدية الروسية ، يتم تعيين الرموز الثنائية الخاصة بهم ، والتي يمكن أن تحتوي على 2 أو 3 أرقام. تتم كتابة الرموز في الجدول:

قم بترميز تسلسل FIGHT ، واجعل مثل هذا الخطأ في الكود لا يسمح لك بفك تشفير الرسالة بشكل صحيح.

اختبار التدريب

2 افترض أن كل حرف تم ترميزه 1 1) 384 بت بايت  (كوي-8). معدل المعلومات 2) 192 بت

كلمة حجم 24 حرف في هذا

الترميز.

3 المنتجة

إعادة ترميز

رسالة إعلامية

اللغة المسجلة أصلاً في 8-

رمز بت KOI-8 ، بترميز 16 بت

يونيكود. حجم المعلومات

زادت الرسائل بنسبة 336 بت. ما هو

طول الرسالة في الشخصيات؟

4 كم عدد الشخصيات يحتوي

رسالة،

معلومات

وهو في الترميز KOI-8 هو 240

5 كم عدد الشخصيات يحتوي

رسالة،

معلومات

الذي تشفير يونيكود هو

6 لترميز الحروف A و B و C و D

استخدم الرموز الثنائية المكونة من ثلاثة أرقام

حق

إذا وجدت خطأً ، فالرجاء تحديد جزء من النص واضغط على Ctrl + Enter.