ترميز المعلومات النصية. لماذا الترميز الثنائي عالمي؟ طرق البرمجة

دعونا نرى كيف كل نفس رقمنة النصوص؟ بالمناسبة ، على موقعنا يمكنك ترجمة أي نص إلى عشري ، ست عشري ، كود ثنائي  باستخدام حاسبة الكود على الانترنت.

ترميز النص.

وفقًا لنظرية الكمبيوتر ، يتكون أي نص من أحرف فردية. تتضمن هذه الأحرف: أحرف ، أرقام ، علامات ترقيم صغيرة ، أحرف خاصة ("" ، رقم ، () ، إلخ) ، كما تتضمن مسافات بين الكلمات.

المعرفة اللازمة. تسمى مجموعة الأحرف التي أكتب بها النص ALFAVIT.

عدد الحروف التي اتخذت في الأبجدية يمثل قوتها.

يمكن تحديد مقدار المعلومات بواسطة الصيغة: N \u003d 2b

  • N هي نفس القوة (العديد من الشخصيات) ،
  • ب - بت (وزن الشخصية المتخذة).

الأبجدية التي سيكون فيها 256 يمكن أن تستوعب تقريبا جميع الأحرف اللازمة. وتسمى هذه الحروف الهجائية كافية.

إذا أخذنا الأبجدية بسعة 256 ، ونضع في اعتبارنا أن 256 \u003d 28

  • تسمى دائمًا 8 بتات 1 بايت:
  • 1 بايت \u003d 8 بت.

إذا قمت بترجمة كل حرف إلى رمز ثنائي ، فإن رمز نص الكمبيوتر هذا سيشغل بايت واحد.

كيف يمكن أن تبدو المعلومات النصية في ذاكرة الكمبيوتر؟

يتم كتابة أي نص على لوحة المفاتيح ، وعلى مفاتيح لوحة المفاتيح ، نرى علامات مألوفة لنا (الأرقام والحروف ، إلخ). يدخلون ذاكرة الوصول العشوائي للكمبيوتر فقط كرمز ثنائي. يشبه الرمز الثنائي لكل حرف رقمًا مكونًا من ثمانية أرقام ، على سبيل المثال 00111111.

نظرًا لأن البايت هو أصغر جسيم يمكن معالجته من الذاكرة ، ويتم توجيه الذاكرة لكل حرف على حدة ، فإن ملاءمة هذا الترميز واضح. ومع ذلك ، فإن 256 حرفًا هي مقدار مناسب جدًا لأي معلومات شخصية.

بطبيعة الحال ، فإن السؤال الذي يطرح نفسه: أي على وجه التحديد رمز ثمانية بت  ينتمي إلى كل شخصية؟ وكيف تترجم النص إلى كود رقمي؟

هذه العملية مشروطة ، ولدينا الحق في الخروج بمختلف طرق لترميز الحروف. يحتوي كل رمز من الأحرف الأبجدية على رقم من 0 إلى 255. ويتم تعيين رمز لكل رقم من 00000000 إلى 11111111.

جدول الترميز هو "ورقة الغش" ، والتي تشير إلى أحرف الأبجدية وفقًا للرقم التسلسلي. بالنسبة لأنواع مختلفة من أجهزة الكمبيوتر ، استخدم جداول مختلفة للترميز.

أصبح ASCII (أو Asuka) المعيار الدولي لأجهزة الكمبيوتر الشخصية. يحتوي الجدول على جزأين.

النصف الأول من الجدول ASCII. (لقد كان النصف الأول هو المعيار).


يُشار إلى الامتثال للترتيب المعجمي ، أي الأحرف الموجودة في الجدول (الأحرف الصغيرة والأحرف الكبيرة) بترتيب أبجدي صارم ، وتُسمى الأرقام بترتيب تصاعدي مبدأ الترميز التسلسلي للأبجدية.

لالأبجدية الروسية ، أيضا ، الامتثال مبدأ الترميز التسلسلي.

الآن ، في هذه الأيام يستخدمون كله خمسة أنظمة الترميز  الأبجدية الروسية (KOI8-P و Windows. MS-DOS و Macintosh و ISO). نظرًا لعدد أنظمة الترميز وعدم وجود معيار واحد ، غالبًا ما ينشأ سوء التفاهم مع نقل النص الروسي إلى نموذج الكمبيوتر الخاص به.

واحد من الأول   معايير لترميز الأبجدية الروسيةوعلى أجهزة الكمبيوتر الشخصية خذ بعين الاعتبار KOI8 ("رمز تبادل المعلومات ، 8 بت"). تم استخدام هذا الترميز في منتصف السبعينيات على سلسلة من أجهزة كمبيوتر EC ، ومنذ منتصف الثمانينيات ، بدأ استخدامه في أنظمة التشغيل UNIX الأولى المترجمة إلى اللغة الروسية.

منذ بداية التسعينات ، ما يسمى بالوقت الذي سيطر فيه نظام التشغيل MS DOS ، يظهر نظام الترميز CP866 ("CP" تعني "صفحة الرموز" ، "صفحة الرموز").

بدأت شركة APPLE العملاقة للكمبيوتر ، مع نظامها المبتكر الخاضع لسيطرتها (Mac OS) ، في استخدام نظامها الخاص لترميز الأبجدية MAC.

تضع منظمة المعايير الدولية (ISO) معيارًا آخر للغة الروسية نظام ترميز الأبجديةيسمى ISO 8859-5.

والأكثر شيوعًا ، اليوم ، نظام ترميز الأبجدية ، اخترع في Microsoft Windows ، ويسمى CP1251.

منذ النصف الثاني من التسعينات ، تم حل مشكلة المعيار لترجمة النص إلى رمز رقمي للغة الروسية وليس فقط عن طريق إدخال نظام يسمى Unicode في المعيار. يتم تمثيله بواسطة ترميز 16 بت ، مما يعني أنه تم تخصيص وحدتي بايت من ذاكرة الوصول العشوائي لكل حرف. بالطبع ، مع هذا الترميز ، يتم مضاعفة تكاليف الذاكرة. ومع ذلك ، يسمح نظام الشفرة هذا بترجمة ما يصل إلى 65536 حرفًا إلى رمز إلكتروني.

تفاصيل نظام Unicode القياسي هو إدراج أي حروف أبجدية على الإطلاق ، سواء كانت موجودة أو منقرضة أو مركبة. في النهاية ، تتضمن أي حروف أبجدية ، بالإضافة إلى ذلك ، نظام Unicode ، الكثير من الرموز الرياضية والكيميائية والموسيقية والعامة.

دعنا نستخدم جدول ASCII لنرى كيف تبدو كلمة ما في ذاكرة جهاز الكمبيوتر الخاص بك.


غالبًا ما يحدث أن نصك ، المكتوب بأحرف من الأبجدية الروسية ، غير قابل للقراءة ، وهذا بسبب الاختلاف في أنظمة ترميز الأبجدية على أجهزة الكمبيوتر. هذه مشكلة شائعة جدًا يتم اكتشافها غالبًا.


وحدات الحد الأدنى من المعلومات هي وحدات البايت والبايت.

واحد  بت يسمح لك بترميز 2   القيم (0 أو 1).

استخدام اثنان  بت يمكن ترميز 4   القيم: 00 ، 01 ، 10 ، 11.

ثلاثة  بت مشفره 8   قيم مختلفة: 000 ، 001 ، 010 ، 011 ، 100 ، 101 ، 110 ، 111.

يمكن أن يتضح من الأمثلة أعلاه أن إضافة بت واحد يضاعف عدد القيم التي يمكن تشفيرها:

1 بت تشفير -\u003e 2 قيم مختلفة (2 1 \u003d 2) ،

2 بت تشفير -\u003e 4 قيم مختلفة (2 2 \u003d 4) ،

3 بت تشفير -\u003e 8 قيم مختلفة (2 3 \u003d 8) ،

4 بت تشفير -\u003e 16 قيمة مختلفة (2 4 \u003d 16) ،

5 بت تشفير -\u003e 32 قيمة مختلفة (2 5 \u003d 32) ،

6 بت تشفير -\u003e 64 قيم مختلفة (2 6 \u003d 64) ،

7 بت تشفير -\u003e 128 قيم مختلفة (2 7 \u003d 128) ،

8 بت تشفير -\u003e 256 قيم مختلفة (2 8 \u003d 256) ،

9 بت تشفير -\u003e 512 قيم مختلفة (2 9 \u003d 512) ،

10 بت ترميز -\u003e 1024 قيم مختلفة (2 10 \u003d 1024).

نتذكر أنه في بايت واحد ، وليس 9 وليس 10 بتات ، ولكن فقط 8. لذلك ، باستخدام بايت واحد ، يمكنك تشفير 256 حرفًا مختلفًا. هل تعتقد أنه كثير أو القليل؟ دعونا نلقي نظرة على مثال الترميز المعلومات النصية.

هناك 33 حرفًا باللغة الروسية ، وبالتالي ، يلزم استخدام 33 بايتًا للترميز. يميز الكمبيوتر بين الأحرف الكبيرة (الكبيرة) والصغيرة (الصغيرة) فقط إذا كانت مشفرة برموز مختلفة. لذلك ، لتشفير الحروف الكبيرة والصغيرة من الأبجدية الروسية ، هناك حاجة إلى 66 بايت.

للأحرف الكبيرة والحروف الصغيرة من الأبجدية الإنجليزية ، يلزم 52 بايت أخرى. والنتيجة هي 66 + 52 \u003d 118 بايت. هنا تحتاج أيضًا إلى إضافة أرقام (من 0 إلى 9) ، حرف مسافة ، جميع علامات الترقيم: نقطة ، فاصلة ، شرطة ، علامات تعجب وعلامات استفهام ، أقواس: دائرية ، مجعدة ومربعة ، وكذلك علامات العمليات الرياضية: + ، - ، \u003d ، / (هذا تقسيم) ، * (هذا هو الضرب). نضيف أيضًا أحرفًا خاصة:٪ ، $ ، & ، @ ، # ، لا ، إلخ. كل هذا معًا هو حوالي 256 حرفًا مختلفًا.

ثم ترك الأمر للصغير. من الضروري التأكد من أن جميع الأشخاص على وجه الأرض يتفقون فيما بينهم على الرموز المحددة (من 0 إلى 255 ، أي ما مجموعه 256) لتعيين الرموز. لنفترض أن جميع الأشخاص يوافقون على أن الرمز 33 يعني علامة تعجب (!) ، والرمز 63 يعني علامة استفهام (؟). وكذلك لجميع الشخصيات المعمول بها. يعني ذلك أن النص الذي كتبه شخص ما على جهاز الكمبيوتر الخاص به يمكن قراءته وطباعته دائمًا بواسطة شخص آخر على جهاز كمبيوتر آخر.

جدول أسكي

ويسمى مثل هذا الاتفاق العالمي على الاستخدام المتساوي لشيء ما معيار. في حالتنا ، يجب أن يكون المعيار عبارة عن جدول يتم فيه تثبيت مراسلة الرموز (من 0 إلى 255) والحروف. يسمى جدول مماثل جدول الترميز.

لكن ليس بهذه البساطة. بعد كل شيء ، فإن الأحرف الجيدة ، على سبيل المثال ، بالنسبة لليونان ، لن تعمل مع تركيا لأنه يتم استخدام الحروف الأخرى هناك. وبالمثل ، فإن ما هو جيد بالنسبة للولايات المتحدة ليس مناسبًا لروسيا ، وما هو جيد بالنسبة لروسيا لا يناسب ألمانيا.

لذلك ، قرروا تقسيم جدول التعليمات البرمجية إلى النصف.

يجب أن تكون الرموز الـ 128 الأولى (من 0 إلى 127) قياسية وإلزامية لجميع البلدان ولكل أجهزة الكمبيوتر ، هذا - دوليالمعيار.

ومع النصف الثاني من جدول الشفرات (من 128 إلى 255) ، يمكن لكل بلد فعل أي شيء ، وإنشاء معيار خاص به في هذا النصف - مواطن.

يسمى النصف الأول (الدولي) من جدول الرموز طاولةASCII, الذي تم إنشاؤه في الولايات المتحدة الأمريكية وقبلت في جميع أنحاء العالم. معيار ASCII غير مسؤول عن النصف الثاني من جدول الشفرات. تقوم مختلف البلدان بإنشاء جداول الرموز الوطنية الخاصة بها هنا. قد يكون هناك أيضًا معايير مختلفة لأنظمة الكمبيوتر المختلفة داخل بلد واحد ، ولكن فقط خلال النصف الثاني من جدول الشفرات.

رموز من جدول أسكي الدولي

0-31 - أحرف خاصة لا تتم طباعتها على الشاشة أو على الطابعة ، ولكنها تُستخدم لتنفيذ إجراءات خاصة (على سبيل المثال ، "نقل النقل" - لنقل النص إلى سطر جديد ، أو لـ "علامة تبويب" - لتعيين المؤشر على مواضع خاصة في سطر النص ، وما إلى ذلك).

32 - الفضاء (الفاصل بين الكلمات هو أيضًا حرف يجب ترميزه ، على الرغم من أنه يتم عرضه كـ "مسافة فارغة" بين الكلمات والحروف) ،

33-47 - الأحرف الخاصة (الأقواس ، إلخ) وعلامات الترقيم (الفترة ، الفاصلة ، إلخ) ،

48-57 - الأرقام من 0 إلى 9 ،

58-64 - الرموز الرياضية (زائد (+) ، ناقص (-) ، اضرب (*) ، قسمة (/) ، إلخ) وعلامات الترقيم (القولون ، فاصلة منقوطة ، إلخ) ،

65-90 - أحرف إنجليزية كبيرة (صغيرة)

91-96 - أحرف خاصة (الأقواس المربعة ، إلخ) ،

97-122 - الحروف الإنجليزية الصغيرة (الصغيرة) ،

123-127 - أحرف خاصة (الأقواس المتعرجة ، إلخ).

خارج جدول ASCII ، بدءًا من الأرقام من 128 إلى 159 ، توجد أحرف كبيرة (أحرف كبيرة) بحروف روسية ، ومن 160 إلى 170 ومن 224 إلى 239 حرفًا هي أحرف روسية صغيرة (صغيرة)

كلمة ترميز السلام

باستخدام الترميز الموضح ، يمكننا أن نتخيل كيف يقوم الكمبيوتر بترميز ثم إعادة إنتاج ، على سبيل المثال ، كلمة MIR (بالأحرف الكبيرة). يتم تمثيل هذه الكلمة بثلاثة رموز: الحرف M يتوافق مع الكود 140 (وفقًا لنظام الترميز الروسي الوطني) ، و - هذا هو الكود 136 و P - وهو 144.

ولكن كما ذكرنا سابقًا ، لا يرى الكمبيوتر المعلومات إلا في شكل ثنائي ، أي كسلسلة من الأصفار وتلك. كل بايت المقابلة لكل حرف من كلمة MIR يحتوي على سلسلة من ثمانية أصفار وتلك. باستخدام قواعد تحويل المعلومات العشرية إلى ثنائي ، يمكنك استبدال القيم العشرية لرموز الحروف بنظيراتها الثنائية.

الرقم العشري 140 يناظر الرقم الثنائي 10001100. يمكن التحقق من ذلك إذا تم إجراء العمليات الحسابية التالية: 2 7 + 2 3 +2 2 \u003d 140. الدرجة التي يتم بها رفع كل "رقمين" هي رقم موضع الرقم الثنائي 10001100 ، والذي يوجد به "1 »، ويتم ترقيم المواضع من اليمين إلى اليسار ، بدءًا من رقم موضع الصفر: 0 ، 1 ، 2 ، إلخ.

يمكنك معرفة المزيد حول نقل الأرقام من نظام رقمي إلى آخر ، على سبيل المثال ، من الكتب المدرسية لعلوم الكمبيوتر أو عبر الإنترنت.

وبالمثل ، يمكنك التحقق من أن الرقم 136 يتوافق مع الرقم الثنائي 10001000 (تحقق: 2 7 + 2 3 \u003d 136). والرقم 144 يناظر الرقم الثنائي 10010000 (راجع: 2 7 + 2 4 \u003d 144).

وبالتالي ، في الكمبيوتر ، سيتم تخزين كلمة MIR في شكل التسلسل التالي من الأصفار وتلك (البتات): 10001100 10001000 10010000.

بالطبع ، يتم إجراء جميع تحويلات البيانات الموضحة أعلاه باستخدام برامج الكمبيوتر ، وهي غير مرئية للمستخدمين. إنهم يلاحظون نتائج هذه البرامج فقط ، عند إدخال المعلومات باستخدام لوحة المفاتيح ، وعند عرضها على شاشة العرض أو الطابعة.

تجدر الإشارة إلى أنه على مستوى دراسة محو الأمية الحاسوبية ، لا يحتاج مستخدمو الكمبيوتر إلى معرفة نظام الأرقام الثنائية. يكفي أن يكون لديك فكرة عن رموز الحروف العشرية. فقط مبرمجو النظام في الممارسة العملية يستخدمون أنظمة الأرقام الثنائية ، السداسية العشرية ، الثمانية وغيرها. هذا مهم بشكل خاص بالنسبة لهم عندما تعرض أجهزة الكمبيوتر رسائل خطأ في البرامج التي تشير إلى القيم الخاطئة دون تحويل إلى عشري.

تمارين محو الأمية الحاسوبيةالتي تسمح لك بمشاهدة أنظمة الترميز الموضحة في المقالة وتشعر بها

ملاحظة  انتهى المقال ، ولكن لا يزال بإمكانك قراءة:



P.P.S.أن الاشتراك لتلقي مقالات جديدةليست بعد على المدونة:
   1) أدخل عنوان البريد الإلكتروني الخاص بك في هذا النموذج.

ترميز النص الثنائي

بدءًا من نهاية الستينيات ، بدأ استخدام أجهزة الكمبيوتر أكثر فأكثر لمعالجة المعلومات النصية ، والآن أصبحت معظم أجهزة الكمبيوتر الشخصية في العالم (ومعظم الوقت) مشغولة بمعالجة معلومات النص.

تقليديا ، لترميز حرف واحد ، يتم استخدام كمية من المعلومات تساوي 1 بايت ، وهذا يعني ، أنا \u003d 1 بايت \u003d 8 بت.

لتشفير حرف واحد ، يلزم 1 بايت من المعلومات.

إذا اعتبرنا الرموز أحداثًا ممكنة ، فوفقًا للصيغة (2.1) ، يمكننا حساب عدد الرموز المختلفة التي يمكن تشفيرها:

N \u003d 2 I \u003d 2 8 \u003d 256.

هذا العدد من الأحرف يكفي لتمثيل المعلومات النصية ، بما في ذلك الأحرف الكبيرة والأحرف الصغيرة من الأبجدية الروسية واللاتينية والأرقام والعلامات والرموز الرسومية ، إلخ.

يتكون الترميز من حقيقة أن كل حرف يتم تعيين رمز عشري فريد من 0 إلى 255 أو الرمز الثنائي المقابل من 00000000 إلى 11111111. وبالتالي ، يميز الشخص الأحرف حسب أنماطها ، والكمبيوتر بواسطة الرموز الخاصة بهم.

عندما يتم إدخال المعلومات النصية إلى جهاز كمبيوتر ، يتم ترميزها بشكل ثنائي ، ويتم تحويل صورة الشخصية إلى رمزها الثنائي. يضغط المستخدم على مفتاح مع وجود رمز على لوحة المفاتيح ، ويدخل تسلسل معين من ثمانية نبضات كهربائية (رمز الرمز الثنائي) في الكمبيوتر. يتم تخزين رمز الحرف في ذاكرة الوصول العشوائي للكمبيوتر ، حيث يشغل بايت واحد.

في عملية عرض رمز على شاشة الكمبيوتر ، يتم تنفيذ العملية العكسية - فك تشفير ، أي تحويل رمز الرمز إلى صورته.

من المهم أن يكون تعيين رمز معين للرمز مسألة توافق ، يتم إصلاحها في جدول الرموز. لا تتوافق أول 33 رمزًا (من 0 إلى 32) مع الأحرف ، ولكن مع العمليات (تغذية الأسطر ، إدخال المساحة ، وما إلى ذلك).

الرموز من 33 إلى 127 دولية وتتوافق مع أحرف الأبجدية اللاتينية والأرقام وعلامات العمليات الحسابية وعلامات الترقيم.

الرموز من 128 إلى 255 هي رموز وطنية ، أي في الترميزات الوطنية ، تتوافق الرموز المختلفة مع نفس الرمز. لسوء الحظ ، يوجد حاليًا خمسة جداول رمز مختلفة للأحرف الروسية (KOI8 ، CP1251 ، CP866 ، Mac ، ISO - جدول 1.3) ، لذلك لن يتم عرض النصوص التي تم إنشاؤها في ترميز واحد بشكل صحيح في آخر.

حاليًا ، معيار Unicode الدولي الجديد واسع الانتشار ، حيث لا يخصص بايت واحد ، ولكن اثنين لكل حرف ، لذلك بمساعدته يمكنك تشفير 256 حرفًا ، لكن N \u003d 216 \u003d \u003d 65536 حرفًا مختلفًا. يتم دعم هذا الترميز بواسطة أحدث إصدارات نظام التشغيل Microsoft Windows & Office (منذ 1997).

يتم تعيين كل ترميز بواسطة جدول الرموز الخاص به. كما يمكن أن يرى من الجدول. 1.3 ، يتم تعيين رموز مختلفة لنفس الكود الثنائي في ترميزات مختلفة.

على سبيل المثال ، سلسلة من الرموز الرقمية 221 ، 194 ، 204 في تشفير CP1251 تشكل كلمة "computer" ، بينما في الترميزات الأخرى ، ستكون مجموعة من الأحرف لا معنى لها.

لحسن الحظ ، في معظم الحالات ، لا يضطر المستخدم إلى القلق بشأن تحويل المستندات النصية إلى نص ، حيث يتم ذلك بواسطة برامج تحويل خاصة مدمجة في التطبيقات.

تعريف رمز الحرف الرقمي

1. قم بتشغيل محرر النصوص MS Word 2002. أدخل الأمر [Insert-Symbol ...]. سوف يظهر مربع حوار على الشاشة. رمز. يشغل الجزء المركزي من مربع الحوار جدول أحرف لخط معين (على سبيل المثال ، Times New Roman).



يتم ترتيب الرموز بالتسلسل من اليسار إلى اليمين وخط بسطر ، بدءًا من الرمز فجوة  في الزاوية اليسرى العليا وتنتهي بالحرف "I" في الزاوية اليمنى السفلى من الجدول.

حدد حرفًا ومن القائمة المنسدلة من:  نوع الترميز. في مربع النص رمز التوقيع:  سوف يظهر الرمز العددي.

إدخال الأحرف بواسطة رمز رقمي

1. قم بتشغيل البرنامج القياسي مفكرة. باستخدام لوحة المفاتيح الرقمية الاختيارية ، اضغط مع الاستمرار على المفتاح (Alt) ، وأدخل الرقم 0224 ، ثم حرر المفتاح (Alt). يظهر رمز في المستند. كرر الإجراء الخاص بالرموز الرقمية من 0225 إلى 0233. سيعرض المستند سلسلة من 12 حرفًا لـ "أمان المنزل" في نظام تشفير Windows (CP1251).

2. باستخدام لوحة المفاتيح الرقمية الاختيارية أثناء الضغط على المفتاح (Alt) ، أدخل الرقم 224 ، سيظهر الرمز "p" في المستند. كرر الإجراء للرموز الرقمية من 225 إلى 233 ، سيعرض المستند سلسلة من 12 حرفًا "rstuhtschshshsh" في الترميز MS-DOS (CP866).



تمارين عملية

1.29. باستخدام جدول أحرف (MS Word) ، اكتب سلسلة من الرموز الرقمية العشرية في ترميز Windows (CP1251) لكلمة "computer".

1.30. باستخدام المفكرة ، حدد أي كلمة في ترميز Windows (CP1251) تُعطى بتسلسل من الرموز الرقمية: 225 ، 224 ، 233،242.

1.31. ما هو تسلسل الحروف الذي سيتوافق مع ترميز KOI8 و ISO مع كلمة "computer" المسجلة في تشفير CP1251؟

يعالج الكمبيوتر كمية كبيرة من المعلومات. الملفات الصوتية والصور والنصوص - كل هذا يجب إعادة إنتاجه أو عرضه. لماذا يعتبر الترميز الثنائي طريقة عالمية لبرمجة معلومات أي معدات تقنية؟

ما هو الفرق بين التشفير والتشفير؟

غالبًا ما يحدد الأشخاص مفاهيم "الترميز" و "التشفير" عندما يكون لديهم في الواقع معان مختلفة. لذا ، فإن التشفير هو عملية تحويل المعلومات لإخفائها. يمكن للشخص الذي قام بتغيير النص ، أو الأشخاص المدربين بشكل خاص ، فك تشفيرها. يستخدم الترميز لمعالجة المعلومات وتبسيط العمل معها. عادةً ما يتم استخدام جدول ترميز شائع مألوف لدى الجميع. انها بنيت في الكمبيوتر.

مبدأ الترميز الثنائي

الترميز الثنائي بناءً على استخدام حرفين فقط - 0 و 1 - لمعالجة المعلومات المستخدمة من قبل أجهزة مختلفة. هذه العلامات كانت تسمى الأرقام الثنائية ، باللغة الإنجليزية - الأرقام الثنائية ، أو بت. كل حرف يستغرق 1 بت من ذاكرة الكمبيوتر. لماذا يعتبر الترميز الثنائي طريقة عالمية لمعالجة المعلومات؟ الحقيقة هي أنه من الأسهل لجهاز الكمبيوتر معالجة عدد أقل من الأحرف. تعتمد إنتاجية الكمبيوتر أيضًا بشكل مباشر على هذا: فالمهام الأقل وظيفية التي يحتاجها الجهاز ، زادت سرعة وجودة العمل.

لا يوجد مبدأ الترميز الثنائي في البرمجة فقط. بالتناوب على الصم وصبر الطبول ، قام سكان بولينيزيا بنقل المعلومات إلى بعضهم البعض. ينطبق مبدأ مماثل عند استخدام الأصوات الطويلة والقصيرة لنقل رسالة. يستخدم "تلغراف الأبجدية" اليوم.

أين يتم استخدام الترميز الثنائي؟

يستخدم ثنائي في الكمبيوتر في كل مكان. يجب برمجة كل ملف ، سواء أكان موسيقيًا أم نصًا ، بحيث يمكن معالجته وقراءته لاحقًا. نظام الترميز الثنائي مفيد للعمل مع الرموز والأرقام وملفات الصوت والرسومات.

ترميز الرقم الثنائي

الآن في أجهزة الكمبيوتر ، يتم تقديم الأرقام في شكل مشفر ، غير مفهومة للشخص العادي. استخدام الأرقام العربية كما نتصور أنها غير عقلانية للتكنولوجيا. والسبب في ذلك هو الحاجة إلى تعيين شخصية فريدة لكل رقم ، وهو أمر مستحيل في بعض الأحيان.


هناك نوعان من الأنظمة: الموضعية وغير الموضعية. يعتمد النظام غير الموضعي على استخدام الحروف اللاتينية وهو مألوف بالنسبة لنا في الشكل ، ومن الصعب جدًا فهم طريقة التسجيل هذه ، لذا فقد تخلوا عنها.

يتم استخدام نظام الرقم الوظيفي اليوم. يتضمن هذا الترميز الثنائي ، العشري ، ثماني ، وحتى السداسي عشر للمعلومات.

نحن نستخدم نظام الترميز العشري في الحياة اليومية. هذه مألوفة بالنسبة لنا مفهومة لكل شخص. يختلف الترميز الثنائي للأرقام باستخدام صفر واحد فقط.

تُترجم الأعداد الصحيحة إلى نظام ترميز ثنائي بتقسيمها على 2. يتم أيضًا ترحيل الحصص الناتجة بمقدار 2 حتى يتم الحصول على إجمالي 0 أو 1. على سبيل المثال ، يمكن تمثيل الرقم 123 10 في نظام ثنائي كـ 1111011 2. والرقم 20 10 سيبدو 10100 2.

تم تخصيص الرقمين 10 و 2 على التوالي ونظام ترقيم الأرقام العشري والثنائي. يستخدم رمز الترميز الثنائي لتبسيط العمل مع القيم الممثلة في أنظمة الأرقام المختلفة.

تعتمد أساليب البرمجة العشرية على نقطة عائمة. من أجل ترجمة القيمة بشكل صحيح من نظام الترميز العشري إلى نظام الترميز الثنائي ، استخدم الصيغة N \u003d M x qp. M هي mantissa (تعبير عن رقم دون أي ترتيب) ، p هو ترتيب قيمة N ، و q هو أساس نظام الترميز (في حالتنا 2).

ليست كل الأرقام إيجابية. للتمييز بين الأعداد الموجبة والسالبة ، يترك الكمبيوتر مساحة قدرها 1 بت لترميز الأحرف. هنا ، يمثل الصفر علامة الجمع ، ويمثل واحد علامة الطرح.

إن استخدام نظام الأرقام هذا يجعل من السهل على الكمبيوتر التعامل مع الأرقام. هذا هو السبب في أن الترميز الثنائي عالمي في العمليات الحسابية.


ترميز النص الثنائي

يتم ترميز كل حرف من الحروف الأبجدية من خلال مجموعة من الأصفار والأخرى. يتكون النص من أحرف مختلفة: الأحرف (الكبيرة والصغيرة) والأحرف الحسابية وغيرها من المعاني المختلفة. يتطلب تشفير المعلومات النصية استخدام 8 قيم ثنائية متتالية من 00000000 إلى 11111111. وبهذه الطريقة ، يمكن تحويل 256 حرفًا مختلفًا.

لتجنب التشويش في ترميز النص ، يتم استخدام جداول قيمة خاصة لكل حرف. لديهم الأبجدية اللاتينية والعلامات الحسابية والعلامات الخاصة (على سبيل المثال ، € ، ¥ ، وغيرها). ترمز الأحرف الفجائية 128-255 إلى الأبجدية الوطنية للبلد.

لتشفير حرف واحد ، يلزم وجود 8 بتات من الذاكرة. لتبسيط الحسابات الفرعية ، تساوي 8 بتات بايت واحد ، لذلك يتم قياس إجمالي مساحة القرص لمعلومات النص بالبايت.


تحتوي معظم أجهزة الكمبيوتر الشخصية على جدول قياسي. ترميزات ASCII  (الكود القياسي الأمريكي لتبادل المعلومات). كما تستخدم الجداول الأخرى التي يختلف فيها نظام ترميز النص. على سبيل المثال ، يسمى ترميز الأحرف الأول KOI-8 (رمز تبادل المعلومات 8 بت) ، ويعمل على أجهزة الكمبيوتر التي تستخدم UNIX. تم العثور على جدول الشفرات CP1251 ، الذي تم إنشاؤه لنظام التشغيل Windows ، أيضًا على نطاق واسع.

ترميز الصوت الثنائي

سبب آخر لأن الترميز الثنائي هو طريقة عالمية لبرمجة المعلومات هو بساطته عند التعامل مع الملفات الصوتية. أي موسيقى هي موجات صوتية مختلفة السعة وتردد التذبذب. حجم الصوت والملعب تعتمد على هذه المعلمات.

لبرمجة موجة صوتية ، يقوم الكمبيوتر بتقسيمها بشكل مشروط إلى عدة أجزاء أو "عينات". يمكن أن يكون عدد هذه العينات كبيرًا ، لذلك يوجد 65،536 مجموعة مختلفة من الأصفار والأخرى. وفقًا لذلك ، تم تجهيز أجهزة الكمبيوتر الحديثة ببطاقات صوت 16 بت ، مما يعني استخدام 16 رقمًا ثنائيًا لترميز عينة واحدة من الموجة الصوتية.

لتشغيل ملف صوتي ، يعالج الكمبيوتر تسلسل الرموز الثنائية المبرمجة ويجمعها في موجة واحدة مستمرة.

ترميز الرسومات

يمكن تقديم المعلومات الرسومية في شكل رسومات أو مخططات أو صور أو شرائح في PowerPoint. تتكون أي صورة من نقاط صغيرة - بكسل ، والتي يمكن رسمها بألوان مختلفة. يتم تشفير وحفظ لون كل بكسل ، ونتيجة لذلك نحصل على صورة كاملة.

إذا كانت الصورة بالأبيض والأسود ، يمكن أن يكون رمز كل بكسل واحدًا أو صفرًا. في حالة استخدام 4 ألوان ، يتكون رمز كل منها من رقمين: 00 ، 01 ، 10 أو 11. وفقًا لهذا المبدأ ، يتم تمييز جودة المعالجة لأي صورة. زيادة أو تقليل السطوع يؤثر أيضًا على عدد الألوان المستخدمة. في أفضل الأحوال ، يميز الكمبيوتر حوالي 16،777،216 لونًا.

استنتاج

هناك طرق مختلفة لمعلومات البرمجة ، من بينها الترميز الثنائي هو الأكثر كفاءة. مع حرفين فقط - 1 و 0 - يقرأ الكمبيوتر معظم الملفات بسهولة. في نفس الوقت ، تكون سرعة المعالجة أعلى بكثير من نظام البرمجة العشري على سبيل المثال. بساطة هذه الطريقة تجعلها ضرورية لأي تقنية. هذا هو السبب في أن الترميز الثنائي عالمي بين أقرانه.

يعلم الجميع أنه يمكن لأجهزة الكمبيوتر إجراء عمليات حسابية باستخدام مجموعات كبيرة من البيانات بسرعة هائلة. لكن لا يعلم الجميع أن هذه الإجراءات تعتمد على شرطين اثنين فقط: سواء كان التيار أم لا ، وما الجهد.

كيف يتمكن الكمبيوتر من معالجة هذه المعلومات المتنوعة؟
السر يكمن في النظام الثنائي. تدخل جميع البيانات إلى جهاز الكمبيوتر ، الذي يتم تقديمه في شكل وحدات وأصفار ، كل منها يتوافق مع حالة واحدة من السلك الكهربائي: الوحدات - الجهد العالي ، الأصفار - منخفضة ، أو الوحدات - وجود الجهد ، الأصفار - غيابه. يسمى تحويل البيانات إلى أصفار وأخرى تسمى التحويل الثنائي ، وتسمى تسميته النهائية الشفرة الثنائية.
في تدوين عشري يستند إلى النظام العشري لحساب التفاضل والتكامل الذي يُستخدم في الحياة اليومية ، يتم تمثيل القيمة العددية بعشرة أرقام من 0 إلى 9 ، ولكل مكان في الرقم قيمة أعلى بعشر مرات من المكان الموجود على يمينه. لتمثيل عدد أكبر من تسعة في النظام العشري ، يتم وضع الصفر في مكانه ، ويوضع واحد في المكان التالي الأكثر قيمة على اليسار. وبالمثل ، في النظام الثنائي ، حيث يتم استخدام رقمين فقط - 0 و 1 ، يكون كل مكان ضعف قيمة المكان الموجود على يمينه. وبالتالي ، في الكود الثنائي ، يمكن تمثيل صفر وواحد فقط كأرقام فردية ، وأي رقم يزيد عن واحد يتطلب مكانين. بعد صفر وواحد ، الأرقام الثنائية الثلاثة التالية هي 10 (قراءة واحدة صفرا) و 11 (قراءة واحدة واحدة) و 100 (قراءة واحدة صفر صفر). 100 أنظمة ثنائية تعادل 4 عشري. يُظهر الجدول العلوي على اليمين مكافئات عشرية ثنائية أخرى.
يمكن التعبير عن أي رقم بالثنائي ، فهو لا يستغرق سوى مساحة أكبر منه في التدوين العشري. في النظام الثنائي ، يمكنك أيضًا كتابة الأبجدية ، إذا تم تعيين رقم ثنائي معين لكل حرف.

رقمين لأربعة أماكن
يمكن إجراء 16 مجموعة باستخدام الكرات الداكنة والخفيفة ، والجمع بينها في مجموعات من أربعة. إذا كنت تأخذ الكرات الداكنة كأصفار والضوء كوحدات ، فإن 16 مجموعة ستتحول إلى رمز ثنائي مكون من 16 وحدة ، تكون القيمة العددية لها من صفر إلى خمسة ( انظر الجدول العلوي في الصفحة 27). حتى مع وجود نوعين من الكرات في النظام الثنائي ، يمكنك إنشاء عدد لا حصر له من المجموعات عن طريق زيادة عدد الكرات ببساطة في كل مجموعة - أو عدد الأماكن في الأرقام.

بت و بايت

أصغر وحدة في معالجة الكمبيوتر ، هي وحدة بيانات يمكن أن تحتوي على واحد من حالتين محتملتين. على سبيل المثال ، كل واحد منها والأصفار (على اليمين) يعني 1 بت. يمكن تمثيل البتة بطرق أخرى: وجود أو عدم وجود تيار كهربائي ، ثقب وغيابه ، اتجاه مغنطة إلى اليمين أو اليسار. ثمانية بتات تشكل بايت. 256 بايت يمكن أن تمثل 256 حرفا وحرفا. معالجة العديد من أجهزة الكمبيوتر بايت من البيانات في نفس الوقت.

تحويل ثنائي يمكن أن يمثل الرمز الثنائي المكون من أربعة أرقام الأرقام العشرية من 0 إلى 15.

جداول الكود

عند استخدام رمز ثنائي للإشارة إلى أحرف الأبجدية أو علامات الترقيم ، تكون جداول الرموز مطلوبة والتي تشير إلى الرمز الذي يتطابق مع الحرف. تم تجميع العديد من هذه الرموز. يتم تكييف معظم أجهزة الكمبيوتر لرمز مكون من سبعة أرقام يسمى ASCII ، أو الكود القياسي الأمريكي لتبادل المعلومات. الجدول على العروض الصحيحة رموز أسكي  لالأبجدية الإنجليزية. الرموز الأخرى مخصصة لآلاف الحروف والحروف الهجائية للغات الأخرى في العالم.

جزء من جدول كود ASCII

إذا وجدت خطأً ، فالرجاء تحديد جزء من النص واضغط على Ctrl + Enter.