Ascii कोड का डिक्रिप्शन। ASCII एन्कोडिंग

विषय 2 पर स्वतंत्र अध्ययन के लिए सामग्री

ASCII कोड टेबल (ASCII - अमेरिकन स्टैंडर्ड कोड फॉर इंफॉर्मेशन इंटरचेंज)।

कुल मिलाकर, ASCII कोडिंग टेबल (चित्र 1) का उपयोग करते हुए, 256 विभिन्न वर्णों को एन्कोड किया जा सकता है। इस तालिका को दो भागों में विभाजित किया गया है: मुख्य (OOh से 7Fh कोड के साथ) और अतिरिक्त (80h से FFh तक, जहां अक्षर h इंगित करता है कि कोड हेक्साडेसिमल नंबर सिस्टम से संबंधित है)।

चित्र 1

तालिका से एक वर्ण को एनकोड करने के लिए, 8 बिट्स (1 बाइट) आवंटित किए जाते हैं। जब प्रसंस्करण पाठ संबंधी जानकारी   एक बाइट में कुछ वर्णों के कोड हो सकते हैं - अक्षर, संख्या, विराम चिह्न, क्रिया चिह्न आदि। प्रत्येक वर्ण का पूर्णांक के रूप में अपना कोड होता है। इस मामले में, सभी कोड विशेष तालिकाओं में एकत्र किए जाते हैं जिन्हें एन्कोडिंग कहा जाता है। उनकी मदद से, प्रतीक कोड मॉनिटर स्क्रीन पर इसके दृश्य प्रतिनिधित्व में परिवर्तित हो जाता है। नतीजतन, कंप्यूटर मेमोरी में किसी भी टेक्स्ट को चरित्र कोड के साथ बाइट्स के अनुक्रम के रूप में दर्शाया गया है।

उदाहरण के लिए, हैलो शब्द! निम्नानुसार एन्कोड किया जाएगा (तालिका 1)।

तालिका 1

चित्रा 1 मानक (अंग्रेजी) और उन्नत (रूसी) एएससीआईआई एन्कोडिंग में शामिल पात्रों को दर्शाता है।

ASCII तालिका की पहली छमाही मानकीकृत है। इसमें नियंत्रण कोड (00h से 20h और 77h तक) शामिल हैं। ये कोड तालिका से हटा दिए जाते हैं क्योंकि वे पाठ तत्वों पर लागू नहीं होते हैं। विराम चिह्न और गणितीय संकेत भी यहां दिए गए हैं: 2lh - !, 26h - &, 28h - (, 2Bh - +, ..., अपरकेस और निचले लैटिन अक्षर: 41h - A, 61h - a।

तालिका की दूसरी छमाही में राष्ट्रीय फ़ॉन्ट, छद्म भौगोलिक चिह्न शामिल हैं, जिनसे तालिकाएँ बनाई जा सकती हैं, विशेष गणितीय वर्ण। एन्कोडिंग टेबल के निचले हिस्से को उपयुक्त ड्राइवरों का उपयोग करके बदला जा सकता है - सहायक कार्यक्रमों को नियंत्रित करें। यह तकनीक आपको कई फोंट और उनके हेडसेट का उपयोग करने की अनुमति देती है।

प्रत्येक प्रतीक कोड का प्रदर्शन प्रतीक की छवि को प्रदर्शित करना चाहिए - न केवल एक डिजिटल कोड, बल्कि संबंधित चित्र, क्योंकि प्रत्येक प्रतीक का अपना आकार होता है। प्रत्येक प्रतीक के आकार का वर्णन एक विशेष प्रदर्शन मेमोरी - चरित्र जनरेटर में संग्रहीत किया जाता है। एक प्रतीक आईबीएम पीसी डिस्प्ले स्क्रीन पर प्रदर्शित किया जाता है, उदाहरण के लिए, एक प्रतीक मैट्रिक्स बनाने वाले डॉट्स के माध्यम से। ऐसे मैट्रिक्स में प्रत्येक पिक्सेल एक छवि तत्व है और उज्ज्वल या अंधेरा हो सकता है। डार्क डॉट को नंबर 0, लाइट (ब्राइट) के साथ एनकोड किया गया है। 1. यदि आप कैरेक्टर के मैट्रिक्स फील्ड में डॉट के रूप में डार्क पिक्सल्स को प्रदर्शित करते हैं और एस्टरिस्क के साथ लाइट पिक्सल्स, तो आप कैरेक्टर के आकार को रेखांकन कर सकते हैं।

विभिन्न देशों में लोग अपनी मूल भाषाओं के शब्दों को लिखने के लिए पात्रों का उपयोग करते हैं। आजकल, आईएसओ सिस्टम और वेब ब्राउज़र सहित अधिकांश एप्लिकेशन, विशुद्ध रूप से 8-बिट हैं, अर्थात्, वे केवल आईएसओ-8859-1 मानक के अनुसार 8-बिट वर्णों को दिखा सकते हैं और सही ढंग से स्वीकार कर सकते हैं।

दुनिया में 256 से अधिक वर्ण हैं (सिरिलिक, अरबी, चीनी, जापानी, कोरियाई और थाई भाषाओं पर विचार करते हुए), और अधिक से अधिक नए वर्ण भी दिखाई देते हैं। और यह कई उपयोगकर्ताओं के लिए निम्नलिखित स्थान बनाता है:

एक ही दस्तावेज़ में विभिन्न वर्ण सेटों से वर्णों का उपयोग करना संभव नहीं है। चूंकि प्रत्येक पाठ दस्तावेज़ अपने स्वयं के एन्कोडिंग के सेट का उपयोग करता है, इसलिए स्वचालित पाठ मान्यता के साथ बहुत कठिनाइयाँ हैं।

नए वर्ण दिखाई देते हैं (उदाहरण के लिए: यूरो), जिसके परिणामस्वरूप आईएसओ एक नया मानक ISO-8859-15 विकसित कर रहा है, जो मानक ISO-8859-1 के समान है। अंतर इस प्रकार है: पुराने ISO-8859-1 मानक की कोडिंग तालिका से, पुरानी मुद्राओं के पदनाम के प्रतीक जो वर्तमान में उपयोग में नहीं हैं, उन्हें नए छपने वाले प्रतीकों (जैसे यूरोस) के लिए जगह बनाने के लिए हटा दिया गया था। परिणामस्वरूप, उपयोगकर्ता डिस्क पर एक ही दस्तावेज़ रख सकते हैं, लेकिन विभिन्न एन्कोडिंग में। इन समस्याओं के समाधान को एन्कोडिंग के एकल अंतर्राष्ट्रीय सेट को अपनाना है सार्वभौमिक कोडिंग   या यूनिकोड।

ASCII के गठन के दौरान, इनलेट्स और टाइपराइटर में निहित नियंत्रण वर्ण एन्कोडिंग की शुरुआत में शामिल थे, और समय के साथ वे कसकर मर गए, हालांकि वे 21 वीं शताब्दी में व्यावहारिक रूप से उपयोग नहीं किए जाते हैं।

मैं ASCII एन्कोडिंग के बारे में विस्तृत जानकारी देता हूं:

ASCII   (इंग्लैंड। एकmerican रोंtandard के लिए ode मैंnformation मैंnterchange, [kis.ki]) - तालिका का नाम (एन्कोडिंग, सेट) जिसमें कुछ सामान्य मुद्रित और गैर-मुद्रित वर्णों के साथ संख्यात्मक कोड जुड़े होते हैं। 1963 में यूएसए में टेबल को विकसित और मानकीकृत किया गया था। रूसी में "ASCII" नाम को अक्सर [ पूछना (ओं) और].

ASCII तालिका वर्णों के लिए कोड परिभाषित करती है:

  • दशमलव अंक;
  • लैटिन वर्णमाला;
  • राष्ट्रीय वर्णमाला;
  • विराम चिह्न;
  • पात्रों पर नियंत्रण रखें।

कहानी

प्रारंभ में (1963), ASCII को उन वर्णों को एनकोड करने के लिए विकसित किया गया था जिनके कोड 7 बिट्स (128 वर्ण; 27 \u003d 128) में रखे गए थे, जबकि डेटा ट्रांसफर के दौरान हुई त्रुटियों को नियंत्रित करने के लिए सबसे महत्वपूर्ण 7 बिट (स्क्रैच से नंबरिंग) का उपयोग किया गया था।

समय के साथ, एन्कोडिंग को 256 वर्णों (28 \u003d 256) तक विस्तारित किया गया; पहले 128 पात्रों के कोड नहीं बदले गए हैं। ASCII को 8-बिट एन्कोडिंग के आधे के रूप में माना जाने लगा, और "विस्तारित ASCII" को 8 बिट में शामिल ASCII कहा जाता था (उदाहरण के लिए, KOI-8)।

चरित्र ओवरले

बैकस्पेस (बीएस) वर्ण (एक वर्ण लौटाते हुए) का उपयोग करके, आप प्रिंटर के शीर्ष पर एक वर्ण मुद्रित कर सकते हैं। ASCII में, आप एक ही तरह से अक्षरों में डायटिकट्रिक्स जोड़ सकते हैं:

  • a बीएस ‘→ á
  • ए बीएस `→ आ
  • एक बीएस ^ → एक
  • ओ बीएस / → ø
  • c बीएस, → ç
  • n बीएस ~ → ñ

टिप्पणी: पुराने फोंट में, एपोस्ट्रोफ "» "बाईं ओर ढलान के साथ खींचा गया था (" `" और "and" की तुलना करें), और टिल्ड "~" को स्थानांतरित कर दिया गया था (तुलना "~" और "˜"), इसलिए वे सिर्फ भूमिका फिट करते हैं वर्ण "characters" और "शीर्ष पर टिल्ड" हैं।

यदि आप एक ही स्थिति में एक ही चरित्र को दो बार प्रिंट करते हैं, तो आपको एक बोल्ड चरित्र मिलता है। यदि आप किसी वर्ण को एक स्थिति में प्रिंट करते हैं और फिर "_" को रेखांकित करते हैं, तो एक रेखांकित चरित्र प्राप्त किया जाएगा।

  • a बीएस → एक
  • एक बीएस _ → ए

यह तकनीक अभी भी उपयोग की जाती है, उदाहरण के लिए, मैन हेल्प सिस्टम में।

राष्ट्रीय ASCII विकल्प

आईएसओ 646 मानक (ईसीएमए -6) एएससीआईआई में राष्ट्रीय पात्रों की नियुक्ति के लिए अनुमति देता है। ऐसा करने के लिए, वर्णों को "@", "[", "\\", "]", "^", "" "," ("," कार्यक्षेत्र बार ",") "," ~ "को बदलने का प्रस्ताव है। इसके अलावा, पाउंड चिन्ह "£" को पाउंड चिन्ह "#" के स्थान पर रखा जा सकता है, और मुद्रा चिन्ह "¤" को डॉलर के प्रतीक "$" के स्थान पर रखा जा सकता है। ऐसी प्रणाली यूरोपीय भाषाओं के लिए अच्छी तरह से अनुकूल है, क्योंकि वे लैटिन वर्णों और केवल कुछ अतिरिक्त वर्णों का उपयोग करते हैं। एक ASCII संस्करण जिसमें राष्ट्रीय वर्ण नहीं हैं, उसे "US-ASCII" या "अंतर्राष्ट्रीय संदर्भ संस्करण" कहा जाता है।

गैर-लैटिन लिपियों (रूसी, ग्रीक, अरबी, हिब्रू) के साथ कुछ भाषाओं के लिए एएससीआईआई के अधिक कट्टरपंथी संशोधन थे। इन संशोधनों में से एक में, निचले अक्षरों में लैटिन अक्षरों के स्थान पर, राष्ट्रीय प्रतीकों को रखा गया था (रूसी और ग्रीक - बड़े अक्षरों के लिए)। एक और संशोधन में यूएस-एएससीआईआई और राष्ट्रीय संस्करण के बीच स्विच करना शामिल था; स्विचिंग "फ्लाई पर" किया गया था - एसओ (एंग। रोंhift ut) और SI (अंग्रेजी) रोंhift मैंएन); इस मामले में, राष्ट्रीय संस्करण में, राष्ट्रीय प्रतीकों के साथ लैटिन अक्षरों को पूरी तरह से बदलना संभव था। इसे भी देखें: KOI-7

इसके बाद 8-बिट एनकोडिंग (कोड पेज) का उपयोग करना अधिक सुविधाजनक हो गया, जिसमें कोड तालिका (0 code127) के निचले आधे हिस्से पर यूएस-एएससीआईआई के पात्रों का कब्जा है, और ऊपरी आधे (128,255) पर राष्ट्रीय पात्रों के एक सेट सहित अतिरिक्त पात्रों का कब्जा है।

इस प्रकार, यूनिकोड को व्यापक रूप से अपनाने से पहले एएससीआईआई तालिका के ऊपरी आधे हिस्से को स्थानीय भाषा के अक्षरों, स्थानीय अक्षरों का प्रतिनिधित्व करने के लिए सक्रिय रूप से उपयोग किया गया था।

ASCII तालिका में सिरिलिक पात्रों को रखने के लिए एक एकल मानक की अनुपस्थिति ने एन्कोडिंग समस्याओं (KOI-8, Windows-1251, आदि) की बहुत समस्या पैदा की। गैर-लैटिन लिपियों के साथ अन्य भाषाओं को भी कई अलग-अलग एन्कोडिंग की उपस्थिति के कारण नुकसान उठाना पड़ा।

यूनिकोड मानक के पहले 128 अक्षर इसी US-ASCII वर्णों से मेल खाते हैं।

ASCII तालिका

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .b .सी .D करें.ई. एफ
0. NUL एसओएच एसटीएक्स ETX ईओटी enq एसीके BEL बी एस हिंदुस्तान टाइम्स वामो वीटी एफएफ सीआर अतः एसआई
1. डीएलई DC1 DC2 DC3 DC4 एन ए SYN ETB CAN ईएम उप ESC एफएस जी एस रुपये अमेरिका
2. ! « # $ % & ( ) * + , - . /
3. 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4. @ एक बी सी डी एफ जी एच मैं जम्मू कश्मीर एल एम एन हे
5. पी क्यू आर एस टी यू वी डब्ल्यू एक्स Y जेड [ \ ] ^ _
6. ` एक जी मैं j कश्मीर एल मीटर n
7. पी क्ष आर रों टी यू v w एक्स y z { | } ~ डेल

एएससीआईआई मानक (1963) के पहले संस्करण में, क्रमशः "0x5e (94) और 0x5f (95) स्थित" अप एरो "और" लेफ्ट एरो "चिन्ह स्थित थे। ECMA-6 मानक (1965) ने उन्हें एक सम्मिलित चरित्र के साथ बदल दिया (जिसका उपयोग क्रमशः circumflex प्रतीक "^") और अंडरस्कोर प्रतीक "_" के रूप में भी किया जाता है।

पात्रों पर नियंत्रण रखें

एएससीआईआई तालिका टेलेटाइप जानकारी के आदान-प्रदान के लिए बनाई गई थी। सेट में गैर-मुद्रण योग्य वर्ण शामिल थे जिनका उपयोग टेलेटाइप डिवाइस को नियंत्रित करने के लिए कमांड के रूप में किया गया था। इसी तरह के कमांड का उपयोग अन्य प्री-कंप्यूटर मैसेजिंग टूल्स (मोर्स कोड, सेमाफोर वर्णमाला) में किया गया था, जो डिवाइस की बारीकियों को ध्यान में रखते थे।

  • NUL, 00 - अशक्त, खाली। अशक्त चरित्र को हमेशा अनदेखा किया गया है। छिद्रित टेपों पर, संख्या "1" को छेद द्वारा इंगित किया गया था, और छेद की कमी से संख्या "0"। छिद्रित टेप के वर्गों में जहां जानकारी दर्ज नहीं की गई थी, उनमें छेद नहीं थे, अर्थात, उनमें अशक्त वर्ण थे; ऐसी साइटें शुरुआत में और टेप के अंत में स्थित थीं। शून्य वर्ण अभी भी कई प्रोग्रामिंग भाषाओं में लाइन के अंत के संकेत के रूप में उपयोग किया जाता है, और इसे "\\ 0" द्वारा दर्शाया जाता है। (शब्द "स्ट्रिंग" वर्णों के अनुक्रम को संदर्भित करता है।) कुछ ऑपरेटिंग सिस्टम पर, नल किसी भी पाठ फ़ाइल का अंतिम चरित्र है।

संचार चैनल पर प्रसारित संदेश दो भागों में विभाजित थे:

  • "हैडर";
  • "पाठ"।

"शीर्ष लेख" में प्रेषक और प्राप्तकर्ता के पते, चेकसम आदि शामिल होते हैं, जिन्हें "पाठ" से पहले या बाद में रखा जा सकता है। "पाठ" शब्द मुद्रण के लिए इच्छित संदेश का हिस्सा था।

  • एसओएच, 01 - रोंतीखा ईडिंग, "हेडर" की शुरुआत।
  • एसटीएक्स, 02 - रोंका तीखा टीएक्सटी, "पाठ" की शुरुआत। टेलेटाइप प्रिंटर को चालू करने के लिए एक कमांड के रूप में प्रतीक का उपयोग किया गया था। मुद्रण के लिए पाठ STX और ETX वर्णों के बीच स्थित था।
  • ETX, 03 - की एन.डी. टीएक्सटी, "पाठ" का अंत। टेलेटाइप प्रिंटिंग डिवाइस को बंद करने के लिए प्रतीक का उपयोग किया गया था। आजकल, कोड 03 का उपयोग एक प्रक्रिया को संकेत संकेत भेजने के लिए किया जाता है। sigएनएएल पूर्णांकerrupt) और कुंजी संयोजन Ctrl + C दबाकर भेजा जा सकता है। इस तरह के संकेत प्राप्त करने के बाद, प्रक्रिया को काम पूरा करना चाहिए।
  • ईओटी, 04 - nd टीरैंसमिशन, ट्रांसफर का अंत। प्रतीक का उपयोग टर्मिनल एमुलेटर द्वारा "फाइल के अंत" (ईओएफ, एएन) के साथ किया जाता है। nd इले) और कुंजी संयोजन Ctrl + D दबाकर भेजा जा सकता है। इस तरह का एक चरित्र प्राप्त करने के बाद, टर्मिनल एमुलेटर उस प्रक्रिया को निर्धारित करेगा जो वर्तमान में टर्मिनल के साथ काम कर रहा है और मानक इनपुट स्ट्रीम (स्टडिन, एनजी) के लिए "फ़ाइल का अंत" (ईओएफ) ध्वज सेट करता है। सेंटअंदर मेंधारा लगाओ) इस प्रक्रिया का। नतीजतन, प्रक्रिया स्टड पढ़ना बंद कर देगी और रीड डेटा को संसाधित करना शुरू कर देगी।
  • enq, 05 - enquire। "मैं पुष्टि के लिए पूछता हूं।"
  • एसीके, 06 - एसीकेnowledgement। "मैं पुष्टि करता हूं।" NAK प्रतीक का अर्थ होता है विपरीत - "मैं पुष्टि नहीं करता।"
  • BEL, 07 - बेलएल, कॉल, बीप। प्रतीक को अक्सर "\\" कहा जाता है और अलार्म बजने के लिए उपयोग किया जाता है। एक आधुनिक पीसी में, अंतर्निहित स्पीकर द्वारा ध्वनि को पुन: पेश किया जाता है। उदाहरण के लिए, निम्नलिखित कमांड ध्वनि खेल सकते हैं: इको-ई "\\" या इको-ई "\\ 007) (बैश); गूंज ^ जी (cmd.exe; दर्ज करने के लिए ^ G प्रेस Ctrl + G), प्रिंटफ ("\\" a); (प्रोग्रामिंग भाषा सी में कोड)।
  • बी एस, 08 - एसीके रोंगति, एक चरित्र वापसी। ← बैकस्पेस कुंजी पिछले वर्ण को मिटा देती है।
  • टैब, 09 - टीab, क्षैतिज टैब। इसे "\\ t" के रूप में निर्दिष्ट किया गया है। कभी-कभी अंग्रेजी से एचटी कहा जाता है। orizontal टीabulation.
  • वामो, 0A - एलऑफ़लाइन ईड, लाइन फ़ीड। प्रिंट गाड़ी को एक पंक्ति नीचे करने की आज्ञा दें। चरित्र का उपयोग UNIX पर एक पाठ फ़ाइल की एक पंक्ति के अंत को चिह्नित करने के लिए किया जाता है। सीआर एलएफ चरित्र अनुक्रम विंडोज में एक पाठ फ़ाइल की एक पंक्ति के अंत को इंगित करता है। कई प्रोग्रामिंग भाषाओं में प्रतीक को "\\ n" के रूप में दर्शाया गया है। पाठ को आउटपुट करते समय ing एंटर की दबाएं एक पंक्ति फ़ीड की ओर जाता है।
  • वीटी, 0B - vertical टीअब, ऊर्ध्वाधर टैब।
  • एफएफ, 0 सी - oRM ईड, पेज रन, नया पेज। प्रिंटर के लिए कमांड: अगली शीट की शुरुआत से प्रिंटिंग जारी रखें।
  • सीआर, 0D - arriage आरeturn, गाड़ी वापसी। प्रिंटर के लिए कमांड: वर्तमान लाइन की शुरुआत से मुद्रण जारी रखें (नई लाइन से नहीं)। कई प्रोग्रामिंग भाषाओं में, प्रतीक सीआर को "\\ r" के रूप में दर्शाया गया है। मैक ओएस पर, सीआर चरित्र एक पाठ फ़ाइल में एक पंक्ति के अंत को इंगित करता है। कीबोर्ड से, CR प्रतीक को कुंजी संयोजन Ctrl + M दबाकर दर्ज किया जा सकता है।
  • अतः, 0 ई - रोंhift ut, दूसरे टेप पर स्विच करें। एक और टेप आमतौर पर लाल रंग में रंगा जाता था। इसके बाद, प्रतीक का उपयोग राष्ट्रीय एन्कोडिंग पर स्विच करने के लिए किया गया था।
  • एसआई, 0F - रोंhift मैंएन। SO क्रिया के विपरीत कार्य करने की आज्ञा: स्रोत टेप पर स्विच करें या स्रोत एन्कोडिंग पर जाएँ।
  • डीएलई, 10 - अता एलस्याही बलात्कार, डेटा चैनल को मुक्त करना। DLE के बाद के किसी भी वर्ण की व्याख्या डेटा के रूप में की जानी चाहिए, न कि नियंत्रण वर्णों के रूप में।
  • DC1, 11 - evice ontrol 1 , डिवाइस नियंत्रण का पहला चरित्र। कमांड: टेप रीडर चालू करें।
  • DC2, 12 - evice ontrol 2 , डिवाइस नियंत्रण के लिए 2 चरित्र। कमांड: पंच चालू करें।
  • DC3, 13 - evice ontrol 3 , डिवाइस नियंत्रण के 3 चरित्र। कमांड: टेप रीडर को बंद करें।
  • DC4, 14 - evice ontrol 4 , उपकरण नियंत्रण का 4 वां वर्ण। कमांड: पंच बंद करें।
  • एन ए, 15 - negative एककश्मीरनोटबंदी, पुष्टि नहीं। ACK पर लौटें।
  • SYN, 16 - synchronization। यह प्रतीक तब प्रसारित किया गया था जब सिंक्रनाइज़ेशन के लिए कुछ संचारित करना आवश्यक था।
  • ETB, 17 - की एन.डी. टीext लॉक, टेक्स्ट ब्लॉक का अंत। कभी-कभी, तकनीकी कारणों से, पाठ को ब्लॉकों में विभाजित किया गया था।
  • CAN, 18 - कर सकते हैंसीएल, रद्दीकरण (जो पहले प्रेषित किया गया था)।
  • ईएम, 19 - की एन.डी. मीटरएडियम, कैरियर का अंत (पेपर टेप, पेपर, आदि से बाहर)
  • उप, 1 ए - उपस्थानापन्न, स्थानापन्न। एक प्रतीक को एक प्रतीक के स्थान पर रखा जाता है जिसका मूल्य संचरण के दौरान खो गया है या क्षतिग्रस्त हो गया है। या एक चरित्र को एक चरित्र से पहले रखा जाता है, जिसकी व्याख्या के लिए आपको वर्णों के एक अतिरिक्त सेट पर स्विच करने की आवश्यकता होती है। या एक चरित्र को एक चरित्र से पहले रखा जाता है जिसे एक अलग रंग में मुद्रित करने की आवश्यकता होती है। वर्तमान में, कुंजी संयोजन Ctrl + Z दबाकर एक वर्ण डाला जाता है और इसका उपयोग DOS और Windows में फ़ाइल के अंत को चिह्नित करने के लिए किया जाता है।
  • ESC, 1 बी - escबंदर। ESC वर्ण का अनुसरण करने वाले वर्ण का ASCII में परिभाषित एक अलग अर्थ है। आमतौर पर, एस्केप सीक्वेंस एक ESC कैरेक्टर को फॉलो करते हैं। DOS में, वे ANSI.SYS ड्राइवर द्वारा कार्यान्वित किए जाते हैं

4 स्तरों में डेटा को अलग करने का समर्थन किया गया था:

  • संदेश में फ़ाइलें शामिल हो सकती हैं;
  • फाइलें समूहों से मिलकर बन सकती हैं;
  • समूहों में रिकॉर्ड शामिल हो सकते हैं;
  • रिकॉर्ड इकाइयों से मिलकर बना सकते हैं।
  • एफएस, 1C - इले रोंएपरेटर, फाइल सेपरेटर।
  • जी एस, 1D - जीroup रोंएपरेटर, ग्रुप सेपरेटर।
  • रुपये, 1 ई - आरecord रोंएपरेटर, रिकॉर्ड सेपरेटर।
  • अमेरिका, 1F - यूलीख रोंएपरेटर, यूनिट सीमांकक।
  • डेल, 7F - डेलete, अंतिम वर्ण मिटाएँ। DEL प्रतीक के साथ, बाइनरी कोड में सभी इकाइयों से मिलकर, किसी भी चरित्र को "अंकित" किया जा सकता है। उपकरणों और कार्यक्रमों ने एनयूएल के रूप में DEL की उपेक्षा की। इस चिन्ह का कोड पहले शब्द प्रोसेसर से आता है, जिसमें एक छिद्रित टेप पर मेमोरी होती है: उनमें, चिन्ह को "कोडिंग" द्वारा छेदों (तार्किक इकाइयों को दर्शाते हुए) से हटा दिया गया था।

तालिका संरचनात्मक गुण

  • बाइनरी नंबर सिस्टम में अंक "0" - "9" के वर्ण कोड 00112 से शुरू होते हैं, और बाइनरी नंबर के साथ समाप्त होते हैं। उदाहरण के लिए, 01012 नंबर 5 है, और 0011 01012 चरित्र "5" है। यह जानकर, आप बाइनरी दशमलव संख्याओं (BCD) को ASCII स्ट्रिंग में बदल सकते हैं, बस बाईं ओर प्रत्येक बाइनरी दशमलव कुतरने के लिए 00112 जोड़कर।
  • ऊपरी और निचले मामले के अक्षर "ए" - "जेड" केवल एक बिट द्वारा उनके प्रतिनिधित्व में प्रतिष्ठित हैं, जो रजिस्टर के रूपांतरण को सरल करता है और जाँचता है कि कोड मूल्यों की सीमा से संबंधित है या नहीं। वर्णमाला में उनके सीरियल नंबर द्वारा वर्णों का प्रतिनिधित्व किया जाता है, जो बाइनरी सिस्टम में पांच अंकों में लिखे जाते हैं, इसके बाद 0102 (अपरकेस अक्षर के लिए) या 0112 (लोअरकेस अक्षर के लिए) होते हैं।

कंप्यूटर ASCII प्रस्तुति

आधुनिक कंप्यूटर के विशाल बहुमत पर, स्मृति की न्यूनतम पता योग्य इकाई 8-बिट बाइट है। इसलिए, यह 7-बिट वर्णों के बजाय 8-बिट का उपयोग करता है। आमतौर पर, एक ASCII वर्ण को 8 बिट तक विस्तारित किया जाता है, बस एक शून्य बिट को उच्च बिट के रूप में जोड़ा जाता है।

प्रोग्रामिंग में ASCII कोड का उपयोग प्रेस किए गए चाबियों के मध्यवर्ती क्रॉस-प्लेटफ़ॉर्म कोड के रूप में किया जाता है (जैसा कि आईबीएम पीसी स्कैन कोड और अन्य आंतरिक कोड के विपरीत)।

QWERTY कीबोर्ड लेआउट के लिए, कोड तालिका निम्न तालिका शो की तरह दिखती है:

पलायन एफ 1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 प्रिंट स्क्रीन स्क्रॉल ताला ठहराव
`जी 1 2 3 4 5 6 7 8 9 0 - =+ पीछे की जगह सम्मिलित करें घर पेज अप करें नंबर लॉक / जोड़ें। * जोड़ें। + जोड़ दें।
टैब क्यू डब्ल्यू आर टी Y यू मैं हे पी [ ] हटाएं अंत पृष्ठ नीचे 7 जोड़ें। 8 जोड़ें। 9 जोड़ें।
कैप्स लॉक एक एस डी एफ जी एच जम्मू कश्मीर एल ; डब्ल्यू 'ई दर्ज 4 जोड़ें। 5 जोड़ें। 6 जोड़ें। ऐड डालें।
पाली जेड एक्स सी वी बी एन एम ,< .> / पाली \| ऊपर 1 जोड़ें। 2 जोड़ें। 3 जोड़ें।
Ctrl जीतना ऑल्ट अंतरिक्ष बार ऑल्ट जीतना सूची Ctrl वाम नीचे सही इन्स / ० Del /।

46/110

इस कीबोर्ड लेआउट पर कोई रूसी अक्षर नहीं हैं, और कुछ गलतियाँ भी हैं, लेकिन मुख्य विशेषताएं प्रतिबिंबित हैं।

मैं सभी को बोलने के लिए आमंत्रित करता हूं

पाठ सूचना की कोडिंग। ASCII एनकॉडिंग। बुनियादी इस्तेमाल किया सिलिन्डरों का इस्तेमाल किया

कोई भी पाठ एक निश्चित वर्णमाला के वर्णों का एक क्रम है। यदि उपयोग किए गए वर्णमाला के प्रत्येक वर्ण को एक संख्या के साथ एन्कोड किया गया है, तो पाठ को संख्याओं के अनुक्रम के रूप में प्रस्तुत किया जाएगा। कंप्यूटर द्वारा पाठ को संसाधित करते समय, संख्याओं का एक द्विआधारी प्रतिनिधित्व किया जाता है।

एन्कोडेड पाठ की सही व्याख्या के लिए, आपको यह जानना होगा कि मूल वर्णमाला के एक वर्ण का बाइनरी कोड कहां समाप्त होता है और दूसरे का बाइनरी कोड शुरू होता है। आप प्रत्येक चरित्र को 8 बिट्स - एक बाइट के अनुक्रम में एन्कोड कर सकते हैं।

आठ अंकों में, आप 28 \u003d 256 विभिन्न द्विआधारी पूर्णांक - 000000002 से 111111112 तक लिख सकते हैं। यह सुनिश्चित करने के लिए पर्याप्त है कि अंग्रेजी के प्रत्येक अपरकेस और लोअरकेस अक्षर और सभी अरबी अंकों, विराम चिह्नों, कुछ अन्य आवश्यक वर्णों, साथ ही डेटा ट्रांसफर के लिए सेवा कोड एक अद्वितीय (गैर-दोहराव) आठ-बिट पदनाम के साथ मेल खाते हैं।

डिजिटल एन्कोडिंग और बाद के डिकोडिंग की सुविधा के लिए, कोड तालिकाओं को संकलित किया जाता है। विभिन्न ऑपरेटिंग सिस्टम वाले विभिन्न प्रकार के कंप्यूटर विभिन्न कोड तालिकाओं का उपयोग करते हैं। 8-बिट संख्या के साथ कंप्यूटर कीबोर्ड वर्ण एन्कोडिंग के लिए मानकों में से एक अमेरिकन स्टैंडर्ड कोड फॉर इंफॉर्मेशन इंटरचेंज (ASCII) कोड तालिका है। इसकी पहली छमाही (कोड 0-127), विराम चिह्न, अरबी अंक और अंग्रेजी वर्णमाला के वर्णों से युक्त, आमतौर पर दुनिया भर में स्वीकार किए जाते हैं। कोड 128 - ASCII तालिका के 255 (विस्तारित ASCII कोड) मुख्य रूप से राष्ट्रीय वर्णमाला के लिए उपयोग किए जाते हैं।

आप Alt कुंजी को दबाए रखते हुए छोटे संख्यात्मक कीपैड पर वांछित संख्या 0 से 255 तक टाइप करके कोड टेबल खेल सकते हैं। चित्र 1 इस तरह से प्राप्त कोड तालिका दिखाता है।

♫ ☼ ◄ ↕

← ∟ ↔

M N O P R S S T U V

सी एच डब्ल्यू डी एफ वाई वाई एस ई

चित्र 1 - कोड तालिका

कोड पंक्ति संख्या और स्तंभ संख्या से बनता है। उदाहरण के लिए, कोड 50 नंबर 2 से संबंधित है, कोड 134 - अक्षर जे। कोड 0 से 32 तक - सेवा।

विभिन्न राष्ट्रीय भाषाओं के अक्षरों के उपयोग के लिए उन्मुख कोड तालिकाओं के कई प्रकारों की उपस्थिति अपने आप में एक बड़ी असुविधा है। तालिकाओं को व्यवस्थित करने के लिए, वे विशेष नाम और संख्याएँ निर्दिष्ट करने लगे (उदाहरण के लिए,

KOI-8), लेकिन इसने विभिन्न राष्ट्रीय वर्णमालाओं को मिलाकर कोडों की एक एकीकृत प्रणाली बनाने की समस्या को हल नहीं किया।

Microsoft Windows ऑपरेटिंग सिस्टम के नवीनतम संस्करणों द्वारा समर्थित नए अंतर्राष्ट्रीय यूनिकोड मानक के लिए इन असुविधाओं और सीमाओं के उन्मूलन को संभव बनाया गया था। वर्तमान में, यह वर्ण एन्कोडिंग मानक प्रति वर्ण दो बाइट्स आवंटित करता है। यह एन्कोडिंग आपको द्विआधारी वर्णमाला में 216 \u003d 65 536 विभिन्न वर्णों का प्रतिनिधित्व करने की अनुमति देता है। पहले 128 अक्षरों के कोड ASCII जैसे ही हैं।

सूचनाओं की सूचना

निर्णय के साथ TASKS

टास्क। मान लीजिए कि प्रत्येक चरित्र 1 बाइट (KOI-8) के साथ एन्कोडेड है। संदेश की सूचना मात्रा का अनुमान लगाएं

मैं n n की और w ग एक और n इल x, n रों ई डी में ओ और ज n रों एक्स एच और च एल।

संदेश में 39 वर्ण हैं, इसलिए, इसे एन्कोड करने के लिए 1 बाइट / वर्ण * 39 वर्ण \u003d 39 बाइट्स की आवश्यकता होती है,

या 8 बिट्स / बाइट्स * 39 बाइट्स \u003d 312 बिट्स।

1। पिछले उदाहरण के संदेश में, "बाइनरी" शब्द को "दशमलव" शब्द से बदल दिया गया था। संदेश की सूचना मात्रा बिट्स और बाइट्स में कैसे बदल गई है?

उत्तर: संदेश की सूचना मात्रा में 2 बाइट्स, 16 बिट्स की वृद्धि हुई।

2। मान लीजिए कि प्रत्येक चरित्र 1 बाइट (KOI-8) के साथ एन्कोडेड है। संदेश की सूचना मात्रा का अनुमान लगाएं

मैं संदेश भेजने और साझा करने में सक्षम हूं।

उत्तर: संदेश की सूचना मात्रा 48 बाइट्स है।

3। मान लीजिए कि प्रत्येक चरित्र 2 बाइट्स (यूनिकोड) में एन्कोडेड है। संदेश की सूचना मात्रा का अनुमान लगाएं

मैं इस तथ्य से अवगत हूं कि केओ I - 8।

उत्तर: संदेश की सूचना मात्रा 68 बाइट्स है।

4। मान लीजिए कि प्रत्येक चरित्र 2 बाइट्स (यूनिकोड) में एन्कोडेड है। संदेश की सूचना मात्रा का अनुमान लगाएं

ALGORITMMOZNO एस पी आर एस

उत्तर: संदेश की सूचना मात्रा 92 बाइट्स है।

5। मूल रूप से 16-बिट यूनिकोड कोड में दर्ज रूसी में सूचना संदेश को 8-बिट KOI-8 एन्कोडिंग में ट्रांसकोड किया गया था। इसी समय, सूचना संदेश में 480 बिट्स की कमी हुई। अक्षरों में संदेश की लंबाई कितनी है?

उत्तर: संदेश 60 वर्ण लंबा है।

6। मूल रूप से 8-बिट KOI-8 कोड में दर्ज रूसी में सूचना संदेश, 16-बिट यूनीकोड \u200b\u200bएन्कोडिंग में ट्रांसकोड किया गया था। सूचना संदेश की मात्रा में 568 बिट्स की वृद्धि हुई। अक्षरों में संदेश की लंबाई कितनी है?

उत्तर: संदेश की लंबाई 71 वर्ण है।

7। मूल रूप से 8-बिट KOI-8 कोड में दर्ज रूसी में सूचना संदेश, 16-बिट यूनीकोड \u200b\u200bएन्कोडिंग में ट्रांसकोड किया गया था। सूचनात्मक संदेश का आयतन कैसे बदल गया है?

उत्तर: एक सूचनात्मक संदेश की मात्रा दोगुनी हो गई है।

8। 200 बिट्स के लिए यूनिकोड में कितने वर्ण होते हैं?

उत्तर: संदेश में 25 अक्षर हैं।

9। एक संदेश में कितने वर्ण होते हैं, जिनकी जानकारी KOI-8 एन्कोडिंग में 240 बिट्स होती है?

उत्तर: संदेश में 30 वर्ण हैं।


सूचना कोडिंग और छँटाई

निर्णय के साथ TASKS

1. चार अंकों का उपयोग करके A, B, C, D अक्षरों की एन्कोडिंग के लिए बाइनरी कोड   क्रमशः 1000 से 1011 तक। B, D, B, A वर्णों के अनुक्रम के लिए, एक बाइनरी कोड लिखते हैं, जो ऑक्टल कोड में एन्कोडिंग परिणाम प्रस्तुत करते हैं।

चरित्र कोड तालिका 1: तालिका 1 में प्रस्तुत किए गए हैं

संबंधित बाइनरी कोड में 16 बिट्स होते हैं: 1001101110101000, यह संख्या लिखने के लिए अधिक सुविधाजनक है कि ट्रायल में टूटने के साथ ऑक्टल कोड में रूपांतरण: 1 001 101 110 101 000 000। यह स्पष्ट है कि संबंधित ऑक्टल नंबर का निम्न रूप है: 115650।

बाइनरी कोड को हेक्साडेसिमल में दर्शाए गए संख्या में परिवर्तित करने के लिए, बाइनरी रिकॉर्ड को टेट्रैड्स (4 अंकों के समूह) में विभाजित करना सही से शुरू करना सुविधाजनक है।

2. रूसी वर्णमाला के 5 अक्षरों के लिए, उनके बाइनरी कोड सेट किए गए हैं, जिसमें 2 या 3 अंक हो सकते हैं। कोड 3 तालिका में दर्ज किए गए हैं:

1) 110100000100110111

2) 101010000010010011

3) 110100001001100111

4) 110110000100110010.

हम क्रमिक रूप से तालिका 3 के अनुसार बिट्स के समूहों में तोड़कर, चार संदेशों में से प्रत्येक को डिकोड करेंगे:

1) 11 01 000 001 001 10 111 अंकों का अंतिम समूह किसी वर्ण से मेल नहीं खा सकता है

तालिका 3 के अनुसार। संदेश में एक त्रुटि है।

2) 10 10 10 000 01 001 001 1 संदेश में एक त्रुटि है।

3) 11 01 000 01 001 10 01 11

संदेश को डीकोड किया जा सकता है। 4) 11 01 10 000 10 01 10 010 संदेश में त्रुटि है।

उत्तर: 3) 110100001001100111

सहज समाधान के लिए TASKS

1. M, N, P, Q अक्षर को एनकोड करने के लिए, क्रमशः 1000 से 1011 तक चार अंकों के बाइनरी कोड का उपयोग किया जाता है। एन, क्यू, पी, एम वर्णों के अनुक्रम के लिए, एम एक बाइनरी कोड लिखते हैं, जो ऑक्टल कोड में एन्कोडिंग परिणाम प्रस्तुत करते हैं।

उत्तर: बाइनरी कोड 1 001 101 110 101 000, ऑक्टल कोड 115650।

2. अक्षरों ए, बी, सी, डी को एनकोड करने के लिए, क्रमशः 1000 से 1011 तक चार अंकों के बाइनरी कोड का उपयोग किया जाता है। B, D, C, A अक्षरों के अनुक्रम के लिए एक बाइनरी कोड लिखें, जो हेक्साडेसिमल कोड में एन्कोडिंग परिणाम प्रस्तुत करता है।

उत्तर: बाइनरी कोड 1001 1011 1010 1000, हेक्साडेसिमल कोड 9BA9।

3. M, N, O, P अक्षरों को एनकोड करने के लिए क्रमश: 000 से 111 तक तीन अंकों के बाइनरी कोड का उपयोग करें। ओ, एन, एम, पी वर्णों के अनुक्रम के लिए, एक बाइनरी कोड लिखते हैं, जो ऑक्टल कोड में एन्कोडिंग परिणाम प्रस्तुत करते हैं।

उत्तर: बाइनरी कोड 110 101 100 111, ऑक्टल कोड 6547।

4. एम, एन, ओ, पी अक्षर को एनकोड करने के लिए, क्रमशः 100 से 111 तक तीन अंकों के बाइनरी कोड का उपयोग किया जाता है। ओ, एन, एम, पी वर्णों के अनुक्रम के लिए एक बाइनरी कोड लिखें, हेक्साडेसिमल कोड में एन्कोडिंग परिणाम प्रस्तुत करें।

उत्तर: बाइनरी कोड 1101 0110 0111, हेक्साडेसिमल कोड B67।

दूसरा अंक 3 नहीं हो सकता।

6. चार-अंकीय संख्याओं की रचना करने के लिए, 1, 2, 3, 4, 5 संख्याओं का उपयोग किया जाता है, और निम्नलिखित नियमों की आवश्यकता होती है:

पहली जगह में नंबर 1, 3, 4 में से एक हो सकता है;

संख्या रिकॉर्ड में, सम और विषम संख्या वैकल्पिक;

तीसरा अंक 4 नहीं हो सकता।

इन नियमों के अनुसार संकलित सभी संभव संख्याओं को रिकॉर्ड करें।

7. चार-अंकीय संख्याओं की रचना करने के लिए, 1, 2, 3, 4, 5 संख्याओं का उपयोग किया जाता है, और निम्नलिखित नियमों की आवश्यकता होती है:

पहले स्थान पर 2, 4, 5 में से एक हो सकता है;

संख्या रिकॉर्ड में, सम और विषम संख्या वैकल्पिक;

दूसरा और अंतिम अंक समान नहीं हो सकता है। इन नियमों के अनुसार संकलित सभी संभव संख्याओं को रिकॉर्ड करें।

8. रूसी वर्णमाला के 5 अक्षरों के लिए, उनके बाइनरी कोड सेट होते हैं, जिसमें 2 या 3 अंक हो सकते हैं। कोड तालिका में लिखे गए हैं:


इस एन्कोडिंग में चार संदेशों में से केवल एक त्रुटि के बिना पारित हो गया, केवल इसे सही ढंग से डिकोड किया जा सकता है। सूची से यह संदेश प्राप्त करें:

1) 110100000100110011

2) 111010000010010011

3) 110100001001100111

4) 110110000100110010। उत्तर: 110100001001100111

9. रूसी वर्णमाला के 5 अक्षरों के लिए, उनके बाइनरी कोड सेट किए गए हैं, जिसमें 2 या 3 अंक हो सकते हैं। कोड तालिका में लिखे गए हैं:

फाइट के अनुक्रम को एनकोड करें, कोड में ऐसी त्रुटि करें जो आपको संदेश को सही ढंग से डिकोड करने की अनुमति नहीं देगा।

प्रशिक्षण परीक्षा

2 मान लें कि प्रत्येक वर्ण 1 1) 384 बिट्स बाइट एन्कोडेड है   (कोई -8)। दर सूचना 2) 192 बिट्स

इसमें 24 वर्ण शब्द मात्रा

एन्कोडिंग।

3 का उत्पादन किया

recoding

सूचनात्मक संदेश

मूल रूप से 8-8 में दर्ज की गई भाषा

बिट कोड KOI-8, 16-बिट एन्कोडिंग में

यूनिकोड। सूचना का आयतन

संदेश 336 बिट्स की वृद्धि हुई। क्या है

अक्षरों में संदेश की लंबाई?

4 कितने वर्ण हैं

संदेश,

सूचना

कोडिंग में KOI-8 240 है

5 कितने वर्ण हैं

संदेश,

सूचना

जिसका यूनिकोड एनकोडेड है

6 एन्कोडिंग अक्षर ए, बी, सी, डी के लिए

तीन अंकों के बाइनरी कोड का उपयोग करें

सही

यदि आपको कोई त्रुटि मिलती है, तो कृपया पाठ का एक टुकड़ा चुनें और Ctrl + Enter दबाएं।