Дешифриране на код на ascii. ASCII кодиране

Материал за самостоятелно изучаване по темата Лекции 2

ASCII кодова таблица (ASCII - Американски стандартен код за обмен на информация).

Общо, използвайки ASCII таблицата за кодиране (Фигура 1), могат да бъдат кодирани 256 различни знака. Тази таблица е разделена на две части: основната (с кодове от OOh до 7Fh) и допълнителната (от 80h до FFh, където буквата h показва, че кодът принадлежи към шестнадесетичната система от числа).

Фигура 1

За да се кодира един символ от таблицата, се разпределят 8 бита (1 байт). При обработка текстова информация  един байт може да съдържа кода на някакъв символ - букви, цифри, препинателни знаци, знаци за действие и т.н. Всеки знак има свой собствен код под формата на цяло число. В този случай всички кодове се събират в специални таблици, наречени кодиране. С тяхна помощ символният код се преобразува във видимото му представяне на екрана на монитора. В резултат на това всеки текст в компютърната памет е представен като поредица от байтове с символни кодове.

Например думата здравей! ще бъдат кодирани както следва (таблица 1).

Таблица 1

Фигура 1 показва знаците, включени в стандартното (английски) и разширеното (руски) ASCII кодиране.

Първата половина на таблицата на ASCII е стандартизирана. Съдържа контролни кодове (от 00h до 20h и 77h). Тези кодове се премахват от таблицата, защото не се прилагат за текстови елементи. Пунктуацията и математическите знаци също са поставени тук: 2lh - !, 26h - &, 28h - (, 2Bh - +, ..., главни и малки букви от латиница: 41h - A, 61h - a.

Втората половина на таблицата съдържа национални шрифтове, псевдографски символи, от които могат да бъдат изградени таблици, специални математически знаци. Долната част на кодиращата таблица може да бъде заменена с помощта на съответните драйвери - контролни помощни програми. Тази техника ви позволява да използвате няколко шрифта и техните слушалки.

Дисплеят за всеки код на символа трябва да показва изображението на символа - не само цифров код, но и съответната картина, тъй като всеки символ има своя собствена форма. Описанието на формата на всеки символ се съхранява в специална дисплейна памет - генератор на символи. Символ се показва на екрана на IBM PC, например, чрез точки, образуващи символна матрица. Всеки пиксел в такава матрица е елемент на изображението и може да бъде ярък или тъмен. Тъмната точка е кодирана с числото 0, светлата (ярка) - 1. Ако показвате тъмните пиксели като точка в полето на матрицата на героя, а светлите пиксели със звездичка, можете да изобразите графично формата на героя.

Хората в различни страни използват знаци, за да записват думите на родния си език. В наши дни повечето приложения, включително електронни системи и уеб браузъри, са чисто 8-битови, тоест те могат само да показват и да приемат правилно 8-битови символи, съгласно стандарта ISO-8859-1.

В света има повече от 256 знака (като се имат предвид кирилицата, арабският, китайският, японският, корейският и тайландският език), а също така се появяват все повече и повече нови знаци. Това създава следните пространства за много потребители:

Не е възможно да се използват символи от различни набори символи в един и същ документ. Тъй като всеки текстов документ използва собствен набор от кодировки, има големи трудности с автоматично разпознаване на текст.

Появяват се нови знаци (например: Euro), в резултат на което ISO разработва нов стандарт ISO-8859-15, който е много подобен на стандарта ISO-8859-1. Разликата е следната: от таблицата за кодиране на стария стандарт ISO-8859-1 бяха премахнати символи на обозначаването на стари валути, които в момента не се използват, за да се освободи място за новопоявили се символи (например евро). В резултат на това потребителите могат да имат едни и същи документи на дискове, но в различни кодировки. Решението на тези проблеми е приемането на единен международен набор от кодировки, наречени универсално кодиране  или unicode.

По време на формирането на ASCII, контролните знаци, присъщи на телетипите и пишещите машини, са включени в началото на кодирането и с течение на времето те плътно загиват там, въпреки че на практика не се използват в 21 век.

Давам подробна информация за кодирането на ASCII:

ASCII  (Eng. Аmerican итеtandard вода за азсъоветната азnterchange, [ˈæs.ki]) - името на таблицата (кодиране, набор), в която цифровите кодове са свързани с някои общи печатни и непечатани знаци. Таблицата е разработена и стандартизирана в САЩ през 1963г. Името "ASCII" на руски език често се произнася като [ питам (и) и].

Таблицата ASCII определя кодовете за знаци:

  • десетични цифри;
  • латинска азбука;
  • национална азбука;
  • препинателни знаци;
  • контролни знаци.

Историята

Първоначално (1963 г.) ASCII е разработен за кодиране на символи, чиито кодове са поставени в 7 бита (128 символа; 27 \u003d 128), докато най-значимият 7-ми бит (номериране от нулата) се използва за контрол на грешки, възникнали по време на прехвърляне на данни.

С течение на времето кодирането се разшири до 256 знака (28 \u003d 256); кодовете на първите 128 знака не са променени. ASCII започна да се възприема като половината от 8-битовото кодиране, а „разширеният ASCII“ се нарича ASCII с включен 8-ми бит (например KOI-8).

Наслагване на символи

Използвайки символа Backspace (BS) (връщане на един символ), можете да отпечатате един знак върху принтера. В ASCII можете да добавяте диакритици към букви по същия начин, например:

  • a BS '→ á
  • a BS `→ à
  • a BS ^ → â
  • o BS / → ø
  • c BS, → ç
  • n BS ~ → ñ

забележка: в стари шрифтове апострофът "» "е начертан с наклон вляво (сравнете" '"и" ´ "), а тилдата" ~ "е изместен нагоре (сравнете" ~ "и" ˜ "), така че те просто пасват на ролята героите са „´“ и „tilde отгоре“.

Ако отпечатате един и същ символ два пъти на една и съща позиция, получавате удебелен знак. Ако отпечатате знак в една позиция и след това подчертаете „_“, ще се получи подчертан знак.

  • a BS a → а
  • a BS _ → a

Тази техника все още се използва например в системата за помощ на човека.

Национални опции за ASCII

Стандартът ISO 646 (ECMA-6) позволява поставянето на национални знаци в ASCII. За това се предлага да се заменят знаците "@", "[", "\\", "]", "^", "` "," ("," Вертикална лента ",") "," ~ ". Също така символът на паунда "£" може да бъде поставен на мястото на знака за фунта "#", а валутният знак "¤" може да бъде поставен на мястото на символа на долара "$". Такава система е много подходяща за европейските езици, тъй като те използват латински букви и само няколко допълнителни знака. Вариант на ASCII, който не съдържа национални знаци, се нарича "US-ASCII" или "международна референтна версия."

За някои езици с нелатински писмености (руски, гръцки, арабски, иврит) имаше по-радикални модификации на ASCII. В една от тези модификации на мястото на малки латински букви бяха поставени национални символи (за руски и гръцки - главни букви). Друга модификация включваше превключване между US-ASCII и националната версия; превключването е извършено "в движение" - с помощта на знаците SO (англ. итеhift оut) и SI (английски итеhift азн); в този случай в националната версия беше възможно напълно да се заменят латинските букви с национални символи. Вижте също: KOI-7.

Впоследствие се оказа по-удобно да се използват 8-битови кодировки (кодови страници), в които долната половина на кодовата таблица (0‑127) е заета от US-ASCII символи, а горната (128–255) са допълнителни символи, включително набор от национални знаци.

Така горната половина на таблицата ASCII преди широкото приемане на Unicode активно се използва за представяне на локализирани знаци, букви от местния език.

Липсата на единен стандарт за поставяне на кирилица в таблицата на ASCII предизвика много проблеми с кодирането (KOI-8, Windows-1251 и др.). Други езици с нелатински писмености също страдат поради наличието на няколко различни кодировки.

Първите 128 знака от стандарта Unicode съответстват на съответните US-ASCII символи.

ASCII таблица

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .d например гости- .F
0. NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1. DLE DC1 DC2 DC3 DC4 NAK SYN ЕТВ CAN EM SUB ESC FS GS RS САЩ
2. ! « # $ % & ( ) * + , - . /
3. 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4. @ А B C D E F G Н аз J K L М N О
5. P Q R S T U V W X Y Z [ \ ] ^ _
6. ` а б в г д е г з аз к к л m п о
7. р р r ите т ф v w х ш z { | } ~ DEL

В първата версия на стандарта ASCII (1963 г.) символите „стрелка нагоре“ и „лява стрелка“ са разположени съответно в позиции 0x5e (94) и 0x5f (95). Стандартът ECMA-6 (1965 г.) ги замени със символ на вмъкване (който също се използва като обиколен символ „^”) и символа за подчертаване „_”.

Контролни знаци

ASCII таблицата е създадена за обмен на информация за телетипи. Комплектът включваше непечатващи се символи, използвани като команди за управление на телетипното устройство. Подобни команди са били използвани и в други инструменти за съобщения преди компютъра (код на Морс, азбука на семафор), като се вземат предвид спецификите на устройството.

  • NUL, 00 - нула, празна. Нулевият символ винаги е игнориран. На перфорираните ленти числото "1" е обозначено с дупка, а числото "0" - чрез липса на дупка. Секциите с перфорирана лента, където информацията не е записана, не съдържат дупки, тоест съдържат нулеви знаци; такива сайтове бяха разположени в началото и в края на лентата. Нулевият символ все още се използва в много езици за програмиране като знак на края на реда и се обозначава с "\\ 0". (Терминът "низ" се отнася до последователност от знаци.) В някои операционни системи null е последният символ на всеки текстов файл.

Съобщенията, предавани по комуникационния канал, бяха разделени на две части:

  • "Header";
  • "Текст".

„Заглавката“ съдържа адресите на подателя и получателя, контролната сума и т.н., може да бъде поставена преди „текст“ или след това. Терминът "текст" беше частта от съобщението, предназначена за печат.

  • SOH, 01 - итепроститутка ое зизчезване, началото на "заглавката".
  • STX, 02 - итетарт от тд хt, началото на "текста". Символът е използван като команда за включване на принтера за телетайп. Текстът за печат беше разположен между знаците STX и ETX.
  • ETX, 03 - дот тд хt, края на "текста". Символът е използван за изключване на печатащото устройство на телетип. В наши дни код 03 се използва за изпращане на сигнал SIGINT към процес. sIGния интerrupt) и може да бъде изпратено чрез натискане на комбинацията клавиши Ctrl + C. След като получи такъв сигнал, процесът трябва да завърши работата.
  • EOT, 04 - дри ое тпредаване, край на прехвърляне. Символът се използва от терминални емулатори със значението „край на файла“ (EOF, eng. дри ое еил) и може да бъде изпратено чрез натискане на клавишната комбинация Ctrl + D. След като получи такъв характер, терминалният емулатор ще определи процеса, който в момента работи с терминала, и ще зададе флаг „край на файла“ (EOF) за стандартния входен поток (stdin, eng. воandar г впусна поток) от този процес. В резултат на това процесът ще спре да чете stdin и ще започне да обработва прочетените данни.
  • ENQ, 05 - eNQuire. „Моля за потвърждение“.
  • ACK, 06 - аСКnowledgement. „Потвърждавам.“ Символът NAK означава точно обратното - „Не потвърждавам“.
  • BEL, 07 - белl, обадете се, бийп. Символът често се нарича "\\ a" и се използва за подаване на аларма. В модерен компютър звукът се възпроизвежда от вградения говорител. Например, следните команди могат да възпроизвеждат звук: echo -e “\\ a” или echo -e “\\ 007 ″ (bash); ехо ^ G (cmd.exe; за да въведете ^ G натиснете Ctrl + G), printf ("\\ a"); (код на език за програмиране C).
  • BS, 08 - баСК итетемп, връщане на един символ. Бутонът ← Backspace изтрива предишния символ.
  • TAB, 09 - тab, хоризонтален таб. Означена е като "\\ t". Понякога се нарича HT от английски. зоРИЗОНТАЛНИ тabulation.
  • LF, 0A - лин еeed, линия емисия. Команда да спуснете носителя за печат с една линия надолу. Символът се използва за маркиране на края на ред от текстов файл в UNIX. CR LF последователност от символи показва края на текстов файл в Windows. Символът в много езици за програмиране е посочен като "\\ n". Натискането на клавиша ↵ Enter, докато извежда текст, води до подаване на ред.
  • VT, 0B - vertical тab, вертикален таб.
  • FF, 0C - еoRM еeed, стартиране на страница, нова страница. Команда за принтер: продължете печатането от началото на следващия лист.
  • CR, 0D - вarriage rетурн, връщане с превоз. Команда за принтера: продължете печатането от началото на текущия ред (не от нов ред). В много езици за програмиране символът CR се обозначава като "\\ r". В Mac OS символът CR показва края на ред в текстов файл. От клавиатурата символът CR може да бъде въведен чрез натискане на клавишната комбинация Ctrl + M.
  • SO, 0E - итеhift оут, преминете към друга лента. Друга лента обикновено беше боядисана в червено. Впоследствие символът е използван за преминаване към националното кодиране.
  • SI, 0F - итеhift азп. Командата за изпълнение на обратното действие на SO: превключване към лентата на източника или превключване към кодирането на източника.
  • DLE, 10 - гаТА лмастило дскап, освобождавайки канала за данни. Всеки знак след DLE трябва да се интерпретира като данни, а не като контролни знаци.
  • DC1, 11 - гройст во вontrol 1 , 1-ви символ на контрола на устройството. Команда: Включете четеца на касети.
  • DC2, 12 - гройст во вontrol 2 , 2-ри символ за управление на устройството. Команда: включете перфоратора.
  • DC3, 13 - гройст во вontrol 3 , 3-ти символ на устройството за управление. Команда: изключете четеца на касети.
  • DC4, 14 - гройст во вontrol 4 , 4-ти символ на управление на устройството. Команда: изключете удара.
  • NAK, 15 - пegative ав ксега потвърждение, не потвърждавайте. Връщане към ACK.
  • SYN, 16 - синchronization. Този символ се предаваше, когато беше необходимо да се предаде нещо за синхронизация.
  • ЕТВ, 17 - дот твътр бзаключване, край на текстовия блок. Понякога по технически причини текстът беше разделен на блокове.
  • CAN, 18 - могаcel, отмяна (на това, което беше предадено по-рано).
  • EM, 19 - дот medium, край на носача (свърши хартиена лента, хартия и т.н.)
  • SUB, 1А - подводницаstitute, замествам. На мястото се поставя символ, чиято стойност е загубена или повредена по време на предаването. Или знак се поставя пред символ, за тълкуването на който трябва да преминете към допълнителен набор от знаци. Или знак се поставя пред символ, който трябва да бъде отпечатан в различен цвят. В момента символ се вмъква чрез натискане на клавишната комбинация Ctrl + Z и се използва за маркиране на края на файл в DOS и Windows.
  • ESC, 1B - eSCмаймуна. Символът, следващ символа ESC, има различно значение от определения в ASCII. Обикновено аварийните последователности следват ESC символ. В DOS те се реализират от драйвера ANSI.SYS

Поддържа се разделянето на данни на 4 нива:

  • съобщението може да се състои от файлове;
  • файловете могат да се състоят от групи;
  • групите могат да се състоят от записи;
  • записите могат да се състоят от единици.
  • FS, 1С - еил итеепаратор, разделител на файлове.
  • GS, 1D - гдифтерит по кокошките итеепаратор, групов разделител.
  • RS, 1Е - record итеепаратор, разделител на записи.
  • САЩ, 1F - фгнида итеепаратор, разделител за единица.
  • DEL, 7F - делete, изтрийте последния символ. Със символа DEL, състоящ се от всички единици в двоичен код, всеки символ може да бъде „забит“. Устройствата и програмите игнорираха DEL, както и NUL. Кодът на този символ идва от първите текстообработващи устройства с памет на перфорирана лента: в тях символът е изтрит чрез „запушване“ на кода му с дупки (обозначаващи логически единици).

Структурни свойства на таблицата

  • Символните кодове на цифрите "0" - "9" в двоичната система от числа започват с 00112 и завършват с двоични числа. Например, 01012 е числото 5, а 0011 01012 е символът "5". Знаейки това, можете да конвертирате двоични десетични числа (BCD) в ASCII низ, като просто добавите 00112 към всеки двоичен десетичен крясък отляво.
  • Буквите "A" - "Z" на горния и долния регистър се отличават по своето представяне само с един бит, което опростява преобразуването на регистъра и проверка дали кодът принадлежи към диапазона от стойности. Буквите са представени чрез техните серийни номера в азбуката, написани с пет цифри в двоичната система, последвани от 0102 (за главни букви) или 0112 (за малки букви).

Компютърна ASCII презентация

На огромното мнозинство от съвременните компютри минималната адресируема единица памет е 8-битов байт. Следователно, той използва 8-битови, а не 7-битови знаци. Обикновено ASCII символ се разширява до 8 бита, като просто се добавя един нулев бит като висок бит.

ASCII кодовете се използват в програмирането като междинни междуплатформени кодове на натиснати клавиши (за разлика от кодовете за сканиране на IBM PC и други вътрешни кодове).

За QWERTY оформлението на клавиатурата кодовата таблица изглежда така, както показва следната таблица:

бягство F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 Екран за печат Заключване на превъртането пауза
1 2 3 4 5 6 7 8 9 0 - =+ Обратно пространство Insert у дома Страница нагоре Num заключване / добавяне. * добавяне. + добавяне.
етикет Q W E R T Y U аз О P [ ] Изтриване край Страница надолу 7 добавете. 8 добавете. 9 добавяне.
Caps заключване А S D F G Н J K L ; w Въведете 4 добавете. 5 добавете. 6 добавете. Въведете добавяне.
изместване Z X C V B N М ,< .> / изместване \| нагоре 1 добавете. 2 добавете. 3 добавете.
Ctrl печалба Alt Space bar Alt печалба списък Ctrl Ляв надолу прав Ins / 0 Дел /.

46/110

В тази подредба на клавиатурата няма руски букви и има и някои неточности, но основните характеристики се отразяват.

Каня всички да говорят

КОДИРАНЕ НА ИНФОРМАЦИЯ ЗА ТЕКСТА. ASCII ENCODING. ОСНОВНИ ИЗПОЛЗВАНИ КИРИЛИЙСКИ КОДОВЕ

Всеки текст е поредица от знаци от определена азбука. Ако всеки символ на използваната азбука е кодиран с число, текстът ще бъде представен като поредица от числа. При обработка на текст от компютър се използва двоично представяне на числа.

За правилното тълкуване на кодирания текст трябва да знаете къде завършва двоичният код на един символ от оригиналната азбука и започва бинарният код на друг. Можете да кодирате всеки символ в последователност от 8 бита - един байт.

С осем цифри можете да запишете 28 \u003d 256 различни двоични числа - от 000000002 до 111111112. Това е достатъчно, за да се гарантира, че всяка главна и малка буква на английската и руската азбука, всички арабски цифри, препинателни знаци, някои други необходими знаци, както и сервизни кодове за пренос на данни, съответстват на уникално (не повтарящо се) осем битово обозначение.

За удобство на цифровото кодиране и последващото декодиране се съставят кодови таблици. Различните видове компютри с различни операционни системи използват различни кодови таблици. Един от стандартите за кодиране на символи на компютърната клавиатура с 8-битови числа е американската стандартна код за обмен на информация (ASCII). Първата му половина (кодове 0-127), съдържаща препинателни знаци, арабски цифри и знаци от английската азбука, е по споразумение общоприето в целия свят. Кодовете 128 - 255 от таблицата на ASCII (разширени кодове на ASCII) се използват главно за национални азбуки.

Можете да играете на кодовата таблица, като напишете желаното число от 0 до 255 на малката цифрова клавиатура, докато държите клавиша Alt. Фигура 1 показва таблицата с кодове, получена по този начин.

♫ ☼ ◄ ↕

← ∟ ↔

M N O P R S T U V

C H W D F Y S E

Фигура 1 - Таблица с кодове

Кодът се формира от номера на реда и номера на колоната. Например, кодът 50 съответства на числото 2, кодът 134 - буквата J. Кодове от 0 до 32 - услуга.

Наличието на много варианти на кодови таблици, ориентирани към използването на азбуки на различни национални езици, само по себе си е голямо неудобство. За да организират таблиците, те започнаха да присвояват специални имена и номера (напр.

KOI-8), но това не реши проблема със създаването на единна система от кодове, комбиниращи различни национални азбуки.

Елиминирането на тези неудобства и ограничения стана възможно благодарение на новия международен стандарт Unicode, поддържан от най-новите версии на операционната система Microsoft Windows. В момента този стандарт за кодиране на символи разпределя два байта на символ. Това кодиране ви позволява да представите 216 \u003d 65 536 различни знака в двоичната азбука. Кодовете на първите 128 знака са същите като ASCII.

ИНФОРМАЦИОНЕН ОБЕМ НА ПОСЛАНИЯТА

ЗАДАЧИ С РЕШЕНИЯ

Задача. Да предположим, че всеки символ е кодиран с 1 байт (KOI-8). Преценете обема на информация на съобщението

I п п и т в а и п IL х л и г в о и ч н и х и е л.

Съобщението съдържа 39 знака, следователно за кодирането му е необходим 1 байт / символ * 39 символа \u003d 39 байта,

или 8 бита / байта * 39 байта \u003d 312 бита.

1. В съобщението на предишния пример думата „двоичен“ е заменена с думата „десетична“. Как се промени обемът на информацията на съобщението в битове и байтове?

Отговор: информационният обем на съобщението се увеличи с 2 байта, с 16 бита.

2. Да предположим, че всеки символ е кодиран с 1 байт (KOI-8). Преценете обема на информация на съобщението

Способен съм да общувам и споделям съобщение.

Отговор: информационният обем на съобщението е 48 байта.

3. Да предположим, че всеки символ е кодиран в 2 байта (Unicode). Преценете обема на информация на съобщението

Наясно съм с факта, че КО I - 8.

Отговор: информационният обем на съобщението е 68 байта.

4. Да предположим, че всеки символ е кодиран в 2 байта (Unicode). Преценете обема на информация на съобщението

ALGORITMMOZNO S P R S

Отговор: обемът на информацията на съобщението е 92 байта.

5. Информационното съобщение на руски език, първоначално записано в 16-битовия код на Unicode, беше прекодирано в 8-битовото кодиране на KOI-8. В същото време информационното съобщение намалява с 480 бита. Каква е дължината на съобщението в знаци?

Отговор: Съобщението е дълго 60 знака.

6. Информационното съобщение на руски език, първоначално записано в 8-битовия код KOI-8, беше прекодирано в 16-битовото кодиране на Unicode. Обемът на информационното съобщение се увеличи с 568 бита. Каква е дължината на съобщението в знаци?

Отговор: Дължината на съобщението е 71 знака.

7. Информационното съобщение на руски език, първоначално записано в 8-битовия код KOI-8, беше прекодирано в 16-битовото кодиране на Unicode. Как се е променил обемът на информационното съобщение?

Отговор: обемът на информационното съобщение се е удвоил.

8. Колко знака съдържа съобщение в Unicode за 200 бита?

Отговор: съобщението съдържа 25 знака.

9. Колко знака съдържа съобщение, чийто обем на информация в кодирането на KOI-8 е 240 бита?

Отговор: съобщението съдържа 30 знака.


ИНФОРМАЦИОННО КОДИРАНЕ И ДЕКОДИРАНЕ

ЗАДАЧИ С РЕШЕНИЯ

1. За кодиране на буквите A, B, C, D, използвайки четирицифрена двоични кодове  от 1000 до 1011 съответно. За поредица от знаци B, D, B, A напишете двоичен код, представете резултата от кодирането в октален код.

Кодовете на знаците са представени в таблица 1: таблица 1

Съответният двоичен код съдържа 16 бита: 1001101110101000, по-удобно е да напишете това число за преобразуване в осмичен код с разбивка на триади: 1 001 101 110 101 000. Ясно е, че съответното октално число има следната форма: 115650.

За да преобразувате число, представено в двоичен код, в шестнадесетичен, е удобно да разделите двоичния запис на тетради (групи от 4 цифри), като се започне отдясно.

2. За 5 букви от руската азбука са зададени техните двоични кодове, които могат да съдържат 2 или 3 цифри. Кодовете се записват в таблица 3:

1) 110100000100110111

2) 101010000010010011

3) 110100001001100111

4) 110110000100110010.

Ние последователно ще декодираме всяко от четирите съобщения, разбивайки на групи битове в съответствие с таблица 3:

1) 11 01 000 001 001 10 111 Последната група цифри не може да бъде съпоставена от знак

съгласно таблица 3. Съобщението съдържа грешка.

2) 10 10 10 000 01 001 001 1 Съобщението съдържа грешка.

3) 11 01 000 01 001 10 01 11

Съобщението може да бъде декодирано. 4) 11 01 10 000 10 01 10 010 Съобщението съдържа грешка.

Отговор: 3) 110100001001100111

ЗАДАЧИ ЗА НЕЗАВИСИМО РЕШЕНИЕ

1. За кодиране на буквите M, N, P, Q се използват четирицифрени двоични кодове съответно от 1000 до 1011. За поредица от знаци N, Q, P, M напишете двоичен код, представете резултата от кодирането в октален код.

Отговор: двоичен код 1 001 101 110 101 000, осмален код 115650.

2. За кодиране на буквите A, B, C, D се използват четирицифрени двоични кодове съответно от 1000 до 1011. За поредица от знаци B, D, C, A напишете двоичен код, представете резултата от кодирането в шестнадесетичен код.

Отговор: двоичен код 1001 1011 1010 1000, шестнадесетичен код 9BA9.

3. За да кодирате буквите M, N, O, P, използвайте трицифрени двоични кодове съответно от 000 до 111. За поредица от знаци O, N, M, P напишете двоичен код, представете резултата от кодирането в октален код.

Отговор: двоичен код 110 101 100 111, осмален код 6547.

4. За кодиране на буквите M, N, O, P се използват трицифрени двоични кодове съответно от 100 до 111. За поредица от знаци O, N, M, P напишете двоичен код, представете резултата от кодирането в шестнадесетичен код.

Отговор: двоичен код 1101 0110 0111, шестнадесетичен код B67.

втората цифра не може да бъде 3.

6. За съставяне на четирицифрени числа се използват числата 1, 2, 3, 4, 5 и се изискват следните правила:

на първо място може да бъде едно от числата 1, 3, 4;

в записа на числа се редуват четни и нечетни числа;

третата цифра не може да бъде 4.

Запишете всички възможни числа, съставени съгласно тези правила.

7. За съставяне на четирицифрени числа се използват числата 1, 2, 3, 4, 5 и се изискват следните правила:

на първо място може да бъде едно от числата 2, 4, 5;

в записа на числа се редуват четни и нечетни числа;

втората и последната цифра не могат да бъдат еднакви. Запишете всички възможни числа, съставени съгласно тези правила.

8. За 5 букви от руската азбука са зададени техните двоични кодове, които могат да съдържат 2 или 3 цифри. Кодовете са написани в таблицата:


От четирите съобщения в това кодиране само едно премина без грешки, само че може да бъде правилно декодирано. Намерете това съобщение от списъка:

1) 110100000100110011

2) 111010000010010011

3) 110100001001100111

4) 110110000100110010. Отговор: 110100001001100111

9. За 5 букви от руската азбука са зададени техните двоични кодове, които могат да съдържат 2 или 3 цифри. Кодовете са написани в таблицата:

Кодирайте последователността на FIGHT, направете такава грешка в кода, която няма да ви позволи правилно да декодирате съобщението.

ТЕСТОВЕН ТЕСТ

2 Да приемем, че всеки символ е кодиран 1 1) 384 бита байт  (Koi-8). Оценете информационно 2) 192 бита

обем на 24 знака в това

кодираща.

3 произведени

прекодиране

информационно съобщение

език, първоначално записан в 8-

битов код KOI-8, в 16-битово кодиране

Unicode. Обемът на информацията

съобщенията се увеличиха с 336 бита. Какво е

дължина на съобщението в знаци?

4 Колко символа съдържа

съобщение,

информация

което в кодиращото KOI-8 е 240

5 Колко символа съдържа

съобщение,

информация

чийто Unicode е кодиран

6 За кодиране на букви A, B, C, D

използвайте трицифрени двоични кодове

прав

Ако откриете грешка, моля, изберете текст и натиснете Ctrl + Enter.