Kódovanie textových informácií. Prečo je binárne kódovanie univerzálne? Metódy programovania

Pozrime sa, ako všetky rovnaké digitalizovať texty? Mimochodom, na našich stránkach môžete preložiť akýkoľvek text na desatinné, hexadecimálne, binárny kód  Používanie online kalkulačky kódov.

Kódovanie textu.

Podľa počítačovej teórie pozostáva akýkoľvek text z jednotlivých znakov. Medzi tieto znaky patria: písmená, čísla, interpunkcia malých písmen, špeciálne znaky („“, č., () Atď.), Medzi ktoré tiež patria medzery.

Potrebné vedomosti. Súbor znakov, s ktorými zapisujem text, sa nazýva ALFAVIT.

Počet znakov v abecede predstavuje jej moc.

Množstvo informácií môže byť určené vzorcom: N \u003d 2b

  • N je rovnaká sila (veľa znakov),
  • b - Bit (hmotnosť získaného znaku).

Abeceda, v ktorej bude 256, môže obsahovať takmer všetky potrebné znaky. Takéto abecedy sa nazývajú DOSTATOČNÉ.

Ak vezmeme abecedu s kapacitou 256 a nezabudnite, že 256 \u003d 28

  • 8 bitov sa vždy nazýva 1 bajt:
  • 1 bajt \u003d 8 bitov.

Ak preložíte každý znak do binárneho kódu, tento kód počítačového textu zaberá 1 bajt.

Ako môžu textové informácie vyzerať v pamäti počítača?

Akýkoľvek text je napísaný na klávesnici, na klávesniciach, vidíme znaky, ktoré sú nám známe (čísla, písmená atď.). Do pamäte RAM počítača vstupujú iba ako binárny kód. Binárny kód každého znaku vyzerá ako osemciferné číslo, napríklad 00111111.

Pretože bajt je najmenšou adresovateľnou časticou pamäte a pamäť je adresovaná každému znaku osobitne, výhoda takéhoto kódovania je zrejmá. 256 znakov je však veľmi výhodné množstvo pre všetky informácie o znakoch.

Prirodzene, vyvstala otázka: Ktoré konkrétne osem bitový kód  patrí ku každej postave? A ako prekladať text do digitálneho kódu?

Tento proces je podmienený a máme právo prísť s rôznymi metódy kódovania znakov, Každý symbol abecedy má číslo od 0 do 255. Každému číslu je pridelený kód od 00000000 do 11111111.

Tabuľka pre kódovanie je „cheat sheet“, ktorý označuje znaky abecedy v súlade so sériovým číslom. Pre rôzne typy počítačov používajte na kódovanie rôzne tabuľky.

ASCII (alebo Asuka) sa stala medzinárodným štandardom pre osobné počítače. Tabuľka má dve časti.

Prvá polovica tabuľky ASCII. (Bola to prvá polovica, ktorá sa stala štandardom.)


Súlad s lexikografickým poradím, to znamená, že v tabuľke sú písmená (malé a veľké) uvedené v prísnom abecednom poradí a čísla vo vzostupnom poradí sa nazývajú princípom postupného kódovania abecedy.

Aj pre ruskú abecedu dodržiavajte princíp sekvenčného kódovania.

Teraz dnes používajú celé päť kódovacích systémov  Ruská abeceda (KOI8-P, Windows. MS-DOS, Macintosh a ISO). Kvôli počtu systémov kódovania a nedostatku jedného štandardu veľmi často dochádza k nedorozumeniam pri prenose ruského textu do jeho počítačovej formy.

Jeden z prvých   normy kódovania ruskej abecedya na osobných počítačoch zvážiť KOI8 („8-bitový kód výmeny informácií“). Toto kódovanie sa používalo v polovici sedemdesiatych rokov na sérii počítačov ES a od polovice osemdesiatych rokov sa začalo používať v prvých operačných systémoch UNIX preložených do ruštiny.

Od začiatku deväťdesiatych rokov, tzv. Času, keď dominoval operačný systém MS DOS, sa objaví kódovací systém CP866 („CP“ znamená „kódová stránka“, „kódová stránka“).

Počítačový gigant APPLE, ktorého inovatívny systém je pod kontrolou (Mac OS), začína používať vlastný systém na kódovanie abecedy MAC.

Medzinárodná organizácia pre normalizáciu (ISO) stanovuje ďalšiu normu pre ruský jazyk systém kódovania abecedynazýva sa ISO 8859-5.

A najbežnejším systémom kódovania abecedy, ktorý bol vynájdený v systéme Microsoft Windows, sa dnes nazýva CP1251.

Od druhej polovice deväťdesiatych rokov bol vyriešený problém normy pre preklad textu do digitálneho kódu pre ruský jazyk, a to nielen zavedením systému s názvom Unicode do normy. Predstavuje šestnásťbitové kódovanie, čo znamená, že pre každý znak sú pridelené presne dva bajty pamäte RAM. S týmto kódovaním sa samozrejme náklady na pamäť zdvojnásobia. Takýto kódový systém však umožňuje prekladať až 65536 znakov do elektronického kódu.

Špecifikami štandardného systému Unicode je zahrnutie absolútne akejkoľvek abecedy, či už existujúcej, zaniknutej, vytvorenej. Nakoniec, absolútne akákoľvek abeceda, okrem toho, systém Unicode, obsahuje veľa matematických, chemických, hudobných a bežných symbolov.

Použime tabuľku ASCII, aby sme zistili, ako môže slovo vyzerať v pamäti počítača.


Často sa stáva, že váš text napísaný písmenami ruskej abecedy nie je čitateľný, je to kvôli rozdielu v systémoch kódovania abecedy v počítačoch. Toto je veľmi častý problém, ktorý sa často zisťuje.


Minimálnymi informačnými jednotkami sú bity a bajty.

jeden  bit vám umožní kódovať 2   hodnoty (0 alebo 1).

použitím dva  bity možno kódovať 4   Hodnoty: 00, 01, 10, 11.

tri  bity sú kódované 8   rôzne hodnoty: 000, 001, 010, 011, 100, 101, 110, 111.

Z vyššie uvedených príkladov je zrejmé, že pridaním jedného bitu sa zdvojnásobí počet hodnôt, ktoré je možné kódovať:

1 bitové kódovanie -\u003e 2 rôzne hodnoty (2 1 \u003d 2),

2 bity kódujú -\u003e 4 rôzne hodnoty (2 2 \u003d 4),

3 bity kódujú -\u003e 8 rôznych hodnôt (2 3 \u003d 8),

4 bity kódujú -\u003e 16 rôznych hodnôt (2 4 \u003d 16),

5 bitov kóduje -\u003e 32 rôznych hodnôt (2 5 \u003d 32),

6 bitov kóduje -\u003e 64 rôznych hodnôt (26 \u003d 64),

7 bitov kóduje -\u003e 128 rôznych hodnôt (2 7 \u003d 128),

8 bitov kóduje -\u003e 256 rôznych hodnôt (28 \u003d 256),

9 bitov kóduje -\u003e 512 rôznych hodnôt (2 9 \u003d 512),

10 bitov kóduje -\u003e 1024 rôznych hodnôt (2 10 \u003d 1024).

Pamätáme si, že v jednom bajte, nie 9 alebo 10 bitoch, ale iba 8. Preto pomocou jedného bajtu môžete kódovať 256 rôznych znakov. Myslíte si, že je to veľa alebo málo? Pozrime sa na príklad kódovania textové informácie.

V ruštine je 33 písmen, a preto sa na ich kódovanie vyžaduje 33 bajtov. Počítač rozlišuje medzi veľkými (malými) a malými (malými) písmenami, iba ak sú kódované rôznymi kódmi. Na kódovanie veľkých a malých písmen ruskej abecedy je teda potrebných 66 bajtov.

Pre veľké a malé písmená anglickej abecedy sa vyžaduje ďalších 52 bajtov. Výsledok je 66 + 52 \u003d 118 bajtov. Tu musíte tiež pridať čísla (od 0 do 9), medzeru, všetky interpunkčné znamienka: bodku, čiarku, pomlčku, výkričník a otáznik, zátvorky: okrúhle, kučeravé a štvorcové, ako aj znaky matematických operácií: +, -, \u003d, / (toto je delenie), * (toto je násobenie). Pridávame tiež špeciálne znaky:%, $, &, @, #, č. Atď. Toto všetko dohromady predstavuje asi 256 rôznych znakov.

A potom sa záležitosť nechala na malej. Je potrebné zabezpečiť, aby sa všetci ľudia na Zemi dohodli, na ktorých konkrétnych kódoch (od 0 do 255, t. J. Celkom 256) priradiť týmto symbolom. Predpokladajme, že všetci ľudia súhlasia, že kód 33 znamená výkričník (!) A kód 63 znamená otáznik (?). A tiež pre všetky použiteľné znaky. To bude znamenať, že text napísaný jednou osobou na svojom počítači môže vždy prečítať a vytlačiť iná osoba na inom počítači.

Tabuľka ASCII

Nazýva sa takáto univerzálna dohoda o rovnakom použití niečoho standard, V našom prípade by štandardom mala byť tabuľka, v ktorej je pevne stanovená korešpondencia kódov (od 0 do 255) a znakov. Nazýva sa podobná tabuľka kódovacia tabuľka.

Ale nie také jednoduché. Koniec koncov, znaky, ktoré sú dobré, napríklad pre Grécko, nebudú pre Turecko fungovať, pretože sa tu používajú iné písmená. Rovnako to, čo je dobré pre USA, nie je vhodné pre Rusko a čo je dobré pre Rusko, nie je vhodné pre Nemecko.

Preto sa rozhodli rozdeliť tabuľku kódov na polovicu.

Prvých 128 kódov (od 0 do 127) musí byť štandardných a povinných pre všetky krajiny a pre všetky počítače, jedná sa o - medzinárodnýŠtandardné.

A s druhou polovicou tabuľky kódov (od 128 do 255) môže každá krajina urobiť čokoľvek av tejto polovici si vytvoriť svoj vlastný štandard - národná.

Volá sa prvá (medzinárodná) polovica tabuľky kódov stôlASCII, ktorá bola vytvorená v USA a akceptovaná po celom svete. Norma ASCII nezodpovedá za druhú polovicu tabuľky kódov. Rôzne krajiny tu vytvárajú svoje vlastné tabuľky kódov. Môže sa tiež stať, že v rámci jednej krajiny existujú rôzne normy pre rôzne počítačové systémy, ale iba v druhej polovici tabuľky kódov.

Kódy z medzinárodnej tabuľky ASCII

0-31 - špeciálne znaky, ktoré sa nevytlačia na obrazovku ani na tlačiareň, ale používajú sa na vykonávanie špeciálnych akcií (napríklad pri „presunutia kočíka“) - presunutie textu na nový riadok alebo „tab“ - na nastavenie kurzora na špeciálne polohy v riadku. text atď.).

32 - medzera (oddeľovač medzi slovami je tiež znakom, ktorý sa má kódovať, hoci sa zobrazuje ako „medzera“ medzi slovami a znakmi),

33 - 47 - špeciálne znaky (zátvorky atď.) A interpunkčné znamienka (bodka, čiarka atď.),

48 - 57 - čísla od 0 do 9,

58 - 64 - matematické symboly (plus (+), mínus (-), násobok (*), delenie (/) atď.) A interpunkčné znamienka (dvojbodka, bodkočiarka atď.),

65 - 90 - veľké (malé) anglické písmená,

91 - 96 - špeciálne znaky (hranaté zátvorky atď.),

97-122 - malé (malé) anglické písmená,

123-127 - špeciálne znaky (zložené zátvorky atď.).

Mimo tabuľky ASCII, začínajúc číslami 128 až 159, sú veľké písmená (veľké písmená) ruské písmená a od 160 do 170 a od 224 do 239 písmen sú malé (malé) ruské písmená.

Kódovanie mierových slov

Pomocou zobrazeného kódovania si vieme predstaviť, ako počítač kóduje a potom reprodukuje napríklad slovo MIR (veľkými písmenami). Toto slovo predstavuje tri kódy: písmeno M zodpovedá kódu 140 (podľa národného ruského kódovacieho systému), a - toto je kód 136 a P - toto je 144.

Ale ako už bolo uvedené, počítač vníma informácie iba v binárnej forme, t. ako postupnosť núl a jedničiek. Každý bajt zodpovedajúci každému písmenu slova MIR obsahuje postupnosť ôsmich núl a jedničiek. Pomocou pravidiel pre prevod desatinných informácií na binárne môžete desiatkové hodnoty písmenových kódov nahradiť ich binárnymi náprotivkami.

Desatinná číslica 140 zodpovedá binárnemu číslu 10001100. Toto je možné skontrolovať, ak sa vykonajú nasledujúce výpočty: 2 7 + 2 3 +2 2 \u003d 140. Stupeň, do ktorého sú zdvihnuté „dve“, je číslo pozície binárneho čísla 10001100, v ktorom je „1“ »A pozície sú očíslované sprava doľava, počnúc nulovým číslom pozície: 0, 1, 2 atď.

Dozviete sa viac o prenose čísel z jedného číselného systému do druhého, napríklad z učebníc počítačovej vedy alebo cez internet.

Podobne si môžete overiť, či číslica 136 zodpovedá binárnemu číslu 10001000 (kontrola: 2 7 + 2 3 \u003d 136). A číslo 144 zodpovedá binárnemu číslu 10010000 (kontrola: 2 7 + 2 4 \u003d 144).

V počítači sa teda slovo MIR uloží vo forme nasledujúcej postupnosti núl a jednotiek (bitov): 10001100 10001000 10010000.

Všetky vyššie uvedené transformácie údajov sa samozrejme uskutočňujú pomocou počítačových programov a používateľom sa nezobrazujú. Výsledky týchto programov sledujú iba pri zadávaní informácií pomocou klávesnice, aj keď sa zobrazujú na obrazovke monitora alebo na tlačiarni.

Je potrebné poznamenať, že na úrovni štúdia počítačovej gramotnosti používatelia počítačov nemusia poznať systém binárnych čísel. Stačí si predstaviť desatinné znaky. Iba programátori systémov používajú v praxi binárne, hexadecimálne, osmičkové a iné číselné systémy. Toto je obzvlášť dôležité pre nich, keď počítače zobrazujú chybové hlásenia v softvéri, ktoré označujú chybné hodnoty bez prevodu na desatinné miesto.

Cvičenia týkajúce sa počítačovej gramotnostiktoré vám umožňujú samostatne vidieť a cítiť opísané kódovacie systémy uvedené v článku

PS:  Tento článok sa skončil, stále si však môžete prečítať:



P.P.S.že prihlásiť sa na odber nových článkovktoré ešte nie sú na blogu:
   1) Do tohto formulára zadajte svoju e-mailovú adresu.

Binárne kódovanie textu

Od konca 60. rokov sa počítače začali čoraz viac využívať na spracovanie textových informácií a väčšina osobných počítačov na svete (a väčšinu času) sa teraz zaoberá textovými informáciami.

Tradične sa na kódovanie jedného znaku používa množstvo informácií rovné 1 bajtu, to znamená I \u003d 1 bajt \u003d 8 bitov.

Na zakódovanie jedného znaku je potrebný 1 bajt informácií.

Ak považujeme symboly za možné udalosti, potom podľa vzorca (2.1) môžeme vypočítať, koľko rôznych symbolov je možné kódovať:

N \u003d 2 I \u003d 28 \u003d 256.

Taký počet znakov postačuje na zobrazenie textových informácií vrátane veľkých a malých písmen ruských a latinských abeced, čísiel, znakov, grafických symbolov atď.

Kódovanie spočíva v tom, že každému znaku je pridelený jedinečný desatinný kód od 0 do 255 alebo zodpovedajúci binárny kód od 00000000 do 11111111. Osoba teda rozlišuje znaky podľa ich štýlov a počítač podľa ich kódov.

Keď sú textové informácie zadané do počítača, sú kódované v binárnom formáte a obraz znaku sa skonvertuje na jeho binárny kód. Užívateľ stlačí klávesnicu so symbolom na klávesnici a do počítača vstúpi určitá sekvencia ôsmich elektrických impulzov (kód binárneho symbolu). Znakový kód je uložený v pamäti RAM počítača, kde zaberá jeden bajt.

V procese zobrazovania symbolu na obrazovke počítača sa vykonáva spätný proces - dekódovanie, to znamená konverzia kódu symbolu na jeho obraz.

Je dôležité, aby priradenie špecifického kódu symbolu bolo dohodou, ktorá je stanovená v tabuľke kódov. Prvých 33 kódov (od 0 do 32) nezodpovedá znakom, ale operáciám (posúvanie riadkov, zadávanie medzier atď.).

Kódy 33 až 127 sú medzinárodné a zodpovedajú znakom latinskej abecedy, číslam, znakom aritmetických operácií a interpunkčným znamienkam.

Kódy 128 až 255 sú národné, to znamená, že v národných kódoch rovnaké symboly zodpovedajú rovnakému kódu. Bohužiaľ, v súčasnosti existuje päť rôznych kódových tabuliek pre ruské písmená (KOI8, CP1251, CP866, Mac, ISO - tabuľka 1.3), takže texty vytvorené jedným kódovaním sa nebudú správne zobrazovať v inom.

V súčasnej dobe je nový medzinárodný štandard Unicode rozšírený, ktorý neprideľuje jeden bajt, ale dva pre každý znak, takže s jeho pomocou môžete kódovať nie 256 znakov, ale N \u003d 216 \u003d \u003d 65536 rôznych znakov. Toto kódovanie je podporované najnovšími verziami platformy Microsoft Windows a Office (od roku 1997).

Každé kódovanie sa nastavuje pomocou vlastnej tabuľky kódov. Ako vidno z tabuľky. 1.3, rôzne symboly sú priradené k rovnakému binárnemu kódu v rôznych kódovaniach.

Napríklad postupnosť číselných kódov 221, 194, 204 v kódovaní CP1251 tvorí slovo „počítač“, zatiaľ čo v iných kódovaniach to bude bezvýznamná sada znakov.

Našťastie sa používateľ vo väčšine prípadov nemusí starať o prekódovanie textových dokumentov, pretože to robia špeciálne konvertorové programy zabudované do aplikácií.

Definícia číselného znakového kódu

1. Spustite textový editor MS Word 2002. Zadajte príkaz [Insert-Symbol ...]. Na obrazovke sa objaví dialógové okno. symbol, Stredná časť dialógového okna je obsadená tabuľkou znakov pre konkrétne písmo (napríklad Times New Roman).



Symboly sú usporiadané postupne zľava doprava a riadok po riadku, začínajúc symbolom medzera  v ľavom hornom rohu a končiac písmenom „I“ v pravom dolnom rohu tabuľky.

Vyberte znak a z rozbaľovacieho zoznamu od:  typ kódovania. V textovom poli Podpisový kód:  zobrazí sa jej číselný kód.

Zadávanie znakov pomocou číselného kódu

1. Spustite štandardný program zápisník, Pomocou voliteľnej numerickej klávesnice podržte kláves (Alt), zadajte číslo 0224, uvoľnite kláves (Alt). V dokumente sa zobrazí symbol. Zopakujte postup pre číselné kódy od 0225 do 0233. Dokument zobrazí postupnosť 12 znakov pre „domácu bezpečnosť“ v kódovacom systéme Windows (CP1251).

2. Pomocou voliteľnej numerickej klávesnice a stlačení klávesu (Alt) zadajte číslo 224, v dokumente sa objaví symbol „p“. Zopakujte postup pre číselné kódy od 225 do 233, dokument zobrazí sekvenciu 12 znakov "rstuhtschshshsh" v kódovacom systéme MS-DOS (CP866).



Praktické cvičenia

1.29. Pomocou tabuľky znakov (MS Word) zapíšte postupnosť desatinných číselných kódov v kódovaní Windows (CP1251) pre slovo „počítač“.

1.30. Pomocou programu Poznámkový blok určte, ktoré slovo v kódovacom systéme Windows (CP1251) je dané sekvenciou číselných kódov: 225, 224, 233,242.

1.31. Aká postupnosť písmen bude kódovanie KOI8 a ISO zodpovedať slovu „počítač“ zaznamenanému v kódovaní CP1251?

Počítač spracováva veľké množstvo informácií. Zvukové súbory, obrázky, texty - to všetko sa musí reprodukovať alebo zobraziť. Prečo je binárne kódovanie univerzálnou metódou programovania informácií akéhokoľvek technického zariadenia?

Aký je rozdiel medzi šifrovaním a šifrovaním?

Ľudia často identifikujú pojmy „kódovanie“ a „šifrovanie“, keď v skutočnosti majú rôzne významy. Šifrovanie je proces konverzie informácií za účelom ich utajenia. Osoba, ktorá zmenila text, alebo špeciálne vyškolení ľudia, sa môžu často dešifrovať. Kódovanie sa používa na spracovanie informácií a zjednodušenie práce s nimi. Zvyčajne sa používa spoločná kódovacia tabuľka, ktorá je známa všetkým. Je zabudovaný v počítači.

Princíp binárneho kódovania

Binárne kódovanie na základe použitia iba dvoch znakov - 0 a 1 - na spracovanie informácií používaných rôznymi zariadeniami. Tieto znaky sa nazývali binárne číslice, v angličtine - binárna číslica alebo bit. Každá postava zaberá 1 bit pamäte počítača. Prečo je binárne kódovanie univerzálnou metódou spracovania informácií? Faktom je, že pre počítač je ľahšie spracovávať menej znakov. Produktivita počítača tiež priamo závisí od toho: čím menej funkčných úloh musí zariadenie vykonať, tým vyššia je rýchlosť a kvalita práce.

Princíp binárneho kódovania sa nenachádza iba pri programovaní. Obyčajní obyvatelia Polynézie striedali nepočujúce a zvučné bubnové rytmy a odovzdávali si navzájom informácie. Podobný princíp platí, keď sa na prenos správy používajú dlhé a krátke zvuky. Dnes sa používa „telegrafná abeceda“.

Kde sa používa binárne kódovanie?

Binárne súbory v počítači sa používajú všade. Každý súbor, či už ide o hudbu alebo text, musí byť naprogramovaný tak, aby sa neskôr mohol ľahko spracovať a prečítať. Binárny kódovací systém je užitočný pre prácu so symbolmi a číslami, zvukovými súbormi, grafikou.

Binárne kódovanie

Teraz sú v počítačoch čísla uvádzané v zakódovanej podobe, pre priemerného človeka nepochopiteľné. Použitie arabských číslic, ako si predstavujeme, je pre technológiu iracionálne. Dôvodom je potreba priradiť každému číslu jedinečný znak, čo je niekedy nemožné.


Existujú dva číselné systémy: pozičné a nepozičné. Nespolohový systém je založený na použití latinských písmen a je nám známy vo forme, ktorá je pomerne ťažko pochopiteľná, preto ju opustili.

Dnes sa používa systém pozičných čísel. To zahŕňa binárne, desiatkové, osmičkové a dokonca aj hexadecimálne kódovanie informácií.

Desiatkový kódovací systém používame v každodennom živote. Toto sú nám známe a sú zrozumiteľné pre každého človeka. Binárne kódovanie čísel sa líši použitím iba nuly a jedného.

Celé čísla sa prevádzajú do binárneho kódovacieho systému ich delením 2. Výsledné kvocienty sa tiež fázujú postupne 2, kým sa nezíska celkom 0 alebo 1. Napríklad číslo 123 10 v binárnom systéme môže byť reprezentované ako 11110112. A číslo 20 10 bude vyzerať ako 10100 2.

Indexy 10 a 2 sú označené systémom kódovania desatinných a binárnych čísiel. Binárny kódovací symbol sa používa na zjednodušenie práce s hodnotami zastúpenými v rôznych číselných systémoch.

Metódy desatinného programovania sú založené na pohyblivej rádovej čiarke. Na správne preloženie hodnoty z desatinného do binárneho kódovacieho systému použite vzorec N \u003d M x qp. M je mantisa (vyjadrenie čísla bez poradia), p je poradie hodnoty N a q je základ kódovacieho systému (v našom prípade 2).

Nie všetky čísla sú kladné. Aby bolo možné rozlíšiť medzi kladnými a zápornými číslami, počítač ponecháva na kódovanie znakov 1 bit. Tu nula predstavuje znamienko plus a jedna znamienko mínus.

Používanie takého číselného systému uľahčuje počítaču prácu s číslami. Z tohto dôvodu je binárne kódovanie vo výpočtových procesoch univerzálne.


Binárne kódovanie textu

Každý znak abecedy je kódovaný vlastnou množinou núl a núl. Text obsahuje rôzne znaky: písmená (veľké a malé písmená), aritmetické znaky a iné rôzne významy. Kódovanie textových informácií vyžaduje použitie 8 po sebe idúcich binárnych hodnôt od 00000000 do 11111111. Týmto spôsobom možno previesť 256 rôznych znakov.

Aby sa predišlo nejasnostiam v kódovaní textu, pre každý znak sa používajú špeciálne hodnotové tabuľky. Majú latinskú abecedu, aritmetické znaky a špeciálne znaky (napríklad €, ¥ a iné). Znaky 128 - 255 kódujú národnú abecedu krajiny.

Na kódovanie 1 znaku je potrebných 8 bitov pamäte. Na zjednodušenie podúčtov sa 8 bitov rovná 1 bajtu, takže celkový priestor na disku pre textové informácie sa meria v bajtoch.


Väčšina osobných počítačov má štandardnú tabuľku. aSCII kódovanie  (Americký štandardný kód pre výmenu informácií). Používajú sa aj iné tabuľky, v ktorých je systém kódovania textu odlišný. Napríklad prvé známe kódovanie znakov sa nazýva KOI-8 (8-bitový kód na výmenu informácií) a funguje na počítačoch so systémom UNIX. Kódová tabuľka CP1251, ktorá bola vytvorená pre operačný systém Windows, je tiež široko nájdená.

Binárne kódovanie zvuku

Ďalším dôvodom, prečo je binárne kódovanie univerzálnou metódou programovania informácií, je jeho jednoduchosť pri práci so zvukovými súbormi. Akákoľvek hudba je zvuková vlna s rôznou amplitúdou a frekvenciou kmitania. Hlasitosť zvuku a jeho výška závisí od týchto parametrov.

Ak chcete naprogramovať zvukovú vlnu, počítač ju podmienečne rozdelí na niekoľko častí alebo „vzoriek“. Počet takýchto vzoriek môže byť veľký, takže existuje 65 536 rôznych kombinácií núl a núl. Preto sú moderné počítače vybavené 16-bitovými zvukovými kartami, čo znamená, že na kódovanie jednej vzorky zvukovej vlny sa používa 16 binárnych číslic.

Na prehrávanie zvukového súboru počítač spracuje naprogramované sekvencie binárnych kódov a spojí ich do jednej súvislej vlny.

Grafické kódovanie

Grafické informácie môžu byť prezentované vo forme výkresov, schém, obrázkov alebo diapozitívov v programe PowerPoint. Každý obrázok obsahuje malé bodky - pixely, ktoré je možné maľovať rôznymi farbami. Farba každého pixelu je zakódovaná a uložená a výsledkom je kompletný obraz.

Ak je obrázok čiernobiely, kód pre každý pixel môže byť jeden alebo nula. Ak sa použijú 4 farby, kód každej z nich pozostáva z dvoch číslic: 00, 01, 10 alebo 11. Na základe tohto princípu sa rozlišuje kvalita spracovania každého obrázka. Zvýšenie alebo zníženie jasu ovplyvňuje aj počet použitých farieb. V najlepšom prípade počítač rozlišuje približne 16 777 216 odtieňov.

záver

Existujú rôzne metódy programovania informácií, z ktorých najúčinnejšie je binárne kódovanie. Len s dvoma znakmi - 1 a 0 - počítač dokáže čítať väčšinu súborov ľahko. Súčasne je rýchlosť spracovania oveľa vyššia ako napríklad systém desatinného programovania. Vďaka jednoduchosti tejto metódy je nevyhnutná pre každú techniku. Z tohto dôvodu je binárne kódovanie medzi svojimi rovesníkmi univerzálne.

Každý vie, že počítače môžu vykonávať výpočty s veľkými skupinami údajov obrovskou rýchlosťou. Nie každý však vie, že tieto činnosti závisia iba od dvoch podmienok: od toho, či je alebo nie je prúd a aké napätie.

Ako počítač dokáže spracovať také rôzne informácie?
Tajomstvo spočíva v binárnom systéme. Všetky údaje vstupujú do počítača vo forme jednotiek a núl, z ktorých každá zodpovedá jednému stavu elektrického vodiča: jednotky - vysoké napätie, nuly - nízke alebo jednotky - prítomnosť napätia, nuly - ich neprítomnosť. Konverzia údajov na nuly a tie sa nazýva binárna konverzia a jej konečné označenie sa nazýva binárny kód.
V desiatkovej notácii založenej na desatinnom systéme počtu, ktorý sa používa v každodennom živote, je numerická hodnota predstavovaná desiatimi číslicami od 0 do 9 a každé miesto v čísle má hodnotu desaťkrát vyššiu ako miesto napravo od neho. Aby reprezentoval číslo väčšie ako deväť v desatinnom systéme, na jeho miesto sa umiestni nula a jedno sa umiestni na ďalšie, hodnotnejšie miesto vľavo. Podobne v binárnom systéme, kde sa používajú iba dve číslice - 0 a 1, je každé miesto dvakrát cennejšie ako miesto napravo od neho. Takže v binárnom kóde môže byť nula a jedno zastúpené ako jediné číslo a akékoľvek číslo väčšie ako jedno vyžaduje dve miesta. Po nule a jednom sú nasledujúce tri binárne čísla 10 (čítané jedna nula) a 11 (čítané jedna-jedna) a 100 (čítané jedna-nulová-nula). 100 binárnych systémov zodpovedá 4 desatinným miestam. Horná tabuľka vpravo zobrazuje ďalšie binárne desatinné ekvivalenty.
Akékoľvek číslo môže byť vyjadrené binárne, zaberá viac miesta ako v desiatkovej notácii. V binárnom systéme môžete tiež napísať abecedu, ak je každému písmenu priradené špecifické binárne číslo.

Dve číslice pre štyri miesta
16 kombinácií je možné vytvoriť pomocou tmavých a svetlých gúľ, ktoré ich kombinujú v sadách po štyroch. Ak zoberiete tmavé gule ako nuly a svetlé ako jednotky, potom sa 16 sád stane 16-jednotkovým binárnym kódom, ktorého číselná hodnota je od nuly do piatich ( pozri hornú tabuľku na strane 27). Aj s dvoma druhmi guličiek v binárnom systéme môžete vytvoriť nekonečný počet kombinácií jednoduchým zvýšením počtu guličiek v každej skupine - alebo počtu miest v číslach.

Bity a bajty

Najmenšia jednotka v počítačovom spracovaní, bit je jednotka údajov, ktorá môže mať jednu z dvoch možných podmienok. Napríklad každý z nich a núl (vpravo) znamená 1 bit. Trochu možno znázorniť inými spôsobmi: prítomnosťou alebo neprítomnosťou elektrického prúdu, otvorom a jeho neprítomnosťou, smerom magnetizácie doprava alebo doľava. Osem bitov tvorí bajt. 256 možných bajtov môže predstavovať 256 znakov a znakov. Mnoho počítačov spracováva bajty údajov súčasne.

Binárna konverzia Štvormiestny binárny kód môže predstavovať desatinné čísla od 0 do 15.

Tabuľky kódov

Ak sa na označenie písmen abecedy alebo interpunkčných znamienok používa binárny kód, sú potrebné tabuľky kódov, ktoré označujú, ktorý kód zodpovedá danému znaku. Bolo zostavených niekoľko takýchto kódov. Väčšina počítačov je prispôsobená na sedemmiestny kód nazývaný ASCII alebo americký štandardný kód na výmenu informácií. Tabuľka vpravo ukazuje aSCII kódy  pre anglickú abecedu. Ostatné kódy sú určené pre tisíce znakov a abecedy iných jazykov sveta.

Časť tabuľky kódov ASCII

Ak nájdete chybu, vyberte časť textu a stlačte kombináciu klávesov Ctrl + Enter.