370 likes | 642 Vues
PREDSTAVLJANJE PODATAKA NA RAČUNALU. Zapisane podatke na računalu može se promatrati s dva gledišta: K ako su stvarno (fizikalno) zapisani u računanoj memoriji. Ovo zapisivanje se vrši pomoću fizičkih jedinica podataka.
E N D
Zapisane podatke na računalu može se promatrati s dva gledišta: • Kako su stvarno (fizikalno) zapisani u računanoj memoriji. Ovo zapisivanje se vrši pomoću fizičkih jedinica podataka. • Čovjekovog razumijevanja zapisanih podataka (logičko tj. semantičko razumijevanje). Za ovaj aspekt podataka se koriste logičke jedinice podataka.
FIZIČKE JEDINICE PODATAKA Podaci se u računalu zapisuju pomoću fizikalnih veličina (el. struja, el. napon, magnetsko polje…) koje se mogu poprimiti jedno od dva moguća stanja (npr. teče el. struja odnosno ne teče el. struja,…). Budući da se radi samo o dva stanja za njihov prikaz su dovoljne dvije vrijednosti pa se njihov prikaz koristi znamenka binarnog brojevnog sustava.
Vrijednost jednog stanja fizikalne veličine predstavlja se s jednom znamenkom binarnog brojevnog sustava. To je najmanja fizička jedinica podataka i zove se BIT (BinarydigiT – binarna znamenka) Vrijednost binarne znamenke je 0 ili 1. Tako se npr. prisustvo neke fizikalne veličine može predstaviti s 1, a odsustvo s 0.
Jedan bit, odnosno jedna binarna znamenka ujedno je i osnovna jedinica za količinu informacija. Dakle s "n" binarnih znamenki moguće je prikazati podatak koji nosi informaciju od "n" bita. Binarnih brojeva s n znamenki ima ukupno 2n, znači s n bita može se u računalu prikazati 2n različitih podataka. n bita 2nrazličitih mogućnosti Npr. 2 bita 22 = 4 različitih mogućnosti 8 bita 28 = 256 različitih mogućnosti
Kako vrijednost jednog bita može biti samo jedna od dvije moguće vrijednosti (0 ili 1) s jednim bitom možemo predstaviti jednu od dvije moguće informacije. Jednu informaciju pridružujemo 0 a drugu 1. S 8 bita može se predstaviti 256 različitih mogućnosti (od osam 0 do osam 1. To znači da se s 8 bita može predstaviti jedna od 256 različitih informacija što je sasvim dovoljno za predstavljanje npr. slova abecede pri čemu svako veliko i malo slovo ima različitu kombinaciju od 8 bita. Memorija računala je organizirana upravo na način da se može pristupati direktno preko adrese skupini od 8 bita.
Skupina od 8 bita je prva veća fizička jedinica i naziva se BYTE. Byte se sastoji iz 8 bita i ujedno predstavlja osnovnu adresibilnu jedinicu memorije. • Tradicionalne veće binarne jedinice su (Base2 IEC sysyte): Kilobyte, Megabyte, Gigabyte, Terabyte, Petabyte, Exabyte… • Kilobyte(KB) equals210 = 1024= 1,024 bytes. • Megabyte(MB) equals220= 10242= 1,048,576 bytes. • Gigabyte(GB) equals230 = 10243bytes. • Terabyte(TB) equals240 = 10244bytes • Petabyte(PB) equaly250 = 10245bytes • Exabyte(EB) equaly260 = 10246bytes
2000. godine Institute of Electrical and Electronics Engineers (IEEE) u suradnji s International ElectrotechnicalCommission (IEC) je formalno usvojio SI (međunarodni sustav mjernih jedinica) mjerne prefixe: • Kilobyte (KB) = 103byte = 1000 byte • Megabyte (MB) = 106byte = 1,000,000 byte • Gigabyte (GB) equals 109 = 1,000,000,000 byte • Terabyte (TB) equals 1012byte • Petabyte (PB) equaly 1015byte • Exabyte (EB) equaly 1018 byte
Pri tome su uvedene nove mjerne jedinice: • Kibibyte (KiB) = 210 = 1,024 byte • Mebibyte (MiB) = 220 = 10242 = 1,048,576 byte • Gibibyte (GiB) = 230 = 10243byte • Tebibyte (TiB) = 240 = 10244byte • Pebibyte (PiB) = 250 = 10245byte • Exbibyte (EiB) = 260 = 10246 byte
LOGIČKE JEDINICE PODATAKA Logičke (semantičke) jedinice podataka su jedinice koje se koriste za razmjenu podataka među ljudima, tj. za komunikaciju podacima na nosiocima podataka prihvatljivim čovjeku. Najmanja logička jedinica podataka jest znak, zatim polje (obilježje ili pojam), zapis (slog), datoteka i baza podataka.
Znakovima se predstavljaju slova abecede, znamenke od 0 do 9, aritmetičke operatore, znakove interpunkcije itd. Polja ili obilježja (pojmovi) smislene su kombinacije od jednog ili više znakova. Njima se izražavaju značajke predmeta, imena ljudi itd. Primjer dva polja: indeks: 11111111 ime: Andro
Zapis ili slog je grupa logički povezanih polja ili obilježja (pojmova). Primjer sloga koji sadrži informacije (sastoji se iz polja) o studentu (indeks, ime, prezime, smjer i status):
Datoteka je skup istovrsnih zapisa (kao npr. podaci o svim studentima). U donjem primjeru je prikazana datoteka koja se sastoji iz 4 sloga.
Baza podataka je skup različitih datoteka koje sadrže sve informacije o jednom području. Npr. studentska evidencija na fakultetu imat će datoteke s podacima o studentima, ispitima, nastavnicima itd.
BAZA PODATAKA Datoteke: • nastavnici • ispiti • studenti Veza između fizičkih i logičkih jedinice podataka. DATOTEKA studenti SLOG DATOTEKE Polja: • matičnibroj • ime • prezime • smjer • status… POLJE ime BYTE (znak) BIT
KODIRANJE Način prikazivanja znakova na jednome mediju nije uvijek prikladan i za prikaz na nekom drugome mediju. Npr. prikazivanje znakova (slova i brojeva) grafičkim simbolima na papiru nije pogodno za prijenos tih znakova električnim putom.
Morse je zbog toga pridružio svakom znaku abecede određeni kod. Na papiru se znak u Morseovu kodu prikazuje kao kombinacija točaka i crta, a u stvarnom prijenosu preko žice ili kroz eter kao elektromagnetski signali veće ili manje frekvencije. • Primjer: • E . • T _ • A ._ • I .. • N _. • O _ _ _
Kodiranje je dakle pretvaranje znakova (signala, pojmova) iz jedne izražajne mogućnosti u drugu prema određenim pravilima. Ta mogućnost izražavanja znakova naziva se kod. Primjer: Glas "Š" izražava se različito u različitim kodovima:
Izražajna mogućnost Kod Svaki kod ima ZALIHU ZNAKOVA (broj elemenata) Svi elementi jednog koda poredani prema dogovorenom redoslijedu čine ALFABET KODA
KODOVI: • ABECEDA (A,B,C…) • BINARNI (0,1): • NBC • BCD • MEĐUNARODNI KOD BROJ 5 (ASCII) • UNICODE • … • OKTALNI (0,1,2,3,4,5,6,7) • HEKSADEKADSKI (0,1,2…A,B,C,D,E,F) • …
Sve pojmove koji se zapisuju u računalu potrebno je zapisati pomoću fizikalnih veličina koje mogu poprimiti jednu od dvije moguće vrijednosti kako bi ih računalo moglo obrađivati. Kako je karakter fizikalnih veličina binaran možemo ih predstaviti s binarnim brojevima Postupak kojim se binarnim brojevima pripisuje drugo značenje naziva se binarnim kodiranjem.
S n bita može se kodirati 2n elemenata. • Broj bita Broj elemenata • 1 21 = 2 • 2 22 = 4 • 3 23 = 8 • 424= 16 • 5 25= 32 • 6 26= 64 • 7 27= 128 • 8 28= 256 • 9 29= 512 • 10 210 = 1024
BINARNI KODOVI • Prirodni binarni kod NBC (naturalbinarycode) pridjeljuje cijelim dekadskim brojevima binarne brojeve npr. 15 -> 1111 • Binarno kodirani dekadski brojevi BCD (binarycodeddecimal) pridjeljuje dekadskim znamenkama skupine od po četiri binarne znamenke npr. 73 -> 0111 0011 • Prošireni binarno kodirani dekadski kod EBCDIC (extendedbinarycodeddecimalinterchangecode) koristi tvrtka IBM u velikim i mini računalima. Kod koristi 8 bitova za prikaz slova, bojeva, interpunkcijskih znakova, specijalnih znakova). Ne koristi se u osobnim računalima.
ASCII kod • Za predstavljanje znakova (slova, brojevi, specijalni znakovi) u računalu najčešće se koristi međunarodni kod br. 5 (standard ISO i CCITT, odnosno ASCII). • ASCII(American Standard Code for Information Interchange) je kod propisan američkom normom, a propisuje pridjeljivanje 8-bitnog binarnog broja brojevima, slovima i specijalnim znakovima.
Kod izvornog, normiranog ASCII koda sedam bita namijenjeno je kodiranju, a 8. bit je tzv. bit pariteta i služi za provjeru ispravnosti podataka. • Primjer:
Sa 7 bita moguće je kodirati 27 = 128 različitih znakova(decimalno od 0 do 127 ili Heksadekadski od 00 do 7F). • Prva 32 (od 0 do 31) znaka namijenjena su kontrolno-upravljačkim signalima za upravljanje pisačem i komunikaciju općenito, a preostalih 96 služi za prikaz slova, brojeva i specijalnih znakova.
Skup od 96 znakova relativno je mali pa je uveden prošireni ASCII kod (Extended ASCII) koji koristi 8 bita za predodžbu znakova. Time se broj znakova koje možemo kodirati povećao na 256. Prvih je 128 (od 0 do 127) kodova dodijeljeno istim znakovima kao i kod normiranog ASCII koda, dok je preostalih 128 namijenjeno novim znakovima.
Prošireni ASCII kod • Kodovi od 128 do 255 nisu jedinstveno normirani pa tako postoje različite tablice proširenih znakova. Prošireni ASCII kod omogućuje ugradnju specifičnih znakova pojedinih zemalja, uz zadržavanje normiranog ASCII skupa. Na slici je prikazan prošireni ASCII kod pod imenom 852, u kojem su sadržani hrvatski znakovi Š, š, Đ, đ, Č, č, Ć, ć, Ž i ž..
UNICODE • Unicode(unique, universal and uniformcharacterencoding) je definiran s namjerom da se kodiraju slova praktički svih živućih jezika. • Osim slova sadrži i interpunkcijske znakove, matematičke simbole, nadzorno-upravljačke kodove, itd. • Svakom znaku pridjeljuje 16-bitovni binarni broj (ukupno 216=65536 znakova).