Kompresija podataka pomo u Shannon-Fano Shannonalgoritma

Dimitrov Daniel 12547 Manoilov ro e 12629

O Shannon-Fano algoritmu
‡ Prvi zvani ni i iroko rasprostanjeni metod kodiranja ‡ Ovaj metod i odgovaraju i kod su izmislili istovremeno i nezavisno jedan od drugog Claude Elwood Shannon i Robert Fano 1948. godine ‡ Kodne re i su promenljive du ine u zavisnosti od u estanosti pojavljivanja karaktera ‡ Kodne re i zadovoljavaju prefiksno svojstvo ‡ Prefiksno svojstvo je osobina koja zahteva da, kada se odre ena sekvenca bitova ozna i kao kod simbola, ni jedna druga kodna re ne sme da zapo ne ovom sekvencom bitova

Shannon-Fano algoritam
1. Za datu listu simbola, razvija se odgovaraju a lista verovatno e ili u estanosti tako da je za svaki simbol poznata relativna u estanost pojavljivanja 2. Vr i se sortiranje liste simbola prema u estanosti u opadaju em redosledu 3. Deli se lista na dva dela, tako da ukupna u estanost pojavljivanja na levoj strani bude sto pribli nija desnoj 4. Leva polovina liste je ozna ena nulom, a desna jedinicom 5. Rekurzivno se ponavljaju koraci 3 i 4, sve dok svaki simbol ne postane list u stablu

Primer
‡ Neka je data neki niz od 39 karaktera sa slede im u estanostima pojavljivanja:
Simbol
A B C D E

Br. 15 Pojavljivanja

7

6

6

5 0.1282

Verovatno e 0.3846 0.1794 0.1538 0.1538

Primer

A,B, C,D,E 15,7, 6,6,5

0

1

A,B 15+7 =22

C,D,E 6+6+5=17

Primer
A,B, C,D,E 15,7, 6,6,5
0 1

A,B 15+7 =22
0 1 0

C,D,E 6+6+5=17
1

A 15

B 7

C 6

D,E 6+5=11

Primer
A,B, C,D,E 15,7, 6,6,5
0 1

A,B 15+7 =22
0 1 0

C,D,E 6+6+5=17
1

A 15

B 7

C 6 D 6

0

D,E 6+5=11

1

E 5

Primer
‡ Rezultat je sledeci:
Simbol Kod A 00 B 01 C 10 D 110 E 111

‡ Rezultat kodiranja je: po 2 bita za A, B i C a po 3 bita za D i E ‡ Prose an broj bita je:
2 Bit ™  7  6  3 Bit ™ 6  5 15 } 2.28 Bita po simbolu 39 Simbola

Shannon-Fano koder

‡ Shannon-Fano koder je aplikacija koja vr i kompresiju podataka upotrebom Shannon-Fano algoritma ‡ Aplikacija je razvijena u programskom jeziku C# i .NET Framework-u 3.5

Startovanje aplikacije

‡ Startovanje aplikacije se vr i pokretanjem fajla KompresijaSF.exe

‡ Da bi aplikacija korektno radila potrebno je da se fajlovi ZedGraph.dll i Shannon-Fano.chm nalaze u istom folderu gde i sam .exe fajl

Startovanje aplikacije

Unos podataka
‡ Interfejs aplikacije je lak za kori enje, prilago en je prose nom korisniku ‡ Tekst koji eli da kompresuje mo e uneti na dva na ina: ± izborom tekstualne datoteke ± direktnim unosom teksta sa tastature ‡ Textbox u kome se unosi tekst sa tastature ima prednost u odnosu na izabranu datoteku ‡ Izbor datoteke se mo e izvr iti na 2 na ina: ± klikom na dugme Browse... ± izborom opcije Otvori iz File (skra enica Ctrl + O )

Kodiranje podataka

‡ Kodiranje razli itih karaktera vr imo klikom na dugme Kodiraj! , opcijom Kodiraj! iz File menija ili pre icom sa tastature Ctrl + K ‡ Nakon zavr etka kodiranja ispod dugmeta Kodiraj! se ispi e vreme za koje je izvr eno kodiranje ‡ Desno od dugmeta e se ispisati generisani kodovi

Kodiranje podataka

Snimanje kompresovane datoteke
‡ Snimanje kompresovane datoteke se vr i nakon generisanja kodova klikom na 'Snimi kao...' ili izborom opcije iz menija 'File' -> 'Snimi kao...

‡ Kad se zavr i snimanje pro iruje se prozor i prikazuje nam ukupno utro eno vreme za kodiranje i snimanje kao i broj razlicitih karaktera

Snimanje kompresovane datoteke

Detalji kompresije

‡ Klikom na tekst detalji kompresije pojavljuje nam se nova forma Gotova kompresija gde se vr i vizuelni prikaz originalne i kompresovane datoteke kao i podaci o njihovim veli inama i stepenu kompresije

Detalji kompresije

Reset aplikacije

‡ Moguce je izvr iti poni tavanje samo vremena ili poni tavanje svih polja i vra anje na pocetak ‡ Poni tavanje vremena se vr i izborom opcije 'Poni ti vreme' iz menija 'Edit ‡ Vra anje na po etak se vr i izborom opcije 'Poni ti sve iz menija 'Edit' ime se aplikacija vra a na po etak kao posle startovanja

Reset aplikacije

Korisni ko upustvo
‡ Kratko korisnicko uputsvo se dobija izborom opcije 'Uputstvo' iz menija 'Help ?' ili pritiskom tastera F1 ‡ Informacije o autorima se mogu videti izborom 'O autorima' iz menija 'Help ?' ‡ Korisni ko upustvo se mo e pogledati i bez startovanja aplikacije otvaranjem fajla Shannon-Fano.chm

Testiranje i analiza testova
‡ Izvr eno je testiranje aplikacije za razli ite ulazne podatke radi dobijanja rezultata vremena kompresije i stepena kompresije ‡ Ulazni podatak je tekst ‡ Vreme trajanja kompresije zavisi od hardvera ra unara i od trenutne iskori enosti ra unarskih resursa

Testiranje i analiza testova
Broj razli itih karaktera 15 5 47 116 116 3 3 10 4 Vreme kodiranja 0 ms 0 ms 0 ms 656.25 ms 31.9 s 10.01 s 27 s 0 ms 0 ms Vreme snimanja 15.625 ms 15.625 ms 15.625 ms 703.125 ms 29 s 3.625 s Mem error 0 ms 15.625 Veli ina datoteka 21B -> 11B 39B -> 12B 1,88K -> 1006B 100,9K -> 49,89K 4847K -> 2394K 23523K->4324K 61.2M -> ? 10B -> 5B 10B -> 3B Stepen kompresije 47.61 % 69.23 % 47.76 % 50.59 % 50.59 % 81.86 % ? 50 % 70 %

Zaklju ak
‡ Karakteri koji se naj e e pojavljuju imaju kra e kodne re i i obrnuto ‡ Za isti broj razli itih karaktera imamo isti stepen kompresije ‡ Ukoliko imamo dve datoteke istih veli ina ali sa razli itim brojem razli itih karaktera onda datokteka sa manjim brojem razli itih karaktera ima ve i stepen kompresije ‡ Vreme snimanja i kodiranja raste sa veli inom ulazne datoteke

Hvala na pa nji!