Grafika komputerowa i OCR

Grafika komputerowa

Powołując się na wiadomości słownika informatycznego, grafika komputerowa to dział informatyki zajmujący się tworzeniem obrazów obiektów rzeczywistych i wyimaginowanych, za pomocą komputera.
Narodziła się pod koniec lat pięćdziesiątych. Jej pionierzy zaczynali realizować swoje projekty na bardzo kosztownych i trudnych w obsłudze maszynach. Jednak ogromne sukcesy jakie odnosili realizatorzy tego kierunku, spowodowały, że grono zainteresowanych tą dziedziną wciąż powiększało się. Do pracy nad nowymi możliwościami i wykorzystaniem grafiki komputerowej w różnych dziedzinach zawodowych, mobilizowały nie tylko fundusze wpływające na ten cel, ale również szerokie zainteresowanie przeróżnych instytucji. Dzięki dynamicznemu rozwojowi elektroniki, w latach 80-tych, grafika była już dostępna dla większej rzeszy użytkowników komputerów domowych. Dziś wiele dziedzin życia nie mogło by sprawnie funkcjonować bez programów wykorzystujących grafikę komputerową. Możemy ją spotkać w architekturze, prasie codziennej, laboratoriach chemicznych, przemyśle twórczym, wojsku a nawet w szpitalu i rozrywce. Zwykli użytkownicy komputerów również nie stronią od tej formy przekazu. Wzbogacają grafiką swoje dokumenty w Wordzie lub w Excelu. Wykorzystują do tego celu rysunki typu ClipArt lub obiekty.
Grafika (niekoniecznie użytkowa) występuje również w wielu dyscyplinach informatycznych; twórcy oprogramowania tworzą atrakcyjny wizualnie interfejs, autorzy witryn internetowych dbają o wygląd swoich stron WWW, a producenci aplikacji graficznych opracowują coraz doskonalsze narzędzia do tworzenia grafiki. Obrazy mogą być tworzone od podstaw, mogą tez być wynikiem obróbki zeskanowanych zdjęć i rysunków. W związku z wejściem w nasze codzienne życie obrazów generowanych za pomocą komputera i rozwojem tej dziedziny informatyki, postaram się nieco przybliżyć grafikę kompu
terową (z racji tematu pracy ze szczególnym uwzględnieniem grafiki rastrowej), jej rolę i zastosowanie.

Grafika bitmapowa (rastrowa)
W grafice rastrowej obrazy tworzone są z położonych regularnie, obok siebie pikseli. Posiadają one różne kolory lub odcienie jasności. Tworzone w ten sposób obrazy zwykło się nazywać mapami bitowymi (potocznie-bitmapami).
Mapa bitowa (bit map) –sposób zapamiętania obrazu przy wykorzystaniu pikseli ułożonych w rzędy i kolumny. Każdy piksel a właściwie informacja o jego kolorze może zostać zapisana za pomocą określonej liczby bitów; wartość 1 oznacza czerń lub kolor, wartość 0 biel (brak koloru). W zależności od liczby kolorów jakie możemy wykorzystać w mapie bitowej, rozróżniamy mapy: 1-bitowe, 8-bitowe, 16-bitowe, 24-bitowe i 32-bitowe.Mapy 1-bitowe to mapy czarno-białe, natomiast w mapach 8-bitowych (28) na jeden piksel przypada 256 kolorów, w 16-bitowych (216)65 536 kolorów, w 24-bitowych (224)16777216 kolorów itd.
Liczba pikseli użytych do odwzorowania obrazu w komputerze zależy od jego rozdzielczości. Pojęcie to określa liczbę pikseli przypadającą na jednostkę powierzchni. Im wyższa jest rozdzielczość obrazka, tym większy jest jego plik. Na objętość zbioru graficznego istotny wpływ ma również ilość możliwych do zapamiętania kolorów. Im więcej kolorów tym większa objętość. Do zapamiętania wystąpień 16 777 216 kolorów na tej samej powierzchni trzeba użyć większej ilości bitów niż do zapamiętania 256 kolorów.
Do wstępnego oszacowania wielkości pliku możemy posłużyć się prostym wzorem:
Wp = ilość pikseli w pionie* ilość pikseli w poziomie* ilość kolorów
Przetwarzanie map bitowych wymaga odpowiedniej ilości pamięci RAM w komputerze. Im więcej, tym lepiej. W przypadku obrazów rastrowych liczba pikseli przypadająca na jednostkę powierzchni jest wielkością stałą (rozdzielczość), dlatego tez przy powiększeniu mapy bitowej występuje efekt powiększenia piksela. W praktyce objawia się to widocznymi na ekranie monitora lub wydruku schodkami, stąd jakość obrazu nie jest najlepsza. Występująca wtedy utrata ostrości obrazu map bitowych jest ich podstawową wadą. Inną wadą jest brak możliwości operowania na fragmentach obrazu. Grafikę rastrową można przyrównać do obrazka namalowanego farbkami. Zmiana barwy dowolnego fragmentu polega na nałożeniu pędzelkiem innego koloru. Nie można tutaj zmienić np. kształtu namalowanego obiektu przez jego modelowanie, a jedynie przez namalowanie w jego miejsce nowego.
Po odpowiednim powiększeniu obrazu widać pojedyncze kwadratowe punkty, z których zbudowany jest cały obraz. Zwiększenie mapy bitowej powoduje, że zwiększane są także te punkty, przez co linie i krawędzie stają się postrzępione. Widać to bardzo dobrze na załączonym obrazku

Programy do edycji i przetwarzania map bitowych-charakterystyka

Programy te oprócz edycji i przetwarzania map bitowych mogą być również przydatne do retuszu i obróbki zdjęć.
W programach tego typu tworzymy rysunki od podstaw lub modyfikujemy już istniejące, będące zwykle wynikiem skanowania gotowych rysunków czy fotografii. W grupie tych programów istnieje sporo programów przeznaczonych do domowych zastosowań (Paint) jak i profesjonalnych, używanych w poligrafii i reklamie. Photoshop Adobe, Paint Shop Pro, Picture Publisher i Corel Photo-Paint.
Zasadnicza różnica pomiędzy programem domowym a profesjonalnym polega na możliwości wyprodukowania w aplikacji pliku przeznaczonego do wydruku. Tylko specjalny zbiór dyskowy nadaje się di rozpoczęcia procesu naświetlania i wydruku. Najogólniej ujmując, technologia przygotowania do druku jest następująca : zbiór*. ps (postscript) lub *.prn (dla konkretnego urządzenia) jest kierowany do naświetlarki. Tam na jego podstawie powstają cztery klisze (dla druku czarno-białego jedna). Każda z nich zawiera negatyw jednego z kolorów modelu CMYK (cyjan, magenta, yellow, black). Za pomocą klisz naświetla się matryce pokryte materiałem światłoczułym. Po ich wypłukaniu nakłada się je kolejno na bębnie drukarni offestowej. Rozpoczyna się druk pierwszego koloru.
Spotykane w grafice komputerowej mapy bitowe mogą posiadać rózny format (pliki przechowujące mapy bitowe mogą posiadać różne rozszerzenie). Jest to spowodowane tym, że programy z tej grupy umożliwiają zapisywanie przetworzonych plików we własnym formacie. Każdy z tych programów posiada jednak możliwość konwersji obrazów na format ogólnie dostępny. Kilka najpopularniejszych formatów map bitowych przedstawiam poniżej:
• BMP- charakterystyczne rozszerzenie nazwy plików zawierających mapę bitową, wykorzystywane przez system Windows oraz wiele innych aplikacji.

• JPEG- jeden z najpopularniejszych obecnie formatów map bitowych przechowujący obraz w postaci skompresowanej, bez wyraźnej straty na jakości obrazu. Pliki te posiadają rozszerzenie jpg.

• GIF- rozszerzenie kolorowych plików graficznych (256 kolorów), które cechują się małą ilością zajmowanego przez nie miejsca. Jest to możliwe dzięki zastosowanej w nich kompresji bez straty jakości obrazu.

• PCX- rozszerzenie bitmapowych plików przechowujących grafikę w starszych wersjach systemu Windows.

• TIFF- format pliku opracowany specjalnie z myślą o aplikacjach służących do składu publikacji i obsługiwany przez wszystkie programy do edycji grafiki. Pliki zapisane w tym formacie posiadają rozszerzenie tif.

Grafika wektorowa
Obiekty tworzone w tego rodzaju grafice definiuje się za pomocą równań algebraicznych (wektorów). Obrazy i rysunki składają się z szeregu punktów, przez które prowadzi się linie proste i krzywe. Obraz wektorowy najprościej ujmując zapamiętany jest postaci wzorów. Program, który je wyświetla i pozwala edytować przelicza wzory. W praktyce kreowanie takiego obrazu polega na utworzeniu niezależnych od siebie obiektów. Każdy z nich posiada takie właściwości jak kontur, rozmiar, kolor i stanowi odrębną całość. Obrazy i rysunki wektorowe możemy poddawać skalowaniu i modelowaniu bez utraty ich jakości. Tutaj zmiana kształtu jakiegoś obiektu polega na modelowaniu jego konturu. Przykładem rysunków utworzonych w grafice wektorowej mogą być ClipArty. W przypadku tej właśnie grafiki nie używamy określenia jakości obrazu. Obiekty są wyświetlane na ekranie monitora z rozdzielczością, z jaką pracuje karta graficzna i drukowanie z rozdzielczością drukarki.
Grafika wektorowa posiada wiele zalet. Jest wyraźna na monitorze i na wydruku, zajmuje mniej miejsca na dysku i w pamięci RAM komputera.
Wadą grafiki wektorowej jest brak uniwersalnego formatu jej zapisu (np. obrazek stworzony w Corelu możemy odczytać tylko w tym programie.) Nie każdy jednak dysponuje drogim oprogramowaniem Corela i żeby nasz rysunek stał się ogólnie dostępny należy zmienić jego format (np. na JPG).

Istnieje wiele profesjonalnych programów umożliwiających tworzenie rysunków w oparciu o grafikę wektorową. Najpopularniejszymi produktami tej kategorii są programy CorelDraw, Illustrator, WindowsDraw i Designer.
Istnieją następujące rozszerzenia plików wektorowych:
•CDR •CGM •DRW •WFM •WPG •DSP

Corel
aby zajmować się grafiką komputerową niezbędne jest posiadanie odpowiedniego oprogramowania. Programy graficzne dostępne na rynku różnią się ceną i oferowanymi możliwościami. Jednym z najlepszych (ale i najdroższych) jest pakiet graficzny CorelDRAW 9PL. Jego zakup wiąże się z wydatkiem ok. 2000 PLN, ale udostępnia narzędzia pozwalające na w pełni profesjonalne tworzenie szerokiej gamy ilustracji, układów stron, a także projektowania logo, gazetek, ulotek, broszur, opakowań, oznakowań, grafik dla stron WWW i wielu innych. Pakiet skłąda się z dwóch podstawowych programów (CorelDRAW i Corel PHOTO-PAINT) oraz kilku dodatkowych aplikacji. Charakterystykę najważniejszych przedstawiam poniżej.
Program CorelDRAW umożliwia łatwe tworzenie profesjonalnej grafiki wektorowej od prostych znaków firmowych do skomplikowanych rysunków technicznych. Program udostępnia narzędzia i efekty umożliwiające wydajne tworzenie grafik o wysokiej jakości. Możliwe jest również przekazanie utworzonych prac do biura usług poligraficznych w celu ich wydrukowania, a także publikowanie dokumentów w Internecie.

Grafika trójwymiarowa (3D) Grafika trójwymiarowa popularnie zwana 3D (z angielskiego - dimension- wymiar). Jest to grafika komputerowa, tworzona przez programy do projektowania przestrzennego, dająca złudzenie głębi obrazu, mimo że jest on wyświetlany na płaskim ekranie. Grafika 3D umożliwia nam wizualizację dowolnie skomponowanego obiektu. Możemy nadawać mu dowolną powłokę (teksturę), oświetlenie i przeprowadzać masę skomplikowanych modyfikacji.
Przykłady zastosowań grafiki 3D:
 Przemysł filmowy
W latach dziewięćdziesiątych możliwości superkomputerów będących na usługach wytwórni filmowych, umożliwiły produkcję pełnometrażowych, animowanych, w pełni komputerowych filmów. Pierwszym takim filmem był "Toy Story", który na dodatek odniósł sukces kasowy (100 mln dolarów w Stanach po czterech tygodniach wyświetlania).
 Kreślenie i projektowanie wspomagane komputerowo
W projektowaniu wspomaganym komputerowo (CAD) użytkownik korzysta z grafiki interaktywnej do projektowania elementów i systemów mechanicznych, elektrycznych, elektromechanicznych i elementów elektronicznych, w tym takich struktur jak budynki, karoserie samochodów, kadłuby samolotów i statków. Zazwyczaj nacisk jest kładziony na interakcję z modelem komputerowym projektowanego elementu albo systemu, ale niekiedy użytkownik chce szybko uzyskać dokładne rysunki elementów i zespołów, np. szkice architektoniczne.
 Wykresy w biznesie, nauce i technologii
Następnym bardzo popularnym obszarem zastosowań dzisiejszej grafiki jest tworzenie wykresów 2D i 3D funkcji matematycznych, fizycznych i ekonomicznych; histogramów i wykresów kołowych; wykresów harmonogramownia zadań; wykresów wielkości zapasów i produkcji itd. Wszystkie te wykresy są używane do prezentowania w przejrzysty i zwięzły sposób tendencji i wzorów uzyskanych z danych, tak żeby wyjaśnić złożone zjawiska i ułatwić podejmowanie decyzji.
 Symulacja i animacja dla wizualizacji naukowej i rozrywki
W wizualizacji naukowej i inżynierskiej coraz popularniejsze stają się obrazy i filmy animowane generowane komputerowo, pokazujące zmienne w czasie zachowanie się rzeczywistych i symulowanych obiektów. Z narzędzi takich można korzystać przy badaniu abstrakcyjnych wielkości matematycznych i modeli matematycznych takich zjawisk jak przepływ cieczy, teoria względności, reakcje jądrowe i chemiczne, systemy fizjologiczne i działanie organów, deformacje struktur mechanicznych pod wpływem różnych obciążeń. Inną dziedziną zaawansowanych technologii jest produkcja efektów specjalnych w filmach. Dostępne są wyrachowane mechanizmy modelowania obiektów i reprezentowania świateł i cieni.
 Medycyna
Grafika komputerowa odgrywa coraz większą rolę w takich dziedzinach jak diagnostyka medyczna lub planowanie operacji. W tym ostatnim przypadku chirurdzy korzystają z grafiki do wspomagania kierowania przyrządami i do dokładnego określania w którym miejscu należy usunąć chorą tkankę.

OCR – Optical Charakter Recognition
Nazwa technologii wykorzystywanej do rozpoznawania tekstu (zapisanego w formacie graficznym). Jej zastosowanie można przedstawić na przykładzie: po awarii dysku twardego straciliśmy wszystkie dane, a z naszego wypracowanie został jedynie próbny wydruk. Co zrobić? Pozostaje albo mozolne przepisywanie całego tekstu, albo użycie skanera z programem OCR. Zeskanowana kartka z wypracowaniem jest obrazem- plikiem graficznym. Można na nim kokilka elementów, ale nie można edytować tekstu. Widoczne na ekranie litery są tylko ciemniejszymi fragmentami rysunku. Dopiero po zastosowaniu technologii OCR Zeskanowana obraz staje się dokumentem tekstowym, co oznacza, że można go zmieniać edytorem tekstów (czyli ominąć mozolne przepisywanie). Stworzono kilka programów do rozpoznawania tekstu. Najbardziej popularne są: FineReader, OmniPage, Recognita OmniPage, Readiris. Jeden z programów pakietu Office także potrafi zmieniać zeskanowane obrazy z napisami na pliki tekstowe. Jest to Document Imaging, za którego pomocą można również skanować i eksportować zwykłe obrazy.
Skuteczność tych programów waha się pomiędzy 95 a 97% rozpoznawalności i to nie jest zadowalający wynik, gdyż w przeliczeniu na liczbę znaków widzimy tą nieidealność. Technologia OCR ma jednak trzy dodatkowe automatyczne funkcje zapewniające skuteczność rozpoznawania znaków:
- automatyczna funkcja oczyszczania tła zeskonowanej strony dzięki czemu na pojawiają się obszary rozpoznane błędnie;
- korekcja położnie kartki na skanerze; najbardziej przydaje się przy skanowaniu stron książek i broszur;
- automatyczna praca ze słownikiem; dzięki tej funkcji program koryguje błędy rozpoznawania wyrazów- jeśli któraś z liter wyrazu znajdującego się w słowniku zostanie źle odczytana, program zastąpi ją właściwą.

Related Articles