Źródła pozyskiwania materiałów cyfrowych

W dzisiejszych czasach (na początku XXI wieku) zalewani jesteśmy potokiem informacji. Te dane napływają do nas za pośrednictwem różnych mediów: gazet, radia, telewizji, Internetu, oraz lokalnych źródeł. Jednym z naszych wyzwań jest wyodrębnienie istotnych informacji z tej fali danych. Po drugie, musimy przekształcić te informacje tak, aby można je było dalej wykorzystać.

Trudność w wyodrębnianiu ważnych informacji można pokonać, dokładnie określając, co nas interesuje. To pomoże nam określić, gdzie w mediach znajdziemy potrzebne informacje i jak je znaleźć.

Na przełomie XX i XXI wieku zaszła rewolucja w szybkich i efektywnych metodach wyszukiwania informacji. Dzięki rozwojowi sieci, sprzętu, technik i oprogramowania komputerowego, teraz możemy uzyskać ważne informacje w sekundach lub minutach. Otrzymane w ten sposób informacje cyfrowe zazwyczaj można łatwo przekształcić do wygodnej formy.

Jednak czasem pojawia się problem, gdy uzyskane informacje nie odpowiadają naszym potrzebom. Oto kilka przykładów:

W specjalistycznym artykule znaleźliśmy ważne dane w postaci wykresu, ale otrzymaliśmy tylko plik graficzny. Potrzebujemy danych liczbowych (x, y) ilustrujących ten wykres, których nie ma w artykule. W takim przypadku musimy wykonać DIGITALIZACJĘ wykresu.
Lokalne źródło informacji dostarcza nam danych tylko w formie wydruku, ale potrzebujemy tych danych w postaci cyfrowej. Producent tego sprzętu zwykle nie dostarcza takiej opcji. Musimy więc zeskanować wydruk i użyć programu do optycznego rozpoznawania znaków (OCR), aby uzyskać wersję cyfrową.
W bibliotece znaleźliśmy cenny artykuł, ale jak przenieść te informacje do naszego komputera? Możemy zrobić cyfrowe zdjęcie strony i przetworzyć je jednym z dwóch wspomnianych wcześniej sposobów.

SKANER

Skaner to urządzenie, które rejestruje i przekształca obrazy, grafiki, rysunki, zdjęcia i teksty w dane cyfrowe, które można następnie przesłać do komputera. Skaner działa podobnie jak kopiarka, tylko zapisuje obraz cyfrowy w pamięci komputera.

Wszystkie urządzenia do digitalizacji, takie jak skanery, kamery wideo i cyfrowe aparaty fotograficzne, mają pewne wspólne cechy. Zamieniają one dane analogowe (rzeczywiste) na dane cyfrowe, które komputer może zrozumieć. Tworzą obrazy rastrowe z czarno-białymi lub kolorowymi pikselami. Odczytują oryginalny obraz punkt po punkcie, kontrolując intensywność koloru lub odcień szarości przy każdym punkcie próbkowania.

Obraz uzyskany ze skanowania można edytować za pomocą odpowiedniego oprogramowania graficznego. Można także przekształcić obraz na tekstowy za pomocą oprogramowania do rozpoznawania tekstu.

Skaner może być również używany do przenoszenia slajdów i negatywów do komputera za pomocą specjalnych przystawek. Te dodatkowe źródła światła pomagają w skanowaniu obiektów.

Po zakończeniu skanowania, obraz jest zwykle wyświetlany na monitorze komputera lub drukarka. Jednak parametry rozdzielczości tych trzech urządzeń różnią się. Monitory zazwyczaj wyświetlają obrazy w rozdzielczości 72 lub 96 dpi, niezależnie od ustawień skanera. Dlatego rozdzielczość skanera powinna być dostosowana do docelowych parametrów wyświetlania, co można ustawić w programach sterujących skanerem. Skanowanie w zbyt wysokiej rozdzielczości, która przekracza możliwości drukarki, tylko spowalnia przetwarzanie danych bez poprawy jakości.

Zasada działania skanera

W typowym płaskim skanerze, oryginalny dokument umieszcza się na powierzchni skanującej (jest to płyta szklana z pokrywą zabezpieczającą dokument przed dopływem światła z zewnątrz) i podświetla się go przy pomocy lampy. Pod płytą przesuwa się wózek z lampą, lustrem, zestawem soczewek oraz odpowiednim przetwornikiem światłoczułym wykonanym w technologii CCD (Charge Coupled Device – układ ze sprzężeniem ładunkowym) lub CMOS (Complementary Metal Oxide Semiconductor – układ półprzewodnikowy wytworzony z użyciem tlenków metali).

Podzespołem odpowiedzialnym w największym stopniu za jakość skanowanych obrazów jest właśnie przetwornik współpracujący z odpowiednią lampą. Element ten odpowiada za rejestrowanie tego co znajduje się na szybie urządzenia. W przypadku CCD używana jest tzw. zimna lampa katodowa, dająca światło zbliżone do naturalnego. Światło odbite od oryginału dokumentu, przechodzi przez układ luster i soczewek, które kierują je do tablicy detektorów. Detektory CCD odczytują każdą linię punktów oraz rejestrują dla nich parametry jasności i kolor. Czujniki te mają stosunkowo dużą głębię ostrości sięgającą kilku cm. Dzięki temu z powodzeniem udaje się zeskanować grubą książkę bez nadmiernego dociskania jej do szyby.

Układ CCD składa się z cząstek światłoczułych. Cząstki te powodują rozszczepianie docierających do nich promieni świetlnych na trzy strumienie w podstawowych barwach, czyli czerwonej, niebieskiej i żółtej, z zastosowaniem układu barw RGB (powszechnie stosowanego w urządzeniach optycznych), po czym następuje konwersja strumieni światła w napięcie elektryczne. Napięcie z kolei przekazywane jest do konwertera A/D (analog-to-digital – przekształcenie danych z formatu analogowego na format cyfrowy), który przekłada dane na format „zrozumiały” dla komputera. Optyka urządzenia (soczewki i lustra) ma również niemałe znaczenie dla jakości utrwalonych obrazów. Niedoskonałości tych elementów występują czasami w postaci aberracji chromatycznej, widzianej jako tęczowe obwódki elementów obrazu.

W skanerze wykonanym w technologii CMOS, tablica detektorów obrazu znajduje się bezpośrednio tuż pod skanowanym dokumentem – detektory reagują bezpośrednio na odbite światło. Czujnik współpracuje z zespołem diod LED oświetlających skanowany obiekt, o świetle zbliżonym do naturalnego, lecz z dominacją niebieskiego. Wymaga to, by obiekt przylegał ściśle do powierzchni szyby. Zaletami skanerów opartych o technologię CMOS są niewątpliwie niski pobór mocy, bardzo długa żywotność oraz niewielka grubość urządzenia. Skanery te są tańsze w produkcji, mniejsze i trwalsze, ale jakość uzyskanego w nich obrazu nie jest tak dobra jak w skanerach CCD. Sprawdzają się lepiej w przypadku ograniczonej przestrzeni do pracy i w systemach przenośnych.

Rozdzielczość

Liczba cząstek światłoczułych pojedynczego modułu CCD pozwala na określenie parametru maksymalnej rozdzielczości optycznej skanera. Jeśli zatem na powierzchni 2.54 cm (= 1 cala) układu występuje 600 cząstek światłoczułych, to rozdzielczość takiego urządzenia wynosi 600 dpi (dots per inch – punktów na cal). Im większa jest rozdzielczość skanera, tym dokładniej odtwarzany jest obraz poddawany skanowaniu.

Jakość poszczególnych elementów konstrukcyjnych jest podstawowym czynnikiem wpływającym na jakość skanów otrzymanych z urządzenia. Współczesne skanery wykorzystują technologię pozwalającą na uzyskanie najwyższej jakości. Stosuje się w nich technologię Double CCD Array (układy CCD z podwójnym sprzężeniem). Zastosowanie tej technologii powoduje, iż urządzenia te mają znaczną przewagę technologiczną nad starszymi urządzeniami.

Dzięki specyficznemu układowi cząstek światłoczułych skanery te łączą wysoką liczbę dpi z niezwykłą dokładnością kodowania kolorów. W celu uniknięcia obniżki prędkości (spowodowanej koniecznością przetwarzania olbrzymich ilości danych) stosuje się najwyższej klasy konwertery danych analogowych na format cyfrowy. W rezultacie urządzenia te oferują maksymalną prędkość i najwyższą jakość.

APARAT CYFROWY

Aparaty cyfrowe są hybrydą tradycyjnych aparatów analogowych i skanerów. W aparatach cyfrowych znajdziemy elementy obu tych urządzeń. Sposób działania aparatu cyfrowego i analogowego różni się pewnymi szczegółami technicznymi, ale oba posiadają elementy optyczne i migawkę.

Aparat cyfrowy korzysta z soczewek i migawki, ale światło pada na tablicę detektorów obrazu – komórki światłoczułe, zamiast na film światłoczuły. To oznacza, że aparat cyfrowy rejestruje obraz za pomocą sensorów CCD.

Sposób działania aparatu cyfrowego i analogowego różnią pewne szczegóły technologiczne. Aparat cyfrowy posiada, tak jak analogowy, soczewki i migawkę regulującą czas naświetlania. Zamiast światłoczułego filmu, światło pada na tablicę detektorów obrazu – komórek światłoczułych. Detektory obrazu są elementami wykonanymi w technologii CCD, zamieniającymi światło na ładunek elektryczny, tak samo jak elementy krzemowe stosowane w światłomierzach (efekt fotowoltaiczny). Ładunki elektryczne powstałe w każdym z detektorów tablicy są z postaci analogowej zamieniane na postać cyfrową, przez urządzenie nazywane przetwornikiem analogowo cyfrowym (ADC – Analog to Digital Converter).

Te nadzwyczaj czułe na światło detektory – komórki światłoczułe, noszą nazwę pikseli i przechowują informację o natężeniu światła padającego na nie. Tak jak w aparacie analogowym, gdy zostanie naciśnięty spust migawki, światło wpada do aparatu cyfrowego przez obiektyw. Padając na tablicę detektorów oświetla każdy z pikseli z natężeniem odpowiednim do szczegółów fotografowanego obrazu.

Tak więc błona fotograficzna w aparacie cyfrowym została zastąpiona płytką z sensorami CCD. Wymiar tablicy i liczba komórek decyduje o optycznej rozdzielczości rejestrowanych obrazów cyfrowych. W opisie aparatu rozdzielczość podawana jest jako iloraz liczby komórek na bokach płytki z elementami CCD.

Obrazy cyfrowe przechowywane są w pamięci aparatu lub na kartach pamięci. Ze względu na dużą ilość danych opisujących każde zdjęcie, są one często kompresowane za pomocą algorytmu JPEG. W większości aparatów można dostosować rozdzielczość i stopień kompresji zdjęć. Silniejsza kompresja pozwala na przechowanie większej liczby zdjęć na karcie pamięci, ale z mniejszą jakością.

Zdjęcie można natychmiast zobaczyć na ekranie aparatu, na telewizorze lub przesłać na komputer. Do przesyłania danych między aparatem a komputerem używa się zwykle portu USB lub portu drukarki. Oprogramowanie dołączone do aparatu pozwala na przesyłanie zdjęć, organizowanie ich i dokonywanie podstawowych edycji.

Obraz w komputerze staje się zwykłym obrazem bitmapowym, który można edytować za pomocą oprogramowania graficznego.

OPROGRAMOWANIE

Optyczne rozpoznawanie tekstu – OCR (Optical Character Recognition)

Programy do OCR są niezbędne, aby przekształcić zeskanowany dokument w tekst, który można edytować na komputerze. Bez tego programu, dokument pozostaje jedynie obrazem i nie można go edytować.

Dopiero program do rozpoznawania tekstu, zamienia obraz na ciąg znaków ASCII, z których składa się tekst nadający się do edycji i przetworzenia w edytorze tekstu (np. edytor Word), arkuszu kalkulacyjnym (np. Excel) czy bazie danych (np. Access). Ciąg znaków może być następnie zapisany w postaci pliku tekstowego. OCR to oprogramowanie ściśle powiązane ze skanerami.

Programy do digitalizacji wykresów i map Programy te służą do zamiany obrazów graficznych na dane liczbowe, które reprezentują współrzędne punktów w przestrzeni dwuwymiarowej. Uzyskane dane liczbowe można dalej przetwarzać i wykorzystywać w różne sposoby. To przydatne, gdy chcemy uzyskać oryginalne dane liczbowe (x, y) z zeskanowanego wykresu lub pliku graficznego.

Program do digitalizacji (próbkowania) wykresów i map

Program taki służy do zamiany obrazu graficznego w postaci sekwencji pikseli-punktów, na postać liczbową, podającą współrzędne tych punktów w przestrzeni dwuwymiarowej. Uzyskana w ten sposób tabela może być następnie przetwarzana jako zbiór danych liczbowych. W szczególności dane te mogą być w dowolny sposób skalowane i transformowane, służyć jako podstawa do utworzenia obrazu wektorowego czy zapamiętane w bazie danych.

Często spotykanym problemem jest uzyskanie oryginalnych danych liczbowych typu (x,y) z obrazka np. z zeskanowanego wykresu lub z wykresu w postaci pliku graficznego ściągniętego z określonej lokalizacji w Internecie. Wtedy digitalizacja jest na ogół jedyną metodą pozwalającą uzyskać takie dane liczbowe.

Was this helpful?

0 / 0

Post Views: 92