View
224
Download
0
Category
Preview:
Citation preview
1
Formaty czasopism
i książek elektronicznych
Dr hab. Marek Nahotko
Transfer informacji w
społeczeństwie
2
Zalety publikacji tradycyjnych
Powszechnie znana i akceptowana konwencja;
Dobra jakość tekstu;
Dostosowanie do zdolności umysłowych człowieka;
Łatwo przenoszalne (w przestrzeni);
Publikacje elektroniczne, jeśli mają być konkurencją, muszą oferować jakąś wartość dodaną.
3
Zalety publikacji elektronicznych
Wiele zalet związanych z formatem:
Możliwości wyszukiwania (np.
pełnotekstowego);
Stosowanie multimediów;
Prezentacje interaktywne i symulacje;
Związki z innymi tekstami (odsyłacze, linki).
5
Pierwsze formaty
ASCII (American Standard Code for
Information Interchange)
Reprezentacja 128 znaków (symboli);
Nieadekwatna reprezentacja symboli
chemicznych i matematycznych;
Poważne trudności z reprezentacją języków
innych niż angielski;
Bardzo prymitywna grafika.
9
Pierwsze formaty
Bitmapa
Obraz graficzny zapisywany jako wzór
pojedynczych pikseli;
Duża objętość pliku, kiepska jakość obrazu;
Połączenie ASCII i bitmapy: możliwość
wyszukiwania pełnotekstowego z wyglądem
przypominającym druk;
Włączanie bitmap (np. wykresów, równań itp.)
do innych formatów (np. tekstowego, html).
11
TeX i LaTeX
Oba formaty pozwalają na kodowanie tekstów;
TeX opisuje sposób wyświetlania tekstów;
LaTeX przedstawia strukturę logiczną tekstów – jest nadbudówką nad TeX, automatyzującą skład tekstu;
LaTeX używany bywa z dodatkowymi tzw. klasami (stylami) ułatwiającymi konkretne zastosowania (np. tworzenie tekstów chemicznych) – np. klasa RevTeX z grupy Physical Review;
Format WYSIWYM (What You See Is What You Mean) – autor tworzy strukturę logiczną (rozdziały, przypisy itp.), a tekst na stronie układa TeX.
Dokument LaTeX zawiera kod źródłowy, który w wyniku kompilacji tworzy plik DVI (Device Independent), który można konwertować np. do PostScriptu.
14
PostScript
Format opisuje ostateczny wygląd strony;
Akceptowany przez większość drukarek
laserowych;
Małe możliwości zmian przez użytkownika;
Fonty muszą być dołączone do
dokumentu (są odrębnym elementem).
18
Wersja PostScript z nowymi cechami:
Linki hipertekstowe wewnątrz i między
dokumentami;
Przypisy i zakładki;
Przeglądanie miniaturek stron;
Fonty włączone do dokumentu
Indeksowanie i wyszukiwanie pełnotekstowe;
Efektywna kompresja (mniejsze pliki).
19
Możliwość utrzymania wyglądu strony;
Darmowe przeglądarki (podobnie jak dla
PS);
Coraz większe możliwości konwersji;
Strona czasopisma w HTML, artykuły w
PDF;
ISO 32000-1: 2008.
20
Inne formaty opisu strony
Replica - oprogramowanie opracowane we wczesnych latach 90. przez firmę Farallon Communications (od 2000 r. własność firmy Proxim), które służyło do przetwarzania dokumentów do formatu publikacji elektronicznej, podobnie jak PDF;
Common Ground - format dokumentu elektronicznego opracowany w latach 90. przez kanadyjską firmę Hummingbird z Toronto, służył do tworzenia międzyplatformowych publikacji elektronicznych w środowisku Windows i Mac OS, z użyciem specjalnego sterownika, działającego analogicznie jak sterownik drukarki;
Envoy - program opracowany w pierwszej połowie lat 90. przez firmę Tumbleweed Software, służący do generowania publikacji elektronicznych. Działał jak wirtualna drukarka, podobnie jak konkurencyjne do niego sterowniki PDF i Replica. Envoy został spopularyzowany przede wszystkim przez edytor WordPerfect dla Windows, razem z którym był przez pewien czas dostarczany. Jego rozwój został wstrzymany, a WordPerfect używa formatu PDF.
21
SGML (Standard Generalised Markup
Language)
Pozwala na opis logicznej struktury tekstu, nie
sposobu wyświetlania;
Definicja struktury w DTD (Document Type
Definition)
DTD dla czasopism: ISO 12083 Article DTD,
ISO 12083 Serial DTD;
Tworzenie własnych DTD przez wydawców;
SGML zbyt skomplikowany; przejście do innych
formatów (HTML).
23
SGML – interfejs GUIDON z OCLC
Cechy:
- linki do rys., tabl., równań
- dostęp wg numeru, dat
- wyszukiwanie pełnotekstowe
- automatyczne informacje o
nowych artykułach przez email
lub fax
28
XML
Pochodzi z SGML;
Definiuje strukturę dokumentu;
Tworzenie własnych DTD i Schematów
XML:
NewsML – standard dla newsów w agencjach
prasowych,
MathML – równania matematyczne,
ChemML (lub CML)
…
34
DjVu
Dokumenty elektroniczne o wysokiej kompresji;
Oparta na segmentacji obrazu – rozdział na warstwy i oddzielna kompresja;
Cechy: Bardzo małe pliki;
Doskonała jakość;
Format rastrowy (łatwość przenoszenia między platformami);
Szybkie przeglądanie, powiększanie, przesuwanie obrazu, osadzanie w HTML;
Przeszukiwanie: specjalna warstwa na wersję tekstową.
Graficzne wizualizacje danych
• Obracanie obiektów
• Modyfikacja orientacji
• Różne reprezentacje
• Ułatwiają badania
ale jednocześnie...
• Uzależnione od platformy, wymagają plugin’ów lub dodatkowych informacji
Wielość stosowanych, niekompatybilnych
formatów plików:
Formaty opisu strony (PS, PDF, DjVu)
Formaty opisu struktury (HTML, XML, EPUB,
Mobipocket – dwa ostatnie w XHTML+CSS)
Formaty natywne (Amazon AZW)
Formaty otwarte (PDF, EPUB)
Częsty brak kompatybilności i współdziałania.
Obecnie tzw. multiformat: Klient płacąc za tytuł,
otrzymuje go w każdym dostępnym dla niego w
danej chwili formacie.
Formaty plików
52
Formaty plików Czytnik Producent Odtwarzane formaty
Kindle3 Amazon AZW, PDF, TXT, MOBI, PRC
Nook Barnes&Noble EPUB, PDF, PDB, JPG
PRS-600 Sony EPUB, PDF, TXT, RTF, DOC, LRX, LRF
iRiver Story Iriver EPUB, PDF, TXT, DOC, PPT, XLS, HWP
PocketBook 302 PocketBook EPUB, PDF, FB2, TXT, RTF, HTML, PRC,
CHM, DJVU, DOC
Kobo eReader Kobo EPUB, PDF
BeBook Neo Endless ideas EPUB, PDF, TXT, HTML, RTF, MOBI, CHM,
PDB
Alex Reader Spring Design EPUB, PDF, TXT, HTML
Novel Pandigital EPUB, PDF
53
Obecnie najczęściej stosowane
ePub Jest to format w którym ostateczny wygląd książki uzależniony jest od
urządzenia oraz indywidualnych preferencji użytkownika. Użytkownik
może decydować o marginesach a także rozmiarze wyświetlanej
czcionki, dzięki zastosowaniu standardu formatowania opartego o
XHTML oraz kaskadowych arkuszy styli CSS.
Mobi Format ten stosowany jest głównie w czytnikach Kindle firmy Amazon.
Format ten daje mniejsze możliwości formatowanie treści niż ePUB,
jego podstawą jest również XHTML i CSS.
PDF Format ten wyróżnia się na tle innych sztywnym podziałem książki na
strony, co niekorzystnie wpływa na mniejsze wyświetlacze gdzie
pojawia się problem skalowania wielkości treści.
56
ePUB
ePUB (electronic publication) to otwarty standard, oparty na
języku XML, służący do publikowania elektronicznych książek,
tworzony przez non-profit IDPF (Intern. Digital Publishing Forum).
Jest to bezpośredni następca rozwijanego wcześniej formatu Open
eBook. Tworzone w nim książki nie mają podziału na strony, choć
istnieje możliwość wyświetlania na marginesie numeru strony
pochodzącego z książki drukowanej. Format ten jest stosowany w
czytnikach książek elektronicznych, smartfonach i tabletach
(potrzebna aplikacja). Format ePUB jest wygodny w użytkowaniu –
można skalować obraz, zmieniać wielkość i rodzaj czcionki,
dostosowując je do swoich wymagań. Tekst wypełnia ekran czytnika
(brak stronicowania), a przy zmianie czcionki zachowuje swoje
właściwości, wysoki kontrast i komfort czytania. Aby móc
odczytywać pliki w formacie ePUB należy pobrać odpowiednie
oprogramowanie np. Adobe Digital Editions. Kindle go nie czyta,
trzeba konwertować, np. przy pomocy Calibre. 57
MOBI
Ogólnie przyjęte określenie formatu pliku tekstowego
odczytywanego m.in. przez program Mobipocket
Reader. Pliki zapisane w zależności od potrzeb
użytkownika i rodzaju czytniku mogą posiadać
rozszerzenie .mobi, .prc (Product Representation
Compact), a także .pdb. Format Mobi zyskuje coraz
większe uznanie i akceptację wraz z rosnącą
popularnością urządzeń mobilnych (Kindle). Plików nie
można drukować. Aplikacje na Windows i Apple, np.
Kindle for PC, Calibre i in.
Format Mobipocket jest zastępowany przez nowy format
KF8 Amazona. Oparty na HTML5 i CSS.
58
59
PDF jest bardzo popularnym formatem. Istneje wiele programów do
tworzenia PDF od produktów Adobe zaczynając, poprzez MS Word,
kończąc na wirtualnych drukarkach, pozwalających drukować do PDF z
prawie każdej aplikacji.
Głównym problemem z PDF jest brak możliwości dopasowania tekstu do
rozmiarów małych ekranów. Urządzenia do e-booków typu Kindle i Nook, a
także telefony i tablety jak iPhone, iPad oraz Kindle Fire, mają ekrany
mniejsze niż typowy komputer a nawet niż typowa książka. W rezultacie, po
załadowaniu na urządzenie pliku w formacie PDF zazwyczaj trzeba go
dostosować do rozmiarów ekranu. Z tego powodu większość formatów e-
booków, takich jak ePub i Kindle dostosowuje tekst do wielkości ekranu w
locie.
PDF ma opinię formatu trudnego w użytkowaniu. Wiele urządzeń podczas
próby ładowania pliku w tym formacie automatycznie konwertuje go na inny.
Zabezpieczenia
DRM - (z j. ang. digital rights management, Zarządzanie prawami cyfrowymi) –
metoda polegająca na zabezpieczeniu pliku przed możliwością kopiowania i
ograniczająca możliwość odczytania pliku do konkretnych modeli urządzeń. Ze
względu na pewne kontrowersje związane z ograniczeniami użytkowymi (np.
niemożliwość wykonania dopuszczalnej wyłącznie do własnego użytku kopii
bezpieczeństwa pliku), format jest coraz częściej zastępowany o wiele
wygodniejszym watermarkiem. Jednocześnie ze względu na pewien stopień
skomplikowania formatu, zdarzały się błędy, bądź luki w działaniu (które były
upubliczniane przez użytkowników), których łatanie powodowało dalsze ograniczenia.
Watermark (znak wodny) – rozwiązanie o wiele wygodniejsze, ze względu, na to że
w momencie zakupu książki elektronicznej, plik jest „tylko” wysyłany na specjalny
serwer treści, który znakuje go danymi osoby kupującej, umożliwiającymi
identyfikację osoby z konkretnym plikiem. Poza tym format nie ma ograniczeń DRM,
czyli można go skopiować na zasadzie wyłącznej kopii bezpieczeństwa (oczywiście
bez rozprzestrzeniania takiego pliku, bo widać od kogo pochodzi); nie ma również
ograniczeń sprzętowych do odtwarzania pliku z takim zabezpieczeniem. Ma to
zasadniczy aspekt psychologiczny – użytkownik przysłowiowo dwa razy zastanowi
się zanim udostępni e-book np. znajomemu.
60
Formaty dostosowujące się
Zalety: Duże możliwości
rozpowszechniania –
akceptowane przez większość
platform i urządzeń.
Użytkownik ma kontrolę nad
sposobem wyświetlania tekstu.
Zwykle mniejszy rozmiar pliku,
więc niższe koszty.
Zwykle tańszy w produkcji.
Łatwiejszy do aktualizacji.
Wady: Umożliwia tylko prosty układ
strony – bez wielu kolumn,
absolutnego pozycjonowania
treści.
Mała kontrola nad bękartami i
wdowami. Czytelnik kontroluje
wielkość tekstu, krój czcionki,
odstępy między wierszami i
marginesy, więc ilość widocznego
tekstu może być różna na
różnych urządzeniach i
ustawieniach.
Ograniczone możliwości
włączania fontów.
63
Stały układ strony
Zalety: Pełna kontrola nad wyglądem
strony, czyli np.:
Układ wielokolumnowy
Pozycjonowanie tekstu
względem ilustracji
Kolorowe tło
Ilustracje całkowicie
wypełniające stronę
Wyświetlanie dwóch stron
Bezproblemowe włączanie
fontów.
Wady: Ograniczone możliwości
dystrybucji.
eBooki nie nadają się na
wszystkie urządzenia lub aplikacje
ze wzgl. na specyficzne style
Duże rozmiary plików, co może
zwiększać opłaty za download.
Problemy z czytelnością na
niektórych urządzeniach ze
względu na rozmiar.
Zwykle droższe w produkcji i
aktualizacji.
64
Albo inaczej:
Formaty opisu strony (Postscript, PDF, djvu)
zawierają pełne informacje o sposobie
wyświetlania treści, układzie i podziale stron.
Decyzja o wyglądzie podczas przygotowania
publikacji
Formaty opisu struktury (HTML, XML, ePub,
MobiPocket) ostateczny wygląd tekstu określany
podczas wyświetlania publikacji. Wygląd może
zależeć np. od parametrów urządzenia,
oprogramowania. Układ może się zmienić np.
wraz ze zmianą czcionki. 65
Znaczniki generujące obiekty w VR
Poezje autorstwa Amaranth Borsuk i
Brada Bourse
iDinosaur, książeczka dla dzieci
69
Książki personalizowane
PMITS – put me in the story:
Sourcebooks
70
Recommended