Форматы электронных книг: что это такое и какой формат выбрать. Разница между EPUB и FB2 Fb2 epub сравнение
Коротко о главном
Если вы хотите составить себе адекватное представление о epub, представьте, что вы сохранили на диск какую-нибудь (например, эту) веб-страницу вместе с используемой на ней графикой и стилями. Для всех современных браузеров это стандартная функция, например в FireFox это делается через меню «Файл → Сохранить как → Веб-страница полностью». Можно сохранить рядом не одну, а несколько страниц. Затем вы кладете рядом с вашими страницами два служебных XML-файла. Один просто метка «это epub» (container.xml), второй содержит перечень всех файлов - .html, .css, .jpg, etc (обычно это файл content.opf).
Осталось поместить всё это в zip-архив и сменить ему расширение с.zip на.epub.
Всё.
Книга готова, а вы уже знаете, что такое epub. Это не шутка и не преувеличение - epub это просто архивированный в zip html. Ни больше, ни меньше.
Про формат подробно
Размещение содержимого в epub-архиве
Как мы уже выяснили, epub - это zip-архив с несколькими файлами. Когда вы архивируете файлы ZIP-архиватором и вкладываете в архив XML-файл container.xml, вы говорите прозой создаете файл в формате «Open Container». Несмотря на убийственно-пафосное название этого мероприятия (IDPF стоило знать, что есть ISO-стандарт OPC и не изобретать велосипед), за «Open Container Format» (OCF) вполне можно поставить IDPF «зачот» (почему - выясним ниже).
Помимо файл container.xml (должен лежать в META-INF) epub обязательно содержит еще один служебный файл, где перечислены все прочие файлы, размещенные в архиве, и указан их тип, как правило называется content.opf.
Вся конструкция для знающего человека сильно напоминает java-пакеты вообще и OpenDocument в частности. И в самом, деле IDPF ищет пути объединения с OpenDocument. Не очень понятно, что мешало стартовать с клоном OD, ведь OpenDocument на два года старше OCF, но, видимо, велосипеды - неизбежный удел дилетантов, вовремя доки почитать не удосужились. Вот и xpointer IDPF так же, по всем судя, твердо намерены реизобрести в рамках EPUB3 . Версии к 5-й догадаются использовать стандартизованный w3c формат для ссылок и тоже будут искать пути объединения.
Какие данные хранятся в epub
epub обычно содержит следующую информацию:
- Мета-данные: название, язык, авторы, etc.
- Средства навигации: порядок листания для xhtml-файлов и « карта сайта содержание»
- Собственно текст в виде нескольких xhtml-файлов, которые могут использовать стили css, картинки в jpg, gif и png а так же векторную графику svg и шрифты. Последняя версия epub декларирует поддержку MathML.
- Помимо этого epub может включать ряд дополнительных узкоспециализированных файлов разметки, PDF-версию книги для печати и т. п. экзотику, реально не используемую, не поддерживаемую читалками и среднему читателю неинтересную.
Минимальная мета-информация epub включает название, ID документа и язык. Помимо этого можно указать авторов, переводчиков и других участников создания книги, дату публикации/написания, тему книги (в свободной форме), plain-text описание и данные об издательстве.
Ключевая мета-информация хранится в стандартной схеме Doublin Core , немного расширенной. Описание авторов, тематики и всех других полей (за исключением дат и языка) дается в свободной текстовой форме, что, фактически, исключает эффективную автоматическую каталогизацию epub из разных источников.
Средства навигации
epub, как мы помним, может включать множество html-файлов. И файлов будет множество. Не потому, что этого требует IDPF, а потому, что от больших файлов epub-читалки падают и все делают много маленьких. И вот для того, чтобы привычное читателю «пролистывание» работало, создатель epub указывает порядок, в котором файлы следует предъявлять. «При открытии показываем 3.html, когда читатель пролистает его до конца открываем 1.html, затем 8.html. А файл footnotes.html при прямом пролистывании недостижим, туда читатель будет попадать по сноскам», что-то в таком роде. Содержится обычно в файле content.opf.
Еще одно средство навигации внутри книги - содержание. Если присутствует, то, как правило хранится в toc.ncx. Технически это более аналог функции «карта сайта», чем привычного «содержания». Cодержание в бумажной книге (или электронном документе) повторяет структуру текста, а.ncx не связан с общим порядком следования текстовых фрагментов и может прямо им противоречить. Впрочем, в реальности файл как правило используется именно в качестве содержания и оформляется «штатно», повторяя порядок, заданный для листания.
Вообще, повторное хранение и переписывание на разные лады одних и тех же данных - фирменный знак epub. Мета-данные храняться в четырех местах: в описании OPF контейнера container.xml, в описании epub-пакета content.opf, в файле содержания toc.ncx и в html-файлах (в тегах meta). Содержание описывается трижды - «карта книги» из toc.ncx спорит с перечислением фрагментов в content.opf кто из них главнее, а заголовки h1-h6 в html смотрят на все это, и думают о реванше.
Текст книги
Разумеется, в epub присутствуют и собственно html-файлы с текстом книги. Так же в архиве хранятся используемые в тексте элементы - графика, стили, скрипты, шрифты.
Никаких существенных «надстроек» или «ограничений» в отношении html, css и т.п. epub не задает. Берем современный Web-контент, ставший уже даже не «динамическим», а «текучим» (epub декларирует поддержку html5, больше смахивающего на ОС , чем на язык разметки, его и браузеры-то пока поддерживают ограниченно), сохраняем на диск, архивируем - и вуаля, электронная книга готова.
«Дорогой, я сохранила интернет на диск, что дальше?»
История вопроса
Чтобы лучше понять основную силу и основную слабость epub, вернемся на 12 лет назад. В 2000-м году, когда ваш покорный слуга только-только приобщился к электронному чтению (если быть точным, был коварно подсажен на оное небезызвестным the-ebook), в сети уже существовали «Библиотека Мошкова », «Альдебаран », «Литпортал » и бог знает сколько еще мелких библиотек. Довольно много текстов было, в принципе, доступно. В основном именно в виде HTML.
HTML уже тогда давал широчайшие возможности для оформления. Благодаря этому люди, готовившие тексты, создавали иногда подлинные шедевры верстки. Достаточно вспомнить, что абзацы в библиотеке Мошкова были (и сейчас Мошков жжет в таком же роде, по-моему) оформлены миксом из тегов
Однако, реально существовавшие читалки (iSilo , Microsoft Reader , Mobipocket , устройства типа REB и т.п.) понимали только ограниченный диалект HTML и еще более ограниченное подмножество CSS. Конечно же, каждая читалка строила «расширения» над форматом, но никто не верстал под конкретную читалку.
В финале, после соединения творческих прорывов создателей текстов, вдохновленных мощью HTML+CSS и ничем не ограниченных в полете своей фантазии, с реальными читалками, на экране пользователя получалась, как правило, ерунда. В лучшем случае книга была неказиста, но читаема. В худшем - текст вообще превращался в месиво.
Моим первым ответом на это стала программа ClearTXT , убирающая из текста «творчество». Однако, достаточно быстро стало ясно, что никакой эвристический анализ не угонится за фантазией создателей html-книг. В итоге все равно приходилось работать руками, больше или меньше.Проблемы с диалектом были не единственными. Программы-читалки имели не только индивидуальные «выразительные средства» и «языковые предпочтения». Ни одна не читала HTML напрямую (в этом плане мало, что изменилось, кстати, предлагаю поразмышлять - почему). Каждая программа использовала свой, обычно закрытый, метод подготовки и упаковки данных. lit, rb, lrf, chm - каждый создатель читалки и разработчик устройства считал своим долгом «изобрести» новый закрытый «формат» и своё, личное, DRM-решение. Средства для конвертации в этот закрытый формат часто были либо недоступны, либо выпускались в виде приложений и/или библиотек под конкретную платформу, с ограниченной документацией или вовсе без нее.
Две проблемы в 2000-м, одна проблема в 2012
Итак, в 2000-м году взять произвольный html и скормить его читалке нам мешали две вещи:epub предлагает решения для обеих проблем:
- Необходимость использовать громоздкие сторонние средства для упаковки HTML в понятный читалке формат
- Несовместимость читалки с используемой разметкой и стилями
Казалось бы, все хорошо.
- Средства упаковки стандартизированы и технологичны - можно даже вручную, минут за 20, собрать весьма сложную книгу используя OCF, notepad и zip-архиватор.
- Как мы уже видели, epub совместим со всеми и всяческими диалектами, стилями и методами разметки. Сохраняй из web, архивируй и читай.
И по поводу упаковки к epub претензий, помимо эстетических, нет. Используется, пусть нестандартное и не самое удачное, но адекватное задаче решение, к тому же простое, как палка.
А вот относительно отображения текста в читалках нас ждут плохие новости. Сам «формат» совместим со всем и всяческим HTML, это да. Куда как просто было написать в стандарте «см. спецификацию html». Соблазн был велик и IDPF не устоял. Но вот мы открываем наш «какой угодно» HTML в «какой угодно читалке» и...
И обнаруживаем, что мы ни на йоту не сдвинулись относительно 2000-го года. Как и в конце прошлого века, каждая конкретная читалка понимает только свой, ограниченный, диалект html+css. Как и в прошлом веке, диалект обычно недокументирован. По-прежнему в каждой читалке для решения даже таких стандартных проблем, как сноски, вводятся свои, ни с чем не совместимые, расширения (поищите epub footnotes в google , методики создания, помимо превращения сносок в ссылки, варьируют от совершенно кислотного CSS до javascript). Простейшие вещи сделать практически невозможно, сложные вещи либо не работают, либо роняют читалки.Вот вам домашнее задание: не подглядывая в epub от ЛитРес, сделайте epub с пустой строкой между двумя абзацами (текст, пустая строка, снова текст, как перед этим абзацем), одинаково отображаемый в iBooks , ADE , Sony и Nook . Китайские чудо-читалки и прочую экзотику оставим в стороне, чтобы задача оставалась выполнимой. И даже выравнивания по ширине и переносов со сносками не попросим. Просто пустая строка, тег
в fb2. Время пошло. Вердикт по делу epub
Явные плюсы формата - простота и технологичность zip-пакета, открытость.
Так же как плюс можно рассматривать единое DRM-решение. IDPF стыдливо делает вид, что DRM в epub типа открыт и типа любой может сделать свой. Все типа верят. И ясно понимают, что epub существует на 99% благодаря тому, что Adobe поддерживает для него DRM-инфраструктуру. DRM-зло, но один DRM на всех это меньшее зло, чем по DRM на магазин.
Да, глупо, когда архивированный HTML с взламываемым за одну минуту DRM выдается за невесть какую инновацию. Но zip и прочая стандартизация это какой ни на есть, а прогресс.
Касаемо плюсов это все.А вот в области создания сложной разметки epub совсем никуда не годится и дальше будут только минусы. Формат не дает создателю книги ни гарантий относительно того, что увидит конечный читатель на экране, ни надежных средств контроля, которые позволят отсечь хотя бы заведомо «нерабочие» варианты, ни готовых решений для стандартных задач. Мой первый epub, только что прошедший валидацию, уронил две читалки из трех, на которых я его тестировал (слишком большой html - 2Мб, и слишком много ссылок, как я потом установил). Создатели документов вынуждены либо игнорировать «фичи» отдельных epub-читалок, либо предлагать несколько epub, чтобы читатель мог взять файл, совместимый именно с его устройством. Ради такого финала и огород городить не стоило - что толку верстать html5 зная, что читать его будут в IE3?
Чего нам ждать от epub в будущем
Наиболее благоприятный для epub сценарий - вытеснение из ниши программ-читалок мелких разработчиков несколькими крупным игроками. Сделать полнофункциональный html5-парсер с постраничной разбивкой как минимум не проще, чем сделать современный браузер, а отдача несопоставимо меньше, и случайных людей тут не будет. Однако ни google, ни Мicrosoft, ни Opera пока что не бегут делать новые движки epub-читалок чтобы Adobe мог как следует поднять бабла на своем чудо-DRM. И сама Adobe вполне ясно свой потенциал по развитию ридеров показала - ADE до сих пор не имеет ни поддержки сносок, ни нормально типографики, ни переносов.
Так что гораздо вероятнее, что лет за пять вокруг epub сформируется некий «неписанный IDPF» неформальный свод правил верстки, рабочих решений по оформлению, опробованных на ведущих читалках «хаков» и «фокусов». Сетевое сообщество уже формирует «истинный» epub-стандарт поверх всепрощающего «html5+css3+все_чего_хочется_еще». Описываются реальные решения для реальных проблем в реальных ридерах. Потом эти «фокусы», будучи стандартом де-факто, станут обязательными и для разработчиков новых читалок. Те, кто в IT достаточно давно, чтобы успеть наглотаться дыма браузерных войн и поработать с IE4, NN4 и Opera 3, отлично представляют себе, что именно нас ждет - по этим граблям сетевое сообщество уже ходило и икается эта прогулка до сих пор. Поэтому когда я вижу «этот epub оптимизирован под iBooks» я испытываю не просто де-жа-вю, а острый рвотный рефлекс.И вот за то, что нас пытаются выпихнуть «назад в 90-е» я ставлю epub незачет. Нам не нужны хаки, становящиеся неработоспособными в новой версии софта. Нам не нужны неписанные правила, по крупицам отлавливаемые методом тыка. Не нужны узаконенные баги. Не нужна «валидация тестированием» по всем читалкам - «покажет или не покажет». Всё это мы проходили.
Нам нужна надежная и удобная технология, четкий стандарт и рабочие средства контроля качества. И epub этого нам дать не смог, к сожалению.Чего от epub ждать бесполезно
Среди недостатков epub есть и еще один, который мы пока не затрагивали - принципиальная несовместимость с другими форматами. epub рожден быть монополистом. Извлечение данных из epub и конвертация в другой формат даже для нехитрого html является непростой задачей. Когда же epub заматереет, обрастет хаками под устройства и замысловатыми решениями, типа подстраничных сносок на CSS, извлечь из него что-либо будет задачей практически неразрешимой. Какой бы формат Adobe не разрабатывала, получается PDF - вход рубль, а выход пять.
А ведь нам все еще нужна поддержка разных (в т.ч. старых) читалок и устройств. Нужна полноценная поддержка альтернативных форматов, которые уже приобрели вес (mobipocket на Kindle) и будут еще появляться на рынке.В добавок нам нужны средства каталогизации, обмена цитатами и заметками и прочая и прочая, чего epub даже на декларативном уровне пока что не обещает. Иными словами, нам нужен fb3, которому и будет посвящена следующая статья.
Часто на форумах и в приходящих мне электронных письмах встречается вопрос «Что такое формат EPUB?». Задают и другие вопросы по данному формату - чем он хорош, чем отличается от FB2, MOBI и DOC, стоит ли покупать книги в нем или же предпочесть другой формат. В этой статье я отвечу на эти и другие вопросы, расскажу об истории создания и развития EPUB, его главных особенностях, а также о перспективах EPUB и существующих альтернативах данному формату.
История
Формат EPUB (название происходит от английского словосочетания «e lectronic pub lication) был разработан Международным форумом по цифровым публикациям (International Digital Publishing Forum - IDPF). Первоначальная версия появилась еще в 1999 году под названием OEB (Open eBook Publication), но окончательная версия вышла в свет в сентябре 2007 года. Это был уже собственно EPUB.
EPUB очень быстро завоевал популярность в США и Европе, где до этого был популярен формат Mobipocket (расширения MOBI, PRC, AZW). Крупнейшая зарубежная библиотека Gutenberg.com сделала epub своим стандартным форматом для хранения электронных книг. Подавляющее большинство онлайн-магазинов электронных книг (контента) перешли на EPUB в 2008-2010 годах.
В 2009 году проектом
Форматы электронных книг EPUB и FB2 относятся к самым популярным. В чем особенности каждого из них?
Факты о EPUB
формате EPUB , имеет структуру, схожую с веб-сайтом со ссылками, однако все ее страницы так или иначе объединены в один файл, который фактически является особой разновидностью ZIP-архива. Данные страницы могут быть представлены в форматах HTML, XHTML, PDF, дополняться графикой, различными шрифтами, стилями. Но для обеспечения связи между разными типами файлов, составляющих контент электронной книги, в стандарте EPUB используются XML-скрипты.
Формат EPUB чаще всего задействуется издателями электронных книг в тех случаях, когда произведение представлено главным образом текстом - в котором немного дополняющих его графических элементов. Это связано с некоторыми сложностями с распознаванием файлов EPUB больших форматов (их величина определяется как раз таки присутствием графики) на ряде устройств.
Вместе с тем формат EPUB, разработанный западными программистами, относится к числу наиболее универсальных. Он поддерживается электронными «читалками» от большинства современных производителей.
Формат EPUB предусматривает защиту цифровых произведений от копирования посредством технологии DRM. Многие магазины электронных книг, а также частные авторы, продающие свою литературу в интернете, пользуются данной возможностью. Цифровое произведение, которое защищено посредством DRM, будет открываться только на определенных устройствах - например, тех, которыми пользуется человек, купивший произведение в онлайне.
Факты об FB2
Электронная книга, представленная в формате FB2 , как и выполненная в виде файла EPUB, является XML-документом особой структуры. Каждый из ее элементов имеет собственные теги. В книге, которая выполнена в формате FB2, способны успешно размещаться как текст, так и графика. В XML-коде файла FB2 также можно прописывать различные метаданные - например, содержание книги, наименование произведения, ISBN, сведения об авторе. Соответствующие документы в целях экономии места на диске упаковываются в ZIP-архивы.
Формат FB2 разработан российскими программистами, поэтому он по умолчанию поддерживается не всеми зарубежными производителями электронных книг. Однако есть большое количество приложений для «читалок», которые могут распознавать данный стандарт. Они доступны для скачивания в основных магазинах, таких как Google Play.
Сравнение
Главное отличие EPUB от FB2 заключается в разнообразии XML-алгоритмов, используемых для форматирования текста, а также дополнения его графикой и иными мультимедийными компонентами. Стандарт EPUB традиционно рассматривается специалистами как более функциональный, поскольку XML-алгоритмы, которые им предусмотрены, могут применяться в целях форматирования таких сложных элементов, как, например, формулы. Вместе с тем файлы EPUB имеют больший размер, чем аналогичные по содержанию электронные книги, которые представлены в стандарте FB2.
Еще одно существенное различие между EPUB и FB2 в том, что первый формат позволяет защитить цифровое произведение от несанкционированного копирования. Стандарт FB2 такой возможности не дает.
Определив то, в чем разница между EPUB и FB2, зафиксируем основные выводы в небольшой таблице.
Таблица
EPUB | FB2 |
Что общего между ними? | |
Оба файловых формата применяются для создания электронных книг | |
Оба формата предполагают использование XML-алгоритмов, поддерживают размещение в электронных книгах текстового и графического контента | |
В чем разница между ними? | |
Предусматривает применение относительно более сложных XML-алгоритмов | Предусматривает использование относительно менее сложных XML-алгоритмов |
Позволяет защищать цифровое произведение от незаконного копирования | Не позволяет защищать электронные книги от копирования |
Разработан на Западе, поддерживается большинством зарубежных производителей «читалок» | Разработан в России, поддерживается по умолчанию главным образом производителями «читалок» из РФ и русскоязычных стран |
Практически все люди, которые спрашивают у меня совета по выбору того или иного устройства для чтения, задают вопросы и о форматах электронных книг - какой лучше и почему. В этой статье я отвечу на эти вопросы очень подробно; рассмотрю как форматы для чтения художественной литературы, так и форматы для чтения литературы технической, научной и учебной.
Художественная литература
Существуют следующие форматы, в которых можно встретить художественную литературу в интернете: TXT, RTF, FB2, EPUB, MOBI, DOC, PDF, DJVU. Сразу скажу, что лучше покупать/скачивать книги в EPUB , FB2 или MOBI . Именно эти форматы наиболее приспособлены для чтения художественной литературы.
Форматы PDF и DJVU слишком тяжелы и неудобны; зачастую текст в них является фактически картинкой, то есть масштабировать можно только страницу целиком, но не размер собственно шрифта. На устройствах для чтения (ридерах) книги в PDF и DJVU отображаются подчас не очень хорошо: буковки могут быть очень маленькими; читать текст неудобно.
Форматы TXT и RTF лишены подобных недостатков, но имеют другие минусы: текст в TXT вообще нельзя отформатировать, то есть заголовки, эпиграфы, цитаты выделяться не будут никак; более того, в TXT не поддерживаются обложки, картинки и таблицы. Это очень убогий, простейший формат. В RTF, конечно, возможности форматирования богаче, но и тут есть недочеты: не поддерживаются автоматически собираемое оглавление и сноски. Помимо этого, файлы RTF обычно весят довольно много, а некоторые устройства для чтения их не всегда корректно отображают.
Формат DOC (и его разновидность DOCX) отлично подходит для сложных документов, но для художественной литературы не годится: он слишком громоздок, сложен; документы DOC часто на разных устройствах отображаются по-разному.
Совсем другое дело - тройка специализированных форматов, заточенных именно под художественную литературу: EPUB, MOBI, FB2 (и его разновидность FB2.ZIP). Данные форматы основаны на так называемой «плавающей верстке», которая позволяет менять размер, гарнитуру шрифта, величину межстрочного интервала и ширину полей. При этом данные форматы поддерживают картинки, таблицы, автособираемое оглавление, сноски и многие другие вещи. Читать книги в FB2/FB2.ZIP, EPUB, MOBI действительно приятно и комфортно.
Разумеется, есть определенные различия между данными форматами, но для новичков они несущественны. Хотя стоит отметить, что в русскоязычном интернете больше всего книг в FB2, в EPUB - уже меньше, а в MOBI - еще меньше.
Конечный выбор формата также зависит от вашего устройства для чтения: с каким-то форматом оно может работать лучше, с каким-то хуже. Тут уж надо поэкспериментировать. Кроме того, встречаются устройства, которые поддерживают только один какой-нибудь формат из указанной тройки. Например, Amazon Kindle читает только MOBI, а B&N Nook — только EPUB.
Подробнее о формате FB2 можете почитать , о EPUB - , о MOBI - .
Научная, техническая и учебная литература
Здесь уже все сложнее: такого рода литература обычно распространяется в форматах PDF, DJVU, DOC (DOCX), каждый из которых, как я отметил ранее, имеет определенные недостатки. Подчас всё еще осложняется тем, что некоторые книги доступны только в одном формате, а подчас - и только в одной версии.
Формат DOC, в принципе, не такой уж и плохой - в сравнении с PDF/DJVU. На компьютере читать в нем книги более или менее комфортно. Хуже дело с устройствами для чтениями: некоторые ридеры отображают его практически как голый текст, исключая ряд иллюстраций, таблицы, формулы и прочее. Другие отображают скорее как картинку: элементы оформления показываются, но нельзя менять размер и гарнитуру шрифта, что на маленьком экране подчас превращается в катастрофу.
PDF. Есть три варианта этого формата: текстовый, графический («картиночный») и графический («картиночный») с OCR-слоем. Первый вариант наиболее предпочтителен: он может содержать все элементы форматирования, а текст остается масштабируемым. В случае же с графическим PDF текст является просто картинкой, которую можно увеличивать только целиком; размер шрифта изменению не подлежит. На устройствах с маленькими экранами графические PDF читать поэтому очень затруднительно.
Иногда на страницы графических PDF накладывается OCR-слой при помощи программы распознавания текста. В книге PDF с OCR-слоем можно проводить поиск, использовать словарь. Это вариант неплохой. Но, опять же, не все устройства для чтения этот OCR-слой «видят». Да и увеличить размер шрифта он не позволяет. Поэтому OCR-слой часто оказывается бесполезным.
Формат DJVU в целом напоминает графический PDF: обычно это просто набор сканов или фотографий бумажной книги. Качество этих сканов/фото может быть просто ужасным, а может быть и вполне приличным. Иногда на сканы/фото накладывается OCR-слой при помощи программы распознавания текста. В книге DJVU с OCR-слоем можно проводить поиск, использовать словарь. Это вариант неплохой. Но, опять же, не все устройства для чтения этот OCR-слой «видят», да и размер шрифта он увеличить не позволит. Поэтому частенько OCR-слой бывает практически бесполезен.
Подведем итог: наиболее предпочтительным форматом для чтения научной/технической/учебной литературы является текстовый PDF, на второе место я бы поставил DOC, на третье - графический PDF и DJVU с OCR-слоем. Последнее место занимают картиночные PDF и DJVU без OCR-слоя.
Документы, таблицы и презентации
Большая часть документов, таблиц и презентаций распространяется в форматах MS Office: DOC/DOCX, XLS/XLSX, PPT/PPTX. Это форматы очень функциональные, но, к сожалению, довольно «громоздкие» и весьма «закрытые» (иными словами, сторонним разработичкам довольно сложно создать программу для чтения файлов в данных форматах). Поэтому некоторые устройства их не поддерживают. Приходится переводить документы в PDF.
Перевести документ/таблицу/презентацию в PDF очень несложно: это позволяет сделать любой приличный текстовый/табличный редактор. Помимо этого, можно воспользоваться каким-нибудь конвертером: их список вы можете найти .
Если документ простой, и главное в нем - текст, то лучше его сконвертировать не в PDF, а в FB2 - так он будет читаться на ридере с большим комфортом. Список соответствующих конвертеров смотрите .
Приятного чтения!