Archivos de la categoría ‘Edición digital’

lektuEl 15 de abril de 2014 fue el pistoletazo de salida de una nueva plataforma de venta de ebooks llamada Lektu. Esta plataforma liderada por Alejo Cuervo y Gigamesh busca configurarse como una alternativa real a Amazon y a otras grandes plataformas de venta de ebooks.
En esta nueva aventura Alejo Cuervo se ha rodeado de un equipo con amplia experiencia en el comercio online y la edición digital. Este equipo esta formado por David Fernández, fundador de la librería online Cyberdark.net, Farid Fleifel, anteriormente CTO en Amazon BuyVIP y Director de Innovación en Spanair, y Cristina Macía con amplia experiencia en el mercado editorial como autora, traductora y coordinadora de publicaciones.
La calidad y valía de las personas implicadas en este proyecto ha provocado que aún antes de su inauguración se sucedieran las filtraciones y rumores sobre lo que nos podríamos encontrar. Normalmente en estos casos el hype suele acabar en frustración cuando las expectativas no se cumplen.

Es verdad que Lektu mejora en muchos aspectos a otras plataformas de venta de ebooks. Estas ventajas han sido ampliamente publicitadas en diversos blogs (aquí y aquí tenéis una muestra). Sin embargo no es menos cierto que también existen sombras.

Hablar de los inconvenientes de un producto o criticar un determinado servicio suele ser fácil. Ya sabéis es más fácil destruir que construir. Con esta idea en mente y a pesar de las dudas que me generaba Lektu decidí darme un tiempo prudencial para analizar mis impresiones y no dejarme llevar por la frustración de unas expectativas no cumplidas.

Pasado un mes desde su inauguración y tras haber echo uso de los servicios que ofrece creo que ya estoy en situación de poder valorar lo que ofrece Lektu, y sobretodo, lo que no ofrece.

Las ventajas de Lektu ya están más que publicitadas y en lineas generales estoy de acuerdo con lo que se ha escrito sobre ella. Los enlaces que he mencionado anteriormente son un buen ejemplo de las cosas buenas que ha implementado y que indudablemente son un paso adelante positivo.

Dicho esto creo que es más interesarme centrarme en cuales son los inconvenientes a los que se enfrenta Lektu y que pueden lastrar su futuro.

  1. Plataforma enfocada a las pequeñas editoriales. La mayoría de las pequeñas editoriales españolas están descontentas del trato que reciben de Amazon o eso dicen. Sus quejas son variadas pero se centran fundamentalmente en tres aspectos: Porcentaje de precio de venta que se queda Amazon, Política de promociones muy agresivas y la competencia “desleal” del programa Kindle Publishing. Lektu surge como respuesta a esta situación e intenta captar socios entre los descontentos. La idea en si no es mala, ya se sabe que la unión hace la fuerza, pero en este caso la suma de estas pequeñas editoriales pinta un cuadro con bastantes problemas. En primer lugar tus socios marcan el carácter de tu negocio, y Lektu se configura como una plataforma de nicho, abocada a gestionar escasos fondos editoriales y de temáticas muy específicas (Ciencia ficción, Fantasía y Terror). Es cierto que esta formula funcionó en el pasado con las librerías físicas (Gigamesh) y las tiendas virtuales (Cyberdark.net) pero las circunstancias actuales no son las mismas y desde luego no es lo que los usuarios estamos reclamando. Hoy en día los usuarios reclaman una oferta integral y variada, no queremos tener que recurrir a diversos servicios cuando buscamos una obra u otra. Con el planteamiento actual de Lektu es difícil que un futuro cercano veamos los fondos de las grandes editoriales (Grupo Planeta, Random House Mondadori, Santillana, RBA Editores) en su catalogo y sin ellos su influencia en el mercado español será intrascendente.
  2. Catalogo de ebooks. Esta es una consecuencia directa del punto anterior. Lektu empezó con un catalogo de apenas 200 títulos. En el momento de la publicación de esta entrada creo que el catalogo supera los 300 títulos… No hay que ser un gran matemático para comprobar que la comparación con otras plataformas es cuando menos insultante. Incluso la infame Libranda nació con un catalogo mayor y ya sabemos como acabo… No es malo tener un catalogo pequeño, pero en esos casos el contenido del mismo se convierte en un elemento crucial y como veremos en el siguiente punto la oferta editorial de Lektu es en el mejor de los casos mejorable… Es cierto que desde su cuenta de twitter informan de que próximamente tendrán novedades interesantes pero el mercado reclama realidades no promesas.
  3. Novedades editoriales. Aceptemos que queremos ser un negocio pequeño, centrarnos en el trato al cliente, con pocos productos pero de gran calidad y… Basta de soñar porque con ese planteamiento en un mundo globalizado estas condenado al fracaso y más cuando ni tu mismo sigues tus premisas. Lektu es un negocio, como ya veremos en el siguiente punto, y su objetivo es vender ebooks y para eso tienes que ofertar productos que el cliente quiera comprar. En el mercado del libro lo que capta la atención y vende son las NOVEDADES. Pretender crear una plataforma con el reclamo de Gigamesh, Sinerrata o Valdemar como editoriales mas conocidas y no ofrecer las novedades de estas editoriales en pegarte un tiro en el pie y tomar por tontos a los clientes. Ahora es cuando me decís: ¡Tienen las novelas de Juego de Tronos! y yo os digo: ¡SOLO TIENE LAS NOVELAS DE JUEGO DE TRONOS! ¿Donde están las otras novelas de George R.R. Martin? ¿O las novelas de Lankhmar, de Tim Powers, de Lovecraft o de Terry Pratchett? Yo os lo diré: En su catalogo de papel. Lo que demuestra esta política es que las editoriales no quieren arriesgarse poniendo a la venta ebooks que les resten negocio al papel. Todavía están ancladas al pasado y no son conscientes de que hay que avanzar. Nadie les va a quitar ventas porque esos libros ya están “gratis” en la red. Tu única posibilidad es ponerlos a la venta igualmente, a un precio razonable, y fidelizar clientes que usen tu plataforma para futuras compras antes de buscar en otros sitios. El caso de Juego de Tronos no es más que un caramelo para atraer usuarios.
  4. Precio. El dinero, el vil dinero, tan despreciado por todos y que por desgracia suele condicionar cualquier proyecto. Desde que se empezó a hablar de Lektu uno de los comentarios más oídos en la red era que los precios de los ebooks iban a ser justos y por supuesto más baratos que los establecidos por las grandes editoriales. Puesta en marcha la plataforma hemos visto que la barrera psicológica esta en los 10€ y vemos muchos libros por 5€ o menos. De entrada podemos pensar que son precios bajos, pero eso no es cierto. La mayoría de las novelas que tienen un precio razonable pertenecen a una de estas tres categorías: a) Autores nobeles o desconocidos del gran público b) Recopilaciones de relatos o cuentos y c) obras clásicas de género. En definitiva lo mismo que ofrece Amazon. Las obras realmente interesantes para el público en general están entre los 6,50€ de Juego de Tronos o los 9,50€ de Danza de Dragones. La prueba definitiva de esta absurda política de precios la veremos cuando en la plataforma se pongan a la venta autenticas novedades (si es que alguna vez se publican…) y ya veremos a que precio . Se que el tema del precio es muy controvertido y que cada uno tiene su opinión. En mi caso mi barrera psicológica para comprar un libro esta en los 6-7€ para una novedad (no más de seis meses en el mercado) y desde luego hoy por hoy no voy a comprar ningún ebook que supere ese precio y creo que para desgracia de Lektu muchos piensan como yo.

Analizados los puntos anteriores mi opinión final es que Lektu es un experimento. Me da la sensación de que el equipo detrás de la plataforma sabe lo que quiere el usuario pero por diversas razones no lo han plasmado plenamente. Quizás sea por imposición de las editoriales, por falta de visión, por miedo a equivocarse… En cualquier caso creo que si no rectifican posiblemente nos encontremos ante un nuevo intento fallido.

No quiero acabar esta entrada sin plantear mi visión del problema. Como comente al principio criticar es fácil y puede hacerlo cualquiera. Realizar una crítica constructiva parte de la idea de plantear cambios que resuelvan problemas.
En mi opinión lo primero que tenemos que tener claro es el análisis de la situación. Preguntémonos por que surgen las web de descargas y que encuentran los usuarios en ellas:

  • Por carecer de acceso a contenidos legales.
  • Por que en esas web encuentran una amplia oferta de contenidos y formatos
  • Por que tienen un precio competitivo (Este último punto no es una tomadura de pelo).

La solución al problema de la piratería empieza porque la industria asuma lo que estas webs hacen bien y lo repliquen o incluso lo mejoren. Veamos como puede hacerse:

  • Para empezar, las editoriales tienen que tener todo su catalogo disponible, tanto las novedades editoriales como el “fondo de armario”. Eliminemos el concepto de obra descatalogada. Nos sorprenderíamos de la cantidad de gente que esta dispuesta a pagar por obras que llevan sin editarse 20 años. Obviamente esta decisión tiene un coste, digitalizar fondo que solo esta en papel no es fácil ni barato, pero a largo plazo es una inversión y como tal hay que entenderla. Además nada impide a una editorial aprovecharse del trabajo de digitalización hecho por las web de descargas, al fin y al cabo los derechos de las obras son tuyos. Las webs con mas fondos piratas no superan los 20.000 en castellano y la calidad de muchos de ellos es discutible. Una oferta conjunta y de calidad de los grandes grupos editoriales superaría ampliamente lo que ofrecen estas webs.
  • Los ebooks mejor editados y con mas características añadidas son los míos. Podrás encontrar una copia barata de mi novela en Epublibre o Papyrefb2 pero si realmente quieres disfrutar del libro la mejor versión es la mía. No tendrás errores ortográficos o tipográficos, tendrás servicios de sincronización, podrás compartir tus impresiones con otros lectores, etc.. En definitiva mejorar la oferta existente ya que no puedes eliminarla.
  • No puedo vender los ebooks a 0€ pero si puedo darle valor añadido a mi producto y ajustar el precio para que sea interesante y atrayente. Busca nuevos modelos de negocio que se adapten a tu producto y que sean interesantes para el usuario (servicios de suscripción, promociones, publicidad, etc.). Añadele funcionalidades a tu producto que la competencia no pueda replicar (sincronización de contenidos, compra desde dispositivos de lectura, actualización de ediciones, préstamo de ebooks, venta de packs papel+ebook o ebook+audiolibro, adelantos editoriales, etc.) Como en cualquier negocio mi primer objetivo es crear una base de clientes estable y publicitar las ventajas de mi producto frente al de la competencia. En este sentido no es mala política acabar con la falacia del todo gratis. En Internet nada es gratuito, otra cosa es como nos cobran por determinados servicios o productos. Hacer una labor de concienciación  sobre este tema y dar publicidad sobre como se mantienen las páginas web de descarga puede ser interesante. A nadie le gusta que descargar un libro “gratis” conlleve la instalación de malware, o que venden mis datos de registro a empresas de publicidad o que te inundan la pantalla con banners de publicidad, etc. Pon en contexto tu producto, diferencialo de la competencia y sobretodo no criminalices el comportamiento de tus clientes. Si quieres que cambien ofreceles algo mejor.

Una última reflexión. El comprador, sobretodo cuando esta realizando adquisiciones de productos de ocio, busca refuerzos positivos de su actividad. Para entendernos, si conseguimos que los usuarios se encuentren satisfechos con el proceso de compra más allá de que el producto en si cumpla sus expectativas  nos habremos apuntado un tanto. Sin embargo si sienten que han sido engañados, que han pagado de más o que no compensa el esfuerzo entonces posiblemente no repitan.

No soy un inocente, se que lo que planteo aquí es difícil. Requiere de los grandes grupos editoriales iniciativa para cambiar un modelo de negocio que lleva siglos; adoptar muchos riesgos; llegar a acuerdos con los autores; y sobretodo, realizar grandes inversiones sin tener la seguridad de triunfar. Como vemos muchas piedras en el camino para un negocio excesivamente tradicional. El problema es que durante años no han tomado la iniciativa y han surgido otras formas de consumir contenidos, cambiar esta tendencia ahora va a costar más pero no les queda opción. La política represiva, las leyes que buscan criminalizar a los usuarios o limitar el uso de tecnologías como el P2P están condenadas al fracaso. En el mejor de los casos retrasaran la adopción de un nuevo modelo de negocio pero nada más.

Solo tengo dos cosas seguras sobre lo que nos deparara el futuro del libro:

  1. Las editoriales están condenadas a desaparecer tal y como las conocemos. De ellas depende que el nuevo intermediario entre el autor y sus lectores surja de sus entrañas o ese puesto sea ocupado por un nuevo actor.
  2. El libro, los autores y los lectores son los únicos actores de esta tragedia que tienen asegurado un futuro. No se en que forma ni como se establecerán las relaciones pero mientras exista alguien dispuesto a disfrutar de una buena historia y de alguien con algo que contar existirá un medio y un soporte para que se pongan en contacto…

 

 

¿Somos clientes de segunda categoría para Amazon?

Publicado: 14 de marzo de 2014 de webjoram en Edición digital, Opinión
Etiquetas:, ,

La pregunta que abre esta entrada puede ser un poco fuerte pero después de analizarlo creo que la respuesta más sincera es .

Cierto es que Amazon ha supuesto un cambio muy importante para el comercio online en España y que su entrada ha revitalizado el mercado mejorando la competencia y haciendo que otras grandes plataformas de comercio mejoren sus políticas de venta y de atención al cliente pero eso no significa que su política e inversión en España este acorde con lo que los usuarios nos merecemos.

No puedo dejar de lado la sensación de que el mercado español y aun el europeo no son tan importantes para el gigante norteamericano como nos quieren hacer pensar. Para llegar a esta conclusión no hay nada más que revisar la cantidad de servicios que oferta Amazon en EEUU y como la mayoría de ellos no llegan o llegan descafeinados al resto de países donde tiene presencia. Es cierto que normalmente se toma como excusa para explicar esta situación las diferencias en el tratamiento de los derechos de autor en los diferentes países. En mi opinión aunque esta puede ser una razón no creo que sea la única que justifica este trato desigual. En esta comparación hemos de reconocer que Amazon UK es un caso excepcional en el ámbito europeo ya que es la única que se acerca en servicios a los ofertados en EEUU pero sin llegar a su mismo nivel.

Lo mejor para sustentar una opinión son los hechos, así que a continuación voy a reseñar alguno de los servicios que Amazon oferta en el mercado americano y que aquí no podemos disfrutar. En este caso voy a centrarme en el ámbito español para realizar la comparación pero países como Francia, Italia o Alemania no están en mejor situación.

 Amazon Instant Video

Este servicio esta enfocado al consumo de series de TV y películas mediante el sistema de streaming de vídeo. Los contenidos se pueden visualizar en la modalidad de alquiler, suscripción y compra. En sus comienzos este servicio se enfoco en el mercado americano por obvias razones ya que para que este servicio tenga cierta calidad las conexiones de los usuarios tienen que cumplir un mínimo de calidad, igualmente la gestión de los derechos de autor eran una cortapisa para su desarrollo inmediato en otros lugares. Pero hoy en día en España ya existen muchos plataformas que realizan este servicio (Wuaki, Filmin, Itunes, Xbox Video, Playstore Video, etc.) por lo que no se comprende las reticencias de Amazon a incorporar este servicio al resto de países donde tiene presencia (caso aparte es el de Amazon UK que si lo oferta). Podría entender que los precios no fueran los mismos que en el mercado americano pero no puedo aceptar que simplemente no de la posibilidad de contratarlo.

 Amazon Premium

Este servicio permite a los clientes de Amazon acceder a una serie de ventajas a cambio del pago de una cuota anual de suscripción. En USA esta cuota es de 79$ aunque parece ser que pronto subirá a los 99$. Este pago permite al cliente norteamericano disfrutar del envío gratuito de todos los pedidos, acceso a todo el catalogo de vídeo del servicio Prime Instant Video y al servicio Kindle Owners’ Lending Library que permite solicitar el préstamo de un ebook al mes dentro de un catalogo de mas de medio millón de libros incluyendo bastantes novedades. En mi opinión es una oferta realmente buena y que merece mucho la pena. Este servicio esta “implantado” en el resto de tiendas de Amazon pero “capado”. En el caso español el servicio solo garantiza el envío gratuito de los paquetes en menos de 3 días. Cierto es que con un descuento considerable ya que en España cuesta solo 15€.

Préstamo de libros Kindle

Este servicio permite a los usuarios que han comprado un ebook poder prestárselo a otro usuario al igual que si se tratara de un libro en papel. Este servicio tiene varios condicionantes que limitan su uso:

  • El préstamo debe estar permitido por el propietario de los derechos de la edición digital
  • El periodo de préstamo es de 14 días y durante ese periodo el propietario del ebook no puede acceder a el.
  • La última limitación es la que más nos interesa: “el préstamo de libros Kindle está únicamente disponible para clientes de Amazon.com residentes en los Estados Unidos”

No puedo entender esta limitación ya que como indica el servicio es necesaria la autorización del propietario de los derechos de autor. Podría darse el caso de que si un editor español quisiera editar un ebook y permitir a sus clientes que pudieran prestarlo a otros usuarios no podría hacerlo porque Amazon no se lo permite.

Si ya se que la posibilidad de que un editor español se planteara esta opción es ciencia ficción pero quien sabe lo mismo hay algún loco en la sala…

Matchbook

Este es un servicio muy interesante ya que permite a cualquier cliente que compre un libro en formato impreso, adscrito a esta promoción, tener la posibilidad adquirir su versión digital por 3$ o menos. En un primer momento muchos usuarios pueden pensar que es una tontería pagar dos veces por el mismo producto pero existen muchas situaciones que esta posibilidad es ideal. Por ejemplo no cargar con el libro en papel en un viaje, no hacer notas sobre el papel, etc… En cualquier caso la gran ventaja de este servicio es que te da esa posibilidad que ademas no se circunscribe a un periodo de tiempo sino que puedes comprar esa versión digital cuando quieras incluso para libros que compraste en Amazon antes de existiera este servicio y ahora están adscritos a el. Al igual que en el caso anterior no entiendo porque este servicio no esta disponible en España. En mi opinión sería una buena forma de recompensar a los usuarios que compran libros en papel y facilitas la transición a la edición digital. Yo estoy convencido de que el futuro del libro es la edición digital pero eso no significa que el papel vaya a desaparecer, al contrario, con el tiempo se centrara en menos ediciones pero de mayor calidad y belleza. En cierto modo es lo mismo que ha pasado con el mp3 y los discos de vinilo que se siguen vendiendo.

Autorip

Este servicio es similar al de matchbook pero enfocado al mundo de la música. Con dos salvedades: la edición digital de los discos físicos que compras es gratuita y este servicio si esta disponible en el mercado español. Lo indico aquí porque es la prueba palpable de que si Amazon quiere puede exportar muchos de sus servicios al mercado español ¿No tienen derechos de autor la música? Sí ¿Son distintos de los libros? No, entonces ¿Cuál es el problema?

X-Ray

Este es una servicio propio de Amazon que busca mejorar el consumo de contenidos dentro de la plataforma de Amazon. Gracias a esta tecnología podemos enriquecer la experiencia de uso. Por ejemplo consultar información sobre los personajes de un libro, acceder a foros sobre un determinado libro, visualizar la letra de una canción o consultar información sobre los protagonistas de una película. En el caso español solo podemos acceder a este servicio para poder ver las letras de las canciones compradas en Amazon y los ebooks en ingles que incorporen esta posibilidad. Es cierto que la implementación de este servicio no depende exclusivamente de Amazon, en el caso de los libros los editores tienen que posibilitar esta función pero en cualquier caso no es entendible que Amazon limite su uso exclusivamente a libros en inglés.

GoodReads

Llegamos al servicio que han suscitado esta entrada. Para quien no lo sepa GoodReads es una web social de recomendación de libros que fue comprada por Amazon en 2013. Esta página web es usada por millones de usuarios en todo el mundo para buscar nuevas lecturas, valorar libros, conectar con otros usuarios, etc…

Desde que Amazon compro GoodReads los usuarios de ambas plataformas esperábamos alguna forma de integración de este servicio dentro de la familia Kindle, sobretodo en sus ereaders. Esta integración aunque no tan amplia como esperábamos se anuncio a bombo y platillo cuando salio el Kindle Paperwhite de segunda generación a finales de 2013 y ahora en marzo de 2014 se ha anunciado que los Kindle Paperwhite de primera generación también dispondrán de esta función. Hasta aquí todo parece correcto, la sorpresa viene cuando se informa que esta funcionalidad solo esta disponible para kindle que estén registrados con una cuenta de Amazon USA  WTF!!!

No logro entender que razones puede argumentar Amazon para impedir que usuarios de otros países que han comprado su dispositivo igual que un usuario norteamericano tengan que ser discriminados de esa manera. El Kindle Paperwhite que se vende en España, Francia, Reino Unido, Italia o Alemania es exactamente igual al que se vende en USA y el acceso a la pagina web y a los servicios de GoodReads es gratuito y no existe ninguna limitación geográfica por lo tanto no existe razones legales o técnicas para impedir este servicio.

Como podéis ver la diversidad de servicios que oferta Amazon es amplia y sin embargo en España solo podemos acceder a una parte muy pequeña de ellos. He de decir que estos no son los únicos servicios que Amazon oferta en USA, existen muchos más, sobretodo gracias a la firma de acuerdos con Bibliotecas, Universidades y otros organismos públicos que buscan facilitar el acceso a su amplio catalogo de contenidos. No he querido reseñar esos servicios en esta entrada porque entiendo que el acceso a los mismos no depende única y exclusivamente de la propia Amazon.

Y vosotros que pensáis, ¿Es justo el trato que Amazon nos da?

En este punto del proceso partimos de un texto “plano” o con una estructura muy básica que respeta únicamente tamaño de la fuente, estilo y alineación al que queremos dotar de las características de un texto perfectamente maquetado, esto es, encabezamiento, cuerpo de texto, notas, tablas, imágenes e indice.

Por maquetar entendemos establecer los estilos adecuados a las diferentes partes del texto que hemos escaneado. Cualquier documento se estructura en diferentes áreas, las más comunes son:

  • Encabezamiento: Este elemento nos permite estructurar el texto en niveles y apartados, comúnmente se equiparan con los capítulos de un libro. Podemos tener distintos niveles de encabezamientos, esto es, nos podemos encontrar con un libros con varias partes que estructuraremos como Encabezamiento1 y dentro de estas partes sus propios capítulos que marcaremos como Encabezamiento2. La importancia de esta estructura es que van a ser la base para generar posteriormente el indice del libro de manera automática.
  • Cuerpo de texto. Este elemento abarca el estilo que debe tener todo el texto de la obra que estamos digitalizando. Dentro de este apartado podemos encontrarnos con subelementos que tengan características propias como pueden ser citas, poemas, canciones imágenes, tablas, etc… En función de las características del texto escaneado dará lugar a una estructura más simple o compleja.
  • Notas a pie de pagina: Este es un elemento opcional que no necesariamente va a existir en todos los documentos que elaboremos, al contrario, de los dos anteriores que son obligatorios. Sobre este elemento solo comentar que a la hora de maquetar un texto siempre debemos marcar las notas con el formato de a pie de página aunque posteriormente al convertirlos a formato ebook todas las notas se convierten al formato final de página salvo en el formato FB2 que si respeta la estructura original.
  • Tablas e imágenes: Al igual que el anterior son elementos opcionales, en el caso de las imágenes siempre debemos tener cuidado de marcar la opción anclaje a párrafo para que a la hora de exportarlas al ebook se realice correctamente.

Por Estilo entendemos las características que definen cada una de las áreas de un texto atendiendo a los siguientes atributos básicos (Fuente, Tamaño texto, alineación, formato párrafo). Hay multitud de guías y ayudas en Internet sobre como trabajar con estilos en los diferentes procesadores de textos, en el caso de Word es interesante consultar este enlace, para openoffice, etc …

Lo ideal es configurar en un documento en blanco los estilos que vamos a utilizar en ese documento (Encabezamiento1, Encabezamiento2, Normal, etc…) definiendo para cada uno sus características tal y como observamos en la imagen:

Maquetacion

En la imagen hemos puesto un ejemplo de las diferentes áreas que puede tener el documento. Para definir las características de cada área no necesitamos escribir nada, solo seleccionar el estilo que nos interesa y modificar sus valores tal y como se muestra en esta imagen:

estilos

Una vez configuramos los estilos insertamos en dicho documento en blanco el documento que habíamos conseguido tras pasarle el OCR. A partir de aquí solo queda revisar todo el texto y ir aplicando en cada una de las partes del mismo los estilos definidos.

Una vez terminado la revisión debemos guardar el fichero en formato pagina web filtrada (*.html) que es el formato que necesitaremos para realizar la conversión a ebook que veremos en el siguiente post.

Del Papel al Ebook (I): Introducción

Del Papel al Ebook (II): Escaneo del texto y OCR

Del Papel al Ebook (IV): QualityEbook

En este paso parto de la suposición de que la fuente original del texto a digitalizar esta en papel, en caso de no ser así, es decir si ya tenemos un documento en formato PDF podemos pasar al OCR directamente.

Antes de explicar como realizar este proceso me gustaría indicar la diferencia entre escanear un documento y realizar un tratamiento de OCR sobre dicho documento, ya que mucha gente cree que es la misma cosa y nada mas lejos de la realidad. Obviamente existen software que realizan ambos pasos de manera simultanea y por eso puede llevar a alguna confusión.

Cuando realizamos un escaneo de una pagina lo que realizamos es una “fotografía” lo mas fidedigna posible de esa página. Igualmente por defecto el sistema nos permite guardar dicha “fotografía” como un fichero de imagen (jpg, png, bmp, etc…) o con un formato PDF. La principal diferencia entre ambas opciones es que cuando guardamos en formato imagen el software del escaner va a crear un archivo por cada página escaneada mientras que si utilizamos el formato PDF el software permite agrupar todas las paginas escaneadas en un solo archivo si así lo deseamos, “simulando” que tenemos un documento de texto pero sin serlo realmente. Este es un hecho importante porque para poder trabajar después con el CONTENIDO de estas imágenes debemos realizar un procedimiento que permita “convertir” estas imágenes en texto con el cual podamos trabajar. Este proceso de conversión es el que se realiza con el software de OCR. En términos simples este software analiza las imágenes reconociendo caracteres y palabras y las convierte en texto. Existen numerosos programas de OCR, gratuitos o de pago y de pago, ademas de que suele estar integrado en el software que acompaña a nuestra impresora. En mi caso yo suelo utilizar el programa AbbyyFine Reader.

 1) Escanear el Original

En lineas generales para que el OCR del texto sea de calidad y tenga pocos errores tenemos que realizar un escaneo adecuado, es decir, a mejor definición de la imagen escaneada mejor sera el OCR sin embargo a mayor resolución de la imagen también aumenta el tamaño del fichero lo cual puede llevar a encontrarnos con ficheros muy grandes a nuestro ordenador le cueste manejar. Los mejores valores para realizar el escaneo son los que aparecen en esta imagen:

Escaner

Si nos encontramos con un texto con la letra muy pequeña entonces deberemos aumentar la resolución del escaner a 400 o incluso 600 ppp

2) OCR

Como ya he indicado anteriormente la mayoría de las aplicaciones de OCR permiten agrupar en un solo proceso tanto el escaneo como el reconocimiento del texto, sin embargo, yo prefiero explicar el proceso como dos pasos diferenciados. En un primer momento realizamos el escaneo a un fichero PDF y a continuación abrimos este PDF en el programa AbbyyFine Reader o similar para que analice el documento y marque las diferentes áreas del documento. El programa identifica 3 tipos de áreas (de texto, de imagen o tabla) y en función de esta codificación realizara el proceso de conversión respetando siempre que se pueda el estilo y tipo de fuente del original.

abbyy

En este punto nuestra tarea sera revisar el análisis hecho por el programa y corregir todos aquellos errores que el programa no haya detectado como son, paginas sin texto, codificación errónea de áreas, eliminación de encabezados y pie de paginas, etc …

En todo momento tendremos dos ventanas de la aplicación, en la de la derecha tenemos el texto escaneado y en la de la izquierda el resultado del OCR realizado.

Una vez terminado este proceso procederemos a exportar el resultado al tipo de documentos que prefiramos, AbbyyFine tiene una amplia variedad de formatos soportados (DOC, PDF, EPUB, RTF, HTML, etc…) En mi opinión el mejor formato de exportación es como documento HTML o RTF, la razón es que ambos formatos mantienen los estilos básicos del texto y elimina mucha de la codificación “sucia” que suelen tener otros formatos. Tened en cuenta que nos interesa tener un texto “casi plano” en cuanto a estilos porque posteriormente vamos a ser nosotros los que maquetemos los estilos propios. Utilizando un símil como ejemplo; para pintar una pared de blanco es preferible partir una pared con un color claro homogéneo antes que una pared pintada en varios colores oscuros.

Del Papel al Ebook (I): Introducción

Del Papel al Ebook (III): Edición de texto

Del Papel al Ebook (IV): QualityEbook

DEL PAPEL AL EBOOK (I): Introducción

Publicado: 18 de febrero de 2013 de webjoram en Edición digital, Manuales
Etiquetas:, , , ,

Una de las consecuencias que ha tenido el desarrollo de la edición digital es la recuperación de numerosos libros descatalogados, agotados o cuya edición ha estado circunscrita a un país. En la mayoría de los casos las grandes editoriales no han cubierto esta necesidad de recuperar para el ámbito digital este fondo cultural y ha sido gracias a la aportación de muchas personas que han dedicado su tiempo al largo proceso que conlleva convertir un texto impreso en un documento digital. Este labor de digitalización empezó mucho antes del desarrollo de los modernos lectores electrónicos y ya en los años 70 tenemos las creación de proyectos como Gutemberg que busca la digitalización de todas las obras libres de derechos de autor en todos los idiomas. A este proyecto le siguieron otros muchos, no todos ellos “legales”, que tienen como objetivo compartir cultura y que en muchos casos a pesar de su status “alegal” han permitido a muchos usuarios acceder a textos que de otra manera les habría sido totalmente imposible. Dejando de lado discusiones sobre la legalidad de esta práctica lo que si es cierto es que en ocasiones muchas personas se encuentran con la necesidad de digitalizar textos impresos para convertirlos en ebook que poder utilizar en sus ereaders o tablets; es a estos usuarios a los que he decidido dedicar una serie de post en los que voy a explicar de la manera más básica posible las etapas que debemos llevar a cabo para realizar esta tarea y que el producto resultante cumpla con los estándares de los diferentes formatos de ebook (EPUB, MOBI, FB2) y por lo tanto sean compatibles con la mayor parte de los lectores existentes en el mercado. En lineas generales las etapas que conlleva este proceso son:

  1. Escaneo del texto y OCR
  2. Revisión del texto con un procesador de textos
  3. Conversión del texto al formato ebook deseado
  4. Depuración del Ebook

Este esquema es el que yo considero más fácil de entender para un profano. Evidentemente cualquier persona con conocimientos de HTML, CSS es posible que considere que se realizan demasiados pasos y que se podría directamente pasar del OCR a la maquetación del texto directamente utilizando herramientas como SIGIL, BookDesigner, Fiction Editor o Notepa++ pero para la mayoría de las personas les resulta mas sencillo realizar estas tareas con un programa más conocido como puede ser el Word o cualquier otro procesador de textos y posteriormente depurar, si así lo desea o requiere, el ebook resultante con herramientas más especificas. Para realizar este proceso necesitaremos:

  1. Un escaner de mesa
  2. Software de OCR (incluido con la mayoría de las impresoras). Existen también software comerciales muy buenos como AbbyyFine Reader y gratuitos como FreeOCR.
  3. Procesador de textos, podemos utilizar OpenOffice, LibreOffice como alternativas gratuitas pero por ciertos problemas de compatibilidad con QualityEbook recomiendo utilizar Word.
  4. QualityEbook es el programa que nos va a permitir convertir un documento Word en el formato de ebook que deseemos.
  5. Sigil. Este es un programa que nos va a permitir la edición de los ebook en formato EPUB para depurar generados con QualityEbook.

Nos vemos en el siguiente post con la primera etapa de nuestro proceso.

Del Papel al Ebook (II): Escaneo del texto y OCR

Del Papel al Ebook (III): Edición de texto

Del Papel al Ebook (IV): QualityEbook

DEL PAPEL AL EBOOK (IV) : QualityEbook

Publicado: 15 de febrero de 2013 de webjoram en Edición digital, Manuales
Etiquetas:, , , , ,

Ya nos encontramos cerca del final del proceso y en realidad si los pasos anteriores los hemos realizado correctamente en esta etapa las tareas a realizar están casi totalmente automatizadas.

El objetivo final de todo el proceso es conseguir un documento en formato Ebook compatible con todos los dispositivos de lectura existentes en el mercado. Sin embargo hasta ahora no hemos hecho referencia a las razones por las que es interesante generar nuestros documentos en dicho formato ya que muchos de vosotros podéis alegar que la mayoría de los ereaders o tablets del mercado soportan otros muchos formatos como son los PDF, DOC, TXT, HTML, ODT y un largo etc. por lo que si ya tenemos un documento en dichos formatos no necesitamos realizar el proceso de convertirlos a Ebook.

La principal razón para realizar esta conversión es que la mayoría de los formatos indicados están pensados para ser mostrados en pantallas de mayor tamaño que las de un ereader o tablet por lo que cuando los utilizamos en estos dispositivos suele dar lugar a errores en la presentación del contenido. Para resolver este problema es por el que se desarrollaron los formatos específicos que nosotros denominamos Ebook pero que abarcan una amplia variedad de los mismos (EPUB, MOBI, FB2, LRF, etc.). Este formato no esta condicionado por el soporte en el que se muestre por lo que puede verse correctamente en un ereader, un tablet o un PC, y ademas, dota a todos los documentos de una estructura normalizada para representar los elementos que pueden componerlos (indice, texto, imágenes, notas, etc …).

Bueno una vez aclarados estos conceptos pasemos a lo realmente importante, convertir nuestro documento, que en el anterior paso guardamos en formato HTML (Pagina web, filtrada), en un ebook.

Existen multitud de programas (calibre, mobicreator, Jutoh) con los que se puede realizar esta operación pero por los resultados obtenidos y por la facilidad de uso yo recomiendo QualityEbook, anteriormente conocido como QualityEpub. Este programa permite abrir cualquier fichero html que cumpla unos requisitos mínimos y a partir de él crear un ebook en el formato que deseemos de los muchos soportados.

Los pasos a realizar son los siguientes:

  1. Descargar e instalar el programa desde su pagina web. Es recomendable también descargar la guía de uso del mismo básicamente porque da algunas ideas de como debemos maquetar el libro en Word para que el programa lo reconozca correctamente.
  2. Abrimos el programa, la primera vez es necesario abrirlo con permisos de administrador para que se pueda configurarse después ya no sera necesario hacerlo mas. Con el programa abierto buscamos el fichero html en nuestro disco duro y lo importamos, tras importarlo y si no encuentra errores nos mostrara una ventana para que indiquemos los metadatos del documento:metadatos
  3. Con el documento cargado podemos realizar algunas operaciones complementarias como son corregir guiones de dialogo, guiones cortos y errores de OCR si lo consideramos necesario.qualityebook
  4. Si comprobamos que todo esta correcto podemos proceder a guardar el resultado en el formato que mas se adecue a nuestras necesidades. Yo recomiendo que ademas del formato que necesitemos guardemos el documento también en formato EPUB que es el estándar de facto y desde el cual en un futuro podemos realizar modificaciones o incluso convertirlo a otros formatos.qualityebook2

Realizados los pasos indicados tendremos nuestro ebook perfectamente preparado para ser leído donde queramos.

El programa QualityEbook nos permite conseguir un resultado muy bueno con un grado de dificultad muy pequeño pero adolece de un problema, nos obliga a que todos nuestros ebooks tengan una presentación similar. Obviamente para la mayoría de los usuarios esto no es importante pero para aquellos que quieran profundizar en la maquetación de ebook existen numerosos tutoriales que explican como hacerlo e igualmente hay muy buenos programas como Sigil, FictionBook o BookDesigner  que nos permitirán personalizar el diseño de nuestro ebook dotandolo de características “unicas” como tipos de fuentes personalizadas, diseño propio de los capítulos, etc …

Del Papel al Ebook (I): Introducción

Del Papel al Ebook (II): Escaneo del texto y OCR

Del Papel al Ebook (III): Edición de texto

Hace unos días publique un post en el cual explicaba en mi humilde opinión cuales eran los errores que la industria editorial esta cometiendo en el desarrollo de un mercado digital viable en el ámbito español.

Poco después leí la noticia publicada en diversos blogs y periódicos de que la industria editorial en la presentación de resultados del año 2012 se queja de haber perdido 350 millones de euros a causa de la “piratería”. De nuevo vemos que no se aprende de los errores cometidos y que prefieren la actitud de “mantenella y no enmendalla” tan característica de nuestra querida tierra.

Sin embargo como no pierdo la esperanza de que al final abran los ojos a la realidad quiero plantear aquí cuales sería para mi las características ideales que debería tener un mercado digital económicamente viable y donde la tan denostada “piratería” quedaría en un mercado residual; porque, efectivamente, siempre habrá una minoría que preferirá no pagar por algo si lo puede conseguir “gratis” con cierto esfuerzo pero el objetivo no debe ser acabar con esta minoría sino conseguir que para la mayoría de las personas sea mas atractivo y fácil acceder a los contenidos mediante un pago justo y acorde al producto suministrado.

Los puntos vitales de este ecosistema serían:

  1. Oferta digital universal: obviamente este es un objetivo muy ambicioso pero en cualquier caso la idea sobre la que sustenta esta premisa es que el mercado digital debe intentar que todo obra cultural este disponible en este formato, no solo las novedades editoriales sino también todas aquellas obras descatalogadas que conforman en muchos casos el fondo de armario de las editoriales y que por diversas razones viven el sueño de los justos. Igualmente el mercado del libro de texto, manuales técnicos, publicaciones periódicas y resto de obras de consulta y referencia deberían también disponibles.
  2. Eliminación de sistemas anticopia: ya estoy viendo a las editoriales temblar de solo pensar en ofertar su catalogo sin controlar que puede hacer o no el usuario con las obras compradas. No seamos ilusos, esta plenamente demostrado que cualquier sistema anticopia es eliminable por lo tanto imponer restricciones a los ebook lo único que consiguen es dificultar los procesos de compra, mantener prisionero al cliente a una plataforma o formato, en definitiva crea insatisfacción y empuja a los usuarios hacia otros sistemas menos “legales”.
  3. Precios sensatos: Este es uno de los puntos más controvertidos y donde en definitiva radica muchos de los problemas a los que se enfrenta esta industria. Ya en mi anterior post explique mi opinión sobre este tema y no voy a repetirme. En mi opinión si el mercado digital quiere ser importante en España el arco de precios de los ebooks de creación literaria (novela, poesía y teatro) debe ser el siguiente: 6-8€ novedades literarias; 3-5€ de las obras con más de un año desde su publicación y un fondo de catalogo cuyos precios estén entre 1-3€. Obviamente para otro tipo de obras como los libros de texto, las revistas, etc. se podría plantear otros sistemas de comercialización (suscripciones, tarifas planas de acceso, freemium, etc…); en cualquier caso nunca se debería perder la perspectiva de que estamos comerciando con un producto digital cuyos costes y ventajas son radicalmente distintas de estos mismos productos en papel por lo que no se puede replicar su política de precios al mercado digital.
  4. Productos de calidad: Este es un elemento fundamental para diferenciar los ebooks de los libros en papel y para justificar el pago de un dinero por “algo” que nunca tendrás físicamente. Frente al “olor” del papel, la calidad de la encuadernación o de las ilustraciones y en definitiva el afán coleccionista que todo lector lleva dentro el mercado editorial debe dotar a los ebooks de características que justifiquen su compra frente al libro en papel o incluso como compra complementaria. En este sentido dotar a los ebooks de contenido multimedia, maquetación correcta y exprimir las características que ya ofrecen los formatos mas extendidos de ebooks (EPUB3, otro enlace, KF8 o MOBI) para la estructuración del contenido, inclusión de notas, etc.. es imprescindible.
  5. Lectura social: Una de las grandes ventajas de los ebooks es la posibilidad de poder leer en cualquier momento y casi con cualquier dispositivo conectado a Internet. En este sentido servicios como la sincronización de la lectura, marcadores y notas que plataformas como Amazon ofrece es un valor añadido que no se debe menospreciar. Igualmente la existencia de este ecosistema se debería potenciar permitiendo la creación de clubes de lectura digitales, fomentando la valoración y la opinión sobre las obras o permitiendo compartir fragmentos de las obras en las redes sociales, y por último posibilitar el “préstamo” de ebooks entre usuarios replicando en cierto modo en el mundo digital los comportamientos del ámbito analógico. Por mi experiencia profesional y personal el préstamo de libros nunca ha sido un menoscabo de las ventas de los mismos sino todo lo contrario te permite conocer nuevos escritores, nuevos géneros y en la mayoría de los casos suele desembocar en la compra de mas libros..

Estos puntos analizados aquí no son novedosos, muchos de ellos se aplican en otros mercados con gran éxito por lo no existen problemas técnicos para llevarlos a cabo.

Obviamente hace falta una voluntad comercial para llevarlo a cabo y posiblemente haga falta también voluntad política para cambiar muchas de las leyes que mantienen una sobreprotección de la industria del libro y que en nada benefician a los usuarios, a los autores y en definitiva al desarrollo de la cultura y de la innovación.