Extraer las imágenes de un PDF en Linux

El formato más utilizado para envío de documentación profesional entre plataformas para que todos puedan ver exactamente el mismo documento no importando si tienen o no el tipo de letra o el programa compatible es sin ninguna duda el Portable Document Format, creado por Adobe ya hace algunos años, pero con esas ventajas vienen algunas desventajas, como el hecho de que no se puede editar de fabrica. Existen mil y un aplicaciones para trabajar con ellos y extraer desde la información hasta las imágenes, pero muchas de ellas son aplicaciones de pago o de prueba, pero al menos en el sistema operativo Linux existen opciones no solo gratuitas sino poderosas para realizar esas operaciones.

El soporte al PDF en Linux es muy amplio, pudiendo ejecutar operaciones como extracción de texto, encriptación, desencriptación o como en el caso que nos ocupa, la extracción de imágenes. Este caso lo acabo de tener en el trabajo, un documento de páginas escaneadas que venían en desorden en el PDF y volverlo a generar (todo ello se puede hacer desde la misma línea de comandos) los paquetes necesarios son xpdf-utils y imagemagick el primero brinda soporte para algunas de las operaciones más comunes con esos archivos, el segundo es el potente editor de imágenes de línea de comando, con el primero extraje las imágenes que presenta en dos formatos el pbm si son imágenes monocromáticas y ppm si son imágenes y si no se le especifica que se extraigan los jpg de manera directa. En el caso de los archivos pbm salen las imágenes en negativo por lo que es necesario aplicarles una edición para lo que usamos imagemagick, si son archivos ppm no existe ese problema.

Esta operación es la misma que tendrían muchos que realizar para extraer las “páginas” de comics que consigan en jpg como para poner un ejemplo, convertirlo a un formato como CBR o CBZ.

Aunque estas instrucciones son muy sencillas generé un script para automatizar el proceso, y se los presento comentado a continuación. Este script puede servir para adecuarlo a otras operaciones, luego mostraré un script para realizar OCR a documentos PDF apoyados en Tesseract.

Todas estas instrucciones se pueden realizar desde terminal sin necesidad de utilizar el script, en el viene explicado que hace cada línea

  #!/bin/bash
  # requiere de xpdf-utils imagemagick
	# Extrae las imágenes de un archivo pdf indicado desde la terminal como un parametro, el -j es para que extraiga los jpg directo sin convertirlos a ppm
	pdfimages -j $1 ${1/.pdf}
	# Verifica si los archivos son pbm (monocromaticos)
	if [ -f ${1/.pdf}-000.pbm ]
	then
		# Si los archivos son monocromaticos estos estarán en negativo
		for i in $( ls *.pbm); do
		# Aplica negativo a las imágenes y las convierte a jpg
            	convert -negate $i ${i/.pbm}.jpg
        	done
		# Borra los archivos pbm
		rm *.pbm
	fi

Popularity: 2% [?]

De porque Google Plus puede no fracasar

Mucho se ha estado hablando acerca de la nueva red de Google, tanto que pareciera que cualquier otra noticia en comparación de este límitado lanzamiento no existiera, lo cierto es que cualquier proyecto del gigante de Mountain View es cubierto desesperadamente por los medios eléctronicos, pero parece que esta vez al menos tienen mucha razón en darle una cobertura amplia.

Las opiniones aunque varían en intensidad son en general optimistas para la plataforma, algunas sin nada de mesura en donde se denota un fanboyismo por los productos del gigante de las busquedas casi igual que el que profesan los amantes de los productos de la manzana, estás últimas augurando el fin de Facebook, opinion no solo exagerada sino falta de fundamentos y muchas de esas elucumbraciones solo podrán definirse con el tiempo, no en algunos días que se lleva navegando en la plataforma.

Si, en mi opinión como uno de los afortunados (si, ahorita entrar es una cuestión de suerte no de contactos como cierto personaje indicó en su “programa”) que puede probar la plataforma, saltan algunos aspectos que más que definir el éxito si aseguran una permanencia mayor que otros proyectos de indole social que ya había intentado Google, aunque rascando más se puede ver que la “nueva” plataforma son más bien partes de proyectos que por separado pocos entendieron y mucho menos utilizaron o que simplemente desecharon, es decir, de un Frankestein de proyectos poco utilizados pudieron canibalizar lo suficiente para generar un proyecto con mucho más futuro.

Una de las carácteristicas que más llama la atención de la nueva plataforma son sus “Circulos”, que permiten definir que deseamos que sepa cada uno de ellos, si queremos incluirlos en nuestro día a día, si queremos que lo vean solo unos cuantos o una sola persona, todo ello de una manera intuitiva que lo hace más que atractiva, pero esa “innovadora” carácteristica no nació con Google Plus, o con Diaspora como algunos pensamos en un principio, solo basta recordar que era una de las carácteristicas de Google Buzz, su intento por entrar al microbloggin que fracasó por un exceso de soberbia de la compañia al pensar que sabían exactamente con quien deseaban compartir los usuarios y endilgarles el servicio sin preguntarles, esto fue suficiente para que todo mundo olvidara Buzz, lo suficiente para darle a “Circulos” la apariencia de innovadora.

Otro es su forma de compartir fotos, que de nuevo era parte de buzz que se respaldaba enormemente de la plataforma Picasa Web, en este caso lo han vuelto a hacer, y de paso le han dado al usuario un espacio ilimitado de almacenaje de fotos, ahora cualquier dispositivo con el cliente de Google Plus subirá la imágen a la nube en esa plataforma esperando pacientemente por si se desea compartir con el mundo.

Existe el aspecto de “Sparks” que es seguir información de tópicos diversos y que podemos consultar y compartir desde la plataforma, solo hay que pensar un poco para ver que esos tópicos pueden ser también preguntas que haga la misma comunidad y tendremos un franco competidor de la plataforma Quora que a pesar de mucha expectación que generó no ha podido despegar cómo algunos esperaban.

Dos aspectos que pueden disfrutar solo los usuarios móviles (y de momento solo androides) son el poder hacer “check-in” en los lugares que uno se encuentra, con la ventaja de poder decidir a quien queremos informar y sustentado en un sistema de check-ins que incorporaron a su plataforma maps, y su plataforma Latitude. Los mensajes públicos geolocalizados son mostrados en un apartado “cercanos” y también en Google Maps en forma de, adivinen, Buzz. La otra carácteristica es Huddle, y es una mezcla de una aplicación que hicieron volar bajo el radar al no meterla con la marca de Google sino a nombre del equipo Slide y se llamó Disco, que permite organizar conversaciones grupales, su capacidad de enviar mensajes push y la conveniencia de estar ya integrado en los servicios planteará cara a mensajeros como whatsapp, beluga o pingchat.

No podemos dejar de mencionar otra de las carácteristicas que supone un avance y fuerte competencia, esta vez de manera dirécta a Skype, y es el Hangout o “Dejada”. Esta carácteristica permite realizar chats de voz y vídeo grupales con una calidad aceptable y que utiliza la tecnología que se utiliza en Google Talk, basada en dos estandares que Google ha estado impulsando como es el WebM.

Estas carácteristicas por si solas parecieran no hacer nada del otro mundo, y seguramente pasaron bajo el radar de muchos sin causar más que una sorpresa pasajera, pero la forma en que Google lo ha logrado conjuntar es implemente sublime, y que tiene a la mayor parte de su audiencia y crítica contentos.

Es muy temprano para augurar lo que algunos comentan de que Google Plus hará por las redes sociales lo que GMail hizo por el correo eléctronico, y que el valor no fue solo la plataforma de correo eléctronico que a mi parecer sigue siendo la más optima y avanzada, sino que hizo despertar de su letargo a las compañias que ya se habían dormido en sus laureles de popularidad a innovar de nuevo, más que sustituir a Facebook o Twitter o la red social que digan y manden, lo importante es que tendrán que innovar para competir de nuevo contra un serio contrincante que no esperaban, y así como no desapareció ni Hotmail ni Yahoo Mail, esperemos que no desparezcan las demás sino que empiecen a generar competencia que al final beneficiará a los usuarios.

Comentarios donde siempre ;)

 

Popularity: 2% [?]

X-Men: First Class ó reiniciando correctamente una saga

X-Men First Class Roster

Uno de mis mayores gustos a través de los años fue coleccionar cómics, todo aquel que se inicie en ese pasatiempo sabe que coleccionar cómics equivale a acumular una gran cantidad de datos referentes al “universo” al que pertenecen, ese conocimiento va acrecentándose dependiendo el tiempo que se coleccionen hasta el punto de poder platicar con tus camaradas coleccionistas si Wolverine es inmortal, cosa que por cierto, aun no nos ponemos de acuerdo.

Lo cierto es que cuando las películas basadas en cómics tuvieron su boom, una de las más esperadas fue sin duda X-Men, una película que aunque a muchos les dejó insatisfechos cumplió al menos en gran parte con la imagen en la vida real que se tenía de el equipo de superheroes renegados más famoso de la casa de las ideas,  aunque apostó por el argumento palomero y nunca ahondó en la ya para esos momentos al menos en el cómic, compleja estructura de los personajes, pero hubo una en particular que resolvieron de la manera más barata, dejaron a Magneto como un megalomano maquiavelico que solo ocupaba el pretexto de la supremacía mutante como bandera para hacerse con el poder, que para cualquiera que haya leído y amado el cómic es la peor forma de describir a ese importante mesías mutante.

Eric Magnus es por mucho un personaje atormentado, sobretodo atormentado por la culpa de no haber podido salvar a su familia, momento en el cual se manifestaron los poderes del que para muchos es el mutante más poderoso del planeta, que carga con el la necesidad de hacerse cada vez más poderoso por una simple razón, proteger a sus hermanos mutantes de la extinción, esa obsesión lleva implícita una enorme generosidad, que lo llevó incluso a apropiarse de la fortaleza de Cable para hacer un refugio para sus hermanos y poder vivir alejados del Homo Sapiens y a la que poeticamente llamó Avalon, el mismo lugar de descanso del legendario rey de britania Arturo. Pero considerado siempre una amenaza latente a la seguridad mundial ese sueño nunca se realizó, y es esa misma cacería la que lo ha orillado a esas enormes amenazas al mundo, un mundo en el cual alguien tan poderoso no tiene cabida si no es controlado y usado como moneda de cambio (aquí lease Superman).

Todo este rollo es para introducir la que al menos argumentalmente es la mejor película de las filmadas sobre este equipo de superheroes, donde más que las escenas de acción, alguna épicas y otras totalmente gratuitas, se explora sobretodo la visión y la cercanía de los hombres que buscan de alguna manera lo mismo pero por medios totalmente opuestos, Charles Xavier y Eric Magnus. En las anteriores películas su “amistad” era más nombrada e insinuada que nada, en esta cinta se muestra de una manera más latente esa amistad, ese lazo que los une casi al grado de la hermandad como el propio Eric nombra a un Charles tendido en la arena, unidos por el respeto mutuo. Muchas fueron las ocasiones en el cómic que ambos debieron desistir de luchar para no hacerse más daño, o giros en que uno u el otro sacrificaba la ventaja para salvar a su conocido, su meta es la misma, la forma de llegar a ella difiere.

Diferencias con el cómic son muchas y muy amplias, el equipo original, el origen de los mutantes y la edad de los mismos, aunque arriesgada por lo poco conocidos que son fuera de los aficionados, la inclusión del Hellfire Club como antagonistas fue una decisión acertada, a pesar de las diferencias cierran incluso cabos sueltos abiertos en las otras películas y deja abiertas nuevas posibilidades en el reboot, los rostros frescos pueden ser utilizados sin problema en dos películas más e incluso yo me atrevo a afirmar que es posible llevar una serie televisiva con actores siguiendo el mismo esquema de la película.

Como se puede apreciar, a mi la película me gusto bastante, siendo purista se toma muchas libertades en los detalles pero el fondo y la esencia de los niños del átomo se respeta incluso le da más profundidad, la inclusión del cameo de Wolverine, o de la bellisima Rebeca Romjin-Stamos, chistes finos orientados sobretodo al lector harán de el una película disfrutable incluso para quienes no gustan del genero, y por supuesto hacen necesario olvidar las infames X-Men 3: The Last Stand y X-Men Origins: Wolverine.

Popularity: 2% [?]

Opera 11.50 y el Pez Espada

Para nadie es un secreto que mi navegador por defecto desde hace años tanto en mi teléfono móvil como en mi escritorio es Opera, para mi una de las más finas obras de ingeniería de software e innovación, y realmente no exagero, si hay un navegador al que agradecer muchas de las funcionalidades innovadoras que ahora disfrutamos en todos es a que primero se les ocurrio a los Desktop Team de la empresa noruega.

Aunque el eterno subestimado, siempre a la sombra de los demás es sin duda el navegador que más atención le ponen todos los demás equipos de desarrollo, para saber hasta donde han puesto la pertiga esta vez y también para “imitar” aquello que se les haya ocurrido.

Aunque con algunas funcionalidades poco comprendidas como Opera Unite u Opera Turbo, pero con algunas como el agrupamiento de pestañas, la sincronización entre dispositivos de marcadores y ahora contraseñas, el speed dial copiado por Chrome y Safari, los gestos de ratón, el control por voz, su elegante y funcional cliente de correo integrado, su cumplimiento cabal de las especificaciones de estándares de la W3C, su excelente utilidad de desarrollo Dragonfly, y por supuesto, por ser el navegador más rápido sobre la tierra, siendo esto último su eslogan desde hace años pero que apenas empieza a recobrar después de varias versiones que se quedaba a la saga de otra maravilla de ingeniería como es el motor V8 de Chrome.

Esta nueva versión que integrará un nuevo  motor que a primera vista tiene un rendimiento impresionante que tiene por nombre código “Swordfish” sustituyendo a “Barracuda” de la anterior versión, y con la nueva capacidad de agregar widgets a los espacios del Speed Dial y la sincronización de contraseñas en Opera Link prometen dar la primera vista de lo que deberán de hacer la competencia para estar a la altura, pues aunque en el escritorio y entre los usuarios no sea un contendiente, la industria respeta enormemente el desarrollo del navegador de la O roja (que adopta un color gris y una instalación aparte llamando al paquete de desarrollo Opera Next).

Está en un momento muy temprano de su desarrollo, pero está increiblemente estable para ser una versión tan preliminar, cualquiera notará la velocidad con que ahora se rendearán las páginas y la eficiente huella de memoria y de proceso que tiene.

Si son arriesgados y quieren probar una excelente pieza de software para navegar en la red, no pueden dejar de darle un vistazo a Opera 11.50, que pueden descargar desde el blog del equipo de desarrollo:

http://my.opera.com/desktopteam/blog/

Popularity: 2% [?]

Moda, Redes Sociales y Unity

Hace unos cuantos días se liberó la nueva versión de Ubuntu, 11.04 Natty Narwhal, y entre las mejoras (o cambios según se vea) incluía un escritorio con el cual había estado experimentando en la Netbook Edition de la distribución desde 10.10, su nombre es Unity y pretendía ser un avance en la interacción del usuario con el escritorio, pero el bombardeo constante de los medios (sobretodo los sociales) hizo de este lanzamiento uno de los más polémicos que ha tenido la distribución de Canonical.

He de admitir que yo en un inicio tampoco me sentí cómodo con el nuevo escritorio cuando lo probé, se me hizo poco ágil, pesado y con pocas posibilidades, me parecía una apuesta muy arriesgada por parte de Canonical después del enorme acierto con la Netbook Remix, además se esperaba mucho de Gnome 3 y Gnome Shell, la evolución del escritorio que prometía una evolución importante al mismo, comparable a KDE 4, personalmente también lo probé y no me convenció, por lo que ya dejé de darle importancia al asunto hasta que llegara la nueva versión.

Utilicé a partir de la Beta Natty en una instalación limpia, no sin problemas al instalar pero que al final domé, con un usuario sin personalizaciones en Gnome para poder aprovechar el nuevo escritorio y emitir un mejor juicio, al inicio me molestaba mucho que por ejemplo el conmutador de tareas no funcionara con la combinación de teclas que yo acostumbraba, tener que cambiar en la barra lateral y la agrupación de ventanas por “aplicación”, también me costó trabajo acostumbrarme a la barra de menú única y a la perdida de iconos del área de notificación. Todo cambio es traumático, para mi lo fue el cambio a Unity,  pero al final puedo decir que lo logré domesticar, y empiezo a entender un poco el porque de como fue diseñado.

Tengo un monitor de 22 pulgadas, suficientemente generoso para trabajar, en algún lugar del escritorio acostumbro grabar archivos (de los vicios que uno se hace en Windows) pero que realmente no me afectan por el tamaño estandar de mi escritorio (1680 x 1050)  pero en mi afán de máximizar el espacio, he experimentado con una gran cantidad de trucos, desde eliminar un panel, usar solamente un dock que se oculte y es hasta Unity donde veo un gran aprovechamiento del espacio en mi escritorio, también su forma de dimensionar las ventanas es más inteligente que el Ubuntu Netbook Remix donde en algunos programas de diseño fijo no se ajustaban y tampoco mostraba barras de desplazamiento. Así que como podrán ver hasta el momento dejé de pensar en Unity como un obstaculo para verlo como algo que hay que probar, así como las primeras versiones de KDE 4 eran terriblemente infuncionales (razón por la cual abandoné mi amada Kubuntu) a pesar de que fue anunciada con bombo y platillo como una importantísima actualización y que tantos y tantos críticos tomaban como ejemplo de lo que Gnome debía estar haciendo, los usuarios al menos en sus iniciales encarnaciones lo hicieron pedazos, ahora quien se acuerda de ello?

Con Unity y eventualmente con Gnome Shell pasará lo mismo, son trabajos en un estado inicial de desarrollo, nisiquiera tan innovadoras dirán por ejemplo los usuarios de MacOS, pues muchas de las funciones de Unity son copias al carbón de funcionalidades del escritorio de MacOS, pero creo que hay que darle al menos una oportunidad, no irnos por lo que la mayor parte de la gente anda diciendo (muchos también solo haciendo eco de lo que ya leyeron de “lideres de opinión”)  y hacer lo propio con Gnome Shell, una de las enormes bellezas de Linux es precisamente la capacidad de elección, si en un momento dado deciden que ni uno ni otro les gusta o si de plano gracias a Unity odian Ubuntu, existen distros y escritorios para todos los gustos, inclusive dentro de Ubuntu podrían probar la elegante simpleza de Enlightment, o la ligereza de LXDE o XFCE, el preciosismo de KDE con solo seleccionar estos paquetes en su Centro de Software, y si han de odiar a Unity, que sea porque lo probaron y no les gustó, no solo porque el Vox Populi dice que no sirve, yo hice lo mismo incluso en la presentación de 10.10 y ahora que lo uso y no siento tener mayor problema he tenido que tragarme lo que en ese momento dije.

Además y es un punto que tal vez algunos no logran ver, es que el futuro (o más bien la tendencia del presente) es el uso de pantallas táctiles, así que no piensan que la barra lateral y el tamaño de los iconos botones y la forma en que muestran el enfoque y la vigencia de un programa parecieran hechos para una tableta? Si es así, entonces no pasará mucho tiempo en que veamos la competencia de Ubuntu en el terreno de las Tablets que son nos gusten o no, la nueva gallina de los huevos de oro, y del que Ubuntu Unity puede tener una presencia importante como en su momento se pensó que Enlightment lograría en el territorio de las PDA.

Popularity: 2% [?]