Skip to content

El PDF como puente entre el mundo físico y el mundo digital

Viernes, 14 febrero, 2014

Con frecuencia hablamos de Servicios de Tecnología, de Aplicaciones Informáticas o de Sistemas de Información, pero con menos frecuencia hablamos de la información en sí, en particular de cómo está esa información construida, almacenada y transmitida. Queremos hablar hoy del formato de la información digital.

Hay miles de formatos de ficheros digitales diferentes. En la Wikipedia se recogen unos 10.000, pero ella misma dice que no están ni mucho menos todos. Tradicionalmente, solo un programa o aplicación era capaz de abrir un determinado tipo de formato, porque para cada programa el programador se inventaba el formato de los datos que quería.

Hasta tal punto esto era general que solo una mínima parte de estos formatos son abiertos, es decir con especificaciones públicas sobre su contenido, y aún menos los reconocidos como estándares oficiales u oficiosos.

pdf_iconUno de los más importantes formatos de archivo, si no el más, es el formato PDF.  Como se indica en Wikipedia,

Cada fichero PDF encapsula una descripción completa de un documento plana de diseño fijo , incluyendo el texto, tipos de letra , gráficos y otros datos necesarios para que aparezca. En 1991 , el co-fundador de Adobe Systems,  John Warnock, esbozó un sistema llamado “Camelot” que dió origen al PDF

El PDF es un formato orientado a la página, destinado a verse pero no a modificarse. No es un buen formato intermedio para recuperar información a incluir en otros formatos de documentos. El éxito de PDF se puede explicar porque, debido a su estructura final y fija, hace que sea un buen medio de intercambio y almacenamiento de información a largo plazo.

Sin embargo, yo creo que hay una razón más profunda y más humana: el PDF es lo más parecido que encontramos dentro de un ordenador a un documento tradicional en papel. Los no-nativos digitales hemos ido a la escuela cargados de libros y de cuadernos de papel. Hemos estudiado la universidad e incluso hemos trabajado muchos años con diversos tipos de hojas, folletos y documentos “materiales” que vienen usándose desde la época de los egipcios.

Ahora tenemos ordenadores y en ellos desarrollamos la mayor parte de nuestro trabajo, sin embargo añoramos todavía esas hojas de papel que se deslizaban por nuestras manos. Nos gusta, y por eso nos gusta el PDF, porque nos lo recuerda. Nos hace también confiar más en él, de forma instintiva.

Otro aspecto psicológico importante es el de la perdurabilidad. Cuando veis un documento en vuestra pantalla, ¿no os parece que en cualquier momento puede desaparecer, o modificarse, o cambiar los márgenes o los colores o lo que sea?. Tenemos tendencia a desconfiar de la solidez de lo digital.

Pero de entre todos, el PDF nos promete una mayor inalterabilidad y permanencia, y no sólo es una impresión subjetiva: es también un hecho que se ha hecho realidad gracias a la evolución de este formato una de cuyas variantes estándares se denomina precisamente PDF/A (PDF for Archive) y está destinado a ser guardado durante muchos años y luego recuperado y poder seguir recuperando correctamente su contenido.

Cintas Univac. Fuente: Wikipedia

Cintas Univac. Fuente: Wikipedia

Me viene a la memoria unas cintas que teníamos, hace muchos años, en el CPD del Industria. Se trataba de unas cintas de nuestro UNIVAC 1100, y que probablemente contenían datos históricos de algunos sistemas que llevaba el Ministerio de Industria.

Al cabo de un año, mas o menos, de llegar yo, como resultado de un proceso de “downsizing“, el UNIVAC fué desmontado, y reemplazado por “sistemas abiertos”, pero allí quedaron las cintas guardadas… cintas que no sólo no se podían leer, sino que incluso aunque encontrásemos la forma de leerlas (había empresas que se dedicaban a ello), simplemente no podríamos interpretar su contenido.

Así que la perdurabilidad de la información digital es una cuestión importante. Recuerdo también que, muchos años después, cuando se empezaba a cacharrear con la firma electrónica y los PKI, los documentalistas y los notarios plateaban una cuestión de durabilidad. En efecto, había documentos legales que tenían efectos por más de 50 años. Si hay que verificar la firma electrónica de un documento dentro de 50 años, ¿quién nos asegura que la empresa o entidad que gestiona la correspondiente PKI sigue existiendo entonces?.

Ya hemos dicho que existe una versión del formato PDF que está diseñada para la perdurabilidad (PDF/A), pero debemos añadir también una inteligente característica de este formato, y es que mantiene siempre la compatibilidad “hacia atrás”, es decir, que cada nueva versión del formato, acompañada de una nueva versión del lector, permite ademas seguir leyendo todas las versiones anteriores.

De modo que hasta ahora tenemos dos cosas:

  • Un formato digital, PDF (propietario), que se ha generalizado con el uso, ya que cumple muy bien una necesidad básica, la representación de la información física en el mundo digital de forma aceptable por los humanos.
  • Una característica necesaria, la perdurabilidad, que en general escasea en el mundo digital.

Pero aún nos faltan otras tres cosas:

  • La adición de características y funciones de garantía, en relación al contenido, en relación a la autoría del mismo y a posibles validaciones (firma digital), en relación al momento en que el documento ha sido firmado y por lo tanto cobra validez (sellado de tiempo), y en relación a que todo esto pueda comprobarse en el futuro aunque las fuentes externas de prueba ya no estén disponibles (autocontenido).
  • Un estándar formal y abierto, que nos otorgue conformidad e interoperabilidad en el uso.
  • Un proceso de adopción oficial con valor legal por los organismos públicos que otorgue validez a todos los efectos de la información representada en este formato digital, y que regule y promueva la publicación oficial en este formato, incluso llegando a eliminar la tradicional publicación en papel.

Como os podéis imaginar, estos tres puntos están bastante relacionados entre sí. El proceso de generalización del uso del PDF y su adecuación a un conjunto de necesidades analógico-digitales se vió acompañado y reforzado con los procesos de estandarización, de los que algunos de los más importantes son:

  • PDF/A-1, estandarizado como ISO 19005-1:2005, basado en un subconjunto de la especificación PDF 1.4 de Adobe
  • PDF/A-2 y PDF/A-3 estandarizados posteriormente como ISO 19005-2:2011 e ISO 19005-3:2012 basados en ISO 32000-1:2008, a su vez apoyado en la especificación PDF 1.7 de Adobe
  • PAdES (PDF Advanced Electronic Signatures), que es un conjunto de restricciones y extensiones de la ISO 32000-1 para adecuarla al uso de la firma electrónica avanzada en el marco de la Directiva UE 1999/93/EC. Este estándard ha sido publicado por ETSI (European Telecommunication Standards Institute) como TS 102 778.

DNIE ejemploEn este punto, ya vemos los avances realizados en la evolución e integración del PDF con la firma electrónica y su estandarización, pero además ya vemos que comienza la plena eficacia legal de los documentos PDF firmados electrónicamente.

Así la adopción oficial ha ido avanzando, y según publicaba Adobe a modo de ejemplo, hay ya muchas organizaciones que establecen, recomiendan, o aceptan el formato PDF o PDF/A para el archivo a largo plazo de documentos digitales:

Organización Standard Aplicación
U.S. Library of Congress PDF/A Recomienda
U.S. National Archives and Records Administration (NARA)  PDF/A Acepta
European Commission (MoReq)  PDF/A  Recomienda
German government (SAGA v4 )  PDF/A  Recomienda
French government  PDF/A  Recomienda
Dutch government  PDF/A  Obliga
National Archives of Sweden  PDF/A  Acepta
Austrian National Library  PDF/A  Recomienda
National Archives of Norway  PDF/A  Recomienda
Organization for the Promotion of Automated Accounting  PDF/A  Recomienda
Brazilian federal legislature  PDF/A  Obliga
U.S. Courts  PDF  Obliga
Victoria, Australia, Public Record Office  PDF  Obliga
Italian government archiving standard  PDF  Acepta
Taiwan National Central Library  PDF  Recomienda

Y por supuesto es obligado mencionar que la Guia Técnica del Esquema Nacional de Interoperabilidad del Catálogo de Estándares establece el estándard PAdES (ETSI TS 102 778-3) así como los formatos PDF y PDF/A como estandares en el Estado español.

En cuanto a la utilización con plenos efectos legales de documentos en formato PDF, habría infinidad de ejemplos, pero vamos a citar únicamente dos:

En definitiva, el “humilde” PDF, es una pieza clave en nuestro viaje desde el mundo físico al mundo digital, tanto por factores sicológicos como tecnológicos y legales.

Bueno, hasta aquí vamos a llegar por hoy. Hemos pasado de un artículo mas bien filosófico a otro un poco mas “próximo”. ¿Cuál os ha gustado más?.

3 comentarios leave one →
  1. Martes, 4 marzo, 2014 10:27 am

    Una exposición clara y razonada que comparto. Ya en su día (tres años ha) también abogaba yo por el uso del PDF en “Los formatos de firma no existen, son los PAdES” (http://goo.gl/k5AIx0), del blog de isigma.

  2. Martes, 8 abril, 2014 11:06 pm

    Esta genial el articulo. La cuestión de la perdurabilidad de los formatos digitales siempre me ha parecido inquietante, y ya no solo en el terreno de la administracion sino tambien en el personal, antes una persona se hacia 300 fotos en su vida, las revelaba y las conservaba, ahora nos hacemos miles de fotos al año pero un simple error de disco duro se lleva por delante toda una vida de recuerdos.

Trackbacks

  1. 18/02/14 – Breves : La nueva Ley de Propiedad Intelectual, ebooks para descargar, Sarah Lark | La revista digital de las Bibliotecas de Vila-real

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: