Con frecuencia hablamos de Servicios de Tecnología, de Aplicaciones Informáticas o de Sistemas de Información, pero con menos frecuencia hablamos de la información en sí, en particular de cómo está esa información construida, almacenada y transmitida. Queremos hablar hoy del formato de la información digital.
Hay miles de formatos de ficheros digitales diferentes. En la Wikipedia se recogen unos 10.000, pero ella misma dice que no están ni mucho menos todos. Tradicionalmente, solo un programa o aplicación era capaz de abrir un determinado tipo de formato, porque para cada programa el programador se inventaba el formato de los datos que quería.
Hasta tal punto esto era general que solo una mínima parte de estos formatos son abiertos, es decir con especificaciones públicas sobre su contenido, y aún menos los reconocidos como estándares oficiales u oficiosos.
Uno de los más importantes formatos de archivo, si no el más, es el formato PDF. Como se indica en Wikipedia,
Cada fichero PDF encapsula una descripción completa de un documento plana de diseño fijo , incluyendo el texto, tipos de letra , gráficos y otros datos necesarios para que aparezca. En 1991 , el co-fundador de Adobe Systems, John Warnock, esbozó un sistema llamado «Camelot» que dió origen al PDF
El PDF es un formato orientado a la página, destinado a verse pero no a modificarse. No es un buen formato intermedio para recuperar información a incluir en otros formatos de documentos. El éxito de PDF se puede explicar porque, debido a su estructura final y fija, hace que sea un buen medio de intercambio y almacenamiento de información a largo plazo.
Sin embargo, yo creo que hay una razón más profunda y más humana: el PDF es lo más parecido que encontramos dentro de un ordenador a un documento tradicional en papel. Los no-nativos digitales hemos ido a la escuela cargados de libros y de cuadernos de papel. Hemos estudiado la universidad e incluso hemos trabajado muchos años con diversos tipos de hojas, folletos y documentos «materiales» que vienen usándose desde la época de los egipcios.
Ahora tenemos ordenadores y en ellos desarrollamos la mayor parte de nuestro trabajo, sin embargo añoramos todavía esas hojas de papel que se deslizaban por nuestras manos. Nos gusta, y por eso nos gusta el PDF, porque nos lo recuerda. Nos hace también confiar más en él, de forma instintiva.
Otro aspecto psicológico importante es el de la perdurabilidad. Cuando veis un documento en vuestra pantalla, ¿no os parece que en cualquier momento puede desaparecer, o modificarse, o cambiar los márgenes o los colores o lo que sea?. Tenemos tendencia a desconfiar de la solidez de lo digital.
Pero de entre todos, el PDF nos promete una mayor inalterabilidad y permanencia, y no sólo es una impresión subjetiva: es también un hecho que se ha hecho realidad gracias a la evolución de este formato una de cuyas variantes estándares se denomina precisamente PDF/A (PDF for Archive) y está destinado a ser guardado durante muchos años y luego recuperado y poder seguir recuperando correctamente su contenido.

Me viene a la memoria unas cintas que teníamos, hace muchos años, en el CPD del Industria. Se trataba de unas cintas de nuestro UNIVAC 1100, y que probablemente contenían datos históricos de algunos sistemas que llevaba el Ministerio de Industria.
Al cabo de un año, mas o menos, de llegar yo, como resultado de un proceso de «downsizing«, el UNIVAC fué desmontado, y reemplazado por «sistemas abiertos», pero allí quedaron las cintas guardadas… cintas que no sólo no se podían leer, sino que incluso aunque encontrásemos la forma de leerlas (había empresas que se dedicaban a ello), simplemente no podríamos interpretar su contenido.
Así que la perdurabilidad de la información digital es una cuestión importante. Recuerdo también que, muchos años después, cuando se empezaba a cacharrear con la firma electrónica y los PKI, los documentalistas y los notarios plateaban una cuestión de durabilidad. En efecto, había documentos legales que tenían efectos por más de 50 años. Si hay que verificar la firma electrónica de un documento dentro de 50 años, ¿quién nos asegura que la empresa o entidad que gestiona la correspondiente PKI sigue existiendo entonces?.
Ya hemos dicho que existe una versión del formato PDF que está diseñada para la perdurabilidad (PDF/A), pero debemos añadir también una inteligente característica de este formato, y es que mantiene siempre la compatibilidad «hacia atrás», es decir, que cada nueva versión del formato, acompañada de una nueva versión del lector, permite ademas seguir leyendo todas las versiones anteriores.
De modo que hasta ahora tenemos dos cosas:
- Un formato digital, PDF (propietario), que se ha generalizado con el uso, ya que cumple muy bien una necesidad básica, la representación de la información física en el mundo digital de forma aceptable por los humanos.
- Una característica necesaria, la perdurabilidad, que en general escasea en el mundo digital.
Pero aún nos faltan otras tres cosas:
- La adición de características y funciones de garantía, en relación al contenido, en relación a la autoría del mismo y a posibles validaciones (firma digital), en relación al momento en que el documento ha sido firmado y por lo tanto cobra validez (sellado de tiempo), y en relación a que todo esto pueda comprobarse en el futuro aunque las fuentes externas de prueba ya no estén disponibles (autocontenido).
- Un estándar formal y abierto, que nos otorgue conformidad e interoperabilidad en el uso.
- Un proceso de adopción oficial con valor legal por los organismos públicos que otorgue validez a todos los efectos de la información representada en este formato digital, y que regule y promueva la publicación oficial en este formato, incluso llegando a eliminar la tradicional publicación en papel.
Como os podéis imaginar, estos tres puntos están bastante relacionados entre sí. El proceso de generalización del uso del PDF y su adecuación a un conjunto de necesidades analógico-digitales se vió acompañado y reforzado con los procesos de estandarización, de los que algunos de los más importantes son:
- PDF/A-1, estandarizado como ISO 19005-1:2005, basado en un subconjunto de la especificación PDF 1.4 de Adobe
- PDF/A-2 y PDF/A-3 estandarizados posteriormente como ISO 19005-2:2011 e ISO 19005-3:2012 basados en ISO 32000-1:2008, a su vez apoyado en la especificación PDF 1.7 de Adobe
- PAdES (PDF Advanced Electronic Signatures), que es un conjunto de restricciones y extensiones de la ISO 32000-1 para adecuarla al uso de la firma electrónica avanzada en el marco de la Directiva UE 1999/93/EC. Este estándard ha sido publicado por ETSI (European Telecommunication Standards Institute) como TS 102 778.
En este punto, ya vemos los avances realizados en la evolución e integración del PDF con la firma electrónica y su estandarización, pero además ya vemos que comienza la plena eficacia legal de los documentos PDF firmados electrónicamente.
Así la adopción oficial ha ido avanzando, y según publicaba Adobe a modo de ejemplo, hay ya muchas organizaciones que establecen, recomiendan, o aceptan el formato PDF o PDF/A para el archivo a largo plazo de documentos digitales:
Organización | Standard | Aplicación |
U.S. Library of Congress | PDF/A | Recomienda |
U.S. National Archives and Records Administration (NARA) | PDF/A | Acepta |
European Commission (MoReq) | PDF/A | Recomienda |
German government (SAGA v4 ) | PDF/A | Recomienda |
French government | PDF/A | Recomienda |
Dutch government | PDF/A | Obliga |
National Archives of Sweden | PDF/A | Acepta |
Austrian National Library | PDF/A | Recomienda |
National Archives of Norway | PDF/A | Recomienda |
Organization for the Promotion of Automated Accounting | PDF/A | Recomienda |
Brazilian federal legislature | PDF/A | Obliga |
U.S. Courts | Obliga | |
Victoria, Australia, Public Record Office | Obliga | |
Italian government archiving standard | Acepta | |
Taiwan National Central Library | Recomienda |
Y por supuesto es obligado mencionar que la Guia Técnica del Esquema Nacional de Interoperabilidad del Catálogo de Estándares establece el estándard PAdES (ETSI TS 102 778-3) así como los formatos PDF y PDF/A como estandares en el Estado español.
En cuanto a la utilización con plenos efectos legales de documentos en formato PDF, habría infinidad de ejemplos, pero vamos a citar únicamente dos:
- El Boletín Oficial del Estado, que desde el 1 de enero de 2009 se publica en formato exclusivamente electrónico, en PDF/A firmado, con plena validez legal.
- La Edición Electrónica del Diario Oficial de la Unión Europea (e-OJ) , que desde el pasado 1 de julio de 2013
se publica con valor legal en formato PDF/A firmado, según la regulación (EU) 216/2013.
En definitiva, el «humilde» PDF, es una pieza clave en nuestro viaje desde el mundo físico al mundo digital, tanto por factores sicológicos como tecnológicos y legales.
Bueno, hasta aquí vamos a llegar por hoy. Hemos pasado de un artículo mas bien filosófico a otro un poco mas «próximo». ¿Cuál os ha gustado más?.
3 respuestas a «El PDF como puente entre el mundo físico y el mundo digital»
[…] importantes en la nueva Ley de Propiedad Intelectual en España (What’s new). – El PDF como puente entre el mundo físico y el mundo digital (eFuncionario). – Ebook para descargar : Los componentes estructurales del nuevo ecosistema del libro : editores […]
Una exposición clara y razonada que comparto. Ya en su día (tres años ha) también abogaba yo por el uso del PDF en «Los formatos de firma no existen, son los PAdES» (http://goo.gl/k5AIx0), del blog de isigma.
Esta genial el articulo. La cuestión de la perdurabilidad de los formatos digitales siempre me ha parecido inquietante, y ya no solo en el terreno de la administracion sino tambien en el personal, antes una persona se hacia 300 fotos en su vida, las revelaba y las conservaba, ahora nos hacemos miles de fotos al año pero un simple error de disco duro se lleva por delante toda una vida de recuerdos.