Cette comparaison a pour objectif de définir les points de divergence entre ODF et Open XML concernant leurs implémentations potentielles.
Nous commencerons par étudier les définitions des formats ainsi que les objectifs donnés, puis nous étudierons cinq points clés ayant été retenus pour comparer les deux spécifications :
- Clarté de la présentation
- Nommage des balises
- Dépendance par rapport aux plateformes d’origine
- Position par rapport aux standards existants
- Ouverture et scénarios d’intégration métier
Définition du format Open XML dans la spécification
“to provide XML schemas, collectively called Office Open XML, which define the XML vocabularies for word-processing, spreadsheet, and presentation documents, as well as the packaging of documents that conform to these schemas.”
La spécification d’Open XML a pour objectif de définir des schémas XML, standards permettant de décrire la structure d'un document XML, définissant le vocabulaire XML nécessaire à la description de documents texte, de feuilles de calculs et de présentations, ainsi que tout autre document conforme à ces schémas.
Objectif
“to enable the implementation of the Office Open XML formats by the widest set of tools and platforms, fostering interoperability across office productivity applications and line-of-business systems, as well as to support and strengthen document archival and preservation, all in a way that is fully compatible with the large existing investments in Microsoft Office documents.”
L’utilisation de ces schémas rend possible l’implémentation d’Open XML sur un large nombre de plateformes et d’outils, favorisant l’interopérabilité entre les applications bureautiques et les systèmes line-of-business. Elle rend possible et renforce également l’archivage des documents et leur préservation, tout en restant compatible avec les anciens formats de la suite Microsoft Office.
Des applications spécifiques, des scénarios précis d’utilisation du format ne sont pas prédéfinis dans les spécifications, les auteurs considérant la définition des applications comme un frein à l’innovation. Cette position sera justifiée dans la suite du document.
Définition du format ODF dans la spécification
“The schema is suitable for office documents, including text documents, spreadsheets, charts and graphical documents like drawings or presentations, but is not restricted to these kinds of documents.”
“The schema provides for high-level information suitable for editing documents. It defines suitable XML structures for office documents and is friendly to transformations using XSLT or similar XML-based tools.”
Le schéma ODF est approprié pour la définition de documents bureautiques, à savoir de documents texte, de feuilles de calcul, de tableaux et graphiques comme des dessins ou présentations, mais n’est pas limité à ce type de documents. Il fournit les informations de haut niveau nécessaires à l’édition et est compatible avec l’utilisation d’outils de transformation comme XSLT.
Objectif
Les objectifs de la conception d’un tel format, bien que certains soient évidents, ne sont pas mentionnés.
Critère de comparaison 1 : Clarté de la présentation
Pour évaluer ce critère, nous avons d’abord comparé les structures des spécifications des deux formats.
Tout d’abord, on remarque la différence de nombre de pages entre les deux spécifications. En effet, la différence est flagrante : 738 pages pour ODF contre 6045 pour Open XML soit 8 fois plus pour le dernier format.
Il peut y avoir plusieurs raisons à la différence du nombre de pages :
Les spécifications sont plus/moins complètes,
Les spécifications sont plus/moins claires,
Un des formats est plus complet que l’autre.
En comparant les deux spécifications, on peut remarquer une différence notable au niveau de la structure de leurs tables des matières. En effet, celle d’Open XML se décompose essentiellement en 4 parties :
WordProcessingML Orienté Word
SpreadsheetML Orienté Excel
PresentationML Orienté PowerPoint
DrawingML Dessin Vectoriel – Commun
Pour les trois premiers, la plupart des éléments du langage sont redéfinis : les styles, les tables, etc…
Au contraire, les spécifications d’ODF n’adoptent pas ce schéma, elles ne se décomposent pas avec une orientation pour chaque application d’OpenOffice.org.
Celles d’ODF définissent le style, les tables, et tous les éléments du langage pour toutes les applications d’OpenOffice.org. Eventuellement, on trouve des exemples d’application pour un outil d’OpenOffice.org particulier.
C’est une approche différente. Celle d’Open XML a pour avantage de détailler plus spécifiquement le langage pour chaque application de Microsoft Office ce qui permet d’expliquer en partie la différence du nombre de pages entre les deux spécifications. L’avantage pour celle d’ODF serait que ses spécifications sont moins liées à sa suite bureautique originelle (partie qui sera développée par la suite).
Pour conclure, nous pouvons dire que les spécifications d’Open XML sont plus claires, plus précises, plus complètes, plus spécifiques à chaque application de Microsoft Office, sont dotées de plus d’exemples, et enfin elles redéfinissent tout.
Critère de comparaison 2 : Nommage des balises
Afin de comparer les balises utilisées dans chaque spécification, des fichiers élémentaires contenant un texte court : « Hello world » ont été créés avec les suites bureautiques utilisant ces spécifications pour leurs formats de fichiers, OpenOffice.org pour ODF (fichiers odt), Microsoft Office 2007 pour Open XML (fichiers docx).
Nous remarquons dans Open XML l’utilisation d’abréviations et dans ODF l’utilisation de noms complets, évoquant de façon directe la fonction remplie par la balise. Chaque approche a ses avantages et inconvénients. Les fichiers ODF seront plus faciles à comprendre pour un utilisateur peu expérimenté. L'utilisation d'abréviations dans Open XML améliore les performances en lecture et écriture des fichiers.
Critère de comparaison 3 : Dépendance par rapport aux plateformes d’origine
Le format Open XML a été conçu avec la contrainte d’être rétro-compatible avec les anciens formats produits par les suites Microsoft Office antérieures à la suite Office 2007, dans laquelle est implémenté Open XML. Il ne faut pas confondre rétrocompatibilité et convertibilité. La rétrocompatibilité implique la restitution complète des données.
La rétrocompatibilité peut donc être vue à la fois comme un atout et comme un handicap. C’est un atout dans la mesure où le nombre de documents produits par la suite Office est très important, il est donc capital de pouvoir conserver ces documents. C’est un handicap dans le sens où les spécifications contiennent soit des éléments redondants soit des erreurs pour être rétro-compatible.
En revanche, ODF n’a pas été développé avec un tel souci. En effet, les développeurs ont fait le choix de passer à la technologie XML directement, sans transition avec leurs anciens formats binaires. Le format ne contient donc pas d’éléments inhérents à un logiciel spécifique et par conséquent les erreurs n’ont pas été reproduites dans le nouveau format.
De ce point de vue, ODF apparaît moins dépendant, donc plus ouvert à d’autres applications que la suite OpenOffice.org. Cette indépendance est aussi être expliquée par le fait que le nombre de fichiers au format précédant ODF, binaire, est de loin inférieur aux milliards de documents produits par la suite de Microsoft.
Critère de comparaison 4 : Position par rapport aux standards existants
Dans cette partie, nous allons essayer de savoir pourquoi dans les spécifications d’ODF certains standards sont réutilisés et dans Open XML entièrement redéfini. Nous allons prendre les exemples de MathML (formule mathématique) et SVG (images vectorielles).
MathML
Nous avons travaillé directement sur les spécifications des deux formats ainsi qu’avec les avis de Brian Jones (Program Manager Office chez MS Corp) pour Open XML et ceux de Thierry Stoehr (Président de l’Association Francophones des Utilisateurs de Linux et des Logiciels libres) pour ODF. Nous pouvons donc conclure qu’ODF utilise donc MathML qui est une recommandation du W3c mais qui n’est pas un standard ISO de plus la majeur partie des mathématises utilisent LateX. L’utilisation de MathML ne serait donc pas le meilleur choix afin de satisfaire les utilisateurs bien que certain l’utilise. On peut donc penser que le choix de ne pas implémenter MathML dans Open XML fut judicieux toutefois l’argumentation de ce point de vue est assez difficile a expliquer comme le montre les diverses réactions des adeptes de ODF.
Images
Au vu des spécifications des deux formats et du complément d’information de Bernard Ourghanlian, Chief Technology & Security Officer de Microsoft France, nous pouvons dire que la réutilisation du standard (W3c) SVG est une bonne chose car son design a déjà été approuvé mais dans le cas d’ODF, l’implémentation n’est pas parfaite, des lacunes persistes.
Cependant, ODF étend SVG pour avoir toutes les fonctionnalités nécessaires.
Pour ce qui est d’Open XML, le souci de perfection de la compatibilité des fonctions déjà existantes est une bonne chose. Sachant qu’aucune application n’a pour le moment implémenté complètement ce standard (SVG) et que ce n’est pas un standard ISO, ce n’est pas un défaut de ne pas l’utiliser dans Open XML.
Critère de comparaison 5 : Ouverture et schémas d’intégration métierL’intégration métier consiste en l’utilisation de données stockées dans les bases de données pour produire des documents de type feuille de calculs d’abord, et ensuite de type traitement de texte comme le montre le schéma ci-dessous. L’inverse est possible également, les données des documents peuvent servir à alimenter les bases de données. On parle ici d’interopérabilité verticale, car les échanges se font verticalement, par métier, comme l’illustre le schéma ci-dessous.

Interopérabilité verticale
Etant donné la place de plus en plus prépondérante des fichiers dans les systèmes d’information des entreprises, les schémas d’intégration métier sont une innovation à très fort potentiel. Il est donc essentiel de bien comprendre où réside cette innovation. En effet, elle ne réside ni dans l’utilisation des métadonnées, ni dans l’ajout de schémas XML personnalisés à l’intérieur des fichiers décrivant la partie traitement de texte ou feuille de calcul d’un document. Elle réside dans la possibilité de l’ajout direct de document de n’importe quel type, bien que XML soit privilégié vu sa transparence, à l’intérieur de la structure du document Open XML. Cette possibilité est permise par les Open Packaging Conventions.
Le format ODF ne possède pas de conventions ouvertes comme les OPC pour décrire la structure des fichiers. Ce type d’application n’est donc pas possible. L’intégration métier est malgré tout possible, au sens où l’entendent les partisans d’ODF, mais se limite à l’utilisation des métadonnées ou à l’ajout de schémas personnalisés au sein de fichiers déjà existants dans la structure. Cependant, cette intégration est plus difficile, et les cas d’utilisation d’intégration métier avec ODF sont très rares.
Du point de vue de la personnalisation, Open XML a de l’avance. En plus d’utiliser des conventions standardisées, le format a des spécifications plus complètes, et est donc plus à même de satisfaire des besoins précis des utilisateurs.
Conclusion
La comparaison des spécifications a eu pour objectif de déterminer des points de comparaison objectifs entre les deux spécifications d’ODF et d’Open XML. Chaque format, bien qu’avec des objectifs similaires d’ouverture et de création de documents bureautiques, a été conçu de façon différente et sous des contraintes différentes.
Notamment, deux points en particulier sont critiques, comme la dépendance par rapport aux plateformes d’origine. En effet, la reproduction d’erreurs au sein du standard Open XML est un point très controversé, mais la rétrocompatibilité est saluée par les utilisateurs, qui peuvent conserver leurs anciens documents de la suite Office.
La réutilisation des standards est un point également où deux choix différents ont été faits et où le débat continue. Les deux approches sont légitimes. Pour Open XML, le choix a été fait de ne pas réutiliser certains standards existants et de redéfinir de meilleurs schémas XML, tandis qu’ODF reprend simplement les standards et fait le choix de ne pas multiplier les standards pour un cas d’utilisation donné, comme le montre le cas de la représentation des formules mathématiques.
Il ressort de cette étude que les spécifications du format Open XML ont plusieurs avantages comparées à celles d’ODF : la clarté de la présentation, la forte documentation en exemples et cas d’utilisations, et l’ouverture des conventions permettant des schémas d’intégration métier intéressants pour les entreprises et les éditeurs logiciels.