Open XML
Contrairement au format binaire des précédentes versions de Microsoft Office, ce nouveau format adopte le langage de stockage XML. Il permet aux développeurs de lire, créer, modifier, afficher sur différents médias des documents Microsoft Office, sans dépendre d'applications Microsoft, en utilisant des outils comme XSLT, SAX ou DOM, directement ou par l'intermédiaire de librairies Open XML qui ne devraient pas tarder à apparaître.
Structure interne d'un fichier Open XML
Les documents Open XML sont des fichiers compressés avec le format Zip. On peut donc visualiser leur contenu en les décompressant.

On remarque la présence de nombreux fichiers. Cet ensemble de fichier est appelé paquet (package). A l’intérieur de celui-ci, les fichiers sont appelés parties (parts). Ces fichiers sont répartis dans différents dossiers. La structure se distingue du format binaire dans la mesure où le format ZIP permet l'organisation de fichiers au sein d'un seul et même fichier ZIP.
La structure est modulaire, en effet les différents objets insérés dans le document se retrouvent dans le ZIP (les images, les graphiques, etc…), et les différentes informations liées au document (style, haut de page, pied de page, etc…) sont également réparties dans différents fichiers.
Les parties
Les parties qui composent un fichier Open XML peuvent être de deux catégories :
1 - Les données (texte, images, sons, vidéos, etc.) qui constituent le document lui-même. Ces parties peuvent contenir des données définis dans Open XML (du WordprocessingML par exemple), d'autres données XML dont le schéma ne fait pas partie des spécifications Open XML, des données binaires (objets OLE, images JPEG ou PNG, des vidéos AVI, etc.), du texte simple...
2 - Les données concernant la structure interne du paquet, notamment le type de contenu des autres parties, et les liens logiques qu'elles ont entre elles. Ces parties contiennent des données XML dont le schéma est défini par la norme Open XML (par les Open Packaging Conventions).
Les parties de la deuxième catégorie, qui contiennent les informations vont permettre de connaître précisément le rôle de chacune des autres parties du paquet, ainsi que les liens qui les unissent entre elles. Ces parties sont de deux types, le fichier des types de contenu et les fichiers de relations (relationships parts).
Les fichiers de relations permettent de retrouver toutes les données contenues dans la structure et d'y naviguer. Ils contiennent la description des liens entre les parties.
Ces deux types de fichiers sont les clés de l'accès aux données du document Open XML. Ils vont permettre de recomposer le document dans son intégralité.

Structure interne d'un fichier ODF
Un document ODF est un fichier compressé au format ZIP qui contient une collection de différents fichiers XML et « binaires » comme les images par exemple. Tout comme Open XML, l'utilisation du format XML rend l'accès au contenu du document et sa transformation très facile car un simple éditeur de texte suffit à le modifier. La compression ZIP permet d'obtenir des fichiers de taille réduite, optimisant ainsi l'espace nécessaire au stockage ou à la transmission des documents sur les réseaux.
L'organisation des fichiers XML est commune à tous les types d'applications intégrant le standard ODF qui, de plus, partagent les mêmes définitions d'éléments tels que tableaux, cellules, paragraphes, ...
Dans les deux cas, la structure des fichiers est basée sur le même principe : l’archivage au format ZIP de packages contenant des fichiers XML décrivant le contenu et son organisation.