Présentation des formats de fichiers binaires Office (traduction automatique)

Important

Cet article a été traduit automatiquement, voir l’avertissement. Vous pouvez consulter la version en anglais de cet article ici.

Résumé : Découvrez les formats de fichiers binaires utilisés dans les produits Microsoft Office des versions actuelles ou précédentes, la façon de s’en servir, leurs structures de base, ainsi que les concepts fondamentaux pour interagir sur ces formats par programmation.

Dernière modification : lundi 9 mars 2015

S’applique à : Excel 2010 | Office 2007 | Office 2010 | Office client | Open XML | PowerPoint 2010 | SharePoint Server 2010 | VBA | Word 2010

Dans cet article
Quelles sont les fichiers binaires de Formats ?
Quelles sont les Versions de fichiers de Format de fichier binaire Microsoft Office utilisation ?
Affichage de contenu dans les fichiers de Format–Based de fichier binaire Microsoft Office
Conclusion
Ressources supplémentaires

**S'applique à:**Microsoft Word | Microsoft PowerPoint | Microsoft Excel | Microsoft Outlook

Publication :   Février 2011

Fournie par :  Microsoft Corporation

Sommaire

  • Quelles sont les fichiers binaires de Formats ?

  • Quelles sont les Versions de fichiers de Format de fichier binaire Microsoft Office utilisation ?

  • Affichage de contenu dans les fichiers de Format–Based de fichier binaire Microsoft Office

  • Création des visionneuses de Format de fichier binaire personnalisé

  • Modification des fichiers de Format–Based de fichier binaire Office

  • Conclusion

  • Ressources supplémentaires

Cet article est le premier d'une série d'articles qui présentent les formats de fichier binaire utilisés par les produits de Microsoft Office. Ce premier article fournit une vue d'ensemble de la façon de travailler avec les formats de fichier binaire Microsoft Office en général et explique certaines des caractéristiques structurelles communes et les concepts clés qui sont communs à différents formats. Les autres articles de la série plus détaillées sur les formats de fichiers individuels. Ces articles sont conçus pour être utilisé en conjonction avec le Office File Format Documents disponible sur MSDN.

Cette série de l'article concerne uniquement les quatre produits de Microsoft Office de base : Microsoft Word, Microsoft PowerPoint, Microsoft Excel et Microsoft Outlook.

Quelles sont les fichiers binaires de Formats ?

Un format de fichier binaire est n'importe quel format de fichier qui contient principalement des données binaires. Cela inclut les programmes compilés, images, supports et plus les fichiers compressés et les fichiers peuvent contenir des informations textuelles mais sont stockés sous forme de données binaires. Les formats de fichier binaire utilisés par les produits Microsoft Office tenir dans cette dernière catégorie. Formats de fichier binaire non peuvent inclure le texte (.txt), .html, .xml et leurs dérivés et interprété les scripts et fichiers de code source.

Toutes les données de fichier dans des formats de fichier binaire Microsoft Office existe dans un ou plusieurs flux. Chaque flux contient des structures de données pour stocker les métadonnées, telles que les informations utilisateur et système et les propriétés de fichier, les informations de mise en forme, contenu de texte et contenu multimédia. Ces structures de données sont exprimées en tant que groupes de nombres hexadécimaux interprète le programme ordinateur hôte et qui présente par le biais de son interface utilisateur.

Pendant ce temps, l'organisation des structures de données varie au sein d'un flux de données. L'unité la plus courante de données est un enregistrement. Un enregistrement contient généralement des métadonnées sur le fichier sous forme de champs et des indicateurs. Cela inclut une ou plusieurs valeurs de décalage pour indiquer l'emplacement des autres enregistrements pertinents ou d'autres données. Le texte est stocké en tant que valeurs numériques qui représentent des caractères ANSI ou Unicode. Les images peuvent être stockés comme des pointeurs vers des fichiers externes ou les images incorporées dans leurs propres formats de fichier binaire, tel que .gif, .jpeg ou .png dans le fichier. Contenu plus actif, telles que les transitions PowerPoint, sont marquées avec les informations nécessaires pour l'interprétation, telles que les propriétés de transition, et puis rendues par le programme ordinateur hôte.

Le fichier utilisé par Microsoft Word, Microsoft PowerPoint, Microsoft Excel et Microsoft Outlook sont tous décrits, de manière exhaustive, dans la bibliothèque MSDN à l'emplacement suivant : Open Specifications/Data Portability/Microsoft Office File Formats/Microsoft Office File Format Documents. À partir de là, vous pouvez ouvrir la spécification complète du format de fichier, soit directement sur le site MSDN, soit comme un fichier .pdf.

Quelles sont les Versions de fichiers de Format de fichier binaire Microsoft Office utilisation ?

Les formats de fichier binaire Microsoft Office abordés dans cet article sont principalement utilisés par Microsoft Outlook, Microsoft Excel et les versions précédentes de Microsoft Word et Microsoft PowerPoint. Microsoft Office Word 2007 et Office PowerPoint 2007 utilisent des formats de fichier XML comme leur format de fichier par défaut et Microsoft Excel 2010 utilise un format binaire plus récent. Le tableau suivant montre le fichier binaire des fichiers de format qui s'appliquent aux versions spécifiques du Word, Excel, PowerPoint et Outlook.

Format de fichier

Version de l'application

MS-DOC

  • Microsoft Word 97

  • Microsoft Word 2000

  • Microsoft Word 2002

  • Microsoft Office Word 2003

MS-PPT

  • Microsoft PowerPoint 97

  • Microsoft PowerPoint 2000

  • Microsoft PowerPoint 2002

  • Microsoft Office PowerPoint 2003

MS-PST

  • Microsoft Outlook 2000

  • Microsoft Outlook 2002

  • Microsoft Office Outlook 2003

  • Microsoft Office Outlook 2007

  • Microsoft Outlook 2010

MS-XLS

  • Microsoft Excel 97

  • Microsoft Excel 2000

  • Microsoft Excel 2002

  • Microsoft Office Excel 2003

MS-XLSB

  • Microsoft Office Excel 2007 ;

les fichiers de format–based de fichier binaire Microsoft Office sont également utilisées par les sociétés qui utilisent des fichiers de Microsoft Office sans l'aide de l'application d'ordinateur hôte d'origine. Certaines des utilisations plus courantes en dehors de Microsoft incluent des outils de recherche entre documents personnalisés, récupération de données à partir des fichiers endommagés, ou de lecture et d'écriture pour la compatibilité avec d'autres applications.

Affichage de contenu dans les fichiers de Format–Based de fichier binaire Microsoft Office

De loin le moyen le plus simple pour afficher un fichier binaire Microsoft Office est le programme ordinateur hôte qui l'a créée. Par exemple, en utilisant Word pour afficher un fichier .doc ou PowerPoint pour afficher un fichier .ppt. Cette approche présente l'affichage de l'utilisateur du contenu, tels que le texte, mise en forme et l'état général de l'interface utilisateur.

Vous pouvez obtenir une image plus structurelle d'un fichier binaire à l'aide de l'outil visualiseur Office, offvis.exe. Le lien suivant vous permet de télécharger directement à partir du centre de téléchargement de cet outil : https://download.microsoft.com/download/1/2/7/127BA59A-4fe1-4acd-BA47-513CEEF85A85/OffVis.zip (éventuellement en anglais)lorsque vous chargez un fichier binaire Microsoft Office dans le visualiseur, vous voyez deux volets. Le volet de navigation affiche le contenu du fichier brut, avec chaque ligne indiquant l'offset actuel, une chaîne de nombres hexadécimaux et leur représentation de texte, le cas échéant. Le volet Résultats affiche les résultats de l'analyse sont constitués par le nom de la structure de données en cours, sa valeur, emplacement d'offset, taille et type. La capture d'écran suivante montre une partie d'un fichier .doc qui contient le texte « Hello, world » dans le visualiseur. La lettre « w » est sélectionnée. Ceci provoque le visualiseur mettre en évidence le nombre hexadécimal correspondant et la structure de données.

La figure 1. Rendu en offvis.exe de HelloWorld.doc

Visionneuse Office

Création des visionneuses de Format de fichier binaire personnalisé

Vous pouvez créer une visionneuse personnalisée, qui vous permet de cibler un contenu spécifique ou comme un moyen pour vous familiariser avec le format de fichier. Votre afficheur doit lire les données de flux, interprètent les structures qu'il contient et naviguer les décalages pour rechercher le texte et tout autre contenu que vous souhaitent afficher. Ces structures de données sont différentes pour chaque type de fichier, mais dans tous les cas, le processus est similaire.

Pour rechercher des contenus dans les fichiers basés sur le format de fichier binaire

  1. Lire le flux de fichier.

  2. Identifier la structure ou les structures peuvent contenir du contenu que vous recherchez.

  3. Dans la première structure, recherchez la valeur de décalage qui spécifie l'emplacement de la section suivante que vous recherchez.

  4. Accédez à la section dans le flux.

  5. Répétez les deux étapes précédentes jusqu'à ce que vous recherchez du contenu que vous voulez.

  6. Lire et analyser le contenu.

Selon vos besoins, cela peut prendre des lignes de moins d'une centaine de code pour un extracteur de texte simple à des millions de lignes pour émuler le programme ordinateur hôte d'origine.

Modification des fichiers de Format–Based de fichier binaire Office

En règle générale, vous devez jamais essayer de modifier directement un fichier binaire Microsoft Office. Utilisez plutôt une opération Enregistrer , qui est similaire à la façon dont vous envoyez un document à une imprimante. Lorsque vous imprimez un document Word par exemple, vous n'envoyez pas le fichier .doc entière à l'imprimante à restituer. Au lieu de cela, Word crée un instantané de votre document, mis en forme selon les spécifications de l'imprimante. L'imprimante peut avoir une logique d'interpréter les polices, mais toutes les informations de mise en page est traitée par l'application émettrice.

De même, lorsque vous enregistrez un fichier dans un format binaire, l'application ordinateur hôte se traduit par des données en mémoire dans le format binaire spécifié et crée le fichier. Si un fichier existe déjà avec le même nom, le nouveau fichier remplace.

Cette approche présente plusieurs avantages.

  • Votre application peut stocker et manipuler le contenu du fichier dans n'importe quel format que vous choisissez, qui est beaucoup plus facile que de travailler directement avec des données binaires.

  • En lisant le fichier binaire d'origine dans la mémoire qu'une seule fois et en conversion immédiatement des données dans une représentation interne, vous évitez recalculer plusieurs pointeurs vers différentes positions de décalage, qui peuvent changer avec chaque édition.

  • Une fois que votre application a une représentation interne du fichier en mémoire, il peut enregistrez ce fichier à n'importe quel format le prend en charge de l'application.

  • En utilisant une représentation interne partagée, votre application peut inclure une logique pour lire plusieurs formats de fichier et ensuite travailler avec eux de la même manière.

Ainsi, le processus de modification d'un fichier au format binaire dispose réellement les trois étapes.

Pour modifier un fichier basé sur le format de fichier binaire

  1. Lire le fichier dans une représentation interne.

  2. Modifier la représentation interne de votre application.

  3. Enregistrez la représentation au format binaire, avec le même nom de fichier et l'emplacement que le fichier source.

Conclusion

La compréhension et l'utilisation de formats de fichier binaire peuvent être un défi. Nous espérons que par l'apprentissage sur les structures de base et l'expérimentation de certaines procédures fournies dans cette série d'articles, vous serez fouiller dans des implémentations plus complexes avec rien de plus que la documentation des spécifications ouvertes et certains outils téléchargeables.

Ressources supplémentaires

Pour plus d’informations, consultez les ressources suivantes :

Notes

Avertissement traduction automatique : cet article a été traduit par un ordinateur, sans intervention humaine. Microsoft propose cette traduction automatique pour offrir aux personnes ne maîtrisant pas l’anglais l’accès au contenu relatif aux produits, services et technologies Microsoft. Comme cet article a été traduit automatiquement, il risque de contenir des erreurs de grammaire, de syntaxe ou de terminologie.