Einführung in die Microsoft Office (2007) Open XML-Dateiformate

Veröffentlicht: 04. Jul 2006

Von Frank Rice

Hier finden Sie Informationen zu den Vorteilen der Microsoft Office (2007) Open XML-Formate. Benutzer können Daten zwischen Office-Anwendungen und Unternehmenssystemen mithilfe von XML- und ZIP-Technologien austauschen. Dokumente sind allgemein verfügbar. Gleichzeitig wird das Risiko hinsichtlich beschädigter Dateien verringert. Dieser Artikel enthält auch Links zu englischsprachigen Seiten.

Auf dieser Seite

Einführung Einführung
Szenarios für neue Dateiformate Szenarios für neue Dateiformate
Vorteile der neuen Dateiformate Vorteile der neuen Dateiformate
Glossar für Open XML-Formate Glossar für Open XML-Formate
Struktur der Office XML-Formate Struktur der Office XML-Formate
Entwickeln von Lösungen mit den Office XML-Formaten Entwickeln von Lösungen mit den Office XML-Formaten
Verwenden der neuen Dateiformate in Office-Produkten Verwenden der neuen Dateiformate in Office-Produkten
Ändern von Office XML-Formatdateien zum Anpassen der Multifunktionsleisten-Benutzeroberfläche Ändern von Office XML-Formatdateien zum Anpassen der Multifunktionsleisten-Benutzeroberfläche
Schlussbemerkung Schlussbemerkung
Weitere Ressourcen Weitere Ressourcen

Einführung

Nach der Einführung von XML in den 90er Jahren erkannten Unternehmenskunden im IT-Bereich mit der Zeit die geschäftlichen Vorteile, die der Einsatz von offenen Formaten und Standardisierung bei wichtigen Computerprodukten und -anwendungen mit sich bringt. IT-Fachleute konnten die Vorteile des durch XML möglichen allgemeinen Datenformats nutzen, da XML von Anwendungen und Internetbrowsern gelesen und auf verschiedenen Plattformen interpretiert werden kann.

Dementsprechend erkannten Entwickler nach der Einführung von XML-Unterstützung in Microsoft Office 2000 die Notwendigkeit, von den binären Dateiformaten in vorherigen Versionen von Microsoft Office zum XML-Format überzugehen. Binärdateien (DOC-, DOT-, XLS- und PPT-Dateien), die über Jahre gute Arbeit zum Speichern und Übertragen von Daten geleistet haben, waren nicht mehr für die neuen Herausforderungen am Arbeitsplatz geeignet, z. B. das einfache Verschieben von Daten zwischen verschiedenen Anwendungen und die Möglichkeit für Benutzer, Geschäftsinformationen aus den Daten zu entnehmen.

In Microsoft Office 2007 wird dieser Übergang mit der Einführung eines XML-basierten Dateiformats für Microsoft Office Excel 2007, Microsoft Office Word 2007 und Microsoft Office PowerPoint 2007 fortgesetzt. Das neue Dateiformat mit der Bezeichnung Microsoft Office Open XML-Formate (Office XML-Formate) begegnet diesen Herausforderungen mit Änderungen, die Ihnen einen neuen Ansatz für Lösungen auf der Grundlage von Microsoft Office-Dokumenten bieten.

Durch die neuen Dateiformate werden Datei- und Datenverwaltung, Datenwiederherstellung und Interoperabilität mit Geschäftssystemen verbessert. Die Verwendungsmöglichkeiten werden im Vergleich zu den Binärdateien in vorherigen Versionen erweitert. Jede Anwendung, in der XML unterstützt wird, kann auf Daten im neuen Dateiformat zugreifen und diese verarbeiten. Die Anwendung muss nicht Teil des Microsoft Office-Systems und nicht einmal ein Microsoft-Produkt sein. Benutzer können mit Standardtransformationen Daten extrahieren oder für andere Zwecke verwenden. Weiterhin werden Sicherheitsrisiken drastisch vermindert, da die Informationen als XML gespeichert werden, das im Wesentlichen nur Text enthält. Die Daten können daher ungehindert durch Firewalls von Unternehmen übertragen werden.

Hinweis   Verwechseln Sie die Office XML-Formate nicht mit XPS (Microsoft Windows XML Paper Specification). In den Office XML-Formaten werden die Open Packaging Conventions (in englischer Sprache) verwendet, die von XML Paper Specification (XPS) (in englischer Sprache) ebenfalls verwendet werden. Die Formate weisen jedoch einige wichtige Unterschiede auf. XPS ist ein festes Seitenformat, das für das Microsoft Windows Vista-Betriebssystem eingeführt wurde. Office XML-Formate sind vollständig bearbeitbare Dateiformate für Office Word 2007, Office Excel 2007 und Office PowerPoint 2007. Obwohl die beiden Formate hinsichtlich der Verwendung von XML und ZIP-Komprimierung Ähnlichkeiten aufweisen, unterscheiden sie sich in der Dateiformatstruktur und im Verwendungszweck.

 

Szenarios für neue Dateiformate

Die Office XML-Formate bieten Kunden neue Möglichkeiten zum Arbeiten mit Daten. Betrachten Sie einige der folgenden Szenarios, die nun mithilfe der neuen Dateiformate möglich sind:

  • Ein serverseitiger Prozess kann eines der Elemente in einem ZIP-Archiv lesen, ohne dass alle Elemente extrahiert werden müssen. Sie können beispielsweise die XML-Datei mit den Daten des Dokuments einzeln extrahieren, ohne dabei die Dateien zu öffnen, die Formatierung, Eigenschaften und andere Nebeninformationen des Dokuments enthalten.

  • In den meisten Szenarios ist der neue Dateicontainer für den Benutzer transparent. Er sieht wie eine übliche binäre Dokumentdatei aus. Das Dokument im neuen XML-Format ist jedoch komprimiert und kleiner. Dies vereinfacht das Senden des Dokuments an andere Benutzer per E-Mail oder über ein anderes Medium.

  • Virusscanner und Serveranwendungen können den Container einfach extrahieren, um die benötigten Elemente direkt anzuzeigen, ohne Risiko einer Beschädigung des Containers oder des Inhalts.

  • Im neuen Dateiformat gespeicherte Dateien können keinen ausführbaren Makrocode enthalten. (Dies trifft nicht auf Dateien mit aktivierten Makros zu, die an anderer Stelle in diesem Artikel erläutert werden.) Sie werden daher als "sicher" eingestuft und können ohne Sicherheitsrisiko durch Firewalls übertragen und mit E-Mail-Anwendungen gesendet werden. Dieses Verhalten wird von den Microsoft Office-Anwendungen erzwungen. Wenn einem Dokument im Office XML-Format ein Makro hinzugefügt wird, verhindert Office das Öffnen dieses Dokuments.

    Hinweis   Mit einigen ZIP-Anwendungen können Sie verschlüsselte Dateien erstellen. Durch das neue Dateiformat werden keine verschlüsselten Dateien erstellt. Beim Versuch, eine verschlüsselte Datei zu lesen, wird der Lesevorgang abgebrochen und ein Fehler zurückgegeben.

  • Wenn ein Element im Container beschädigt ist, sind die anderen Elemente weiterhin verfügbar. Wenn ein Benutzer beispielsweise versucht, eine auf einem beschädigten Datenträger erstellte und damit fehlerhafte Datei zu öffnen, wird das Hauptverzeichnis vom Office-Dateiwiederherstellungsmechanismus neu erstellt und der Inhalt der Datei vollständig wiederhergestellt.

  • Office-Entwickler können mit den Microsoft WinFX Application Programming Interfaces (APIs) gültige XPS-Dateien erstellen. Diese APIs werden von Lösungen zum Interagieren mit dem Inhalt des neuen Dateiformats verwendet. Weiterhin können Office-Entwickler mithilfe der APIs ZIP-Archive öffnen, die mit einer anderen ZIP-Anwendung erstellt wurden, vorausgesetzt es werden keine ZIP-Funktionen verwendet, die nicht in Office unterstützt werden.

    Hinweis   In Microsoft Office werden Dateien gemäß den offengelegten Paketerstellungskonventionen erstellt, die von den WinFX-APIs gelesen werden können. Dementsprechend können Sie mit WinFX Pakete erstellen, die in Microsoft Office-Anwendungen geöffnet werden können. Die WinFX-APIs funktionieren unter vorherigen Versionen von Microsoft Windows, einschließlich: Microsoft Windows Vista, Microsoft Windows Server 2003 und Microsoft Windows XP. Zusätzlich sind Konverter für Microsoft Office 2000, Microsoft Office XP und Microsoft Office 2003 Editions verfügbar.

Das neue Dateiformat hat gleichzeitig Auswirkungen auf den Umgang mit Office-Anwendungen, die Benutzer zur täglichen Arbeit verwenden. In den folgenden Szenarios wird beschrieben, wie das neue Format die Arbeit mit der Office 2007-Ausgabe vereinfacht:

  • Der neugierige Benutzer Heiko bemerkt, dass der neue Dateicontainer in der Office 2007-Ausgabe eine ZIP-Datei ist. Heiko möchte dies überprüfen. Er öffnet daher ein in Word 2007 erstelltes Dokument mit einer ZIP-Anwendung. Es werden einige Dateien angezeigt, die wie der Inhalt eines XML-Dokuments aussehen, sowie einige Bilder, die denjenigen im Originaldokument entsprechen. Fasziniert öffnet Heiko eine der XML-Dateien im Editor, um die von Word erstellte XML-Datei zu untersuchen. Zufrieden mit der Feststellung, wie einfach das Anzeigen des Dokumenteninhalts ist, schließt er den Editor und die ZIP-Anwendung und öffnet die Datei wieder mit Word, um am Dokument weiterzuarbeiten.

  • Tanja möchte eine Dokumenteigenschaft eines Word 2007-Dokuments ändern. Sie öffnet die neue Formatdatei mit einer ZIP-Anwendung, extrahiert das XML-Element mit den Dokumenteigenschaften, nimmt die Änderung vor und fügt das Element wieder in den Container ein. Anschließend speichert und schließt sie den Container. Tanja öffnet das Dokument dann in Word. Der gesamte Inhalt ist weiterhin vorhanden, und die einzige Änderung besteht aus der von Tanja bearbeiteten Eigenschaft.

  • Das Logo eines Beratungsunternehmens wurde geändert, um die neuen Ziele des Unternehmens widerzuspiegeln. Der IT-Bereich erhält den Auftrag, das Logo in Tausenden auf einem Server gespeicherten Dokumenten zu ändern. In vorherigen Versionen von Microsoft Office war es entweder erforderlich, alle Dokumente einzeln zu öffnen, das alte Logo zu löschen und das neue einzufügen, oder zum Automatisieren der Aufgabe eine komplizierte, kundenspezifische Anwendung zu entwickeln und zu testen. Auf Basis des neuen Dateiformats wird vom IT-Bereich ein Batchprozess erstellt, der die Dateistruktur nach der Grafik im Medienordner (identisch für alle Dokumente) durchsucht und diese durch das neue Logo ersetzt. Beim Öffnen eines Dokuments wird nun automatisch das neue Logo angezeigt.

  • Eine Anwaltskanzlei muss die Vertraulichkeit der Kunden- und der eigenen Firmendaten schützen. Durch die üblichen Verfahren ist der Firma bekannt, dass in Dokumenten, einschließlich der in Word erstellten, verschiedene sichtbare und versteckte Eigenschaften gespeichert werden. Einige dieser Eigenschaften können vertrauliche Kundeninformationen oder proprietäre Informationen des Unternehmens enthalten. Durch systematisches Probieren hat die Firma eine Vorgehensweise zum Entfernen dieser Informationen entwickelt. Der Vorgang ist jedoch zeitaufwendig und anfällig für Fehler, da der Benutzer die Vorgehensweise genau befolgen muss.. Auf Basis des neuen Dateiformats wird daher vom IT-Bereich ein einfacher Batchprozess entwickelt, der die Verzeichnisstruktur durchsucht und die Zielkomponenten aus den Paketen entfernt. Das Unternehmen kann sich nun darauf verlassen, dass alle vertraulichen und proprietären Informationen sicher aus den Dokumenten entfernt werden.

  • Karin nimmt letzte Änderungen an ihrer Magisterarbeit vor. Nachdem Sie den Literaturnachweis hinzugefügt hat, versucht Sie, das fertige Dokument zu speichern. Zu ihrem Entsetzen wird die Speicherung vorzeitig abgebrochen, und es wird eine Meldung angezeigt, dass das Dokument beschädigt zu sein scheint. Nachdem der erste Schreck vorbei ist, erinnert sich Karin daran, dass sie das neue Dateiformat verwendet. Sie importiert den Text in ein neues Dokument und fügt die Bilder sowie die Formatierungs- und Stilkomponenten wieder ein, um das Dokument erfolgreich wiederherzustellen. Anschließend speichert sie das neue Dokument.

  • Manuela verwendet Office 2000 unter Windows 2000 und hat den Konverter installiert, der zum Lieferumfang von Office 2007 gehört. Sie kann Dokumente im Word-XML-Format öffnen. Gleichzeitig kann sie das Dokument bearbeiten und anschließend im neuen Format speichern, da das Öffnen und Speichern von den Konvertern unterstützt wird.

 

Vorteile der neuen Dateiformate

Die neuen Office XML-Formaten bieten eine Reihe von Vorteilen, die nicht nur für Entwickler und deren erstellte Lösungen hilfreich sind, sondern ebenso für einzelne Benutzer und Organisationen jeder Größe.

Im Folgenden werden einige der besonderen Vorteile der Office XML-Formate erläutert:

  • Einfache Integration von Geschäftsinformationen in Dokumente Office XML-Formate ermöglichen das schnelle Erstellen von Dokumenten aus verschiedenen Datenquellen. Dies beschleunigt das Erstellen von Dokumenten, Data-Mining-Vorgänge und das Wiederverwenden von Inhalten. Der Austausch von Daten zwischen Office-Anwendungen und Unternehmenssystemen wird vereinfacht. Darüber hinaus können Sie Informationen in einem Office-Dokument ändern oder eine Komponente des Dokuments erstellen, ohne die Office-Anwendung zu verwenden. Mitarbeiter können ihre Produktivität durch schnelleres und genaueres Veröffentlichen, Suchen und Wiederverwenden von Informationen in beliebigen Anwendungen verbessern, solange in diesen das Lesen und Schreiben von XML unterstützt wird.

  • Offengelegt und gebührenfrei Die Office XML-Formate basieren auf XML- und ZIP-Technologien und sind daher frei verfügbar. Die Spezifikation für die Formate und Schemas wird unter der gleichen gebührenfreien Lizenz veröffentlicht und bereitgestellt, die heute bereits für die Microsoft Office 2003-Referenzschemas gilt und zur umfassenden Verwendung in der Industrie angeboten und bereitgestellt wird.

  • Interoperabilität Mit Standard-XML als Kernelement der Office XML-Formate wird der Austausch von Daten zwischen Microsoft Office-Anwendungen und Unternehmenssystemen vereinfacht. In Lösungen können mithilfe von Standardtools und -technologien zum Bearbeiten von XML Informationen innerhalb eines Office-Dokuments geändert oder neue Dokumente erstellt werden, ohne dass Zugriff auf die Office-Anwendungen erforderlich ist. Mit den neuen Formaten können Sie Dokumentarchive erstellen, ohne dabei Office-Code zu verwenden.

  • Stabilität Die Office XML-Formate sind robuster als binäre Formate und verringern daher das Risiko, Informationen aufgrund von beschädigten Dateien zu verlieren. Sogar für Dokumente, die außerhalb von Office erstellt oder geändert werden, ist die Wahrscheinlichkeit einer Beschädigung geringer, da die neuen Formate die Zuverlässigkeit der Dokumentwiederherstellung in Office-Anwendungen verbessern. Immer mehr Dokumente werden als E-Mail-Anlagen gesendet oder auf Wechselspeichermedien gespeichert. Das mögliche Auftreten eines Netzwerkfehlers oder Fehlers im Speichermedium erhöht die Wahrscheinlichkeit, dass ein Dokument beschädigt wird.

    Mit den neuen Dateiformaten wird die Datenwiederherstellung verbessert, indem die einzelnen Komponenten getrennt und separat im Dateipaket gespeichert werden. Dies kann es einem Unternehmen ermöglichen, beim Wiederherstellen verlorener Daten viel Geld und Zeit zu sparen. Wenn eine Dateikomponente beschädigt ist, kann der Rest der Datei weiterhin in der Anwendung geöffnet werden. Wenn beispielsweise ein Diagramm beschädigt ist, kann der Kunde die anderen Komponenten des Dokuments ohne das Diagramm weiterhin öffnen. Zusätzlich können diese Beschädigungen von Office-Anwendungen erkannt werden. Beim Öffnen des Dokuments wird dann versucht, das Dokument durch Wiederherstellen der ordnungsgemäßen Datenstruktur zu reparieren.

  • Effizienz Die Office XML-Formate verwenden ZIP- und Komprimierungstechnologien zum Speichern von Dokumenten. Ein bedeutender Vorteil der neuen Formate besteht aus wesentlich geringeren Dateigrößen, die bis zu 75 Prozent der Größe vergleichbarer binärer Dokumente betragen können. Dies ist einer der Vorteile des Speicherns von Dateien mit der Kombination aus XML- und ZIP-Technologien. Da XML ein textbasiertes und daher gut komprimierbares Format ist und der ZIP-Container das Komprimieren des Inhalts unterstützt, können Benutzer eine wesentliche Verringerung der Dateigrößen erzielen. Diese Art der Dateikomprimierung bietet Möglichkeiten zum Einsparen von Kosten, da weniger Festplattenspeicher zum Speichern von Dateien benötigt und die Bandbreite verringert wird, die zum Senden von Dateien per E-Mail, über Netzwerke oder im Internet erforderlich ist.

  • Sicherheit Die Offenlegung der Office XML-Formate bedeutet sicherere und transparentere Dateien. Dokumente können ohne Bedenken weitergegeben werden, da personenbezogene oder vertrauliche Informationen von Unternehmen, z. B. Benutzernamen, Kommentare und Dateipfade, einfach identifiziert und entfernt werden können. Gleichzeitig können Dateien mit Inhalten zur speziellen Verarbeitung (wie OLE-Objekte oder Microsoft Visual Basic für Applikationen-(VBA-)Code) identifiziert werden. Mit den Dateiformaten wird auch die Sicherheit hinsichtlich Dokumenten mit eingebettetem Code oder Makros verbessert. In der Standardeinstellung wird in den neuen Dateiformaten von Word 2007, Excel 2007 und PowerPoint 2007 eingebetteter Code nicht ausgeführt. Wenn also ein Benutzer eine E-Mail mit angehängtem Word-Dokument erhält, kann er den Anhang öffnen, ohne dass im Dokument schädlicher Code ausgeführt werden kann. Die Office XML-Formate enthalten ein besonderes Format mit einer besonderen Erweiterung für Dateien mit eingebettetem Code, sodass IT-Mitarbeiter schnell Dateien identifizieren können, die Code enthalten.

  • Abwärtskompatibilität Microsoft Office 2007 ist mit folgenden vorherigen Versionen abwärtskompatibel: Microsoft Office 2000, Microsoft Office XP und Microsoft Office 2003. Benutzer dieser Versionen können ohne großen Aufwand auf das neue Format umstellen und weiterhin den vollen Nutzen aus vorhandenen Dateien ziehen. Insbesondere können die älteren DOC-, XLS- und PPT-Binärformate weiter verwendet werden, da sie vollständig mit dem Office 2007-Dateiformat kompatibel sind. Benutzer früherer Office-Versionen können ein kostenloses Update herunterladen, um in vorherigen Versionen Dateien im neuen Format zu öffnen und zu speichern. Benutzer, die Office 2007 installieren, können die Standarddateiformate beliebig festlegen. Dies stellt sicher, dass Benutzer weiterhin Lösungen von Drittanbietern verwenden können, die auf vorherigen Versionen basieren, und mit Mitarbeitern, Zulieferern, Kunden und Anderen zusammenarbeiten können, die bereits aktualisiert haben.

 

Glossar für Open XML-Formate

In der folgenden Liste werden die in diesem Artikel und in verwandten Themen verwendeten Begriffe definiert:

  • API   Eine Reihe von Funktionen oder Methoden, die für den Zugriff auf Softwarefunktionalität verwendet werden. API ist ein Akronym für Application Programming Interface (Anwendungsprogrammierschnittstelle).

  • Konverter   Kostenlose Tools zum Öffnen von Dateien mit Office XML-Formaten in vorherigen Office-Versionen.

    Hinweis   Der Schutz durch die Verwaltung von Informationsrechten (Information Rights Management, IRM) wird von den Konvertern erkannt, berücksichtigt und auf Dokumente angewendet. Ein Dokument, das durch IRM geschützt ist, bleibt geschützt, unabhängig davon, ob der Empfänger Office 2007 oder eine vorherige Version verwendet.

  • Aufwärtskompatibilität   Die Möglichkeit, mit einer früheren Version einer Anwendung Dateien einer höheren Version zu öffnen und Features zu ignorieren, die in der früheren Version nicht implementiert sind. Z. B. ist Word 2003 aufwärtskompatibel mit Word 2007, da Word 2007-Dateien mit einem Konverter erfolgreich geöffnet werden können.

  • Office Open XML-Formate   Eine Struktur aus Bausteinen und Beziehungen, die zum Zusammenstellen, Verpacken, Verteilen und Darstellen dokumentbasierter Inhalte verwendet wird. Die Bausteine definieren einen plattformunabhängigen Rahmen für Dokumentformate, sodass Dokumente in Softwareanwendungen zuverlässig und konsistent erstellt, ausgetauscht und angezeigt werden können.

  • Paket   Der ZIP-Container, der die Komponenten des Dokuments enthält, wie in der Spezifikation Open Packaging Conventions (in englischer Sprache) festgelegt.

  • Komponente   Entspricht einer Datei im Paket. Wenn beispielsweise ein Benutzer mit der rechten Maustaste auf eine Excel 2007-Datei klickt und diese extrahieren möchte, werden Dateien angezeigt, wie z. B. eine workbook.xml-Datei und mehrere sheetn.xml-Dateien. Jede dieser Dateien ist eine Komponente im Paket.

  • Beziehungen   Die Methode, mit der festgelegt wird, wie die einzelnen Komponenten zu einem Dokument zusammengefügt werden. Diese Methode definiert die Verbindung zwischen einer Quellkomponente und einer Zielressource. Beziehungen werden innerhalb von XML-Komponenten im Dokumentpaket gespeichert (z. B. /_rels/.rels).

  • XML   XML (Extensible Markup Language) ist ein einfaches, vielseitiges Textformat, das zum digitalen Veröffentlichen und Austauschen eines breiten Spektrums an Daten im Internet und anderswo verwendet wird.

  • ZIP   Ein Format für komprimierte Archive nach Industriestandard, das zum Speichern von Dateien und zur Übertragung zwischen Computern, per E-Mail oder im Internet verwendet wird.

 

Struktur der Office XML-Formate

Der neue Dateicontainer baut auf der einfachen, komponentenbasierten und komprimierten ZIP-Dateiformatspezifikation auf. Kern der neuen Office XML-Formate ist die Verwendung von XML-Referenzschemas und eines ZIP-Containers. Jede Datei setzt sich aus einer Auflistung einer beliebigen Anzahl von Komponenten zusammen. Diese Auflistung definiert das Dokument.

Dokumentkomponenten werden mithilfe des ZIP-Formats in der Containerdatei bzw. dem Paket gespeichert. Bei den meisten Komponenten handelt es sich um XML-Dateien, die in der Containerdatei gespeicherte Anwendungsdaten, Metadaten und sogar Kundendaten beschreiben. Im Containerpaket können andere, nicht-XML-Komponenten vorhanden sein, einschließlich Komponenten wie Binärdateien, die im Dokument eingebettete Bilder oder OLE-Objekte darstellen. Zusätzlich werden durch Beziehungskomponenten die Beziehungen zwischen Komponenten festgelegt. Dieser Entwurf stellt die Struktur für Office-Dateien dar. Während sich der Inhalt der Datei aus Komponenten zusammensetzt, beschreiben die Beziehungen, wie die einzelnen Komponenten zusammenarbeiten.

Das Ergebnis sind XML-Dateiformate für Office-Dokumente, die umfassend integriert und zugleich modular und sehr vielseitig sind. In den nächsten Abschnitten werden die einzelnen Komponenten der Office XML-Formate ausführlich erläutert. Die Office-Anwendungen, in denen das neue Dateiformat verwendet wird, werden ebenfalls beschrieben.

Hinweis   Um die Zusammensetzung einer Datei mit Office XML-Formaten zu verstehen, sollten Sie eine Datei extrahieren. Zum Öffnen der Datei wird davon ausgegangen, dass auf dem Computer eine ZIP-Anwendung installiert ist, z. B. WinZip von WinZip Computing Corporation.

So öffnen Sie eine XML-Datei von Word 2007

  1. Erstellen Sie einen temporären Ordner, in dem die Datei und zugehörige Komponenten gespeichert werden.

  2. Speichern Sie ein Word 2007-Dokument als DOCX-Datei, das Text, Bilder und andere Elemente enthält.

  3. Fügen Sie am Ende des Dateinamens die Erweiterung ".zip" an.

  4. Doppelklicken Sie auf die Datei. Sie wird mit der Komprimierungsanwendung geöffnet. Die Einzelkomponenten, aus der die Datei besteht, werden angezeigt.

  5. Extrahieren Sie die Komponenten in den zuvor angelegten Ordner.

Komprimierung im ZIP-Format

Beim Erstellen eines Microsoft Office-Dokuments werden viele Elemente verwendet. Einige davon werden von allen Office-Anwendungen gemeinsam verwendet, zum Beispiel Dokumenteigenschaften, Stylesheets, Grafiken, Hyperlinks, Diagramme und Zeichnungen. Andere Elemente sind anwendungsspezifisch, wie zum Beispiel Arbeitsblätter in Excel, Folien in PowerPoint oder Kopf- und Fußzeilen in Word.

Wenn Benutzer ein Dokument in Office 2003 oder älteren Versionen von Microsoft Office speichern, wird eine einzige Datei auf den Datenträger geschrieben, die leicht geöffnet werden kann. Diese Darstellung ist wichtig für die Art und Weise, in der Dokumente in der Praxis gespeichert, verwaltet und freigegeben werden. Durch das Zusammenfassen der einzelnen Komponenten einer Datei von Microsoft Office 2007 in einem ZIP-Container bleibt ein Dokument eine einzelne Dateiinstanz. Da eine einzelne Paketdatei die Entität eines einzelnen Dokuments darstellt, können Benutzer Office 2007-Dateien genauso speichern und öffnen wie in früheren Versionen von Microsoft Office. Sie können weiterhin mit einer einzigen Datei arbeiten.

Der Dateicontainer in Version 2007
Abbildung 1: Der Dateicontainer in Version 2007

Bei früheren Office-Versionen mussten Entwickler zum Bearbeiten des Inhalts eines Office-Dokuments wissen, wie Daten gemäß der in der Binärdatei definierten, strukturierten Speicherung gelesen und geschrieben wurden. Dieser Vorgang ist kompliziert und aufwendig, insbesondere deshalb, weil die Formate von Office-Binärdateien für den primären Zugriff über Office-Anwendungen entwickelt wurden. Die Formate entsprachen den Strukturen im Arbeitsspeicher der Anwendungen und konnten auf Computern mit wenig Arbeitsspeicher und langsamen Festplatten verwendet werden. Zudem stellte sich das programmgesteuerte Ändern von Office-Binärdateien ohne Verwendung der Office-Anwendungen als Hauptgrund für beschädigte Dateien heraus. Dies hielt einige Entwickler sogar davon ab, auch nur zu versuchen, die Dateien zu ändern.

ZIP wurde als Paketformat für die Office XML-Formate gewählt, da dies ein allgemein bekannter Industriestandard ist. Heute stehen viele Tools zum Arbeiten mit dem ZIP-Format zur Verfügung, und die Verwendung dieses Formats bietet eine flexible, modulare Struktur, die eine weiterführende Erweiterung der Funktionalität ermöglicht. Daher haben Sie mit jedem bzw. jeder der zahlreichen Tools und Technologien, die für ZIP-Dateien nach dem Industriestandard verwendet werden können, Zugriff auf den vollständigen Inhalt von Microsoft Office 2007-Dokumenten. Nach dem Öffnen der Containerdatei kann jede Komponente des Dokuments im Paket bearbeitet werden, die das Dokument definiert. Sie können beispielsweise ein Word 2007-Dokument im Office XML-Format öffnen, die XML-Komponente suchen, die den Text des Word-Dokuments darstellt, und diese Komponente mithilfe einer Technologie ändern, die zur Bearbeitung von XML fähig ist. Anschließend können Sie die XML-Komponente wieder in das Containerpaket einfügen und so ein aktualisiertes Office-Dokument erstellen.

Komponenten

In einem Paket im Office XML-Format sind viele logische Komponenten der Datei als einzelne Dateien und Komponenten gespeichert. Diese Modularität ist eine wichtige Eigenschaft dieses Dateiformats. Aufgrund dieser Modularität können Sie eine spezielle Komponente schnell finden und genau diese direkt bearbeiten. Sie können Dokumentkomponenten je nach bevorzugtem Ergebnis bestimmter Geschäftsanforderungen bearbeiten, austauschen oder sogar entfernen.

Alle Office-Anwendungen verwenden einige Arten von Komponenten gemeinsam, wie beispielsweise Miniaturansichten, Metadaten, Medien und Beziehungen. Andere befinden sich als spezielle Komponenten konsistent in allen Dateien, z. B. Dokumenteigenschaften. Viele Komponenten gibt es jedoch nur in dem Dokumenttyp der Anwendung, die sie repräsentieren. Eine Arbeitsblattkomponente gibt es beispielsweise nur in einem Excel-Dokument, während eine Folienmaster-Komponente nur in einem PowerPoint-Dokument enthalten ist.

Es ist wichtig zu beachten, dass die tatsächliche Dateiverzeichnisstruktur, mit einigen wenigen in den Open Packaging Conventions (offengelegte Paketerstellungskonventionen) definierten Ausnahmen, willkürlich ist. Die Gültigkeit einer Datei wird durch die Beziehungen der Dateien zueinander im Paket festgelegt, nicht durch die Dateistruktur. Sie können die Anordnung und die Namen der Komponenten einer Datei im Office 2007-XML-Format innerhalb des zugehörigen ZIP-Containers ändern, vorausgesetzt, Sie aktualisieren die Beziehungen ordnungsgemäß, sodass sich die Komponenten des Dokuments weiterhin entsprechend des Entwurfs aufeinander beziehen. Wenn die Beziehungen stimmen, kann die Datei ohne Fehler geöffnet werden. Eine Datei im Office XML-Format erhält beim Erstellen zunächst die Standardstruktur. Anhand dieser Standardstruktur kann die Zusammensetzung von Dateien im Office XML-Format leicht festgestellt werden. Sie können diese Standardstruktur ändern, vorausgesetzt, Sie aktualisieren die Beziehungen entsprechend. Weitere Informationen dazu finden Sie unter Walkthrough: Word 2007 Open XML File Format (in englischer Sprache).

Komponenten können zu verschiedenen Inhaltstypen gehören. Komponenten, die Microsoft Office-Anwendungsdaten beschreiben, werden als XML gespeichert. Diese Komponenten entsprechen dem XML-Referenzschema, das das zugeordnete Office-Feature oder -objekt definiert. Beispielsweise sind die Daten in einer Excel 2007-Datei, die ein Arbeitsblatt darstellen, in einer XML-Komponente enthalten, die dem Office-Schema für ein Excel-Arbeitsblatt entspricht. Sind mehrere Arbeitsblätter in einer Arbeitsmappe enthalten, wird darüber hinaus für jedes Arbeitsblatt eine entsprechende XML-Komponente in der Paketdatei gespeichert. Alle Schemas, die Komponenten von Standard-Office-Dokumenten repräsentieren, werden von Microsoft vollständig dokumentiert und mit einer gebührenfreien Nutzungslizenz zur Verfügung gestellt. Die Kenntnisse über die Schemas ermöglichen das einfache Analysieren und Erstellen von Microsoft Office-Dokumenten durch beliebige XML-basierte Standardtechnologien.

In vielen Szenarios ist es von Vorteil, die Komponenten mit dem ursprünglichen Inhaltstyp zu speichern. Diese Komponenten werden nicht als XML gespeichert. In einem Office 2007-Dokument werden beispielsweise Bilder als Binärdateien (PNG, JPG oder ähnliche Dateitypen) im Dokumentpaket gespeichert. Daher können Sie den Paketcontainer mit einer ZIP-Anwendung öffnen und das Bild im ursprünglichen Format direkt anzeigen, bearbeiten oder austauschen. Im Vergleich zum XML-codierten Speichern des Bildes ist bei dieser Speichermethode nicht nur der Zugriff einfacher, sie benötigt auch weniger Verarbeitungsschritte und Festplattenspeicher. Weitere erwähnenswerte, binär gespeicherte Komponenten sind VBA-Projekte und eingebettete OLE-Objekte. (Eingebettete OLE-Objekte werden nur dann binär gespeichert, wenn der entsprechende OLE-Server lediglich eine binäre Version bereitstellt. Beispielsweise werden die Inhalte von eingebetteten Microsoft Office 2007-Dokumenten als weitere Pakete eingebettet.) Für Entwickler ist der einfache Zugriff in vielen Szenarios von Vorteil. Sie können beispielsweise eine Lösung erstellen, die eine Auflistung von Microsoft Office 2007-Dokumenten iteriert, um ein vorhandenes OLE-Objekt mit einer aktuelleren Version zu ersetzen. Eine solche Vorgehensweise und viele andere Szenarios werden möglich, ohne dass Office-Anwendungen verwendet oder die dokumentspezifischen XML-Strukturen geändert werden müssen. In den nächsten Abschnitten werden einige der Komponenten kurz beschrieben, die von allen Office-Produkten mit Unterstützung von Office XML-Formaten verwendet werden. Typen und Anzahl der Komponenten sind abhängig von der jeweiligen Anwendung, die eine ZIP-Containerdatei erstellt. In Word 2007 werden beispielsweise dokumentbezogene Komponenten erstellt, in PowerPoint 2007 jedoch Komponenten, die sich auf Folienpräsentationen beziehen.

_rels-Ordner
Dieser Ordner enthält eine RELS-Datei, in der die Basisbeziehungen innerhalb des Pakets definiert werden. Diese Datei ist der Ausgangspunkt zum Analysieren des Pakets.

RELS-Datei
Enthält die Beziehungen auf Basis der Startkomponente (die virtuelle Startkomponente). Die Beziehungen werden im folgenden Format definiert:

<Relationship Id="someID" Type="relationshipType" Target="targetPart"/>

Dabei kann Id eine beliebige Zeichenfolge sein, die jedoch in der RELS-Datei eindeutig sein muss.

Type Der Beziehungstyp, der Beziehungen gegenseitig abgrenzt und einen Hinweis auf den Zweck der Beziehung liefert. Er zeigt auf das Schema, das Office XML-Formattypen definiert.

Target Zeigt auf den Ordner und die Datei, die das Ziel der Beziehung enthalten (eine andere Komponente).

Tabelle 1: Beziehungstypen

Integrierte Beziehungstypen

https://schemas.microsoft.com/office/2006/relationships/officeDocument

https://schemas.microsoft.com/office/2006/relationships/vbaProject

https://schemas.microsoft.com/office/2006/relationships/userXmlData

https://schemas.microsoft.com/office/2006/relationships/hyperlink

https://schemas.microsoft.com/office/2006/relationships/styleSheet

https://schemas.microsoft.com/office/2006/relationships/comments

https://schemas.microsoft.com/office/2006/relationships/oleObject

https://schemas.microsoft.com/office/2006/relationships/e2Object

https://schemas.microsoft.com/office/2006/relationships/e1Object

https://schemas.microsoft.com/office/2006/relationships/image

https://schemas.microsoft.com/office/2006/relationships/sound

https://schemas.microsoft.com/office/2006/relationships/movie

https://schemas.microsoft.com/office/2006/relationships/slide

https://schemas.microsoft.com/office/2006/relationships/layout

https://schemas.microsoft.com/office/2006/relationships/notesslide

https://schemas.microsoft.com/office/2006/relationships/slidemaster

https://schemas.microsoft.com/office/2006/relationships/glossaryDoc

https://schemas.microsoft.com/office/2006/relationships/cfChunk

https://schemas.microsoft.com/office/2006/relationships/dataStoreItem

https://schemas.microsoft.com/office/2006/relationships/embeddedFont

https://schemas.microsoft.com/office/2006/relationships/embeddedMetroObject

https://schemas.microsoft.com/office/2006/relationships/chart

https://schemas.microsoft.com/office/2006/relationships/activeXControl

https://schemas.microsoft.com/office/2005/relationships/diagram

https://schemas.microsoft.com/office/2005/relationships/diagramData

https://schemas.microsoft.com/office/2005/relationships/diagramStyle

https://schemas.microsoft.com/office/2005/relationships/diagramColorTrans

https://schemas.microsoft.com/office/2005/relationships/diagramDefinition

https://schemas.microsoft.com/package/2005/02/md/core-properties

https://schemas.microsoft.com/office/2006/relationships/docPropsApp

https://schemas.microsoft.com/office/2006/relationships/docPropsCustom

https://schemas.microsoft.com/ office/2006/relationships/documentThumbnail

https://schemas.microsoft.com/office/2006/relationships/glossaryDoc

Hauptkomponente des Dokuments

Das Ziel der Beziehung https://schemas.microsoft.com/office/2006/relationships/officeDocument ist die Hauptkomponente, die das Dokument definiert (die Präsentationskomponente für PowerPoint, die Arbeitsmappenkomponente für Excel, die Dokumentkomponente für Word). Alle anderen Beziehungen basieren auf der Hauptkomponente des Dokuments.

Application* **-Ordner (z. B. Word)*

Enthält anwendungsspezifische Dateien der Komponenten, für Word beispielsweise:

  • wordDocument.xml   Enthät die Daten (Text) des Dokuments sowie Format- und Zeichensatzeinstellungen.

  • footer.xml   Enthält Informationen über die Fußzeilen des Dokuments, beispielsweise Seitenzahlen und Formatinformationen.

  • header.xml   Enthält Informationen über die Kopfzeilen, analog zur Datei footer.xml.

  • wordDocument.doc   Ist eine Kopie des ursprünglichen Dokuments.

  • styles.xml   Enthält Informationen über die im Dokument enthaltenen Formate, z. B. Schriftgrade, Tabellenformate oder Aufzählungen.

Audiodatei

Enthält beliebige Audiodateien, z. B. MID-, MP3- oder WAV-Dateien.

Datei Content_Types.xml

Stellt eine Liste der Inhaltstypen für die anderen im Paket enthaltenen Komponenten bereit. Inhaltstypen werden definiert als die Typen von Komponenten, die in einem Paket gespeichert werden können:

Tabelle 2: Inhaltstypen in einem ZIP-Container

Integrierte Inhaltstypen

 

application/vnd.ms.powerpoint.template.macroEnabled.12

application/x-font

application/vnd.ms-excel.12

application/x-font

application/vnd.ms-excel.addin.12

application/xml

application/vnd.ms-excel.binary.12

audio/aiff

application/vnd.ms-excel.macroEnabled.12

audio/basic

application/vnd.ms-excel.macroEnabledTemplate.12

audio/midi

application/vnd.ms-excel.template.12

audio/mp3

application/vnd.ms-metro.core-properties+xml

audio/mpegurl

application/vnd.ms-metro.relationships+xml

audio/wav

application/vnd.ms-office.activeX+xml

audio/x-ms-wax

application/vnd.ms-office.chart

audio/x-ms-wma

application/vnd.ms-office.vbaProject

image/bmp

application/vnd.ms-powerpoint.

image/gif

application/vnd.ms-powerpoint.macroEnabled.12

image/jpeg

application/vnd.ms-powerpoint.main.12+xml

image/png

application/vnd.ms-powerpoint.presentation.12

image/tiff

application/vnd.ms-powerpoint.show.12

image/xbm

application/vnd.ms-powerpoint.show.macroEnabled.12

image/x-icon

application/vnd.ms-powerpoint.template.12

video/avi

application/vnd.ms-word.document.12

video/mpeg

application/vnd.ms-word.document.macroEnabled.12

video/mpg

application/vnd.ms-word.document.macroEnabled.main+xml

video/x-ivf

application/vnd.ms-word.document.main+xml

video/x-ms-asf

application/vnd.ms-word.fontTable+xml

video/x-ms-asf-plugin

application/vnd.ms-word.listDefs+xml

video/x-ms-wm

application/vnd.ms-word.settings+xml

video/x-ms-wmv

application/vnd.ms-word.styles+xml

video/x-ms-wmx

application/vnd.ms-word.subDoc+xml

video/x-ms-wvx

application/vnd.ms-word.template.12


application/vnd.ms-word.template.macroEnabled.12


application/vnd.ms-word.template.macroEnabled.main+xml


application/vnd.ms-word.template.main+xml


Komponente Dokumenteigenschaften

Enthält die grundsätzlichen Dokumenteigenschaften, die für alle dem XPS-Format entsprechenden Dateien definiert sind, beispielsweise:

  • Autor

  • Titel

  • Thema

  • Kommentare

  • Letztes Speicherdatum

  • Erstellungsdatum

Beziehungen

Komponenten stellen die einzelnen Elemente dar, die zusammen ein Office 2007-Dokument ausmachen. Die verwendete Methode zum Festlegen, in welchen Abhängigkeiten die einzelnen Komponenten für das aktuelle Dokument stehen, wird als Beziehungen bezeichnet. Zum Definieren von Beziehungen wird XML verwendet. Beziehungen definieren die Verbindung zwischen einer Quellkomponente und einer Zielressource. Beispielsweise kann die Verbindung zwischen einer Folie und einem auf dieser Folie angezeigten Bild durch eine Beziehung identifiziert werden. Beziehungen werden in XML-Komponenten oder "Beziehungskomponenten" im Dokumentcontainer gespeichert. Wenn eine Quellkomponente über mehrere Beziehungen verfügt, werden alle nachfolgenden Beziehungen in derselben XML-Beziehungskomponente aufgeführt.

Beziehungen spielen eine wesentliche Rolle in Office XML-Formaten. Auf jede Dokumentkomponente wird über mindestens eine Beziehung verwiesen. Durch das Verwenden von Beziehungen kann festgestellt werden, in welcher Abhängigkeit eine Komponente zu einer anderen Komponente steht, ohne den jeweiligen Inhalt der Komponenten untersuchen zu müssen. In den Komponenten werden alle Verweise auf Beziehungen durch eine Beziehungs-ID dargestellt. Dadurch können alle Verbindungen zwischen einzelnen Komponenten unabhängig vom inhaltsspezifischen Schema bleiben.

Übersichtsdiagramm zu Beziehungen für eine Excel 2007-Arbeitsmappe
Abbildung 2: Übersichtsdiagramm zu Beziehungen für eine Excel 2007-Arbeitsmappe

Im folgenden Beispiel wird eine Beziehungskomponente in einer Excel 2007-Arbeitsmappe mit zwei Arbeitsblättern dargestellt:

<Relationships xmlns="https://schemas.microsoft.com/package/2005/06/relationships"> 
<Relationship ID="rId3" 
   Type="https://schemas.microsoft.com/office/2005/8/relationships/xlStyles"
      Target="styles.xml"/> 
   <Relationship ID="rId2" 
Type="https://schemas.microsoft.com/office/2005/8/relationships/xlWorksheet" 
         Target="worksheets/Sheet2.xml"/> 
   <Relationship ID="rId1" 
      Type="https://schemas.microsoft.com/office/2005/8/relationships/xlWorksheet" 
         Target="worksheets/Sheet1.xml"/> 
   <Relationship ID="rId5" 
Type="https://schemas.microsoft.com/office/2005/8/relationships/xlMetadata" 
         Target="metadata.xml"/> 
   <Relationship ID="rId4" 
Type="https://schemas.microsoft.com/office/2005/8/relationships/xlSharedStrings" 
         Target="strings.xml"/> 
</Relationships>

Es ist zu beachten, dass Beziehungen nicht lediglich Verweise auf interne Dokumente darstellen, sondern auch auf externe Ressourcen. Wenn ein Dokument beispielsweise Verknüpfungen mit Bildern oder Objekten enthält, werden diese ebenfalls als Beziehungen dargestellt. Dadurch können in einem Dokument enthaltene Verknüpfungen mit externen Quellen einfach gefunden, überprüft und geändert werden. Sie bieten die Möglichkeit zum Reparieren von fehlerhaften externen Verknüpfungen, zum Überprüfen unbekannter Quellen und zum Entfernen möglicherweiser gefährlicher Verknüpfungen.

Entwickler profitieren auf vielfältige Weise durch die Verwendung von Beziehungen in Office XML-Formaten. Beziehungen vereinfachen das Auffinden von Inhalten in einem Dokument, da zum Suchen von Komponenten kein dokumentspezifisches XML analysiert werden muss. Auch zum Suchen nach internen oder externen Dokumentressourcen muss eine solche Analyse nicht mehr durchgeführt werden. Durch Beziehungen lassen sich alle Inhalte eines Dokuments schnell auflisten. Wenn Sie beispielsweise die Arbeitsblätter in einer Excel-Arbeitsmappe zählen möchten, können Sie die Beziehungen auf vorhandene Arbeitsblattkomponenten untersuchen. Beziehungen können außerdem zum Untersuchen des Inhaltstyps in einem Dokument verwendet werden. Dies ist in Situationen hilfreich, in denen überprüft werden muss, ob ein Dokument einen bestimmten Inhaltstyp enthält, der möglicherweise gefährlich (beispielsweise ein verdächtiges OLE-Objekt) oder nützlich (z. B. in einem Szenario, in dem alle JPEG-Bilder zur Weiterverwendung aus einem Dokument extrahiert werden sollen) ist.

Darüber hinaus können Dokumente über Beziehungen ohne Kenntnisse von anwendungsspezifischer Syntax oder Inhaltsmarkups verändert werden. Ein Entwickler kann beispielsweise ohne jede Kenntnis der PowerPoint-Programmierung eine Lösung erstellen, die durch Bearbeiten der im Dokument enthaltenen Beziehungen alle nicht gewünschten Folien aus einer Präsentation entfernt.

Dateien ohne und mit aktivierten Makros

In der Standardeinstellung enthalten in Office XML-Formaten gespeicherte Microsoft Office 2007-Dokumentdateien keine Makros, also keinen Code. Dadurch wird sichergestellt, dass in einem Standarddokument enthaltener böswilliger Code zu keiner Zeit unabsichtlich ausgeführt werden kann. Microsoft Office 2007-Dokumente können jedoch auch weiterhin Makros enthalten und verwenden, der Benutzer oder Entwickler muss diese Dokumente jedoch als Dokumenttyp mit aktivierten Makros speichern. Dieser Schutz beeinträchtigt die Entwicklung von Lösungen keineswegs, ermöglicht Organisationen jedoch einen vertrauensvolleren Umgang mit Dokumenten.

Dateien mit aktivierten Makros weisen dasselbe Dateiformat wie Dateien ohne Makros auf, verfügen jedoch im Unterschied dazu über zusätzliche Komponenten. Die zusätzlichen Komponenten sind von dem im Dokument enthaltenen Automatisierungstyp abhängig. Eine Datei mit aktivierten VBA-Makros enthält eine binäre Komponente, die das VBA-Projekt enthält. Eine Excel-Arbeitsmappe, die Excel 4.0-Makros verwendet (XLM-Makros), oder eine PowerPoint-Präsentation, die Schaltflächen enthält, wird ebenfalls als Datei mit aktivierten Makros gespeichert. Wenn eine codespezifische Komponente in einer Datei ohne Makros enthalten ist (ob versehentlich oder böswillig), werden die Office-Anwendungen das Ausführen des Codes nicht gestatten – ohne jede Ausnahme.

Ab sofort können Sie feststellen, ob in einem Microsoft Office 2007-Dokument Code enthalten ist, bevor Sie es öffnen. Bisher war dieser "vorausschauende Hinweis" ohne Office-Anwendungen nur schwer zu realisieren. Die Paketdatei kann jetzt auf codebasierte Komponenten und Beziehungen überprüft werden, ohne Office und möglicherweise gefährlichen Code auszuführen. Erscheint eine Datei verdächtig, können alle zum Ausführen von Code fähigen Komponenten aus der Datei entfernt werden, damit der Code keinen Schaden anrichten kann.

Dateinamenerweiterungen

Die in Office XML-Formaten gespeicherten Microsoft Office 2007-Dokumente verfügen über neue Dateinamenerweiterungen. Durch diese kann Office Dokumente in diesem Dateiformat von in vorherigen Office-Versionen verwendeten binären Dokumenten unterscheiden. Die neuen Erweiterungen übernehmen die Erweiterungen der vorhandenen binären Dateien, fügen jedoch einen Buchstaben an die Erweiterung an. Die Standarderweiterungen der in Word 2007, Excel 2007 und PowerPoint 2007 erstellten Dokumente verwenden die neuen Dateiformate und fügen den Buchstaben "x" an. Sie lauten ".docx", ".xlsx" beziehungsweise ".pptx". Andere Office-Dokumente, die die neuen Dateiformate verwenden (einschließlich Vorlagen, Add-Ins und PowerPoint-Präsentationen), erhalten ebenfalls neue Erweiterungen.

Eine weitere mit Office 2007 eingeführte Änderung besteht in unterschiedlichen Erweiterungen für Dateien ohne oder mit aktivierten Makros. Dokumente mit aktivierten Makros erhalten eine Dateinamenerweiterung, die mit dem Buchstaben "m" (statt "x") endet. Beispielsweise hat ein Word 2007-Dokument mit aktivierten Makros die Erweiterung ".docm", die Benutzer oder Anwendungen auf das Vorhandensein von Code hinweist, bevor das Dokument geöffnet wird.

Tabelle 3: Liste der Dateinamenerweiterungen für Office 2007-Dokumenttypen

Dateityp Word 2007

Erweiterung

Word 2007-XML-Dokument

.docx

Word 2007-XML-Dokument mit aktivierten Makros

.docm

Word 2007-XML-Vorlage

.dotx

Word 2007-XML-Vorlage mit aktivierten Makros

.dotm

Dateityp Excel 2007

Erweiterung

Excel 2007-XML-Arbeitsmappe

.xlsx

Excel 2007-XML-Arbeitsmappe mit aktivierten Makros

.xlsm

Excel 2007-XML-Vorlage

.xltx

Excel 2007-XML-Vorlage mit aktivierten Makros

.xltm

Binäre Excel 2007-Arbeitsmappe

.xlsb

Excel 2007-XML-Add-In mit aktivierten Makros

.xlam

Dateityp PowerPoint 2007

Erweiterung

PowerPoint 2007-XML-Präsentation

.pptx

PowerPoint 2007-XML-Präsentation mit aktivierten Makros

.pptm

PowerPoint 2007-XML-Vorlage

.potx

PowerPoint 2007-XML-Vorlage mit aktivierten Makros

.potm

PowerPoint 2007-XML-Add-In mit aktivierten Makros

.ppam

PowerPoint 2007-XML-Bildschirmpräsentation

.ppsx

PowerPoint 2007-XML-Bildschirmpräsentation mit aktivierten Makros

.ppsm

 

Entwickeln von Lösungen mit den Office XML-Formaten

Die Office XML-Formate ermöglichen oder verbessern viele Arten von Lösungen, die das Erstellen von Dokumenten beinhalten. Sie können auf die Inhalte von Office-Dokumenten in den neuen Dateiformaten mit beliebigen Tools oder Technologien zugreifen, die ZIP-Archive verarbeiten können. Den Dokumentinhalt können Sie anschließend mit jeder standardkonformen XML-Verarbeitungstechnik bearbeiten. Komponenten, die als eingebettete, systemeigene Formate vorliegen (bspw. Bilder), können Sie mit beliebigen für den Objekttyp geeigneten Tools ändern.

Darüber hinaus bietet die Möglichkeit, die als ZIP-Archiv vorliegende Containerdatei eines Microsoft Office 2007-Dokuments manuell öffnen zu können, einige interessante Vorteile für Entwickler. Beim Erstellen von Office-Lösungen kann beispielsweise der Inhalt oder die Struktur eines Dokuments untersucht werden, ohne eine Zeile Code zu schreiben. Diese Möglichkeit ist äußerst hilfreich beim Entwerfen der Anwendung und beim Erstellen von Prototypen.

Die Struktur innerhalb eines Microsoft Office 2007-Dokuments kann sehr einfach nach Komponenten und Beziehungen durchsucht werden, ob zum Auffinden von Informationen, Ändern von Inhalten oder Entfernen von Elementen aus dem Dokument. Durch den Einsatz von XML und die Offenlegung der Office-Referenzschemas können weitere Dokumente einfach erstellt werden, vorhandenen Dokumenten Daten hinzugefügt oder nach bestimmten Inhalten in einem Dokument gesucht werden.

Im restlichen Teil dieses Artikels werden einige Szenarios dargestellt, in denen die Office XML-Formate dokumentbasierte Lösungen ermöglichen. Die folgenden Szenarios sind lediglich ein kleiner Teil einer nahezu endlosen Liste von Möglichkeiten:

  • Dateninteroperabilität

  • Bearbeiten von Inhalten

  • Freigeben und Wiederverwenden von Inhalten

  • Erstellen von Dokumenten

  • Dokumentsicherheit

  • Verwalten von vertraulichen Informationen

  • Formatieren von Dokumenten

  • Profilerstellung von Dokumenten

Dateninteroperabilität

Da das Datenformat XML als Standardformat für den Datenaustausch weit verbreitet ist, können durch die neuen Office XML-Formate Dokumente noch besser für den gemeinsamen Zugriff in heterogenen Systemen freigegeben werden. Durch das Verwenden von XML als Microsoft Office-Standarddateiformat können Benutzer Dokumentdaten innerhalb einer Abteilung oder zwischen zwei Unternehmen ohne die Einschränkungen austauschen, die beim Verwenden binärer Formate auftreten.

Die Offenheit der neuen Dateiformate ermöglicht den Zugriff auf Daten und eine neue, weitgehende Integration über den Desktop hinaus. Sie haben z. B. die Möglichkeit, mithilfe der veröffentlichten Spezifikation der neuen Dateiformate Dokumente mit unterschiedlichen Daten zu erstellen, ohne dafür eine Office-Anwendung verwenden zu müssen. Anwendungen auf dem Server können viele Dokumente in einem Arbeitsgang verarbeiten, sodass umfangreiche Lösungen möglich sind, die Unternehmensdaten in den vertrauten und flexiblen Office-Anwendungen vernetzen. Mit XML-Standardprotokollen wie XPath (eine verbreitete XML-Abfragesprache) und XSLT (Extensible Stylesheet Language Transformations) können Daten aus Dokumenten abgerufen oder Dokumente mit externen Daten aktualisiert werden.

Ein Szenario kann das Personalisieren von tausenden von Dokumenten sein, die an Kunden gesendet werden. Sie können mithilfe einer Serveranwendung, die XML-Code aus einer Unternehmensdatenbank oder Anwendung zur Verwaltung von Kundenbeziehungen (Customer Relationship Management, CRM) extrahiert, Informationen in eine Standardvorlage für Dokumente einfügen. Diese Methode zur Dokumenterstellung ist äußerst effizient, da das Ausführen von Office-Anwendungen nicht erforderlich ist. Dennoch haben Sie die Möglichkeit, hochwertige, umfassende Office-Dokumente zu erstellen.

Sie können auch mithilfe benutzerdefinierter Schemas Daten in Office-Dokumenten austauschen. Auf Informationen, die bisher in binärem Format vorlagen und nicht abgerufen werden konnten, kann nun problemlos zugegriffen werden, sodass Dokumente als frei austauschbare Datenquellen dienen können. Benutzerdefinierte Schemas vereinfachen nicht nur das Einfügen oder Extrahieren von Daten, sondern strukturieren auch Dokumente und können das Erzwingen von Datenüberprüfungen ermöglichen.

Bearbeiten von Inhalten

Ein weiteres gutes Beispiel für die Verbesserung von Prozessen durch Office XML-Formate ist das Bearbeiten der Inhalte vorhandener Office-Dokumente. Dabei können z. B. kleine Datenmengen aktualisiert, vollständige Dokumentkomponenten ausgetauscht, Komponenten entfernt oder neue Komponenten hinzugefügt werden. Die neuen Dateiformate vereinfachen das Suchen und Bearbeiten von Inhalten durch das Verwenden von Beziehungen und Komponenten. Durch XML und XML-Schemas stehen Ihnen nahezu zahllose Möglichkeiten zur Verfügung, um mithilfe verbreiteter XML-Technologien wie XPath und XSLT Daten in Dokumentkomponenten zu bearbeiten.

Ein mögliches Szenario ist das Bearbeiten des Kopfzeilentexts in einem Word-Dokument. Es macht natürlich keinen Sinn, diese Aufgabe für ein einziges Dokument zu automatisieren. Wie kann jedoch verfahren werden, wenn ein Unternehmen durch einen Zusammenschluss den Firmennamen in hunderten von verschiedenen Dokumenten ändern muss? Ein Entwickler kann Code schreiben, der in allen Dokumenten nach der Kopfzeilenkomponente in der Word-Dateistruktur sucht und mit einer XPath-Abfrage nach dem alten Text sucht. So kann für jedes Dokument der neue Text eingesetzt und die alte Kopfzeilenkomponente ersetzt werden. Durch das Automatisieren kann viel Zeit gespart werden, ein Prozess ermöglicht werden, der andernfalls möglicherweise gar nicht versucht würde, und Fehler vermieden werden, die bei manueller Durchführung auftreten können.

Ein weiteres Szenario kann das Aktualisieren eines vorhandenen Office-Dokuments durch das gezielte Ändern einer vollständigen Komponente sein. In einer Excel 2007-Arbeitsmappe können Sie ein vollständiges Tabellenblatt mit veralteten Daten oder Berechnungsformeln durch ein neues Tabellenblatt ersetzen, indem Sie die entsprechende Komponente überschreiben. Diese Aktualisierungsmethode kann auch auf binäre Komponenten angewendet werden. Sie können ein vorhandenes Bild oder sogar ein OLE-Objekt bei Bedarf gegen ein neues austauschen. Sie können eine als OLE-Objekt in Office-Dokumenten eingebettete Microsoft Office Visio-Skizze aktualisieren, indem Sie diese binäre Komponente überschreiben. Sie können URLs in Hyperlinks aktualisieren, um auf neue Internetadressen zu verweisen.

Im Folgenden werden weitere anwendungsspezifische Szenarios aufgeführt.

Bearbeiten von Inhalten in Word 2007

Es ist in Unternehmen üblich, häufig verwendeten Text in Word-Dokumente einzufügen. Es kann z. B. erforderlich sein, dass in jedem öffentlichen Dokument eines Unternehmens die Garantieausschlüsse oder Nutzungsbedingungen enthalten sind. Ein anderes Beispiel für häufig verwendeten Text kann ein kurzes Firmenportrait in Vertriebsangeboten oder PR-Texten sein. Word bietet Funktionen, z. B. AutoText, mit denen formatierter Text eingefügt werden kann. Diese Funktion lässt sich jedoch nur für Aufgaben geringeren Umfangs einsetzen, da entweder Word automatisiert werden muss oder Benutzerinteraktion erforderlich ist.

Word 2007 hingegen bietet eine sehr flexible Alternative für das Einfügen von Inhalten in ein Dokument. Mit dem Word XML-Format können Sie Dokumentkomponenten, Dokumentbausteine genannt, hinzufügen, auf die das Gesamtdokument beim Starten von Word verweist. Sie können also eine Bibliothek mit Dokumentbausteinen, die Sie aus Word-kompatiblen Dokumentformaten ableiten können, erstellen und nach Bedarf in Programmen für Word-Dokumentlösungen wiederverwenden.

Diese erweiterte Bearbeitungsmöglichkeit für Word-Inhalte bietet einige interessante Szenarios, z. B. die Dokumenterstellung auf dem Server. Im bereits erwähnten Beispiel können Sie also einen Garantieausschluss automatisch in ein auf einem Server erstelltes Dokument einfügen. Nehmen Sie an, die Dokumente eines internationalen Unternehmens müssen einen Garantieausschluss in den jeweiligen Landessprachen enthalten. Das Unternehmen kann die entsprechenden sprachspezifischen Garantieausschlüsse als HTML-Dateien erstellen und auf einem Server speichern. Eine Anwendung zur Dokumenterstellung kann das entsprechende Dokumentfragment für die erforderliche Sprache als Komponente in den Dokumentcontainer einfügen. Dieses Fragment wird dann als gewöhnliche Word-Dokumentkomponente angezeigt.

Bearbeiten von Inhalten in Excel 2007

Um die Leistung bei Lade- und Speichervorgängen zu optimieren und die Dateigröße zu reduzieren, speichert Excel 2007 nur eine einzige Kopie von häufig verwendetem Text in der Excel-Datei. Dazu implementiert Excel eine Zeichenfolgentabelle in einer Dokumentkomponente, die durch das Ziel der Beziehung https://schemas.microsoft.com/office/2005/8/relationships/xlSharedStrings festgelegt wird. In dieser Komponente wird jeder eindeutige Textwert einer Arbeitsmappe nur einmal aufgeführt. In den einzelnen Zellen der Tabellenblätter wird dann auf diese Zeichenfolgentabelle verwiesen, um die Werte zu erhalten.

Durch diesen Vorgang wird zum einen das Excel XML-Format optimiert, zum anderen werden einige interessante Möglichkeiten für weitere Lösungen zur Bearbeitung von Inhalten eröffnet. Entwickler einer internationalen Organisation können mithilfe der freigegebenen Zeichenfolgentabelle einen mehrsprachigen Support einrichten. Anstatt Arbeitsmappen für jede unterstützte Sprache zu erstellen, kann eine einzige Arbeitsmappe Zeichenfolgentabellen für die verschiedenen Sprachen verwenden. Eine andere Möglichkeit ist die Verwendung von Zeichenfolgentabellen zur Suche nach Schlüsselbegriffen in einer Sammlung von Arbeitsmappen. Das Verarbeiten einer einzigen XML-Textdatei mit Zeichenfolgen ist schneller und einfacher als das Excel-Objektmodell in zahlreichen Tabellenblättern und Arbeitsmappen zu bearbeiten.

Bearbeiten von Inhalten in PowerPoint 2007

Wenn eine PowerPoint 2007-Präsentation im PowerPoint XML-Format gespeichert wird, kann auf die Inhalte dieser Präsentation problemlos zugegriffen werden. Da es sich um die erste PowerPoint-Version handelt, die XML-Formate verarbeiten kann, bietet sie viele Anwendungsmöglichkeiten, die in früheren PowerPoint-Versionen nicht verfügbar sind. Sie können jetzt auf Folien und Foliennotizen als Text zugreifen. Es können Lösungen zum Suchen, Indizieren und Erstellen von Präsentationsinhalten entwickelt werden. Es ist möglich, auf einfache Weise datengesteuerte Präsentationen mithilfe von XML zu erstellen. Außerdem können Sie mithilfe von XML-Komponenten auf Folienmaster und Folienlayouts zugreifen, um mithilfe eines Programms vorhandene oder neue PowerPoint-Präsentationen zu formatieren.

Durch Erstellen einer Anwendung, die Folien unabhängig von vorhandenen PowerPoint-Präsentationen speichert, können Sie Inhalte für PowerPoint-Präsentationen zusammenstellen oder vorhandene Inhalte wiederverwenden. Folien werden als einzelne XML-Komponenten angezeigt. Somit kann mithilfe einer Lösung die Methode, mit der eine Organisation PowerPoint 2007-Folien als Daten speichert und verwaltet, optimiert werden. Es kann sogar eine Anwendung zum Anzeigen der Folien entwickelt werden, mit der Benutzer ohne PowerPoint Folien suchen und auswählen können, um eine Präsentation zu erstellen. Mit einer webbasierten Anwendung kann die Verwaltung der Folien sogar zentralisiert werden.

Freigeben und Wiederverwenden von Inhalten

Die Modularität der Office XML-Formate ermöglicht das einmalige Erstellen von Inhalten, die anschließend in verschiedenen Dokumenten verwendet werden können. Entwickler können also verschiedene Standardvorlagen erstellen und entsprechende Komponenten als Bausteine für andere Dokumente wiederverwenden. So kann z. B. eine in einem Word-Dokument erstellte Tabelle auch in anderen Word-Dokumenten verwendet werden. Einmal erstellte Grafiken, die in den Anwendungen von Microsoft Office 2007 über ein gemeinsames Schema verfügen, können für verschiedene Dokumenttypen verwendet werden. Der problemlose Zugriff, der durch diese Formate ermöglicht wird, bietet Ihnen uneingeschränkte Möglichkeiten, Inhalte gemeinsam zu nutzen.

Ein Szenario kann das Erstellen eines Repository für Bilder sein, die in Dokumenten verwendet werden. Sie können eine Lösung erstellen, mit der Bilder aus verschiedenen Office-Dokumenten extrahiert und Benutzern über eine zentrale Zugriffsmöglichkeit bereitgestellt werden. Da Bilder in Office 2007-Dokumenten als binäre Komponenten gespeichert werden, können Sie problemlos die Anwendung erstellen und eine Bildbibliothek verwalten. Somit müssen Benutzer, die bereits verwendete Bilder einfügen möchten, nicht erst die einzelnen Dokumente öffnen und schließen, um nach den gewünschten Bildern zu suchen. Mithilfe der entwickelten Anwendung können sie im Repository nach Bildern suchen und diese direkt in das entsprechende Dokument einfügen.

Sie können die Dokumentverwaltung durch weitere Visualisierung unterstützen, indem Sie eine ähnliche Anwendung entwickeln, die Miniaturansichten der extrahierten Bilder verwendet.

Erstellen von Dokumenten

Eine der häufigsten Anforderungen von Entwicklern ist die Möglichkeit, Microsoft Office-Dokumente auf Servern erstellen zu können, ohne die Microsoft Office-Anwendungen automatisieren zu müssen. Unternehmen, die komplexe Dokumente mit hohem Datenvolumen oder Dokumente in großer Anzahl erstellen müssen, benötigen für diese anspruchsvollen Aufgaben effektivere Verarbeitungsmethoden. Vom technischen Standpunkt aus gesehen, wurden Office-Anwendungen nicht dafür entwickelt, auf einem Server ausgeführt zu werden.

Seit Microsoft Office 2003 wurde diese Einschränkung durch die Einführung von XML-Dokumentformaten, die entsprechend den Referenzschemas in Office 2003 erstellt werden konnten, aufgehoben. Sie können mit jeder Technologie, mit der XML-Dateien entsprechend der Office-Schemas erstellt werden können, Word- oder Excel-Dokumente erstellen. Dies war bereits ein gewaltiger Fortschritt. Allerdings konnten diese Möglichkeiten nur für Excel und Word verwendet werden, und nur Word unterstützte XML-Dateien absolut zuverlässig. In Office 2007 wurde diese Entwicklung fortgeführt, indem nun XML-Dateien auch durch PowerPoint unterstützt werden und sowohl PowerPoint als auch Excel dieses Dateiformat zuverlässig unterstützen.

Dank dieser Weiterentwicklung ist es nun mithilfe von Office 2007 möglich, eine Office-Lösung zu entwickeln, mit der Excel-, Word- und PowerPoint-Dokumente erstellt werden können, ohne dass Office gestartet werden muss. Die Lösung muss XML-Dateien entsprechend der Schemas der Office 2007-Version und den Inhalt der Pakete entsprechend der Office XML-Formate erstellen. Zwar sind die Office-Schemas sehr umfangreich, um die zahlreichen Funktionen der Microsoft Office-Anwendungen vollständig darstellen zu können, es sind jedoch nicht alle durch das Format festgelegten Strukturen für das Erstellen eines Dokuments erforderlich. Die Datei kann in jeder Office-Anwendung mit einer minimalen Anzahl an definierten Elementen geöffnet werden, sodass problemlos zahlreiche Dokumente erstellt werden können.

Beachten Sie, dass sich das Erstellen von Dokumenten nicht ausschließlich auf neue Dokumente bezieht. Wenn Sie die Regeln der Office XML-Formate befolgen, können Sie selbstverständlich Dokumente auch per Programm erstellen, ohne Office verwenden zu müssen. Häufig besteht das Erstellen von Dokumenten jedoch aus dem Zusammenfügen von Teilen aus vorhandenen Dokumenten, Daten und anderen Inhalten. Für dieses Szenario sind die neuen Office XML-Formate hervorragend geeignet, da sie über eine modulare Architektur verfügen und ihre Inhalte auf dem XML-Format basieren.

Diese Art der Dokumenterstellung gilt auch für PowerPoint-Präsentationen. Viele Organisationen verfügen über eine Vielzahl von PowerPoint-Dateien, die durchaus wiederverwendet werden können. Häufig erstellen Benutzer zusätzliche oder ähnliche Präsentationen mit Folien von mehreren bereits vorhandenen Präsentationen. Das Suchen, Zusammenstellen und Integrieren (Kopieren und Einfügen) von Folien ist in der Regel ein zeitraubender, immer wiederkehrender Vorgang, den viele Organisationen für Kundenpräsentationen automatisieren möchten. Mit Office 2007 kann problemlos auf einzelne Folien einer PowerPoint-Präsentation zugegriffen werden, da jede Folie als einzelne XML-Komponente im Containerpaket der Präsentation gespeichert ist. Eine benutzerdefinierte Lösung kann mithilfe dieser Architektur den Erstellungsvorgang für Präsentationen vollständig automatisieren. Benutzerdefiniertes XML kann die Metadaten einzelner Folien enthalten, sodass Benutzer mithilfe vordefinierter Schlüsselwörter diese Folien problemlos suchen können. Wenn ein Benutzer eine Folie auswählt, fügt die Lösung die XML-Komponente dieser Folie der Präsentation hinzu und erstellt die Referenzbeziehung.

Dokumentsicherheit

Sicherheit ist in der heutigen Informationstechnologie ein sehr wichtiger Aspekt. Die Office XML-Formate unterstützen das Vertrauen in die Arbeit mit Office-Dokumenten und das Bereitstellen von Lösungen, die die Dokumentsicherheit berücksichtigen. Mit den neuen Dateiformaten können Sie Lösungen erstellen, die nach allen bekannten Sicherheitslücken suchen und diese beheben, bevor sie Schäden anrichten können.

Nehmen Sie ein Szenario an, in dem ein Unternehmen eine Lösung benötigt, um entweder Dokumente in einer Archivbibliothek zu speichern, in der kein benutzerdefinierter Code ausgeführt werden muss, oder um makrofreie Dokumente an Kunden zu senden. Sie können eine Anwendung zum Entfernen sämtlichen VBA-Codes aus dem Textteil eines Office-Dokuments entwickeln, mit der die Dokumente durchsucht und die Komponenten entfernt werden, die durch das Ziel der Beziehung https://schemas.microsoft.com/office/2006/relationships/vbaProject festgelegt werden. Als Ergebnis erhalten Sie Dokumente von höherer Qualität.

Außerdem können Makros nur in jeweils einem Dateityp (DOCM-Dateien für Word, XLSM-Dateien für Excel und PPTM-Dateien für PowerPoint) der verschiedenen Office 2007-Produkte ausgeführt werden. Alle Dateitypen, die nicht mit dem Suffix "m" enden, führen keinen Makrocode aus, auch wenn diese Dateien Makrocode enthalten. Dadurch können Sie gewährleisten, dass Benutzer, die mit diesen Dateitypen arbeiten, vor bösartiger Software geschützt sind.

Leider ist Makrocode nicht die einzige Gefahrenquelle für Office-Benutzer. Kürzlich wurden potenzielle Sicherheitsrisiken in binären JPG-Dateien entdeckt. Sie können die Sicherheitsrisiken durch binäre Dateien, wie z. B. OLE-Objekte und Bilder, jedoch umgehen, indem Sie die Office-Dokumente nach gefährlichen Elementen durchsuchen und diese entfernen. Wenn z. B. ein bestimmtes OLE-Objekt als Sicherheitsrisiko identifiziert wurde, können Sie eine Anwendung erstellen, um alle Dokumente, die dieses Objekt enthalten, zu suchen. Anschließend können Sie die entsprechenden Dokumente löschen oder in einem Qurantäneverzeichnis speichern. Entsprechend können Sie auch alle externen Verweise eines Microsoft Office 2007-Dokuments suchen, indem Sie die Beziehungskomponenten analysieren. Dadurch können Entwickler entscheiden, ob externe Ressourcen, auf die in einem Dokument verwiesen wird, vertrauenswürdig sind, oder ob korrigierende Maßnahmen erforderlich sind.

Sie können Komponenten aufgrund des Inhaltstyps oder der Beziehungen sperren. Wenn z. B. ein IT-Administrator auf eine mögliche Bedrohung durch GIF-Dateien aufmerksam wird, kann durch entsprechende Einstellungen in den Gruppenrichtlinien das Laden von Inhalten des Typs "image/gif" in Microsoft Office 2007-Dokumenten verboten werden. Nach Bereitstellen der aktuellen Sicherheitspatches kann diese Einstellung wieder deaktiviert werden. Durch dieses Vorgehen kann sich der Administrator darauf verlassen, dass die Benutzer schnell geschützt werden.

Komponenten können auch durch Formatrichtlinien gesperrt werden. Wenn z. B. der IT-Administrator eine Sicherheitslücke entdeckt, durch die bösartige Kommentare einen ausnutzbaren Pufferüberlauffehler in PowerPoint auslösen kann, können Benutzer und deren Computer durch das Bereitstellen einer Office-Dateiformatrichtlinie geschützt werden. Diesmal werden statt des Inhaltstyps (da es sich um Text handelt, der XML enthält) speziell die Kommentare gesperrt, indem der Beziehungstyp schemas.microsoft.com/office/2006/relationships/comments gesperrt wird. Diese Optionen kann der Administrator mit den Richtlinienvorlagen von Microsoft Office (ADM-Dateien) festlegen. Weitere Informationen zum Verwenden von Office-Richtlinienvorlagen finden Sie im Artikel Administrators Can Use Office Policy Templates with the Group Policy Settings of Windows (in englischer Sprache) der Microsoft Knowledge Base.

Verwalten von vertraulichen Informationen

Sie können Benutzer nicht nur vor bösartigen Inhalten, sondern auch vor ungewolltem Freigeben von Daten schützen. Das kann z. B. personenbezogene Informationen (Personally Identifiable Information, PII) in einem Dokument, jedoch auch verfolgte Änderungen, Kommentare und Anmerkungen, die als vertraulich gekennzeichnet wurden, betreffen. Sie können mit einem Programm beide Arten von Informationen direkt entfernen, ohne erst das entsprechende Dokument durchsuchen zu müssen. Um z. B. Kommentare aus Dokumenten zu entfernen, können Sie nach einer Beziehung zu Kommentarkomponenten suchen und die entsprechende Kommentarkomponente entfernen.

Die Office XML-Formate ermöglichen neben dem Schutz von PII-Daten und Kommentaren auch den Zugriff auf diese Informationen, der auch auf andere Weise sinnvoll sein kann. Sie können z. B. eine Lösung entwickeln, die mithilfe von PII-Daten Dokumente auflistet, die von einer bestimmten Person oder Organisation erstellt wurden. Mit den neuen Dateiformaten können Sie diese Liste erstellen, ohne Office starten oder das Office-Objektmodell verwenden zu müssen. Entsprechend kann eine Anwendung ein Verzeichnis oder Volume mit Office-Dokumenten durchsuchen und alle Kommentare in den Dokumenten zusammentragen. Durch zusätzliche Suchkriterien können Sie die Kommentarsuche einschränken und Benutzer bei der Optimierung der Zusammenarbeit beim Erstellen von Dokumenten unterstützen.

Formatieren von Dokumenten

Wie viele andere Aspekte von Office-Dokumenten, die Office XML-Formate verwenden, werden auch Dokumentformatierungen und Schrifttypen in separaten XML-Komponenten innherhalb des Paketcontainers verwaltet. Auch von dieser Trennung können Sie profitieren, um Lösungen zu entwickeln. In einigen Organisationen werden sehr spezielle Dokumentformate verwendet. Diese zu verwalten ist oft sehr zeitaufwendig. Sie können in Dokumenten jedoch z. B. Schrifttypen bearbeiten oder ersetzen, ohne Office starten zu müssen.

Außerdem ist es allgemein üblich, ein Dokument oder eine Reihe von Dokumenten gleichen Inhalts für verschiedene Abteilungen, Standorte, Niederlassungen oder Kunden unterschiedlich zu formatieren. Sie können den Inhalt in einem einzigen Satz von Dokumenten verwalten und anschließend neue Formatierungen anwenden. Dazu tauschen Sie die Komponente, die im Ziel der Beziehung https://schemas.microsoft.com/office/2006/relationships/styleSheet festgelegt ist, durch eine andere Komponente aus. Diese Möglichkeit, die Komponenten auszutauschen, vereinfacht das Formatieren von Dokumenten, ohne Inhalte in vielen verschiedenen Dokumenten verwalten zu müssen.

Profilerstellung von Dokumenten

Das effektive Verwalten von Dokumenten war lange Zeit ein Problem der Informationstechnologie. In Microsoft Office 2003 haben Sie unter Verwendung von OLE Zugriff auf die herkömmlichen Office-Dokumenteigenschaften wie Autor, Titel, Thema usw. In den neuen Office XML-Formaten kann auf die Dokumenteigenschaften weiterhin problemlos zugegriffen werden, da sie in eigenen Dokumentkomponenten abgelegt sind. In folgendem Beispiel ist die Komponente mit den Dokumenteigenschaften in einer DOCX-Datei von Word dargestellt.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?> 
<CoreProperties xmlns="https://schemas.microsoft.com/package/2005/06/md/core-properties"> 
   <Title>Word Document Sample</Title> 
   <Subject>Microsoft Office Word 2007</Subject> 
   <Creator>2007 Microsoft Office System User</Creator> 
   <Keywords/> 
   <Description>2007 Microsoft Office system .docx file</Description> 
   <LastModifiedBy>2007 Microsoft Office System User</LastModifiedBy> 
   <Revision>2</Revision> 
   <DateCreated>2005-05-05T20:01:00Z</DateCreated> 
   <DateModified>2005-05-05T20:02:00Z</DateModified> 
</CoreProperties>

Allerdings können Sie durch die neuen Dateiformate den Office-Dokumenten eigene Daten und Inhalte hinzufügen, die über Office-basierte Eigenschaften hinausgehen, z. B. für eine erweiterte Profilerstellung von Dokumenten. Sie können eigenen benutzerdefinierten XML-Code erstellen und einfach als neue Komponente in eine Datei einfügen. Diesen XML-Code können Sie anschließend mit jedem Tool oder jeder Anwendung bearbeiten, die auf Office XML-Formate zugreifen kann.

 

Verwenden der neuen Dateiformate in Office-Produkten

Neben vielen Komponenten, über die alle Office-Produkte mit den neuen Dateiformaten verfügen, gibt es produktspezifische Komponenten.

Dateiformatstruktur in Excel 2007

Zusätzlich zu den Komponenten, über die alle Office-Produkte verfügen (z. B. XML-Daten-, Beziehungs- und Medienkomponenten), bietet Excel separate Komponenten für Arbeitsmappen, Tabellenblätter und Entitäten wie Grafiken, dynamische Ansichten von Pivot-Tabellen usw.

Dateiformatstruktur in PowerPoint 2007

PowerPoint verwendet viele der Komponenten, die auch von anderen Produkten in deren Dateiformat verwendet werden. Zusätzlich stellt PowerPoint spezifische Objekte für Folienpräsentationen zur Verfügung, z. B. individuelle Folienkomponenten, eine Masterfolienkomponente, Präsentationsdaten usw.

Dateiformatstruktur in Word 2007

Dementsprechend bietet Word zusätzliche Komponenten für Dokumenteigenschaften, Stile und Formatierungen, Fuß- und Kopfzeilen Endnoten usw.

 

Ändern von Office XML-Formatdateien zum Anpassen der Multifunktionsleisten-Benutzeroberfläche

In den folgenden Schritten wird das Erstellen einer benutzerdefinierten Multifunktionsleisten-Benutzeroberfläche in Excel 2007 dargestellt, die durch Bearbeiten einer Arbeitsmappendatei mit aktivierten Makros die erforderlichen Komponenten zum Aufrufen eines benutzerdefinierten Makros enthält. Für dieses Beispiel gehen Sie folgendermaßen vor:

  • Erstellen Sie eine Excel-Arbeitsmappe mit einem Makro, und speichern Sie die Arbeitsmappe als Datei mit aktiviertem Makro im Office XML-Format (XLSM-Datei).

  • Erstellen Sie eine Anpassungsdatei zur Erweiterung der Multifunktionsleiste mit einer Registerkarte, einer Gruppe und einer Schaltfläche.

  • Definieren Sie für die Schaltfläche ein Rückrufereignis, um das von Ihnen im Dokument erstellte Makro aufzurufen.

  • Bearbeiten Sie den Inhalt der Containerdatei des Dokuments mit aktiviertem Makro derart, dass er auf die Anpassungsdatei zur Erweiterung der Multifunktionsleiste verweist.

  • Speichern Sie die Datei mit aktiviertem Makro, und öffnen Sie diese in Excel.

So erstellen Sie eine Office XML-Formatdatei mit aktiviertem Makro in Excel

  1. Starten Sie Excel 2007.

  2. Klicken Sie auf die Registerkarte Entwickler und anschließend auf Visual Basic.

    Hinweis   Wenn keine Registerkarte Entwickler angezeigt wird, müssen Sie sich zunächst als Entwickler zu erkennen geben. Klicken Sie zu diesem Zweck in Ihrer Anwendung auf die Schaltfläche Microsoft Office, dann auf Excel-Optionen, anschließend auf Personalisieren, und aktivieren Sie dann Registerkarte 'Entwickler' in der Multifunktionsleiste anzeigen. Hierbei handelt es sich um eine globale Einstellung, die Sie in allen Office-Anwendungen, die die Multifunktionsleisten-Benutzeroberfläche implementieren, als Entwickler ausweist.

  3. Doppelklicken Sie im Visual Basic-Editor zum Öffnen des Codefensters auf DieseArbeitsmappe.

  4. Geben Sie die folgende VBA-Unterroutine ein, und schließen Sie anschließend den Visual Basic-Editor:

Sub MyButtonMacro(ByVal ControlID As IRibbonControl) Msgbox("Hello world") End Sub

  1. Speichern Sie die Arbeitsmappe als Office XML-Formatdatei mit aktivierten Makros (XLSM-Datei).

So erstellen Sie die XML-Datei, die Markup zum Anpassen der Benutzeroberfläche enthält

  1. Erstellen Sie auf Ihrem Desktop einen Ordner mit dem Namen customUI.

  2. Öffnen Sie in einem Texteditor eine neue Datei, und speichern Sie diese unter dem Namen customUI.xml im Ordner customUI .

  3. Fügen Sie der Datei den folgenden Code hinzu:

<customUI xmlns="https://schemas.microsoft.com/office/2006/01/customui"> <ribbon startFromScratch="true"> <tabs> <tab id=":CustomTab" label="My Tab"> <group id="SimpleControls" label="Sample Group"> <button id="Button1" size="large" label="Large Button" onAction="ThisWorkbook.MyButtonMacro" /> </group> </tab> </tabs> </ribbon> </customUI>

Anschließend bearbeiten Sie einige der Dateien, die im bereits erstellten Dateicontainer mit aktivierten Makros enthalten sind:

  1. Fügen Sie dem Dateinamen der Arbeitsmappendatei eine ZIP-Erweiterung hinzu, und doppelklicken Sie auf die Datei, um diese zu öffnen.

  2. Fügen Sie dem Container die Anpassungsdatei hinzu, indem Sie den Ordner customUI vom Desktop auf die ZIP-Datei ziehen.

  3. Extrahieren Sie die RELS-Datei auf Ihren Desktop. Ein _rels-Ordner, der die RELS-Datei enthält, wird auf Ihren Desktop kopiert.

  4. Öffnen Sie die RELS-Datei, und fügen Sie die folgende Zeile zwischen dem letzten Relationship-Tag und dem Relationships-Tag ein. Dadurch wird eine Beziehung zwischen der Arbeitsmappendatei und der Anpassungsdatei hergestellt:

<Relationship Id="someID" Type="https://schemas.microsoft.com/office/2006/relationships/ui /extensibility" Target="customUI/customUI.xml" />

  1. Speichern und schließen Sie die Datei.

  2. Fügen Sie den _rels-Ordner erneut der Containerdatei hinzu, indem Sie ihn von Ihrem Desktop ziehen und die vorhandene Datei überschreiben.

  3. Geben Sie der Arbeitsmappendatei den ursprünglichen Namen, indem Sie die ZIP-Erweiterung entfernen.

  4. Öffnen Sie die Arbeitsmappe, und beachten Sie, dass die Multifunktionsleiste jetzt My Tab anzeigt.

  5. Klicken Sie auf die Schaltfläche, um das Meldungsfeld anzuzeigen.

 

Schlussbemerkung

Benutzer, Organisationen und Entwickler profitieren von den Vorteilen der Office XML-Formate, die mit Microsoft Office 2007 eingeführt werden. Als offene und auf XML basierende Standardformate erschließen die neuen Dateiformate zahlreiche Möglichkeiten für neuartige Lösungstypen und -szenarios. Sie können auf Dokumente in Form von Datenquellen zugreifen, diese ohne Office-Anwendungen bearbeiten oder in Unternehmenslösungen verarbeiten. Organisationen können nur profitieren, wenn Sie früher getätigte Investitionen in Geschäftssysteme auf Basis von Microsoft Office, Office 2007 und das neue XML-basierte Dateiformat kombinieren.

 

Weitere Ressourcen

Weitere Informationen finden Sie unter: