Introduzindo os formatos de arquivo XML abertos do Microsoft Office (2007)

Frank Rice

Publicado em: 29/8/2006

Aplicável a:

  • Conjuntos Microsoft Office 2007

  • Microsoft Office Excel 2007

  • Microsoft Office PowerPoint 2007

  • Microsoft Office Word 2007

Resumo:

Conheça os benefícios dos Formatos XML Abertos do Microsoft Office (2007). Os usuários podem trocar dados entre os aplicativos do Office e sistemas empresariais usando as tecnologias XML e ZIP. Os documentos podem ser acessados universalmente. E você pode reduzir o risco de ter arquivos danificados. (26 páginas impressas)

Nesta página

Introdução Introdução
Cenários do novos formatos de arquivo Cenários do novos formatos de arquivo
Benefícios dos novos formatos de arquivo Benefícios dos novos formatos de arquivo
Glossário dos Formatos XML Abertos Glossário dos Formatos XML Abertos
Estrutura dos Formatos XML do Office
Estrutura dos Formatos XML do Office
Desenvolvendo soluções com os Formatos XML do Office Desenvolvendo soluções com os Formatos XML do Office
Usando os novos formatos de arquivo nos produtos do Office
Usando os novos formatos de arquivo nos produtos do Office
Modificando arquivos de Formatos XML do Office para personalizar a interface do usuário da Faixa de Opções
Modificando arquivos de Formatos XML do Office para personalizar a interface do usuário da Faixa de Opções
Conclusão Conclusão
Recursos adicionais Recursos adicionais

Introdução

Com o advento do XML na década de 1990, os clientes de computação corporativa começaram a perceber o valor comercial da adoção de formatos abertos e da padronização nos produtos e aplicativos de computador dos quais eles dependiam. Os profissionais de TI se beneficiavam do formato comum de dados possível com o XML devido à sua capacidade de ser lido por aplicativos, plataformas e navegadores da Internet.

Da mesma forma, com a adoção do suporte para XML no Microsoft Office 2000, os desenvolvedores passaram a ver a necessidade de mudar dos formatos de arquivos binários das versões anteriores do Microsoft Office para o formato XML. Os arquivos binários (.doc, .dot, .xls e .ppt), que durante anos fizeram um ótimo trabalho de armazenamento e transporte de dados, não podiam atender aos novos desafios do local de trabalho, como mover dados facilmente entre aplicativos diferentes e permitir que os usuários tivessem uma visão global da empresa a partir desses dados.

O Microsoft Office System 2007 continua com essa transição adotando um formato de arquivo baseado em XML para o Microsoft Office Excel 2007, o Microsoft Office Word 2007 e o Microsoft Office PowerPoint 2007. O novo formato de arquivo, chamado de Formatos XML Abertos do Microsoft Office (Formatos XML do Office), resolve essas questões de local de trabalho com alterações que afetam a maneira como você aborda as soluções baseadas em documentos do Microsoft Office.

Os novos formatos melhoram o gerenciamento de arquivos e dados, a recuperação de dados e a interoperabilidade com sistemas de linha de negócios. Eles estendem o que é possível com os arquivos binários de versões anteriores. Qualquer aplicativo que ofereça suporte a XML pode acessar e trabalhar com dados no novo formato de arquivo. O aplicativo não precisa fazer parte do Microsoft Office System ou mesmo de um produto da Microsoft. Os usuários também podem usar transformações padrão para extrair ou redefinir a finalidade dos dados. Além disso, as preocupações com a segurança são bastante reduzidas, uma vez que as informações são armazenadas em XML, que é, basicamente, texto sem formatação. Portanto, os dados podem passar por firewalls corporativos sem impedimentos.

Observação: não confunda os Formatos XML Abertos com o formato XML Paper Specification do Microsoft Windows. Os Formatos XML do Office usam as Open Packaging Conventions, que também são usadas pela XML Paper Specification (XPS). No entanto, os formatos são diferentes em vários aspectos importantes. O XPS é um formato de documento fixo e paginado, introduzido para o sistema operacional Microsoft Windows Vista. Os Formatos XML do Office são formatos de arquivo totalmente editáveis para o Office Word 2007, o Office Excel 2007 e o Office PowerPoint 2007. Embora eles tenham semelhanças na maneira de usar o XML e a compactação ZIP, eles são diferentes quanto ao design e ao uso pretendido do formato de arquivo.

Cenários do novos formatos de arquivo

Os Formatos XML do Office alteram a maneira como os clientes trabalham com dados. Considere alguns dos seguintes cenários, agora possíveis com os novos formatos de arquivo:

  • Um processo do servidor pode ler um dos itens de um arquivo ZIP sem precisar extrair todos eles. Por exemplo, é possível extrair apenas o arquivo XML que contém os dados do documento sem abrir os arquivos que contêm a formatação, as propriedades e outras informações periféricas do documento.

  • Na maioria dos cenários, o novo contêiner de arquivo é transparente para o usuário. Ele é semelhante a um arquivo típico de documento binário. No entanto, o novo documento em formato XML é compactado e menor, facilitando o envio a outros usuário por email ou outra mídia.

  • Os scanners de vírus e os aplicativos de servidor podem extrair o contêiner com facilidade para exibir apenas os itens afetados de forma direta, sem a preocupação de corromper o contêiner ou seu conteúdo.

  • Os arquivos salvos no novo formato de arquivo não podem conter código de macro executável. (Isso não se aplica aos arquivos habilitados para macros, discutidos em outra parte deste artigo.) Portanto, eles são considerados "seguros" e podem passar por firewalls e ser enviados por aplicativos de email sem preocupações com a segurança. Esse comportamento é aplicado pelos aplicativos do Microsoft Office. Se parte de uma macro for adicionada a um documento de Formato XML do Office, o Office impedirá a abertura do documento.

Observação: alguns aplicativos ZIP permitem criar arquivos criptografados. O novo formato de arquivo não cria arquivos criptografados. Se você tentar ler um arquivo criptografado, a leitura será interrompida e um erro será retornado.

  • Se um item do contêiner se tornar corrompido, os outros itens continuarão disponíveis. Por exemplo, se um usuário tentar abrir um arquivo criado em um disco danificado e o arquivo estiver corrompido, o mecanismo de recuperação de arquivos do Office reconstruirá o diretório central e recuperará totalmente o conteúdo do arquivo.

  • Os desenvolvedores do Office podem usar as interfaces de programação de aplicativo (APIs) do Microsoft WinFX para criar um arquivo XPS válido. Essas APIs são a forma como as soluções interagem com o conteúdo do novo formato de arquivo. Os desenvolvedores do Office também podem usar as APIs para abrir um arquivo ZIP criado por outro aplicativo ZIP, desde que ele não use os recursos ZIP que não têm suporte no Office.

Observação: o Microsoft Office cria arquivos de acordo com as Open Packaging Conventions que podem ser lidos pelas APIs do WinFX e, reciprocamente, o WinFX pode criar pacotes que podem ser abertos com aplicativos do Microsoft Office. As APIs do WinFX funcionam com várias versões anteriores do Microsoft Windows, incluindo as seguintes: Microsoft Windows Vista, Microsoft Windows Server 2003 e Microsoft Windows XP. Além disso, conversores estão disponíveis para as Edições do Microsoft Office 2000, Microsoft Office XP e Microsoft Office 2003.

O novo formato de arquivo também altera a maneira como os usuários do Office trabalham com os aplicativos que usam em suas tarefas diárias. Os cenários a seguir ilustram formas pelas quais o novo formato altera a maneira como você trabalha usando a versão 2007 do Office:

  • Howard, um usuário curioso, descobre que o contêiner do novo formato de arquivo da versão 2007 do Office é um arquivo ZIP. Ele quer ver com seus próprios olhos como isso funciona e abre um dos documentos que criou no Word 2007 usando um aplicativo ZIP. Ele vê alguns arquivos que são semelhantes a conteúdo de documento XML e algumas imagens que correspondem ao que ele tinha visto no documento original. Intrigado, o curioso Howard abre um dos arquivos XML no Bloco de Notas para ver que tipo de arquivo XML é gerado pelo Word. Satisfeito com a facilidade de examinar o documento, ele fecha o Bloco de Notas e o aplicativo ZIP e reabre o arquivo no Word para continuar trabalhando no documento.

  • Jan precisa alterar a propriedade de um documento do Word 2007. Ela abre o arquivo com o novo formato em um produto ZIP, extrai o item XML que contém as propriedades do documento, faz alterações, adiciona o item novamente ao contêiner e salva e fecha o contêiner. Em seguida, ela abre o documento no Word e descobre que todo o conteúdo continua lá e que a única alteração feita ocorreu na propriedade modificada por ela.

  • O logotipo de uma empresa de consultoria foi alterado a fim refletir sua nova missão. O departamento de TI recebe a tarefa de alterar o logotipo nos milhares de documentos armazenados atualmente em um servidor. Nas versões anteriores do Microsoft Office, era necessário abrir cada documento individualmente, excluir o logotipo antigo e colar o novo ou criar e testar um aplicativo personalizado complexo para automatizar a tarefa. Com o novo formato de arquivo, o departamento de TI cria um processo em lotes que navega pela estrutura de arquivos para localizar o gráfico na pasta de mídia (que é a mesma para cada documento) e troca o novo gráfico. Agora, quando o documento é aberto, o novo logotipo é exibido automaticamente.

  • Uma firma de advocacia precisa proteger o sigilo dos dados de seus clientes e de seus próprios dados. Baseada em práticas padrão, a firma sabe que documentos, incluindo aqueles criados no Word, armazenam várias propriedades, algumas visíveis e outras ocultas dentro do documento. Algumas dessas propriedades podem conter informações que são confidenciais dos clientes e proprietárias da empresa. Através de tentativa e erro, a firma criou um procedimento para remover essas informações. No entanto, o processo é demorado e sujeito a erros, porque depende de que o usuário siga o procedimento exato. Com o novo formato de arquivo, o departamento de TI desenvolve um processo em lotes simples que percorre a estrutura de pastas para remover as partes necessárias do pacote. A firma agora pode ter confiança de que todas as informações confidenciais e proprietárias sejam removidas com segurança do documento.

  • Denise está fazendo as alterações finais na dissertação de seu mestrado. Depois de adicionar a bibliografia, ela se prepara para executar o salvamento final. Para seu desespero, o salvamento é interrompido prematuramente e ela vê uma mensagem informando que o documento parece estar corrompido. Depois de se acalmar, Denise se lembra de que está usando o novo formato de arquivo. Ela importa o texto para um novo documento, reanexa as imagens e inclui as partes de formatação e estilo para reconstruir o documento com êxito. Em seguida, ela salva o novo documento.

  • Elizabeth é uma usuária do Windows 2000 que executa o Office 2000 com o conversor instalado que é incluído na versão 2007 do Office. Ela pode abrir um documento em Formato XML do Word. Além disso, pode editar o documento e salvá-lo novamente como um documento no novo formato, porque os conversores oferecem suporte à abertura e ao salvamento.

Benefícios dos novos formatos de arquivo

Os novos Formatos XML do Office introduzem vários dos benefícios que ajudam não apenas os desenvolvedores e as soluções que eles criam, como também usuários individuais e organizações de todos os tamanhos.

Os seguintes destaques são alguns dos benefícios gerais adicionais dos Formatos XML do Office:

  • Integração fácil entre informações comerciais e documentos. Os Formatos XML do Office permitem a criação rápida de documentos de fontes de dados díspares, acelerando o assembly de documentos, a mineração de dados e a reutilização de conteúdo. A troca de dados entre aplicativos do Office e sistemas comerciais empresariais é simplificada. Além disso, você pode alterar as informações dentro de um documento do Office ou criar um documento a partir dos componentes do documento sem usar o aplicativo do Office. Os funcionários podem aumentar sua produtividade publicando, pesquisando e reutilizando informações com mais rapidez e precisão em qualquer todos os aplicativos, desde que ofereçam suporte à leitura e gravação de XML.

  • Aberto e isento de pagamentos de royalties. Os Formatos XML do Office são baseados nas tecnologias XML e ZIP e, portanto, estão acessíveis universalmente. A especificação dos formatos e esquemas será publicada e disponibilizada sob a mesma licença isenta de pagamentos de royalties existente hoje para os Esquemas de Referência do Microsoft Office 2003. Essa licença é oferecida abertamente e está disponível para uso em toda a indústria.

  • Interoperável. Com o XML padrão da indústria no núcleo dos Formatos XML do Office, a troca de dados entre aplicativos do Microsoft Office e sistemas comerciais empresariais é simplificada. Sem a necessidade de acesso aos aplicativos do Office, as soluções podem alterar informações dentro de um documento do Office ou criar um documento usando ferramentas e tecnologias padrão capazes de manipular o XML. Os novos formatos permitem criar arquivos de documentos sem usar o código do Office.

  • Robusto. Os Formatos XML do Office foram desenvolvidos para serem mais robustos do que formatos binários e, portanto, para ajudar a reduzir o risco de perda de informações devido a arquivos danificados ou corrompidos. Mesmo os documentos criados ou alterados fora do Office têm menos probabilidade de ser corrompidos, porque os aplicativos do Office foram desenvolvidos para recuperar documentos com mais confiabilidade usando os novos formatos. Com o número cada vez maior de documentos viajando através de anexos de email ou de armazenamento removível, a possibilidade de uma falha na rede ou no armazenamento aumenta a possibilidade de que um documento seja corrompido.

    Os novos formatos de arquivo melhoram a recuperação de dados segmentando e armazenando separadamente cada uma das partes dentro do pacote do documento. Isso tem o potencial de propiciar grandes economias de dinheiro e de tempo gastos pelas empresas na recuperação de dados perdidos. Quando um componente de arquivo é corrompido, o restante do arquivo ainda é aberto dentro do aplicativo. Por exemplo, se um gráfico se tornar corrompido, isso não impedirá que o cliente abra as outras partes do documento, sem o gráfico. Além disso, os aplicativos do Office podem detectar esses defeitos e tentar reparar um documento ao abri-lo, restaurando a estrutura de dados apropriada ao documento.

  • Eficiente. Os Formatos XML do Office usam tecnologias ZIP e de compactação para armazenar documentos. Um benefício significativo dos novos formatos são os tamanhos de arquivos consideravelmente reduzidos: até 75 por cento menores do que os documentos binários correspondentes. Essa é uma das vantagens de usar a combinação das tecnologias XML e ZIP para a restauração de arquivos. Como o XML é um formato baseado em texto que tem uma ótima compactação e o contêiner ZIP oferece suporte à compactação do conteúdo, os usuários podem obter reduções significativas de tamanhos de arquivos. Esse tipo de compactação de arquivo oferece economias potenciais de custo porque reduz o espaço em disco necessário para armazenar os arquivos e também a largura de banda necessária para transportar arquivos por email, em redes e através da Web.

  • Seguro. A abertura dos Formatos XML do Office se traduz em arquivos mais seguros e transparentes. É possível compartilhar documentos com segurança, porque você pode identificar e remover facilmente informações de identificação pessoal e confidenciais da empresa, como nomes de usuário, comentários e caminhos de arquivo. Da mesma forma, é possível identificar arquivos com conteúdo como objetos OLE ou código do Microsoft Visual Basic for Applications (VBA) para processamento especial. Os formatos de arquivo também ajudam a aumentar a segurança em relação a documentos com código ou macros incorporados. Por padrão, os novos formatos de arquivo do Word 2007, Excel 2007 e PowerPoint 2007 não executam código incorporado. Portanto, se uma pessoa receber uma mensagem de email com um documento do Word anexado, ela poderá abrir o anexo sabendo que o documento não executará nenhum código prejudicial. Os Formatos XML do Office incluem um formato de finalidade especial com uma extensão separada para arquivos com código incorporado, permitindo que a equipe de TI identifique rapidamente os arquivos que contêm código.

  • Compatibilidade com versões anteriores. O Microsoft Office System 2007 é compatível com estas versões anteriores: Microsoft Office 2000, Microsoft Office XP e Microsoft Office 2003. Os usuários dessas versões podem adotar o novo formato com pouco esforço e continuar a obter o máximo benefício de arquivos existentes. De forma específica, eles podem continuar a usar os formatos binários .doc, .xls e .ppt mais antigos, que são totalmente compatíveis com o formato de arquivo 2007. Os usuários de versões anteriores do Office podem baixar uma atualização gratuita que permite abrir e editar arquivos no novo formato usando versões anteriores. Os usuários que instalarem a versão 2007 do Office poderão definir os formatos de arquivo padrão para todos os formatos desejados. Isso ajuda a garantir que os usuários possam continuar a trabalhar com soluções de terceiros baseadas em versões anteriores e a trabalhar com seus colegas, fornecedores, clientes e outros que fizeram a atualização.

Glossário dos Formatos XML Abertos

A lista a seguir define termos usados neste artigo e conteúdo relacionado:

  • API Um conjunto de funções ou métodos usados para acessar funcionalidade de software. API é o acrônimo de interface de programação de aplicativo.

  • Conversores Ferramentas gratuitas que abrem arquivos criados nos Formatos XML do Office em versões anteriores do Office.

    Observação: os conversores lêem, respeitam e aplicam a proteção de IRM (Gerenciamento de Direitos de Informação) aos documentos. Um documento que inclui a proteção de IRM continua a ser protegido independentemente de o destinatário estar usando a versão 2007 do Office ou uma versão anterior.

  • Compatibilidade com versões posteriores A capacidade de uma versão anterior de um aplicativo de abrir arquivos de uma versão posterior e ignorar os recursos que não foram implementados na versão anterior. Por exemplo, o Word 2003 é compatível com a versão posterior do Word 2007 porque ele pode abrir arquivos do Word 2007 com êxito usando um conversor.

  • Formatos XML Abertos do Office Uma estrutura de blocos de construção e relações usada para redigir, empacotar, distribuir e processar conteúdo centralizado em documento. Os blocos de construção definem uma estrutura independente de plataforma para formatos de documento que permite que aplicativos de software gerem, troquem e exibam documentos de maneira confiável e consistente.

  • Pacote O contêiner ZIP que abriga os componentes (as partes) que compõem o documento, conforme definido pela especificação Open Packaging Conventions.

  • Parte Corresponde a um arquivo do pacote. Por exemplo, se um usuário clicar com o botão direito do mouse em um arquivo do Excel 2007 e optar por extraí-lo, ele verá arquivos, como um arquivo pasta.xml, e vários arquivos plann.xml. Cada um desses arquivos é uma parte do pacote.

  • Relações O método usado para especificar como a coleção das partes é reunida para formar um documento. Esse método especifica a conexão entre uma parte de origem e um recurso de destino. As relações são armazenadas dentro de partes XML (por exemplo, /_rels/.rels) no pacote do documento.

  • XML O XML é um formato de texto simples e flexível desenvolvido para a publicação eletrônica e a troca de uma grande variedade de dados na Internet e em outros locais.

  • ZIP Um formato de arquivo de compactação padrão da indústria usado para armazenar e transportar arquivos entre computadores, por email ou pela Internet.

Estrutura dos Formatos XML do Office

O contêiner do novo formato de arquivo é baseado na especificação de formato de arquivo ZIP compactado simples e baseado em partes. No centro dos novos Formatos XML do Office está o uso de esquemas de referência do XML e um contêiner ZIP. Cada arquivo é composto de uma coleção de um número indeterminado de partes. Essa coleção define o documento.

As partes do documento são armazenadas no arquivo ou pacote do contêiner usando o formato ZIP padrão da indústria. A maioria das partes são arquivos XML que descrevem dados do aplicativo, metadados e até mesmo dados do cliente, armazenados dentro do arquivo do contêiner. Outras partes não-XML também podem ser incluídas dentro do pacote do contêiner, incluindo partes como arquivos binários que representam imagens ou objetos OLE incorporados ao documento. Além disso, há partes de relação que especificam as relações entre as partes. Esse design fornece a estrutura de um arquivo do Office. Enquanto as partes compõem o conteúdo do arquivo, as relações descrevem como as partes do conteúdo funcionam em conjunto.

Os resultados são formatos de arquivo XML para documentos do Office estreitamente integrados, sendo, porém, modulares e bastante flexíveis. As próximas seções descrevem cada componente dos Formatos XML do Office em detalhes. Elas também descrevem os aplicativos do Office que usam o novo formato de arquivo.

Observação: para compreender a composição de um arquivo de Formatos XML do Office, você pode extrair um arquivo. Para abrir o arquivo, supõe-se que você possua um aplicativo ZIP, como o WinZip da WinZip Computing Corporation, instalado no computador.

Para abrir um arquivo XML do Word 2007

  1. Crie uma pasta temporária na qual armazenar o arquivo e suas partes.

  2. Salve um documento do Word 2007, contendo texto, imagens e outros elementos, como um arquivo .docx.

  3. Adicione uma extensão .zip ao final do nome do arquivo.

  4. Clique duas vezes no arquivo. Ele será aberto no aplicativo ZIP. Você pode ver as partes que compõem o arquivo.

  5. Extraia as partes para a pasta criada anteriormente.

Pacote ZIP

Muitos elementos participam da criação de um documento do Microsoft Office. Alguns deles são compartilhados normalmente entre todos os aplicativos do Office, como propriedades do documento, folhas de estilos, gráficos, hiperlinks, diagramas e desenhos. Outros são específicos de cada aplicativo, como planilhas do Excel, slides do PowerPoint ou cabeçalhos e rodapés do Word.

Quando os usuários salvam um documento com o Office 2003 ou com versões anteriores do Microsoft Office, um único arquivo é gravado no disco, e pode ser aberto facilmente. Essa comparação é importante para compreender como os documentos são armazenados, gerenciados e compartilhados na prática. Com o encapsulamento das partes individuais de um arquivo do Microsoft Office System 2007 em um contêiner ZIP, um documento permanece como uma única instância do arquivo. O uso de um único arquivo de pacote para representar a entidade de um único documento significa que os usuários têm a mesma experiência que nas versões anteriores do Office ao salvar e abrir documentos do Office (2007). Eles podem continuar a trabalhar com apenas um arquivo.

Figura 1. O contêiner do formato de arquivo na versão 2007

Nas versões anteriores do Office, os desenvolvedores que desejam manipular o conteúdo de um documento do Office precisavam saber como ler e gravar dados de acordo com o armazenamento estruturado definido dentro do arquivo binário. Esse processo é complexo e desafiador, em especial porque os formatos de arquivo binário do Office foram desenvolvidos para serem acessados principalmente por meio de aplicativos do Office. Os formatos refletiam as estruturas da memória dos aplicativos e podiam ser executados em computadores com pouca memória e discos rígidos lentos. Além disso, a alteração de arquivos binários do Office de maneira programática sem os aplicativos do Office foi identificada como a causa principal da corrupção de arquivos. Isso intimidava alguns desenvolvedores até mesmo de tentar alterar os arquivos.

O ZIP foi escolhido como o formato de pacote para os Formatos XML do Office por ser um padrão bem-compreendido na indústria. Há muitas ferramentas disponíveis atualmente para se trabalhar com o formato ZIP e seu uso fornece uma estrutura flexível e modular que permite uma expansão de funcionalidade, em constante avanço. Portanto, você tem acesso a todo o conteúdo de documentos do Microsoft Office 2007 usando qualquer uma das várias ferramentas e tecnologias que funcionam com arquivos ZIP padrão da indústria. Depois de abrir um arquivo de contêiner, é possível manipular qualquer uma das partes do documento encontradas dentro do pacote que define o documento. Por exemplo, é possível abrir um documento do Word 2007 que usa os Formatos XML do Office, localizar a parte XML que representa o corpo do documento do Word, alterar essa parte usando qualquer tecnologia capaz de editar XML e retornar a parte XML ao pacote do contêiner para criar um documento atualizado do Office.

Partes

Dentro de um pacote de Formatos XML do Office, muitas partes lógicas do arquivo são armazenadas como arquivos ou partes individuais. Essa modularidade é uma das importantes características do formato do arquivo. A modularidade permite localizar uma parte específica de forma rápida, e trabalhar diretamente com aquela parte apenas. É possível editar, trocar ou até mesmo remover partes do documento, dependendo do resultado desejado de uma necessidade comercial específica.

Todos os aplicativos do Office compartilham alguns tipos de partes, como miniaturas, metadados, mídia e partes de relação. Outras partes existem consistentemente dentro de todos os arquivos como uma parte específica, como as propriedades do documento. No entanto, muitas partes são exclusivas ao tipo de documento do aplicativo que representam. Por exemplo, uma parte de planilha é encontrada apenas em um documento Excel, enquanto uma parte de slide mestre aparece apenas em um documento do PowerPoint.

É importante observar que, com apenas algumas exceções definidas dentro das Open Packaging Conventions, a estrutura real do diretório do arquivo é arbitrária. São as relações dos arquivos dentro do pacote, não a estrutura de arquivos, que determinam a validade do arquivo. É possível reorganizar e renomear as partes de um arquivo de Formatos XML do Office (2007) dentro de seu contêiner ZIP, desde que você atualize as relações apropriadamente de forma que as partes do documento continuem a se relacionar conforme projetado. Se as relações forem precisas, o arquivo será aberto sem erros. A estrutura de arquivos inicial de um arquivo de Formatos XML do Office é a estrutura padrão que é criada. A estrutura padrão permite determinar facilmente a composição de arquivos de Formatos XML do Office. Desde que as relações sejam mantidas atualizadas, é possível alterar essa estrutura de arquivos padrão. Para obter mais informações, consulte o artigo Walkthrough: Word 2007 Open XML File Format (em inglês).

As partes podem ter tipos de conteúdo diferentes. As partes usadas para descrever aplicativos do Microsoft Office são armazenadas como XML. Essas partes são compatíveis com o esquema de referência do XML, que define o recurso ou objeto associado do Office. Por exemplo, em um arquivo do Excel 2007, os dados que representam uma planilha são encontrados em uma parte XML que obedece ao esquema do Office para uma planilha do Excel. Além disso, se houver várias planilhas na pasta de trabalho, haverá uma parte XML correspondente armazenada no arquivo do pacote para cada planilha. Todos os esquemas que representam as partes padrão dos documentos do Office serão totalmente documentadas e disponibilizadas pela Microsoft com uma licença de uso isenta de pagamentos de royalties. Assim, por meio de qualquer tecnologia padrão baseada em XML, é possível aplicar seu conhecimento dos esquemas do Office para analisar e criar facilmente documentos do Microsoft Office System 2007.

Em muitos cenários, é vantajoso armazenar as partes em seu tipo de conteúdo nativo. Essas partes não são armazenadas como XML. As imagens de um documento da versão 2007 do Office, por exemplo, são armazenadas como arquivos binários (.png, .jpg e outros tipos de arquivo) dentro do pacote do documento. Portanto, é possível abrir o contêiner do pacote usando um aplicativo ZIP e exibir, editar ou substituir a imagem imediatamente em seu formato nativo. Essa abordagem de armazenamento não é apenas mais acessível, ela também exige menos processamento interno e espaço em disco do que o armazenamento de uma imagem como XML codificado. Outras partes importantes armazenadas como partes binárias são os projetos do VBA e os objetos OLE incorporados. (Os objetos OLE incorporados serão binários apenas se o servidor OLE associado fornecer somente uma representação binária. Os documentos incorporados pelo Microsoft Office System 2007, por exemplo, incorporam seu conteúdo como outro pacote.) Para os desenvolvedores, a acessibilidade torna os cenários mais atraentes. Por exemplo, é possível criar uma solução que itera uma coleção de documentos do Microsoft Office System 2007 para atualizar um objeto OLE existente com uma versão mais nova. Você pode chegar a esse e a vários outros cenários sem precisar usar os aplicativos do Office ou alterar o XML específico do documento. As seções a seguir descrevem brevemente algumas das partes comuns a todos os produtos do Office que oferecem suporte aos Formatos XML do Office. Os tipos e números de partes dependem do aplicativo que cria o arquivo de contêiner ZIP. Por exemplo, o Word 2007 cria partes relacionadas a documentos, mas o PowerPoint 2007 cria partes relacionadas a apresentações de slides.

Pasta _rels

Essa pasta contém um arquivo .rels que define as relações raiz dentro do pacote. Esse é o primeiro local ao qual você deve ir para iniciar uma análise de pacote.

Arquivo .rels

Contém relações baseadas na parte inicial (a parte inicial virtual). As relações são definidas com o seguinte formato:

<Relationship Id="someID" Type="relationshipType" Target="targetPart"/> 


onde Id é qualquer cadeia de caracteres, desde que seja exclusiva no arquivo .rels.

Type O tipo de relação, que diferencia as relações e fornece uma dica sobre o objetivo da relação. Ele aponta para o esquema que define os tipos de Formatos XML do Office.

Target Aponta para a pasta e o arquivo que contêm o destino da relação (outra parte).

Tabela 1. Tipos de relações

Tipos de relações internas

  • http://schemas.microsoft.com/office/2006/relationships/officeDocument

  • http://schemas.microsoft.com/office/2006/relationships/vbaProject

  • http://schemas.microsoft.com/office/2006/relationships/userXmlData

  • http://schemas.microsoft.com/office/2006/relationships/hyperlink

  • http://schemas.microsoft.com/office/2006/relationships/styleSheet

  • http://schemas.microsoft.com/office/2006/relationships/comments

  • http://schemas.microsoft.com/office/2006/relationships/oleObject

  • http://schemas.microsoft.com/office/2006/relationships/e2Object

  • http://schemas.microsoft.com/office/2006/relationships/e1Object

  • http://schemas.microsoft.com/office/2006/relationships/image

  • http://schemas.microsoft.com/office/2006/relationships/sound

  • http://schemas.microsoft.com/office/2006/relationships/movie

  • http://schemas.microsoft.com/office/2006/relationships/slide

  • http://schemas.microsoft.com/office/2006/relationships/layout

  • http://schemas.microsoft.com/office/2006/relationships/notesslide

  • http://schemas.microsoft.com/office/2006/relationships/slidemaster

  • http://schemas.microsoft.com/office/2006/relationships/glossaryDoc

  • http://schemas.microsoft.com/office/2006/relationships/cfChunk

  • http://schemas.microsoft.com/office/2006/relationships/dataStoreItem

  • http://schemas.microsoft.com/office/2006/relationships/embeddedFont

  • http://schemas.microsoft.com/office/2006/relationships/embeddedMetroObject

  • http://schemas.microsoft.com/office/2006/relationships/chart

  • http://schemas.microsoft.com/office/2006/relationships/activeXControl

  • http://schemas.microsoft.com/office/2005/relationships/diagram

  • http://schemas.microsoft.com/office/2005/relationships/diagramData

  • http://schemas.microsoft.com/office/2005/relationships/diagramStyle

  • http://schemas.microsoft.com/office/2005/relationships/diagramColorTrans

  • http://schemas.microsoft.com/office/2005/relationships/diagramDefinition

  • http://schemas.microsoft.com/package/2005/02/md/core-properties

  • http://schemas.microsoft.com/office/2006/relationships/docPropsApp

  • http://schemas.microsoft.com/office/2006/relationships/docPropsCustom

  • http://schemas.microsoft.com/ office/2006/relationships/documentThumbnail

  • http://schemas.microsoft.com/office/2006/relationships/glossaryDoc

Parte Documento principal

O destino da relação http://schemas.microsoft.com/office/2006/relationships/officeDocument é a parte principal que define o documento (a parte da apresentação para o PowerPoint, a parte da pasta de trabalho para o Excel ou a parte do documento para o Word). Todas as outras relações são baseadas na parte Documento principal.

Pasta aplicativo (como Word)

Contém os arquivos do documento que são específicos de aplicativo. Por exemplo (para o Word):

  • wordDocument.xml Contém os dados (texto) do documento, além das configurações de estilo e de fonte.

  • footer.xml Contém informações sobre os rodapés do documento, como em qual página eles aparecem e algumas informações sobre estilo.

  • header.xml Contém informações semelhantes àquelas encontradas na pasta footer.xml, porém referentes aos cabeçalhos.

  • wordDocument.doc É uma cópia do documento original.

  • styles.xml Contém informações sobre os estilos encontrados no documento, como tamanhos de fonte, estilos de tabela e listas com marcadores.

Arquivo de áudio

Contém qualquer arquivo do tipo áudio, como arquivos .mid, .mp3 ou .wav.

Arquivo Content_Types.xml

Fornece uma listagem dos tipos de conteúdo das outras partes contidas no pacote. Os tipos de conteúdo são definidos como os tipos de partes que podem ser armazenados em um pacote:

Tabela 2. Tipos de conteúdo em um contêiner ZIP

Tipos de conteúdo internos

application/vnd.ms.powerpoint.template.macroEnabled.12

application/x-font

application/vnd.ms-excel.12

application/x-font

application/vnd.ms-excel.addin.12

application/xml

application/vnd.ms-excel.binary.12

audio/aiff

application/vnd.ms-excel.macroEnabled.12

audio/basic

application/vnd.ms-excel.macroEnabledTemplate.12

audio/midi

application/vnd.ms-excel.template.12

audio/mp3

application/vnd.ms-metro.core-properties+xml

audio/mpegurl

application/vnd.ms-metro.relationships+xml

audio/wav

application/vnd.ms-office.activeX+xml

audio/x-ms-wax

application/vnd.ms-office.chart

audio/x-ms-wma

application/vnd.ms-office.vbaProject

image/bmp

application/vnd.ms-powerpoint.

image/gif

application/vnd.ms-powerpoint.macroEnabled.12

image/jpeg

application/vnd.ms-powerpoint.main.12+xml

image/png

application/vnd.ms-powerpoint.presentation.12

image/tiff

application/vnd.ms-powerpoint.show.12

image/xbm

application/vnd.ms-powerpoint.show.macroEnabled.12

image/x-icon

application/vnd.ms-powerpoint.template.12

video/avi

application/vnd.ms-word.document.12

video/mpeg

application/vnd.ms-word.document.macroEnabled.12

video/mpg

application/vnd.ms-word.document.macroEnabled.main+xml

video/x-ivf

application/vnd.ms-word.document.main+xml

video/x-ms-asf

application/vnd.ms-word.fontTable+xml

video/x-ms-asf-plugin

application/vnd.ms-word.listDefs+xml

video/x-ms-wm

application/vnd.ms-word.settings+xml

video/x-ms-wmv

application/vnd.ms-word.styles+xml

video/x-ms-wmx

application/vnd.ms-word.subDoc+xml

video/x-ms-wvx

application/vnd.ms-word.template.12

 

application/vnd.ms-word.template.macroEnabled.12

 

application/vnd.ms-word.template.macroEnabled.main+xml

 

application/vnd.ms-word.template.main+xml

 

Parte Propriedades do documento

Contém as propriedades principais do documento definidas para todos os arquivos compatíveis com o formato XPS, como:

  • Autor

  • Título

  • Assunto

  • Comentários

  • Data da Última Gravação

  • Data de Criação

Relações

As partes são elementos individuais que compõem um documento da versão 2007 do Office. As relações são o método usado para especificar como a coleção de partes se relaciona para formar o documento propriamente dito. O XML é usado para definir relações. As relações especificam a conexão entre uma parte de origem e um recurso de destino. Por exemplo, é possível identificar a conexão entre um slide e uma imagem que aparece nesse slide por meio de uma relação. As relações são armazenadas dentro de partes XML ou "partes de relação" no contêiner do documento. Se uma parte de origem tiver várias relações, todas as relações subseqüentes serão listadas na mesma parte de relação XML

As relações desempenham uma função importante nos Formatos XML do Office. Cada parte do documento é indicada por pelo menos uma relação. O uso de relações possibilita descobrir como uma parte se relaciona à outra sem que seja necessário examinar o conteúdo das partes. Dentro das partes, todas as referências a relações são representadas por uma Identificação de Relação, o que permite que todas as conexões entre as partes permaneçam independentes do esquema específico de conteúdo.

Figura 2. Diagrama de relações de alto nível de uma pasta de trabalho do Excel 2007

A seguir é fornecido um exemplo de uma parte de relação em uma pasta de trabalho do Excel 2007 que contém duas planilhas:

<Relationships xmlns="http://schemas.microsoft.com/package/2005/06/relationships"> 
<Relationship ID="rId3" 
   Type="http://schemas.microsoft.com/office/2005/8/relationships/xlStyles"
      Target="styles.xml"/> 
   <Relationship ID="rId2" 
Type="http://schemas.microsoft.com/office/2005/8/relationships/xlWorksheet" 
         Target="worksheets/Sheet2.xml"/> 
   <Relationship ID="rId1" 
      Type="http://schemas.microsoft.com/office/2005/8/relationships/xlWorksheet" 
         Target="worksheets/Sheet1.xml"/> 
   <Relationship ID="rId5" 
Type="http://schemas.microsoft.com/office/2005/8/relationships/xlMetadata" 
         Target="metadata.xml"/> 
   <Relationship ID="rId4" 
Type="http://schemas.microsoft.com/office/2005/8/relationships/xlSharedStrings" 
         Target="strings.xml"/> 
</Relationships>

Também é importante observar que as relações representam não apenas referências internas do documento, mas também recursos externos. Por exemplo, se um documento contiver imagens ou objetos vinculados, eles também serão representados por meio de relações. Isso facilita a localização, a inspeção e a alteração de links em um documento para fontes externas. Esse recurso oferece a oportunidade de reparar links externos desfeitos, validar fontes desconhecidas ou remover links potencialmente prejudiciais.

O uso de relações nos Formatos XML do Office beneficia os desenvolvedores de várias maneiras. As relações simplificam o processo de localização de conteúdo dentro de um documento porque não é preciso analisar XML específico de documento para localizar partes. Também não é preciso analisar XML específico de documento para localizar recursos internos e externos do documento. As relações permitem fazer o inventário de todo o conteúdo dentro de um documento rapidamente. Por exemplo, se você precisar contar o número de planilhas de uma pasta de trabalho do Excel, poderá inspecionar as relações de quantas partes de planilha existem. Também é possível usar as relações para examinar o tipo de conteúdo de um documento. Isso é útil em situações nas quais você precisa identificar se um documento contém um tipo específico de conteúdo que pode ser prejudicial (como um objeto OLE suspeito) ou útil (como em um cenário onde você deseja extrair todas as imagens JPEG de um documento para reutilizar em outro lugar).

As relações também permitem manipular documentos sem que seja preciso aprender a sintaxe ou a marcação específica do aplicativo. Por exemplo, sem qualquer conhecimento de como programar o PowerPoint, a solução de um desenvolvedor pode facilmente remover slides de uma apresentação editando as relações do documento.

Arquivos habilitados para macro versus arquivos sem macro

Os documentos do Microsoft Office System 2007 padrão salvos nos Formatos XML do Office foram projetados como arquivos sem macro e, portanto, não podem conter código. Esse comportamento garante que códigos mal-intencionados que residam em um documento padrão nunca possam ser executados inesperadamente. Embora os documentos do Microsoft Office System 2007 ainda possam conter e usar macros, o usuário ou desenvolvedor deve salvar esses documentos como um tipo de documento habilitado para macro. Essa defesa não afeta sua capacidade de criar soluções, mas permite que as organizações usem documentos com mais confiança.

Os documentos do Microsoft Office System 2007 padrão salvos nos Formatos XML do Office foram projetados como arquivos sem macro e, portanto, não podem conter código. Esse comportamento garante que códigos mal-intencionados que residam em um documento padrão nunca possam ser executados inesperadamente. Embora os documentos do Microsoft Office System 2007 ainda possam conter e usar macros, o usuário ou desenvolvedor deve salvar esses documentos como um tipo de documento habilitado para macro. Essa defesa não afeta sua capacidade de criar soluções, mas permite que as organizações usem documentos com mais confiança.

Agora é possível determinar se existe algum código dentro de um documento do Microsoft Office System 2007 antes de abri-lo. Antes, esse "aviso prévio" não era algo que podia ser conseguido facilmente fora do Office. Você pode inspecionar o arquivo do pacote quanto à existência de quaisquer relações e partes baseadas em código sem executar o Office e sem executar código potencialmente perigoso. Se um arquivo parecer suspeito, você poderá remover do arquivo qualquer uma das partes capazes de executar código, para que o código não possa provocar nenhum dano.

Extensões de nomes de arquivos

Os documentos do Microsoft Office System 2007 salvos usando os Formatos XML do Office têm novas extensões de nomes de arquivos que permitem que o Office diferencie esses documentos de formato de arquivo dos documentos binários usados pelas versões anteriores do Office. As novas extensões emprestam as extensões dos nomes de arquivos binários existentes anexando uma letra ao final do sufixo. As extensões padrão de documentos criados no Word 2007, Excel 2007 e PowerPoint 2007 usando os novos formatos de arquivo anexam a letra "x", e são .docx, .xlsx e .pptx, respectivamente. Outros tipos de documento do Office que usam os novos formatos de arquivo (incluindo modelos, complementos e apresentações do PowerPoint) também recebem novas extensões.

Outra novidade introduzida na versão 2007 do Office é que existem extensões diferentes para os arquivos que são habilitados para macro versus os arquivos sem macro. Os documentos habilitados para macro incluem uma extensão de nome de arquivo que termina com a letra "m" em vez de um "x". Por exemplo, um documento do Word 2007 habilitado para macro tem a extensão .docm e, portanto, permite que qualquer usuário ou aplicativo de software identifique que um documento contém código antes de abri-lo.

Tabela 3. Lista de extensões de nomes de arquivos para tipos de documento no Office versão 2007

Tipo de arquivo do Word 2007

Extensão

Documento XML do Word 2007

.docx

Documento XML do Word 2007 habilitado para macro

.docm

Modelo XML do Word 2007

.dotx

Modelo XML do Word 2007 habilitado para macro

.dotm

Tipo de arquivo do Excel 2007

Pasta de trabalho XML do Excel 2007

.xlsx

Pasta de trabalho XML do Excel 2007 habilitada para macro

.xlsm

Modelo XML do Excel 2007

.xltx

Modelo XML do Excel 2007 habilitado para macro

.xltm

Pasta de trabalho binária do Excel 2007

.xlsb

Complemento XML do Excel 2007 habilitado para macro

.xlam

Tipo de arquivo do PowerPoint 2007

Extensão

Apresentação XML do PowerPoint 2007

.pptx

Apresentação XML do PowerPoint 2007 habilitada para macro

.pptm

Modelo XML do PowerPoint 2007

.potx

Modelo XML do PowerPoint 2007 habilitado para macro

.potm

Complemento XML do PowerPoint 2007 habilitado para macro

.ppam

Apresentação XML do PowerPoint 2007

.ppsx

Apresentação XML do PowerPoint 2007 habilitada para macro

.ppsm

Desenvolvendo soluções com os Formatos XML do Office

Os Formatos XML do Office introduzem ou aprimoram muitos tipos de soluções que envolvem documentos que você pode criar. Você pode acessar o conteúdo de um documento do Office nos novos formatos de arquivo usando qualquer ferramenta ou tecnologia capaz de trabalhar com arquivos ZIP. Pode, então, manipular o conteúdo do documento usando qualquer técnica de processamento XML padrão ou, para as partes existentes como formatos nativos incorporados (como imagens), fazer o processamento usando qualquer ferramenta apropriada para esse tipo de objeto.

Além disso, a possibilidade de abrir o arquivo de contêiner de um documento do Microsoft Office System 2007 manualmente como um arquivo ZIP tem alguns benefícios interessantes para os desenvolvedores. Por exemplo, ao criar soluções baseadas no Office, é possível examinar o conteúdo e a estrutura de um documento sem precisar escrever nenhum código. Esse recurso pode ser muito útil para o design de soluções e na criação de protótipos.

Depois que você está dentro de um documento do Microsoft Office System 2007, a estrutura facilita a navegação pelas partes de um documento e por suas relações, seja para localizar informações, alterar conteúdo ou remover elementos de um documento. O uso de XML, além dos esquemas de referência publicados do Office, significa que você pode facilmente criar documentos adicionais, adicionar dados a documentos existentes ou pesquisar conteúdo específico em vários documentos.

O restante deste artigo explora alguns cenários nos quais os Formatos XML do Office habilitam soluções baseadas em documentos. Eles são apenas uma parte de uma lista quase interminável de possibilidades:

  • Interoperabilidade de dados

  • Manipulação de conteúdo

  • Compartilhamento e reutilização de conteúdo

  • Assembly de documentos

  • Segurança de documentos

  • Gerenciamento de informações confidenciais

  • Determinação de estilos de documentos

  • Criação de perfis de documentos

Interoperabilidade de dados

O desenvolvimento do XML como um padrão popular para a troca de dados significa que os novos Formatos XML do Office tornam os dados baseados em documentos mais acessíveis entre sistemas heterogêneos. Estejam alguns usuários compartilhando dados de documentos em um departamento ou duas organizações trocando dados comerciais, o XML como um formato de arquivo padrão para documentos do Microsoft Office significa que os aplicativos do Office podem participar de processos comerciais sem as limitações anteriormente impostas pelos formatos binários.

A abertura dos novos formatos de arquivo desbloqueia dados e introduz um novo e amplo nível de integração que vai além da área de trabalho. Por exemplo, você pode fazer referência à especificação publicada dos novos formatos de arquivo para criar documentos de dados sofisticados sem usar um aplicativo do Office. Os aplicativos do servidor podem processar documentos em massa para habilitar soluções em grande escala que combinam dados empresariais dentro dos aplicativos familiares e flexíveis do Office. Você pode usar protocolos XML padrão, como o XPath (uma linguagem de consulta XML comum) e o XSTL para recuperar dados de documentos ou atualizar o conteúdo de um documento a partir de dados externos.

Esse tipo de cenário pode envolver a personalização de milhares de documentos para distribuição a clientes. Você pode inserir informações de maneira programática em um modelo de documento padrão usando um aplicativo de servidor que use XML extraído de um banco de dados empresarial ou de um aplicativo CRM (Gerenciamento de relacionamento com o cliente). A criação desses documentos é altamente eficiente porque não há requisito da execução de aplicativos do Office, embora a capacidade de produzir documentos do Office sofisticados e de alta qualidade ainda exista.

O uso de esquemas personalizados no Office é outra maneira de usar documentos para compartilhar dados. Informações que antes eram bloqueadas em um formato binário, agora podem ser facilmente acessadas e, portanto, os documentos podem servir como fontes de dados intercambiáveis de forma aberta. Os esquemas personalizados não apenas simplificam a inserção ou extração de dados, como também adicionam estrutura a documentos e são capazes de aplicar a validação de dados.

Manipulação de conteúdo

A edição do conteúdo de documentos existentes do Office é outro exemplo valioso de aprimoramento de processo dos Formatos XML do Office. A edição pode envolver a atualização de pequenas quantidades de dados, a troca de partes inteiras, a remoção de partes ou a adição de partes completamente novas. Com o uso de relações e partes, os novos formatos de arquivo tornam o conteúdo mais fácil de localizar e manipular. O uso do XML e do esquema XML significa que você pode usar tecnologias XML comuns, como XPath e XSLT, para editar dados dentro de partes do documento de maneiras virtualmente infinitas.

Um cenário poderia envolver a necessidade de editar texto no cabeçalho de um documento do Word. Naturalmente, não é lógico automatizar essa tarefa para um documento. Mas, em outro cenário, e se uma empresa tivesse passado por uma fusão e precisasse atualizar seu novo nome no cabeçalho de centenas de diferentes documentos? Um desenvolvedor poderia gravar o código para fazer o loop por todos os documentos, localizar a parte do cabeçalho na estrutura do arquivo do Word e executar uma consulta XPath para localizar o texto antigo. Em seguida, ele poderia inserir o novo texto, substituir a parte do cabeçalho e repetir o processo até que todos os documentos estivessem atualizados. A automação poderia economizar muito tempo, habilitar um processo que de outra forma não poderia ser tentado e evitar os erros potenciais de um processo manual.

Outro cenário poderia ser um no qual um documento existente do Office precisasse ser atualizado, alterando-se apenas uma parte inteira. Em uma pasta de trabalho do Excel 2007, você poderia substituir uma planilha inteira que contivesse dados antigos ou modelos de cálculo desatualizados por uma nova planilha substituindo sua parte. Esse tipo de atualização também se aplica a partes binárias. Você poderia trocar uma imagem existente ou até mesmo um objeto OLE por um novo, se necessário. Você poderia atualizar um desenho do Microsoft Office Visio incorporado como um objeto OLE em documentos do Office, por exemplo, substituindo essa parte binária. Você poderia atualizar URLs em hiperlinks para que elas apontassem para novos locais.

A seguir são fornecidos alguns cenários adicionais específicos de aplicativo.

Manipulação de conteúdo no Word 2007

É uma prática comercial comum incorporar timbres a um documento do Word. Por exemplo, um aviso de isenção de responsabilidade oficial ou de isenção de responsabilidade sobre termos e condições pode ser obrigatório em todos os documentos públicos criados por uma organização. Outro exemplo típico de timbre é uma seção de "Visão geral da empresa" usada na criação de propostas de vendas ou em publicações de anúncios da empresa. O Word oferece recursos, como o AutoTexto, que podem executar a inserção de texto formatado, mas esse recurso é limitado em escala, porque exige a automação do Word ou a interação direta do usuário.

O Word 2007 oferece uma alternativa muito flexível para inserir conteúdo em um documento. O Formato XML do Word permite adicionar partes de documento, chamadas de blocos de construção, às quais é feita uma referência pelo documento geral quando ele é aberto no Word. Isso significa que é possível criar uma biblioteca de blocos de construção de documento, que podem ser derivados de formatos de documento que o Word é capaz de processar e reutilizar programaticamente conforme necessário em soluções de documento do Word.

Essa capacidade mais ampla de manipular conteúdo do Word oferece alguns cenários interessantes, como o assembly de documentos no servidor. Voltando ao exemplo fornecido anteriormente, é possível inserir, de forma automática, um aviso de isenção de responsabilidade em um documento criado em um servidor. Imagine uma multinacional que exija que todos os seus documentos contenham um aviso de isenção de responsabilidade nos idiomas locais. A empresa pode criar os avisos de isenção de responsabilidade específicos aos idiomas apropriados como arquivos .html e salvá-los em um servidor. Um aplicativo que esteja construindo os documentos pode inserir o fragmento de documento correspondente no idioma necessário como uma parte dentro do contêiner do documento. Em seguida, esse fragmento é processado como uma parte transparente de um documento do Word.

Manipulação de conteúdo no Excel 2007

Para otimizar o carregamento e economizar em desempenho e tamanho de arquivo, o Excel 2007 armazena apenas uma cópia do texto repetitivo dentro do arquivo do Excel. Para isso, o Excel implementa uma tabela de cadeia de caracteres em uma parte do documento especificada pelo destino da relação http://schemas.microsoft.com/office/2005/8/relationships/xlSharedStrings. Cada valor de texto exclusivo encontrado dentro de uma pasta de trabalho é listado uma vez nessa parte. Em seguida, células individuais da planilha fazem referência à tabela de cadeia de caracteres para derivar seus valores.

Embora esse processo otimize o Formato XML do Excel, ele também introduz algumas oportunidades interessantes para outras soluções de manipulação de conteúdo. Os desenvolvedores de uma organização multinacional usam a tabela de cadeia de caracteres compartilhada para oferecer um nível de suporte multilíngüe. Em vez de criar pastas de trabalho exclusivas para cada idioma com suporte, uma única pasta de trabalho pode usar tabelas de cadeia de caracteres que correspondam a diferentes idiomas. Outra possibilidade é usar tabelas de cadeia de caracteres para pesquisar termos de palavras-chave dentro de uma coleção de pastas de trabalho. O processamento de um único documento XML de cadeia de caracteres contendo apenas texto é mais rápido e simples do que manipular o modelo de objeto do Excel em muitas planilhas e pastas de trabalho.

Manipulação de conteúdo no PowerPoint 2007

Quando uma apresentação do PowerPoint 2007 é armazenada no Formato XML do PowerPoint, o conteúdo permanece altamente acessível. Como essa é a primeira versão do PowerPoint a oferecer um formato XML, ela abre muitos cenários que não eram possíveis nas versões anteriores. Agora você tem acesso total a slides e anotações de slides na forma de texto. Soluções que exigem pesquisa, indexação e criação de conteúdo de apresentação agora são possíveis. É possível produzir facilmente apresentações orientadas a dados usando XML. E você pode acessar slides mestres e layouts de slide por meio de partes XML para formatar programaticamente apresentações do PowerPoint novas ou existentes.

É possível usar uma abordagem diferente para o assembly ou a reutilização do conteúdo de apresentações do PowerPoint criando um aplicativo que utilize um catálogo de slides armazenados independentemente das apresentações existentes. Os slides são representados como partes XML individuais, portanto, uma solução pode otimizar a maneira como uma organização armazena e gerencia slides do PowerPoint 2007 como dados. É possível até escrever um "visualizador" de slides que permita que um usuário descubra e selecione slides para criar uma apresentação fora do PowerPoint. O aplicativo pode até mesmo ser baseado na Web, para permitir o gerenciamento centralizado.

Compartilhamento e reutilização de conteúdo

A modularidade dos Formatos XML do Office abre a possibilidade de gerar conteúdo uma vez e realocá-lo para vários outros documentos. Como um desenvolvedor, você pode imaginar a criação de vários modelos básicos e a reutilização das partes como blocos de construção para outros documentos. Você pode usar uma tabela criada em um documento do Word, por exemplo, em outros documentos do Word. Pode criar gráficos (que têm um esquema comum entre os aplicativos do Microsoft Office System 2007) uma vez e reutilizá-los várias vezes em diferentes tipos de documentos. A acessibilidade do formato cria oportunidades ilimitadas de compartilhamento de conteúdo.

Um cenário desse tipo pode ser um no qual haja uma necessidade de criar um repositório de imagens usadas em documentos. Você pode criar uma solução que extraia as imagens de uma coleção de documentos do Office e permita que os usuários as reutilizem a partir de um único ponto de acesso. Como os documentos do Office na versão 2007 armazenam imagens intactas como partes binárias, é possível criar a solução e manter uma biblioteca de imagens facilmente. Em seguida, os usuários que desejarem incorporar imagens usadas anteriormente não precisarão procurar na coleção inteira de documentos, abrindo e fechando cada um deles, para localizar imagens. Eles podem usar o aplicativo personalizado para localizar as imagens no repositório e inseri-las imediatamente no documento com o qual estão trabalhando.

É possível criar um aplicativo semelhante que reutiliza imagens em "miniatura" extraídas de documentos e adicionar um aspecto visual a um processo de gerenciamento de documentos.

Assembly de documentos

Uma das solicitações mais comuns dos desenvolvedores é a capacidade de criar documentos do Microsoft Office em um servidor sem automatizar os aplicativos do Microsoft Office. As organizações que precisam produzir documentos complexos e de dados sofisticados ou montar documentos em grandes quantidades desejam um processamento eficiente para fins avançados. Tecnicamente, os aplicativos do Office não eram escritos para serem executados a partir de um servidor e não tinham suporte a esse recurso.

Nas edições do Microsoft Office 2003, a introdução de formatos de documento XML que podiam ser produzidos de acordo com os Esquemas de Referência XML do Office 2003 ajudavam a superar essa limitação. Qualquer tecnologia capaz de montar XML pode criar um documento do Word ou do Excel, desde que siga os esquemas do Office. Na época, esse foi um enorme avanço, mas, infelizmente, se aplicava apenas ao Excel e ao Word, e somente o Word, na verdade, oferecia fidelidade total em seu suporte a arquivos XML. A versão 2007 do Office é criada sobre esse esforço, adicionando arquivos XML do PowerPoint e garantindo que os arquivos XML do PowerPoint e do Excel também sejam de fidelidade total.

Esse avanço da tecnologia significa que, com a versão 2007 do Office, você pode criar uma solução do Office que produza documentos do Excel, do Word e do PowerPoint sem jamais abrir o Office. A solução deve criar o XML de acordo com os esquemas da versão 2007 e criar o conteúdo do pacote conforme definido pelos Formatos XML do Office. Embora os esquemas do Office sejam bastante extensos, para representar completamente os conjuntos de recursos avançados que os aplicativos do Microsoft Office fornecem, todas as estruturas definidas pelo formato não precisam gerar um documento. Cada um dos aplicativos do Office é capaz de abrir o arquivo com uma quantidade mínima de itens definidos, facilitando assim a criação de muitos documentos.

Observe que o assembly de documentos não diz respeito apenas aos novos documentos. É claro que, seguindo as regras dos Formatos XML do Office, é possível criar documentos de forma programada, sem usar o Office. Mas o assembly de documentos normalmente significa criar documentos usando partes de documentos, dados e outros tipos de conteúdo existentes. Os novos Formatos XML do Office se adaptam bem a esse cenário porque têm uma arquitetura modular e seu conteúdo é baseado em XML.

Um exemplo de assembly de documento também se aplica às apresentações do PowerPoint. Muitas organizações têm uma vasta coleção de arquivos do PowerPoint com valor reutilizável. Em geral, os usuários emprestam slides de várias apresentações preexistentes para criar uma apresentação adicional ou relacionada. Localizar, coordenar e integrar (copiar e colar) slides normalmente é um processo demorado e redundante, que muitas organizações desejam que seja automatizado para as apresentações destinadas a clientes. Com a versão 2007 do Office, os slides individuais dentro de um arquivo de apresentação do PowerPoint estão prontamente acessíveis porque cada um deles é autocontido em sua própria parte XML, dentro do pacote do contêiner da apresentação. Uma solução personalizada pode usar essa arquitetura para automatizar totalmente o processo de assembly de apresentações. É possível usar XML personalizado para manter metadados pertencentes a slides individuais, permitindo que os usuários pesquisem facilmente usando palavras-chave predefinidas. Depois que um usuário seleciona um slide, a solução insere a parte XML do slide na apresentação montada e cria a relação de referência.

Segurança de documentos

A segurança é muito importante atualmente na tecnologia de informações. Os Formatos XML do Office ajudam a ter mais confiança no trabalho com documentos do Office e no fornecimento de soluções que levem em conta a segurança dos documentos. Com os novos formatos de arquivo, você pode criar soluções que pesquisem e removam todas as vulnerabilidades potenciais identificadas antes que elas causem problemas.

Por exemplo, uma empresa precisa de uma solução para preparar documentos para armazenamento em uma biblioteca de arquivos, na qual jamais é preciso executar código personalizado, ou enviar documentos sem macro a um cliente, É possível escrever um aplicativo que remove todo o código VBA de vários documentos do Office fazendo a iteração pelos documentos e removendo a parte especificada pelo destino da relação http://schemas.microsoft.com/office/2006/relationships/vbaProject. O resultado é uma coleção de documentos de qualidade mais alta.

Além disso, os Formatos XML do Office fornecem apenas um tipo de arquivo para cada produto na versão 2007 (.docm para Word, .xlsm para Excel e .pptm para PowerPoint) no qual é possível executar código de macro. Todos os tipos de arquivo que não terminam com o sufixo "m", mesmo os que contêm código de macro, não executarão o código. Isso ajuda a garantir que os usuários estejam protegidos contra software mal-intencionado ao trabalhar com esses tipos de arquivos.

Infelizmente, o código de macro não é a única ameaça potencial de segurança para os usuários do Office. Há pouco tempo foram detectadas vulnerabilidades de segurança em arquivos .jpg binários. É possível evitar riscos potenciais de arquivos binários, como objetos OLE e imagens, interrogando os documentos do Office e removendo todas as exposições que vierem a surgir. Por exemplo, se um objeto OLE específico for identificado como uma ameaça de segurança conhecida, você poderá criar um aplicativo para localizar e limpar ou colocar em quarentena todo documento que contenha o objeto. Da mesma forma, é possível identificar prontamente toda referência externa feita em um documento do Microsoft Office System 2007 examinando-se as partes de relação. Essa identificação permite que os desenvolvedores de soluções decidam se os recursos externos com referências de/para um documento são confiáveis ou se exigem ação corretiva.

É possível bloquear partes por tipo de conteúdo ou por relação. Por exemplo, se um administrador de TI ficar sabendo que imagens .gif podem conter uma ameaça de segurança, poderão ser usadas configurações de diretiva de grupo para desabilitar o carregamento de conteúdo de imagem/gif em documentos do Microsoft Office System 2007. Depois de implantar patches de segurança adequados, a configuração poderá ser desativada e o administrador de TI poderá ter certeza de que os usuários foram protegidos com rapidez.

Também é possível bloquear partes por meio de diretivas de formato. Por exemplo, se o administrador de TI descobrir uma vulnerabilidade na qual comentários malformados podem provocar falha no PowerPoint com um estouro de buffer explorável, os usuários e seus computadores poderão ser protegidos pela implantação de uma diretiva de formato de arquivo do Office. Desta vez, em vez de bloquear por tipo de conteúdo (como este é um caso de XML contendo texto), os comentários são bloqueados especificamente por meio do bloqueio da relação schemas.microsoft.com/office/2006/relationships/comments. Para fazer isso, os administradores podem usar os modelos de diretiva do Microsoft Office (arquivos .adm) para definir essas opções. Para obter mais informações sobre o uso de modelos de diretiva do Office, consulte o artigo da Base de Dados de Conhecimento Microsoft Administrators Can Use Office Policy Templates with the Group Policy Settings of Windows (em inglês).

Gerenciamento de informações confidenciais

Ao tentar proteger os usuários contra conteúdo mal-intencionado, você também pode ajudar a protegê-los contra o compartilhamento acidental de dados. Esses dados inadequados podem ter a forma de informações de identificação pessoal armazenadas dentro de um documento ou alterações, comentários e anotações controladas, marcados dessa forma para que não saiam do departamento ou da organização. Você poderá remover programaticamente os dois tipos de informações de forma direta, sem precisar varrer um documento inteiro. Para remover comentários de documentos, por exemplo, você pode verificar se existe uma relação de parte de comentário e, se ela for encontrada, remover a parte de comentário associada.

Além de proteger informações de identificação pessoal e comentários, os Formatos XML do Office permitem o acesso a essas informações, que podem ser úteis de outras maneiras. Você pode criar uma solução que use dados de informações de identificação pessoal para retornar uma lista de documentos criados por uma única pessoa ou por uma organização específica. Com os novos formatos de arquivo, é possível produzir essa lista sem precisar abrir o Office ou usar seu modelo de objeto. Da mesma forma, um aplicativo pode fazer um loop por uma pasta ou um volume de documentos do Office e agregar todos os comentários dentro dos documentos. É possível aplicar critérios adicionais para qualificar os comentários e ajudar os usuários a gerenciar melhor o processo de colaboração durante a criação de documentos.

Determinação de estilos de documentos

Assim como muitos outros aspectos de documentos do Office que usam os Formatos XML do Office, os estilos de documento, a formatação e as fontes são mantidos em partes XML separadas dentro do pacote do contêiner. Portanto, mais uma vez, é possível criar soluções que tirem proveito dessa separação. Algumas organizações têm padrões de documento muito específicos, e o gerenciamento desses padrões pode consumir muito tempo. No entanto, você pode, por exemplo, modificar ou substituir fontes de documentos sem abrir o Office. para

Além disso, é muito comum ter um mesmo documento ou uma coleção de documentos com o mesmo conteúdo, mas que foram formatados de maneira diferente por outro departamento, local, subsidiária ou cliente de destino. É possível manter o conteúdo dentro de um único conjunto de documentos e, posteriormente, aplicar um novo conjunto de estilos, conforme necessário. Para fazer isso, você troca a parte especificada pelo destino da relação http://schemas.microsoft.com/office/2006/relationships/styleSheet por outra parte. Essa capacidade de troca simplifica o processo de controle da apresentação de um documento sem a necessidade de gerenciar conteúdo em vários documentos.

Criação de perfis de documentos

O gerenciamento de documentos sempre representou um problema para a tecnologia de informações. No Microsoft Office 2003, você tem acesso às tradicionais propriedades de documentos do Office, como Autor, Título, Assunto e outras propriedades, usando o OLE. Nos novos Formatos XML do Office, as propriedades de documentos também podem ser acessadas facilmente, porque residem em sua própria parte dentro de um documento. É fornecido a seguir um exemplo de uma parte Propriedades do documento de um arquivo .docx do Word.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?> 
<CoreProperties xmlns="http://schemas.microsoft.com/package/2005/06/md/core-properties"> 
   <Title>Word Document Sample</Title> 
   <Subject>Microsoft Office Word 2007</Subject> 
   <Creator>2007 Microsoft Office System User</Creator> 
   <Keywords/> 
   <Description>2007 Microsoft Office system .docx file</Description> 
   <LastModifiedBy>2007 Microsoft Office System User</LastModifiedBy> 
   <Revision>2</Revision> 
   <DateCreated>2005-05-05T20:01:00Z</DateCreated> 
   <DateModified>2005-05-05T20:02:00Z</DateModified> 
</CoreProperties>

No entanto, os documentos do Office que usam os novos formatos de arquivo permitem que você adicione seus próprios dados e conteúdo além daqueles oferecidos pelas propriedades baseadas no Office, como para a criação avançada de perfis de documentos. Você pode criar seu próprio XML personalizado e colocá-lo no arquivo, exatamente como qualquer outra parte. Em seguida, pode usar esse XML com qualquer ferramenta ou aplicativo capaz de acessar Formatos XML do Office.

Usando os novos formatos de arquivo nos produtos do Office

Embora existam muitas partes comuns aos produtos do Office que implementam os novos formatos de arquivo, também existem componentes específicos de cada produto.

A estrutura de formato de arquivo no Excel 2007

Além das partes comuns a todos os produtos do Office (como as partes de dados XML, as partes de relações e as partes de mídia), o Excel também fornece partes separadas para pastas de trabalho, planilhas e entidades como gráficos, exibições dinâmicas de tabelas dinâmicas e assim por diante.

A estrutura de formato de arquivo no PowerPoint 2007

O PowerPoint usa em seu formato de arquivo muitas das mesmas partes usadas pelos outros produtos, com a adição dos objetos específicos à apresentação de slides, como partes de slides individuais, uma parte de slide mestre, dados de apresentação e assim por diante.

A estrutura de formato de arquivo no Word 2007

Da mesma forma, os usuários do Word podem esperar ver partes adicionais relativas a propriedades de documentos, estilos e formatação, rodapés, cabeçalhos, notas de fim e assim por diante.

Modificando arquivos de Formatos XML do Office para personalizar a interface do usuário da Faixa de Opções

As seguintes etapas ilustram a criação de uma interface de usuário da Faixa de Opções personalizada no Excel 2007 que contém os componentes para chamar uma macro personalizada modificando um arquivo de pasta de trabalho habilitado para macro. Neste exemplo, você faz o seguinte:

  • Cria uma pasta de trabalho do Excel com uma macro e salva-a como um arquivo de Formatos XML do Office habilitado para macro (.xlsm).

  • Cria um arquivo de personalização de extensibilidade da Faixa de Opções com uma guia, um grupo e um botão.

  • Especifica um evento de retorno de chamada no botão para chamar a macro criada no documento.

  • Modifica o conteúdo do arquivo de contêiner do documento habilitado para macro para apontar para o arquivo de personalização de extensibilidade da Faixa de Opções.

  • Salva o arquivo habilitado para macro e abre-o no Excel.

Para criar um arquivo de Formatos XML do Office habilitado para macro no Excel

  1. Inicie o Excel 2007.

  2. Clique na guia Desenvolvedor e em Visual Basic.

    Observação: se a guia Desenvolvedor não for exibida, você precisará se identificar como desenvolvedor. Para isso, no aplicativo, clique no Botão Microsoft Office, clique em Opções do Excel, clique em Personalizar e selecione Mostrar guia Desenvolvedor na Faixa de Opções. Essa é uma configuração global e identifica você como um desenvolvedor em todos os outros aplicativos do Office que implementam a interface do usuário da Faixa de Opções.

  3. No Visual Basic Editor, clique duas vezes em EstaPasta de trabalho para abrir a janela de código.

  4. Digite a seguinte sub-rotina do VBA e feche o Visual Basic Editor:

    Sub MyButtonMacro(ByVal ControlID As IRibbonControl)
       Msgbox("Hello world")
    End Sub
    
    
  5. Salve a pasta de trabalho como um arquivo de Formatos XML do Office habilitado para macro (.xlsm).

Para criar o arquivo XML que contém a marcação para modificar a interface do usuário

  1. Crie uma pasta na área de trabalho chamada customUI.

  2. Abra um novo arquivo em um editor de texto e salve-o como customUI.xml na pasta customUI.

  3. Adicione o seguinte código ao arquivo:

    <customUI xmlns="http://schemas.microsoft.com/office/2006/01/customui"> 
       <ribbon startFromScratch="true"> 
          <tabs> 
             <tab id=":CustomTab" label="My Tab"> 
                <group id="SimpleControls" label="Sample Group"> 
                   <button id="Button1" size="large" label="Large Button" 
                      onAction="ThisWorkbook.MyButtonMacro" /> 
                </group> 
             </tab> 
          </tabs> 
       </ribbon> 
    </customUI> 
    
    

Em seguida, modifique alguns dos arquivos contidos no contêiner do arquivo habilitado para macro criado anteriormente:

  1. Adicione uma extensão .zip ao nome do arquivo da pasta de trabalho e clique duas vezes para abrir o arquivo.

  2. Adicione o arquivo de personalização ao contêiner arrastando a pasta customUI da área de trabalho para o arquivo ZIP.

  3. Extraia o arquivo .rels para a área de trabalho. Uma pasta _rels contendo o arquivo .rels é copiada na área de trabalho.

  4. Abra o arquivo .rels e adicione a seguinte linha entre a última marca Relationship e a marca Relationships. Isso cria uma relação entre o arquivo da pasta de trabalho e o arquivo de personalização:

    <Relationship Id="someID" Type="http://schemas.microsoft.com/office/2006/relationships/ui
    /extensibility" Target="customUI/customUI.xml" /> 
    
    
    
  5. Feche e salve o arquivo.

  6. Adicione a pasta _rels ao arquivo de contêiner outra vez, arrastando-o da área de trabalho e substituindo o arquivo existente.

  7. Renomeie o arquivo da pasta de trabalho para seu nome original removendo a extensão .zip.

  8. Abra a pasta de trabalho e observe se a interface do usuário da Faixa de Opções exibe My Tab.

  9. Clique no botão e a caixa de mensagem será exibida.

Conclusão

Usuários, organizações e desenvolvedores se beneficiam das vantagens dos Formatos XML do Office na versão 2007 do Microsoft Office System. Os novos formatos de arquivo, por serem abertos e baseados em XML, criam possibilidades para muitos novos tipos de soluções e cenários que você pode criar. Você pode acessar documentos como fontes de dados, manipulá-los sem usar os aplicativos do Office e processá-los em soluções empresariais. As organizações que combinam investimentos em sistemas comerciais existentes com a plataforma Microsoft Office System, a versão 2007 do Office, e os novos formatos de arquivo baseados em XML só podem obter vantagens.

Recursos adicionais

Para obter mais informações, consulte os seguintes recursos:

  1. Microsoft Office Open XML Formats Frequently Asked Questions (em inglês)

  2. Office 2003 XML Reference Schemas License Overview (em inglês)

  3. Microsoft Office Developer Center (em inglês)

Mostrar: