Site Resilience Configurations

 

適用版本: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

上次修改主題的時間: 2007-10-29

近年來,有越來越多的企業體認到郵件通訊是其致勝的基礎。對許多組織而言,郵件系統必須是營運持續計畫的一部分,且必須在郵件服務部署中納入站台回復性設計。基本上,許多站台回復性解決方案都會採用在第二個資料中心部署備份硬體的方式。此作法經常會衍生出下列基本問題:

  • 主要資料中心失敗後所需的服務等級為何?
  • 使用者需要其資料,還是只需要郵件服務?
  • 資料需求的急迫性如何?
  • 必須支援多少使用者?
  • 使用者將如何存取其資料?
  • 待命資料中心啟動的服務等級協定 (SLA) 為何?
  • 服務如何移回主要資料中心?
  • 資源是否為站台回復性解決方案所專用?

您可以藉由這些問題,著手擬定您的站台回復性郵件解決方案。從站台失敗進行復原的核心需求,是建立適當的解決方案,將必要的郵件資料移至主控郵件服務的備份資料中心。

本主題將詳細說明 Microsoft Exchange Server 2007 之量產發行 (RTM) 版本和 Exchange 2007 Service Pack 1 (SP1) 的數種站台回復性組態。在您開始考量站台回復性解決方案前,建議您先了解下列詞彙:

  • 延伸叢集   亦稱為分散各處的叢集,為叢集節點位於多個資料中心內的叢集組態。
  • 資料庫可攜性   可讓信箱在其主要資料庫移動時,重新定位於不同伺服器上的系統管理工作。
  • 延伸的 Active Directory 站台   包含來自多個資料中心之電腦的 Active Directory 目錄服務站台 (例如,跨越多個實體位置的 Active Directory 站台)。
  • Active Directory 站台成員資格   根據電腦之主要 IP 位址而成為特定 Active Directory 站台的成員。變更 IP 位址,或變更包含該 IP 位址的 Active Directory 站台後,電腦的 Active Directory 站台成員資格即會隨之變更。
  • 生產資料中心   含有服務的作用中伺服器及其相關基礎結構的資料中心。
  • 熱備份資料中心   已備妥且可取得服務的擁有權並繼續其傳遞作業的備份資料中心。在此位置上執行服務並不需要特殊組態。
  • 線上備份資料中心   一個備份資料中心,具有可對生產資料中心取得服務擁有權的伺服器。使用者必須進行手動輸入,才能啟動此資料中心內的服務。
  • 離線備份資料中心   具有足夠的容量和基礎結構以取得服務擁有權的備份資料中心。在此資料中心內執行服務頗為費事。
  • 專用   依設計僅用以支援主要資料中心之使用者的伺服器。
  • 非專用   既支援主要資料中心的使用者、也支援其他位置之使用者的伺服器。

生產線上專用等詞彙可搭配使用,以說明站台復原部署。舉例來說,由專用且大量設定的備份資料中心所備份的生產資料中心,稱為「Production:Warm (專用)」。

支援站台回復性的功能

有數種 Exchange 2007 功能可作為站台回復性解決方案的建置基礎。其中包括:

  • 延伸叢集,可用以複寫資料或簡化備份資料中心的啟用程序。
  • 資料庫可攜性,可用於啟用已複寫的資料。
  • 延伸的 Active Directory 站台,可用以支援延伸叢集或啟用備份資料中心。
  • 變更電腦的 Active Directory 站台成員資格,此動作可在啟用備份資料中心的過程中執行。
  • 與異地儲存搭配使用的一般磁帶備份,可用以復原備份資料中心內的信箱資料。

此外,協力廠商產品會提供資料複寫功能,可用以傳輸資料至備份資料中心。這些產品可與獨立伺服器、復原叢集或延伸的單一副本叢集 (SCC) 搭配使用。在這些組態中,主要伺服器或叢集內的資料會複寫至第二個資料中心內的第二個伺服器或叢集的組態中。當站台失敗時,第二個資料中心內的叢集或伺服器必須以手動方式啟用。

在 Exchange 2007 SP1 中,新增了一個名為待命連續複寫 (SCR) 的新功能,其是專為站台回復性案例量身訂做的。顧名思義,SCR 是為使用或啟用待命修復伺服器的情況而設計的。SCR 延伸了 Exchange 2007 RTM 中提供的現有連續複寫功能,並為執行 Exchange 2007 SP1 的信箱伺服器提供新的資料可用性案例。SCR 可利用本機連續複寫 (LCR) 和叢集連續複寫 (CCR) 所使用的相同記錄傳送和重新顯示技術,提供新增的部署選項及設定。

SCR 使高可用性 (包括服務和資料可用性) 和站台回復性之間有了區隔。例如,SCR 可以和 CCR 結合在一起,以便在主要資料中心 (使用 CCR 以取得高可用性) 以本機方式,以及在次要或備份資料中心 (使用 SCR 以取得站台回復性) 以遠端方式來複寫儲存群組。次要資料中心可在裝載 SCR 目標的容錯移轉叢集中包含一個被動節點。此類型的叢集稱為待命叢集,因為待命叢集不包含任何叢集信箱伺服器,但是在復原情況下可以快速提供替代叢集信箱伺服器給待命叢集。如果主要資料中心故障或遺失,則裝載在此待命叢集中的 SCR 目標可以快速地在待命叢集上啟動。

如需 SCR 的相關資訊,請參閱待命連續複寫

達成站台回復性解決方案

組織可考量數種站台回復性解決方案。此主題的其餘部分將提供下列站台回復性解決方案的相關資訊:

  • Production:Cold (專用)
  • Production:Warm (專用)
  • Production:Warm (非專用),含有兩個 Active Directory 站台
  • Production:Production (非專用),含有一個 Active Directory 站台

此主題中所說明的解決方案假設,生產資料中心失敗時將會失去完整的郵件基礎結構。備份資料中心必須具有網際網路連線能力與所有必要的服務,以主控 Exchange。此外,您應編寫啟用程序的指令碼,並定期測試這些程序。

Production:Cold (專用)

在最基本的郵件站台回復性解決方案中,組織具有硬體與設備的合約,但並沒有作用中的備份資料中心。所有信箱資料皆會定期備份並移出站台。Active Directory 資料也會以類似的方式處理。使用者必須取得硬體並加以部署,才能啟用站台回復性解決方案。若要縮短整體的作業中斷時間,組織可針對重要的硬體組件與硬體廠商訂定快速遞交合約。

此解決方案衍生出另一種方法,即與能夠由其維護的集區啟用硬體的嚴重損壞修復廠商建立關係。這種關係可讓備份資料在廠商端進行維護,以縮短復原時間。廠商端的專用儲存可以是信箱與 Active Directory 資料的複寫目標。

為求簡便,部署的組態最終可能會與生產環境相類似,或至少有部份類似。在此類復原程序中,最好儘可能使用您所熟悉的技術與相依性。

Production:Warm (專用)

在 Production:Warm (專用) 復原模型中,生產資料中心具有內含專用設備的指定備份資料中心。當生產資料中心無法使用時,即會使用專用設備。如前所述,備份資料中心並不會自動啟用。它必須由系統管理員手動觸發方可啟用。備份資料中心在觸發而啟用後,將會重新設定專用備份設備與基礎結構,以提供郵件服務。下圖說明 Production:Warm (專用) 組態。

實際執行:暖 (專用) 部署

上圖顯示主控 Edge Transport、Hub Transport、Client Access 與 Mailbox server role 的生產資料中心 (A)。具有各角色與 Active Directory 之專用備份伺服器的線上備份資料中心 (B)。此圖顯示除了 Mailbox server role 以外,所有伺服器角色皆使用簡易備援,信箱備援由叢集或待命伺服器組態透過適當的複寫解決方案所處理。

可能的信箱備援解決方案包括:

  • 延伸叢集組態中的叢集連續複寫 (CCR)   CCR 可使用記錄傳送以建立及管理信箱資料的第二個複本。因此,CCR 雙節點叢集在各個資料中心內各有一個節點。在此組態中,兩個位置之間必須要有延伸的子網路,才能使用 Windows 叢集服務。只要再次於其他資料中心內的節點上登錄叢集信箱伺服器的指定 IP 位址,即可透過延伸叢集進行叢集信箱伺服器的容錯移轉。
  • 使用同步協力程式複寫的單一副本叢集 (SCC)   協力程式複寫可讓系統保有兩份信箱伺服器資料。與使用 CCR 時相同,必須要有延伸的子網路,叢集才能順利進行容錯移轉。
  • 使用協力程式複寫的待命叢集   會將信箱資料複寫至備份資料中心內的第二個叢集,並使用伺服器嚴重損壞修復程序來還原服務。同步或非同步的複寫均可。不需使用叢集,也沒有延伸子網路的使用需求。
  • 使用協力程式複寫的待命叢集   會將信箱資料複寫至備份資料中心內的第二部伺服器,並使用資料庫可攜性或伺服器嚴重損壞修復程序來還原服務。同步或非同步的複寫均可。不需使用叢集,也沒有延伸子網路的使用需求。
  • 在第二個資料中心存放第二個複本的本機連續複寫 (LCR)   這並不是優先使用的解決方案,但對某些組織而言可能已足夠。在此組態中,會使用 Internet SCSI (iSCSI) 式存放區來儲存資料的被動副本。連線的網路特性必須可讓被動副本與主動副本保持適當的一致性。在此組態中無法使用 LCR 進行快速本機啟用,因為網路延遲與頻寬將無法支援用戶端存取。

上圖說明其中一項叢集解決方案的使用方式。這是因為 Mailbox Server 顯示於生產資料中心的 Active Directory 站台中。在叢集解決方案中,叢集內每個節點上的網路必須位於相同的子網路中。在非叢集解決方案中不一定須使用單一子網路,但建議您使用。必要時,您可以使用不同的子網路。

使用叢集解決方案時,正常的操作程序如下所示:

  1. 所有內送的網際網路郵件都會流經資料中心 A 內的 Edge Transport Server。
  2. 所有以 Active Directory 站台 Redmond-Prod 中的 Mailbox Server 為目的地的郵件,皆會由 Redmond-Prod 中的 Hub Transport Server 進行處理。
  3. Active Directory 站台 Redmond-Prod 中的叢集信箱伺服器會根據其設定存放在資料中心 A 或 B 的節點中。節點 A 與 B 為 Redmond-Prod 的一部分,由 Redmond-Prod Hub Transport 與 Client Access Server 提供其服務。
  4. 由於 CCR 支援兩個節點,因此第二個節點必須位於資料中心 B 中。這表示資料中心 A 中的主動節點失敗時,會將叢集信箱伺服器強制移至資料中心 B;在此情況下,此節點將仍由資料中心 A 中的 Hub Transport Server 與 Client Access Server 提供服務。
  5. 您可以設定使用三部伺服器與兩個資料副本的 SCC,使叢集信箱伺服器在失敗時仍會保持在資料中心 A 中,而不會容錯移轉至資料中心 B。但若此失敗與存放區有關,則仍需啟用資料中心 B 中的被動節點。

兩個資料中心之間的網路頻寬需求取決於三項因素:

  • 叢集服務延遲需求   執行叢集服務時,叢集節點之間的來回時間不可超過半秒。
  • 複寫的頻寬需求   CCR 所需的頻寬低於大部分的協力廠商複寫解決方案,因為 CCR 複寫的基礎為記錄傳送,而非資料庫複製。CCR 解決方案所需的頻寬受到多種因素影響,這些因素通常會因為環境而有所不同,而這些需求包含下列項目的頻寬:
    • 記錄傳送
    • 檔案系統通知,Microsoft Exchange 複寫服務有賴此通知以得知何時有新的記錄檔可進行傳送
    • 目錄伺服器流量
    • 用戶端流量 (若用戶端與叢集信箱伺服器並非位於相同的實際位置)
    • 叢集活動訊號流量
    • 叢集資料庫更新
    • 任何其他使用網路的應用程式
  • 集線傳輸與用戶端存取必須要有彼此間的 LAN 通訊,並具備它們所服務的 Mailbox Server,方可執行   這項需求對 Client Access Server 而言較為重要,因為它所服務的是線上使用者。網域控制站的信箱存取可透過廣域網路 (WAN) 連線進行,而此連線的延遲將使線上 MAPI 存取受到影響。

若部署非叢集解決方案,延遲與頻寬需求即可能降低。複寫的網路需求有其必要性與重要性。但其他需求大多沒有必要,除非您想在資料中心 A 尚未完全失敗的情況下啟用備份 Mailbox Server。

當生產資料中心失敗時,系統管理員可藉由執行下列其中一種方式,來還原郵件流程與郵件服務:

  • 將備份資料中心內的信箱伺服器移至 Active Directory 站台 Redmond-DR 中。
  • 將備份資料中心內的 Hub Transport Server、Client Access Server 與目錄伺服器移至 Active Directory 站台 Redmond-Prod 中。

建議您使用第二種作法,因為此作法對環境的其他部分所造成的影響最低。例如,任何分公司中的 Exchange 伺服器皆不需變更其對佇列郵件的路由方式。它們只需在正確的伺服器啟動且可供使用時進行連線即可。

啟用資料中心 B 時需遵循下列高階步驟:

  1. 使網路基礎結構上線。
  2. 使 Active Directory 基礎結構上線。
  3. 使其餘 Mailbox Server 上線。執行此步驟時可能必須強制叢集與其餘的單一伺服器一起上線。
  4. Active Directory 站台 Redmond-Prod 會以 Redmond-DR 中的 Hub Transport Server、Client Access Server 與目錄伺服器的 IP 位址進行更新。
  5. 組織之網域的 MX 記錄會以資料中心 B 中的 Edge Transport Server 的 IP 位址進行更新。
  6. 最近移動的 Client Access Server 會新增至網路負載平衡 (NLB) 組態中。
  7. 資料中心 A 郵件服務會在資料中心 B 中還原。

當資料中心 A 可用時,可使用下列高階步驟停用資料中心 B:

  1. 使資料中心 A 個別伺服器上線。它們會加入且提供服務,除非 Exchange 服務已手動停止或停用。遷移回原有位置後,讓資料中心 A 伺服器上線。
  2. 讓資料中心 B 中的 Hub Transport Server 清空其佇列,然後使其離線。
  3. 將資料中心 B 中的 Client Access Server 移出 NLB 組態。用戶端接著會透過資料中心 A 中的伺服器進行連線。
  4. 組織之網域的 MX 記錄會以資料中心 A 中 Edge Transport Server 的 IP 位址進行更新。
  5. 執行必要的網路基礎結構更新。
  6. 將叢集信箱伺服器移至資料中心 A。
  7. 以啟用期間所移動之伺服器的 IP 位址更新 Active Directory 站台 Redmond-DR。
  8. 還原資料中心 A 郵件服務。

與使用站台失敗解決方案時相同,生產與備份資料中心的啟用程序亦應編寫為指令碼,並定期測試。使用 Mailbox Server 的叢集解決方案,可減少備份資料中心的啟用時間。其他解決方案可能具有某些必要的網域名稱系統 (DNS) 與 Active Directory 複寫,而能夠影響何時繼續進行郵件流程以及用戶端何時可存取其信箱。

Production:Warm (專用) 解決方案的優點之一是專用電腦能夠提供可預測的服務等級。

Production:Warm (非專用),含有兩個 Active Directory 站台

在 Production:Warm (專用) 組態中,備份資料中心內的 Edge Transport、Hub Transport 與 Client Access Server 已專門指定為資料中心 A 的待命資源。該組態代表未充分使用的重要硬體投資。下圖顯示替代模型。

範例實際執行:暖 (非專用) 部署

系統管理員必須手動觸發備份資料中心的啟用程序,Production:Warm (非專用) 才可使用。啟用程序經觸發後將會重新設定備份資料中心內的某些設備與基礎結構,以接管資料中心 A 之使用者的郵件服務。

與 Production:Warm (專用) 解決方案相同,Production:Warm (非專用) 解決方案中也有兩個 Active Directory 站台。與 Production:Warm (專用) 解決方案不同的是,這兩個 Active Directory 站台皆延伸至其他資料中心。備份資料中心內的專用資源已成為備份資料中心內不同生產組態的備援伺服器。此方法讓這些資源可用於一般用途,進而建立可有效作為彼此備份的兩個生產資料中心。

例如,如圖範例 Production:Warm (非專用) 部署中所示,當資料中心 A 失敗時,Hub Transport Server 4、Client Access Server 4 與通用類別目錄伺服器 4 即會新增至 Active Directory 站台 Redmond 中,並與 Redmond 的節點 B 結合,為資料中心 A 的使用者提供服務以傳遞郵件服務。在站台失敗後,兩個生產環境此時執行的容量與備援性皆比其正常狀態來得低。假設其正在進行的載入受支援,此組態即為可接受之組態。例如,網際網路郵件會透過資料中心 B 中的 Edge Transport Server 進行傳送。為在延伸的資料中心作業中斷時提供支援,企業可與廠商訂定能夠應要求快速提供備用硬體的合約。新增的硬體接著可用以還原備援性或新增更大的容量。

在此情況下,Redmond 與 Dublin Active Directory 站台部署的一般操作將與採用 Production:Warm (專用) 解決方案時的操作相同。同樣地,兩個位置之間的網路頻寬將受到相同因素的影響,不同之處在於,Redmond 與 Dublin 伺服器必須同時受支援。

備份資料中心可透過下列其中一項作業來啟用:

  • 將主動節點與叢集信箱伺服器移至作業資料中心的 Active Directory 站台中。
  • 將備份資料中心內的 Hub Transport Server、Client Access Server 與目錄伺服器移至已失敗之資料中心的 Active Directory 站台中。

建議使用的啟用解決方案,是將 Hub Transport 與 Client Access Server 移至已失敗之資料中心的 Active Directory 站台中。此解決方案可造就最單純、最不受干擾的啟用作業。

在此解決方案中,可透過下列高階步驟完成資料中心 A 的復原:

  1. 使網路基礎結構上線。網路基礎結構不一定需要變更,因為資料中心 B 已接收網際網路郵件。
  2. 使資料中心 A 的 Active Directory 基礎結構上線 (Active Directory 站台 Redmond)。
  3. 使其餘 Mailbox Server 上線。執行此步驟時可能必須強制叢集與其餘的單一伺服器一起上線。
  4. Active Directory 站台 Redmond 會以 Hub Transport Server 4、Client Access Server 4 與通用類別目錄伺服器 4 的 IP 位址進行更新。
  5. Client Access Server 3 會新增至 Redmond 的 NLB 組態中。
  6. 還原資料中心 A 郵件服務。

當資料中心 A 可用時,可使用下列高階步驟將資料中心 B 還原為正常組態:

  1. 使資料中心 A 個別伺服器上線。它們會加入且提供服務,除非 Exchange 服務已手動停止或停用。遷移回原有位置後,讓資料中心 A 伺服器上線。
  2. 讓 Hub Transport Server 4 清空其佇列,然後使其離線。
  3. 將 Client Access Server 4 移出 NLB 組態。用戶端仍將可連接至資料中心 A 中的伺服器。
  4. 執行必要的網路基礎結構更新。
  5. 將叢集信箱伺服器移至資料中心 A。
  6. 以啟用期間所移動之伺服器的 IP 位址更新 Active Directory 站台 Dublin。
  7. 兩個資料中心都會還原為原有的狀態。

與使用站台失敗解決方案時相同,生產與備份資料中心的啟用程序亦應編寫為指令碼,並定期測試。使用 Mailbox Server 的叢集解決方案,可減少備份資料中心的啟用時間。其他信箱解決方案可能具有某些必要的 DNS 與 Active Directory 複寫,而能夠指定何時繼續進行郵件流程以及用戶端何時可存取其信箱。

此解決方案可讓用以進行站台回復性的伺服器套用至一般操作中。如此可降低站台回復性解決方案的成本,但將因此而有無法在必要時維持完整系統負載的風險。例如,若資料中心 B 中的 Hub Transport Server 負載持續增加而使用 80% 的容量,則 A 在啟用備份資料中心時將會超出 Hub Transport 容量。使用此解決方案時,系統管理員必須仔細追蹤系統的使用情形變化,以確保解決方案的可行性。若負載增加,您就必須取得新的硬體並加以部署。

Production:Production (非專用),含有一個 Active Directory 站台

組織中如需使用能夠支援備份站台自動啟用的解決方案,即必須部署 Production:Production (非專用) 解決方案。此解決方案會在同時跨越兩個資料中心的單一 Active Directory 站台中部署備援伺服器,如下圖所示。

實際執行:實際執行 (非專用) 部署

此解決方案會同時將兩個資料中心的資源部署到單一 Active Directory 站台中。站台中的任何資源可用以因應大部分的要求。例如,資料中心 A 中的 Edge Transport Server 可使用資料中心 B 中的集線傳輸,將郵件傳遞至信箱位於資料中心 A 之叢集信箱伺服器上的使用者。同樣地,Active Directory 流量依預設也不會有參考位置。基於這些原因,不建議您使用此解決方案。

啟用備份資料中心的程序與復原多重伺服器失敗的程序相仿。若要在啟用後進行復原,只需在失敗的伺服器上還原服務即可。如同先前討論的非專用解決方案,若未做好容量管理,在資料中心失敗後負載即可能超過服務的容量。系統管理員必須確定解決方案在資料中心失敗後可支援預期的負載。若未做好適當的容量管理,即可能單一資料中心失敗後導致整體的郵件服務失敗。

若要確保您目前閱讀的是最新資訊,並尋找其他的 Exchange Server 2007 說明文件,請造訪 Exchange Server 技術資源中心.