監控工作流程管理員 1.0

 

若要確保 Workflow Manager 1.0 的高可用性和可靠性,請一定要監控伺服器,確定它是以良好的健康情況來作業,以及快速偵測到發生的失敗,以便採取更正動作。本文將討論可用來監控 Workflow Manager 1.0 環境的功能。

監控伺服器的一般方法如下:

  1. 效能計數器

  2. 事件追蹤

  3. PowerShell

  4. System Center Operations Manager Management Pack

效能計數器對於提供伺服器效能的相關資訊十分有用。效能計數器是依計數器集合組成群組。

Workflow Manager 1.0 會產生一組本身的效能計數器,協助您監控伺服器。Workflow Manager 1.0 會定義兩個計數器集合:管理和發送器。個別計數器是依各自的計數器集合所定義。當您在已安裝 Workflow Manager 1.0 的機器上開啟效能監視器時,可以在這些計數器集合中找到效能計數器,然後,您就可以查看 [Workflow Management] 和 [Workflow Dispatcher] 計數器集合。

下表彙總這兩個集合中可用的效能計數器。

Index

效能計數器

詳細資料

1

Management requests per second

前端在指定節點上每秒處理的要求數目。

2

Workflow events per second

指定節點上每秒的成功 PublishNotification 呼叫數目。

3

Management request failures per second

指定節點上導致呼叫者錯誤回應 (每秒) 的每秒前端呼叫數目。錯誤原因可能是要求不正確、授權錯誤或驗證錯誤。

4

Authorization errors per second

指定節點上每秒授權錯誤數目。

5

發行工作流程事件期間

發行工作流程通知的平均延遲。

6

Episodes outstanding

指定後端節點上執行的工作流程執行個體數目。

7

Episodes failed per second

指定後端節點上每秒報告的工作流程執行個體執行錯誤數目。

8

Events processed per second

指定節點上每秒成功處理的工作流程通知數目。

下列範例是衍生自上方效能計數器的健康情況模型。

徵兆

來源

內容:原因、解決方式、摘要

節點似乎未處理任何訊息。

RequestsProcessedPerSecond

未作用 10 分鐘。

Workflow 執行個體似乎未完成

(EpisodesCompletedPerSecond / RequestsProcessedPerSecond) * 100

低於 N% - N 可以由使用者定義 (例如,10)。

Workflow Instance 失敗

RequestsFailedPerSecond

失敗數目。

您也可以從 Windows 新增效能計數器 (如 CPU 和 Memory Utilization)。

Workflow Manager 1.0 元件會使用「Windows 事件追蹤 (ETW)」進行追蹤。ETW 是追蹤的理想選擇,因為它對效能而言具有最小額外負荷。而且,ETW 記錄檔也小於其他格式的記錄檔。服務的所有元件都使用名稱為 Microsoft- Workflow 的 ETW 提供者。

Workflow Manager 1.0 使用下列預設可用的 ETW 管道。

  • Operational Channel:此管道用於報告需要操作員參與之重大問題的追蹤。範例包括服務錯誤或已達 SLA 閾值。

  • Debug Channel:所有診斷追蹤都會使用此管道。

  • Analytic Channel:此管道用於最高值追蹤 (如完成作業所需的時間量)。事件可能還有其他的中繼資料 (例如範圍或作業名稱)。

您可以在 Workflow Manager 1.0 資料夾的 Microsoft.Workflow.EventDefinitions.man ETW 資訊清單檔中找到 [InstallDrive]:\Program Files\Workflow Manager\1.0\Workflow 所產生的完整事件清單。

下表列出該檔案中一些對監控伺服器健康情況十分重要的感興趣事件。

問題

產生的事件識別碼

WF 後端啟動失敗

289

未處理的例外狀況

1, 10, 19

特定節點中常見的未處理例外狀況

30 分鐘內 1、10 或 19 的 5 個事件

常見已啟動服務事件

30 分鐘內 288 或 582 的 5 個事件

PowerShell 是管理 Workflow Manager 1.0 伺服器的好方法。Workflow Manager 1.0 包含的 Cmdlet 可提供 Workflow 陣列和其健康狀況的狀態。Workflow Manager 1.0在 [開始] 功能表中提供捷徑,讓系統管理員啟動工作流程管理員 1.0 程式群組中的工作流程 PowerShell 提示。匯入 Workflow Manager 1.0 PowerShell 模組,也可以透過程式設計方式叫用這些 Cmdlet。所有 Workflow Manager 1.0 Cmdlet 都是定義在 Workflow Manager 1.0 安裝目錄的 Microsoft.Workflow.Commands PowerShell 模組中。

有兩個 Cmdlet 特別適用於伺服器監控:Get-WFFarm 和 Get-WFFarmStatus。

Get-WFFarm Cmdlet 是擷取 Workflow Farm 之所有詳細資料的快速方法。此 Cmdlet 會傳回下列有關您陣列的資訊。

說明

主機

列出陣列中的主機 (或電腦)。

端點

列出主機上的 http 和 https 端點。

WFFarmDBConnectionString

工作流程陣列資料庫的連接字串。工作流程陣列資料庫包含陣列的所有設定資訊。

RunAsAccount

用來執行工作流程後端服務的帳戶。

AdminGroup

傳回將哪個 Windows 驗證安全性群組設定為 Workflow Farm 的 Administrators 群組。

InstanceDBConnectionString

執行個體資料庫的連接字串。執行個體資料庫包含持續性工作流程的執行個體資訊。強烈建議您不要更新此資料庫中的任何資訊。此連接字串只適用於提供其他離線 Cmdlet (如用於嚴重損壞修復的 Cmdlet)。

ResourceDBConnectionString

資源資料庫的連接字串。資源資料庫包含工作流程和活動定義。強烈建議您不要更新此資料庫中的任何資訊。此連接字串只適用於提供其他離線 Cmdlet (如用於嚴重損壞修復的 Cmdlet)。

HttpPort

如果服務是使用 http 所設定,則會列出 Workflow 前端的 Httpport。

HttpsPort

列出 Workflow 前端的 Httpsport。

OutboundCertificate

傳回輸出憑證的指紋。也會傳回是否在安裝期間自動產生此憑證。

SslCertificate

傳回 SSL 憑證的指紋。也會傳回是否在安裝期間自動產生此憑證。

System_CAPS_note注意事項

Get-AzureWFFarmStatus 未併入 Workflow Manager 1.0 中,但會併入為 1.0 RTM 的一部分。

Get-AzureWFFarmStatus Cmdlet 提供陣列的基本狀態和其節點。

Get-AzureWFFarmStatus 會從每個節點提供 Workflow Backend Windows 服務的健康情況,以及在該節點上是否可連絡 Workflow 前端。

System_CAPS_note注意事項

Workflow Manager 1.0 未將 Management Pack 併入為安裝的一部分,但是在 1.0 RTM 時可供個別下載。此 Management Pack 將支援 Microsoft System Center 2012 及 System Center 2007 R2。

效能計數器、事件追蹤和 PowerShell Cmdlet 提供陣列健康情況的深入資訊。不過,實際企業類別可靠性不僅需要持續監控伺服器,還需要在偵測到失敗時啟動的警示機制。Microsoft System Center Operations Manager Management Pack 提供此警示功能。

System Center Management Pack 支援本文章涵蓋的大部分事件和效能計數器。管理組件的目標是設為監控 Workflow Manager 1.0 陣列和其節點,而不是特別設為監控 Workflow Manager 1.0 成品 (如工作流程執行個體)。

下圖顯示 Workflow Manager 1.0 的一般健康情況模型。

Workflow health model

社群新增項目

新增
顯示: