Rendimiento de Windows Workflow Foundation

Artículo
02/27/2011

Este tema es aplicable a Windows Workflow Foundation 4.

Dustin Metzgar

Wenlong Dong

Microsoft Corporation, septiembre de 2010

Microsoft .NET Framework versión 4 incluye una revisión principal de Windows Workflow Foundation (WF) con inversiones relevantes en rendimiento. Esta nueva revisión introduce cambios significativos de diseño con respecto a versiones anteriores de WF que se proporcionaban como parte de .NET Framework 3.0 y .NET Framework 3,5. Se ha rediseñado en lo que respecta al núcleo del modelo de programación, el runtime y las herramientas para mejorar significativamente el rendimiento y la facilidad de uso. En este tema se muestran las características de rendimiento más importantes de estas revisiones y se comparan con las de la versión anterior.

El rendimiento de cada componente de flujo de trabajo se ha aumentado por órdenes de magnitud entre WF3 y WF4. Esto hace que la separación entre los servicios de Windows Communication Foundation (WCF) codificados manualmente y los servicios de flujo de trabajo de WCF sea bastante pequeño. La latencia del flujo de trabajo se ha reducido significativamente en WF4. El rendimiento de persistencia ha aumentado en un factor comprendido entre 2,5 y 3,0. Se ha reducido notablemente la sobrecarga del seguimiento de estado por medio del seguimiento de flujo de trabajo. Estas son razones de peso para migrar a WF4, o adoptarlo, en las aplicaciones.

Terminología

La versión de WF introducida en .NET Framework 4 se denominará WF4 en el resto de este tema. WF se introdujo en .NET 3.0 y presentó una serie de revisiones secundarias a través de .NET Framework 3,5 SP1. La versión de Workflow Foundation para .NET Framework 3,5 se denominará WF3 en el resto de este tema. WF3 se proporciona con .NET Framework 4 en paralelo con WF4. Para obtener más información sobre la migración de los artefactos de WF3 a WF4, vea el tema que contiene la guía de migración de Windows Workflow Foundation 4.

Windows Communication Foundation (WCF) es el modelo de programación unificado de Microsoft para compilar aplicaciones orientadas a servicios. Se introdujo por primera vez como parte de .NET 3.0 junto con WF3 y ahora es uno de los componentes clave de .NET Framework.

Windows Server AppFabric es un conjunto de tecnologías integradas que permiten compilar, escalar y administrar más fácilmente aplicaciones web y aplicaciones compuestas que se ejecutan en IIS. Proporciona herramientas para supervisar y administrar servicios y flujos de trabajo. Para obtener más información, vea Windows Server AppFabric.

Objetivos

El objetivo de este tema es mostrar las características de rendimiento de WF4 con datos medidos para diferentes escenarios. También se proporcionan en él comparaciones detalladas entre WF4 y WF3, y asimismo se muestran las grandes mejoras realizadas en esta nueva revisión. Los escenarios y los datos presentados en este artículo cuantifican el costo subyacente de distintos aspectos de WF4 y WF3. Estos datos son útiles para entender las características de rendimiento de WF4 y pueden ser útiles para planear migraciones de WF3 a WF4 o utilizar WF4 en el desarrollo de aplicaciones. Sin embargo, se debe ser cauto al considerar las conclusiones extraídas de los datos presentados en este artículo. El rendimiento de una aplicación de flujo de trabajo compuesta depende en gran medida de cómo se implementa el flujo de trabajo y cómo se integran los distintos componentes. Se debe medir cada aplicación para determinar las características de rendimiento de la misma.

Información general sobre las mejoras de rendimiento de WF4

WF4 se ha diseñado e implementado cuidadosamente con un alto grado de rendimiento y escalabilidad que se describe en las siguientes secciones.

Runtime de WF

El núcleo del runtime de WF lo constituye un programador asincrónico que controla la ejecución de las actividades en un flujo de trabajo. Proporciona un entorno de ejecución predecible y de gran rendimiento para las actividades. El entorno tiene un contrato bien definido en materia de ejecución, continuación, realización, cancelación y control de excepciones, así como un modelo de subprocesos predecible.

En comparación con WF3, el runtime de WF4 tiene un programador más eficaz. Aprovecha el mismo grupo de subprocesos de E/S que se utiliza para WCF, que muestra gran eficacia en la ejecución de elementos de trabajo por lotes. La cola del programador interno de elementos de trabajo se ha optimizado para la mayoría de los patrones de uso comunes. El runtime de WF4 también administra los estados de ejecución de forma muy simple con una lógica de sincronización y control de eventos mínima, mientras que WF3 depende de una invocación y registro complejos de eventos.

Almacenamiento y flujo de datos

En WF3, los datos asociados a una actividad se modelan mediante propiedades de dependencia implementadas por el tipo DependencyProperty. El modelo de propiedades de dependencia se introdujo en Windows Presentation Foundation (WPF). En general, este modelo es muy flexible para admitir un enlace de datos fácil y otras características de interfaz de usuario. Sin embargo, el modelo requiere que las propiedades se definan como campos estáticos en la definición de flujo de trabajo. El establecimiento o la obtención de los valores de propiedad por parte del runtime de WF suponen una lógica de búsqueda compleja.

WF4 utiliza una lógica clara de ámbito de datos para mejorar sustancialmente la forma de tratar los datos en un flujo de trabajo. Separa los datos almacenados en una actividad de los datos que fluyen por los límites de la actividad utilizando dos conceptos diferentes: variables y argumentos. Mediante el uso de un ámbito jerárquico claro para las variables y los argumentos "In/Out/InOut", la complejidad del uso de datos para las actividades se reduce drásticamente y el período de duración de los datos también se amplía de forma automática. Las actividades tienen una signatura bien definida descrita por sus argumentos. Mediante la simple inspección de una actividad, se puede determinar qué datos espera recibir y qué datos generará como consecuencia de su ejecución.

En WF3, las actividades se inicializaban cuando se creaba un flujo de trabajo. En WF4, las actividades se inicializan solo cuando se ejecutan las actividades correspondientes. Esto permite un ciclo de vida más simple de la actividad sin realizar operaciones de inicializar/anular inicialización cuando se crea una nueva instancia de flujo de trabajo, consiguiéndose de este modo una mayor eficacia.

Flujo de control

Como en cualquier lenguaje de programación, WF proporciona compatibilidad con los flujos de control para las definiciones de flujo de trabajo introduciendo un conjunto de actividades de flujo de control para la creación de secuencias, bucles, bifurcaciones y otros modelos. En WF3, cuando se necesita volver a ejecutar la misma actividad, se crea un nuevo elemento ActivityExecutionContext y la actividad se clona mediante una lógica de serialización y deserialización compleja basada en BinaryFormatter. Normalmente, el rendimiento de los flujos de control reiterativos es mucho más lento que la ejecución de una secuencia de actividades.

WF4 trata este aspecto de forma bastante diferente. Toma la plantilla de actividad, crea un nuevo objeto ActivityInstance y lo agrega a la cola del programador. Este proceso completo solamente implica la creación explícita de objetos y es muy simple.

Programación asincrónica

Las aplicaciones tienen normalmente mejores niveles de rendimiento y escalabilidad con la programación asincrónica de operaciones de bloqueo de ejecución prolongada, como las operaciones de computación distribuidas o de E/S. WF4 proporciona compatibilidad asincrónica a través de los tipos de actividad base AsyncCodeActivity y AsyncCodeActivity. El runtime entiende las actividades asincrónicas de forma nativa y, por lo tanto, puede colocar automáticamente la instancia en una zona sin persistencia mientras el trabajo asincrónico está pendiente. Las actividades personalizadas pueden derivar de estos tipos para realizar el trabajo asincrónico sin retener el subproceso de programador de flujo de trabajo ni bloquear las actividades que puedan ejecutarse en paralelo.

Mensajería

Inicialmente, WF3 tenía compatibilidad de mensajería muy limitada a través de invocaciones de eventos externos o servicios Web. En .NET 3.5, los flujos de trabajo se podían implementar como clientes de WCF o exponer como servicios de WCF a través de SendActivity y ReceiveActivity. En WF4, el concepto de programación de mensajería basada en flujo de trabajo se ha fortalecido más mediante la estrecha integración de la lógica de mensajería de WCF en WF.

La canalización de procesamiento de mensajes unificada proporcionada en WCF en .NET 4 ayuda a que los servicios de WF4 tengan un rendimiento y una escalabilidad significativamente mejores que WF3. WF4 también proporciona una compatibilidad de programación de mensajería más avanzada que puede modelar patrones de intercambio de mensajes (MEP) complejos. Los desarrolladores pueden utilizar contratos de servicio con tipos para conseguir una programación fácil o contratos de servicio sin tipos para lograr un rendimiento mejor sin pagar costos de serialización. La compatibilidad de almacenamiento en caché de canales del lado cliente mediante la clase SendMessageChannelCache en WF4 ayuda a los desarrolladores a compilar aplicaciones rápidas con el mínimo esfuerzo. Para obtener más información, vea Cambiar los niveles de uso compartido de caché para actividades Send.

Programación declarativa

WF4 proporciona un marco de programación declarativa limpio y simple para modelar los procesos y servicios de negocios. El modelo de programación admite la composición totalmente declarativa de actividades, sin código lateral, simplificando enormemente la creación del flujo de trabajo. En .NET Framework 4, el marco de programación declarativa basada en XAML se ha unificado en el ensamblado System.Xaml.dll único para admitir tanto WPF como WF.

En WF4, XAML proporciona una experiencia realmente declarativa y permite que la definición completa del flujo de trabajo se defina en marcado XML, haciendo referencia a actividades y tipos generados mediante el uso de .NET. Esto resultaba difícil de hacer en WF3 con formato XOML sin la participación de lógica personalizada de código subyacente. La nueva pila de XAML en .NET 4 tiene un rendimiento mucho mejor en la serialización/deserialización de artefactos de flujo de trabajo y hace que la programación declarativa sea más atractiva y sólida.

Diseñador de flujo de trabajo

La compatibilidad de la programación totalmente declarativa con WF4 impone explícitamente requisitos más exigentes para el rendimiento en tiempo de diseño de grandes flujos de trabajo. El diseñador de flujos de trabajo en WF4 tiene mejor escalabilidad para grandes flujos de trabajo que el de WF3. Con la compatibilidad de virtualización de interfaz de usuario, el diseñador puede cargar fácilmente un flujo de trabajo grande de 1000 actividades en unos segundos, mientras que es muy difícil cargar un flujo de trabajo de unos pocos cientos de actividades con el diseñador de WF3.

Comparaciones de rendimiento en el nivel de componente

Esta sección contiene datos sobre comparaciones directas entre actividades individuales en flujos de trabajo de WF3 y WF4. Áreas clave como la persistencia tienen un impacto más profundo en el rendimiento que los componentes de actividades individuales. Las mejoras de rendimiento en componentes individuales de WF4 son importantes porque los componentes son ahora bastante rápidos en comparación con la lógica de orquestación codificada manualmente. Un ejemplo de ello se trata en la sección siguiente: "Escenario de composición de servicio".

Configuración de entorno

Entorno de la prueba de rendimiento de flujo de trabajo

Las ilustración anterior muestra la configuración de una máquina utilizada para la medición del rendimiento en el nivel de componente. Un solo servidor y cinco clientes conectados a través de una interfaz de red Ethernet de 1 Gbps. Para las mediciones fáciles, el servidor se configura para utilizar un núcleo único de un servidor de procesador dual y núcleo cuádruple basado en x86 que ejecuta Windows Server 2008. La utilización de la CPU del sistema se mantiene en casi el 100%.

Detalles de prueba

CodeActivity de WF3 es probablemente la actividad más simple que se puede utilizar en un flujo de trabajo de WF3. La actividad llama a un método en el código subyacente en que el programador de flujos de trabajo puede colocar el código personalizado. En WF4, no hay ningún equivalente directo a CodeActivity de WF3 que proporcione la misma funcionalidad. Observe que hay una clase base CodeActivity en WF4 que no está relacionada con CodeActivity de WF3. Se recomienda encarecidamente a los autores de flujos de trabajo que creen actividades personalizadas y compilen flujos de trabajo de solo XAML. En las pruebas siguientes, se utiliza una actividad denominada Comment en lugar de un elemento CodeActivity vacío en flujos de trabajo de WF4. El código de la actividad Comment es el siguiente:

[ContentProperty("Body")]
    public sealed class Comment : CodeActivity
    {
        public Comment()
            : base()
        {
        }

        [DefaultValue(null)]
        public Activity Body
        {
            get;
            set;
        }

        protected override void Execute(CodeActivityContext context)
        {
        }
    }

Flujo de trabajo vacío

Esta prueba utiliza un flujo de trabajo de secuencia sin actividades secundarias.

Actividad única

El flujo de trabajo es un flujo de trabajo de secuencia que contiene una actividad secundaria. La actividad es un elemento CodeActivity sin código en el caso de WF3 y una actividad Comment en el caso de WF4.

While con 1000 iteraciones

El flujo de trabajo de la secuencia contiene una actividad While con una actividad secundaria en el bucle que no realiza ningún trabajo.

Replicador comparado con ParallelForEach

ReplicatorActivity en WF3 tiene modos de ejecución paralela y secuencial. En modo secuencial, el rendimiento de la actividad es similar a WhileActivity. ReplicatorActivity es muy útil para la ejecución paralela. El equivalente de WF4 es la actividad ParallelForEach.

En el siguiente diagrama se muestran los flujos de trabajo utilizados para esta prueba. El flujo de trabajo de WF3 está en el lado izquierdo y el flujo de trabajo de WF4 está en el derecho.

ReplicatorActivity de WF3 y ParallelForEach de WF4

Flujo de trabajo secuencial con cinco actividades

Esta prueba sirve para mostrar el efecto de la ejecución de varias actividades en secuencia. Hay cinco actividades en la secuencia.

Ámbito de transacción

La prueba de ámbito de transacción difiere ligeramente de las demás pruebas en que una nueva instancia de flujo de trabajo no se crea para cada iteración. En su lugar, el flujo de trabajo se estructura con un bucle While que contiene una actividad TransactionScope que contiene a su vez una sola actividad que no realiza trabajo. Cada ejecución de un lote de 50 iteraciones mediante el bucle While se cuenta como una operación única.

Compensación

El flujo de trabajo de WF3 tiene una actividad compensable única denominada WorkScope. La actividad simplemente implementa la interfaz ICompensatableActivity:

class WorkScope : 
        CompositeActivity, ICompensatableActivity
    {
        public WorkScope() : base() { }

        public WorkScope(string name)
        {
            this.Name = name;
        }

        public ActivityExecutionStatus Compensate(
            ActivityExecutionContext executionContext)
        {
            return ActivityExecutionStatus.Closed;
        }
    }

El destino del controlador de error es la actividad WorkScope. El flujo de trabajo de WF4 es igualmente simplista. Una actividad CompensableActivity tiene un cuerpo y un controlador de compensación. Una compensación explícita es el elemento siguiente en la secuencia. La actividad de cuerpo y la actividad de controlador de compensación son implementaciones vacías:

public sealed class CompensableActivityEmptyCompensation : CodeActivity
    {
        public CompensableActivityEmptyCompensation()
            : base() { }

        public Activity Body { get; set; }

        protected override void Execute(CodeActivityContext context) { }
    }
    public sealed class CompensableActivityEmptyBody : CodeActivity
    {
        public CompensableActivityEmptyBody()
            : base() { }

        public Activity Body { get; set; }

        protected override void Execute(CodeActivityContext context) { }
    }

Flujos de trabajo de compensación básicos de WF3 y WF

Figura 2: flujos de trabajo de compensación básicos de WF3 (izquierda) y WF4 (derecha)

Resultados de las pruebas de rendimiento

Resultados de pruebas de rendimiento

Gráfico de datos de la prueba de rendimiento

Todas las pruebas se miden en flujos de trabajo por segundo con la excepción de la prueba de ámbito de transacción. Como se puede ver más arriba, el rendimiento del runtime de WF ha mejorado globalmente, sobre todo en áreas que requieren varias ejecuciones de la misma actividad como el bucle While.

Escenario de composición de servicio

Como se muestra en la sección anterior, "Comparaciones de rendimiento en el nivel de componente", ha habido una reducción significativa de sobrecarga entre WF3 y WF4. Los servicios de flujo de trabajo de WCF casi pueden coincidir ahora con el rendimiento de los servicios de WCF codificados manualmente, pero siguen teniendo todas las ventajas del runtime de WF. Este escenario de prueba compara un servicio de WCF con un servicio de flujo de trabajo de WCF en WF4.

Servicio de tienda en línea

Uno de los puntos fuertes de Windows Workflow Foundation es la capacidad de crear procesos mediante el uso de varios servicios. En este ejemplo, hay un servicio de tienda en línea que orquesta dos llamadas de servicio para realizar un pedido. El primer paso es validar el pedido utilizando un servicio de validación de pedidos. El segundo paso es rellenar el pedido utilizando un servicio de almacén.

Los dos servicios back-end, el servicio de validación de pedidos y el servicio de almacén, siguen siendo los mismos en ambas pruebas. La parte que cambia es el servicio de tienda en línea que realiza la orquestación. En un caso, el servicio se codifica manualmente como un servicio de WCF. En el otro caso, el servicio se escribe como un servicio de flujo de trabajo de WCF en WF4. Las características específicas de WF, como el seguimiento y la persistencia, se desactivan para esta prueba.

Entorno

Entorno de la prueba de rendimiento de flujo de trabajo

Las solicitudes del cliente se realizan al servicio de tienda en línea a través de HTTP desde varios equipos. Un equipo único hospeda los tres servicios. La capa de transporte entre el servicio de tienda en línea y los servicios back-end es TCP o HTTP. La medición de operaciones por segundo se basa en el número de llamadas a PurchaseOrder completadas realizadas al servicio de tienda en línea. La agrupación de canales es una nueva característica disponible en WF4. En la parte de WCF de esta prueba, la agrupación de canales no se proporciona para su uso inmediato, por lo que se utilizó una implementación codificada manualmente de una técnica de agrupación simple en el servicio de tienda en línea.

Rendimiento

Gráfico de rendimiento de servicio de una tienda en línea

La conexión de los servicios TCP back-end sin agrupación de canales hace que el servicio de WF tenga un impacto del 17,2% en el rendimiento. Con la agrupación de canales, la reducción es de aproximadamente el 23,8%. Para HTTP, el impacto es mucho menor: el 4,3% sin agrupación y el 8,1% con agrupación. También es importante tener en cuenta que la agrupación de canales proporciona muy pocas ventajas cuando se utiliza HTTP.

Aunque hay una sobrecarga del runtime de WF4 en comparación con un servicio de WCF codificado manualmente en esta prueba, se pudo considerar un escenario más desfavorable. Los dos servicios back-end de esta prueba realizan muy poco trabajo. En un escenario real de extremo a extremo, estos servicios realizarían operaciones más costosas, como llamadas de base de datos, con lo que el impacto en el rendimiento de la capa de transporte sería menos importante. Esto, más las ventajas de las características disponibles en WF4, hace de Workflow Foundation una opción viable para crear servicios de orquestación.

Consideraciones clave de rendimiento

Las áreas de características de esta sección, con la excepción de la interoperabilidad, han cambiado radicalmente entre WF3 y WF4. Esto afecta al diseño de las aplicaciones de flujo de trabajo, así como al rendimiento.

Latencia de activación de flujo de trabajo

En una aplicación de servicio de flujo de trabajo de WCF, la latencia para iniciar un nuevo flujo de trabajo o cargar un flujo de trabajo existente es tan importante como puede ser el bloqueo. Este caso de prueba mide un host XOML de WF3 en comparación con un host XAMLX de WF4 en un escenario típico.

Configuración de entorno

Configuración del entorno para pruebas de latencia y rendimiento

Configuración de prueba

En el escenario, un equipo cliente se pone en contacto con un servicio de flujo de trabajo de WCF utilizando la correlación basada en contexto. La correlación basada en contexto requiere un enlace de contexto especial y utiliza un encabezado de contexto o una cookie para relacionar los mensajes con la instancia de flujo de trabajo correcta. Tiene una mejora de rendimiento ya que el identificador de la correlación se encuentra en el encabezado del mensaje, por lo que no es necesario el análisis del cuerpo del mensaje. Para obtener más información sobre la correlación de contexto, vea Intercambio de contexto.

El servicio creará un nuevo flujo de trabajo con la solicitud y enviará una respuesta inmediata para que la medición de la latencia no incluya el tiempo empleado en la ejecución del flujo de trabajo. El flujo de trabajo de WF3 es XOML con un código subyacente y el flujo de trabajo de WF4 es totalmente XAML. El flujo de trabajo de WF4 tiene el siguiente aspecto:

Ámbito de correlación de WF 4

La actividad Receive crea la instancia del flujo de trabajo. Un valor pasado al mensaje recibido se refleja en el mensaje de respuesta. Una secuencia que sigue a la respuesta contiene el resto del flujo de trabajo. En el caso anterior, solo se muestra una actividad Comment. El número de actividades Comment se cambia para simular la complejidad del flujo de trabajo. Una actividad Comment es equivalente a una actividad CodeActivity de WF3 que no realiza ningún trabajo. Para obtener más información sobre la actividad Comment, vea la sección "Comparaciones de rendimiento en el nivel de componente" más arriba en este artículo.

Resultados de pruebas

Resultados de latencia

Figura 3: latencia en frío y en caliente para los servicios de flujo de trabajo de WCF

En el gráfico anterior, frío hace referencia al caso en que no hay un WorkflowServiceHost existente para el flujo de trabajo dado. En otras palabras, la latencia en frío se produce cuando el flujo de trabajo se utiliza por primera vez y el XOML o el XAML deben compilarse. La latencia en caliente es el tiempo necesario para crear una nueva instancia de flujo de trabajo cuando el tipo de flujo de trabajo ya se ha compilado. La complejidad del flujo de trabajo apenas si sufre diferencias en el caso de WF4, pero tiene una progresión lineal en el caso de WF3.

Rendimiento de la correlación

WF4 introduce una nueva característica de correlación basada en contenido. WF3 proporcionaba solamente correlación basada en contexto. La correlación basada en contexto solo se podía realizar en enlaces de canal de WCF específicos. El identificador del flujo de trabajo se inserta en el encabezado del mensaje cuando se utilizan estos enlaces. El runtime de WF3 solo podía identificar un flujo de trabajo por su identificador. Con la correlación basada en contenido, el autor de flujos de trabajo puede crear una clave de correlación de una parte relevante de datos como un número de cuenta o un identificador de cliente. Para obtener más información sobre la correlación basada en contenido, vea Basado en contenidos.

En la correlación basada en contexto hay un incremento de rendimiento ya que la clave de correlación se encuentra en el encabezado del mensaje. La clave se puede leer desde el mensaje sin que sea necesaria la deserialización/copia del mensaje. En la correlación basada en contenido, la clave de correlación se almacena en el cuerpo del mensaje. Se utiliza una expresión XPath para buscar la clave. El costo de este procesamiento adicional depende del tamaño del mensaje, la profundidad de la clave en el cuerpo y el número de claves. Esta prueba compara la correlación basada en contexto con la correlación basada en contenido y también muestra el descenso del rendimiento cuando se utilizan varias claves.

Configuración de entorno

Entorno de la prueba de rendimiento de flujo de trabajo

Configuración de prueba

Prueba de flujo de trabajo del rendimiento de la correlación

El flujo de trabajo mostrado más arriba es el mismo que se utiliza en la sección "Persistencia" que figura más abajo. Para las pruebas de la correlación sin persistencia no hay ningún proveedor de persistencia instalado en el runtime. La correlación se produce en dos lugares: CreateOrder y CompleteOrder.

Resultados de pruebas

Rendimiento de la correlación

Este gráfico muestra una disminución del rendimiento cuando aumenta el número de claves utilizadas en la correlación basada en contenido. La similitud de las curvas entre TCP y HTTP indica la sobrecarga asociada a estos protocolos.

Correlación con persistencia

Con un flujo de trabajo conservado, la presión de CPU debida a la correlación basada en contexto pasa del runtime de flujo de trabajo a la base de datos SQL. Los procedimientos almacenados en el proveedor de persistencia de SQL realizan el trabajo de hacer coincidir las claves para buscar el flujo de trabajo adecuado.

Resultados de correlación y persistencia

La correlación basada en contexto es todavía más rápida que la correlación basada en contenido. Sin embargo, la diferencia es menos pronunciada, ya que la persistencia tiene un impacto mayor en el rendimiento que la correlación.

Rendimiento de un flujo de trabajo complejo

La complejidad de un flujo de trabajo no se mide solamente por el número de actividades. Las actividades compuestas pueden contener muchas actividades secundarias y esas actividades secundarias también pueden ser actividades compuestas. Según aumenta el número de niveles de anidamiento, también aumenta el número de actividades que pueden estar actualmente en estado de ejecución y el número de variables que pueden estar en este estado. Esta prueba compara el rendimiento entre WF3 y WF4 cuando se ejecutan flujos de trabajo complejos.

Configuración de prueba

Estas pruebas se ejecutaron en un equipo de 4 vías con procesador Intel Xeon X5355, de 2,66 GHz y 4 GB de RAM que ejecuta Windows Server 2008 basado en x64. El código de prueba se ejecuta en un proceso único con un subproceso por núcleo para alcanzar el 100% de utilización de la CPU.

Los flujos de trabajo generados para esta prueba tienen dos variables principales: la profundidad y el número de actividades en cada secuencia. Cada nivel de profundidad incluye una actividad paralela, un bucle While, decisiones, asignaciones y secuencias. En el diseñador de WF4 que se muestra más abajo, se representa el diagrama de flujo de nivel superior. Cada actividad de diagrama de flujo es similar al diagrama de flujo principal. Puede ser útil pensar en un fractal al representar este flujo de trabajo, donde la profundidad se limita a los parámetros de la prueba.

El número de actividades en una prueba dada viene determinado por la profundidad y el número de actividades por secuencia. La siguiente ecuación calcula el número de actividades en la prueba de WF4:

Ecuación para calcular el número de actividades

El número de actividades en la prueba de WF3 se puede calcular con una ecuación algo diferente debido a una secuencia adicional:

Ecuación para calcular el número de actividades

Donde d es la profundidad y a es el número de actividades por secuencia. La lógica que subyace a estas ecuaciones es que la primera constante, multiplicada por a, es el número de secuencias y la segunda constante es el número estático de actividades en el nivel actual. Hay tres actividades secundarias de diagrama de flujo en cada diagrama de flujo. En el nivel de profundidad inferior estos diagramas de flujo están vacíos, pero en los demás niveles hay copias del diagrama de flujo principal. El número de actividades en la definición de flujo de trabajo de cada variación de prueba se indica en la siguiente tabla:

Compara el número de actividades usadas en cada prueba

El número de actividades en la definición de flujo de trabajo aumenta claramente con cada nivel de profundidad. Pero solo una ruta por punto de decisión se ejecuta en una instancia de flujo de trabajo dada, por lo que solo se ejecuta un pequeño subconjunto de las actividades reales.

Flujo de trabajo complejo

Se creó un flujo de trabajo equivalente para WF3. El diseñador de WF3 muestra el flujo de trabajo completo en el área de diseño en lugar de anidarlo; por consiguiente, es demasiado extenso para mostrarlo en este tema. A continuación se muestra un fragmento de código del flujo de trabajo.

Flujo de trabajo de WF3

Para ejercer el anidamiento en un caso extremo, otro flujo de trabajo que forma parte de esta prueba utiliza 100 secuencias anidadas. En la secuencia más interna hay una actividad Comment o CodeActivity única.

Secuencias anidadas

El seguimiento y la persistencia no se utilizan como parte de esta prueba.

Resultados de pruebas

Gráfico de rendimiento

Incluso con flujos de trabajo complejos con gran profundidad y un alto número de actividades, los resultados del rendimiento son coherentes con otras cifras mostradas anteriormente en este artículo. El rendimiento de WF4 es más rápido en órdenes de magnitud y tiene que compararse en una escala logarítmica.

Memoria

La sobrecarga de la memoria de Windows Workflow Foundation se mide en dos áreas clave: la complejidad del flujo de trabajo y el número de definiciones de flujo de trabajo. Las mediciones de memoria se tomaron en una estación de trabajo de 64 bits con Windows 7. Hay muchas maneras de obtener la medición del tamaño del espacio de trabajo: supervisar los contadores de rendimiento, sondear Environment.WorkingSet o utilizar una herramienta como VMMap disponible en VMMap. Se utilizó una combinación de métodos para obtener y comprobar los resultados de cada prueba.

Prueba de complejidad de flujo de trabajo

La prueba de complejidad de flujo de trabajo mide la diferencia del espacio de trabajo basándose en la complejidad del flujo de trabajo. Además de los flujos de trabajo complejos utilizados en la sección anterior, las nuevas variaciones se agregan para cubrir dos casos básicos: un flujo de trabajo de una sola actividad y una secuencia con 1000 actividades. Para estas pruebas, los flujos de trabajo se inicializan y ejecutan hasta su finalización en un bucle serie único durante un período de un minuto. Cada variación de prueba se ejecuta tres veces y los datos registrados son la media de estas tres ejecuciones.

Las dos nuevas pruebas básicas tienen flujos de trabajo parecidos a los que se muestran a continuación:

Flujos de trabajo complejos

En el flujo de trabajo de WF3 mostrado más arriba, se utilizan actividades CodeActivity vacías. El flujo de trabajo de WF4 anterior utiliza actividades Comment. La actividad Comment se describió en la sección Comparaciones de rendimiento en el nivel de componente, anteriormente en este artículo.

Gráfico de uso de memoria

Una de las tendencias claras que se observan en este gráfico es que el anidamiento tiene un impacto relativamente mínimo en el uso de memoria tanto en WF3 como en WF4. El impacto en la memoria más significativo procede del número de actividades en un flujo de trabajo determinado. Dados los datos de las variaciones de la secuencia 1000, la secuencia 5 de profundidad compleja 5 y la secuencia 1 de profundidad compleja 7, es evidente que, a partir de la cifra de mil actividades, el aumento del uso de memoria se hace más apreciable. En el caso extremo (secuencia 1 de profundidad 7) donde hay 29.000 actividades aproximadamente, WF4 utiliza casi un 79% menos de memoria que WF3.

Prueba de varias definiciones de flujo de trabajo

La medición de memoria por cada definición de flujo de trabajo se divide en dos pruebas diferentes debido a las opciones disponibles para hospedar flujos de trabajo en WF3 y WF4. La ejecución de estas pruebas se diferencia de la ejecución de la prueba de complejidad de flujo de trabajo en que se crean instancias de un flujo de trabajo determinado y se ejecutan solo una vez por definición. Esto se debe a que la definición de flujo de trabajo y su host permanecen en memoria durante la vigencia de AppDomain. La memoria utilizada en la ejecución de una instancia de flujo de trabajo determinada se debe limpiar durante la recolección de elementos no utilizados. La guía de migración de WF4 contiene información más detallada acerca de las opciones de hospedaje. Para obtener más información, vea el tema que contiene la guía básica de migración de WF sobre hospedaje de flujos de trabajo.

La creación de muchas definiciones de flujo de trabajo para una prueba de definición de flujo de trabajo se puede realizar de varias maneras. Por ejemplo, se puede utilizar generación de código para crear un conjunto de 1000 flujos de trabajo idénticos excepto en el nombre y guardar cada uno de ellos en archivos independientes. Se adoptó este enfoque para la prueba hospedada en consola. En WF3, se utilizó la clase WorkflowRuntime para ejecutar las definiciones de flujo de trabajo. WF4 puede utilizar WorkflowApplication para crear una instancia de flujo de trabajo única o utilizar directamente WorkflowInvoker para ejecutar la actividad como si se tratara de la llamada a un método. WorkflowApplication es un host de una instancia de flujo de trabajo única y tiene una paridad de características muy próxima a WorkflowRuntime, por lo que se utilizó en esta prueba.

Cuando se hospedan flujos de trabajo en IIS, es posible utilizar VirtualPathProvider para crear un nuevo WorkflowServiceHost en lugar de generar todos los archivos XAMLX o XOML. VirtualPathProvider administra la solicitud entrante y responde con un "archivo virtual" que puede cargarse desde una base de datos o, en este caso, generarse sobre la marcha. Por consiguiente, no es necesario crear 1000 archivos físicos.

Las definiciones de flujo de trabajo utilizadas en la prueba de consola fueron flujos de trabajo secuenciales simples con una sola actividad. Esta actividad única fue una actividad CodeActivity vacía en el caso de WF3 y una actividad Comment en el caso de WF4. El caso hospedado en IIS utilizó flujos de trabajo que empiezan en la recepción de un mensaje y finalizan en el envío de una respuesta:

Servicios de flujo de trabajo de WF3 y WF4

Figura 4: flujo de trabajo de WF3 con ReceiveActivity y flujo de trabajo de WF4 con patrón de solicitud/respuesta

En la siguiente tabla se muestra el incremento de espacio de trabajo entre una definición de flujo de trabajo única y 1001 definiciones:

Opciones de hospedaje	Incremento de espacio de trabajo de WF3	Incremento de espacio de trabajo de WF4
Flujos de trabajo hospedados en aplicación de consola	18 MB	9 MB
Servicios de flujo de trabajo hospedados en IIS	446 MB	364 MB

El hospedaje de definiciones de flujo de trabajo en IIS consume mucha más memoria debido a WorkflowServiceHost, los artefactos detallados del servicio de WCF y la lógica de procesamiento de mensajes asociada al host.

Para el hospedaje en consola en WF3 los flujos de trabajo se implementaron en código, en lugar de XOML. En WF4, la opción predeterminada es usar XAML. El XAML se almacena como un recurso incrustado en el ensamblado y se compila en tiempo de ejecución para proporcionar la implementación del flujo de trabajo. Hay alguna sobrecarga asociada a este proceso. Para realizar una comparación objetiva entre WF3 y WF4, se utilizaron flujos de trabajo codificados en lugar de XAML. A continuación se muestra un ejemplo de uno de los flujos de trabajo de WF4:

    public class Workflow1 : Activity
    {
        protected override Func<Activity> Implementation
        {
            get
            {
                return new Func<Activity>(() =>
                {
                    return new Sequence
                    {
                        Activities = {
                            new Comment()
                        }
                    };
                });
            }
            set
            {
                base.Implementation = value;
            }
        }
    }

Hay otros muchos factores que pueden afectar al consumo de memoria. Sigue siendo aplicable el mismo consejo para todos los programas administrados. En entornos hospedados en IIS, el objeto WorkflowServiceHost creado para una definición de flujo de trabajo permanece en memoria hasta que se recicla el grupo de aplicaciones. Debe tenerse en cuenta este aspecto al escribir extensiones. Además, es preferible evitar variables "globales" (variables cuyo ámbito es el flujo de trabajo completo) y limitar el ámbito de las variables en la medida de lo posible.

Servicios de runtime de flujo de trabajo

Persistencia

WF3 y WF4 se proporcionan con un proveedor de persistencia de SQL. El proveedor de persistencia de SQL de WF3 es una implementación simple que serializa la instancia de flujo de trabajo y la almacena en un blob. Por esta razón, el rendimiento de este proveedor depende en gran medida del tamaño de la instancia de flujo de trabajo. En WF3, el tamaño de las instancias podía aumentar por muchas razones, como se ha analizado anteriormente en este documento. Muchos clientes prefieren no utilizar el proveedor de persistencia de SQL predeterminado porque el almacenamiento de una instancia serializada en una base de datos no proporciona visibilidad en el estado del flujo de trabajo. Para encontrar un flujo de trabajo determinado sin conocer su identificador, se tendría que deserializar cada instancia persistente y examinar el contenido. Muchos desarrolladores prefieren escribir sus propios proveedores de persistencia para superar este obstáculo.

El proveedor de persistencia de SQL de WF4 ha intentado solucionar algunas de estas cuestiones. Las tablas de persistencia exponen cierto tipo de información como los marcadores activos y las propiedades que se pueden convertir. La nueva característica de correlación basada en contenido en WF4 no se comportaría correctamente utilizando el enfoque de persistencia de SQL de WF3, que ha impulsado algún cambio en la organización de la instancia de flujo de trabajo persistente. Esto hace que el trabajo del proveedor de persistencia sea más complejo y provoca un esfuerzo adicional en la base de datos.

Configuración de entorno

Entorno de la prueba de rendimiento de flujo de trabajo

Configuración de prueba

Incluso con un conjunto de características mejorado y un control de simultaneidad superior, el proveedor de persistencia de SQL en WF4 es más rápido que el proveedor en WF3. Para ilustrar esta afirmación, a continuación se comparan dos flujos de trabajo que realizan fundamentalmente las mismas operaciones en WF3 y WF4.

Flujos de trabajo de persistencia

Figura 5: flujo de trabajo de persistencia en WF3 (izquierda) y WF4 (derecha)

Los dos flujos de trabajo los crea un mensaje recibido. Después de enviar una respuesta inicial, el flujo de trabajo se conserva. En el caso de WF3, se utiliza una actividad TransactionScopeActivity vacía para iniciar la persistencia. Lo mismo se puede lograr en WF3 marcando una actividad como "conservar al cerrar". Un segundo mensaje correlacionado completa el flujo de trabajo. Los flujos de trabajo se conservan pero no se descargan.

Resultados de pruebas

Persistencia del rendimiento

Cuando el transporte entre el cliente y el nivel intermedio es HTTP, la persistencia en WF4 mejora 2,6 veces más. El transporte TCP aumenta ese valor hasta 3 veces más. En todos los casos, la utilización de la CPU en el nivel intermedio es del 98% o un valor superior. La razón de que el rendimiento de WF4 sea mayor se debe a que el runtime de flujo de trabajo es más rápido. El tamaño de la instancia serializada es bajo en ambos casos y no es un elemento de gran contribución en esta situación.

Los flujos de trabajo de WF4 y WF3 en esta prueba utilizan una actividad para indicar explícitamente cuándo debe producirse la persistencia. Esto tiene la ventaja de que el flujo de trabajo se conserva sin descargarlo. En WF3, también es posible la persistencia utilizando la característica TimeToUnload, pero en este caso se descarga la instancia de flujo de trabajo de la memoria. Si un desarrollador que utiliza WF3 desea asegurarse de que un flujo de trabajo se conserva en determinados puntos, tiene que modificar la definición de flujo de trabajo o pagar el costo de descargar y volver a cargar la instancia de flujo de trabajo. Una nueva característica de WF4 hace posible la persistencia sin descargar: TimeToPersist. Esta característica permite que la instancia de flujo de trabajo se conserve en estado inactivo, pero permanezca en memoria hasta que se satisfaga el umbral de TimeToUnload o se reanude la ejecución.

Observe que el proveedor de persistencia de SQL de WF4 realiza más trabajo en el nivel de base de datos. La base de datos SQL puede convertirse en un cuello de botella, por lo que es importante supervisar el uso de CPU y disco en ella. Asegúrese de incluir los siguientes contadores de rendimiento de la base de datos SQL al realizar las pruebas de rendimiento de las aplicaciones de flujo de trabajo:

Disco físico\Tiempo de lectura de disco en %
Disco físico\Tiempo de disco en %
Disco físico\Tiempo de escritura de disco en %
Disco físico\Media de longitud de cola de disco en %
Disco físico\Media de longitud de cola de lectura de disco
Disco físico\Media de longitud de cola de escritura de disco
Disco físico\Longitud de cola de disco actual
Información de procesador\Tiempo de procesador en %
Bloqueos temporales de SQL\Media de tiempo de espera de bloqueo temporal (ms)
Bloqueos temporales de SQL\Esperas de bloqueo temporal por segundo

Seguimiento

El seguimiento de flujo de trabajo se puede utilizar para realizar el seguimiento del progreso de un flujo de trabajo. La información incluida en los eventos de seguimiento la determina un perfil de seguimiento. Cuanto más complejo sea el perfil de seguimiento, más costoso será el seguimiento.

WF3 se proporcionó con un servicio de seguimiento basado en SQL. Este servicio podía funcionar en modo por lotes y en modo sin lotes. En el modo sin lotes, los eventos de seguimiento se escriben directamente en la base de datos. En modo por lotes, los eventos de seguimiento se recopilan en el mismo lote como estado de instancia de flujo de trabajo. El modo por lotes tiene el máximo rendimiento para la gama más amplia de diseños de flujo de trabajo. Sin embargo, el procesamiento por lotes puede tener un impacto negativo en el rendimiento si el flujo de trabajo ejecuta muchas actividades sin persistencia y se realiza un seguimiento de esas actividades. Esto sucedería normalmente en los bucles y la mejor manera de evitar este escenario es diseñar bucles grandes para que contengan un punto de persistencia. La introducción de un punto de persistencia en un bucle también puede afectar negativamente al rendimiento, por lo que es importante medir los costos de cada uno y lograr un equilibrio.

WF4 no se proporciona con un servicio de seguimiento de SQL. El registro de la información de seguimiento en una base de datos SQL se puede controlar mejor desde un servidor de aplicaciones que si está integrado en .NET Framework. Por lo tanto, el seguimiento de SQL lo controla ahora AppFabric. El proveedor de seguimiento para uso inmediato en WF4 está basado en el Seguimiento de eventos para Windows (ETW).

ETW es un sistema de eventos de baja latencia en el nivel de kernel integrado en Windows. Utiliza un modelo de proveedor/consumidor que permite que solo exista sanción en el seguimiento de eventos cuando haya realmente un consumidor. Además de los eventos de kernel como procesador, disco, memoria y uso de red, muchas aplicaciones también se benefician de las ventajas de ETW. Los eventos ETW son más eficaces que los contadores de rendimiento porque los eventos se pueden personalizar para la aplicación. Un evento puede contener texto, como un identificador de flujo de trabajo o un mensaje informativo. Además, los eventos se categorizan con máscaras de bits, por lo que la utilización de un determinado subconjunto de eventos tendrá un impacto menor en el rendimiento que la captura de todos los eventos.

Estas son algunas de las ventajas del enfoque de utilizar ETW en lugar de SQL para el seguimiento:

La recopilación de eventos de seguimiento se puede separar a otro proceso. Esto proporciona mayor flexibilidad en la forma de grabar los eventos.
Los eventos de seguimiento ETW se combinan fácilmente con los eventos ETW de WCF u otros proveedores de ETW tales como un proveedor de kernel o SQL Server.
Los autores de flujos de trabajo no necesitan modificar un flujo de trabajo para trabajar mejor con una implementación de seguimiento en particular, como el modo por lotes del servicio de seguimiento de SQL de WF3.
Un administrador puede activar o desactivar el seguimiento sin reciclar el proceso de host.

Las ventajas en cuanto a rendimiento para el seguimiento ETW plantean una desventaja. Los eventos ETW se pueden perder si el sistema está sometido a una intensa presión de recursos. El procesamiento de eventos no puede bloquear la ejecución normal de programas y, por consiguiente, no se garantiza que todos los eventos ETW se difundan a sus suscriptores. Esto hace que el seguimiento ETW sea apropiado para la supervisión de estado pero no para el proceso de auditoría.

WF4 no tiene un proveedor de seguimiento de SQL, pero AppFabric sí lo tiene. El enfoque de seguimiento de SQL de AppFabric es la suscripción a eventos ETW con un servicio de Windows que procesa por lotes los eventos y los escribe en una tabla SQL diseñada para inserciones rápidas. Un trabajo independiente descarga los datos de esta tabla y los reforma en tablas de informes que se pueden ver en el panel de AppFabric. Esto significa que un lote de eventos de seguimiento se controla con independencia del flujo de trabajo del que procede y, por consiguiente, no tiene que esperar un punto de persistencia antes de su grabación.

Los eventos ETW se pueden grabar con herramientas como logman o xperf. El archivo ETL compacto puede verse con una herramienta como xperfview o convertirse a un formato más legible, como XML, con tracerpt. En WF3, la única opción para obtener los eventos de seguimiento sin una base de datos SQL es crear un servicio de seguimiento personalizado. Para obtener más información sobre ETW, vea los temas acerca de WCF Services and Event Tracing for Windows y Seguimiento de eventos para Windows.

La habilitación del seguimiento de flujo de trabajo influirá en el rendimiento de diversas maneras. El banco de pruebas que figura más abajo utiliza la herramienta logman para usar los eventos de seguimiento de ETW y grabarlos en un archivo ETL. El costo del seguimiento de SQL en AppFabric no pertenece al ámbito de este artículo. El perfil de seguimiento básico, que también se utiliza en AppFabric, se muestra en este banco de pruebas. También se incluye el costo de realizar solamente el seguimiento de los eventos de supervisión de estado. Estos eventos son útiles para la solución de problemas y la determinación del rendimiento medio del sistema.

Configuración de entorno

Entorno de la prueba de rendimiento de flujo de trabajo

Resultados de pruebas

Coste de la traza del flujo de trabajo

La supervisión de estado tiene un impacto en el rendimiento de un 3%, aproximadamente. El costo del perfil básico se sitúa en torno al 8%.

Interop

WF4 es prácticamente una nueva escritura completa de WF y, por consiguiente, los flujos de trabajo y actividades de WF3 no son directamente compatibles con WF4. Muchos clientes que adoptaron pronto Windows Workflow Foundation tendrán definiciones de flujo de trabajo internas o de otro fabricante y actividades personalizadas para WF3. Una forma de facilitar la transición a WF4 es utilizar la actividad Interop, que puede ejecutar actividades de WF3 desde un flujo de trabajo de WF4. Se recomienda utilizar solamente la actividad Interop cuando sea necesario. Para obtener más información sobre la migración a WF4, vea el tema que contiene la guía de migración de WF4.

Configuración de entorno

Entorno de la prueba de rendimiento de flujo de trabajo

Resultados de pruebas

En la tabla siguiente se muestran los resultados de ejecutar un flujo de trabajo que contiene cinco actividades en una secuencia en varias configuraciones.

Prueba	Rendimiento (flujos de trabajo/segundo)
Secuencia de WF3 en runtime de WF3	1.576
Secuencia de WF3 en runtime de WF4 utilizando Interop	2.745
Secuencia de WF4	153.582

Se observa un aumento notable de rendimiento cuando se utiliza Interop en WF3 directamente. Sin embargo, cuando se compara con las actividades de WF4, el aumento es insignificante.

Resumen

Las inversiones relevantes en rendimiento para WF4 han dado buenos resultados en muchas áreas cruciales. El rendimiento de cada componente de flujo de trabajo es, en algunos casos, cien veces mayor en cuanto a rapidez en WF4 si se compara con WF3; la causa es un runtime WF más ligero. Las cifras de latencia también son significativamente mejores. Esto significa que la reducción de rendimiento por el uso de WF en oposición a los servicios de orquestación de WCF codificados manualmente es muy pequeña frente a las ventajas añadidas derivadas de utilizar WF. El rendimiento de persistencia ha aumentado en un factor comprendido entre 2,5 y 3,0. La sobrecarga de la supervisión de estado por medio del seguimiento de flujo de trabajo es ahora muy pequeña. Hay disponible un conjunto completo de guías de migración para quienes están considerando la posibilidad de cambiar de WF3 a WF4. Todo esto hace que WF4 sea una opción atractiva para escribir aplicaciones complejas.

Reconocimientos

Muchas gracias a los siguientes colaboradores y revisores por sus esfuerzos:

Leon Welicki, Microsoft Corporation
Ryszard Kwiecinski, Microsoft Corporation
Emil Velinov, Microsoft Corporation
Nate Talbert, Microsoft Corporation
Bob Schmidt, Microsoft Corporation
Stefan Batres, Microsoft Corporation

Rendimiento de Windows Workflow Foundation

Terminología

Objetivos

Información general sobre las mejoras de rendimiento de WF4

Runtime de WF

Almacenamiento y flujo de datos

Flujo de control

Programación asincrónica

Mensajería

Programación declarativa

Diseñador de flujo de trabajo

Comparaciones de rendimiento en el nivel de componente

Configuración de entorno

Detalles de prueba

Flujo de trabajo vacío

Actividad única

While con 1000 iteraciones

Replicador comparado con ParallelForEach

Flujo de trabajo secuencial con cinco actividades

Ámbito de transacción

Compensación

Resultados de las pruebas de rendimiento

Escenario de composición de servicio

Servicio de tienda en línea

Entorno

Rendimiento

Consideraciones clave de rendimiento

Latencia de activación de flujo de trabajo

Configuración de entorno

Configuración de prueba

Resultados de pruebas

Rendimiento de la correlación

Configuración de entorno

Configuración de prueba

Resultados de pruebas

Correlación con persistencia

Rendimiento de un flujo de trabajo complejo

Configuración de prueba

Resultados de pruebas

Memoria

Prueba de complejidad de flujo de trabajo

Prueba de varias definiciones de flujo de trabajo

Servicios de runtime de flujo de trabajo

Persistencia

Configuración de entorno

Configuración de prueba

Resultados de pruebas

Seguimiento

Configuración de entorno

Resultados de pruebas

Interop

Configuración de entorno

Resultados de pruebas

Resumen

Reconocimientos

Recursos adicionales