Aprovecha toda la potencia de tu GPU con Ansys Fluent (Parte 2)

Imagina el tiempo que podrías ahorrar a lo largo del año si pudieras ahorrar unos minutos, horas o incluso días en cada tarea. Pues bien, si esa tarea es la simulación de dinámica de fluidos computacional (CFD) y quieres reducir los tiempos de resolución, el solver de Ansys Fluent para la GPU podría ser la solución.

Ya sea para resolver un modelo de 100.000 celdas o de 100 millones de celdas, un enfoque tradicional para reducir el tiempo de simulación es resolver en muchas CPU. Otro enfoque que ha ganado atención en los últimos años es el uso de unidades de procesamiento gráfico, o GPU. Esto comenzó cuando algunas partes de la solución de la CPU se pasaron a las GPU para acelerar el tiempo de solución general, lo que se conoce como descarga a las GPU.

Ya implementamos esta tecnología de descarga en Ansys Fluent en 2014, pero este año estamos llevando el uso de la tecnología de la GPU a un nivel completamente nuevo con la introducción de un solver multi-GPU nativo en Fluent. Una implementación nativa proporciona todas las funciones del solver en la GPU y evita la sobrecarga de intercambio de datos entre la CPU y la GPU, lo que se traduce en una mayor aceleración en comparación con la descarga.

Para aprovechar todo el potencial de las GPU para la CFD es necesario que todo el código se ejecute de forma residente en la(s) GPU(s).

En la primera parte de este blog destacamos una aceleración de 32 veces en una simulación de aerodinámica externa de automóviles de gran tamaño, pero entendemos que no todos los usuarios simulan modelos de ese tamaño. En este blog, destacaremos la potencia de las GPU para modelos más pequeños que contienen funciones físicas adicionales, como los medios porosos y la transferencia de calor conjugada (CHT).

Acelerar las simulaciones CFD de todos los tamaños

Los modelos detallados en este blog, que van desde 512.000 celdas hasta más de 7 millones, muestran un aumento sustancial del rendimiento cuando se resuelven en las GPU. Y no es necesario contar con la GPU más cara a nivel de servidor para obtener ganancias de rendimiento sustanciales, ya que el solucionador de Fluent para la GPU puede utilizar la GPU de su portátil o estación de trabajo para reducir considerablemente los tiempos de solución. Pero no te conformes con nuestra palabra: sigue leyendo para ver cómo el solver nativo para múltiples GPUs ha dado lugar a aumentos de velocidad de:

  • 8,32X para un sistema de admisión de aire
  • 8,6X para un inversor de tracción
  • 15,47X y 11X para dos diseños diferentes de intercambiadores de calor

Flujo de aire a través de un filtro poroso

Los sistemas de admisión de aire en los automóviles se utilizan para aspirar el aire, haciéndolo pasar por un filtro para eliminar los residuos y enviar aire limpio al motor. Para esta simulación de 7,1 millones de celdas, el filtro se modela como un medio poroso con una resistencia viscosa de 1e+8 m-2 y una resistencia inercial de 2.500 m-1. El aire entra en el sistema de admisión con un caudal másico de 0,08 kg/s.

La velocidad de un sistema de entrada de aire se aceleró 8,32 veces cuando se resolvió en una GPU NVIDIA A100.

Para resolver este modelo se utilizaron cuatro configuraciones de hardware diferentes, tres de ellas compuestas por núcleos Intel® Xeon® Gold 6242 y una por una GPU NVIDIA A100 Tensor Core.

El uso de una sola GPU NVIDIA A100 dio como resultado un aumento de velocidad de 8,3 veces en comparación con la resolución en 32 núcleos Intel® Xeon® Gold.

8.32X speedup for airflow through a porous media

El uso de una sola GPU NVIDIA A100 para simular el flujo de aire a través de un medio poroso dio como resultado un aumento de velocidad de 8,3 veces en comparación con 32 núcleos Intel® Xeon® Gold.

Gestión térmica mediante la modelización de la transferencia de calor conjugada (CHT)

En muchas aplicaciones industriales es fundamental tener en cuenta los efectos térmicos junto con el flujo de fluidos. Para capturar con precisión el comportamiento térmico del sistema, suele ser importante la transferencia de calor en el fluido junto con la conducción de calor en el metal adyacente. Nuestro solucionador nativo para la GPU muestra un enorme aumento de la velocidad en estos problemas de CHT acoplados.

A continuación se muestran tres simulaciones térmicas diferentes que incluyen CHT, un inversor de tracción refrigerado por agua de 4 millones de celdas, un intercambiador de calor de aletas de persiana de 1,4 millones de celdas y un disipador de calor de montaje vertical de 512.000 celdas.

Water-Cooled Traction Inverter

Una simulación de un inversor de tracción con CHT que se aceleró 8,6 veces cuando se resolvió en una GPU NVIDIA A100.

Los inversores de tracción toman la corriente continua (DC) de una batería de alto voltaje y la convierten en corriente alterna (AC) para enviarla a un motor eléctrico. La gestión térmica es fundamental para que los inversores de tracción garanticen tanto la seguridad como la longevidad.

El modelo mostrado arriba es un inversor de tracción de 4 millones de celdas refrigerado por agua que tiene cuatro transistores bipolares de puerta aislada (IGBT) con una carga térmica de 400 W. La refrigeración procede del agua de 25 °C que circula por la carcasa a una velocidad de 0,5 kg/s, y el rechazo de calor al aire circundante se modela utilizando una condición de contorno convectiva.

La resolución en una GPU NVIDIA A100 dio como resultado un aumento de velocidad de 8,6 veces en comparación con 32 núcleos Intel® Xeon ® Gold 6242.

Intercambiador de calor con aletas de persiana

Este modelo de intercambiador de calor utiliza la convección forzada a través de un intercambiador de calor de aletas apersianadas. El problema consiste en que el aire a 20° C fluye a través de las aletas de rejilla de aluminio a una velocidad de 4 m/s para enfriar los tubos de cobre.

Para establecer una línea de base, ejecutamos el modelo de 1,4 millones de celdas en 8 núcleos Intel® Xeon® Gold 6242. Al ejecutar este mismo modelo en una GPU NVIDIA A100, la velocidad se multiplicó por 15,5.

El contorno de la temperatura en un intercambiador de calor con aletas de rejilla se resolvió 15,47 veces más rápido en una NVIDIA A100.

15.47X speedup for a louvered fin heat exchanger

Una sola GPU proporcionó una velocidad de resolución de la simulación 15,47 veces mayor para un intercambiador de calor de aletas de rejilla.

Disipador de calor de montaje vertical

El problema final consiste en un disipador de calor de aluminio de cinco aletas por convección libre con la base mantenida a una temperatura constante de 76,85° C y el aire circundante a una temperatura ambiente de 16,85° C.

La resolución de este caso de 512.000 celdas en un portátil con una GPU NVIDIA Quadro RTX 5000 dio como resultado un aumento de velocidad de 11 veces en comparación con los 6 núcleos Intel® Core™ i7-11850H del portátil.

Incluso cuando se utiliza una sola GPU de portátil como la NVIDIA Quadro RTX 5000, se pueden esperar grandes reducciones en el tiempo de resolución con el solucionador multi-GPU nativo de Fluent. Si se utiliza una tarjeta gráfica similar en una estación de trabajo, se puede esperar un rendimiento aún mayor.

La simulación de un disipador de calor de 512.000 celdas se aceleró 11 veces cuando se resolvió en una GPU NVIDIA Quadro RTX 5000.

Revolucionando las simulaciones de CFD a través de las GPU

Los usuarios de Fluent disponen ahora de la potencia y la flexibilidad necesarias para ejecutarlo en un portátil o una estación de trabajo con una sola GPU o ampliarlo a un servidor multi-GPU. Aproveche el hardware que ya posee para acelerar sus simulaciones CFD más de lo que nunca pensó.

El solver multi-GPU nativo de Fluent funciona en cualquier tarjeta NVIDIA de 2016 o posterior con el driver CUDA 11.0 o más reciente instalado.

Ansys ha sido pionero en el uso de la tecnología de la GPU para la simulación, y con esta nueva tecnología de solver, la estamos llevando a un nivel completamente nuevo. Todas las funciones del solver nativo para la GPU están construidas con los mismos métodos numéricos y de discretización que el solver Fluent para la CPU, lo que proporciona a los usuarios los resultados precisos que esperan en menos tiempo que nunca.