Técnicas de Control de velocidad del ventilador en PC
Analog Devices ofrece un conjunto completo de productos de monitoreo de hardware para usar en PC de escritorio y portátiles, y servidores. Sistemas inteligentes: los dispositivos de monitoreo hacen posible sofisticadas técnicas de control de velocidad del ventilador para proporcionar una refrigeración adecuada y mantener un rendimiento térmico óptimo en el sistema. Durante el año pasado, se desarrolló una familia de productos, incluidos el Controlador de Ventilador y Monitor de Temperatura PWM Dual ADM1029, el Monitor Térmico Remoto de doble Canal de ±1°C con controlador de ventilador integrado ADM1026 y ADM1030/31, compatible con ACPI, para uno o dos ventiladores independientes. Se basan en la tecnología principal utilizada en la cartera de productos de monitores de sistema de PC ADM102x (consulte también Diálogo analógico 33-1 y 33-4). Al proporcionar un control de velocidad del ventilador basado en las temperaturas medidas dentro del sistema, estos nuevos productos ofrecen soluciones de gestión térmica más completas. Aquí discutimos la necesidad de este nivel de control sofisticado y los problemas inherentes a proporcionarlo.
Fondo
A medida que amanece el nuevo milenio, los procesadores están alcanzando velocidades de 1 GHz y más. Sus impresionantes mejoras en la velocidad y el rendimiento del sistema se acompañan de la generación de cantidades cada vez mayores de calor dentro de las máquinas que los utilizan. La necesidad de disipar de forma segura este calor, junto con los movimientos en la industria de la computación para desarrollar “PC verdes” y máquinas fáciles de usar (a medida que los dispositivos de Internet se vuelven convencionales) ha impulsado la necesidad y el desarrollo de técnicas de refrigeración y gestión térmica más sofisticadas.
Los PC también han comenzado a ser más pequeños y menos convencionales en tamaño y forma, como se puede ver en cualquiera de los últimos PC de concepto o portátiles de línea delgada del mercado. Especificaciones rígidas de disipación de energía, como “Directrices de energía móvil’ 99 ” (Ref. 1) estipule cuánto calor se puede disipar de forma segura a través del teclado de un portátil sin causar molestias al usuario. Cualquier exceso de calor debe canalizarse desde el sistema por otros medios, como la convección a lo largo de tuberías de calor y una placa separadora de calor, o el uso de un ventilador para mover el aire a través del sistema. Claramente, lo que se necesita es un enfoque inteligente y eficaz para la gestión térmica que pueda adoptarse universalmente. Varios grupos de la industria se han reunido para abordar estos y otros problemas, y han desarrollado estándares como ACPI (interfaz de configuración avanzada y alimentación) para computadoras portátiles e IPMI (interfaz de gestión de plataforma inteligente) para la administración de servidores.
Estándares de la industria
El desarrollo de los nuevos productos de gestión térmica/control de velocidad fue motivado por los estándares ACPI e IPMI. La configuración avanzada y la interfaz de alimentación-ACPI fue definida por Intel, Microsoft y Toshiba principalmente para definir e implementar la administración de energía dentro de los ordenadores portátiles.
La administración de energía se define como ” Mecanismos en hardware y software para minimizar el consumo de energía del sistema, administrar los límites térmicos del sistema y maximizar la vida útil de la batería del sistema. La administración de energía implica compensaciones entre la velocidad del sistema, el ruido, la duración de la batería, la velocidad de procesamiento y el consumo de energía de ca.”
Considere primero a un usuario de computadora portátil que escriba informes de viaje mientras vuela a través de océanos o continentes. ¿Qué característica es más importante, el máximo rendimiento de la CPU o el aumento de la duración de la batería? En una aplicación de procesador de textos tan simple, donde el tiempo entre las pulsaciones de teclas de un usuario es casi una eternidad en los ciclos de reloj de la CPU, el rendimiento máximo de la CPU no es tan crítico como la disponibilidad continua de energía. Por lo tanto, el rendimiento de la CPU se puede canjear por una mayor duración de la batería. Por otro lado, considere al usuario que quiere ver la última película de James Bond en movimiento completo, pantalla completa, sonido y brillo que adormecen la mente, en un disco versátil digital (DVD). Es fundamental que el sistema funcione a un nivel de rendimiento para decodificar el software lo suficientemente rápido, sin dejar caer marcos de imagen o audio. En esta situación, el rendimiento de la CPU no puede verse comprometido. Por lo tanto, la generación de calor estará en los niveles superiores, y la atención a la gestión térmica será de suma importancia para obtener un rendimiento superior sin afectar la confiabilidad. Ingrese ACPI.
¿Qué es entonces ACPI? ACPI es una especificación que describe la interfaz entre los componentes y cómo se comportan. No es una especificación puramente de software o hardware, ya que describe cómo el software del BIOS, el software del sistema operativo y el hardware del sistema deben interactuar.
La especificación ACPI describe dos métodos distintos de refrigeración del sistema: refrigeración pasiva y refrigeración activa. La refrigeración pasiva se basa en el sistema operativo (SO) y/o el software básico del sistema de entrada/salida (BIOS) para reducir el consumo de energía de la CPU con el fin de reducir la disipación de calor de la máquina. ¿Cómo se puede lograr esto? Al tomar decisiones inteligentes, como entrar en el modo de suspensión si no se ha detectado ninguna pulsación de tecla u otra interacción del usuario después de un tiempo especificado. O si el sistema está haciendo algunos cálculos intensivos, como el procesamiento 3D, y se está calentando peligrosamente, la BIOS podría decidir acelerar (ralentizar) el reloj de la CPU. Esto reduciría la potencia térmica de la máquina, pero a costa del rendimiento general del sistema. ¿Cuál es el beneficio de este enfriamiento de tipo pasivo? Su ventaja distintiva es que el requisito de energía del sistema se reduce silenciosamente (no se requiere operación del ventilador) para disminuir la temperatura del sistema, pero limita el rendimiento.
Entonces, ¿qué pasa con el enfriamiento activo? En un sistema enfriado activamente, el software del sistema operativo o del BIOS realiza una acción directa, como encender un ventilador montado en la CPU, para enfriar el procesador. Tiene la ventaja de que el mayor flujo de aire sobre la babosa metálica o el disipador de calor de la CPU permite que el calor se extraiga de la CPU con relativa rapidez. En un sistema enfriado pasivamente, la aceleración de la CPU por sí sola evitará un mayor calentamiento de la CPU, pero la resistencia térmica del disipador térmico al “aire inmóvil” puede ser bastante grande, lo que significa que el disipador disiparía el calor al aire bastante lentamente, retrasando el retorno al procesamiento a toda velocidad. Por lo tanto, un sistema que emplea refrigeración activa puede combinar el máximo rendimiento de la CPU y una disipación de calor más rápida. Sin embargo, el funcionamiento del ventilador introduce ruido acústico en el entorno del sistema y consume más energía. ¿Qué técnica de enfriamiento es mejor? En realidad, depende de la aplicación; una máquina versátil utilizará ambas técnicas para manejar circunstancias diferentes. ACPI describe las técnicas de enfriamiento en términos de dos modos diferentes: modo de rendimiento y modo silencioso. Los dos modos se comparan en las Figuras 1 y 2.
Las figuras 1 y 2 son ejemplos de escalas de temperatura que ilustran las respectivas compensaciones entre el rendimiento, el ruido acústico del ventilador y el consumo / disipación de energía. Para que un dispositivo de gestión del sistema sea compatible con ACPI, debe ser capaz de señalizar cruces de límites a intervalos de, por ejemplo, 5°C, o eventos SCI (interrupción del control del sistema), que se ha producido un nuevo incremento de temperatura fuera del límite. Estos eventos proporcionan un mecanismo por el cual el sistema operativo puede rastrear la temperatura del sistema y tomar decisiones informadas sobre si acelerar el reloj de la CPU, aumentar/disminuir la velocidad del ventilador de refrigeración o tomar medidas más drásticas. Una vez que la temperatura supere la configuración de directiva _CRT (temperatura crítica), el sistema se apagará como sistema a prueba de fallos para proteger la CPU. Las otras dos configuraciones de directiva que se muestran en las Figuras 1 y 2 son _PSV (refrigeración pasiva o limitación del reloj de la CPU) y _ACx. (refrigeración activa, cuando se enciende el ventilador).
En la Figura 1 (modo de rendimiento), el ventilador de refrigeración se enciende a 50°C. Si la temperatura continúa aumentando más allá de 60°C, se inicia la aceleración del reloj. Este comportamiento maximizará el rendimiento del sistema, ya que el sistema solo se ralentiza a una temperatura más alta. En la Figura 2 (modo silencioso), el reloj de la CPU se estrangula primero a 45 grados C. Si la temperatura continúa aumentando, es posible que se encienda un ventilador de refrigeración a 60 grados C. Este modo de rendimiento reducido también tenderá a aumentar la duración de la batería, ya que la aceleración del reloj reduce el consumo de energía.
La figura 3 muestra cómo los límites de las bandas de medición de temperatura rastrean la medición de temperatura. Cada cruce de límites produce una interrupción.
La especificación de interfaz de gestión de plataforma inteligente (IPMI) (Ref. 2) trae características de administración térmica similares a los servidores. El objetivo de IPMI es reducir el coste total de propiedad (TCO) de un servidor mediante la supervisión de los parámetros críticos de “latido” del sistema: temperatura, voltajes, velocidades del ventilador y fuentes de alimentación. Otra motivación para IPMI es la necesidad de interoperabilidad entre servidores, para facilitar la comunicación entre los zócalos y el chasis. IPMI se basa en el uso de un bus I2C de 5 voltios, con mensajes enviados en forma de paquete. Encontrará más información sobre IPMI en el sitio web de Intel en http://developer.intel.com/design/servers/ipmi/.
Todos los miembros de la familia de monitoreo de temperatura y sistemas (TSM) de Analog Devices cumplen con ACPI e IPMI.
Monitoreo de temperatura
El requisito previo para el control inteligente de la velocidad del ventilador dentro de las PC es la capacidad de medir con precisión la temperatura del sistema y del procesador. La técnica de monitoreo de temperatura utilizada ha sido el tema de muchos artículos (por ejemplo, ver Diálogo Analógico 33-4.) y solo se visitará brevemente aquí. Todos los dispositivos de monitoreo del sistema de dispositivos analógicos utilizan una técnica de monitoreo de temperatura conocida como monitoreo de diodos térmicos (TDM). La técnica hace uso del hecho de que el voltaje delantero de un transistor conectado a diodos, operado a una corriente constante, exhibe un coeficiente de temperatura negativo, de aproximadamente-2mV/°C. Dado que el valor absoluto de VBE varía de un dispositivo a otro, esta característica por sí sola no es adecuada para su uso en dispositivos producidos en masa, ya que cada uno requeriría una calibración individual. En la técnica TDM, se pasan sucesivamente dos corrientes diferentes a través del transistor y se mide el cambio de voltaje. La temperatura está relacionada con la diferencia en VBE por:
ΔVBE = kT/q × ln(N)
donde:
k = Boltzmann,
q = carga del electrón magnitud
T = temperatura absoluta en grados kelvin
N = relación de las dos corrientes
En cualquier CPU, la temperatura más relevante es la del “punto caliente” en el dado. Todas las demás temperaturas del sistema (incluida la temperatura del disipador de calor) retrasarán el aumento de esta temperatura. Por esta razón, prácticamente todas las CPU (fabricadas desde los primeros procesadores Intel Pentium II) contienen un transistor estratégicamente ubicado en su matriz para monitoreo térmico. Da un perfil real, esencialmente instantáneo, de la temperatura de la matriz. La Figura 5 muestra los perfiles de temperatura en un sistema que entran y se despiertan repetidamente desde el modo de suspensión. Compara las temperaturas medidas por un termistor conectado al disipador de calor de la CPU y por el diodo térmico del sustrato. En el corto intervalo para que la temperatura real de la matriz cambie hacia adelante y hacia atrás en aproximadamente 13 grados, el termistor del disipador de calor no puede detectar ningún cambio.
Control de temperatura a ventilador
Con un método de monitoreo de temperatura preciso establecido, se puede implementar un control de ventilador efectivo. La técnica, en general, es usar TDM para medir la temperatura, con el transistor de detección integrado en el chip o colocado externamente lo más cerca posible de un punto caliente, y ajustando la velocidad del ventilador a un nivel que garantice el transporte de calor suficiente a esa temperatura. Se programarán varios parámetros de funcionamiento del bucle de control, como la velocidad mínima, la temperatura de arranque del ventilador, la velocidad frente a la pendiente de temperatura y la histéresis de encendido/apagado. Los enfoques de control de velocidad descritos incluirán encendido-apagado, continuo (“lineal”) y modulación de ancho de pulso (PWM).
Métodos de control del ventilador: Históricamente, la gama de enfoques para el control de velocidad del ventilador en PC va desde el simple control de encendido y apagado hasta el control de velocidad de la temperatura al ventilador en bucle cerrado.
Control de dos pasos: Esta fue la primera forma de control de velocidad del ventilador adoptada en PC. El BIOS mediría la temperatura del sistema (originalmente usando un termistor cerca de la CPU) y decidiría si encender o apagar un ventilador de refrigeración por completo. Más tarde, las PC utilizaron monitores de temperatura basados en TDM más precisos para implementar el mismo control de ventilador de dos pasos.Control de tres pasos
: El BIOS o Sistema Operativo mide de nuevo la temperatura utilizando un termistor o diodo térmico y, en función de la configuración del software, decide si encender o apagar completamente el ventilador o configurarlo para que funcione a media velocidad.
Control lineal de velocidad del ventilador: Este método más reciente de control de velocidad del ventilador también se conoce como control de voltaje. El BIOS o el sistema operativo lee la temperatura del circuito de medición TDM y escribe de vuelta un byte a un DAC en chip, para ajustar el voltaje de salida con el fin de controlar la velocidad del ventilador. Un ejemplo de controlador de ventilador IC de este tipo es el ADM1022, que tiene un chip DAC de 8 bits con un rango de voltaje de salida de 0 V a 2,5 V. Funciona con un amplificador de búfer externo con clasificaciones de diseño adecuadas para el ventilador elegido. El ADM1022 también contiene puntos de disparo de hardware automáticos predeterminados que hacen que el ventilador se accione a toda velocidad en caso de que su circuito TDM detecte una condición de sobrecalentamiento. El debut de este tipo de dispositivos significó la aparición del control automático de la velocidad del ventilador, donde parte de la toma de decisiones se traslada del software del sistema operativo al hardware de monitoreo del sistema.Control de velocidad del ventilador de modulación de ancho de pulso (PWM): En la línea de productos de monitoreo de sistemas de ADI, estos tipos de PWM son los productos de control de ventilador más recientes. El BIOS o el sistema operativo puede leer la temperatura del dispositivo TDM y controlar la velocidad del ventilador de refrigeración ajustando el ciclo de trabajo PWM que se le aplica.
Vale la pena señalar que todos los métodos anteriores de control de velocidad del ventilador dependen de la intervención de la CPU o del host para leer la temperatura del dispositivo TDM a través del Bus de Administración del sistema de 2 cables. El software de gestión térmica ejecutado por la CPU debe decidir cuál debe ser la velocidad del ventilador y escribir un valor en un registro en el IC del monitor de sistemas para establecer la velocidad del ventilador adecuada.
Un siguiente paso obvio en la evolución del control de velocidad del ventilador es implementar un bucle de control de velocidad del ventilador automático, que podría comportarse independientemente del software y hacer funcionar el ventilador a su velocidad óptima para una temperatura de chip dada. Este control de velocidad de bucle cerrado ofrece muchos beneficios.
Una vez que el dispositivo de monitoreo de sistemas se ha inicializado (cargando registros de límite con los parámetros requeridos), el bucle de control es completamente independiente del software, y el CI puede reaccionar a los cambios de temperatura sin intervención del host. Esta característica es especialmente deseable cuando se produce un fallo catastrófico del sistema, del cual el sistema no puede recuperarse. Si el PC se bloquea, el software de administración de energía en el sistema operativo ya no se ejecuta, lo que resulta en la pérdida de la administración térmica. Si el PC no puede leer la temperatura que se está midiendo (ya que el PC se ha bloqueado), no se puede esperar que ajuste la velocidad correcta del ventilador para proporcionar el nivel de enfriamiento requerido.
El otro beneficio tangible de una implementación de circuito cerrado es que operará el ventilador a la velocidad óptima para cualquier temperatura dada. Esto significa que se reducen tanto el ruido acústico como el consumo de energía. El funcionamiento de un ventilador a toda velocidad maximiza el consumo de energía y el ruido acústico. Si la velocidad del ventilador se puede administrar de manera efectiva a través de la optimización de bucles, se reduce el consumo de energía y el ruido audible del ventilador para que funcione tan rápido como sea necesario para una temperatura determinada. Este es un requisito absolutamente crítico en las aplicaciones de PC portátiles alimentadas por baterías, donde cada miliamperio de corriente (o miliamperio-segundo de carga) es un bien preciado.
Bucle de Control automático de la velocidad del ventilador
A continuación se explica cómo se puede implementar un bucle de control automático de la velocidad del ventilador, que medirá la temperatura utilizando técnicas TDM y ajustará la velocidad del ventilador adecuadamente en función de la temperatura. Los parámetros programables permiten un control más completo del bucle. El primer valor de registro que se programará es TMIN. Esta es la temperatura (correspondiente a ACx) a la que el ventilador se encenderá por primera vez y donde comenzará el control de velocidad del ventilador. La velocidad se ajusta momentáneamente al máximo para poner en marcha el ventilador y, a continuación, se vuelve a la configuración de velocidad mínima (véase la Figura 6). El parámetro que permite controlar la pendiente de la función de temperatura a velocidad del ventilador es el rango de TMÁX a TMIN, o TRANGE. Los valores programados para TMIN y TRANGE definen la temperatura a la que el ventilador alcanzará la velocidad máxima, es decir, TMAX = TMIN + TRANGE. El rango de temperatura programado es seleccionable: 5&de; C, 10 ° C, 20 ° C, 40 ° C y 80°C. Con el fin de evitar el encendido y apagado rápidos en las proximidades de la MINT, se utiliza histéresis para establecer una temperatura por debajo de la MINT, a la que se apaga el ventilador. La cantidad de histéresis que se puede programar en el bucle es de 1°C a 15°C. Este bucle de control del ventilador puede ser supervisado por el software del sistema operativo a través del SMBus y el PC puede decidir anular el bucle de control en cualquier momento.
PWM vs Control lineal de velocidad del ventilador
Uno podría preguntarse por qué la modulación de ancho de pulso es deseable si el control lineal de velocidad del ventilador ya está en uso generalizado.
Considere un ventilador de 12 V accionado mediante control lineal de velocidad del ventilador. A medida que el voltaje aplicado al ventilador aumenta lentamente de 0 V a aproximadamente 8 V, el ventilador comenzará a girar. A medida que el voltaje del ventilador aumenta aún más, la velocidad del ventilador aumentará hasta que funcione a la velocidad máxima cuando se acciona con 12 V. Por lo tanto, el ventilador de 12 V tiene una ventana de funcionamiento efectiva entre 8 V y 12 V; con un rango de solo 4 V disponible para su uso en el control de velocidad.
La situación empeora con el ventilador de 5 V que se utilizaría con un ordenador portátil. El ventilador no arrancará hasta que el voltaje aplicado sea de aproximadamente 4 V. Por encima de 4 V, el ventilador tenderá a girar casi a toda velocidad, por lo que hay poco control de velocidad disponible entre 4 y 5 voltios. Por lo tanto, el control de velocidad lineal del ventilador no es adecuado para controlar la mayoría de los tipos de ventiladores de 5V.
Con modulación de ancho de pulso (PWM), el voltaje máximo se aplica para intervalos controlados (el ciclo de trabajo de una onda cuadrada, típicamente a 30 a 100 Hz). A medida que este ciclo de trabajo, o relación de tiempo alto a tiempo bajo, es variado, la velocidad del ventilador cambiará.
A estas frecuencias, se reciben pulsos de tacómetro limpios del ventilador, lo que permite una medición fiable de la velocidad del ventilador. A medida que las frecuencias de transmisión aumentan, hay problemas con pulsos de taquicardia insuficientes para una medición precisa, luego ruido acústico y, finalmente, picos eléctricos que corrompen la señal de taquicardia. Por lo tanto, la mayoría de las aplicaciones PWM utilizan excitación de baja frecuencia para accionar el ventilador. El circuito externo de la unidad PWM es bastante simple. Se puede lograr (Figura 7) con un solo transistor externo o MOSFET para accionar el ventilador. El equivalente lineal de control de velocidad del ventilador, impulsado por un voltaje de velocidad analógico, requiere un amplificador de operación, un transistor de paso y un par de resistencias para ajustar la ganancia del amplificador de operación.
¿Cómo se mide la velocidad del ventilador? Un ventilador de 3 hilos tiene una salida de tach, que generalmente produce 1, 2 o 4 pulsos de tach por revolución, dependiendo del modelo de ventilador. Esta señal de tacómetro digital se aplica directamente a la entrada de tacómetro en el dispositivo de monitoreo de sistemas. Los pulsos de taquicardia no se cuentan, porque un ventilador funciona relativamente lentamente, y tomaría una cantidad considerable de tiempo acumular una gran cantidad de pulsos de taquicardia para una medición confiable de la velocidad del ventilador. En su lugar, los pulsos tach se utilizan para conectar un oscilador en chip que funciona a 22,5 kHz a través de un contador (Ver Figura 8). En efecto, se está midiendo el período de taquicardia para determinar la velocidad del ventilador. Un recuento alto en el registro de valores de tac indica que el ventilador funciona a baja velocidad (y viceversa). Se utiliza un registro de límite para detectar ventiladores atascados o estancados.
¿Qué otros problemas hay con el control de velocidad del ventilador?
Cuando se controla un ventilador utilizando PWM, el ciclo de trabajo mínimo para un funcionamiento continuo confiable del ventilador es de aproximadamente el 33%. Sin embargo, un ventilador no arranca con un ciclo de trabajo del 33% porque no hay suficiente energía disponible para superar su inercia. Como se señaló en la discusión de la Figura 6, la solución a este problema es girar el ventilador durante 2 segundos en el arranque. Si el ventilador necesita funcionar a su velocidad mínima, el ciclo de trabajo PWM puede reducirse al 33% después de que el ventilador se haya girado, y la histéresis lo protege del estancamiento.
Paradas del ventilador & Fallos del ventilador
Sin embargo, puede surgir la posibilidad de que un ventilador se detenga en algún momento mientras se usa en un sistema. Las causas pueden incluir un ventilador que funciona demasiado lento o la acumulación de polvo que impide que gire. Por esta razón, los monitores de Analog Devices systems tienen un mecanismo integrado en el chip basado en la salida tach del ventilador para detectar y reiniciar un ventilador estancado. Si no se reciben pulsos de tach, el valor en el registro de Valores de Tach excederá el límite en el Registro de Límites de Tach y se establecerá una bandera de error. Esto hará que el controlador intente reiniciar el ventilador al intentar girarlo durante 2 segundos. Si el ventilador continúa fallando, durante un máximo de 5 intentos de reinicio, se reconoce que existe un fallo catastrófico del ventilador, y un pin FAN_FAULT afirmará advertir al sistema de que un ventilador ha fallado. En los sistemas de doble controlador de dos ventiladores, el segundo ventilador se puede girar a toda velocidad para tratar de compensar la pérdida de flujo de aire debido a la falla del primer ventilador.
Resumen
Analog Devices continúa desarrollando y ofreciendo soluciones de gestión térmica superiores a la industria informática. Las técnicas desarrolladas para el ADM1029, el ADM1030 / 31 y el ADM1026 llevan la gestión térmica dentro de los PC a un nuevo nivel. Estos dispositivos están llenos de características como monitoreo de temperatura, control automático de temperatura en el hardware, medición de velocidad del ventilador, soporte para ventiladores redundantes y de respaldo, detección de fallas y presencia del ventilador, frecuencia PWM programable y ciclo de trabajo. A medida que las pautas de alimentación se vuelven más estrictas y los PC funcionan significativamente más calientes, se están desarrollando técnicas de medición de temperatura y control de velocidad del ventilador más sofisticadas para administrar los sistemas del futuro de manera más efectiva.
Leave a Reply