Fläkthastighetskontrolltekniker i datorer
analoga enheter erbjuder en omfattande uppsättning hårdvaruövervakningsprodukter för användning i stationära och bärbara datorer och servrar. Intelligenta system-övervakningsenheter möjliggör sofistikerade fläkthastighetskontrolltekniker för att ge tillräcklig kylning och bibehålla optimal termisk prestanda i systemet. Under det senaste året har en familj av produkter, inklusive ADM1029 Dual PWM Fan Controller och Temperaturmonitor, ADM1026 och ADM1030/31 komplett, ACPI-kompatibel, Dual-Channel 0-kanals 1-kanals-Fjärrvärmemonitor med integrerad fläktkontroll, för en eller två oberoende fläktar, utvecklats. De bygger på kärntekniken som används i produktportföljen ADM102x PC System Monitor (se även Analog dialog 33-1 och 33-4). Med fläkthastighetskontroll baserat på de temperaturer som mäts i systemet erbjuder dessa nya produkter mer kompletta termiska hanteringslösningar. Vi diskuterar här behovet av denna nivå av sofistikerad kontroll och de frågor som är inneboende i att tillhandahålla den.
Bakgrund
när det nya årtusendet gryr, uppnår processorer hastigheter på 1 GHz och mer. Deras imponerande förbättringar i hastighet och systemprestanda åtföljs av generering av ökande mängder värme i de maskiner som använder dem. Behovet av att säkert sprida denna värme, tillsammans med rörelser i datorindustrin för att utveckla “gröna datorer” och användarvänliga maskiner (som internetapparater blir vanliga) har drivit behovet av och utvecklingen av mer sofistikerade kylnings-och värmehanteringstekniker.
datorer har också börjat bli mindre och mindre konventionella i storlek och form-vilket kan ses i någon av de senaste konceptdatorer eller smala bärbara datorer på marknaden. Stela strömavledning specifikationer såsom “Mobile Power guidelines’ 99 ” (Ref. 1) ange hur mycket värme som kan släppas säkert genom en notebook-tangentbord utan att orsaka obehag för användaren. Eventuell överskottsvärme måste kanaliseras ut från systemet på annat sätt, såsom konvektion längs värmerör och en värmespridarplatta, eller användning av en fläkt för att flytta luft genom systemet. Det är uppenbart att det som behövs är ett intelligent, effektivt tillvägagångssätt för termisk hantering som kan antas universellt. Olika branschgrupper har samlats för att ta itu med dessa och andra frågor, och har utvecklat standarder som ACPI (advanced configuration and power interface) för bärbara datorer och IPMI (intelligent platform management interface) för serverhantering.
industristandarder
utvecklingen av de nya värmehanterings – /hastighetskontrollprodukterna motiverades av ACPI-och IPMI-standarderna. Den avancerade konfigurationen och strömgränssnittet-ACPI definierades av Intel, Microsoft och Toshiba främst för att definiera och implementera strömhantering inom bärbara datorer.
energihantering definieras som ” mekanismer i hårdvara och mjukvara för att minimera systemets strömförbrukning, hantera systemets termiska gränser och maximera systemets batterilivslängd. Strömhantering innebär avvägningar mellan systemhastighet, brus, batterilivslängd, bearbetningshastighet och strömförbrukning.”
Tänk först på en notebook-PC-användare som skriver reserapporter medan de flyger över hav eller kontinenter. Vilken egenskap är viktigare, maximal CPU-prestanda eller ökad batterilivslängd? I en sådan enkel ordbehandlare ansökan, där tiden mellan en användares tangenttryckningar är nästan en evighet i CPU klockcykler, maximal CPU-prestanda är långt ifrån lika kritisk som kontinuerlig tillgång till ström. Så CPU-prestanda kan handlas mot ökad batterilivslängd. Å andra sidan, överväga användaren som vill titta på den senaste James Bond-filmen i full-motion, full-screen, mind-bedövande ljud och ljusstyrka, på digital versatile disk (DVD). Det är viktigt att systemet fungerar på en nivå av prestanda för att avkoda programvaran tillräckligt snabbt, utan att tappa bild-eller ljudramar. I denna situation kan CPU-prestanda inte äventyras. Därför kommer värmeproduktionen att vara på toppnivåer, och uppmärksamhet på termisk hantering kommer att vara av största vikt för att uppnå topprestanda utan att försämra tillförlitligheten. Ange ACPI.
vad är då ACPI? ACPI är en specifikation som beskriver gränssnittet mellan komponenter och hur de beter sig. Det är inte en ren mjukvaru-eller hårdvaruspecifikation, eftersom den beskriver hur BIOS-programvaran, OS-programvaran och systemhårdvaran ska interagera.
ACPI-specifikationen beskriver två distinkta metoder för systemkylning: passiv kylning och aktiv kylning. Passiv kylning bygger på operativsystemet (OS) och/eller Basic input/output-system (BIOS) programvara för att minska CPU-strömförbrukningen för att minska maskinens värmeavledning. Hur kan detta uppnås? Genom att fatta intelligenta beslut som att gå in i viloläge om ingen tangenttryckning eller annan användarinteraktion har upptäckts efter en viss tid. Eller om systemet gör några intensiva beräkningar, till exempel 3D-bearbetning, och blir farligt varmt, kan BIOS besluta att gasa (sakta ner) CPU-klockan. Detta skulle minska den termiska effekten från maskinen, men på bekostnad av den totala systemprestanda. Vad är fördelen med denna passiva kylning? Dess tydliga fördel är att systemets effektbehov sänks tyst (fläktdrift krävs inte) för att minska systemtemperaturen, men det begränsar prestanda.
så, vad sägs om aktiv kylning? I ett aktivt kylt system tar OS-eller BIOS-programvaran en direkt åtgärd, som att slå på en CPU-monterad fläkt, för att kyla ner processorn. Det har fördelen att det ökade luftflödet över CPU: s metallsnigel eller kylfläns gör att värmen kan dras ut ur CPU: n relativt snabbt. I ett passivt kylt system kommer CPU-strypning ensam att förhindra ytterligare uppvärmning av CPU, men kylflänsens värmebeständighet till “still air” kan vara ganska stor, vilket innebär att kylflänsen skulle sprida värmen till luften ganska långsamt, vilket fördröjer en återgång till fullhastighetsbehandling. Således kan ett system som använder aktiv kylning kombinera maximal CPU-prestanda och snabbare värmeavledning. Men driften av fläkten introducerar akustiskt ljud i systemets miljö och drar mer kraft. Vilken kylteknik är bättre? I verkligheten beror det på applikationen; en mångsidig maskin kommer att använda båda teknikerna för att hantera olika omständigheter. ACPI beskriver kylteknikerna i termer av två olika lägen: performance mode och silent mode. De två lägena jämförs i figurerna 1 och 2.
figurerna 1 och 2 är exempel på temperaturskalor som illustrerar respektive avvägningar mellan prestanda, fläktljudljud och strömförbrukning / avledning. För att en systemhanteringsanordning ska vara ACPI-kompatibel bör den kunna signalera gränskorsningar vid, säg, 5 C-intervall i C eller SCI-händelser (systemkontrollavbrott), att en ny temperaturökning utanför gränsen har inträffat. Dessa händelser ger en mekanism genom vilken operativsystemet kan spåra systemtemperaturen och fatta välgrundade beslut om huruvida CPU-klockan ska strypas, öka/minska kylfläktens hastighet eller vidta mer drastiska åtgärder. När temperaturen överstiger policyinställningen _crt (critical temperature) stängs systemet av som ett felsäkert för att skydda CPU. De andra två policyinställningarna som visas i figurerna 1 och 2 är _PSV (passiv kylning eller CPU clock throttling) och _ACx. (aktiv kylning, när fläkten slås på).
i Figur 1 (prestandaläge) slås kylfläkten på vid 50 CCG.om temperaturen fortsätter att stiga utöver 60 CCG, påbörjas strypning av klockan. Detta beteende maximerar systemets prestanda, eftersom systemet bara saktas ner vid en högre temperatur. I Figur 2 (tyst läge) stryps CPU-klockan först vid 45 grader C. Om temperaturen fortsätter att stiga kan en kylfläkt slås på vid 60 grader C. Detta läge med reducerad prestanda tenderar också att öka batteriets livslängd, eftersom strypning tillbaka klockan minskar strömförbrukningen.
Figur 3 visar hur gränserna för temperaturmätningsbanden spårar temperaturmätningen. Varje gränsövergång ger ett avbrott.
IPMI-specifikationen (intelligent platform management interface) (Ref. 2) ger liknande värmehanteringsfunktioner till servrar. IPMI syftar till att minska den totala ägandekostnaden (TCO) för en server genom att övervaka systemets kritiska” hjärtslag ” – parametrar: temperatur, spänningar, fläkthastigheter och nätaggregat (Nätaggregat). En annan motivation för IPMI är behovet av interoperabilitet mellan servrar, för att underlätta kommunikationen mellan baseboards och chassi. IPMI bygger på användningen av en 5-volts I2C-buss, med meddelanden som skickas i paketform. Ytterligare information om IPMI finns på Intels webbplats http://developer.intel.com/design/servers/ipmi/.
alla medlemmar i TSM-familjen (Analog Devices Temperature and Systems-Monitoring) är ACPI-och IPMI-kompatibla.
temperaturövervakning
förutsättningen för intelligent fläkthastighetskontroll inom datorer är möjligheten att mäta både system-och processortemperatur exakt. Den använda temperaturövervakningstekniken har varit föremål för många artiklar (till exempel, se Analog dialog 33-4.) och kommer bara att kort besökas här. Alla analoga enheter systemövervakningsenheter använder en temperaturövervakningsteknik som kallas termisk diodövervakning (TDM). Tekniken använder sig av det faktum att framspänningen hos en diodansluten transistor, som drivs med en konstant ström, uppvisar en negativ temperaturkoefficient, ca-2mV/msk C. Eftersom det absoluta värdet av VBE varierar från enhet till enhet, är denna funktion i sig olämplig för användning i massproducerade enheter, eftersom var och en skulle kräva individuell kalibrering. I TDM-tekniken passeras två olika strömmar successivt genom transistorn och spänningsförändringen mäts. Temperaturen är relaterad till skillnaden i VBE med:
SECURIVBE = kt/q i ln(N)
där:
k = Boltzmanns konstant
q = elektronladdningsstorlek
T = absolut temperatur i kelvins
N = förhållandet mellan de två strömmarna
i någon CPU är den mest relevanta temperaturen den för “hot spot” på munstycket. Alla andra temperaturer i systemet (inklusive kylflänsens temperatur) fördröjer ökningen av denna temperatur. Av denna anledning innehåller praktiskt taget varje CPU (tillverkad sedan de tidiga Intel Pentium II-processorerna) en strategiskt placerad transistor på sin dö för termisk övervakning. Det ger en sann, väsentligen momentan, profil av dö temperatur. Figur 5 visar temperaturprofiler i ett system som upprepade gånger går in och vaknar från viloläge. Den jämför temperaturerna uppmätta med en termistor fäst vid CPU: s kylfläns och av substratets termiska diod. I det korta intervallet för den faktiska formtemperaturen att förändras fram och tillbaka med cirka 13 grader, kan kylfläns termistorn inte känna någon förändring.
temperatur till fläktstyrning
med en exakt temperaturövervakningsmetod fastställd kan effektiv fläktstyrning implementeras! Tekniken är i allmänhet att använda TDM för att mäta temperaturen, med avkänningstransistorn antingen integrerad på chip eller externt placerad så nära som möjligt till en hot-spot, och ställa in fläkthastigheten på en nivå som säkerställer tillräcklig värmetransport vid den temperaturen. Olika driftsparametrar för styrslingan kommer att vara programmerbara, såsom minsta hastighet, fläktstart temperatur, hastighet kontra temperatur lutning och slå PÅ/AV Hysteres. De beskrivna hastighetskontrollmetoderna inkluderar on-off, kontinuerlig (“linjär”) och pulsbreddsmodulering (PWM).
Fläktkontrollmetoder: historiskt sett är utbudet av tillvägagångssätt för fläkthastighetskontroll i datorer från enkel On-off-kontroll till sluten slinga temperatur-till-fläkthastighetskontroll.
Tvåstegsstyrning: detta var den tidigaste formen av fläkthastighetskontroll som antogs i datorer. BIOS skulle mäta systemtemperaturen (ursprungligen med en termistor i närheten av CPU) och bestämma om en kylfläkt ska slås på eller av helt. Senare använde datorer mer exakta TDM-baserade temperaturmonitorer för att implementera samma tvåstegs fläktstyrning.
trestegs kontroll: BIOS eller operativsystemet mäter igen temperaturen med hjälp av en termistor eller termisk diod och bestämmer, baserat på Programvaruinställningar, om fläkten ska sättas på, stängas av eller ställas in på halv hastighet.
linjär fläkthastighetskontroll: denna nyare metod för fläkthastighetskontroll är också känd som spänningsstyrning. BIOS eller OS läser temperaturen från TDM-mätkretsen och skriver tillbaka en byte till en on-chip DAC, för att ställa in utspänningen för att styra fläktens hastighet. Ett exempel på en IC-fläktstyrenhet av denna typ är ADM1022, som har ett 8-bitars DAC-chip med ett utspänningsområde på 0 V till 2,5 V. Det fungerar med en extern buffertförstärkare med lämpliga designbetyg för den valda fläkten. ADM1022 innehåller också standardautomatiska hårdvaru-tripppunkter som gör att fläkten körs i full hastighet om dess TDM-krets upptäcker ett övertemperaturförhållande. Debuten av dessa typer av enheter innebar uppkomsten av automatisk fläkthastighetskontroll, där en del av beslutsfattandet flyttas från OS-programvara till systemövervakningshårdvara.
pulsbreddsmodulering (PWM) fläkthastighetskontroll: i ADI: s systemövervakningsproduktlinje är dessa PWM-typer de senaste fläktkontrollprodukterna. BIOS eller OS kan läsa temperaturen från TDM-enheten och styra kylfläktens hastighet genom att justera PWM-arbetscykeln som appliceras på den.
det är värt att notera att alla ovanstående metoder för fläkthastighetskontroll är beroende av CPU eller värdintervention för att läsa temperaturen från TDM-enheten över 2-tråds Systemhanteringsbuss. Den termiska programvara som utförs av CPU måste sedan bestämma vad fläkthastigheten ska vara och skriva tillbaka ett värde till ett register på System monitor IC för att ställa in lämplig fläkthastighet.
ett uppenbart nästa steg i utvecklingen av fläkthastighetskontroll är att implementera en automatisk fläkthastighetskontrollslinga, som kan fungera oberoende av programvara och köra fläkten med optimal hastighet för en given chiptemperatur. Det finns många fördelar med en sådan sluten varvtalsreglering.
när systemövervakningsanordningen har initierats (genom att ladda gränsregister med nödvändiga parametrar) är styrslingan sedan helt oberoende av programvara, och IC kan reagera på temperaturförändringar utan värdintervention. Denna funktion är särskilt önskvärd när ett katastrofalt systemfel uppstår, från vilket systemet inte kan återhämta sig. Om datorn kraschar körs inte energihanteringsprogramvaran i operativsystemet längre, vilket resulterar i förlust av termisk hantering! Om datorn inte kan läsa temperaturen som mäts (eftersom datorn har kraschat), kan det inte förväntas ställa in rätt fläkthastighet för att ge den önskade kylnivån.
den andra konkreta fördelen med en sluten slinga är att den kommer att driva fläkten med optimal hastighet för en viss temperatur. Detta innebär att både akustiskt ljud och strömförbrukning minskar. Att köra en fläkt i full hastighet maximerar både strömförbrukning och akustiskt ljud. Om fläkthastigheten kan hanteras effektivt genom loopoptimering, körs bara så snabbt som behövs för en given temperatur, strömavlopp och hörbart fläktljud reduceras båda. Detta är ett absolut kritiskt krav i batteridrivna bärbara PC-applikationer där varje milliampere av ström (eller milliamp-sekund laddning) är en dyrbar vara.
Automatisk Fläkthastighetskontrollslinga
så här kan man implementera en automatisk fläkthastighetskontrollslinga, som mäter temperaturen med TDM-tekniker och ställer in fläkthastigheten på lämpligt sätt som en funktion av temperaturen. Programmerbara parametrar möjliggör mer fullständig kontroll av slingan. Det första registervärdet som ska programmeras är TMIN. Detta är temperaturen (motsvarande ACx) vid vilken fläkten först slås på och där fläkthastighetskontrollen börjar. Hastigheten är tillfälligt inställd på max för att få igång fläkten och återgår sedan till lägsta hastighetsinställning (se Figur 6). Parametern som tillåter kontroll av lutningen för temperatur-till-fläkthastighetsfunktionen är intervallet från TMAX till TMIN eller TRANGE. De programmerade värdena för tmin och TRANGE definierar temperaturen vid vilken fläkten når maximal hastighet, dvs TMAX = TMIN + TRANGE. Programmerat temperaturområde kan väljas: 5& de;C, 10 CCB, 20 CCB, 40 CCB och 80 CCB. För att undvika snabb cykling på och av i närheten av TMIN används Hysteres för att fastställa en temperatur under TMIN, vid vilken fläkten är avstängd. Mängden Hysteres som kan programmeras in i slingan är 1 C till 15 C. Denna fläktstyrslinga kan övervakas av OS-programvara över SMBus och datorn kan när som helst besluta att åsidosätta styrslingan.
PWM vs. Linjär fläkthastighetskontroll
man kan fråga sig varför pulsbreddsmodulering är önskvärd om linjär fläkthastighetskontroll redan används i stor utsträckning.
Tänk på att en 12-V-fläkt drivs med linjär fläkthastighetsreglering. Eftersom spänningen som appliceras på fläkten långsamt ökas från 0 V till ca 8 V, börjar fläkten att snurra. När spänningen till fläkten ökas ytterligare ökar fläkthastigheten tills den körs med maximal hastighet när den körs med 12 V. således har 12-V-fläkten ett effektivt driftsfönster mellan 8 V och 12 V; med ett intervall på endast 4 V tillgängligt för användning vid varvtalsreglering.
situationen blir ännu värre med 5-V-fläkten som skulle användas med en bärbar dator. Fläkten startar inte förrän den applicerade spänningen är ca 4 V. över 4 V tenderar fläkten att snurra nära full hastighet, så det finns lite tillgänglig hastighetskontroll mellan 4 och 5 volt. Således är linjär fläkthastighetsreglering olämplig för att styra de flesta typer av 5V-fläktar.
med pulsbreddsmodulering (PWM) appliceras maximal spänning för kontrollerade intervall (arbetscykeln för en kvadratvåg, vanligtvis vid 30 till 100 Hz). Eftersom denna arbetscykel, eller förhållandet mellan hög tid och låg tid, varieras, kommer fläktens hastighet att förändras.
vid dessa frekvenser tas rena tach-pulser (varvräknare) tillbaka från fläkten, vilket möjliggör tillförlitlig mätning av fläkthastigheten. När drivfrekvenserna går högre finns det problem med otillräckliga tach-pulser för noggrann mätning, sedan akustiskt brus och slutligen elektriska spikar som skadar tach-signalen. Därför använder de flesta PWM-applikationer lågfrekvent excitation för att driva fläkten. Den externa PWM-drivkretsen är ganska enkel. Det kan åstadkommas (Figur 7) med en enda extern transistor eller MOSFET för att driva fläkten. Den linjära fläkthastighetskontrollekvivalenten, driven av en analog hastighetsspänning, kräver en op-förstärkare, en passtransistor och ett par motstånd för att ställa in op-amp-förstärkningen.
hur mäts fläkthastigheten? En 3-tråds fläkt har en tach-utgång, som vanligtvis matar ut 1, 2 eller 4 tach-pulser per varv, beroende på fläktmodellen. Denna digitala tach-signal appliceras sedan direkt på tach-ingången på systemövervakningsanordningen. Tach-pulserna räknas inte, eftersom en fläkt går relativt långsamt, och det skulle ta en märkbar tid att ackumulera ett stort antal tach-pulser för en pålitlig fläkthastighetsmätning. Istället används tach-pulserna för att Grinda en on-chip-oscillator som körs vid 22,5 kHz till en räknare (se figur 8). I själva verket mäts tach-perioden för att bestämma fläkthastigheten. Ett högt antal i tach-värderegistret indikerar en fläkt som körs med låg hastighet (och vice versa). Ett gränsregister används för att upptäcka stickande eller stoppade fläktar.
vilka andra problem finns det med fläkthastighetskontroll?
vid styrning av en fläkt med PWM är minsta arbetscykel för pålitlig kontinuerlig fläktdrift cirka 33%. En fläkt startar dock inte vid 33% arbetscykel eftersom det inte finns tillräckligt med ström för att övervinna trögheten. Som nämnts i diskussionen om Figur 6 är lösningen på detta problem att snurra fläkten i 2 sekunder vid start. Om fläkten måste köras med sin lägsta hastighet kan PWM-arbetscykeln minskas till 33% Efter att fläkten har snurrat upp och den skyddas från att stallas av hysteresen.
Fläktstånd & fläktfel
ändå kan möjligheten uppstå att en fläkt kan stanna någon gång medan den används i ett system. Orsaker kan vara en fläkt som arbetar för långsamt eller dammuppbyggnad som förhindrar att den snurrar. Av denna anledning har monitorerna för analoga enheter en on-chip-mekanism baserad på fläktens tach-utgång för att upptäcka och starta om en stoppad fläkt. Om inga tach-pulser tas emot kommer värdet i tach-värderegistret att överskrida gränsen i Tach-Gränsregistret och en felflagga kommer att ställas in. Detta gör att regulatorn försöker starta om fläkten genom att försöka snurra upp den i 2 sekunder. Om fläkten fortsätter att misslyckas, för upp till 5 försök att starta om, erkänns ett katastrofalt fläktfel att existera, och en FAN_FAULT-pin kommer att hävda att varna systemet för att en fläkt har misslyckats. I tvåfläkt med dubbla styrsystem kan den andra fläkten spinnas upp till full hastighet för att försöka kompensera för förlusten i luftflödet på grund av att den första fläkten misslyckades.
sammanfattning
överlägsna termiska hanteringslösningar fortsätter att utvecklas och erbjudas datorindustrin av analoga enheter. De tekniker som utvecklats för ADM1029, ADM1030 / 31 och ADM1026 tar termisk hantering inom datorer till en ny nivå. Dessa enheter är packade med funktioner som temperaturövervakning, automatisk temperaturkontroll i hårdvara, fläkthastighetsmätning, stöd för säkerhetskopiering och redundanta fläktar, fläktpresent och fläktfeldetektering, programmerbar PWM-frekvens och arbetscykel. När kraftriktlinjerna blir strängare och datorer körs betydligt varmare, utvecklas mer sofistikerade temperaturmätningar och fläkthastighetskontrolltekniker för att hantera framtidens system mer effektivt.
Leave a Reply