Instruktioner pr. cyklus

Beregning af IPCEdit

Beregningen af IPC sker ved at køre et bestemt stykke kode, beregne antallet af instruktioner på maskinniveau, der kræves for at fuldføre det, og derefter bruge højtydende timere til at beregne antallet af clockcyklusser, der kræves for at fuldføre det på den faktiske hardware. Det endelige resultat fremkommer ved at dividere antallet af instruktioner med antallet af CPU-urcyklusser.

Antal instruktioner pr. sekund og floating point-operationer pr. sekund for en processor kan udledes ved at multiplicere antallet af instruktioner pr. cyklus med den pågældende processors clockfrekvens (cyklusser pr. sekund angivet i Hertz). Antallet af instruktioner pr. sekund er en omtrentlig indikator for processorens sandsynlige ydeevne.

Antal instruktioner, der udføres pr. takt, er ikke en konstant for en given processor; det afhænger af, hvordan den pågældende software, der køres, interagerer med processoren og faktisk hele maskinen, især hukommelseshierarkiet. Visse processorkendetegn har dog tendens til at føre til design, der har højere IPC-værdier end gennemsnittet; tilstedeværelsen af flere aritmetiske logiske enheder (en ALU er et processorsubsystem, der kan udføre elementære aritmetiske og logiske operationer) og korte pipelines. Når man sammenligner forskellige instruktionssæt, kan et enklere instruktionssæt føre til et højere IPC-tal end en implementering af et mere komplekst instruktionssæt med samme chipteknologi; det mere komplekse instruktionssæt kan dog være i stand til at udføre mere nyttigt arbejde med færre instruktioner. Det er derfor normalt meningsløst at sammenligne IPC-tal mellem forskellige instruktionssæt (f.eks. x86 vs. ARM).

Faktorer, der styrer IPCEdit

Dette afsnit indeholder ingen kildehenvisninger. Hjælp venligst med at forbedre dette afsnit ved at tilføje henvisninger til pålidelige kilder. Ukilderet materiale kan blive anfægtet og fjernet. (juli 2017) (Lær hvordan og hvornår du fjerner denne skabelonbesked)

Et givet niveau af instruktioner pr. sekund kan opnås med en høj IPC og en lav clockhastighed (som AMD Athlon og tidligt Intels Core-serie), eller fra en lav IPC og høj clockhastighed (som Intel Pentium 4 og i mindre grad AMD Bulldozer). Begge dele er gyldige processordesigns, og valget mellem de to er ofte dikteret af historien, tekniske begrænsninger eller markedsføringspres. En høj IPC med en høj frekvens vil dog altid give den bedste ydelse.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.