国产在线中文字幕亚洲,一区视频国产精品观看,欧美日韩国产高清片,久久久久久AV无码免费网站,亚洲无码一二三四五区,日韩无码www.,sese444

您好,歡迎來到維庫電子市場網(wǎng) 登錄 | 免費注冊

ALU
閱讀�19691時間�2011-05-01 16:02:49

  ALU是計算機(jī)中執(zhí)行各種算�(shù)和邏輯運算操作的部件�運算�的基本操作包括加、減、乘、除四則運算,�、或、非、異或等邏輯操作,以及移位、比較和傳送等造作,都稱作算�(shù)邏輯部件(ALU)�

運算基本原理

  計算�(jī)運行�,運算器的操作和操作種類由控制器決定。運算器處理的數(shù)�(jù)來自存儲�;處理后的�(jié)果數(shù)�(jù)通常送回存儲�,或暫時寄存在運算器中�

  �(shù)�(jù)運算器的處理對象是數(shù)�(jù),所以數(shù)�(jù)長度和計算機(jī)�(shù)�(jù)表示方法,對運算器的性能影響極大�70年代微處理器常以1��4��8��16個二�(jìn)制位作為處理�(shù)�(jù)的基本單�。大多數(shù)通用計算�(jī)則以16�32�64位作為運算器處理�(shù)�(jù)的長�。能對一個數(shù)�(jù)的所有位同時�(jìn)行處理的運算器稱為并行運算器。如果一次只處理一�,則稱為串行運算�。有的運算器一次可處理幾位 (通常�6�8�),一個完整的�(shù)�(jù)分成若干段�(jìn)行計�,稱為串 并行運算�。運算器往往只處理一種長度的�(shù)�(jù)。有的也能處理幾種不同長度的�(shù)�(jù),如半字長運�、雙倍字長運�、四倍字長運算等。有的數(shù)�(jù)長度可以在運算過程中指定,稱為變字長運算�

  按照�(shù)�(jù)的不同表示方�,可以有二�(jìn)制運算器、十�(jìn)制運算器、十六�(jìn)制運算器、定點整�(shù)運算器、定點小�(shù)運算�、浮點數(shù)運算器等。按照數(shù)�(jù)的性質(zhì),有地址運算器和字符運算器等�

  操作運算器能�(zhí)行多少種操作和操作速度,標(biāo)志著運算器能力的�(qiáng)弱,甚至�(biāo)志著計算�(jī)本身的能�。運算器最基本的操作是加法。一個數(shù)與零相加,等于簡單地傳送這個數(shù)。將一個數(shù)的代碼求�,與另一個數(shù)相加,相�(dāng)于從后一個數(shù)中減去前一個數(shù)。將兩個數(shù)相減可以比較它們的大小�

  左右移位是運算器的基本操作。在有符號的�(shù)�,符號不動而只移數(shù)�(jù)�,稱為算�(shù)移位。若�(shù)�(jù)連同符號的所有位一齊移�,稱為邏輯移�。若將數(shù)�(jù)的位與位鏈接�(jìn)行邏輯移位,稱為循環(huán)移位�

  運算器的邏輯操作可將兩個數(shù)�(jù)按位�(jìn)行與、或、異或,以及將一個數(shù)�(jù)的各位求�。有的運算器還能�(jìn)行二值代碼的16種邏輯操��

  乘、除法操作較為復(fù)�。很多計算機(jī)的運算器能直接完成這些操作。乘法操作是以加法操作為基礎(chǔ)�,由乘數(shù)的一位或幾位譯碼控制逐次�(chǎn)生部分積,部分積相加得乘�。除法則又常以乘法為基礎(chǔ),即選定若干因子乘以除數(shù),使它近似為1,這些因子乘被除數(shù)則得�。沒有執(zhí)行乘法、除法硬件的計算�(jī)可用程序?qū)崿F(xiàn)�、除,但速度慢得�。有的運算器還能�(zhí)行在一批數(shù)中尋求數(shù),對一批數(shù)�(jù)連續(xù)�(zhí)行同一種操作,求平方根等復(fù)雜操作�

�(fā)�

  算術(shù)邏輯單元(ALU)是�(jìn)行整�(shù)運算的結(jié)�(gòu)?,F(xiàn)階段是用電路來實�(xiàn),應(yīng)用在電腦芯片中�

  在計算機(jī)�,算�(shù)邏輯單元(ALU)是專門�(zhí)行算�(shù)和邏輯運算的�(shù)字電�。ALU是計算機(jī)中央處理器的最重要組成部分,甚至連最小的微處理器也包含ALU作計�(shù)功能。在�(xiàn)代CPU和GPU處理器中已含有功能強(qiáng)大和�(fù)雜的ALU;一個單一元件也可能含有ALU�

  1945年數(shù)�(xué)家馮諾伊曼在一篇介紹被稱為EDVAC的一種新型電腦的基礎(chǔ)�(gòu)成的報告中提出ALU的概��

  早期�(fā)�

  1946�,馮諾伊曼與同事合作為普林斯頓高等學(xué)�(xí)�(xué)�(IAS)�(shè)計計算機(jī)。隨后IAS計算�(jī)成為后來計算�(jī)的原�。在論文中,馮諾伊曼提出他相信計算機(jī)中所需的部�,其中包括ALU� 馮諾伊曼寫到,ALU是計算機(jī)的必備組成部分,因為已確定計算機(jī)一定要完成基本的數(shù)�(xué)運算,包括加減乘�。于是他相信「(計算�(jī))應(yīng)該含有專門完成此類運算的部�。�

  �(shù)字系�(tǒng)

  ALU必須使用與數(shù)字電路其他部分使用同樣的格式�(jìn)行數(shù)字處�.對現(xiàn)代處理器而言,幾乎全都使用二�(jìn)制補碼表示方�。早期的計算�(jī)曾使用過很多種數(shù)字系�(tǒng),包括反�、符號數(shù)值碼,甚至是十�(jìn)制碼,每一位用十個管�� 以上這每一種數(shù)字系�(tǒng)所對應(yīng)的ALU都有不同的設(shè)計,而這也影響了當(dāng)前對二�(jìn)制補碼的�(yōu)先選�,因為二�(jìn)制補碼能簡化ALU加法和減法的運算� 一個簡單的能�(jìn)行與或非和加運算�2位ALU�

  可行性分�

  絕大部分計算�(jī)指令都是由ALU�(zhí)行的。ALU從寄存器中取出數(shù)�(jù),數(shù)�(jù)�(jīng)過處理將運算�(jié)果存入ALU輸出寄存器中。其他部件負(fù)�(zé)在寄存器與內(nèi)存間傳送數(shù)�(jù)� 控制單元控制著ALU,通過控制電路來告訴ALU該執(zhí)行什么操作�

  簡單運算

  大部分ALU都可以完成以下運算∶

  整數(shù)算術(shù)運算(加、減,有時還包括乘和除,不過成本較高�

  位邏輯運算(�、或、非、異或)

  移位運算(將一個字向左或向右移位或浮動特定�,而無符號延伸),移位可被�(rèn)為是乘以2或除�2�

  �(fù)雜運�

  工程師可�(shè)計能完成任何運算的ALU,不論運算有多復(fù)雜;問題在于運算越復(fù)�,ALU成本越高,在處理器中占用的空間越�,消耗的電能越多� 于是,工程師們經(jīng)常計算一個折中的方案,提供給處理器(或其他電路)一個能使其運算高速的ALU,但同時又避免ALU�(shè)計的太復(fù)雜而價格昂�。設(shè)想你需要計算一個數(shù)的平方根,數(shù)字工程師將評估以下的選項來完成此操作�

  �(shè)計一個極度復(fù)雜的ALU,它能夠一步完成對任意�(shù)字的平方根運�。這被稱為單時鐘脈沖計算�

  �(shè)計一個非常復(fù)雜的ALU,它能夠分幾步完成一個數(shù)字的平方根運算。不�,這里有個訣�,中間結(jié)果經(jīng)過一連串電路,就像是工廠里的生產(chǎn)�。這甚至使得ALU能夠在完成前一次運算前就接受新的數(shù)字。這使得ALU能夠以與單時鐘脈沖同樣的速度�(chǎn)生數(shù)�,雖然從ALU輸出的結(jié)果有一個初始延遲。這被稱為計算流水��

  �(shè)計一個復(fù)雜的ALU,它能夠計算分幾步計算一個數(shù)字的平方�。這被稱為互動計算,經(jīng)常依賴于帶有嵌入式微碼的�(fù)雜控制單��

  在處理器中設(shè)計一個簡單的ALU,去掉一個昂貴的專門用于此運算的處理�,再選擇以上三個選項之一。這被稱為�(xié)處理��

  告訴編成人員沒有�(xié)處理器和仿真�(shè)備,于是他們必須自己寫出算法來用軟件計算平方根。這是由軟件圖書館完成的�

  對協(xié)處理器�(jìn)行仿�,也就是�,只要一個程序想要�(jìn)行平方根的計算,就讓處理器檢查當(dāng)前有沒有�(xié)處理�。如果有的話就使用其�(jìn)行計算,如果沒有的話,中斷程序�(jìn)程并�(diào)用操作系�(tǒng)通過軟件算法來完成平方根的計算。這被稱為軟件仿真�

  以上給出的選項按最快和最貴到最慢和最�(jīng)�(jì)排列。于�,雖然甚至是最簡單的計算機(jī)也能計算最�(fù)雜的公式,但是最簡單的計算機(jī)�(jīng)常需要耗費大量時間,通過若干步才能完�� �(qiáng)大的處理�,比如英特爾酷睿和AMD64系列對一些簡單的運算采用1號選項,對最常見的復(fù)雜運算采�2號選�,對極為�(fù)雜的運算采用3號選�。這是具有在處理器中構(gòu)造非常復(fù)雜的ALU的能力為前提��

  輸入和輸�

  ALU的輸入是要�(jìn)行操作的�(shù)�(jù)(稱為操作數(shù))以及來自控制單元的指令代碼,用來指示�(jìn)行哪種運�。它的輸出即為運算結(jié)果� 在許多設(shè)計中ALU也接收或�(fā)出輸入或輸出條件代碼到(或來自)狀�(tài)寄存�。這些代碼用來指示一些情�,比如�(jìn)位或借位、溢出、除�(shù)為零��

  ALU與FPU

  浮點單元也對兩個數(shù)值�(jìn)行算�(shù)運算,但是這種運算已浮點數(shù)表示,比在ALU中一般使用的補碼表示方式�(fù)雜的多。為了完成此類運�,F(xiàn)PU里嵌入了多個復(fù)雜電路,包括一些內(nèi)部ALU� 工程師一般認(rèn)為ALU是處理整�(shù)型(比如補碼和BCD碼)算術(shù)運算的的電路,而對更為�(fù)雜的格式(比如浮點型、復(fù)�(shù)型)�(jìn)行計算的電路則擁有一個更加匹配的稱謂�

�(jié)�(gòu)簡單的低壓低功耗單元設(shè)�

  1.引言

  隨著手持式個人通訊系統(tǒng)等的�(fā)�,低壓低功耗高吞吐量電路的需求越來越多,因此低功耗微處理器和元件的設(shè)計已�(jīng)變成了主�。ALU是微處理器最重要的組成部�,其中全加器電路是所有運算電路的基本單元,設(shè)計低功耗快速加法器單元是獲得低功耗高速運算電路的�(guān)�。ALU單元的設(shè)計標(biāo)�(zhǔn)是多種多樣的,晶體管�(shù)量顯然是一個主要的�(guān)注點,因為它極大的影響了功能單元ALU的設(shè)計復(fù)雜�。另外兩個重要的卻又相互矛盾的因素是功耗和速度。與功耗降低相�(guān)的一個因素是電路能工作的電壓, 還有一個是晶體管的�(shù)�,而全加器晶體管的�(shù)量又極大的影響了ALU單元的晶體管�(shù)量,因此全加器的�(shè)計也是ALU�(shè)計中必須重點考慮的一部分。對于已有的全加器的�(shè)計按照種類來分有靜態(tài)CMOS電路,動�(tài)電路,傳送管和傳輸門邏輯。其中全靜態(tài)CMOS電路是最傳統(tǒng)的,但需�28個管�。動�(tài)電路能極大的減少晶體管的�(shù)量但是短路功耗卻很大;使用傳送門邏輯是一個可選的降低電路�(fù)雜性的方案。在中基于傳送門和反向器的全加器�(shè)計中各使用了20�16個晶體管,為了得到更少管子的全加�,在中基于XOR/XNOR的傳送門邏輯電路組成的全加器只用�14個管�,在�,介紹了一個基于傳輸管的靜�(tài)能量恢復(fù)全加器(SERE�,它只使用了10個管子,且不管它自稱的功耗小,這個設(shè)計相比同類的�(shè)計來講速度比較�,同時這個設(shè)計不能用來級�,因為在低電壓下工作時有多閥值損失問�。在中一種新的基于選擇電路的10管全加器�(shè)計被提出,然而這個設(shè)計也同樣有多閥值損失問�,以至于不能在低電壓級連模式下正確的工作,前面提到�10管全加器都是基于�1的原理來�。文中的ALU單元將采用一種新�10管全加器,它可以減輕閥值損失問�,這個設(shè)計可以在使用少量管子的情況下組成快速的并行加法器(RCA)同時保持較低的能量損耗,另外,這個設(shè)計可以在較低的工作電壓下正確運行�

現(xiàn)有的10管全加器結(jié)構(gòu)

  �1 .�(xiàn)有的10管全加器�(jié)�(gòu)

  2.新的基于CLRCL全加器的ALU單元

  首先考慮全加器的�(shè)�,全加器的邏輯表�(dá)式為�

  Sum=(A⊙B)·Cin+(A⊕B) ·!Cin Count=(A⊕B) ·Cin+(A⊙B) ·A

  可以看出有兩個基本的模型需要使用――XOR�2�1選擇器。一個XOR/XNOR功能用傳送門邏輯只用四個管子就可以�(dá)�,一�2�1選擇器可以用兩個管子實�(xiàn)。但是這些電路都有不同程度的閥值電壓損�,所以在使用時必須小�,文中將采用一種新的全加電�,這個全加器的特點是�(jìn)位邏輯電平恢�(fù)稱之為(Complementary and Level Restoring Carry Logic or CLRCL�。目的是為了減小電路的復(fù)雜性和�(dá)到快速的級連運�。為了避免�(jìn)位鏈的多閥值電壓損�,為此重寫全加器的和以及�(jìn)位邏輯公式:

  Sum =(A⊕Cin) ·!Cout+(A⊙Cin) ·B Count =(A⊕Cin) ·B+(A⊙Cin) ·A

  改�(jìn)后的電路圖如�2.其中MUX的電路如�3所�。這樣�(shè)計的合理之處在于以下幾點:首�,避免了使用有閥值損失的信號作為下一個單元的控制信號,這是在現(xiàn)有的10管全加器中普遍存在的問題,這將�(dǎo)致在電路級連的時候有多閥值電壓損失從而使電路不能正確工作;第�,在傳送管鏈中去除了沒有緩沖的�(jìn)位信號傳�。根�(jù)Elmore公式,傳送延遲時間跟級連的傳送門�(shù)目是二次方的�(guān)�。即使是中等�(shù)目的級連長�,這樣的延遲也是不能忍受的�

新的1位ALU單元電路圖

  �2.新的1位ALU單元電路�

MUX 的MOS電路圖

  �3 .MUX 的MOS電路�

  正如�2中全加器部分電路所�,XNOR電路采用了一�2�1選擇器加一個反向器來實�(xiàn),這個反向器的功用有三個:,反向器INV1可以用來補償輸出傳送門輸出電壓的損�,這個輸出將用來與另外兩�2�1選擇器一起實�(xiàn)和以及�(jìn)位功�,這樣和以及�(jìn)位信號的閥值電壓損失可以控制在一個|V t|;第�,反向器INV2在�(jìn)位鏈中充�(dāng)了一個緩沖器的作用,從而加速了�(jìn)位的傳�;第三,同時這個反向器提供了一個�(jìn)位的互補信號�!Count)供下一級電路使�。這樣全部的全加器部分電路就只需�10個管子(5個PMOS�5個NMOS�,這是目前我們所知的最少的實現(xiàn)全加器電路的晶體管數(shù)��

  在邏輯與或的功能部分,采用了兩個信號來控制(Cnt2和Cnt3�(Figure 2所�),�(dāng)全加器的和信號以及邏輯與/或功能信號產(chǎn)生后,再使用一�2�1選擇器(控制信號為Cnt1�,共使用了三個控制信號實�(xiàn)了全加及邏輯�/或的功能(見Table 1),使用了兩個用傳送門實現(xiàn)�2�1選擇器串�(lián)�,這個電路會有兩個閥值電壓的損失,不過這并不影響最終電路的正確操作,因為兩個閥值電壓的損失�3.3v的工作電壓下還是可以正確工作�

  至于左移、右移和SWAP功能可以通過傳輸門來實�(xiàn)(見Figure 2右部分),通過不同的控制信號可以輕易的實現(xiàn)這些功能�

  前面提到了本文中提出的電路會有兩個閥值電壓的損失,為了后�(xù)電路的正確工作我們可以加一個電平恢�(fù)電路,同時這個電路還可以加快電路的傳送速度(見Figure 2右半部分�,在此恢復(fù)電路中我們使用了一個控制信號(Cnt4)來實現(xiàn)三態(tài)門的功能以控制信號的輸出與�。加上這部分電路后輸出信號會取反,在許多處理器中信號采用的是補碼形�,而這為補碼的實�(xiàn)提供了便利�

  3. 電路分析和仿真結(jié)�

  一些其他的全加器設(shè)計將用來和本文的全加器比�,因為設(shè)計的目標(biāo)是降低電路的�(fù)雜性和提高電路的速度以及能量損耗的降低,所以主要關(guān)注于門�(shù)少并基于傳送門的全加器之間的比較。已有的全加器總�(jié)如下�2�

  �0.35um工藝下仿真一�10管的全加器的DC特�,其中Vdd�3.3v,反向器的(W/L)p=1.4um/0.35um 以及(W/L)n=0.7um/0.35um(table3�。另外,此電路在1.9v的電壓下依然可以正確工作,這為�(jìn)一步降低功耗提供了一個很好的途徑�

  對整個電路�(jìn)行DC分析,得到整個電路的功耗為12.12 uw,延�1.5ns,仿真�(jié)果見�4。另外在AC方面,這個電路的工作頻率也是比較高的�

電路仿真結(jié)果

  �4 . 電路仿真�(jié)�

  4.結(jié)�

  本文提出了一種新�1位的ALU單元。所提議的ALU單元在DC方面,可以在很低的工作電壓下工作,功耗小且速度快;在AC方面,由于采用了CLRCL全加器可以工作在很高的頻率下。同�,比較了�(xiàn)有的一些全加器的性能,可以看到文中的CLRCL電路不僅使用的晶體管的數(shù)目較少,同時它的功耗和速度性能也是比較�(yōu)良的,極大的提高了1位ALU的性能�

維庫電子通,電子知識,一查百��

已收錄詞�168674