麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種GPU圖形狀態(tài)參數(shù)的分布式統(tǒng)一管理方法與流程

文檔序號:11154295閱讀:614來源:國知局
一種GPU圖形狀態(tài)參數(shù)的分布式統(tǒng)一管理方法與制造工藝

本發(fā)明涉及計算機硬件技術領域,尤其涉及GPU圖形狀態(tài)參數(shù)的分布式統(tǒng)一管理方法。



背景技術:

隨著圖形化應用的不斷增加,早期單靠CPU進行圖形繪制的解決方案已經(jīng)難以滿足成績和技術增長的圖形處理需求,圖形處理器(Graphic Processing Unit,GPU)應運而生。從1999年Nvidia發(fā)布第一款GPU產(chǎn)品至今,GPU技術的發(fā)展主要經(jīng)歷了固定功能流水線階段、分離染色器架構階段、統(tǒng)一染色器架構階段,其圖形處理能力不斷提升,應用領域也從最初的圖形繪制逐步擴展到通用計算領域。GPU流水線高速、并行的特征和靈活的可編程能力,為圖形處理和通用并行計算提供了良好的運行平臺。

目前,我國尚無基于統(tǒng)一染色架構的GPU,各領域顯示控制系統(tǒng)中大量采用國外進口的商用GPU芯片。尤其是在軍用領域中,國外進口商用GPU芯片存在溫度和環(huán)境適應性差、無法保證電路本身或配套軟件沒有“后門”、包含大量軍用領域不需要的冗余功能單元,功耗指標無法滿足要求、商用GPU芯片更新?lián)Q代快,隨時面臨停產(chǎn)、斷檔,難以滿足武器裝備持續(xù)保障等缺陷,在安全性、可靠性、保障性等方面的存在重大隱患。而且,出于政治、軍事、經(jīng)濟等原因,國外對我國實行技術“封鎖”和產(chǎn)品“壟斷”,難以獲得GPU芯片的底層技術資料,如寄存器資料、詳細內(nèi)部微架構、核心軟件源碼等,導致GPU功能、性能無法充分發(fā)揮,且移植性較差;上述問題嚴重制約了我國顯示系統(tǒng)的獨立研制和自主發(fā)展。尤其是涉及GPU的眾多圖形狀態(tài)參數(shù)的管理機制,是GPU圖形處理流水線微架構的核心技術,突破GPU圖形狀態(tài)參數(shù)管理關鍵技術,研制高性能圖形處理器芯片迫在眉睫。



技術實現(xiàn)要素:

本發(fā)明公開了一種GPU圖形狀態(tài)參數(shù)的分布式統(tǒng)一管理方法,能夠在滿足硬件低延遲并行使用多個圖形狀態(tài)參數(shù)的前提下,實現(xiàn)GPU硬件對所有OpenGL圖形狀態(tài)參數(shù)的高效訪問,以及主機對所有OpenGL圖形狀態(tài)參數(shù)的調(diào)試訪問。

本發(fā)明的技術解決方案是:

一種GPU圖形狀態(tài)參數(shù)的分布式統(tǒng)一管理方法,包括:

根據(jù)GPU圖形處理流水線中各流水階段的功能,將所有OpenGL圖形狀態(tài)參數(shù)分為至少8個類型,分別是:頂點全局屬性參數(shù)(Global Vertex Parameters,GVP)、頂點染色參數(shù)(Vertex Parameters,VP)、像素染色參數(shù)(Pixel Parameters,PP)、紋理貼圖參數(shù)(Texture Parameters,TP)、幾何引擎參數(shù)(Geometry Parameters,GP)、圖像處理參數(shù)(Image Parameters,IP)、片段參數(shù)(Fragment Parameters,F(xiàn)P)和其它功能參數(shù)(Other Parameters,OP);

所述至少8個類型的圖形狀態(tài)參數(shù)均以SRAM或寄存器的形式獨立存儲,并且每一種類型的圖形狀態(tài)參數(shù)存儲器分布在使用它們的圖形流水線對應的流水級功能單元中:頂點全局屬性參數(shù)存在于任務調(diào)度單元(Job Schedule Unit,JSU)中、頂點染色參數(shù)和像素染色參數(shù)存在于統(tǒng)一染色陣列(Unified Shading Array,USA)中、紋理貼圖參數(shù)存在于紋理貼圖單元(Texture Mapping Unit,TMU)中、幾何引擎參數(shù)存在于幾何引擎單元(Geometry Engine Unit,GEU)中、圖像處理參數(shù)存在于圖像處理單元(Image Processing Unit,IPU)中、片段參數(shù)存在于片段處理單元(Rasterizing Operating Unit,ROU)中、其它功能參數(shù)存在于命令處理器單元(Command Processor Unit,CMD)中;

通過多個專用的窗口寄存器對所有OpenGL圖形狀態(tài)參數(shù)進行訪問;窗口寄存器至少包括參數(shù)地址寄存器、參數(shù)訪問片選寄存器、數(shù)據(jù)寄存器、字使能寄存器和窗口訪問模式寄存器;其中,參數(shù)地址寄存器用來存儲需要訪問的圖形狀態(tài)參數(shù)的地址,以及本次訪問的讀寫控制信號;參數(shù)訪問片選寄存器用來存儲對8個類型圖形狀態(tài)參數(shù)存儲器的訪問片選信號;數(shù)據(jù)寄存器用來存儲要寫入某個圖形狀態(tài)參數(shù)存儲器的數(shù)據(jù),或者從某個圖形狀態(tài)參數(shù)存儲器中讀出的圖形狀態(tài)參數(shù),根據(jù)不同的圖形狀態(tài)參數(shù)訪問數(shù)據(jù)通路寬度,包含一個或多個32b寄存器;字使能寄存器用來選擇訪問圖形狀態(tài)參數(shù)時,數(shù)據(jù)寄存器中的有效參數(shù)字;窗口訪問模式寄存器用來在正常圖形處理模式和調(diào)試模式間進行選擇。

主機能夠?qū)Υ翱诩拇嫫髦械拇翱谠L問模式寄存器進行配置,使窗口工作于正常圖形處理模式或者調(diào)試模式;在正常圖形處理模式下,只有命令處理器可以對所有的8種圖形狀態(tài)參數(shù)存儲進行訪問,在調(diào)試模式下,只有主機可以對所有的8種圖形狀態(tài)參數(shù)存儲進行訪問。

所有8種類型的圖形狀態(tài)參數(shù)統(tǒng)一編址,不同類型的圖形狀態(tài)參數(shù)位于不同的地址段中。

窗口寄存器中的參數(shù)地址寄存器、數(shù)據(jù)寄存器和字使能寄存器連接到所有8種類型圖形狀態(tài)參數(shù)存儲所在的圖形功能單元中;窗口寄存器中的參數(shù)訪問片選寄存器至少包含8bit,每1bit對應一種圖形狀態(tài)參數(shù)存儲的訪問片選信號,并分別連接到對應的8種圖形狀態(tài)參數(shù)所在的圖形功能單元中。

在正常圖形處理模式下,命令處理器對圖形狀態(tài)參數(shù)的讀寫訪問通過對多個窗口寄存器的訪問完成。

在調(diào)試模式下,主機通過寄存器訪問通路對圖形狀態(tài)參數(shù)的讀寫訪問同樣也是通過對多個窗口寄存器的訪問完成,訪問方式與權利要求4中的訪問方式相同。

本發(fā)明的技術效果是:

1、本發(fā)明提供的GPU圖形狀態(tài)參數(shù)的分布式統(tǒng)一管理機制按照圖形流水線中不同流水階段中的圖形處理功能單元對OpenGL圖形狀態(tài)參數(shù)的使用方式和使用需求,對所有OpenGL圖形狀態(tài)參數(shù)進行了分類映射,將所有OpenGL圖形狀態(tài)參數(shù)分為8個類型的圖形狀態(tài)參數(shù),分別是:頂點全局屬性參數(shù)、頂點染色參數(shù)、像素染色參數(shù)、紋理貼圖參數(shù)、幾何引擎參數(shù)、圖像處理參數(shù)、片段參數(shù)和其它功能參數(shù)。相對于所有圖形狀態(tài)參數(shù)未分類的方式來說,上述分類方式可以使每一類圖形參數(shù)存儲的容量顯著減少,有效降低電路設計復雜度,以及讀寫訪問延遲;

2、本發(fā)明中所述8類圖形狀態(tài)參數(shù)均以SRAM、寄存器或其它形式存儲在片上實現(xiàn),并分布式存在于使用它們的功能單元中,或與其關聯(lián)實現(xiàn)。例如,頂點全局屬性參數(shù)存在于任務調(diào)度單元中、頂點染色參數(shù)和像素染色參數(shù)存在于統(tǒng)一染色陣列中、紋理貼圖參數(shù)存在于紋理貼圖單元中、幾何引擎參數(shù)存在于幾何引擎單元中、圖像處理參數(shù)存在于圖像處理單元中、片段參數(shù)存在于片段處理單元中、其它功能參數(shù)存在于命令處理器單元中。相對于所有圖形狀態(tài)參數(shù)集中式實現(xiàn)的方式來說,上述圖形狀態(tài)參數(shù)的片上分布式實現(xiàn)方式可以使得某種類型的圖形狀態(tài)參數(shù)與其對應的功能單元在片上近距離實現(xiàn),從而使得芯片在布線時難度降低,并使功能單元獲得較低的參數(shù)訪問延遲;

3、本發(fā)明中所述窗口訪問機制可以通過窗口控制邏輯內(nèi)部有限的幾個專用寄存器,就能實現(xiàn)對數(shù)量眾多的OpenGL圖形狀態(tài)參數(shù)進行訪問的目的。典型的OpenGL圖形狀態(tài)參數(shù)數(shù)量達到1800個32b字以上,直接將如此數(shù)量眾多的狀態(tài)參數(shù)暴露給GPU中命令處理器和主機處理器會占用大量命令處理器地址空間和主機總線地址空間,而采用窗口訪問機制可以將命令處理器訪問圖形狀態(tài)參數(shù)時需要占用的存儲器地址空間降低到不超過10個32b字,大幅降低命令處理器和主機需要訪問的存儲空間范圍;

4、本發(fā)明中所述窗口訪問機制中窗口控制邏輯可以根據(jù)主機的配置選擇由GPU命令處理器對所有圖形狀態(tài)參數(shù)進行訪問,此時工作在正常繪圖模式下;或者由主機對所有圖形狀態(tài)參數(shù)進行訪問,此時工作在調(diào)試模式下。如果不采用窗口訪問機制,在兩種不同的工作模式下,所有8種類型的圖形狀態(tài)參數(shù)存儲單元不得不為每一種工作模式配置一套訪問接口,至少是一套控制邏輯。而采用窗口訪問機制時,無論出于哪種工作模式下,窗口控制邏輯為所有8種類型的圖形狀態(tài)參數(shù)存儲單元提供了統(tǒng)一的訪問界面,即讀寫訪問接口只有一套,大幅降低了連線數(shù)量,簡化了硬件設計復雜度。

附圖說明

圖1是本發(fā)明基于窗口機制的GPU圖形狀態(tài)參數(shù)分布式統(tǒng)一管理結(jié)構框圖;

圖2是基于圖形處理流水線的GPU圖形狀態(tài)參數(shù)分類方式圖。

具體實施方式

下面結(jié)合附圖和具體實施例,對本發(fā)明的技術方案進行清楚、完整地表述。顯然,所表述的實施例僅是本發(fā)明一部分實施例,而不是全部的實施例,基于本發(fā)明中的實施例,本領域技術人員在沒有做出創(chuàng)造性勞動前提所獲得的所有其它實施例,都屬于本發(fā)明的保護范圍。

一種GPU圖形狀態(tài)參數(shù)的分布式統(tǒng)一管理機制,包含面向圖形處理流水線的OpenGL圖形狀態(tài)參數(shù)的分類方式、不同類型圖形狀態(tài)參數(shù)的片上分布方式、基于窗口的OpenGL圖形狀態(tài)參數(shù)的訪問機制;

所述面向圖形處理流水線的OpenGL圖形狀態(tài)參數(shù)的分類方式是根據(jù)GPU圖形處理流水線中各流水階段的功能,將所有OpenGL圖形狀態(tài)參數(shù)分為至少8個類型,分別是:頂點全局屬性參數(shù)(Global Vertex Parameters,GVP)、頂點染色參數(shù)(Vertex Parameters,VP)、像素染色參數(shù)(Pixel Parameters,PP)、紋理貼圖參數(shù)(Texture Parameters,TP)、幾何引擎參數(shù)(Geometry Parameters,GP)、圖像處理參數(shù)(Image Parameters,IP)、片段參數(shù)(Fragment Parameters,F(xiàn)P)和其它功能參數(shù)(Other Parameters,OP);

所述不同類型圖形狀態(tài)參數(shù)的片上分布方式是:所有8個類型的圖形狀態(tài)參數(shù)均以SRAM或寄存器的形式獨立存儲,并且每一種類型的圖形狀態(tài)參數(shù)存儲器分布在使用它們的圖形流水線對應的流水級功能單元中;

所述頂點全局屬性參數(shù)存在于任務調(diào)度單元(Job Schedule Unit,JSU)中,或者與其關聯(lián)存在;

所述頂點染色參數(shù)和像素染色參數(shù)存在于統(tǒng)一染色陣列(Unified Shading Array,USA)中,或者與其關聯(lián)存在;

所述紋理貼圖參數(shù)存在于紋理貼圖單元(Texture Mapping Unit,TMU)中,或者與其關聯(lián)存在;

所述幾何引擎參數(shù)存在于幾何引擎單元(Geometry Engine Unit,GEU)中,或者與其關聯(lián)存在;

所述圖像處理參數(shù)存在于圖像處理單元(Image Processing Unit,IPU)中,或者與其關聯(lián)存在;

所述片段參數(shù)存在于片段處理單元(Rasterizing Operating Unit,ROU)中,或者與其關聯(lián)存在;

所述其它功能參數(shù)存在于命令處理器單元(Command Processor Unit,CMD)中,或者與其關聯(lián)存在;

所述基于窗口的OpenGL圖形狀態(tài)參數(shù)的訪問機制的是通過多個專用的窗口寄存器對所有OpenGL圖形狀態(tài)參數(shù)進行訪問的方法;

所述窗口寄存器至少包括參數(shù)地址寄存器、參數(shù)訪問片選寄存器、數(shù)據(jù)寄存器、字使能寄存器和窗口訪問模式寄存器;

所述參數(shù)地址寄存器用來存儲需要訪問的圖形狀態(tài)參數(shù)的地址,以及本次訪問的讀寫控制信號;

所述參數(shù)訪問片選寄存器用來存儲對8個類型圖形狀態(tài)參數(shù)存儲器的訪問片選信號;

所述數(shù)據(jù)寄存器用來存儲要寫入某個圖形狀態(tài)參數(shù)存儲器的數(shù)據(jù),或者從某個圖形狀態(tài)參數(shù)存儲器中讀出的圖形狀態(tài)參數(shù),根據(jù)不同的圖形狀態(tài)參數(shù)訪問數(shù)據(jù)通路寬度,可能包含一個或多個32b寄存器;

所述字使能寄存器用來選擇訪問圖形狀態(tài)參數(shù)時,數(shù)據(jù)寄存器中的有效參數(shù)字;

所述窗口訪問模式寄存器用來在正常圖形處理模式和調(diào)試模式間進行選擇;

所述GPU圖形狀態(tài)參數(shù)的分布式統(tǒng)一管理機制,其特殊之處在于:主機可以對窗口寄存器中的窗口訪問模式寄存器進行配置,使窗口工作于正常圖形處理模式或者調(diào)試模式。在正常圖形處理模式下,只有命令處理器可以對所有的8種圖形狀態(tài)參數(shù)存儲進行訪問,在調(diào)試模式下,只有主機可以對所有的8種圖形狀態(tài)參數(shù)存儲進行訪問;

所述GPU圖形狀態(tài)參數(shù)的分布式統(tǒng)一管理機制,其特殊之處在于:所有8種類型的圖形狀態(tài)參數(shù)統(tǒng)一編址,不同類型的圖形狀態(tài)參數(shù)位于不同的地址段中;

所述窗口寄存器中的參數(shù)地址寄存器、數(shù)據(jù)寄存器和字使能寄存器連接到所有8種類型圖形狀態(tài)參數(shù)存儲所在的圖形功能單元中;

所述窗口寄存器中的參數(shù)訪問片選寄存器至少包含8bit,每1bit對應一種圖形狀態(tài)參數(shù)存儲的訪問片選信號,并分別連接到對應的8種圖形狀態(tài)參數(shù)所在的圖形功能單元中;

所述正常圖形處理模式下,命令處理器對圖形狀態(tài)參數(shù)的讀寫訪問通過對多個窗口寄存器的訪問完成。

所述調(diào)試模式下,主機通過寄存器訪問通路對圖形狀態(tài)參數(shù)的讀寫訪問同樣也是通過對多個窗口寄存器的訪問完成。

實施例

如圖1所示,PCIe模塊是主機與GPU的總線接口單元,負責在主機與GPU之間傳遞數(shù)據(jù);命令處理器模塊負責接口來自主機的OpenGL函數(shù)命令,并將相應的圖形狀態(tài)參數(shù)設置到8種圖形狀態(tài)參數(shù)存儲單元中;GSU是狀態(tài)參數(shù)管理單元,包括圖形狀態(tài)參數(shù)訪問窗口控制邏輯,以及對多個圖形處理功能單元工作狀態(tài)的處理邏輯。

如圖2中基于圖形處理流水線各階段圖形功能的OpenGL圖形狀態(tài)參數(shù)分類映射方式,形成了8種圖形狀態(tài)參數(shù)在片上的分布式方式,如圖1所示。任務調(diào)度單元負責完成頂點和像素染色任務的調(diào)度;頂點全局屬性參數(shù)存在于任務調(diào)度單元(JSU)中,或者與其關聯(lián)存在;USA負責完成頂點和像素染色任務的處理;頂點染色參數(shù)和像素染色參數(shù)存在于統(tǒng)一染色陣列(USA)中,或者與其關聯(lián)存在;紋理貼圖單元完成紋素數(shù)據(jù)獲取過程的加速;紋理貼圖參數(shù)存在于紋理貼圖單元(TMU)中,或者與其關聯(lián)存在;幾何引擎負責完成頂點位置的變換、圖元的裝配和剪裁,以及圖元的光柵化;幾何引擎參數(shù)存在于幾何引擎單元(GEU)中,或者與其關聯(lián)存在;圖像處理單元完成幀緩沖區(qū)中圖像,以及紋理圖像的處理;圖像處理參數(shù)存在于圖像處理單元(IPU)中,或者與其關聯(lián)存在;片段處理單元完成像素寫入幀緩沖區(qū)前的最后處理;片段參數(shù)存在于片段處理單元(ROU)中,或者與其關聯(lián)存在;命令處理器單元完成頂點數(shù)組和顯示列表調(diào)用,以及所有圖形狀態(tài)參數(shù)的配置功能;其它功能參數(shù)存在于命令處理器單元(CMD)中,或者與其關聯(lián)存在。

主機通過PCIe模塊中的寄存器通道,可以配置窗口控制邏輯中的窗口訪問模式寄存器,從而選擇工作在正常工作模式或是調(diào)試工作模式。

在正常工作模式下,GPU中命令處理器單元通過窗口控制邏輯對所有圖形狀態(tài)參數(shù)進行訪問,典型的訪問流程如下:不同實現(xiàn)方案的訪問流程可能存在差異,但并不使相應實現(xiàn)方案的本質(zhì)脫離本發(fā)明方案的精神和范圍。第一步,命令處理器寫參數(shù)地址寄存器,指定要訪問參數(shù)的起始地址,以及本次訪問的讀寫控制信號;第二步,窗口邏輯會根據(jù)地址寄存器內(nèi)容自動設置參數(shù)訪問片選寄存器;第三步,命令處理器寫字使能寄存器,用來在圖形狀態(tài)參數(shù)訪問通路超過1個32b字的時候選擇具體要訪問哪一個或幾個字;第四步,如果是寫操作,將需要寫的一個或多個圖形狀態(tài)參數(shù)數(shù)據(jù)字寫入數(shù)據(jù)寄存器中,窗口控制邏輯會根據(jù)地址寄存器、字使能寄存器中的內(nèi)容將一個或多個32b數(shù)據(jù)寄存器中的內(nèi)容寫入到對應的參數(shù)存儲器中。如果是讀操作,窗口控制邏輯將根據(jù)多個圖形處理功能單元工作狀態(tài),以及地址寄存器將從對應的參數(shù)存儲器中讀回一個或多個32b參數(shù)數(shù)據(jù),并寫入到數(shù)據(jù)寄存器中,命令處理器根據(jù)需要使用。

在調(diào)試模式下,主機通過寄存器訪問通路對圖形狀態(tài)參數(shù)的讀寫訪問同樣也是通過對多個窗口寄存器的訪問完成。

最后應說明的是,以上實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解;其依然可以對前述各實施例記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質(zhì)脫離本發(fā)明各實施例技術方案的精神和范圍。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 洮南市| 红桥区| 福海县| 丰镇市| 鹤岗市| 永德县| 许昌市| 博客| 肇东市| 淮北市| 镇远县| 吉安县| 浪卡子县| 漯河市| 四川省| 邯郸市| 安康市| 牡丹江市| 安岳县| 微博| 监利县| 察隅县| 彩票| 和顺县| 武宁县| 思南县| 奇台县| 珲春市| 横峰县| 九龙县| 正安县| 资源县| 赫章县| 布拖县| 云浮市| 镇康县| 丹棱县| 宁南县| 宁乡县| 犍为县| 巴南区|