麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種風格化寫真圖像的生成方法、裝置、電子設備與流程

文檔序號:41758332發布日期:2025-04-29 18:27閱讀:2來源:國知局
本發明涉及ai圖像的領域,更具體地,涉及一種風格化寫真圖像的生成方法、裝置、電子設備。
背景技術
::1、隨著人工智能(artificial?intelligence,ai)和計算機視覺(computer?vision)領域的交叉發展,衍生出了ai圖像技術,也被稱為人工智能圖像處理技術,是指利用人工智能算法對圖像數據進行分析、處理和理解的技術。目前,在日常生活中,ai圖像技術在多個社交軟件中得到廣泛使用,人們利用ai圖像技術可以生成自己想要的風格類型圖片,但是常規的ai圖像技術,需要預先進行大量的圖片訓練,圖像生成的速度慢,人工成本相對高,并且生成結果往往存在一定的模糊或失真現象。技術實現思路1、本發明旨在克服上述現有技術的至少一種缺陷(不足),提供一種風格化寫真圖像的生成方法、裝置、電子設備,用于達到提高風格化寫真圖像生成效率的效果。2、根據本技術的第一方面,提供了一種風格化寫真圖像的生成方法,所述方法包括:3、預訓練風格模型,所述風格模型包括多個,任意一個風格模型對應一種風格類型;4、獲取原始圖像;5、將所述原始圖像輸入所述風格模型獲得風格圖像;6、對所述風格圖像進行姿勢調整得到風格化寫真圖像。7、所述風格化寫真圖像的生成方法,利用獲取的一張原始圖像,結合多種模型和深度學習框架,即可實現風格化寫真圖像地生成,并且在風格寫真基礎上,支持控制指定的人物姿態,所述生成方法對風格與姿勢控制具有絲滑的兼容能力,對于表情夸張的人像也能從質量欠佳的圖像中解析出人物信息,保證生成寫真圖像真實感的同時增加更多的視覺層次和細節,利用基于深度學習的生成模型,結合先進的圖像處理算法,提高了風格化寫真圖像的生成質量。8、可選地,所述對所述風格圖像進行姿勢調整得到風格化寫真圖像,包括:9、預設姿態估計模型;10、將所述原始圖像輸入姿態估計模型提取姿態信息;11、基于所述姿態信息構建對應的骨架圖像;12、將所述骨架圖像與所述風格圖像進行融合得到所述風格化寫真圖像。13、所述姿態估計模塊從輸入的原始圖像中提取出姿態信息,將提取的姿態信息構成骨架圖像,所述骨架圖像表示人體姿態,將所述骨架圖像與所述風格圖像進行融合對齊得到風格化寫真圖像。14、可選地,所述將所述骨架圖像與所述風格圖像進行融合得到風格化寫真圖像,包括:15、提取所述骨架圖像對應的姿態信息特征;16、提取所述風格圖像的信息特征;17、將所述姿態信息特征與所述風格圖像的信息特征進行對齊融合得到風格化寫真圖像。18、通過將所述姿態信息特征與所述風格圖像的信息特征進行對齊能夠提升細節表現,增強特征表示,在特征對齊的基礎上進行融合得到風格化寫真圖像,能夠優化重構效果。19、可選地,所述將所述原始圖像輸入所述風格模型獲得風格圖像,包括:20、選擇所述風格模型中的任意一個風格模型;21、將所述原始圖像輸入所述任意一個風格模型提取和人臉關聯的關鍵點信息、和人臉關聯的文本信息;22、所述任意一個風格模型對所述關鍵點信息和所述文本信息進行處理得到所述風格圖像。23、所述風格模型通過所述關鍵點信息和文本信息進行計算處理可以得到對應風格模型的風格圖像,生成速度快并且能夠所述風格模型有生成專屬風格的能力,人臉信息作為獨立的條件平行于文本信息一起送入模型中進行處理,使生成的圖片具有id保持能力,能夠與原始圖像進行對應,所述原始圖像的生成風格與選擇的風格模型有關。24、可選地,所述風格模型通過文本提取模型、stable?diffusion模型和注意力機制模型構建;25、將所述原始圖像輸入所述文本提取模型中提取和人臉關聯的文本信息;26、將所述原始圖像輸入注意力機制模型中獲取和人臉關聯的所述關鍵點信息;27、將所述文本信息和所述關鍵點信息輸入所述stable?diffusion模型獲得所述風格圖像。28、所述文本提取模型用于提取與所述原始圖像中的人臉關聯的文本信息,所述文本信息用于描述所述原始圖像的特征,所述特征包括所述原始圖像的紋理特征等細節特征;所述注意力機制模型用于獲取和人臉關聯的所述關鍵點信息,所述關鍵點信息包括眼睛、眉毛、嘴巴鼻子等,能夠描述人臉獨特的關鍵點;所述stable?diffusion模型用于生成風格模型,它能夠根據文本提取模型提取的與人臉關聯的文本描述或者用戶自定義輸入生成對應的風格圖像;所述注意力機制模型通過動態調整模型對輸入數據不同部分的關注程度,使得模型能夠更有效地捕捉信息,提高對上下文的理解能力。29、可選地,所述注意力機制模型包括transformer模型,將所述原始圖像輸入transformer模型中進行信息提取得到人臉信息特征作為所述關鍵點信息。30、所述transformer模型包括編碼器(encoder)和解碼器(decoder)兩個部分,編碼器用于處理輸入的數據,編碼器由多個編碼器層組成,每一個編碼器層主要有自注意力(self-attention)層和前饋網絡(feed-forward?network,ffn)層;解碼器用于輸出經過編碼器處理之后的數據,解碼器同樣由多個解碼器層組成,每一個解碼器層主要有掩碼自注意力(masked?self-attention)層、編碼器-解碼器注意力(encoder-decoder?attention)層、前饋網絡(feed-forward?network,ffn)層,綜上所述,編碼器負責理解輸入數據并提取特征,而解碼器則負責基于這些特征生成輸出數據。31、可選地,所述注意力機制模型還包括注意力查詢模型,所述注意力查詢模型嵌入所述transformer模型的輸出層之前,利用所述注意力查詢模型進行特征投影提取得到所述人臉信息特征。32、利用所述注意力查詢模型建立多頭注意力機制,在進行特征提取時將多頭注意力機制與所述transformer模型結合,編碼器對輸入數據進行處理,解碼器基于編碼器對處理之后的數據進行解碼并輸出,在所述transformer模型進行圖像處理之后,再連接所述注意力查詢模型,基于所述注意力查詢模型建立的多頭注意力機制,所述多頭注意力機制將輸入的數據分割成多個頭,每個頭學習輸入序列的不同方面,通過多頭注意力機制提高提取特征信息的效率。33、可選地,所述將所述骨架圖像與所述風格圖像進行融合得到所述風格化寫真圖像,具體包括:34、將所述骨架圖像進行預處理使其適配controlnet模型的輸入;35、將經過預處理后的骨架圖像和所述風格圖像輸入所述controlnet模型進行對齊和融合得到所述風格化寫真圖像。36、所述controlnet模型擁有強大的控制能力,能夠通過多種檢測方法(如邊緣檢測、深度估計、姿態檢測等)來精確控制圖像生成過程,提高生成質量和多樣性,增強靈活性和可控性,有人體姿態檢測功能,擴大生成圖像的廣泛的應用場景范圍。37、根據本技術的第二方面,提供了一種風格化寫真圖像的生成裝置,包括:38、預訓練模塊,用于預訓練風格模型,所述風格模型包括多個,任意一個風格模型對應一種風格類型;39、獲取模塊,用于獲取原始圖像;40、輸入模塊,用于將所述原始圖像輸入所述風格模型獲得風格圖像;41、調整模塊,用于對所述風格圖像進行姿勢調整得到風格化寫真圖像。42、所述生成裝置中的各模塊相互協作配合實現風格化寫真圖像的生成,預訓練模塊用于對風格模型進行預訓練,使風格模型具備有快速對圖像進行風格處理的能力,進行預訓練的模型包含多個,一個風格模型對應一種風格類型,所述獲取模塊獲取原始圖像之后,再通過輸入模塊,將所述原始圖像輸入到選擇的任一個風格模型中,使生成的圖片被賦予想要的風格類型,先將原始圖像輸入風格模型中進行風格處理得到風格圖像,再利用調整模塊對所述風格圖像進行姿態的調整,從而生成風格化寫真圖像,43、根據本技術的第三方面,提供了一種電子設備,包括:44、存儲器,用于存儲一個或多個計算機程序;45、處理器,當所述一個或多個計算機程序被所述處理器執行時,實現上述第一方面所述的風格化寫真圖像的生成方法。46、所述電子設備,為風格化寫真圖像的生成提供了一套完整的系統,對圖像進行存儲,并對存儲圖像進行處理,處理后的圖像再由存儲器保存。47、根據本技術的第四方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機指令,所述計算機指令用于使處理器執行時實現上述第一方面所述的風格化寫真圖像的生成方法。48、基于上述任意一個方面,本技術實施例提供的一種風格化寫真圖像的生成方法、裝置、電子設備及計算機存儲介質能夠提高風格化寫真圖像的生成效率,降低成本。利用多種模型和深度學習框架,減少單一模型需要花費的時間,實現風格化寫真圖像地生成,并且在風格寫真基礎上,支持控制指定的人物姿態,提高圖像的生成速度,降低相應的成本。當前第1頁12當前第1頁12
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 云林县| 从江县| 海宁市| 焉耆| 合水县| 阿尔山市| 通化县| 平定县| 西峡县| 襄樊市| 万载县| 榆社县| 伽师县| 邯郸县| 建平县| 西青区| 淮北市| 清河县| 贡觉县| 行唐县| 敖汉旗| 化德县| 台南市| 富宁县| 梁山县| 新巴尔虎右旗| 蒙山县| 文昌市| 马公市| 甘南县| 衡水市| 太保市| 大丰市| 浙江省| 彭阳县| 永年县| 子洲县| 淄博市| 禹州市| 绥中县| 商南县|