麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

集合及其使用方法

文檔序號:3570473閱讀:1543來源:國知局
專利名稱:集合及其使用方法
集合及其使用方法相關申請的交叉引用本申請要求2010年1月四日提交的美國臨時申請系列第61Λ99,401號和2009 年5月四日提交的美國臨時申請系列第61/182,350號的權益,二者均通過引用整體并入本文。背景在尤其是治療性抗體領域中的藥物研發上的進展正快速地使許多疾病的治療成為可能和/或改進許多疾病的治療。這些達到新穎的目標空間并提供新穎的作用機制的進展正日益改善患者的生活質量,甚至是患有最嚴重的和挑戰性的疾病的患者。一般對于保健制度特別是患者來說的一個挑戰是由這些藥物進展賦予的新藥的成本也在快速地增加。 高成本是由于藥物特別是抗體的研發所需的投資目前每種市售產品超過十億美元。研發的高失敗風險和極長的研發時間線使得這些投資不可避免。從潛在治療性抗體的鑒定時起直到它上市并可以使患者受益可能要超過十五年。從鑒定、臨床前、臨床到進入市場的每個研發階段充滿了挑戰和風險。制藥公司不斷地審估以確定如何通過減少時間線和失敗風險來減少研發成本,以使最有效的藥品快速達到患者手中,并使他們負擔得起。以下公開內容提供了允許更快地鑒定用于治療可以說任何疾病的最優治療性抗體的一種有價值的進展。候選的治療性抗體必須滿足許多研發標準以使其上市,所述研發標準諸如長期穩定性和高表達產率。本公開的進展提高了鑒定直接從開始就滿足所有的嚴格研發標準的抗體的概率和速度。由此得到的抗體將更廉價地生產并且在眾多疾病的治療上將是有效的且安全的。鑒定治療性抗體的公知方法是通過使用噬菌體展示技術。噬菌體展示利用生長在細菌中的病毒樣粒子來展示抗體。這種技術的一個益處是使用的文庫是巨大的,具有高達IX 101°種抗體,可以快速地測試這些抗體與任何疾病相關的任何靶的結合。見, 例如,Knappik 等人,(2000), 〃 Fully synthetic human combinatorial antibody libraries(HuCAL)based on modular consensus frameworks and CDRs randomized with trinucleotides (基于模塊共有構架和以三個核苷酸隨機化的⑶R的全合成的人組合抗體文庫(HuCAL)),“ J. Mol. Biol. 11 ;296(1) 57-860以這些大數目為研究對象的益處是對靶進行篩選的結果可產生數百種結合該治療靶的抗體,所有這些抗體可能是治療上相關的。但一個問題是,通常這些抗體中只有一些是可研發的,意味著它們能夠滿足所需的所有嚴格標準以使其上市。為了使新的噬菌體展示文庫快速縮短鑒定時間線并減少內在風險,該文庫應包括具有如下特性的抗體所述特性對于選擇和臨床研發是必要的并且將在患者中產生安全且有效的治療。這些特性包括1)高噬菌體展示率,使得能夠針對感興趣的靶對該集合 (collection)的每一種和每一個抗體進行測試;幻高表達水平,使得抗體或片段可被高效地復制;幻高熱穩定性,使得抗體能夠以有效形式到達患者;4)在血清中的高穩定性,使得抗體能夠在體內存活達治療相關的時間力)低免疫原性風險,從而提高安全性,以及5)高度多樣性,使得可使用一個文庫來鑒定針對任何治療靶的抗體。
以基本方式模擬人免疫系統的文庫將是具有高度價值的,或甚至是最佳的解決辦法。人免疫系統包括被種系基因編碼的抗體。抗體在部分上包括可變重鏈和可變輕鏈。存在大約50種可變重鏈種系基因和大約50種可變輕鏈種系基因,合起來提供約2,500種不同的可變重鏈和可變輕鏈對的組合。在人中,認為所有這2500種組合被產生。但已發現, 某些可變重鏈、可變輕鏈和/或可變重鏈和可變輕鏈組合(對)以比其他可變重鏈、可變輕鏈和/或可變重鏈和可變輕鏈組合(對)更高的水平表達。假設一定存在某些比另一些表達得更多的原因,且如果這樣的話,假設高表達的種系基因可能具有有利的功能特性。 因此,提供具有有利的功能特性的抗體文庫的一種方式是產生包括來自免疫組庫(immune repertoire)的豐富的可變重鏈、可變輕鏈和/或可變重鏈和可變輕鏈種系對的文庫。此外,認為人存在的種系基因序列出于明顯的原因具有非常低的免疫原性,因此可以在重組抗體中模擬這些序列以降低免疫原性風險。已從事了評估人免疫組庫中普遍的可變重鏈和輕鏈種系基因配對的方法。見de Wildt 等人,Analysis of heavy and light chain pairings indicates that receptor editing shapes the human antibody repertoire (重鏈禾口輕鏈配對的分析指示受體編輯 (receptor editing)塑造人抗體譜),J Mol Biol. 22 ;285 (3) :895-901 (1999 年 1 月),通過引用將其整體并入。Wildt等人從人供體采取血樣,分選已經歷體細胞超突變(somatic hypermutation)的IgG+B細胞,PCR擴增cDNA,對每個cDNA進行測序,并將每條序列與已知的人可變結構域種系基因進行比對。Wildt等人觀察到,僅有一些種系基因占據免疫組庫的優勢地位,并且頻繁表達的重鏈和輕鏈基因區段通常是成對的。還已嘗試保持個體B細胞的重鏈和輕鏈可變結構域配對。例如,已公開可變結 1 "! ] !^ (cognate pair),,白勺t_。 JAL Meijer ^A, Isolation of human antibody repertoires with preservation of the natural heavy and light chain pairing (1 存天然重鏈和輕鏈配對的人抗體譜的分離),J Mol Biol. ,358(3) =764-72(2006年5月5 日);和W02005042774。根據Mei jer等人所述的技術的文庫已從免疫過的宿主的個體B細胞產生。一般而言,通過FACS分選B細胞,以選擇代表體細胞超突變細胞的⑶38hi B細胞, PCR擴增它們的cDNA,并且將該抗體基因產物插入Fab載體中以用于選擇。這種同源對文庫不是沒有限制。例如,提供B細胞的宿主通常被免疫;并且分選的B細胞群已經被超突變, 因此,得到的文庫偏向于特定的免疫原。另外,已嘗試利用突出的可變重鏈或可變輕鏈產生文庫。例如,在Shi等人, "De Novo Selection of High-Affinity Antibodies from Synthetic Fab Libraries Displayed on Phage as pIX Fusion Proteins (在噬菌體上展示為pIX融合蛋白的來自合成的Fab文庫的高親和力抗體的重新選擇)J Mol Biol. ,397(2) :385-96 (2010年3 月26日)(不被認為是關于本發明的現有技術)以及對應的專利申請W0200908M62 ;和 W02006014498中,根據可變重鏈或可變輕鏈種系蛋白序列在人免疫組庫中的使用頻率將它們摻入文庫中。還進行了另外的嘗試,該嘗試將特異性種系對摻入文庫中。例如,W01999020749描述了一種文庫,其中文庫成員包括具有由人種系重鏈基因區段DP-47(IGHV3-2;3)編碼的高變環和/或由該種系基因編碼的構架區的規范結構的重鏈,和/或具有由人種系輕鏈基因區段02/012 (IGKV1-39/1D-39)編碼的高變環和/或由該種系基因編碼的構架區的規范結構的輕鏈。另外的方法已產生直接來自B細胞或衍生自B細胞的文庫。例如,Glanville等人,Precise Determination of the Diversity of a Combinatorial Antibody Library Gives Insight into the Human Immunoglobulin Repertoire (組合抗體文庫的多樣性的準確測定給予了對人免疫球蛋白譜的深入了解),Natl Acad Sci 1 ; 106 (48) 20216-21 (2009年12月)(不被認為是關于本發明的現有技術),描述了由肪4種人供體免疫球蛋白M(IgM)譜的多樣性構建的抗體文庫。具體而言,對來自6M個人類供體的重鏈和輕鏈V基因cDNA分別進行PCR擴增(分離可變重鏈和輕鏈對),然后將這些重鏈和輕鏈結構域隨機地重新關聯。W0200305M16描述了從顯示對感興趣的病原體明顯響應的宿主分離B細胞,這些病原體產生于被微生物感染或用疫苗治療。在W0200305M16中,對編碼可變區的CDR3區的cDNA進行測序,并且設計包含優勢CDR3的抗體片段。W02009100896描述了從免疫的宿主分離B細胞,其中對編碼可變重鏈區和可變輕鏈區的cDNA進行測序,并且確定未配對的可變重鏈和可變輕鏈序列的豐度。在W02009100896(不被認為是關于本發明的現有技術)中,合成包括隨機重組的可變重鏈和可變輕鏈的文庫,其中抗體是對一種免疫原特異的。這些方法和其他方法的概述見于Fuh等人,Synthetic antibodies as therapeutics (作為療法的合成抗體),Expert Opin Biol Ther. ,7(1) :73-87 (2007 年 1 月)。因此,對于摻入在人免疫組庫中表達的具有有利的生物物理特性的可變重鏈和可變輕鏈種系基因對的抗體或其片段的集合存在高度需求,所述有利的生物物理特性產生在患者中安全且有效的容易開發的抗體。本發明滿足了這些需求和其他需求。概述本公開內容對有效地鑒定針對任何靶的可開發的且在患者中安全和有效的抗體的問題提供了有價值的解決辦法。從最一般的意義上講,發明人開始于如下想法以基本方式模擬人免疫系統的抗體文庫可能是有利的。一方面,發明人決定通過將來自人免疫組庫的最佳種系基因序列摻入抗體中來模擬人免疫系統。這樣,在一些實施方案中,文庫的抗體包括序列上為種系的部分,例如構架區。使用種系序列將顯著地降低在患者中治療性使用的重組抗體的免疫原性風險。此外,發明人根據其如下假設而研究在人免疫組庫中富含的可變重鏈和可變輕鏈種系基因對可能具有有利的生物物理特性,將導致更有效率的臨床研發,提高得到的抗體在患者中的安全性和效力。作為背景,每個B細胞編碼一種抗體,并且每種抗體包含可變重鏈和可變輕鏈。可將抗體的可變重鏈和可變輕鏈中的每一個與種系序列比對以確定抗體的起源,意味著可變重鏈和可變輕鏈由哪些種系基因編碼。因此,對于每種抗體來說,可變重鏈和可變輕鏈構成種系對,例如,VH3-23與VK1-5配對。為了證實突出的種系基因對可能具有有利的生物物理特性的假設,第一步是鑒定存在于人免疫組庫中的可變重鏈和可變輕鏈種系基因對。這是通過廣泛地查找公開可用的文獻并通過從人宿主中對B細胞采樣而完成。下一步,匯集、分析原始數據,并根據發生率對存在于人免疫組庫中的可變重鏈和可變輕鏈種系對進行分級。從這個數據很清楚的是, 某些可變重鏈和可變輕鏈種系基因對比其他種系對更頻繁地存在于人免疫組庫中。另外,發明人認為某些可變重鏈和可變輕鏈種系基因對在幼稚B細胞(未經歷抗原的)與經歷抗原的B細胞中可差異地表達,因此,基于采樣的B細胞的發育或分化來分析匯集數據。從我們的分析很清楚的是,某些種系基因對在幼稚B細胞群與經歷抗原的B細胞群中差異地表達。下一步,必須確定要測試哪些種系蛋白對,因為在人免疫組庫中存在約2500對。 一種方式是測試最突出地出現在人免疫組庫中的可變重鏈和可變輕鏈種系蛋白對,例如, 見表18。人們可例如選擇前四百對用于測試,或者選擇表達高于某個閾值濃度的可變重鏈和可變輕鏈種系基因對。這種方法將需要合成和測試大量可變重鏈和可變輕鏈種系蛋白對序列;因此,這種方法可能不是非常有效率的。作為一種可選的方法,發明人選擇了代表、準確地再現或覆蓋大多數來自人免疫組庫的突出表達的對的一小組可變重鏈和可變輕鏈種系對。這種方法部分上基于如下觀察結果少量可變重鏈、可變κ輕鏈和可變λ輕鏈種系基因在人免疫組庫中占優勢。Wildt 等人在895-896頁描述了這種現象。Wildt等人還說明頻繁表達的重鏈和輕鏈基因區段通常是成對的,并且觀察到采樣的一半配對僅對應于五個種系對。因此,可以聯合少量的突出表達的重鏈和輕鏈種系基因(未成對的)以產生一組代表人免疫組庫的對。這種方法以下列方式進行。分析匯集數據和另外的數據(僅鑒定VH或VL的表達而不是關聯對的表達)來確定在人免疫組庫中可變重鏈、可變κ輕鏈和可變λ輕鏈的種系基因表達。下一步,評估突出表達的可變重鏈、可變κ輕鏈和可變λ輕鏈種系蛋白序列 (不是對)以確定其與研發相關的生物物理特性。經由計算機模擬(in silico)評估了可變重鏈、可變κ輕鏈和可變λ輕鏈種系蛋白序列的以下特性(i)CDR長度,(ii)等電點 (Pl)(優選的等電點是8或以上,因為這將提供在中性配制緩沖液中的穩定性),(iii)翻譯后修飾(PTM)(具體地說,N連接的糖基化位點(NxS或NxT)或化學修飾如Asp切割(通常在DP)),(iv) Asp異構化(DD,DG),(ν)脫酰胺作用(NS,NG)(這可在體內(在血清中)或在儲存時在配制緩沖液中發生并且導致抗體結合的喪失),(vi)在CDR中甲硫氨酸的存在 (當暴露于溶劑時可被氧化),(vii)未成對的半胱氨酸的存在(將與任何其他未成對的半胱氨酸形成二硫鍵,由此導致蛋白的交聯和/或較低的表達水平),(viii)偏離種系,(ix) 潛在的T細胞表位的存在,以及(χ)理論上的聚集傾向。下一步,組合具有有利的生物物理特征的可變重鏈、可變κ輕鏈和可變λ輕鏈種系對以形成可變重鏈和可變輕鏈對。如表23所示,這一小組的對代表、準確地再現或覆蓋大多數來自人免疫組庫的突出表達的對。這是通過如下方式完成的合成可變重鏈和可變輕鏈種系基因、將它們組合成對、將這些對表達成蛋白并測試每種蛋白來鑒定這些對的生物物理特性。測試了以下特性(i)在噬菌體上以Fab形式的相對展示率,(ii)以Fab形式的相對表達水平,例如,在大腸桿菌中;(iii)以Fab形式的熱穩定性;(iv)以Fab形式在牛血清或小鼠血清中的穩定性;(ν)以IgG形式的相對表達水平;(vi)以IgG形式在牛血清中的穩定性。鑒定具有有利的生物物理特性的種系蛋白對后,將集合設計成包括這些對。本公開內容的一個方面是如下抗體或功能片段的集合所述抗體或功能片段包括具有增強可研發性(developability)的有利特性的可變重鏈和輕鏈種系基因對,但不包括不具有這些特性的可變重鏈和輕鏈種系基因對,即使不具有這些特性的可變重鏈和輕鏈種系基因對被突出地表達在人免疫組庫中。以這種方式,將集合設計成不包括自然存在的(在2,500對中)不具有有利的功能特性的可變重鏈和輕鏈的組合或對。例如,VH4-34是人免疫組庫中頻繁出現的,如表20所示,但是還已知源自這種重鏈種系基因的抗體對B細胞有細胞毒性,因此源自這種基因的抗體可從文庫設計中排除。見Miat等人,Rapid cytotoxicity of human B lymphocytes induced by VH4-34(VH4. 21)gene-encoded monoclonal antibodies (由VH4-34(VH4. 21)基因編碼的單克隆抗體誘導的人B淋巴細胞的快速細胞毒性),Clin Exp Immunol.,105(1) :183-90(1996 年 7 月)。在一些實施方案中,本發明的集合包括含大量功能上有利的可變重鏈和可變輕鏈的組合或對的抗體,以致這些集合的抗體十分多樣,從而提供可用于鑒定針對任何治療靶的抗體的集合。這些集合克服了現有技術的許多問題。例如,源自B細胞的同源文庫沒有加入這個概念,因為在這種文庫中存在的VH和VL類配對與在B細胞樣品中存在的類配對相同。如果取得足夠大的B細胞樣品,近似50個VH和50個VL的類配對組合Q500)中的每一個都將存在。在本公開內容中VH和VL對的廣泛測試顯示許多VH和VL種系基因對沒能具有容許在臨床上的可研發性的特性。因此,這種同源文庫包括可能不可開發的許多VH和VL對。 因此,產生只包括具有有利的功能特性的VH和VL類對的大多樣性的文庫可能是令人期望的,但是對于同源文庫方法,這是不能的。此外,在一些實施方案中,包含在集合中的種系基因對是基于幼稚B細胞或未經歷抗原的B細胞的樣品,因此,所代表的種系基因對不偏向于特定的免疫原,并且這些集合可能在針對任何免疫原進行篩選上是優秀的。附圖描述

圖1顯示在周質提取具有VH3-23重鏈(上圖)和VH1-69重鏈(下圖)的抗體后的抗-Fd表達ELISA的結果,每種抗體帶有三種修飾的phoA信號序列之一,所述修飾的phoA 信號序列相比于野生型(TKA)信號序列包括C端限制酶切位點AfIII (VLS)、NheI (VLA)和 AvrII (VLG)。在VH3-23組中,所有修飾的phoA信號序列保持了野生型(TKA)范圍內的表達水平。圖2顯示了在周質提取具有VK1-39輕鏈(左上圖)、VK3-11輕鏈(右上圖)、 VL1-40輕鏈(左下圖)和VL3-1輕鏈(右下圖)的抗體后的抗-Fd表達ELISA的結果,每種抗體帶有三種修飾的ompA信號序列之一,所述修飾的ompA信號序列相比于野生型(AQA) 信號序列包括C端限制酶切位點NdeI (AYG) ,NdeI (AYA)和BsiWI (TYA)。使用V κ和V λ Fab 片段二者測試了包括C端限制酶切位點的修飾的ompA信號序列和野生型信號序列。包括 NdeI (AYA)的信號序列始終顯示與野生型(AQA) —樣好或更好的表達。圖3顯示了如實施例1-1. 3中詳述的被選擇用于摻入phoA和ompA大腸桿菌信號序列的C端中的限制酶切位點,并且包括CDR 3周圍的信號序列及其各自的取向。這幅圖在展示大腸桿菌信號序列的同時還表示如實施例1. 5中詳述的選擇用于在IgG表達中使用的人重鏈和κ鏈前導序列中摻入的C端限制酶切位點。圖4-9顯示在1Tsuiji M.等人Q006)中分離并描述的B細胞的VH/VL種系基因對。圖10-12顯示在Tiller Τ.等人Q007)中分離并描述的B細胞的VH/VL種系基因對。
圖13-17顯示在Mietzner B.等人Q008)中分離并描述的B細胞的VH/VL種系基因對。圖18-20顯示在Wardemann H.等人Q003)中分離并描述的B細胞的VH/VL種系基因對。圖21-23顯示在Yurasov S.等人Q005)中分離并描述的B細胞的VH/VL種系基因對。圖M16顯示在Yurasov S.等人Q006)中分離并描述的B細胞的VH/VL種系基因對。圖27顯示用于擴增分離自人宿主的單個分選的成熟的幼稚B細胞(mn)和抗體分泌細胞(asc)的cDNA的PCR策略,如實施例2. 2中詳述的。圖觀-36顯示如實施例2. 2中詳述的分離自人樣品的B細胞的VH/VL對。圖37顯示選擇用于合成、組合和功能表征的20種VH種系基因,如實施例4_4. 1 詳述的。該圖還顯示每種種系基因經由計算機模擬分析的結果,其中Pl代表等電點,PTM是如本文所述的互補決定區中的翻譯后修飾,NxS/T是N連接的糖基化位點,并且在CDR中的 Met是甲硫氨酸。圖38顯示選擇用于合成、組合和功能表征的8種V λ和12種V κ種系基因,如實施例4-4. 1詳述的。該圖還顯示每種種系基因的經由計算機模擬分析的結果,其中pi代表等電點,PTM是如本文所述的互補決定區中的翻譯后修飾,NxS/T是N連接的糖基化位點,并且在⑶R中的Met是甲硫氨酸。圖39顯示了來自示于圖446的實施例2. 1和示于圖觀_36的實施例2. 2的匯集數據的VH/Vk對。數字條目代表匯集數據中鑒定的來自個體B細胞的每個VH/V κ種系基因對的數目。Y軸顯示根據匯集數據中的表達頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據匯集數據中的表達頻率從左(IGKV3-20)到右(IGKV1D-17) 排序的V κ種系基因。數字1358是采樣的B細胞數目。圖40顯示了來自示于圖446的實施例2. 1和示于圖觀_36的實施例2. 2的匯集數據的VH/νλ對。數字條目代表匯集數據中鑒定的來自個體B細胞的每個VH/V λ種系基因對的數目。Y軸顯示根據匯集數據中的表達頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據匯集數據中的表達頻率從左(IGLV2-14)到右(IGLV4-60)排序的V λ種系基因。數字779是采樣的B細胞數目。圖41顯示了來自示于圖446的實施例2. 1和示于圖觀_36的實施例2. 2的匯集數據的VH/Vk對,但僅包括未成熟的B細胞、新的遷移B細胞和成熟的幼稚B細胞的未經歷抗原的B細胞群以鑒定在幼稚的人免疫組庫中突出的VH/Vk對。數字條目代表匯集數據中鑒定的來自個體B細胞的每個VH/VL種系基因對的數目。Y軸顯示根據匯集數據中的表達頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據匯集數據中的表達頻率從左(IGKV3-20)到右(IGKV1D-17)排序的Vk種系基因。數字888是采樣的 B細胞數目。圖42顯示了來自示于圖446的實施例2. 1和示于圖觀_36的實施例2. 2的匯集數據的VH/νλ對,但僅包括未成熟的B細胞、新的遷移B細胞和成熟的幼稚B細胞的未經歷抗原的B細胞群以鑒定在幼稚的人免疫組庫中突出的VH/VX對。數字條目代表匯集數據中鑒定的來自個體B細胞的每個VH/VX種系基因對的數目。Y軸顯示根據匯集數據中的表達頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據匯集數據中的表達頻率從左(IGLV2-14)到右(IGLV4-60)排序的V λ種系基因。數字457是采樣的B 細胞數目。圖43顯示了來自示于圖446的實施例2. 1和示于圖觀_36的實施例2. 2的匯集數據的VH/V κ對,但僅包括IgG抗體分泌細胞以及IgM和IgG記憶性B細胞的經歷抗原的 B細胞群。數字條目代表匯集數據中鑒定的來自個體B細胞的每個VH/Vk種系基因對的數目。Y軸顯示根據匯集數據中的表達頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據匯集數據中的表達頻率從左(IGKV3-20)到右(IGKV1D-17)排序的Vk 種系基因。數字470是采樣的B細胞數目。圖44顯示了來自示于圖446的實施例2. 1和示于圖觀_36的實施例2. 2的匯集數據的VH/V λ對,但僅包括IgG抗體分泌細胞以及IgM和IgG記憶性B細胞的經歷抗原的 B細胞群。數字條目代表匯集數據中鑒定的來自個體B細胞的每個VH/VX種系基因對的數目。Y軸顯示根據匯集數據中的表達頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據匯集數據中的表達頻率從左(IGLV2-14)到右(IGLV4-60)排序的νλ 種系基因。數字322是采樣的B細胞數目。圖45A-C顯示由VH種系基因編碼的氨基酸序列,如在以下文獻中所述=Tomlinson 等人’ (1992), "The Repertoire of Human Germline Vh Sequences Reveals about Fifty Groups of Vh Segments with Different Hypervariable Loop (人禾中系 Vh 序列的組庫揭示大約五十組具有不同超變環的Vh區段)” J. Mol. Biol. 227,776-798 ;Matsuda 等人(1998), "The complete nucleotide sequence of the human immunoglobulin heavy chain variable region locus (人免疫球蛋白重鏈可變區基因座的完整核苷酸序列),,J Exp Med 188(11) :2151-62 ;禾口 LeFranc MP(2001) "Nomenclature of the human immunoglobulin heavy (IGH) genes (人免疫球蛋白重鏈(IGH)基因的命名)· ”Exp Clin Immunogenet. 18(2) :100_16o圖46A-C顯示了由Vk種系基因編碼的氨基酸序列,如在以下文獻中所述 Sellable 禾口 Zachau(1993),“The variable genes of the human immunoglobulin kappa locus (人免疫球蛋白κ基因座的可變基因),”Biol.Chem Hoppe Seyler. 374(11) 1001-22 ;Brensing_Kiippers 等人(1997), "Thehuman immunoglobulin kappa locus on yeast artificial chromosomes (YACs)(在酵母人工染色體(YAC)上的人免疫球蛋白κ 基因座)”Gene. 191(2) :173-81 ;Kawasaki 等人(2001), "Evolutionary dynamics of the human immunoglobulin kappa locus and the germline repertoire of the Vkappa genes(人免疫球蛋白κ基因座和Vk基因的種系組庫的進化動態)”Eur J Immunol 31(4) :1017-28 ;禾口 Lefranc MP(2001) " Nomenclature of the human immunoglobulin kappa(IGK) genes (人免疫球蛋白 κ (IGK)基因的命名)〃 Exp Clin Immunogenet.,18, 161-174。圖4743顯示由¥入種系基因編碼的氨基酸序列,如在以下文獻中所述=Kawasaki 等人,(1997) “One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆堿基序列分析)”Genome Research 7(3)250-61 ;Frippiat 等人,(1995) “ Organization of the human immunoglobulin lambda light-chain locus on chromosome 22qll. 2 (在染色體 22qll. 2 上的人免疫球蛋白 λ 輕鏈基因座的組織)〃 Hum. Mol. Genet.,4,983-991 ;和 LeFranc MP (2001) “ Nomenclature of the human immunoglobulin lambda(IGL) genes ( Λ^it S S λ (IGL) SSW^ 名)·Εχρ Clin Immunogenet. ;18 :242_254。圖48顯示pJPdl三順反子(tricistronic)噬菌體展示載體。圖49顯示ρJPxIFab表達載體。圖 50 顯示 pMxll (pMORPHXll)Fab 表達載體。圖51顯示pM0RPH30Fab展示載體。圖52顯示pJP_h_IgGlf可變重鏈IgG表達載體。圖53顯示pJP_h_Ig_ κ可變κ輕鏈IgG表達載體。圖54顯示pJP_h_Ig_ λ 2可變λ輕鏈IgG表達載體。圖55顯示測試的400個VH/VL種系基因對的相對Fab展示率。較高的數字指示較高的展示水平。圖56顯示測試的400個VH/VL種系基因對的相對Fab表達水平。較高的數字指示較高的Fab表達水平。圖57顯示以Fab形式的測試的400個VH/VL種系基因對的溫度穩定性數據。數字60和70指示在測試的設置中在60°C或70°C穩定持續45min的VH/VL對。數字4指示溫度不穩定的對并且bg指示低表達水平。圖58顯示以Fab形式的測試的400個VH/VL種系基因對在牛血清中的穩定性數據。S代表在測試的條件下穩定的并且U代表在測試的條件下不穩定的。圖59顯示以Fab形式的測試的400個VH/VL種系基因對在小鼠血清中的穩定性數據。S代表在測試的條件下穩定的并且U代表在測試的條件下不穩定的。圖60顯示測試的400個VH/VL種系基因對的相對IgG表達率。較高的數字指示較高的IgGl表達水平。圖61顯示以IgG形式的測試的400個VH/VL種系基因對的血清穩定性數據。S代表在測試的條件下穩定的并且U代表在測試的條件下不穩定的。詳述定義為了使理解本發明容易,提供了以下定義和闡釋。一般術語在數值和范圍上下文中的術語“大約”或“近似”是指近似于或接近于使得本發明可按預期實行(諸如具有期望的序列同源性的數字或百分比)的所列的值或范圍的值或范圍,根據本文包含的教導這對于技術人員是清楚的。這至少部分上是由于可變的培養條件和生物系統的可變性。因此,這些術語涵蓋超出系統誤差產生的值的值。這些術語使隱含的東西明確。通常,“大約”涵蓋陳述值的士 10%。因此,術語“大約”可用來描述范圍。在發明概述和發明描述中本文列出的所有范圍包括關于該范圍的數字或在該范圍的數字之間的所有數字或值。本發明的范圍明白地命名并列出在該范圍中的所有整數、 小數和分數值。
術語“受治療者”包括人和非人動物。非人動物包括所有脊椎動物,例如,哺乳動物和非哺乳動物,如非人靈長類、羊、狗、牛、雞、兩棲動物和爬行動物。除另外說明,術語“患者”或“受治療者”在本文可互換使用。術語“治療”包括施用組合物或抗體以阻止或延遲疾病的癥狀、并發癥或生物化學標記(biochemical indicia)的發作,減輕癥狀或停止或抑制疾病、病癥或疾患的進一步發展。因此,治療涵蓋但不限于“治愈”。治療可以是預防性的(以阻止或延遲疾病的發作,或阻止或減緩臨床癥狀或其亞臨床癥狀的表現)或在疾病表現后治療性的抑制或減輕癥狀。如本文所用的“數據庫或可讀介質”是指用于儲存序列數據的任何格式以及由此的任何信息集合,如數據庫文檔、查找表、Excel電子表格等等。在某些實施方案中,數據庫以電子形式存儲,如計算機可讀的存儲裝置。這包括介質,如服務器、客戶端(client)、硬盤、⑶、DVD、個人數字助理如Palm Pilot、磁帶、zip盤、計算機內部ROM(只讀存儲器)或因特網或萬維網。其他計算機可獲取的用于存儲文檔的介質將對本領域技術人員是明顯的。“經由計算機模擬”是指在計算機上進行的操作、分析和設計,但還可以同樣在紙上或通過心算進行。抗體及其特性如本文所用的術語“抗體”包括整個抗體。抗體可以是多克隆的、親和力純化的多克隆的、單克隆的、全人的、鼠的或嚙齒動物的、嵌合的、駱駝的或人源化的抗體。抗體可屬于任何的抗體類,如IgG, IgGl、IgG2、IgG3、IgG4、IgA(包括人亞類IgAl和IgA2)、IgD、 IgE、IgG或IgM。天然存在的“抗體”是包括由二硫鍵相互連接的至少兩條重(H)鏈和兩條輕(L)鏈的糖蛋白。如本文所用的術語“其功能片段”包括任何抗原結合片段,如Fab、F(ab' )2、 Fab\ Fv, scFv、包括Fc部分的單鏈、納米抗體以及具有不同于可變構架區的支架的其他抗體樣結構。術語“其功能片段”包括但不限于抗體的任何功能部分,其中功能包括免疫原的結合或效應子功能。如本文所用,術語“親和力”是指在抗原位點處在抗體與抗原之間的相互作用的強度。在每個抗原位點之內,抗體“臂”的可變區通過非共價力與抗原在許多位點相互作用; 相互作用越大,親和力越強。如本文所用,術語抗體或其功能片段如IgG抗體的“高親和力” 是指抗體具有對靶抗原10_8M或更低、10_9M或更低、ΙΟ,Μ或更低、或10_"Μ或更低的KD。然而,“高親和力”結合對于其他抗體同種型來說可能不同。例如,對于IgM同種型的“高親和力”結合是指抗體具有10_7Μ或更低、或10_8Μ或更低的KD。如本文所用的術語“Kassoc”或“Ka”意指特定的抗體-抗原相互作用的締合速率, 而本文所用的術語“Kdis”或“Kd”意指特定的抗體-抗原相互作用的解離速率。如本文所用的術語“KD”意指解離常數,它由Kd與Ka的比(即Kd/Ka)獲得并且被表示為摩爾濃度 (M)。抗體的KD值可使用本領域充分確立的方法來確定。一種用于確定抗體KD的方法是通過使用表面等離子共振或使用生物傳感器系統如Biacore 系統。術語“交叉阻斷(cross-block)”、“交叉阻斷的”和“交叉阻斷了”在本文可互換使用,來表示在標準的競爭結合測定中抗體或其他結合劑干擾其他抗體或結合劑與相同的靶結合的能力。抗體或其他結合劑能夠干擾另一種抗體或結合分子與相同的靶結合的能力或程度,以及因此是否可以根據本發明將其說成交叉阻斷,可使用標準競爭結合測定法來確定。一種適合的測定包括Biacore技術的使用(例如,通過使用BIAcore 3000儀器 (BiaCOre,UppSala,SWeden)),該技術可利用表面等離子共振技術測量相互作用的程度。另一種測量交叉阻斷的測定法利用基于ELISA的方法。術語“表位”表示能夠特異性結合抗體的蛋白決定簇。表位通常由化學活性表面分類的分子如氨基酸或糖側鏈組成,并且通常具有特定的三維結構特征以及特定的電荷特征。構象表位和非構象表位的差別在于在存在變性溶劑的情況下與前者的結合喪失,但與后者的結合沒有。術語“嵌合抗體”是其中恒定區或其部分被改變、取代或交換以使得抗原結合位點 (可變區)與具有不同或改變的類別、效應子功能和/或種類的恒定區連接的抗體分子。術語“同種型”是指由重鏈恒定區基因提供的抗體類(例如,IgM, IgE, IgG如IgGl 或IgG4)。同種型還包括這些類之一的修飾形式,其中已作出修飾來改變Fc功能,例如,增強或減少效應子功能或與Fc受體的結合。術語“種系”表示從親本到后代傳下來的編碼抗體或其功能片段的核酸序列。術語“種系蛋白序列”表示a)由種系基因編碼的抗體或其功能片段的可變區的氨基酸序列,b)由編碼抗體或其功能片段的可變區的修飾的核酸序列所編碼的氨基酸序列,所述抗體或其功能片段的可變區具有與由種系基因編碼的抗體或其功能片段的可變區相同的氨基酸序列,其中所述核酸序列通過以下方式修飾例如,密碼子優化、期望的限制酶切位點的添加、優化的GC含量、不期望的剪接位點的去除或mRNA不穩定性基序的去除, 或c)由種系基因編碼的但在氨基酸序列中具有點突變的氨基酸序列,所述點突變諸如為了去除不期望的半胱氨酸,或引入期望的限制酶切位點例如Bbsl,或產生于合成、擴增或克隆中的錯誤。術語“種系基因序列”表示a)編碼抗體或其功能片段的可變區的種系基因的核酸序列,或b)編碼具有與由種系基因所編碼的抗體的可變區相同的氨基酸序列的抗體或其功能片段的修飾的氨基酸序列,其中所述氨基酸序列通過以下方式修飾例如,密碼子優化、期望的限制酶切位點的添加、優化的GC含量、不期望的剪接位點的去除或mRNA不穩定性基序的去除。術語“種系基因對”表示編碼抗體或其功能片段的可變重鏈和可變輕鏈的核酸序列及其對應的種系基因的對。例如,種系基因對可以是VH3-23/VK 1-5,其中由VH3-23/ VK 1-5編碼的抗體包括由種系基因VH3-23編碼的可變重鏈或其部分以及由種系基因 Vk 1-5編碼的可變輕鏈或其部分。術語“種系蛋白對”表示如下抗體或其功能片段,其中可變重鏈或其部分以及可變輕鏈或其部分a)各自由特定的種系基因編碼,或b)各自由編碼具有與由特定的種系基因編碼的抗體的可變區相同的氨基酸序列的抗體或其功能片段的可變區的修飾的核酸序列編碼,其中所述核酸序列通過以下方式修飾例如,密碼子優化、期望的限制酶切位點的添加、優化的GC含量、不期望的剪接位點的去除或mRNA不穩定性基序的去除,或c)各自包含由種系基因編碼的但在氨基酸序列中具有點突變的氨基酸序列,所述點突變諸如為了去除不期望的半胱氨酸,或引入期望的限制酶切位點例如Bbsl,或產生于合成、擴增或克隆中的錯誤。例如,種系蛋白對可以是由VH3-23/VK 1-5編碼的抗體或功能片段,其中該抗體包括由種系基因VH3-23編碼的可變重鏈或其部分以及由種系基因V κ 1-5編碼的可變輕鏈或其部分。“種系蛋白對”包括如在實施例5中所制備的構建體,所述構建體包括a)對于VH 前導序列(摻入如圖3所示的NheI RE位點的修飾的phoA);種系FRl、 CDRU FR2、CDR2和FR3 (摻入如圖3所示的BssHIIRE位點);如在Ewert S.等人,J. Mol. Biol. (2003)325,531-553 中所用的 4D5 抗體的 CDR-H3 (WG⑶GFYAMDY);以及 JH4FR4(摻入如圖3所示的Xhol/Sall RE位點);b)對于Vk 前導序列(摻入如圖3所示的NdeI RE位點的ompA);種系FR1、CDR1、 FR2、CDR2和FR3(摻入如圖3所示的BbsI RE位點);根據Ewert S.等人,J. Mol. Biol. (2003)325,531-553 的 κ 樣 CDR-L3 (QQHYTTPPT);以及 JklFR4 (摻入如圖 3 所示的 KpnI RE 位點);和c)對于VX 前導序列(摻入如圖3所示的NdeI RE位點的ompA);種系FR1、CDR1、 FR2、CDR2和FR3(摻入如圖3所示的BbsI RE位點);根據Ewert S.等人,J. Mol. Biol. (2003) 325,531-553 的 λ 樣 CDR-L3 (QSYDSSLSGVV);以及 J12/3FR4 (摻入如圖 3所示的KpnI RE位點)。這些構建體中的每一種被合成、表達并且如實施例6和7所述作為Fab和IgG測試了以下功能特性a)在噬菌體產生和噬菌體ELISA之后以Fab形式的相對展示;b)在大腸桿菌中的Fab產生、大腸桿菌細胞裂解和產生的Fab的ELISA檢測后的相對Fab表達水平; c)在大腸桿菌中的Fab產生、大腸桿菌細胞裂解和升高溫度下孵育后非變性Fab的ELISA 檢測后Fab的溫度穩定性;d)在牛/小鼠血清中孵育后借助非變性Fab的ELISA檢測的來自大腸桿菌裂解物的Fab的牛/小鼠血清穩定性;e)在哺乳動物細胞中產生IgGl和ELISA 檢測細胞培養上清液中的分泌IgGl后的相對的人IgGl表達水平;和f)在牛/小鼠血清中孵育后借助非變性Fab的ELISA檢測的人IgGl的牛血清穩定性。JigtJft^S(substantially germline protein sequence) 示由種系基因編碼的但在氨基酸序列中具有點突變的氨基酸序列,所述點突變諸如,為了去除不期望的半胱氨酸,或引入期望的限制酶切位點例如Bbsl,或產生于合成、擴增或克隆中的錯誤。“種系基因”是編碼在以下出版物中所公開的抗體或其功能片段的種系基因的核酸,對于 VH :Tomlinson 等人,(1992),“The Repertoire of Human Germline Vh Sequences Reveals about Fifty Groups of Vh Segments with Different Hypervariable Loop (人種系Vh序列的組庫揭示大約五十組具有不同超變環的Vh區段)”J. Mol.Biol. 227,776-798 ;Matsuda 等人(1998) ,“The complete nucleotide sequence of the human immunoglobulin heavy chain variable region locus( A 免疫球蛋白重鏈可變區基因座的完整核苷酸序列)”J Exp Med 188(11) 2151-62 ; 禾口 LeFranc MP(2001) "Nomenclature of the human immunoglobulin heavy (IGH) genes (人免疫球蛋白重鏈(IGH)基因的命名).” Exp Clin Immunogenet. 18(2) :100_16 ; 對于 νλ :Kawasaki 等人’ (1997) “One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆堿基序列分 |/f ) “ Genome Research 7(3) 250-61 ;Frippiat ^A, (1995) “ Organization of the human immunoglobulin lambda light-chain locus on chromosome 22qll.2(在染色體22qll.2上的人免疫球蛋白λ輕鏈基因座的組織)"Hum. Mol. Genet.,4,983-991 ;和LeFranc MP(2001)“ Nomenclature ofthe human immunoglobulin lambda (IGL) genes(A 免疫球蛋白λ (IGL)基因的命名)· Exp Clin Immunogenet. ; 18 :242_254 ;以及對于V κ SchableiB Zachau (1993), "The variable genes of the human immunoglobulin kappa locus (人免疫球蛋白κ基因座的可變基因),”Biol.Chem Hoppe Seyler. 374(11) 1001-22 ;Brensing_Kiippers 等人(1997), "The human immunoglobulin kappa locus on yeast artificial chromosomes (YACs)(在酵母人工染色體(YAC)上的人免疫球蛋白κ 基因座)”Gene. 191(2) 173-81 ;Kawasaki 等人(2001),‘‘Evolutionary dynamics of the human immunoglobulin kappa locus and thegermline repertoire of the Vkappa genes(人免疫球蛋白κ基因座和Vk基因的種系組庫的進化動態)”Eur J Immunol 31(4) 1017-28 ;禾口 Lefranc MP(2001) “ Nomenclature of the human immunoglobulin kappa(IGK) genes (人免疫球蛋白 κ (IGK)基因的命名)〃 Exp Clin Immunogenet.,18, 161-174,由此通過引用將它們全部以整體并入。可變重鏈的JH4、可變κ輕鏈的Jk 1、以及可變λ輕鏈區的JX 2/3的序列在以下出版物中描述:Scaviner 等人,(1999),“ Protein displays ofthe human immunoglobulin heavy, kappa and lambda variable and j oining regions ( 球蛋白重鏈、κ和λ鏈可變區和接合區的蛋白展示)“Exp Clin Immunogenet. 16 (4) 234-40 ;X^tT JH :Ravetch ^X, (1981), "Structure of the human immunoglobulin mu locus characterization of embryonic and rearrangedj and D genes.(入;^ 求胃白mu基因座的結構胚性的和重排的J和D基因的表征)”Cell 27 (3pt 2) :583_91 ;對于 JK :Hieter 等人(1982), "Evolution of human immunoglobulin kappa J region genes. (人免疫球蛋白1^了區基因的進化)”了 Biol Chem 257(3) :1516_22 ;對于JL :Kawasaki等人’ (1997) “One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆堿基序列分析)”Genome Research 7(3) 250-61,通過引用它們全部以整體并入本文。JH4序列是(YFDYWGQGTLVTVSS) Jk 1序列是 (WTFGQGTKVEIK);并且 J λ 2/3 序列是(WFGGGTKLTVL)。術語“依賴于位置的氨基酸利用”是指特定氨基酸序列在多肽中的給定位置出現的可能性。在本發明中,對于通過個體種系基因分類的重排氨基酸序列確定了依賴于位置的氨基酸利用。這使得CDR在其天然的種系環境中的個性、精確的設計成為可能。術語“可變結構域/區(VH或VL) ”表示包括基本上由分別組成輕鏈(包括κ和 λ )和重鏈免疫球蛋白基因座的VL (包括Vk和V λ )、VH、JL (包括Jk和J λ )以及JH核酸中的任何一個編碼的一個或多個Ig結構域的免疫球蛋白的區域。輕鏈或重鏈可變區(VL和 VH)由散布三個稱為“互補決定區”或“⑶R”的高變區的“構架”區或“FR”區組成。構架區和 CDR 的范圍已被精確地定義(見 Kabat,1991,J. Immunol.,147,915-920. ;Chothia & Lesk, 1987,J. Mol.Biol. 196 :901_917 ;Chothia 等人,1989,Nature 342 :877_883 ;Al-Lazikani 等人,1997,J. Mol. Biol. 273 :927_948)。抗體的構架區即組分輕鏈和重鏈的聯合構架區用來安置和對齊⑶R,⑶R主要負責與抗原結合。術語“構架區”表示被Kabat等人(1991)定義為充當可變結構域的抗原結合環的支架的這種可變結構域的一部分的抗體可變結構域。構架區的實例包括可變重鏈或可變輕鏈的 FR1、FR2、FR3 和 FR4。
20
術語“互補決定區”或“⑶R”表示由Kabat等人(1991)定義的抗體的抗原結合環。 抗體Fv片段的兩個可變結構域的每一個包含三個⑶R。互補決定區包括可變重鏈或可變輕鏈的 CDR1、CDR2 和 CDR3。“優選的VH和VL類對”表示那些在免疫組庫中優選的VH和VL類對,所述免疫組庫例如根據標準閾值組的人免疫組庫。例如,豐富的VH-VL對;或具有有利的生物物理特性如低免疫原性、穩定性的VH-VL對;容易被展示和/或表達的VH-VL對;或者以在約2500個人B細胞的樣品中至少0. 05%的濃度出現的VH-VL對。在人免疫組庫中優選的VH和VL類對可具有勝過其他VH和VL類對的優選的特征。術語“幼稚”表示未經歷抗原的。術語“幼稚B細胞”表示如下B細胞其中編碼抗體或其功能片段的核酸沒有經歷體細胞超突變,因此被認為包括種系基因的核酸,存在V(D) J基因區段重排。被認為幼稚的 B細胞群是未成熟的B細胞、新的遷移B細胞和成熟的幼稚B細胞。術語“幼稚的人免疫組庫(nai've human immune r印ertoire),,表示分離自人免疫系統的未經歷抗原的B細胞的核酸的組庫,其中編碼抗體或其功能片段的核酸沒有經歷體細胞超突變,因此被認為包括種系基因的核酸,存在V(D) J基因區段重排。組庫可以是個體或群體的組庫。只要獲得足夠的B細胞,本發明順從于從單個個體確定免疫組庫。優選地,從多個個體獲得免疫組庫以避免樣品偏倚。術語“人免疫組庫(human immune repertoire) ”表示分離自人免疫系統的B細胞的核酸的組庫。組庫可以是個體或群體的組庫,并且可以來自于幼稚B細胞和/或經歷抗原的B細胞。只要獲得足夠的B細胞,本發明順從于從單個個體確定免疫組庫。優選地,從多個個體獲得免疫組庫以避免樣品偏倚。將“抗原”和“免疫原”定義為被抗體特異性結合的任何分子。術語“對免疫原特異的”表示在抗體與相應分子之間的特異性關聯。如本文所用的“⑶R多樣化”或“多樣的⑶R”是通過任何適合的方法對⑶R的氨基酸序列的修飾。CDR—般已知是免疫原結合區,因此具有包含代表CDR中的較大多樣性的成員的集合提高了集合將包括對于任何免疫原具有特異性和最佳特性的抗體或其片段的概率。通過改變一個或多個CDR的氨基酸組成而獲得多樣性。這可以通過本領域技術人員已知的任何方法達成,包括本文所述的方法。“編碼抗體或其片段的合成核酸的集合”表示編碼該抗體或其片段的所有核酸是合成的,但不是指可與這些合成的核酸可操作地連接的其他核酸,如載體。在分子生物學上下文中使用的術語術語“合成”或“合成了”表示基因合成,其中核酸序列被合成為物理DNA,包括多核苷酸。標準的DNA合成包括單核苷酸合成,其中產生單鏈寡核苷酸,然后利用PCR樣組件連接重疊的寡核苷酸。公司如 Sloning (Puchheim, Germany) >Geneart (Regensburg, Germany)、 DNA2. 0 (Menlo Park, CAUSA)和 Genscript (Piscataway,NJ USA)提供了基因合成技術。例如,Sloning利用一組事先制備的雙鏈三聯體核苷酸,這些核苷酸退火并隨后被連接。術語“合成的”描述了通過合成制備或被合成的分子。術語“集合(collection)”或“文庫”表示至少兩個成員。術語“成員”包括但不限于編碼抗體或其片段的核酸或者抗體或其片段本身。
術語“宿主”是指任何宿主,包括哺乳動物,如人、鼠類或嚙齒動物,小鼠、大鼠、松鼠、花栗鼠、囊地鼠、豪豬、河貍、倉鼠、沙土鼠、豚鼠、兔、狗、貓、牛或馬。術語“核酸”在本文可與術語“多核苷酸”互換使用,并且是指處于單鏈或雙鏈形式的脫氧核糖核苷酸或核糖核苷酸及其聚合物。該術語涵蓋包含已知的核苷酸類似物或修飾的骨架殘基或連接的核酸,這些核酸是合成的、天然存在的和非天然存在的,具有與參考核酸相似的結合特性。這些類似物的實例包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性甲基膦酸酯、2-0-甲基核糖核苷酸以及肽-核酸(PNA)。除非另外指明,否則特定的核酸序列還隱含地涵蓋其保守修飾的變體(例如,簡并密碼子取代)和互補序列以及明確指出的序列。具體地說,如以下所述,簡并密碼子取代可通過如下方式達成產生其中一個或多個選擇的(或全部的)密碼子的第三個位置被混合堿基和/或脫氧肌苷殘基取代的序列(Batzer等人,Nucleic Acid Res. 19 :5081,1991 ; Ohtsuka 等人,J. Biol. Chem. 260 :2605_2608,1985 ;和 Rossolini 等人,Mol. Cell. Probes 8 91-98,1994)。術語“可操作地連接”是指在兩個或更多個多核苷酸(例如,DNA)區段之間的功能關系。通常,它是指轉錄調節序列與被轉錄的序列的功能關系。例如,如果啟動子或增強子序列在適當的宿主細胞或其他表達系統中刺激或調控編碼序列的轉錄,那么啟動子或增強子序列與該編碼序列可操作地連接。一般來說,與被轉錄的序列可操作地連接的啟動子轉錄調節序列在物理上與該被轉錄的序列鄰接,即它們是順式作用的。然而,一些轉錄調節序列如增強子不必與它們增強轉錄的編碼序列物理上鄰接或位置上很靠近。如本文所用,術語“密碼子優化的”或“密碼子優化”表示已利用在生產細胞或生物中優選的密碼子改變核苷酸序列來編碼氨基酸序列。優化的核苷酸序列被工程化以保留最初由初始核苷酸序列編碼的氨基酸序列。此外,可將核苷酸序列設計成完全或盡可能不含抑制性基序、剪接位點、mRNA不穩定性基序和不期望的限制酶切位點。還可以優化核苷酸序列的GC含量、期望的限制酶切位點以及其他參數。可優化序列在不同宿主中的表達, 包括細菌細胞或真核細胞。由優化的核苷酸序列編碼的氨基酸序列也被稱為優化的。術語“氨基酸”是指天然存在的氨基酸和合成的氨基酸,以及以類似于天然存在的氨基酸的方式起作用的氨基酸類似物和氨基酸模擬物。天然存在的氨基酸是由遺傳密碼編碼的氨基酸,以及后來被修飾的那些氨基酸,例如,羥基脯氨酸、Y-羧基谷氨酸和0-磷酸絲氨酸。氨基酸類似物是指具有與天然存在的氨基酸相同的基本化學結構(即,與氫、羧基、氨基和R基結合的α碳)的化合物,例如,高絲氨酸、正亮氨酸、甲硫氨酸亞砜、甲硫氨酸甲基硫鐺(methionine methyl sulfonium)。這些類似物具有修飾的R基(例如,正亮氨酸)或修飾的肽骨架,但保留了與天然存在的氨基酸相同的基本化學結構。氨基酸模擬物是指具有與氨基酸的一般化學結構不同的結構但以類似于天然存在的氨基酸的方式起作用的化學化合物。術語“多肽”和“蛋白”在本文可互換使用,是指氨基酸殘基的聚合物。這些術語適用于其中一個或更多個氨基酸殘基是對應的天然存在的氨基酸的人工化學模擬物的氨基酸聚合物,并適用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。除非另外指明,否則特定的多肽序列還隱含地涵蓋其保守修飾的變體。術語“保守修飾的變體”適用于氨基酸序列和核酸序列二者。就特定的核酸序列來說,保守修飾的變體是指那些編碼相同或基本上相同的氨基酸序列的核酸,或者在核酸不編碼氨基酸序列的情況下是指基本相同的序列。因為遺傳密碼的簡并性,大量功能相同的核酸編碼任何給定蛋白。例如,密碼子GCA、GCC、GCG和GCU都編碼氨基酸丙氨酸。因此, 在丙氨酸被密碼子指定的每個位置,該密碼子可被改變為所述的任何對應密碼子而不改變所編碼的多肽。這種核酸變異是“沉默變異”,是一類保守修飾變異。本文編碼多肽的每個核酸序列還描述了該核酸的每種可能的沉默變異。技術人員將認識到,核酸中的每個密碼子(除了通常是甲硫氨酸唯一密碼子的AUG和通常是色氨酸唯一密碼子的TGG之外)可被修飾產生功能相同的分子。因此,編碼多肽的核酸的每種沉默變異隱含在每個描述的序列中。對于多肽序列來說,“保守修飾的變體”包括導致氨基酸被化學上相似的氨基酸取代的對多肽序列的個體取代、缺失或添加。提供功能相似的氨基酸的保守取代表是本領域公知的。這些保守修飾的變體不包括但不排除本發明的多態變體、種間同源物和等位基因。 以下八組包括互相為保守取代的氨基酸1)丙氨酸(A)、甘氨酸(G) ;2)天冬氨酸(D)、谷氨酸(E) ;3)天冬酰胺(N)、谷氨酰胺(Q) ;4)精氨酸(R)、賴氨酸(K) ;5)異亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、纈氨酸(V) ;6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W) ;7)絲氨酸(S)、 蘇氨酸(T);和8)半胱氨酸(C)、甲硫氨酸(M)(見,例如Creighton,Proteins (1984))。在一些實施方案中,術語“保守序列修飾”用來指如下氨基酸修飾不顯著影響或改變包含該氨基酸序列的抗體的結合特征的氨基酸修飾。術語“相同的”或“同一性”百分比在兩個或更多個核酸或多肽序列的上下文中是指相同的兩條或更多條序列或子序列。如果兩條序列在比較窗口或者在使用以下序列比較算法之一或通過人工比對和肉眼檢查所測量的指定區域比較和比對最大對應性時具有指定百分比的相同氨基酸殘基或核苷酸(即,在限定的區域或者當不限定時整個序列的60% 同一性、任選65%、70%、75%、80%、85%、90%、95%或99%同一性),那么這兩條序列是 “基本上相同的”。任選地,同一性在長度為至少約50個核苷酸(或10個氨基酸)的區域, 或更優選在長度為100到500或1000或更多個核苷酸(或20、50、200或更多個氨基酸) 的區域存在。對于序列比較,通常一條序列用作與測試序列進行比較的參考序列。當使用序列比較算法時,將測試序列和參考序列輸入計算機中,指定子序列坐標,如果必要的話, 指定序列算法程序參數。可使用缺省的程序參數,或者可指定可選的參數。然后序列比較算法基于程序參數計算測試序列相對于參考序列的序列同一性百分比。如本文所用的“比較窗口”包括參考選自由20到600、通常約50到約200、更通常約100到約150組成的組的任何一個鄰接位置數目的區段,在比較窗口中在序列與參考序列被最佳地比對后可將該序列與參考序列的相同數目的鄰接位置進行比較。用于比較的序列比對方法是本領域公知的。用于比較的序列的最佳比對可通過如下方式進行例如, 通過 Smith 和 Waterman (1970) Adv. App 1. Math. 2 :482c 的局部同源性算法,通過 Needleman 和 Wunsch,J. Mol. Biol. 48 :443,1970 的同源性比對算法,通過 Pearson 和 Lipman,Proc. Nat,1. Acad. Sci. USA 85 :2444,1988的相似性搜尋方法,通過這些算法的計算機實現(在 Wisconsin 遺傳性軟件包,Genetics Computer Group, 575Science Dr. , Madison, WI 中的GAP、BESTFIT、FASTA和TFASTA),或通過人工比對和肉眼檢查(見,例如,Brent等人, Current Protocols in Molecular Biology (現代分子生物學實驗技術),John Wiley&Sons,Inc. (2003))。適于確定序列同一性百分比和序列相似性百分比的算法的兩個實例是分別被描述于 Altschul 等人,Nucl. Acids Res. 25 :3389_3402,1977 和 Altschul 等人,J. Mol. Biol. 215 =403-410,1990中的BLAST和BLAST 2. 0算法。用于執行BLAST分析的軟件是通過美國國立生物技術信息中心公開可用的。這種算法包括首先通過識別問詢序列中長度 W的短字(word)來識別高得分序列對(HSP),該高得分序列對當與數據庫序列中的相同長度的字對齊時匹配或滿足某個正值閾值得分Τ。T被稱為相鄰字得分閾值(neighborhood word score threshold) (Altschul等人,上述)。這些最初的相鄰字命中(hit)充當用于啟動搜索的種子以尋找包含它們的更長的HSP。字命中沿每條序列在兩個方向上延伸直到累計的比對得分可被增加為止。對于核苷酸序列,使用參數M(對一對匹配殘基的獎勵得分;總是> 0)和N(對錯配殘基的處罰得分;總是< 0)計算累計得分。對于氨基酸序列,使用評分矩陣來計算累計得分。當發生以下情況時字命中在每個方向上的延伸停止累計比對得分從其所達到的最大值下降了量X ;由于一個或更多個負得分殘基比對的累計,累計得分趨于零或零以下;或者到達任一條序列的末端。BLAST算法參數W、T和X決定比對的靈敏度和速度。BLASTN程序(對于核苷酸序列而言)使用字長(W) 11,期望(E)10,M = 5, N = -4以及兩條鏈的比較作為缺省值。對于氨基酸序列,BLASTP程序使用字長(W)3,和期望(E) 10 以及 BL0SUM62 評分矩陣(參見 Henikoff 和 Henikoff,Proc. Natl. Acad. Sci. USA 89 10915,1989),比對(B) 50,期望(E) 10,M = 5,N = -4和兩條鏈的比較作為缺省值。BLAST算法還進行兩條序列之間的相似性的統計分析(見,例如,Kar 1 in和 Altschul,Proc. Natl. Acad. Sci. USA 90 :5873_5787,1993)。由 BLAST算法提供的一種相似性量度是最小和概率(P(N)),它提供了在兩條核苷酸序列或氨基酸序列之間的匹配將偶然發生的概率的指示。例如,如果在測驗核酸與參考核酸的比較中最小和概率小于大約0. 2、 更優選地小于大約0. 01、并且最優選地小于大約0. 001,那么認為該核酸與參考序列是相似的。兩條氨基酸序列之間的同一性百分比還可以使用已被加入ALIGN程序(2. 0版) 中的 E. Meyers 和 W. Miller 的算法(Comput. Appl. Biosci.,4 :11_17,1988)確定,使用 PAMl20殘基權重表、空位長度罰分12和空位罰分4。此外,兩條氨基酸序列之間的同一性百分比可使用已被加入GCG軟件包的GAP程序(在www. gcg. com可獲得)中的Needleman 和 Wunsch(J. Mol. Biol. 48 444-453,1970)算法確定,使用 Blossom 62 矩陣或 PAM250 矩陣,以及空位權重(gap weight) 16、14、12、10、8、6 或 4,以及長度權重(length weight) U 2、3、4、5 或 6。除了以上指出的序列同一性百分比外,兩條核酸序列或多肽基本上相同的另一個指征是由第一核酸編碼的多肽與針對由第二核酸編碼的多肽而產生的抗體有免疫交叉反應,如以下所述。因此,多肽通常與另一多肽基本上相同,例如,在這兩條多肽差異僅為保守取代的情況下。兩條核酸序列基本上相同的另一指征是這兩個分子或它們的互補序列在嚴格條件下彼此雜交,如以下所述。兩條核酸序列基本上相同的又另一個指征是可使用相同的引物來擴增該序列。術語“重組的宿主細胞”(或簡稱“宿主細胞”)是指重組表達載體已被引入其中的細胞。應理解這些術語不僅意指特定的受試細胞而且意指這種細胞的子代。因為某些修
24飾由于突變或環境影響可發生在隨后的代中,所以這種子代事實上可與母本細胞不同,但是仍被包括在本文所用的術語“宿主細胞”的范圍之內。典型的宿主細胞是原核的(如細菌的,包括但不限于大腸桿菌)或真核的(其包括酵母、哺乳動物細胞和更多)。術語“載體”意指如下多核苷酸分子所述多核苷酸分子能夠運輸與其連接的另一個多核苷酸。優選的載體是能夠自主復制和/或表達與其連接的核酸的那些載體。能夠指導與其可操作地連接的核酸的表達的載體在本文被稱為“表達載體”。一種類型的載體是 “質粒”,是指附加的DNA區段可被連入其中的環狀雙鏈DNA環。另一種類型的載體是病毒載體,其中附加的DNA區段可被連入該病毒的基因組中。某些載體能夠在它們被引入的宿主細胞中自主復制(例如,具有細菌的復制起點的細菌載體和附加型哺乳動物載體)。其他載體(例如,非附加型哺乳動物載體)可在引入宿主細胞中后被整合到宿主細胞的基因組中,從而與宿主基因組一起復制。此外,某些載體能夠指導與其可操作地連接的基因的表達。這些載體在本文稱為“重組表達載體”(或簡稱“表達載體”)。一般來說,在重組DNA 技術中有實用性的表達載體通常處于質粒形式。在本說明書中,“質粒”和“載體”可被互換使用,因為質粒是最常用的載體形式。然而,本發明旨在包括具有同等功能的那些其他形式的表達載體,如病毒載體(例如,復制缺陷型逆轉錄病毒、腺病毒以及腺伴隨病毒)。載體通常包括原核復制子,原核復制子可包括能夠在細菌宿主細胞中指導編碼VH 和/或VL的同源物的表達(轉錄和翻譯)的原核啟動子,所述細菌宿主細胞例如用編碼VH 和/或VL的同源物轉化的大腸桿菌(Escherichia coli)。啟動子是允許RNA聚合酶的結合和轉錄發生的由DNA序列形成的表達控制元件。與細菌宿主相容的啟動子序列通常被提供在包含用于插入DNA區段的便利限制酶切位點的質粒載體中。這些載體質粒的實例包括可商購的 PUC8、pUC9、pBR322 和 pBR329、pPL 以及 pKK223。“展示載體”包括具有指導重組DNA分子在宿主細胞中在染色體外復制和維持的能力的DNA序列,所述宿主細胞例如用重組DNA分子轉化的細菌宿主細胞。這些DNA序列是本領域公知的。展示載體可以是例如起源于fd、M13或fl絲狀噬菌體類別的噬菌體載體或噬菌粒載體。這些載體能夠促進蛋白(包括,例如,結合蛋白或其片段)在絲狀噬菌體表面上的展示。適合于在噬菌體、核糖體、DNA、細菌細胞或真核細胞(例如酵母或哺乳動物細胞)上展示的展示載體也是本領域公知的,例如,是病毒載體或編碼嵌合蛋白的載體。“唯一的”限制酶切位點是在給定的核酸分子上只存在或出現一次的限制酶切位點ο集合及其生產和使用方法本公開內容使得可用于鑒定針對任何靶的治療性抗體的抗體或其功能片段的集合成為可能,其中所述抗體在臨床上可開發并且在患者中是安全且有效的。作為背景,發明人設想在人免疫組庫中富含的可變重鏈和可變輕鏈種系基因對可能具有有利的生物物理特性,將導致更有效率的研發,提高得到的抗體在患者中的安全性和效力。每個B細胞編碼一種抗體,并且每種抗體包含可變重鏈和可變輕鏈。可將抗體的可變重鏈和可變輕鏈中的每一個與種系基因序列比對以確定抗體的起源,意味著可變重鏈和可變輕鏈由哪些種系基因形成。因此,對于每種抗體而言,可以說,可變重鏈和可變輕鏈構成種系基因對,例如, VH3-23與VK1-5配對。這種有利的生物物理特性可包括a)以Fab形式的相對高的展示率;b)相對高的Fab表達水平;c) Fab的溫度穩定性;d)Fab的牛/小鼠血清穩定性;e)相對高的人IgGl表達水平;和f)人IgGl的牛血清穩定性。為了證實種系基因對可能具有有利的生物物理特性的假設,第一步是鑒定在人免疫組庫中表達的可變重鏈和可變輕鏈種系基因對。在一些方面,本發明包括產生合成抗體或其功能片段的集合的方法,所述方法包括獲得包括人免疫組庫中存在的可變重鏈和可變輕鏈種系基因對的數據的步驟。在一些實施方案中,數據是從提供可變重鏈和可變輕鏈種系基因對的公開可用的文獻中獲得。一般來說,在相關的公開可用的文獻中,遵循以下方法從人供體中分離B細胞,分選B細胞以確定其發育或分化的階段,產生并擴增代表編碼來自每個B細胞的抗體的DNA的cDNA,對該cDNA測序,將編碼可變重鏈和可變輕鏈的cDNA 與已知的種系基因序列比對,并確定來自每個B細胞的種系基因對。在一些實施方案中,數據是從人B細胞的采樣和分離獲得的,其包括與文獻中使用的方法類似的方法。在這些方面,生產合成抗體或其功能片段的集合的方法包括獲得包含存在于人免疫組庫中的可變重鏈和可變輕鏈種系基因對的數據的步驟;其中該獲得步驟還包括如下步驟aa)從樣品中分離人B細胞;ab)從該B細胞產生cDNA ;ac) PCR擴增來自B細胞的cDNA ;ad)對PCR產物進行測序;和ae)鑒定PCR產物的種系基因。兩個數據集提供了人免疫組庫中存在的可變重鏈和可變輕鏈種系基因對。下一步,匯集、分析原始數據,并根據表達水平對存在于人免疫組庫中的可變重鏈和可變輕鏈種系基因對進行分級。在這些方面,本發明包括產生抗體或其功能片段的集合的方法,所述方法包括鑒定在人免疫組庫中被突出表達的可變重鏈和可變輕鏈種系基因對。在人免疫組庫中被突出表達的種系基因對從這個數據很清楚的是,某些可變重鏈和可變輕鏈種系基因對比其他種系對更頻繁地存在于人免疫組庫中。因為這些突出的對預期具有優異的生物物理特性,所以本發明的方面包括源自在人免疫組庫中突出的種系基因對的合成抗體或其功能片段的集合,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區源自于在人免疫組庫中突出的種系基因對。在其他方面,本發明包括含在人免疫組庫中被突出表達的種系基因對的基本上的種系蛋白序列的合成抗體或其功能片段的集合,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區包括在人免疫組庫中被突出表達的種系基因對的基本上的種系蛋白序列。在其他方面,本發明包括含在人免疫組庫中被突出表達的種系基因對的種系蛋白序列的合成抗體或其功能片段的集合,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區包括在人免疫組庫中被突出表達的種系基因對的種系蛋白序列。在一些方面,本發明包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述構架區包括種系蛋白對的種系蛋白序列,其中所述種系基因在人免疫組庫中被突出表達。在一些實施方案中,本發明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構架區基本上由在人免疫組庫中被突出表達的種系基因對的種系蛋白序列組成。在一些實施方案中,抗體或其功能片段基本上由在人免疫組庫中被突出表達的種系基因對組成,其中在一些實施方案中,一個或更多個⑶R基本上由在人免疫組庫中被突出表達的種系基因對的種系蛋白序列組成。在一些實施方案中,本發明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構架區由在人免疫組庫中被突出表達的種系基因對的種系蛋白序列組成。在一些實施方案中,抗體或其功能片段由在人免疫組庫中被突出表達的種系蛋白對所編碼的種系蛋白對組成,其中在一些實施方案中,一個或更多個 CDR基本上由在人免疫組庫中被突出表達的種系基因對的種系蛋白序列組成。在一些實施方案中,這些集合的大多數或基本上全部的抗體或其功能片段包括在人免疫組庫中被突出表達的種系基因對的種系蛋白序列。在一些實施方案中,在人免疫組庫中豐富的或被突出表達的種系基因對以如下濃度表達在人免疫組庫中至少0. 05%,在人免疫組庫中至少0. 09% ;在人免疫組庫中至少 0. 14% ;在人免疫組庫中至少0. 19% ;在人免疫組庫中至少0. 23% ;在人免疫組庫中至少 0. 28% ;在人免疫組庫中至少0. 33% ;在人免疫組庫中至少0. 37% ;在人免疫組庫中至少 0. 42% ;在人免疫組庫中至少0. 47% ;在人免疫組庫中至少0. 51% ;在人免疫組庫中至少 0. 56% ;在人免疫組庫中至少0. 61% ;在人免疫組庫中至少0. 66% ;在人免疫組庫中至少 0. 70% ;在人免疫組庫中至少0. 84% ;在人免疫組庫中至少0. 89% ;在人免疫組庫中至少
0.94% ;在人免疫組庫中至少1.03% ;在人免疫組庫中至少1. 12% ;在人免疫組庫中至少
1.17% ;或在人免疫組庫中至少1. 26%。本發明的另外一方面是集合可用于鑒定針對任何免疫原的抗體或其功能片段的能力。根據CDR長度和在構象或規范結構上的多樣性,認為產生具有在人免疫組庫中被突出表達的至少兩個可變重鏈和可變輕鏈種系蛋白對的集合將提供在該集合中的多樣性,尤其是在該集合的抗體的互補決定區中的多樣性。這容許本發明的集合可用于鑒定針對任何免疫原的抗體或其功能片段。因此,本發明的一些方面包括含抗體或其功能片段的集合, 所述抗體或其功能片段包含如下數目的選自人免疫組庫的突出表達的種系蛋白對的不同的種系蛋白對至少兩個不同的種系蛋白對;至少三個不同的種系蛋白對;至少四個不同的種系蛋白對;至少五個不同的種系蛋白對;至少六個不同的種系蛋白對;至少七個不同的種系蛋白對;至少八個不同的種系蛋白對;至少九個不同的種系蛋白對;至少十個不同的種系蛋白對;至少十一個不同的種系蛋白對;至少十二個不同的種系蛋白對;至少十三個不同的種系蛋白對;至少十四個不同的種系蛋白對;至少十五個不同的種系蛋白對;至少十六個不同的種系蛋白對;至少十七個不同的種系蛋白對;至少十八個不同的種系蛋白對;至少十九個不同的種系蛋白對;至少二十個不同的種系蛋白對;至少21個不同的種系蛋白對;至少22個不同的種系蛋白對;至少23個不同的種系蛋白對;至少24個不同的種系蛋白對;至少25個不同的種系蛋白對;至少26個不同的種系蛋白對;至少27個不同的種系蛋白對;至少28個不同的可變重鏈種系蛋白;至少29個不同的種系蛋白對序列;至少 30個不同的種系蛋白對;至少31個不同的種系蛋白對;至少32個不同的種系蛋白對;至少 33個不同的種系蛋白對;至少34個不同的種系蛋白對;至少35個不同的種系蛋白對;至少 36個不同的種系蛋白對;至少37個不同的種系蛋白對;至少38個不同的種系蛋白對;至少 39個不同的種系蛋白對;至少40個不同的種系蛋白對;至少41個不同的種系蛋白對;至少 42個不同的種系蛋白對;至少43個不同的種系蛋白對;至少44個不同的可變重鏈種系蛋白;至少45個不同的種系蛋白對序列;至少46個不同的種系蛋白對;至少47個不同的種系蛋白對;至少48個不同的種系蛋白對;至少49個不同的種系蛋白對;或至少50個不同的種系蛋白對。在一些實施方案中,集合包括含選自表18所示的種系基因對的一個或更多個種系蛋白對的可變重鏈和可變輕鏈構架區。在一些實施方案中,本發明包括分離的抗體或其功能片段,所述分離的抗體或其功能片段包含可變重鏈結構域和可變輕鏈結構域,所述可變重鏈結構域和可變輕鏈結構域包含FRl、CDRl、FR2、CDR2和FR3,所述FRl、CDRl、FR2、CDR2和FR3包含種系基因對的種系蛋白序列,其中所述種系基因對選自表18的種系基因對。在幼稚的人免疫組庫中被突出表達的種系基因對還預料某些可變重鏈和可變輕鏈種系基因對可在幼稚B細胞(未經歷抗原的)與經歷抗原的B細胞中差異地表達,因此,基于采樣的B細胞的發育或分化來分析數據。包含在幼稚B細胞中被差異表達的種系基因對的種系蛋白對的集合可能在選擇針對任何免疫原的抗體或其功能片段上是有利的。因此,本發明的方面包括源自于在幼稚的人免疫組庫中被突出表達的種系基因對的合成抗體或其功能片段的集合,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區源自于在幼稚的人免疫組庫中被突出表達的種系基因對。在其他方面,本發明包括含在幼稚的人免疫組庫中被突出表達的種系基因對的基本上的種系蛋白序列的合成抗體或其功能片段的集合,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區包括在幼稚的人免疫組庫中被突出表達的種系基因對的基本上的種系蛋白序列。在其他方面,本發明包括含在幼稚的人免疫組庫中被突出表達的種系基因對的種系蛋白序列的合成抗體或其功能片段的集合,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區包括在幼稚的人免疫組庫中被突出表達的種系基因對的種系蛋白序列。 在一些方面,本發明包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合, 其中所述構架區包括種系蛋白序列,其中所述種系蛋白序列包括可變重鏈和可變輕鏈種系蛋白對,其中所述種系蛋白對由在幼稚的人免疫組庫中被突出表達的種系基因對編碼。在一些實施方案中,本發明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構架區基本上由在幼稚的人免疫組庫中被突出表達的種系基因對的種系蛋白序列組成。在一些實施方案中,抗體或其功能片段基本上由如下種系蛋白對組成所述種系蛋白對由在幼稚的人免疫組庫中被突出表達的種系基因對編碼。在一些實施方案中,本發明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構架區由在幼稚的人免疫組庫中被突出表達的種系基因對的種系蛋白序列組成。在一些實施方案中,抗體或其功能片段由如下種系蛋白對組成所述種系蛋白對由在幼稚的人免疫組庫中被突出表達的種系基因對編碼。在一些實施方案中,這些集合的大多數或基本上全部的抗體或其功能片段包括在幼稚的人免疫組庫中被突出表達的種系基因對的種系蛋白序列。在一些實施方案中,在幼稚的人免疫組庫中豐富的或被突出表達的種系基因對以如下濃度表達在幼稚的人免疫組庫中至少0. 07%,在幼稚的人免疫組庫中至少0. 15% ; 在幼稚的人免疫組庫中至少0. 22% ;在幼稚的人免疫組庫中至少0. 30% ;在幼稚的人免疫組庫中至少0. 37% ;在幼稚的人免疫組庫中至少0. 45% ;在幼稚的人免疫組庫中至少 0. 52% ;在幼稚的人免疫組庫中至少0. 59% ;在幼稚的人免疫組庫中至少0. 67% ;在幼稚的人免疫組庫中至少0. 74% ;在幼稚的人免疫組庫中至少0. 82% ;在幼稚的人免疫組庫中至少0. 89% ;在幼稚的人免疫組庫中至少0. 97% ;在幼稚的人免疫組庫中至少1. 19% ;或在幼稚的人免疫組庫中至少1. 56%。
本發明的另外一方面是集合可用于鑒定針對任何免疫原的抗體或其功能片段的能力。根據CDR長度和在構象或規范結構上的多樣性,認為產生具有在幼稚的人免疫組庫中被突出表達的種系基因對所編碼的至少兩個可變重鏈和可變輕鏈種系蛋白對的集合將提供在該集合中的多樣性,尤其是在該集合的抗體的互補決定區中的多樣性。這容許本發明的集合可用于鑒定針對任何免疫原的抗體或其功能片段。因此,本發明的一些方面包括含抗體或其功能片段的集合,所述抗體或其功能片段包含如下數目的不同的種系蛋白對: 至少兩個不同的種系蛋白對;至少三個不同的種系蛋白對;至少四個不同的種系蛋白對; 至少五個不同的種系蛋白對;至少六個不同的種系蛋白對;至少七個不同的種系蛋白對; 至少八個不同的種系蛋白對;至少九個不同的種系蛋白對;至少十個不同的種系蛋白對; 至少十一個不同的種系蛋白對;至少十二個不同的種系蛋白對;至少十三個不同的種系蛋白對;至少十四個不同的種系蛋白對;至少十五個不同的種系蛋白對;至少十六個不同的種系蛋白對;至少十七個不同的種系蛋白對;至少十八個不同的種系蛋白對;至少十九個不同的種系蛋白對;至少二十個不同的種系蛋白對;至少21個不同的種系蛋白對;至少22 個不同的種系蛋白對;至少23個不同的種系蛋白對;至少24個不同的種系蛋白對;至少25 個不同的種系蛋白對;至少26個不同的種系蛋白對;至少27個不同的種系蛋白對;至少28 個不同的可變重鏈種系蛋白;至少29個不同的種系蛋白對序列;至少30個不同的種系蛋白對;至少31個不同的種系蛋白對;至少32個不同的種系蛋白對;至少33個不同的種系蛋白對;至少34個不同的種系蛋白對;至少35個不同的種系蛋白對;至少36個不同的種系蛋白對;至少37個不同的種系蛋白對;至少38個不同的種系蛋白對;至少39個不同的種系蛋白對;至少40個不同的種系蛋白對;至少41個不同的種系蛋白對;至少42個不同的種系蛋白對;至少43個不同的種系蛋白對;至少44個不同的可變重鏈種系蛋白;至少45 個不同的種系蛋白對序列;至少46個不同的種系蛋白對;至少47個不同的種系蛋白對;至少48個不同的種系蛋白對;至少49個不同的種系蛋白對;或至少50個不同的種系蛋白對。在一些實施方案中,集合包括含選自表19的種系基因對的一個或更多個種系蛋白對的可變重鏈和可變輕鏈構架區。在一些實施方案中,本發明包括分離的抗體或其功能片段,所述分離的抗體或其功能片段包含可變重鏈結構域和可變輕鏈結構域,所述可變重鏈結構域和可變輕鏈結構域包含FRl、CDRl、FR2、CDR2和FR3,所述FRl、CDRl、FR2、CDR2和FR3包含構成種系蛋白對的種系蛋白序列,其中所述種系蛋白對選自表19的種系基因對。在人免疫組庫中被突出表達的可變重鏈、可變κ輕鏈、以及可變λ輕鏈種系基因下一步,分析匯集數據和附加的數據以確定在人免疫組庫中可變重鏈、可變κ輕鏈、和可變λ輕鏈的種系基因表達。因此,本發明的額外方面包括產生抗體或其功能片段的集合的方法,所述方法包括鑒定在人免疫組庫中被突出表達的可變重鏈、可變κ輕鏈、 和可變λ輕鏈種系基因的步驟。這樣做的一個途徑是基于可變重鏈、可變κ輕鏈、和可變 λ輕鏈種系基因的表達水平將它們排序。包含由在人免疫組庫中被突出表達的種系基因編碼的可變重鏈或可變輕鏈種系蛋白序列的抗體可能具有增強研發及在患者中的安全性和效力的有利生物物理特性。因此,本發明的方面包括源自于在人免疫組庫中被突出表達的可變重鏈或可變輕鏈種系基因的合成抗體或其功能片段的集合,其中在一些實施方案中,這些抗體或其功能片段的一個
29或更多個構架區和/或互補決定區源自于在人免疫組庫中被突出表達的可變重鏈或可變輕鏈種系基因。在其他方面,本發明包括含在人免疫組庫中被突出表達的可變重鏈或可變輕鏈種系基因的基本上的種系蛋白序列的合成抗體或其功能片段的集合,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區包含在幼稚的人免疫組庫中被突出表達的可變重鏈或可變輕鏈種系基因的基本上的種系蛋白序列。在其他方面,本發明包括含在人免疫組庫中被突出表達的可變重鏈或可變輕鏈種系基因的種系蛋白序列的合成抗體或其功能片段的集合,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區包含在人免疫組庫中被突出表達的可變重鏈或可變輕鏈種系基因的種系蛋白序列。在一些方面,本發明包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述構架區包括種系蛋白序列,其中所述種系蛋白序列由在人免疫組庫中被突出表達的可變重鏈或可變輕鏈種系基因編碼。在一些實施方案中,本發明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構架區基本上由在人免疫組庫中被突出表達的可變重鏈或可變輕鏈種系基因的種系蛋白序列組成。在一些實施方案中,抗體或其功能片段基本上由如下可變重鏈或可變輕鏈種系蛋白序列組成所述種系蛋白序列由在幼稚的人免疫組庫中被突出表達的種系基因編碼。在一些實施方案中,本發明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構架區由在人免疫組庫中被突出表達的可變重鏈或可變輕鏈種系基因的種系蛋白序列組成。在一些實施方案中,抗體或其功能片段由如下可變重鏈或可變輕鏈種系蛋白序列組成所述種系蛋白序列由在人免疫組庫中被突出表達的種系基因編碼。在一些實施方案中,這些集合的大多數或基本上全部的抗體或其功能片段包括在幼稚的人免疫組庫中被突出表達的種系基因編碼的種系蛋白序列。在一些實施方案中,在人免疫組庫中豐富的或被突出表達的可變重鏈種系基因以如下濃度表達在人免疫組庫中至少0. ;在人免疫組庫中至少0.2% ;在人免疫組庫中至少0. 3% ;在人免疫組庫中至少0. 4% ;在人免疫組庫中至少0. 5% ;在人免疫組庫中至少0. 6% ;在人免疫組庫中至少1. 0% ;在人免疫組庫中至少1. 6% ;在人免疫組庫中至少2.1% ;在人免疫組庫中至少2.2% ;在人免疫組庫中至少2.6% ;在人免疫組庫中至少2. 7% ;在人免疫組庫中至少3.0% ;在人免疫組庫中至少3.2% ;在人免疫組庫中至少3. 3% ;在人免疫組庫中至少4.0% ;在人免疫組庫中至少4. ;在人免疫組庫中至少4. 5% ;在人免疫組庫中至少4. 6% ;在人免疫組庫中至少5. 3% ;在人免疫組庫中至少 5.8% ;或在人免疫組庫中至少6. 8% ;在人免疫組庫中至少7.6% ;在人免疫組庫中至少 8.0% ;或在人免疫組庫中至少10.6%。在一些實施方案中,在人免疫組庫中豐富的或被突出表達的可變κ輕鏈種系基因以如下濃度表達在人免疫組庫中至少0. 1%,在人免疫組庫中至少0.2% ;在人免疫組庫中至少0. 3% ;在人免疫組庫中至少0. 4% ;在人免疫組庫中至少0. 5% ;在人免疫組庫中至少0.7% ;在人免疫組庫中至少1.0% ;在人免疫組庫中至少1. 1% ;在人免疫組庫中至少1. 3% ;在人免疫組庫中至少1. 9% ;在人免疫組庫中至少2. 2% ;在人免疫組庫中至少2. 4% ;在人免疫組庫中至少2. 6% ;在人免疫組庫中至少4. 6% ;在人免疫組庫中至少6. 0% ;在人免疫組庫中至少7. 6% ;在人免疫組庫中至少8. 5% ;在人免疫組庫中至少 11. 1% ;在人免疫組庫中至少11. 2% ;在人免疫組庫中至少14. 2% ;或在人免疫組庫中至少 16. 2%。在一些實施方案中,在人免疫組庫中豐富的或被突出表達的可變λ輕鏈種系基因以如下濃度表達在人免疫組庫中至少0. 1%,在人免疫組庫中至少0. 3% ;在人免疫組庫中至少0. 5% ;在人免疫組庫中至少0. 6% ;在人免疫組庫中至少1. 0% ;在人免疫組庫中至少1. 2% ;在人免疫組庫中至少1. 5% ;在人免疫組庫中至少1. 7% ;在人免疫組庫中至少4. 5% ;在人免疫組庫中至少5. 1% ;在人免疫組庫中至少5. 3% ;在人免疫組庫中至少 6.5% ;在人免疫組庫中至少8. 1% ;在人免疫組庫中至少10.0% ;或在人免疫組庫中至少 11. 3% ;或在人免疫組庫中至少18. 1%。本發明的另外一方面是集合可用于鑒定針對任何免疫原的抗體或其功能片段的能力。認為產生具有在人免疫組庫中被突出表達的一個或更多個可變重鏈、可變κ輕鏈和可變λ輕鏈種系基因的集合將產生在該集合中的多樣性,尤其是在CDR長度和在構象或規范結構上的多樣性,由此使得該集合可用于鑒定針對任何免疫原的抗體或其功能片段。本發明的實施方案包括含抗體或其功能片段的集合,所述抗體或其功能片段包含如下數目的不同的可變重鏈種系蛋白序列至少兩種不同的可變重鏈種系蛋白序列;至少三種不同的可變重鏈種系蛋白序列;至少四種不同的可變重鏈種系蛋白序列;至少五種不同的可變重鏈種系蛋白序列;至少六種不同的可變重鏈種系蛋白序列;至少七種不同的可變重鏈種系蛋白序列;至少八種不同的可變重鏈種系蛋白序列;至少九種不同的可變重鏈種系蛋白序列;至少十種不同的可變重鏈種系蛋白序列;至少十一種不同的可變重鏈種系蛋白序列; 至少十二種不同的可變重鏈種系蛋白序列;至少十三種不同的可變重鏈種系蛋白序列;至少十四種不同的可變重鏈種系蛋白序列;至少十五種不同的可變重鏈種系蛋白序列;至少十六種不同的可變重鏈種系蛋白序列;至少十七種不同的可變重鏈種系蛋白序列;至少十八種不同的可變重鏈種系蛋白序列;至少十九種不同的可變重鏈種系蛋白序列;至少二十種不同的可變重鏈種系蛋白序列;至少21種不同的可變重鏈種系蛋白序列;至少22 種不同的可變重鏈種系蛋白序列;至少23種不同的可變重鏈種系蛋白序列;至少24種不同的可變重鏈種系蛋白序列;至少25種不同的可變重鏈種系蛋白序列;至少26種不同的可變重鏈種系蛋白序列;至少27種不同的可變重鏈種系蛋白序列;至少28種不同的可變重鏈種系蛋白;至少29種不同的可變重鏈種系蛋白序列;至少30種不同的可變重鏈種系蛋白序列;至少31種不同的可變重鏈種系蛋白序列;至少32種不同的可變重鏈種系蛋白序列;至少33種不同的可變重鏈種系蛋白序列;至少34種不同的可變重鏈種系蛋白序列; 至少35種不同的可變重鏈種系蛋白序列;至少36種不同的可變重鏈種系蛋白序列;至少 37種不同的可變重鏈種系蛋白序列;至少38種不同的可變重鏈種系蛋白序列;至少39種不同的可變重鏈種系蛋白序列;至少40種不同的可變重鏈種系蛋白序列;至少41種不同的可變重鏈種系蛋白序列;至少42種不同的可變重鏈種系蛋白序列;至少43種不同的可變重鏈種系蛋白序列;至少44種不同的可變重鏈種系蛋白;至少45種不同的可變重鏈種系蛋白序列;至少46種不同的可變重鏈種系蛋白序列;至少47種不同的可變重鏈種系蛋白序列;至少48種不同的可變重鏈種系蛋白序列;至少49種不同的可變重鏈種系蛋白序列。本發明的實施方案包括含抗體或其功能片段的集合,所述抗體或其功能片段包含如下數目的不同的可變κ輕鏈種系蛋白序列至少兩種可變κ輕鏈種系蛋白序列;至少三種不同的可變κ輕鏈種系蛋白序列;至少四種不同的可變κ輕鏈種系蛋白序列;至少五種不同的可變κ輕鏈種系蛋白序列;至少六種不同的可變κ輕鏈種系蛋白序列;至少七種不同的可變κ輕鏈種系蛋白序列;至少八種不同的可變κ輕鏈種系蛋白序列;至少九種不同的可變κ輕鏈種系蛋白序列;至少十種不同的可變κ輕鏈種系蛋白序列;至少十一種不同的可變κ輕鏈種系蛋白序列;至少十二種不同的可變κ輕鏈種系蛋白序列; 至少十三種不同的可變κ輕鏈種系蛋白序列;至少十四種不同的可變κ輕鏈種系蛋白序列;至少十五種不同的可變κ輕鏈種系蛋白序列;至少十六種不同的可變κ輕鏈種系蛋白序列;至少十七種不同的可變K輕鏈種系蛋白序列;至少十八種不同的可變K輕鏈種系蛋白序列;至少十九種不同的可變K輕鏈種系蛋白序列;至少二十種不同的可變K輕鏈種系蛋白序列;至少21種不同的可變K輕鏈種系蛋白序列;至少22種不同的可變K 輕鏈種系蛋白序列;至少23種不同的可變κ輕鏈種系蛋白序列;至少24種不同的可變κ 輕鏈種系蛋白序列;至少25種不同的可變κ輕鏈種系蛋白序列;至少26種不同的可變κ 輕鏈種系蛋白序列;至少27種不同的可變κ輕鏈種系蛋白序列;至少28種不同的可變κ 輕鏈種系蛋白;至少29種不同的可變κ輕鏈種系蛋白序列;至少30種不同的可變κ輕鏈種系蛋白序列;至少31種不同的可變κ輕鏈種系蛋白序列;至少32種不同的可變κ輕鏈種系蛋白序列;至少33種不同的可變κ輕鏈種系蛋白序列;至少34種不同的可變κ輕鏈種系蛋白序列;至少35種不同的可變κ輕鏈種系蛋白序列。本發明的實施方案包括含抗體或其功能片段的集合,所述抗體或其功能片段包含如下數目的不同的可變λ輕鏈種系蛋白序列至少兩種不同的可變λ輕鏈種系蛋白序列; 至少三種不同的可變λ輕鏈種系蛋白序列;至少四種不同的可變λ輕鏈種系蛋白序列; 至少五種不同的可變λ輕鏈種系蛋白序列;至少六種不同的可變λ輕鏈種系蛋白序列; 至少七種不同的可變λ輕鏈種系蛋白序列;至少八種不同的可變λ輕鏈種系蛋白序列; 至少九種不同的可變λ輕鏈種系蛋白序列;至少十種不同的可變λ輕鏈種系蛋白序列; 至少十一種不同的可變λ輕鏈種系蛋白序列;至少十二種不同的可變λ輕鏈種系蛋白序列;至少十三種不同的可變λ輕鏈種系蛋白序列;至少十四種不同的可變λ輕鏈種系蛋白序列;至少十五種不同的可變λ輕鏈種系蛋白序列;至少十六種不同的可變λ輕鏈種系蛋白序列;至少十七種不同的可變λ輕鏈種系蛋白序列;至少十八種不同的可變λ輕鏈種系蛋白序列;至少十九種不同的可變λ輕鏈種系蛋白序列;至少二十種不同的可變λ 輕鏈種系蛋白序列;至少21種不同的可變λ輕鏈種系蛋白序列;至少22種不同的可變λ 輕鏈種系蛋白序列;至少23種不同的可變λ輕鏈種系蛋白序列;至少24種不同的可變λ 輕鏈種系蛋白序列;至少25種不同的可變λ輕鏈種系蛋白序列;至少26種不同的可變λ 輕鏈種系蛋白序列;至少27種不同的可變λ輕鏈種系蛋白序列;至少28種不同的可變λ 輕鏈種系蛋白;至少29種不同的可變λ輕鏈種系蛋白序列;至少30種不同的可變λ輕鏈種系蛋白序列;至少31種不同的可變λ輕鏈種系蛋白序列;至少32種不同的可變λ輕鏈種系蛋白序列;至少33種不同的可變λ輕鏈種系蛋白序列。在一些實施方案中,集合包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括選自由以下組成的組的一種或更多種可變重鏈種系蛋白序列 IGHV3-23 ;IGHV3-30 ;IGHV4-39 ;IGHV4-34 ; IGHV4-59 ; IGHV1-69 ;IGHV5-51 ; IGHV3-7 ; IGHV1-18 ; IGHV3-48 ; IGHV3-15 ; IGHV3-21 ; IGHV1-2 ; IGHV3-33 ; IGHV4-31 ; IGHV3-53 ;IGHV3-11 ; IGHV3-9 ; IGHV4-4 ; IGHV1-46 ; IGHV3-74 ; IGHV1-24 ; IGHV4-61 ; IGHV1-8 ; IGHV1-3 ; IGHV3-49 ; IGHV3-43 ; IGHV4-28 ; IGHV3-64 ;和 IGHV7-81。在一些實施方案中,集合包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括選自由以下組成的組的一種或更多種可變κ輕鏈種系蛋白序列 IGKV3-20 ;IGKV1-39/1D-39;IGKV1-5 ;IGKV3-15 ; IGKV4-1 ; IGKV3-11 ; IGKV2-28/2D-28; IGKV1-33/1D-33 ; IGKV2-30 ; IGKV1-9 ;IGKV1-17 ; IGKV1-27;IGKV1-8 ;IGKV1-16 ; IGKV1-6 ; IGKV1-12 ; IGKV2D-29 ; IGKV1-13 ; IGKV1D-8 ;和 IGKV2-24。在一些實施方案中,集合包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括選自由以下組成的組的一種或更多種可變λ輕鏈種系蛋白序列 JGLV2-14;IGLV1-40 ; IGLV1-44 ;IGLV1-51 ; IGLV2-23 ; IGLV3-21 ;IGLV1-47 ; IGLV3-1 ; IGLV2-11 ; IGLV2-8 ; IGLV6-57 ; IGLV3-25 ; IGLV7-46 ;IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;禾口 IGLV3-27。在一些實施方案中,本發明包括含FR1、⑶Rl、FR2、⑶R2和FR3的分離的抗體或其功能片段,所述FRl、CDRl、FR2、CDR2和FR3包含選自由以下組成的組的種系蛋白序列IGHV3-23 ;IGHV3-30 ;IGHV4-39 ;IGHV4-34 ;IGHV4-59 ;IGHVl-69 IGHV5-51 ; IGHV3-7 ;IGHV1-18 ; IGHV3-48 ;IGHV3-15 ; IGHV3-21 ;IGHV1-2 ; IGHV3-33 IGHV4-31 ;IGHV3-53 ;IGHV3-11 ;IGHV3-9 ;IGHV4-4 ;IGHV1-46 ;IGHV3-74 ;IGHV1-24 IGHV4-61 ;IGHV1-8 ;IGHV1-3 ;IGHV3-49 ;IGHV3-43 ;IGHV4-28 ;IGHV3-64 ;IGHV7-81 IGKV3-20 ;IGKV1-39/1D-39 ;IGKV1-5 ; IGKV3-15 ; IGKV4-1 ; IGKV3-11 ; IGKV2-28/2D-28 IGKV1-33/1D-33 ;IGKV2-30;IGKV1-9 ;IGKV1-17 ; IGKV1-27 ; IGKV1-8 ;IGKV1-16 ; IGKV1-6 IGKV1-12 ; IGKV2D-29 ;IGKV1-13 ; IGKV1D-8;IGKV2-24 ; IGLV2-14 ; IGLV1-40 ; IGLV1-44 IGLV1-51 ; IGLV2-23 ;IGLV3-21 ;IGLV1-47 ; IGLV3-1 ; IGLV2-11 ; IGLV2-8 ; IGLV6-57 IGLV3-25;IGLV7-46 ; IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;和 IGLV3-27。具有有利的生物物理特性的可變重鏈、可變κ輕鏈和可變λ輕鏈種系基因下一步,評估突出的可變重鏈、可變κ輕鏈和可變λ輕鏈種系蛋白序列以確定其與研發相關的生物物理特性。經由計算機模擬評估了可變重鏈、可變κ輕鏈和可變λ輕鏈種系蛋白序列的以下特性CDR長度;等電點(pi),優選的等電點是7. 5或以上,因為這應該提供在標準的PH 5.5到?!1 7配制緩沖液中的穩定性;在互補決定區中的翻譯后修飾 (PTM)(具體地說,N連接的糖基化位點(NxS或NxT)或化學修飾如Asp切割(通常在DP), Asp異構化(DD,DG),脫酰胺作用(NS,NG)(這可在體內(在血清中)或在儲存時在配制緩沖液中發生并且導致抗體結合的喪失);在CDR中甲硫氨酸的存在(當暴露于溶劑時可被氧化);未成對的半胱氨酸的存在(將與任何其他未成對的半胱氨酸形成二硫鍵,由此導致蛋白的交聯和/或較低的表達水平);偏離種系;潛在的T細胞表位的存在;以及理論上的聚集傾向。在一些實施方案中,本發明包括產生合成抗體或其功能片段的集合的方法,所述方法包括如下步驟a)鑒定包含如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i) 在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸; iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;和vi)至少7. 5的等電點;和b)產生含在a)中鑒定的可變重鏈和/或可變輕鏈種系基因序列的抗體或其功能片段的集合。本發明的方面包括源自于具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列的合成抗體或其功能片段的集合i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸; iv) 一個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區源自于具有這些特性的可變重鏈和/或可變輕鏈種系蛋白序列。本發明的方面包括合成抗體或其功能片段的集合,所述合成抗體或其功能片段包括具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列的基本上的種系蛋白序列i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區包括來自具有這些特性的可變重鏈和/或可變輕鏈種系蛋白序列的基本上的種系蛋白序列。本發明的方面包括合成抗體或其功能片段的集合,所述合成抗體或其功能片段包括具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列的種系蛋白序列i) 在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸; iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點,其中在一些實施方案中,這些抗體或其功能片段的一個或更多個構架區和/或互補決定區包括具有這些特性的可變重鏈和/或可變輕鏈種系蛋白的種系蛋白序列。本發明的方面包括合成抗體或其功能片段的集合,所述合成抗體或其功能片段包括不含未成對半胱氨酸的可變重鏈和/或可變輕鏈種系蛋白序列。本發明的方面包括含如下可變重鏈和/或可變輕鏈種系蛋白序列的合成抗體或其功能片段的集合所述可變重鏈和/或可變輕鏈種系蛋白序列包含互補決定區中的四個或更少的翻譯后修飾;互補決定區中的三個或更少的翻譯后修飾;互補決定區中的兩個或更少的翻譯后修飾;互補決定區中的一個或更少的翻譯后修飾;或互補決定區中無翻譯后修飾。本發明的方面包括源自于如下可變重鏈和/或可變輕鏈種系蛋白序列的合成抗體或其功能片段的集合所述可變重鏈和/或可變輕鏈種系蛋白序列包括至少7. 5的等電點;至少8. 0的等電點;至少8. 5的等電點;至少9的等電點;或至少9. 5的等電點。本發明的方面包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述構架區包括具有一種或更多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,合成抗體或其功能片段的集合包括具有至少兩種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,合成抗體或其功能片段的集合包括具有至少四種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補決定區中四個或更少的翻譯后修飾;ii) 在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,合成抗體或其功能片段的集合包括具有至少四種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補決定區中四個或更少的翻譯后修飾;ii) 在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,合成抗體或其功能片段的集合包括具有至少五種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補決定區中四個或更少的翻譯后修飾;ii) 在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,合成抗體或其功能片段的集合包括具有如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;和vi)至少7. 5的等電點。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區基本上由具有一種或更多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列組成i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位; ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,抗體或其功能片段基本上由具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列組成i)在互補決定區中四個或更少的翻譯后修飾;ii) 在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區由具有一種或更多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列組成i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,抗體或其功能片段由具有一種或多種如下特性的可變重鏈和 /或可變輕鏈種系蛋白序列組成i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,這些集合的大多數或基本上全部的抗體或其功能片段包括具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未
35成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少 7.5的等電點。一些實施方案包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述構架區包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;和ν)至少7. 5的等電點。一些實施方案包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述構架區包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i) 一個或更少的未成對半胱氨酸。一些實施方案包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述構架區包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i) 一個或更少的未成對半胱氨酸;ii) 一個或更少的潛在T細胞表位。一些實施方案包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述構架區包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i) 一個或更少的未成對半胱氨酸;ii) 一個或更少的潛在T細胞表位;和iii)至少7. 5的等電點。一些實施方案包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述構架區包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i)在互補決定區中兩個或更少的甲硫氨酸;ii) 一個或更少的未成對半胱氨酸;iii) 一個或更少的潛在T細胞表位;和iv)至少7. 5的等電點。本發明的另外一方面是集合可用于鑒定針對任何免疫原的抗體或其功能片段的能力。認為產生具有一個或更多個可變重鏈、可變κ輕鏈和可變λ輕鏈種系蛋白序列的集合將產生在該集合中的多樣性,尤其是在CDR長度和在構象或規范結構上的多樣性,由此使得該集合可用于鑒定針對任何免疫原的抗體或其功能片段。本發明的實施方案包括含如下抗體或其功能片段的集合所述抗體或其功能片段包括如下數目的不同的可變重鏈種系蛋白序列至少兩種不同的可變重鏈種系蛋白序列; 至少三種不同的可變重鏈種系蛋白序列;至少四種不同的可變重鏈種系蛋白序列;至少五種不同的可變重鏈種系蛋白序列;至少六種不同的可變重鏈種系蛋白序列;至少七種不同的可變重鏈種系蛋白序列;至少八種不同的可變重鏈種系蛋白序列;至少九種不同的可變重鏈種系蛋白序列;至少十種不同的可變重鏈種系蛋白序列;至少十一種不同的可變重鏈種系蛋白序列;至少十二種不同的可變重鏈種系蛋白序列;至少十三種不同的可變重鏈種系蛋白序列;至少十四種不同的可變重鏈種系蛋白序列;至少十五種不同的可變重鏈種系蛋白序列;至少十六種不同的可變重鏈種系蛋白序列;至少十七種不同的可變重鏈種系蛋白序列;至少十八種不同的可變重鏈種系蛋白序列;至少十九種不同的可變重鏈種系蛋白序列;或至少二十種不同的可變重鏈種系蛋白序列,所述不同的可變重鏈種系蛋白序列包含如下特性i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν) 中等或低的聚集傾向;或vi)至少7. 5的等電點。本發明的實施方案包括含如下抗體或其功能片段的集合所述抗體或其功能片段包括如下數目的不同的可變κ輕鏈種系蛋白序列至少兩種不同的可變κ輕鏈種系蛋白29/172 頁
序列;至少三種不同的可變κ輕鏈種系蛋白序列;至少四種不同的可變κ輕鏈種系蛋白序列;至少五種不同的可變κ輕鏈種系蛋白序列;至少六種不同的可變κ輕鏈種系蛋白序列;至少七種不同的可變κ輕鏈種系蛋白序列;至少八種不同的可變κ輕鏈種系蛋白序列;至少九種不同的可變κ輕鏈種系蛋白序列;至少十種不同的可變κ輕鏈種系蛋白序列;至少十一種不同的可變κ輕鏈種系蛋白序列;至少十二種不同的可變κ輕鏈種系蛋白序列,所述不同的可變κ輕鏈種系蛋白序列包含如下特性i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5 的等電點。本發明的實施方案包括含如下抗體或其功能片段的集合所述抗體或其功能片段包括如下數目的不同的可變λ輕鏈種系蛋白序列至少兩種不同的可變λ輕鏈種系蛋白序列;至少三種不同的可變λ輕鏈種系蛋白序列;至少四種不同的可變λ輕鏈種系蛋白序列;至少五種不同的可變λ輕鏈種系蛋白序列;至少六種不同的可變λ輕鏈種系蛋白序列;至少七種不同的可變λ輕鏈種系蛋白序列;至少八種不同的可變λ輕鏈種系蛋白序列,所述不同的可變λ輕鏈種系蛋白序列包含如下特性i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) —個或更少的潛在T細胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點。在一些實施方案中,集合包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括選自由以下組成的組的一種或更多種可變重鏈種系蛋白序列IGHVl-2 ;IGHV1-18 ;IGHV1-69 ;IGHV1-46 ;IGHV3-7 ;IGHV3-11 ;IGHV3-15 ;IGHV3-21 ; IGHV3-23 ;IGHV3-30 ;IGHV3-33 ;IGHV3-48 ;IGHV3-53 ;IGHV3-73 ;IGH3-74 ;IGHV4-4 ; IGHV4-31 ; IGHV4-39 ; IGHV 5-51和 IGHV6-1。在一些實施方案中,集合包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括選自由以下組成的組的一種或更多種可變κ輕鏈種系蛋白序列IGKVl-5 ;IGKV1-6 ;IGKV1-9 ;IGKV1-12 ;IGKV1-16 ;IGKV1-17 ;IGKV1-27 ;IGKV1-39 ; IGKV2-30 ; IGKV3-11 ; IGKV3-15 ;和 IGKV3-20。在一些實施方案中,集合包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括選自由以下組成的組的一種或更多種可變λ輕鏈種系蛋白序列 IGLV1-40 ; IGLV1-47 ;IGLV1-51 ; IGLV2-11 ; IGLV2-23 ; IGLV2-14 ; IGLV3-1 和 IGLV3-21。在一些實施方案中,本發明包括含FR1、⑶Rl、FR2、⑶R2和FR3的分離的抗體或其功能片段,所述FR1、⑶Rl、FR2、⑶R2和FR3包含選自由以下組成的組的種系蛋白序列 JGHV1-2 ;IGHV1-18 ; IGHV1-69 ; IGHV1-46 ; IGHV3-7 ; IGHV3-11 ;IGHV3-15 ; IGHV3-21 ; IGHV3-23 ;IGHV3-30 ;IGHV3-33 ;IGHV3-48 ;IGHV3-53 ;IGHV3-73 ;IGH3-74 ;IGHV4-4 ; IGHV4-31 ; IGHV4-39 ; IGHV 5-51 ; IGHV6-1 ; IGKV1-5 ;IGKV1-6 ; IGKV1-9 ; IGKV1-12 ; IGKV1-16 ;IGKV1-17 ;IGKV1-27 ; IGKV1-39 ; IGKV2-30 ; IGKV3-11 ;IGKV3-15 ; IGKV3-20 ; IGLV1-40 ; IGLV1-47 ; IGLV1-51 ; IGLV2-11 ;IGLV2-23 ; IGLV2-14 ; IGLV3-1 和 IGLV3-21。具有有利的生物物理特性的種系基因對下一步,必須確定要測試哪些種系蛋白質對,因為在人免疫組庫中存在約2500
37對。一種方式是測試最突出地出現在人免疫組庫中的可變重鏈和可變輕鏈種系蛋白對,例如,見表18。人們可例如選擇前四百對用于測試,或者選擇表達高于某個閾值濃度的可變重鏈和可變輕鏈種系蛋白對。因此,本發明的方面包括生產合成抗體或其功能片段的集合的方法,其中所述生產步驟還包括如下步驟鑒定以至少0. 05%的濃度在人免疫組庫中表達的可變重鏈和可變輕鏈種系基因對;產生包含所鑒定的種系蛋白對的抗體或其功能片段; 并且評估所述種系蛋白對的如下特性i)以Fab形式的相對展示率;ii)以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在 37°C持續大于十天的在牛血清中的穩定性;ν)以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。這種方法將需要合成和測試大量可變重鏈和可變輕鏈種系蛋白對序列;因此,這種方法將不是非常有效率的。作為一種替代的方法,發明人選擇了代表、準確地再現或覆蓋大多數來自人免疫組庫的突出表達的對的一小組可變重鏈和可變輕鏈種系對。這種方法部分上基于如下觀察結果少量可變重鏈、可變κ輕鏈和可變λ輕鏈種系基因在人免疫組庫中占優勢。Wildt 等人在895-896頁描述了這種現象。Wildt等人還說明頻繁表達的重鏈和輕鏈基因區段通常是成對的,并且觀察到采樣的一半配對僅對應于五個種系對。因此,可以聯合少量的突出表達的重鏈和輕鏈種系基因(未成對的)以產生一組代表人免疫組庫的對。因此,本發明的方面包括如下抗體或其片段的集合所述抗體或其片段包括代表、 準確地再現或覆蓋人免疫組庫或幼稚的人免疫組庫的大多數突出表達的可變重鏈和可變輕鏈種系基因對的種系蛋白對。如以下所述,隨著首先測試可變重鏈和可變輕鏈種系蛋白對的有利的生物物理特性,然后將集合設計成包括具有一種或更多種這些有利的生物物理特性的種系蛋白對,我們的方法產生了包含可充分開發的抗體或其片段的集合。本發明的方面包括生產抗體或其功能片段的集合的方法,所述方法包括鑒定具有一種或多種如下特性的可變重鏈和可變輕鏈種系蛋白對的步驟i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab pMxll_FH VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與 M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些方面,本發明包括生產抗體或其功能片段的集合的方法,所述方法包括產生含可變重鏈和可變輕鏈構架區的抗體或其功能片段的集合,其中所述一種或更多種構架區包括種系蛋白對的種系蛋白序列,其中所述種系蛋白對包括一種或更多種如下特性 i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在 37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,FRU FR2和FR3區包括種系蛋白序列。在一些實施方案中,FRl、FR2和FR3區包括種系蛋白對的種系蛋白序列。在一些實施方案中,抗體或其功能片段包括含種系蛋白序列的一個或更多個互補決定區。在一些實施方案中,抗體或其功能片段包括含種系蛋白對的種系蛋白序列的一個或更多個互補決定區。在一些實施方案中,⑶Rl區和⑶R2區包括種系蛋白序列。在一些實施方案中,⑶Rl 區和⑶R2區包括種系蛋白對的種系蛋白序列。在一些實施方案中,FRU⑶Rl、FR2、⑶R2 和FR3區包括種系蛋白序列。在一些實施方案中,FR1、⑶Rl、FR2、⑶R2和FR3區包括種系蛋白對的種系蛋白序列。在一些實施方案中,FR4區包括JH4重鏈區。在一些實施方案中, 尺4區包括了1^ 1輕鏈區。在一些實施方案中,FR4區包括JX 2/3輕鏈區。在其他實施方案中,本發明包括生產抗體或其功能片段的集合的方法,所述方法包括產生集合,其中產生還包括如下步驟合成編碼抗體或其功能片段的核酸;將核酸克隆到載體中;并且表達抗體或其功能片段。合成并測試可變重鏈和可變輕鏈種系蛋白對的突出表達的或代表的組后,然后可將集合設計成包括具有有利的生物物理特性的種系蛋白對。本發明的方面包括源自于具有一種或更多種如下特性的種系蛋白對的合成抗體或其功能片段的集合i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii) 與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在 60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和 vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性,其中在一些實施方案中,抗體或其功能片段的一個或更多個構架區和/或互補決定區源自于具有這些特性的種系蛋白對。本發明的方面包括如下合成抗體或其功能片段的集合所述合成抗體或其功能片段包括具有一種或更多種如下特性的種系蛋白對的基本上的種系蛋白序列i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與 M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性,其中在一些實施方案中,抗體或其功能片段的一個或更多個構架區和/或互補決定區包括具有這些特性的種系蛋白對的基本上的種系蛋白序列。本發明的方面包括如下合成抗體或其功能片段的集合所述合成抗體或其功能片段包括具有一種或更多種如下特性的種系蛋白對的種系蛋白序列i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性; iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性,其中在一些實施方案中,抗體或其功能片段的一個或更多個構架區和/或互補決定區包括具有這些特性的種系蛋白對的種系蛋白序列。在一些方面,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區包括具有一種或更多種如下特性的種系蛋白對的種系蛋白序列i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,包含種系蛋白對的種系蛋白序列的構架區包括FR1、FR2和 FR3區。在一些實施方案中,抗體或其功能片段包括含種系蛋白序列的一個或更多個互補決定區。在一些實施方案中,抗體或其功能片段包括含種系蛋白對的種系蛋白序列的一個或更多個互補決定區。在一些實施方案中,⑶Rl區和⑶R2區包括種系蛋白序列。在一些實施方案中,⑶Rl區和⑶R2區包括種系蛋白對的種系蛋白序列。在一些實施方案中,FR1、 ⑶R1、FR2、⑶R2和FR3區包括種系蛋白序列。在一些實施方案中,FR1、⑶Rl、FR2、⑶R2和 FR3區包括種系蛋白對的種系蛋白序列。在一些實施方案中,FR4區包括JH4重鏈區。在一些實施方案中,FR4區包括Jk 1輕鏈區。在一些實施方案中,FR4區包括J λ 2/3輕鏈區。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區包括具有至少兩種如下特性的種系蛋白對的種系蛋白序列i)以Fab 形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區包括具有至少三種如下特性的種系蛋白對的種系蛋白序列i)以Fab 形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區包括具有至少四種如下特性的種系蛋白對的種系蛋白序列i)以Fab 形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區包括具有至少五種如下特性的種系蛋白對的種系蛋白序列i)以Fab 形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。
在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區包括具有如下特性的種系蛋白對的種系蛋白序列i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與 M0R03080相比至少0.4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區基本上由具有一種或更多種如下特性的種系蛋白對的種系蛋白序列組成i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在 37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,抗體或其功能片段基本上由包括一種或更多種如下特性的種系蛋白對的種系蛋白序列組成i)以Fab形式的相對展示率包括在采樣的前75%Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab 形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述構架區由具有一種或更多種如下特性的種系蛋白對的種系蛋白序列組成 i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在 37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,抗體或其功能片段由包括一種或更多種如下特性的種系蛋白對的種系蛋白序列組成i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii) 與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在 60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和 vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,這些集合的大多數或基本上全部的抗體或其功能片段包括具有一種或更多種如下特性的種系蛋白對的種系蛋白序列i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以 Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些方面,集合的抗體或其功能片段包括具有一種或更多種如下特性的種系蛋白對的種系蛋白序列i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii) 與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在 60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和 vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,抗體或其功能片段基本上由包括如下特性的種系蛋白對的種系蛋白序列組成i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以 IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,抗體或其功能片段由包括如下特性的種系蛋白對的種系蛋白序列組成i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以 IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述可變重鏈構架區和可變輕鏈構架區包括種系蛋白對的種系蛋白序列,其中所述種系蛋白對包括如下特性i)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;和ii)以IgG形式在37°C持續十四天的在血清中的穩定性。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述可變重鏈構架區和可變輕鏈構架區包括種系蛋白對的種系蛋白序列,其中所述種系蛋白對包括如下特性i)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;ii)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;iii)以IgG 形式在37°C持續十四天的在血清中的穩定性。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述可變重鏈構架區和可變輕鏈構架區包括種系蛋白對的種系蛋白序列,其中所述種系蛋白對包括如下特性i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iii)以Fab形式在 37°C持續大于十天的在牛血清或小鼠血清中的穩定性;和iv)以IgG形式在37°C持續十四天的在血清中的穩定性。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述可變重鏈構架區和可變輕鏈構架區包括種系蛋白對的種系蛋白序列,其中所述種系蛋白對包括如下特性i)與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;ii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iii)以Fab 形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;iv)與M0R03080相比至少
420. 4的以IgG形式的表達水平;和ν)以IgG形式在37°C持續十四天的在血清中的穩定性。在其他實施方案中,本發明的集合包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述可變重鏈構架區和可變輕鏈構架區包括種系蛋白對的種系蛋白序列,其中所述種系蛋白對包括如下特性i)以Fab形式在60°C或更高溫度持續至少 45分鐘的熱穩定性;ii)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;iii)與M0R03080相比至少0.4的以IgG形式的表達水平;和iv)以IgG形式在37°C持續十四天的在血清中的穩定性。在其他實施方案中,本發明的集合和/或生產這些集合的方法包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括含如下以Fab形式的相對展示率的種系蛋白對的種系蛋白序列相比于對照至少0. 1 ;相比于對照至少0. 2 ;相比于對照至少0. 3 ;相比于對照至少0. 4 ;相比于對照至少0. 5 ;相比于對照至少0. 6 ;相比于對照至少0. 7 ;相比于對照至少0. 8 ;相比于對照至少0. 9 ;相比于對照至少1. 0 ;相比于對照至少1. 1 ;相比于對照至少1. 2 ;相比于對照至少1. 3 ;相比于對照至少1. 4 ;相比于對照至少1. 5 ;相比于對照至少1. 6 ;相比于對照至少1. 7 ;相比于對照至少1. 8 ;相比于對照至少1. 9 ;相比于對照至少2. 0 ;相比于對照至少2. 1 ;相比于對照至少2. 2 ;相比于對照至少2. 3 ;相比于對照至少2. 4 ;相比于對照至少2. 5 ;相比于對照至少2. 6 ;相比于對照至少2. 7 ;相比于對照至少2. 8 ;相比于對照至少2. 9 ;相比于對照至少3. 0 ;相比于對照至少3. 2 ;相比于對照至少3. 3 ;相比于對照至少3. 4 ;相比于對照至少3. 5 ;相比于對照至少3. 6 ;相比于對照至少3. 7 ;相比于對照至少3. 8 ;相比于對照至少4. 1 ;相比于對照至少4. 3 ;相比于對照至少4. 4 ;相比于對照至少4. 5 ;相比于對照至少4. 6 ;相比于對照至少4. 7 ;相比于對照至少5. 0 ;相比于對照至少5. 1 ;相比于對照至少5. 2 ;相比于對照至少5. 4 ;相比于對照至少5. 5 ;相比于對照至少5. 7 ;相比于對照至少5. 9 ;相比于對照至少6. 0 ;相比于對照至少6. 1 ;相比于對照至少6. 3 ;相比于對照至少6. 4 ;相比于對照至少6. 7 ;相比于對照至少6. 9 ;相比于對照至少7. 0 ;相比于對照至少7. 1 ;相比于對照至少7. 2 ;相比于對照至少7. 3 ;相比于對照至少7. 4 ;相比于對照至少8. 1 ;相比于對照至少8. 2 ;相比于對照至少8. 3 ;相比于對照至少8. 4 ;相比于對照至少8. 5 ;相比于對照至少8. 6 ;相比于對照至少8. 7 ;相比于對照至少8. 8 ;相比于對照至少8. 9 ;相比于對照至少9. 1 ;相比于對照至少9. 2 ;相比于對照至少9. 3 ;相比于對照至少9. 4 ;相比于對照至少
9.5 ;相比于對照至少9. 7 ;相比于對照至少9. 8 ;相比于對照至少10. 0 ;相比于對照至少
10.2 ;相比于對照至少10. 3 ;相比于對照至少10. 5 ;相比于對照至少10. 6 ;相比于對照至少10. 7 ;相比于對照至少10. 8 ;相比于對照至少11. 0 ;相比于對照至少11. 2 ;相比于對照至少11. 3 ;相比于對照至少11. 5 ;相比于對照至少11. 7 ;相比于對照至少11. 8 ;相比于對照至少12. 1 ;相比于對照至少12. 3 ;相比于對照至少12. 4 ;相比于對照至少12. 9 ;相比于對照至少13. 0 ;相比于對照至少13. 6 ;相比于對照至少14. 4 ;相比于對照至少14. 5 ;相比于對照至少16. 1 ;相比于對照至少16. 6 ;相比于對照至少16. 7 ;相比于對照至少17. 1 ;相比于對照至少19. 4 ;相比于對照至少27. 3 ;或相比于對照至少29. 0。在一些實施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構架區,其中所述可變重鏈構架區和可變輕鏈構架區包括種系蛋白對的種系蛋白序列,其中所述種系蛋白對包括含如下值的以Fab形式的相對展示率采樣的前10% Fab中的值;采樣的前15% Fab中的值;采樣的前20% Fab中的值;采樣的前25% Fab中的值;采樣的前30% Fab中的值;采樣的前35% Fab中的值;采樣的前40% Fab中的值;采樣的前45% Fab中的值;采樣的前50% Fab中的值;采樣的前55% Fab中的值;采樣的前60% Fab中的值;采樣的前65% Fab中的值;采樣的前70% Fab中的值;采樣的前75% Fab中的值;采樣的前 80% Fab中的值;采樣的前85% Fab中的值;或采樣的前90% Fab中的值。在其他實施方案中,本發明的集合和/或生產這些集合的方法包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括種系蛋白對的種系蛋白序列, 所述種系蛋白對的種系蛋白序列包括如下值的以Fab形式的相對表達水平相比于Fab VH1-69VLA_V11-40AYA 至少 0. 1 ;相比于 Fab VH1-69VLA_V11_40AYA 至少 0. 2 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 3 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 4 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 5 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 6 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 7 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 8 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 9 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 1. 0 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 1. 1 ;相比于 Fab VH1-69VLA_V11_40AYA 至少 1. 2 ;或相比于 Fab VH1-69VLA_V11-40AYA 至少 1. 3。在其他實施方案中,本發明的集合和/或生產這些集合的方法包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括種系蛋白對的種系蛋白序列, 所述種系蛋白對的種系蛋白序列包括以Fab形式在70°C或更高溫度持續至少45分鐘的熱穩定性;或包括以Fab形式在80°C或更高溫度持續至少45分鐘的熱穩定性。在其他實施方案中,本發明的集合和/或生產這些集合的方法包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括種系蛋白對的種系蛋白序列,所述種系蛋白對的種系蛋白序列包括如下值的以IgG形式的相對表達水平相比于 M0R03080至少0. 1 ;相比于M0R03080至少0. 2 ;相比于M0R03080至少0. 3 ;相比于M0R03080 至少0. 4 ;相比于M0R03080至少0. 5 ;相比于M0R03080至少0. 6 ;相比于M0R03080至少0. 7 ; 相比于M0R03080至少0. 8 ;相比于M0R03080至少0. 9 ;相比于M0R03080至少1. 0 ;相比于 M0R03080至少1. 1 ;相比于M0R03080至少1. 2 ;相比于M0R03080至少1. 3 ;相比于M0R03080 至少1. 4 ;相比于M0R03080至少1. 5 ;相比于M0R03080至少1. 6 ;相比于M0R03080至少1. 7 ; 相比于M0R03080至少1. 8 ;相比于M0R03080至少1. 9。在某些方面,本發明包括集合以及生產或使用含抗體或其功能片段的集合的方法,所述抗體或其功能片段包括含種系蛋白序列、基本上的種系蛋白序列或源自于種系蛋白序列的序列的一個或更多個互補決定區。在某些實施方案中,抗體或其功能片段包括含種系蛋白序列的CDRl和CDR2。在某些實施方案中,抗體或其功能片段包括含種系蛋白對的種系蛋白序列的⑶Rl和⑶R2。在一些方面,一個或更多個構架區包括種系蛋白對的種系蛋白序列。如在一些方面,?1 4選自由朋、1^1和入2/3組成的組。如圖45A-47B所示,種系蛋白序列只包括 FR1-FR3。因此在某些方面,當所述可變重鏈構架區和可變輕鏈構架區包括種系蛋白序列時,FR1、FR2和/或FR3包括種系蛋白序列。在一些方面,一個或更多個構架區包括種系蛋白序列,容許一個或更多個互補決定區的多樣化。在一些實施方案中,本發明包括集合以及生產和制備所述包括多樣化HCDR3區的合成抗體或其功能片段的集合的方法。在一些實施方案中,本發明包括集合以及生產和使用所述包括多樣化LCDR3區的合成抗體或其功能片段的集合的方法。本發明的另外一方面是集合可用于鑒定針對任何免疫原的抗體或其功能片段的能力。根據CDR長度和在構象或規范結構上的多樣性,認為產生具有包括以上功能特性的至少兩個可變重鏈和可變輕鏈種系蛋白對的集合將提供在該集合中的多樣性,尤其是在該集合的抗體的互補決定區中的多樣性。這容許本發明的集合可用于鑒定針對任何免疫原的抗體或其功能片段。本發明的一些實施方案包括如下集合所述集合包括含可變重鏈和可變輕鏈構架區的抗體或其功能片段,其中所述構架區包括具有如下特性的種系蛋白對的種系蛋白序列i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在 37°C持續十四天的在牛血清中的穩定性,其中所述集合包括含如下數目的不同的種系蛋白對的抗體或其功能片段至少兩個不同的種系蛋白對;至少三個不同的種系蛋白對;至少四個不同的種系蛋白對;至少五個不同的種系蛋白對;至少六個不同的種系蛋白對;至少七個不同的種系蛋白對;至少八個不同的種系蛋白對;至少九個不同的種系蛋白對;至少十個不同的種系蛋白對;至少十一個不同的種系蛋白對;至少十二個不同的種系蛋白對; 至少十三個不同的種系蛋白對;至少十四個不同的種系蛋白對;至少十五個不同的種系蛋白對;至少十六個不同的種系蛋白對;至少十七個不同的種系蛋白對;至少十八個不同的種系蛋白對;至少十九個不同的種系蛋白對;至少二十個不同的種系蛋白對;至少21個不同的種系蛋白對;至少22個不同的種系蛋白對;至少23個不同的種系蛋白對;至少24個不同的種系蛋白對;至少25個不同的種系蛋白對;至少26個不同的種系蛋白對;至少27個不同的種系蛋白對;至少28種不同的可變重鏈種系蛋白;至少29個不同的種系蛋白對序列;至少30個不同的種系蛋白對;至少31個不同的種系蛋白對;至少32個不同的種系蛋白對;至少33個不同的種系蛋白對;至少34個不同的種系蛋白對;至少35個不同的種系蛋白對;至少36個不同的種系蛋白對;至少37個不同的種系蛋白對;至少38個不同的種系蛋白對;至少39個不同的種系蛋白對;至少40個不同的種系蛋白對;至少41個不同的種系蛋白對;至少42個不同的種系蛋白對;至少43個不同的種系蛋白對;至少44種不同的可變重鏈種系蛋白;至少45個不同的種系蛋白對序列;至少46個不同的種系蛋白對;至少47個不同的種系蛋白對;至少48個不同的種系蛋白對;至少49個不同的種系蛋白對或至少50個不同的種系蛋白對。包含種系基因序列的抗體或其功能片段另外,認為利用種系蛋白序列將降低抗體在施用至患者時的免疫原性風險。因此, 本發明的方面包括集合以及生產和使用含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的所述集合的方法,其中所述構架區包括種系蛋白序列。在一些實施方案中,抗體或其功能片段的可變重鏈和可變輕鏈構架區包括基本上的種系序列。在一些實施方案中,抗體或其功能片段的可變重鏈和可變輕鏈構架區源自于種系序列。在一些實施方案中,所述抗體或其功能片段包括含種系蛋白序列、基本上的種系序列或源自于種系蛋白序列的FR1、FR2、FR3和FR4區。在某些實施方案中,所述抗體或其功能片段包括含代表性種系蛋白對的種系蛋白序列的FR1、FR2、FR3。在一些實施方案中,使用的FR4區是可變重鏈的JH4,可變κ輕鏈的J κ 1和可變λ輕鏈的J λ 2/3。又因為利用種系蛋白序列將降低抗體在患者中施用時的免疫原性風險,所以本發明的某些方面包括集合以及生產或使用包含一個或更多個互補決定區的抗體或其功能片段的集合的方法,所述一個或更多個互補決定區包括種系蛋白序列、基本上的種系序列或源自于種系蛋白序列。在某些實施方案中,抗體或其功能片段包括含種系蛋白序列的CDRl 和CDR2。在某些實施方案中,抗體或其功能片段包括含種系蛋白對的種系蛋白序列的CDRl 和 CDR2。在一些方面,一個或更多個構架區包括種系蛋白序列,容許一個或更多個互補決定區的多樣化。在一些實施方案中,本發明包括集合以及生產和制備所述包括多樣化HCDR3 區的合成抗體或其功能片段的集合的方法。在一些實施方案中,本發明包括集合以及生產和使用所述包括多樣化LCDR3區的合成抗體或其功能片段的集合的方法。CDR可通過本領域公知的方法設計,包括那些公開在Knappik等人2000 ;WO 97/08320 ;W02008053275 ; W02009036379 ;W02007056441 ;W02009114815中的方法,這些文獻全部通過引用整體并入。另外,為了產生包含具有低免疫原性風險的抗體或其功能片段的集合,在某些方面,本發明的集合以及生產和使用這些集合的方法包括含人序列的抗體或其功能片段。在一些方面,本發明的集合包括至少IXlO4;至少IXlO5;至少IXlO6;至少 IX IO7;至少IX IO8;至少IX IO9;至少IX IOltl;或至少IX IO11種編碼抗體或其功能片段的核酸序列或者抗體或其功能片段。在一些方面,集合的抗體或其功能片段是合成的。在一些方面,集合包括編碼抗體或其功能片段的核酸。本發明另外的實施方案在一些方面,本發明包括含可變重鏈和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述可變重鏈構架區和可變輕鏈構架區包括種系蛋白對的種系蛋白序列,其中所述種系蛋白對包含如下特性i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;禾口vi)以IgG形式在37°C持續十四天的在血清中的穩定性;其中所述抗體或其功能片段的集合包括至少兩個不同的種系蛋白對的種系蛋白序列,且其中所述種系蛋白對由種系基因對編碼。在一些實施方案中,本發明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構架區基本上由包括如下特性的種系蛋白對的種系蛋白序列組成i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;
46
iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;禾口vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,本發明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構架區由包括如下特性的種系蛋白對的種系蛋白序列組成i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。在一些實施方案中,所述種系基因對以至少0.05%的濃度存在于人免疫組庫中。 在一些實施方案中,所述種系基因對以至少0. 23%的濃度存在于人免疫組庫中。在一些實施方案中,所述種系基因對以至少0. 51 %的濃度存在于人免疫組庫中。在一些實施方案中, 所述種系基因對以至少0.07%的濃度存在于幼稚的人免疫組庫中。在一些實施方案中,所述種系基因對以至少0.52%的濃度存在于幼稚的人免疫組庫中。在一些實施方案中,所述種系基因對以至少0.88%的濃度存在于幼稚的人免疫組庫中。在一些實施方案中,所述抗體或其功能片段包括人序列。在一些實施方案中,所述抗體或其功能片段的集合包括至少十七個不同的種系蛋白對的種系蛋白序列。在一些實施方案中,所述抗體或其功能片段包括含種系蛋白序列的一個或更多個互補決定區。在一些實施方案中,所述抗體或其功能片段包括含種系蛋白序列的FR1、CDR1、 FR2、CDR2和FR3區。在一些實施方案中,所述抗體或其功能片段包括選自由以下組成的組的FR4區JH4、Jk 1和JX 2/3。在一些實施方案中,所述抗體或其功能片段包括多樣化的 HCDR3區。在一些實施方案中,所述抗體或其功能片段包括多樣化的IXDR3區。在一些實施方案中,集合包括IXlO4種抗體或其功能片段。在一些實施方案中, 所述種系蛋白對包括含在采樣的前60% Fab中的值的以Fab形式的相對展示率。在一些實施方案中,所述種系蛋白對包括與Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表達水平。在一些實施方案中,所述種系蛋白對包括以Fab形式在70°C或更高溫度持續至少45分鐘的熱穩定性。在一些實施方案中,所述種系蛋白對包括與M0R03080相比至少 0.6的以IgG形式的表達水平。在一些實施方案中,可變重鏈和可變輕鏈構架區包括選自由以下組成的組的種系蛋白對的種系蛋白序列IGHV3-23/IGKVl-5 ; IGHV3-23/IGKV3-20 ;IGHV4-39/ IGKV3-15 ; IGHV3-23/IGKV3-15 ; IGHV4-39/IGKV1-39/1D-39 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ; IGHV1-69/IGKV1-39/1D-39 ;IGHV5-51/ IGLV1-40 ; IGHV4-39/IGKV3-20 ; IGHV3-23/IGLV 2-14 ;IGHV4-39/IGLV 3-21 ;IGHV3-23/ IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ;IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/IGKV3-20 ;IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV5-51/IGKV3-20 ; IGHV3-7/IGKV1-39/1D-39 ;IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ; ighv3-23/igkv3-11 ;ighv3-30/igkv1-5 ;ighv3-30/igkv3-15 ;ighv3-21/igkv1-5 ; ighv3-21/igkv3-15 ; ighv3-30/iglv 1-51 ;ighv3-21/iglv 1-51 ;和 ighv1-69/igkv3-11。在一些實施方案中,所述抗體的所述功能片段選自由Fab、F (ab' ) 2、Fab,、Fv和 scFv組成的組。在一些方面,本發明包括編碼公開的抗體集合的核酸的集合。在一些方面,本發明包括含編碼公開的抗體集合的核酸的載體。在一些方面,本發明包括含編碼公開的抗體集合的核酸的重組宿主細胞。在一些實施方案中,重組宿主細胞是原核的或真核的。在一些實施方案中,重組宿主細胞是大腸桿菌或哺乳動物細胞。在一些方面,本發明包括含可變重鏈構架區和可變輕鏈構架區的合成抗體或其功能片段的集合,其中所述構架區包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i)在互補決定區中四個或更少的翻譯后修飾;ii)在互補決定區中兩個或更少的甲硫氨酸;iii) 一個或更少的未成對半胱氨酸;iv) 一個或更少的潛在t細胞表位;ν)中等或低的聚集傾向;和vi)至少7.5的等電點;且其中所述抗體或其功能片段的集合包括至少兩種不同的可變重鏈種系蛋白序列,其中所述種系蛋白序列由種系基因序列編碼。在一些實施方案中,所述可變重鏈或可變輕鏈種系基因序列以至少0. 5%的濃度存在于人免疫組庫中。在一些實施方案中,所述抗體或其功能片段的集合包括至少五種不同的可變重鏈種系蛋白序列。在一些實施方案中,所述抗體或其功能片段包括人序列。在一些實施方案中,所述可變重鏈或可變輕鏈種系基因序列以至少5. 0%的濃度存在于人免疫組庫中。在一些實施方案中,所述抗體或其功能片段包括含種系蛋白序列的一個或更多個互補決定區。在一些實施方案中,所述抗體或其功能片段包括含種系蛋白序列的fr1、cdr1、 fr2、cdr2和fr3。在一些實施方案中,所述抗體或其功能片段包括選自由以下組成的組的 fr4區jh4、jk 1和jx 2/3。在一些實施方案中,所述抗體或其功能片段還包括多樣化的 hcdr3區。在一些實施方案中,所述抗體或其功能片段還包括多樣化的ixdr3區。在一些實施方案中,集合包括1 x io4種抗體或其功能片段。在一些實施方案中,所述可變重鏈種系蛋白序列選自由以下組成的組ighv3_23 ; ighv3-30 ; ighv4-39 ; ighv4-34 ; ighv4-59 ;ighv1-69 ; ighv5-51 ; ighv3-7 ;ighv1-18 ; ighv3-48 ;ighv3-15 ; ighv3-21 ; ighv1-2 ; ighv3-33 ; ighv4-31 ; ighv3-53 ; ighv3-11 ; ighv3-9 ; ighv4-4 ; ighv1-46 ; ighv3-74 ; ighv1-24 ; ighv4-61 ; ighv1-8 ; ighv1-3 ; ighv3-49 ; ighv3-43 ; ighv4-28 ; ighv3-64 ;和 ighv7-81。在一些實施方案中,所述可變κ輕鏈種系蛋白序列選自由以下組成的組 igkv3-20 ; igkv1-39/1d-39 ; igkv1-5 ; igkv3-15 ; igkv4-1 ; igkv3-11 ; igkv2-28/2d-28 ; igkv1-33/1d-33 ;igkv2-30 ; igkv1-9 ;igkv1-17 ; igkv1-27 ; igkv1-8 ;igkv1-16 ; igkv1-6 ; igkv1-12 ; igkv2d-29 ;igkv1-13 ; igkv1d-8 ;和 igkv2-24。
在一些實施方案中,所述可變λ輕鏈種系蛋白序列選自由以下組成的組 IGLV2-14 ; IGLV1-40 ;IGLV1-44 ;IGLV卜51 ; IGLV2-23 ;IGLV3-21 ;IGLV1-47 ;IGLV3-1 ; IGLV2-11 ; IGLV2-8 ; IGLV6-57 ; IGLV3-25 ; IGLV7-46 ;IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;和 IGLV3-27。在一些方面,本發明包括生產公開的合成抗體或其功能片段的集合的方法。在一些實施方案中,生產步驟還包括產生含可變重鏈和可變輕鏈構架區的抗體或其功能片段的
皇A 朱η j其中所述可變重鏈構架區和可變輕鏈構架區包含種系蛋白對的種系蛋白序列,其中所述種系蛋白對包含如下特性i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性;且其中所述抗體或其功能片段的集合包括至少兩個不同的種系蛋白對。在一些實施方案中,生產步驟還包括如下步驟a)獲得包括在人免疫組庫中存在的可變重鏈和可變輕鏈種系基因對的數據;b)鑒定包含如下特性的可變重鏈和可變輕鏈種系蛋白對i)以Fab形式的相對展示率包括在采樣的前75% Fab中的值;ii)與 Fab pMxll_FH VH1-69VLA_V11_40AYA相比至少 0. 4 的以 Fab 形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)與M0R3080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性;和c)產生包含在步驟b)中鑒定的種系蛋白對的可變重鏈種系蛋白序列和可變輕鏈種系蛋白序列的抗體或其功能片段的集合。在一些實施方案中,步驟b)還包括如下步驟ba)鑒定以至少0.05%的濃度存在于人免疫組庫中的可變重鏈和可變輕鏈種系基因對;bb)產生包含在步驟ba)中鑒定的種系蛋白對的抗體或其功能片段;和be)評估所述種系蛋白對的如下特性i)以Fab形式的相對展示率;ii)以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性;ν)以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。
49
在一些實施方案中,步驟a)還包括如下步驟aa)從樣品中分離人B細胞;ab)從所述B細胞產生cDNA ;ac) PCR擴增來自B細胞的cDNA ;ad)對所述PCR產物測序;ae)鑒定每種PCR產物的種系基因。在一些實施方案中,產生集合的步驟還包括如下步驟ca)合成編碼所述抗體或其功能片段的核酸;cb)將所述核酸克隆到載體中;cc)表達所述抗體或其功能片段。在一些實施方案中,所述種系基因對以至少0.05%的濃度存在于人免疫組庫中。 在一些實施方案中,所述種系基因對以至少0. 23%的濃度存在于人免疫組庫中。在一些實施方案中,所述種系基因對以至少0. 51 %的濃度存在于人免疫組庫中。在一些實施方案中, 所述種系基因對以至少0.07%的濃度存在于幼稚的人免疫組庫中。在一些實施方案中,所述種系基因對以至少0.52%的濃度存在于幼稚的人免疫組庫中。在一些實施方案中,所述種系基因對以至少0.88%的濃度存在于幼稚的人免疫組庫中。在一些實施方案中,所述抗體或其功能片段包括人序列。在一些實施方案中,所述抗體或其功能片段包括至少十七個不同的種系蛋白對的種系蛋白序列。在一些實施方案中,所述抗體或其功能片段包括含種系蛋白序列的一個或更多個互補決定區。在一些實施方案中,所述抗體或其功能片段包括含種系蛋白序列的FR1、CDRU FR2、CDR2和FR3。在一些實施方案中,所述抗體或其功能片段包括選自由以下組成的組的FR4區JH4、JK 1和JX2/3。在一些實施方案中,所述抗體或其功能片段包括多樣化的 HCDR3區。在一些實施方案中,所述抗體或其功能片段包括多樣化的IXDR3區。在一些實施方案中,集合包括1 X IO4種抗體或其功能片段。在一些實施方案中,所述種系蛋白對包括含在采樣的前60% Fab中的值的以Fab 形式的相對展示。在一些實施方案中,所述種系蛋白對包括與Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表達水平。在一些實施方案中,所述種系蛋白對包括以Fab形式在70°C或更高溫度持續至少45分鐘的熱穩定性。在一些實施方案中,所述種系蛋白對包括與M0R03080相比至少0. 6的以IgG形式的表達水平。在一些實施方案中,可變重鏈和可變輕鏈構架區包括選自由以下組成的組的種系蛋白對的種系蛋白序列IGHV3-23/IGKVl-5 ;IGHV3-23/IGKV3-20 ;IGHV4-39/IGKV3-15 ; IGHV3-23/IGKV3-15 ; IGHV4-59/IGKV1-39/1D-39 ;IGHV4-39/IGKV1-39/1D-39 ;IGHV4-59/ IGKV3-20 ;IGHV1-18/IGKV3-20 ;IGHV3-30/IGKV3-20 ;IGHV4-39/IGKV1-5 ;IGHV1-69/ IGKV1-39/1D-39 ; IGHV5-51/IGLV1-40 ; IGHV3-23/IGKV4-1 ; IGHV4-39/IGKV3-20 ; IGHV3-23/IGLV 2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/ IGKV1-39/1D-39 ; IGHV3-30/IGKV3-11 ; IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/IGKV3-20 ;IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV4-59/IGKV4-1 ; IGHV5-51/IGKV3-20 ; IGHV3-7/IGKV1-39/1D-39 ; IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ; IGHV4-39/IGLV 2-14 ;IGHV4-39/IGLV 2-8 ;IGHV3-23/IGKV3-11;IGHV3-30/IGKV1-5 ;IGHV3-30/IGKV3-15 ;IGHV3-21/IGKV1-5 ;IGHV3-21/IGKV3-15 ;IGHV3-30/IGLV1-51 ; IGHV3-21/IGLV 1-51 ;IGHV3-53/IGLV 1-44 ;IGHV4-59/IGKV3-15 ;IGHV5-51/IGKV4-1 ; IGHV1-69/IGKV4-1 ;和 IGHV1-69/IGKV3-11。在一些方面,所述抗體的所述功能片段選自由Fab、F(ab' ) 2、Fab,、Fv和scFv組成的組。在一些方面,本發明包括編碼含C端限制酶切位點的信號序列或前導序列的分離的核酸。在一些實施方案中,限制酶切位點是NheI。在一些實施方案中,信號序列或前導序列包括PhoA或人重鏈前導序列。在一些實施方案中,限制酶切位點是NdeI。在一些實施方案中,信號序列包括ompA或人κ前導序列。在一些方面,本發明包括含如下核酸的載體所述核酸編碼含C端限制酶切位點的信號序列或前導序列。在一些方面,本發明包括含所述載體的宿主細胞。在一些實施方案中,宿主細胞是原核的或真核的。在一些實施方案中,宿主細胞是大腸桿菌。在一些實施方案中,宿主細胞是哺乳動物細胞。在一些方面,本發明包括含FRl、OTRl、FR2、raR2和FR3的分離的抗體或其功能片段,所述FRl、OTRl、FR2、raR2和FR3包含種系蛋白對的種系蛋白序列,其中所述種系蛋白對選自由以下組成的組IGHV3-23/IGKV1-5 ; IGHV3-23/IGKV3-20 ; IGHV4-39/IGKV3-15 ; IGHV3-23/ IGKV3-15 ; IGHV4-39/IGKV1-39/1D-39 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ;IGHV1-69/IGKV1-39/1D-39 ;IGHV5-51/IGLV 1-40 ;IGHV4-39/ IGKV3-20 ; IGHV3-23/IGLV 2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/ IGKV3-20 ; IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV5-51/IGKV3-20 ;IGHV3-7/ IGKV1-39/1D-39 ;IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ;IGHV3-23/ IGKV3-11 ;IGHV3-30/IGKV1-5 ;IGHV3-30/IGKV3-15 ;IGHV3-21/IGKV1-5 ;IGHV3-21/ IGKV3-15 ; IGHV3-30/IGLV 1-51 ;IGHV3-21/IGLV 1-51 ;和 IGHV1-69/I。一方面,本公開內容描述了包括含可變重鏈和輕鏈構架區(具體是FRl)的抗體的集合,所述可變重鏈和輕鏈構架區包含種系序列。預期具有種系構架區將降低抗體在施用至患者時的免疫原性風險。然而,必須使用限制酶切位點以使得能將編碼抗體集合的核酸標準地克隆到展示載體和/或表達載體中,以便可針對免疫原篩選抗體。過去,用于克隆的限制酶切位點通常位于構架區內,從而修飾核酸序列遠離種系。為了確保本公開內容的每種抗體的至少構架I(FRl)區保持種系序列,在FRl內應該沒有任何非天然存在的限制酶切位點。因此,本公開內容的一個方面是在原核信號序列和人前導序列的C端內具體是在三個C端殘基內摻入限制酶切位點。另外,包含限制酶切位點的信號序列和前導序列必須是有功能的并且容許抗體或其片段在原核和哺乳動物表達系統中均有良好的展示和表達水平。在一些方面,本發明包括編碼含C端限制酶切位點的信號序列或前導序列的分離的核酸。在一些實施方案中,限制酶切位點是NheI或NdeI。在一些實施方案中,信號序列或前導序列包括PhoA或人重鏈前導序列。在一些實施方案中,信號序列或前導序列包括 ompA或人κ前導序列。在一些方面,本發明包括含如下分離的核酸的載體所述分離的核酸編碼含C端限制酶切位點的信號序列或前導序列。在一些方面,本發明包括含編碼具有 C端限制酶切位點的信號序列或前導序列的分離的核酸的宿主細胞或含編碼具有C端限制酶切位點的信號序列或前導序列的分離的核酸的載體。在一些實施方案中,相應的宿主細胞是原核的,例如大腸桿菌,或是真核的,例如哺乳動物細胞。本公開內容第一次公開如下概念在幼稚的人免疫組庫中最普遍的VH和VL類對可能具有優選的特征,如更大的穩定性和更低的免疫原性。本公開內容還第一次將這種概念引入集合設計中并且利用全基因合成來產生這些集合。本公開內容使得鑒定幼稚的和經歷抗原的人免疫組庫中的VH和VL類對、確定最普遍的VH和VL類對并然后產生包含這些 VH和VL類對的集合的方法成為可能。更具體而言,本公開內容的集合包括具有高度多樣化的CDR的最普遍的和/或最優選的VH和VL類配對。這種策略提高了集合包括穩定的、具有低免疫原性和對特定抗原的高親和力的針對任何免疫原的抗體或其片段的概率。該結果極大地提高了集合包括可用于治療或診斷目的的針對任何免疫原的高度有效的抗體或其片段的概率。因此,可對從人宿主的幼稚B細胞獲得的編碼抗體或其片段的核酸序列(或其選定部分)進行測序。從這些序列數據,可鑒定在免疫組庫中代表性的種系家族VH/VL鏈類配對。基于某些指標如普遍性(prevalence)和/或有利的生物物理特性,選擇重鏈和輕鏈類對摻入集合中。然后可通過基因合成來合成集合。在一些實施方案中,合成的集合包括基本上的種系VH和VL構架區,其中CDR是多樣化的,或者VH和/或VL僅一個CDR是多樣化的。使用從人宿主的幼稚B細胞獲得的DNA序列作為“模板”,本公開內容使得鑒定最普遍的VH和VL對的方法成為可能。一旦闡明VH和VL類對的相對豐度,就可以產生包含最普遍的和/或最優選的VH和VL類對的抗體或其片段的高度多樣的集合。利用這種信息, 技術人員能夠產生高度的多樣性而不犧牲可歸因于最普遍的和/或最優選的VH和VL類對組合的關鍵益處。在本公開內容之前,沒有人闡釋最普遍的和/或最優選的VH和VL類對或嘗試將該知識應用到文庫產生技術中。因此,這種方法提供了編碼代表幼稚的人免疫系統的抗體或其片段的核酸的全面的集合。利用本文公開的集合設計和展示方法,可產生大多樣性的集合,因為一些實施方案包括至少IX101°種成員的集合。在一些方面,本公開內容使得包含公開的核酸集合的載體和宿主細胞成為可能。在一些方面,本公開內容使得生產這些集合的方法成為可能。在一些實施方案中,在單獨步驟中獲得代表人免疫組庫的幼稚DNA序列,并將其儲存在數據庫中;因此集合設計可經由計算機模擬被容易地改變、優化和定制,容許通常可在合成文庫中實現的定制水平。在一些方面,本公開內容使得利用所公開的集合鑒定抗體或其片段的方法成為可能。在一些方面,本發明涉及編碼抗體或其片段的集合或文庫,所述抗體或其片段包含由免疫組庫中豐富和/或優選的VH和VL種系家族和/或基因編碼的種系蛋白序列。在一些實施方案中,編碼抗體或其片段的核酸是種系、基本上的種系或其密碼子優化的變體。這些集合或文庫可包括具有有利的生物物理特性的VH和VL種系家族和/或基因,所述有利的生物物理特性包括在噬菌體上的高度展示;以Fab形式在大腸桿菌中的高表達;以IgG 形式在哺乳動物細胞中的高表達;高熱穩定性;血清穩定性;低聚集傾向(即,高溶解性); 和低免疫原性風險。在一些實施方案中,集合或文庫可包括存在于幼稚的人免疫組庫中的 VH和VL種系家族和/或基因。相關的實施方案包括制備和使用這些集合的方法。在一些方面,本發明涉及編碼抗體或其片段的集合或文庫,所述抗體或其片段包含由免疫組庫中豐富和/或優選的VH和VL種系家族和/或基因以及免疫組庫中豐富和/ 或優選的VH/VL類對編碼的種系蛋白序列。在一些實施方案中,編碼抗體或其片段的核酸是種系、基本上的種系或其密碼子優化的變體。這些集合或文庫可包括由具有有利的生物物理特性的VH和VL種系家族和/或基因和/或VH/VL類對編碼的種系蛋白序列,所述有利的生物物理特性包括在噬菌體上的高度展示;以Fab形式在大腸桿菌中的高表達;以IgG 形式在哺乳動物細胞中的高表達;高熱穩定性;血清穩定性;低聚集傾向(即,高溶解性); 和低免疫原性風險。在一些實施方案中,集合或文庫可包括由存在于幼稚的人免疫組庫的 VH和VL種系家族和/或基因和/或VH/VL類對編碼的種系蛋白序列。相關的實施方案包括制備和使用這些集合的方法。因此,本發明包括編碼基本上代表免疫組庫的抗體或其片段的核酸的集合,其中每種抗體或其片段包括VH/VL類對,其中基本上代表免疫組庫是使得該集合中存在的每個 VH/VL類對為在免疫組庫中以至少0. 05%、至少1 %或至少2%的VH/VL類對的濃度存在的 VH/VL類對。免疫組庫可以是個體或群體,并且可以是幼稚的。這種免疫組庫可被測定為如下VH/VL類對的免疫組庫,例如在來自個體的至少IX IO5個B細胞中的VH/VL類對;在來自多個個體的群體的至少1 X IO5個B細胞中的VH/VL類對;或存在于至少1 X IO5種抗體中的VH/VL類對。免疫組庫可以是幼稚B細胞或經歷抗原的B細胞的免疫組庫。個體或群體可以是人。免疫組庫可通過分析公開可用的數據庫和/或文獻來確定。在一些實施方案中,編碼抗體或其片段的核酸是合成的,如通過全基因合成而產生。在相關的實施方案中,核酸是種系序列;基本上的種系序列;或是種系或基本上的種系序列的密碼子優化的變體。在一些實施方案中,CDR中至少一個是高度多樣化的。在一些實施方案中,本公開內容的集合包括抗體或其片段,其中VH和VL 二者的 FRl、FR2和FR3包括具有優選特征的VH和VL類對的種系蛋白序列。最優選地,本公開內容的集合包括抗體或其片段,其中VH和VL 二者的FR1、FR2和FR3包括具有優選特征的VH 和VL類對的種系蛋白序列,其中VH和VL 二者的CDR3是高度多樣化的。在相關的實施方案中,所述編碼抗體或其片段的核酸的集合被克隆到載體中。適合的載體是本領域已知的,并且包括展示載體如噬菌體展示載體、質粒載體、噬菌粒載體、 包括細菌表達載體或哺乳動物表達載體的表達載體。在另外的相關實施方案中,集合或克隆到載體中的集合被轉化到宿主細胞中。因此,本發明包括宿主細胞的集合。適合的宿主細胞包括原核宿主細胞(如大腸桿菌)和真核宿主細胞(如哺乳動物宿主細胞)。在另一實施方案中,本發明是包含來自約1345個幼稚的人B細胞或來自可讀介質上的公開可用的序列的VH/VL類對的數據庫。這種數據庫可用于本發明的集合和文庫的設計和構建。本發明還包括生產編碼基本上代表免疫組庫的抗體或其片段的核酸的集合的方法。免疫組庫可以是一人或多人的幼稚B細胞或經歷抗原的B細胞的免疫組庫。這種方法可包括如下步驟(a)鑒定以至少0. 05%、至少或至少2%的VH/VL類對的濃度在免疫組庫中存在的VH/VL類對;(b)合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%、至少1 %或至少2%的VH/VL類對的濃度在免疫組庫中存在的VH/VL 類對。該鑒定步驟可以不同方式進行。例如,鑒定VH/VL類對可包括從一個或多個人宿主中分離幼稚B細胞,并且通過分離并測序編碼VH/VL類對的DNA、mRNA或cDNA或通過用對每個VH和VL特異的一種或多種核酸探針探測來確定每個B細胞中的VH/VL類對,然后分析VH/VL類對。在可選的或補充的實施方案中,VH/VL類對可以從預先存在的數據庫如抗體序列數據庫中確定。在可選的或補充的實施方案中,VH/VL類對可以從文獻鑒定。因而, 在一個實施方案中,本發明包括獲得抗體核酸序列(預先存在的或重新產生的抗體核酸序列),通過序列比對確定VH/VL類對,并且核對這些序列以鑒定免疫組庫中存在的VH/VL類對。在一些實施方案中,使用所述方法來產生其中大多數成員具有促進抗體或其片段的生產和表達(例如在噬菌體上或從細胞)的有利的生物物理特性的集合,并且生產可溶的、熱穩定的抗體。更具體地說,這些特性包括(i)有效地展示在噬菌體上;( )有效地展示在哺乳動物細胞上;(iii)以Fab形式很好地表達在大腸桿菌中;(iv)以IgG形式很好地表達在哺乳動物細胞中;(ν)熱穩定性;(vi)可溶性;和(vii)低免疫原性。通過確定具有這些特性中的一些或全部特性的VH/VL類對,人們可以例如通過只合成那些具有這類特性的核酸來構建其中大多數成員具有這些生物物理特性的集合。因此,本發明包括這種集合以及制備這種集合的方法。在一些實施方案中,合成的核酸是種系、基本上的種系或其密碼子優化的變體。可將變異引入至少一個互補決定區(⑶幻中。任何⑶R是合適的,尤其是⑶R3。優選地,添加至⑶R的序列變異限于框內序列并且不含半胱氨酸和終止密碼子,由此確保文庫的所有成員被正確地表達。合成了核酸后,可將其克隆到載體(如展示載體、噬菌體展示載體;噬菌粒載體; 或哺乳動物表達載體)中,并且可將其轉化到宿主細胞中。適合的宿主細胞包括原核宿主細胞(例如大腸桿菌)和真核宿主細胞(例如哺乳動物宿主細胞)。在另外的實施方案中,本發明提供了鑒定對免疫原特異的抗體的方法。在一個實施方案中,這種方法可以包括鑒定以至少0. 05%、至少或至少2%的VH/VL類對的濃度在免疫組庫中存在的VH/VL類對;對編碼包含以至少0. 05%、至少或至少2%的VH/VL 類對的濃度在免疫組庫中存在的VH/VL類對的抗體或其片段的核酸的集合進行合成;展示或表達該集合的抗體或其片段;針對特定免疫原篩選該集合;并且選擇對所述免疫原特異的至少一種抗體或其片段。因為本發明的方法和集合可以按照有利的生物物理特性來構建,所以通過制備編碼具有這些有利特性的抗體或其片段的核酸的集合并針對特定免疫原進行篩選來鑒定結合這種免疫原的抗體,本發明對于鑒定用于治療疾病或病癥的抗體或其抗體片段是特別有用的。在一些方面,本發明涉及包含VH/VL對的抗體或其片段的集合或文庫。在一些實施方案中,抗體或其片段的集合或文庫包含由免疫組庫中豐富的VH和VL種系家族和/或基因編碼的種系蛋白序列。在一些實施方案中,本發明涉及包含由具有某些有利的生物物
54理特征的VH和VL種系家族和/或基因編碼的種系蛋白序列的抗體或其片段的集合或文庫。在一些實施方案中,VH和VL種系家族和/或基因是免疫組庫中天然存在的那些,并且在該文庫中是更豐富的或更普遍的。在一些實施方案中,抗體或其片段的集合或文庫包含由VH和VL種系家族和/或基因編碼的種系蛋白序列。在一些實施方案中,抗體或其片段的集合或文庫包括來自種系、基本上的種系或密碼子優化的VH和VL種系家族和/或基因的構架區和/或CDR區。在一些實施方案中,抗體或其片段的集合或文庫包含由合成的、通過全基因合成而構建的VH和VL種系家族和/或基因編碼的種系蛋白序列。在一些實施方案中,抗體或其片段的集合或文庫包含由合成的、通過全基因合成而構建的VH和VL種系家族和/或基因的部分。在一些實施方案中,抗體或其片段的集合或文庫包括由具有有利的生物物理特性的VH和VL種系家族和/或基因編碼的種系蛋白序列,所述有利的生物物理特性幫助篩選和進一步研發尤其是在治療背景下的抗體。有利的生物物理特性包括但不限于(i)它們以Fab形式被很好地展示在噬菌體上;(ii)它們以IgG形式被很好地展示在哺乳動物細胞上;(iii)它們以Fab形式被大量表達在例如大腸桿菌中,以及以IgG形式被大量表達在例如哺乳動物細胞中;(iv)是熱力學穩定的;(ν)具有高血清穩定性;(vi)具有低聚集傾向(即高可溶性);和(vii)具有低免疫原性風險。在其他方面,本公開內容的集合包括含優選的VH和VL類對的種系蛋白序列的抗體或其片段。本公開內容的集合優選地包括抗體或其片段,其中一個或更多個構架區包括由具有優選的特征的VH和VL類對編碼的種系蛋白序列,特別是其中VH和VL的FR1、FR2 和FR3包括具有優選的特征的VH和VL類對的種系蛋白序列。CDR可以是高度多樣化的。 優選地,VH和VL 二者的⑶R3是高度多樣化的。在一些實施方案中,VH和/或VL的⑶Rl 和CDR2是種系序列或基本上的種系序列。這種策略提高了本公開內容的集合包括能夠被開發用于治療用途的針對任何免疫原的抗體或其片段的概率,因為集合中存在的大多數抗體或其片段包括具有以上優選特征的VH和VL對的種系序列。選擇的抗體還將具有低免疫原性和對特定抗原的高親和力。 該結果極大地提高了從公開的集合選擇的抗體或其片段針對任何免疫原是高效的且可被研發用于治療或診斷目的的概率。這些集合克服了現有技術的許多問題。例如,在源自B細胞的同源文庫中,該文庫存在的VH和VL類配對取決于樣品中存在的類配對。如果取得足夠大的B細胞樣品,大約 50個VH和50個VL的類配對組合(約2500個)中的每一個都將存在。存在如此多的VH 和VL類對可比擬背景噪聲。產生只包括最普遍的VH和VL類對的大多樣性的文庫可能是令人期望的,但是對于同源文庫方法,這是不可能的。此外,在一些實施方案中,集合所基于的DNA序列是從未經歷抗原的幼稚B細胞的樣品獲得,因此,所表達的成員不偏向于特定抗原并且可以使用集合來針對任何免疫原進行篩選。因此,可對從人宿主的幼稚(未經歷抗原的)B細胞獲得的編碼抗體或其片段的核酸序列(或其選定部分)進行測序。從這些序列數據,可鑒定在免疫組庫中主要代表的種系家族VH/VL鏈類配對。基于某些指標如普遍性,選擇重鏈和輕鏈類對加入集合中。然后可通過基因合成來合成集合。在一些實施方案中,合成的集合包括基本上的種系VH和VL 構架區,其中CDR是多樣化的。
利用從例如人宿主的幼稚(未經歷抗原的)B細胞或從公開可用的數據庫或文獻獲得的DNA序列作為“模板”,本公開內容使得鑒定最普遍的VH和VL種系家族和/或基因和/或類對的方法成為可能。闡釋了 VH和VL種系家族和/或基因和/或類對的相對豐度后,就可以測試包含由VH和VL種系家族和/或基因和/或類對編碼的種系蛋白序列的抗體或其片段的如下優選特征(i)它們以Fab形式被很好地展示在噬菌體上;(ii)它們以Fab 形式和IgG形式被大量表達;(iii)并且它們是熱力學穩定的。通過測試由最普遍的VH和 VL種系家族和/或基因和/或類對編碼的種系蛋白序列,可鑒定具有優選特征的那些。利用這種信息,技術人員能夠產生高度的多樣性而不犧牲可歸因于最普遍的VH和VL種系家族和/或基因和/或類對組合的關鍵益處。利用本文公開的集合設計和展示方法,可產生大多樣性的集合,因為一些實施方案包括至少IX 101°種成員的集合。本公開內容總體上涉及包含具有最優選的特征的VH和VL類對的合成抗體集合。 在一些實施方案中,集合包括由類對代表的VH和VL家族編碼的種系蛋白序列。本公開內容總體上涉及包含具有優選的特征的一個或更多個VH和VL類對的合成抗體集合。在一些方面,集合包括由類對代表的VH和VL家族編碼的種系蛋白序列。在一些方面,本公開內容使得鑒定在免疫組庫中最普遍的VH和VL種系基因、測試具有最普遍的VH和VL種系基因序列的抗體以鑒定具有優選特征的VH和VL種系基因、并然后產生包含優選的VH和VL類對的集合的方法成為可能。本公開內容使得鑒定在人免疫組庫(可能是幼稚的)中的VH和VL類對、確定最普遍的VH和VL類對、測試這些VH和VL 類對以鑒定具有優選特征的VH和VL類對、并然后產生包含優選的VH和VL類對的集合和 /或源自于優選的VH和VL種系基因的抗體的方法成為可能。一旦鑒定了 VH和VL和/或 VH和VL類對,就鑒定了它們相應的種系序列,這樣可將種系序列加入到集合設計中。在一些方面,本公開內容使得包含公開的核酸集合的載體和宿主細胞成為可能。在一些方面,本公開內容使得生產這些集合的方法成為可能。在一些實施方案中,在單獨步驟中獲得代表人免疫組庫的DNA序列,并將其儲存在數據庫中;因此,集合設計可經由計算機模擬被容易地改變、優化和定制,容許通常可在合成文庫中實現的定制水平。在一些方面,本公開內容使得利用所公開的集合鑒定抗體或其片段的方法成為可能。方法、核酸、蛋白、載體、宿主細胞在一方面,本公開內容使得由全基因合成產生的核酸的集合成為可能。基因合成技術近年已取得相當大的進展并且可產生非常大的核酸集合。以下公司提供了這種合成月艮務Entelechon (Regensburg、Germany)、Geneart (Regensburg、Germany)禾口 Sloning Biotechnology (PuchheinuGermany)。為了使基因合成公司得以產生集合,可提供該集合的每個成員的序列。在一些實施方案中,本公開內容使得編碼包含以至少0. 05%的VH和VL類對的濃度存在于至少1 X IO5個B細胞的樣品中的VH和VL類對的抗體或其片段的合成核酸的集合成為可能。在其他實施方案中,本公開內容的集合包括以至少1 %的VH和VL類對的濃度存在于至少IXlO5個B細胞的樣品中的VH和VL類對。在其他實施方案中,本公開內容的集合包括以至少1.5%的VH和VL類對的濃度存在于至少IXlO5個B細胞的樣品中的VH 和VL類對。在其他實施方案中,本公開內容的集合包括以至少2%的VH和VL類對的濃度存在于至少IXlO5個B細胞的樣品中的VH和VL類對。在其他實施方案中,本公開內容的集合包括以至少3%的VH和VL類對的濃度存在于至少1 X IO5個B細胞的樣品中的VH和 VL類對。在其他實施方案中,本公開內容的集合包括以至少4%的VH和VL類對的濃度存在于至少IXlO5個B細胞的樣品中的VH和VL類對。在其他實施方案中,本公開內容的集合包括以至少5%的VH和VL類對的濃度存在于至少1 X IO5個B細胞的樣品中的VH和VL 類對。在一些實施方案中,本公開內容使得其中從分離自人宿主的B細胞中鑒定VH和VL 類對的集合成為可能。在一些實施方案中,B細胞是幼稚的。在一些實施方案中,核酸的集合編碼包含VH和VL構架區的抗體或其片段。在優選的實施方案中,核酸的集合被合成包括具有多樣化的CDR的種系VH和VL構架區。種系構架區是令人期望的,因為包含種系構架區的抗體或其片段不可能具有免疫原性。利用本文公開的集合設計和展示方法,可產生大多樣性的集合,因為一些實施方案包括至少1XIO4種核酸序列的集合,一些實施方案包括至少1 X 105、106、IO7,108、109、 IOloUO11或IO12種核酸序列的集合。這種多樣性是通過合成包括如下成員的集合而產生 所述成員包括具有多樣化的CDR的普遍的VH和VL類對。本公開內容的集合是從基本上代表免疫組庫的序列數據而設計。在一些實施方案中,序列數據是通過檢索公開可用的免疫球蛋白序列表而獲得。例如,可利用Ig-Blast檢索NCBI或者可檢索公開可用的文獻。到2005年為止,該數據庫包括至少25,000種FASTA 格式的人重排抗體序列。在22,500個條目中,13,235個代表VH序列,1,506個代表V κ并且2,259個代表V λ。從這些序列中,VH、Vk和V λ可歸類為其對應的種系家族和/或基因。因為一些Ig-Blast包括完全的抗體序列,每個VH和VL結構域類配對的正確的種系家族和/或基因可從數據庫序列確定。如果利用這種方法,本領域技術人員能夠容易地確定每個VH和VL種系家族和/或基因的突出性(prominence)和/或每個VH和VL結構域類對的種系家族和/或基因。選擇哪些VH和VL和/或VH和VL類對加入文庫中能夠以許多方式完成。在一些實施方案中,選擇具有最高普遍性的VH和VL加入集合或文庫中。在一些實施方案中,選擇具有有利的生物物理特性的VH和VL加入集合或文庫中。在一些實施方案中,選擇具有最高普遍性的VH和VL類對加入集合或文庫中。在一些實施方案中,選擇具有有利的生物物理特性的VH和VL類對加入集合或文庫中。在一些實施方案中,選擇具有最高普遍性和/或有利的生物物理特性的VH和VL和/或具有最高普遍性的VH和VL類對和/或具有有利的生物物理特性的VH和VL類對加入集合或文庫中。這種方法的一個缺點是公開可用的數據庫通常填充了針對特定免疫原而產生的抗體的序列,因此這些序列是有偏性的。此外,在大部分數據庫中,重鏈和輕鏈的序列是不相聯系的,因此不能鑒定VH和VL類配對。在一些實施方案中,核酸序列通過如下方式獲得從一個或更多個宿主收獲B細胞,從B細胞分離DNA,并且優選地對DNA測序。優選地,B細胞是幼稚的。B細胞的樣品是從一個或更多個人供體收獲的。以下是可用于分離B細胞的技術。通過使用以抗CD43和抗Mac-1/CDllb單克隆抗體(例如經磁性微珠)針對其他細胞類型的陰性選擇從脾臟中分離靜息B淋巴細胞(B細胞)。這種策略從脾細胞的混合群中去除非B細胞并且依靠如下事實除了靜息的脾B細胞之外大多數成熟的白細胞表達CD43 (事實上,除了粒細胞、單核細胞、巨噬細胞、血小板、自然殺傷(NK)細胞、胸腺細胞和外周CD8+細胞和大多數CD4+T細胞之外,⑶43的表達顯示在不成熟的B細胞、漿細胞和某些成熟細胞上)。抗Mac-I/⑶lib 微珠被包括在陰性選擇中以改善髓樣細胞的除去。通過利用AutoMACS自動磁珠細胞分選儀(Miltenyi Biotec),B細胞分離可以是自動化的。如通過B220+細胞的熒光分析所評定的,這種分離常規地產生> 95%純的大約4X IO7個B細胞/脾臟。還參見Miltenyi S, Muller W, Weichel W 禾口 RadbruchA. (1990)Cytometry 11 U),231-238。所收獲的B細胞的數目基本上代表免疫組庫。在一些實施方案中,至少IX IO4個 B細胞從宿主分離,更優選至少IO5個B細胞、更優選至少IO6個B細胞、最優選IO7個B細胞從宿主分離。編碼來自B細胞的抗體或其片段的DNA被分離并擴增,例如,重鏈和輕鏈通過 PCR反應連接。DNA被優選地測序。測序的DNA可以是從B細胞mRNA產生的cDNA。從真核細胞如B細胞提取mRNA是公知的技術程序。存在許多技術方案并且商業試劑盒是可用的。如PolyATtract mRNA 分離系統(Promega,Madison, WI, USA)或多種 RNeasy 和 OligotexDirectmRNA試劑盒(均來自于Qiagen,Hilden, Germany)。這些技術中許多利用真核mRNA的聚腺苷酸尾,例如經由對oligo (dT)基質如oligo(dT)纖維素的親和純化。可以利用特定引物經反轉錄接著通過常規PCR從分離的mRNA選擇性擴增cDNA。 特定引物用于擴增可變重鏈和可變輕鏈結構域核酸。參見Cancer Surv. 1997 ;30 =21-44, J Clin. Pathol. 1994 ;47 :493-6, J. Clin. Pathol. 1990 ;43 :888-90 或 Mol. Pathol. 2002 年 4 月;55(2) :98-101。將編碼來自一個B細胞的可變和可變輕鏈結構域的DNA保持在一起,以使得可以鑒定可變結構域重鏈和輕鏈類配對。用于分離編碼個體B細胞的可變結構域配對的核酸的技術是本領域公知的。見,例如,W001/92291 ;W092/15678 ;W093/03151, W02005/042774 ; Mullinax RL 等人,19^Biotechniques 12 :6864-868 ;Chapal,N.等人 1997Biotechniques 23,518-524,, Embleton MJ 等人,1992Nucleic Acids Res. 20 15,3831—3837 ;Coronella, J. Α.等人2000Nucleic Acids Res. 28 :20,E85 ;Thirion S等人,1996European Journal of Cancer Prevention 5 :6507-511 ;禾口 Wang,X 等人 2000 J. Immunol. Methods20,217—225。這些技術可被單獨使用或與其他方法組合使用。例如,如果大樣品的可變重鏈和輕鏈結構域序列沒有從其對應的B細胞中被一起成功地鑒定,那么可完成以下方法,以鑒定正確的可變重鏈和可變輕鏈結構域類對。完成了每個個體B細胞的單細胞PCR。優選地,來自每個B細胞的DNA被測序。存在多家能夠對整個基因組測序的公司, 如 Helicos Biosciences Corporation (Cambridge, MA, USA) Helicos 能夠用其真實單分子測序(True Single Molecule Sequencing )技術直接以高速度和高效率對DNA或RNA 的單分子測序。能夠進行類似測序工作的其他公司包括Illumina(San Diego, CA, US A ; Solexa system)和Roche (Basel, CH ;454系統)。在測序之前不需要克隆步驟。在另一方面,本公開內容使得鑒定免疫組庫中存在的重鏈和輕鏈可變結構域對的種系家族的方法成為可能。使用本領域技術人員已知的方法可將所有抗體或其片段追溯到其種系家族。通過分析編碼抗體或其片段的核酸的序列,VH和VL 二者的種系家族可通過
58本領域技術人員已知的方法確定。例如,Wildt等人,(1999)從3位患者中采樣B細胞并鑒定了 365種VH和VL類配對。將來自每個B細胞的RNA用于cDNA合成并且對編碼VH和 VL區的cDNA進行PCR擴增和測序。如Wildt的圖1所示,某些VH和VL類比其他VH和VL 類更頻繁配對,例如,VH3-8 與 V κ 3-1、V κ 3-19, V κ 4-1, V κ 2-3 ^ V κ 1-2,以及 VH3-9 與 Vk 3-1、V κ 3-3 或 Vk 1-5。在另一方面,本公開內容使得在合成集合之前設計多樣化的互補決定區的方法成為可能。CDR可通過本領域公知的方法設計,包括在Knappik等人2000 ;WO 97/08320中公開的方法。在另一方面,本公開內容使得選擇期望被包括在編碼抗體或其片段的核酸的集合中的可變結構域類配對的方法成為可能。在一些實施方案中,合成了包含由公開的方法鑒定的所有VH和VL結構域類對的核酸的集合。此外,VH和VL類對的普遍性可通過多種統計檢驗確定。最簡單的形式是,簡單地計數個體VH和VL類對。更復雜的統計檢驗可考慮各種其他參數。通過非限制性實例的方式,以下統計檢驗和參考文獻可作為已在這種或類似的分析中進行大量探討的實例來指導貝葉斯壓縮估計(Bayesian Shrinkage Estimation)(見例如,Biometrics 59(2003) 476-486),DADA (cDNA豐度的數字分析,見例如,BMC Genomics 2002,3 7),線性建模(太平洋生物計算討論會(Pacific Symposium on Biocomputing),1999,4 :41-52)和各種聚類方法(BMC Bioinformatics 2006,7 :397,第 4 次 IEEE 國際數據挖掘會議(Fourth IEEE International Conference on Data Mining(ICDM' 04)),H 403—406 M)。在其他方面,本公開內容使得包含編碼抗體或其片段的核酸集合的載體的集合成為可能。在一些實施方案中,載體包含表達載體、展示載體、噬菌體展示載體或噬菌粒載體。真核表達載體是本領域公知的并且還可商購獲得。通常,提供這些載體包含用于插入期望的DNA的便利的限制酶切位點。這些載體的實例包括pSVL和pKSV-10、pBPV-1/ PML2d 和 pTDTl (ATCC,編號 31255)。在其他方面,本公開內容使得用公開的載體集合轉化的宿主細胞的集合成為可能。宿主細胞可以是真核的或原核的。細菌細胞是優選的原核宿主細胞并且通常是大腸桿菌(Escherichia coli, Ε. coli)的菌株,諸如,例如,可從 Bethesck Research Laboratories, Inc.,Bethesda, Md獲得的大腸桿菌菌株DH5。優選的真核宿主細胞包括酵母和哺乳動物細胞,包括鼠類細胞和嚙齒類細胞,優選脊椎動物細胞,如來自小鼠、大鼠、猴或人細胞系的細胞。引入載體到宿主細胞中可通過本領域技術人員已知的許多轉化或轉染方法完成, 包括磷酸鈣沉淀、電穿孔、顯微注射、脂質體融合、RBC血影(ghost)融合、原生質體融合、病毒感染以及類似方法。單克隆全長抗體、Fab片段、Fv片段和scFv片段的生產是公知的。用重組DNA分子轉化適當的細胞宿主是通過通常取決于所用的載體類型的方法而完成。關于原核宿主細胞的轉化,見,例如,Cohen等人,Proceedings National Academy of Science, USA,第 69 卷,第 2110 頁(1972);和 Maniatis 等人,Molecular Cloning, a Laboratory Manual (分子克隆實驗室指南),冷泉港實驗室,冷泉港,紐約(1982)。關于用包含rDNA的逆轉錄病毒載體轉化脊椎動物細胞,見例如,Sorge等人,Mol. Cell. Biol., 4 :1730-1737(1984) ;Graham 等人,Virol. ,52 :456(1973);禾口 Wigler 等人,ProceedingsNational Academy ofSciences,USA,第 76 卷,第 1373-1376 頁(1979)。在另一方面,本公開內容使得包含如下序列數據的試劑盒或數據庫成為可能,所述序列數據闡述編碼如下抗體或其片段的核酸所述抗體或其片段包含在至少IX IO5個幼稚的人B細胞的樣品中存在的核酸,其中所述序列數據在可讀介質上。在另一方面,本公開內容使得生產編碼抗體或其片段的合成核酸的集合的方法成為可能,所述方法包括合成編碼包含以至少0. 05%的VH和VL類對存在于至少約2500個B 細胞的樣品中的VH和VL類對的抗體或其片段的核酸的集合。在一些實施方案中,本公開內容使得生產編碼基本上代表免疫組庫的抗體或其片段的核酸的集合的方法成為可能,所述方法包括(a)鑒定以至少0. 05%、至少或至少2%的VH/VL類對的濃度在免疫組庫中存在的VH/VL類對;(b)合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%、至少1 %或至少2%的VH/VL類對的濃度在免疫組庫中存在的VH/VL類對。在一些實施方案中,鑒定VH/VL類對包括(i)從一個或更多個人宿主中分離B細胞; (ii)通過選自如下的方法確定每個B細胞中的VH/VL類對(A)對編碼VH/VL類對的DNA、 mRNA或cDNA進行分離并測序;或(B)用對每個VH和VL特異的一種或更多種核酸探針進行探測;和(iii)分析VH/VL類對。在一些實施方案中,鑒定VH/VL類對包括(i)獲得抗體核酸序列;(ii)通過序列比對確定VH/VL類對;(iii)核對這些來自至少100種抗體的序列以鑒定在免疫組庫中存在的VH/VL類對。在一些實施方案中,這些方法包括選擇顯示選自以下組成的組的至少一種生物物理特性的VH/VL類對(i)有效地展示在噬菌體上;(ii) 有效地展示在哺乳動物細胞上;(iii)以Fab形式很好地表達在大腸桿菌中;(iv)以IgG形式很好地表達在哺乳動物細胞中;(ν)熱穩定性;(vi)可溶性;和(vii)低免疫原性;以及合成編碼顯示至少一種所述生物物理特性的抗體或其片段的核酸的集合。在一些實施方案中,編碼抗體或其片段的核酸的集合是種系、基本上的種系或密碼子優化的種系核酸的變體。在一些實施方案中,在合成編碼含VH/VL類對的抗體或其片段的核酸的集合的過程中, 將序列變異引入至少一個互補決定區(CDR)中。在一些實施方案中,序列變異限于不含終止密碼子的序列。在一些實施方案中,這些方法還包括將核酸的集合克隆到載體中。在一些實施方案中,載體選自以下組成的組(i)展示載體,(ii)噬菌體展示載體;(iii)噬菌粒載體;和(iv)哺乳動物表達載體。在一些實施方案中,這些方法還包括轉化到宿主細胞中。在一些實施方案中,宿主細胞選自由以下組成的組(i)原核宿主細胞;(ii)真核宿主細胞(iii)大腸桿菌宿主細胞;和iv)哺乳動物宿主細胞。一些實施方案還包括將所述核酸插入載體的集合中并且轉化/轉染到宿主細胞中并展示抗體或其片段。在一些實施方案中,載體是表達載體、展示載體,如噬菌粒載體。一些實施方案還包括將所述載體轉染到適合的宿主細胞中。在一些實施方案中,宿主細胞是原核的,例如大腸桿菌,或是真核的,例如哺乳動物細胞。在另一方面,本公開內容使得鑒定對免疫原特異的抗體或其抗體片段的方法成為可能,所述方法包括如下步驟合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%的VH和VL類對的濃度存在于至少約2500個B細胞的樣品中的VH 和VL類對;針對特定免疫原篩選該集合;并且選擇對所述免疫原特異的一種或更多種抗體或其片段。一些實施方案包括鑒定對免疫原特異的抗體或其抗體片段的方法,所述方法包括如下步驟(a)鑒定以至少0. 05%、至少或至少2%的VH/VL類對的濃度在免疫組庫中存在的VH/VL類對;(b)對編碼包含以至少0. 05%、至少或至少2%的VH/VL類對的濃度在免疫組庫中存在的VH/VL類對的抗體或其片段的核酸的集合進行合成;(c)展示或表達該集合的抗體或其片段;(d)針對特定免疫原篩選該集合;和(e)選擇對所述免疫原特異的至少一種抗體或其片段。一些實施方案包括鑒定用于治療疾病或病癥的抗體或其抗體片段的方法,所述方法包括如下步驟(a)鑒定以至少0. 05%、至少或至少2%的VH/VL 類對的濃度在免疫組庫中存在的VH/VL類對;(b)鑒定顯示選自以下組成的組的至少一種生物物理特性的VH/VL類對(i)有效地展示在噬菌體上;(ii)有效地展示在哺乳動物細胞上;(iii)以Fab形式很好地表達在大腸桿菌中;(iv)以IgG形式很好地表達在哺乳動物細胞中;(ν)熱穩定性;(vi)可溶性;和(vii)低免疫原性;(c)合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%、至少或至少2%的VH/VL類對的濃度在免疫組庫中存在并展示(i)-(vii)的至少一種生物物理特性的VH/VL類對;(d)展示或表達來自所述集合的抗體或其片段;(e)針對與所述疾病或病癥相關的特定免疫原篩選該集合;和(f)選擇對所述免疫原特異的至少一種抗體或其片段。在一些實施方案中,B細胞分離自人宿主。在一些實施方案中,B細胞是幼稚的。 在一些實施方案中,在至少1 X約2500個B細胞的樣品中存在的VH和VL類對是通過如下方法鑒定的所述方法包括從一個或更多個人宿主收獲幼稚B細胞;從收獲的B細胞中分離DNA ;并且分析所分離的DNA。在一些實施方案中,分析DNA的步驟包括對DNA測序。在一些實施方案中,分析DNA的步驟還包括鑒定每個VH和VL類對在樣品中存在的頻率。一些實施方案還包括將所述核酸插入載體的集合中并且轉化/轉染到宿主細胞中,并展示抗體或其片段。在另一方面,本公開內容使得鑒定對免疫原特異的抗體或其抗體片段的方法成為可能,所述方法包括如下步驟合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%的VH和VL類對的濃度存在于至少約2500個B細胞的樣品中的VH 和VL類對;針對特定免疫原篩選該集合;并且選擇對所述免疫原特異的一種或更多種抗體或其片段。在一些實施方案中,B細胞分離自人宿主。在一些實施方案中,B細胞是幼稚的。 在一些實施方案中,在至少約2500個B細胞的樣品中的VH和VL類對是通過如下方法鑒定的所述方法包括從一個或更多個人宿主收獲B細胞;從收獲的B細胞中分離DNA ;并且分析所分離的DNA。在一些實施方案中,分析DNA的步驟包括對DNA測序。在一些實施方案中,分析DNA的步驟還包括鑒定每個VH和VL類對在樣品中存在的頻率。在一些實施方案中,在測試/篩選之前利用噬菌體、酵母、核糖體、細菌或真核的展示來展示集合。在一些實施方案中,集合被展示在原核或真核細胞上。在一些實施方案中,集合以Fab或IgG形式或其他本領域技術人員已知的形式展示。篩選可以通過使用本領域公知的方法之一進行,例如噬菌體展示、選擇性感染的噬菌體、篩選結合的多核糖體技術、以及用于酶活性或蛋白穩定性的測定系統。許多這類方法是本領域技術人員已知的并且作為示例性參考文獻在以下提供Valle RP, Curr. Opin.Drug Discov. Devel. 2003 ¥ 3 月;6 (2) :197-203 ;Ackermann BL Expert Rev. Proteomics. 2007 年 4 月;4 (2) :175-86 ;禾口 Anderson KS J Proteome Res. 2005 年 7—8 月; 4(4) 1123-33。
61
在一個實施方案中,進行篩選測定以使得抗體對配體的結合直接或間接產生可檢測的信號。這些信號包括,例如,復合物的產生、催化反應產物的形成、能量的釋放或攝取,等等。來自用主題的重組DNA進行轉化的群體的細胞可被克隆以產生例如單克隆集落。可以將來自這些集落的細胞收獲、裂解并且用本領域已知的方法檢驗其DNA內容物的重組DNA的存在,所述本領域已知的方法例如在Southern, J. Mol. Biol. ,98 :503(1975)或 Berent 等人,Biotech. 3 :208(1985)中所述的。生物物理特性本發明還包括集合以及制備這些集合的方法,在這些集合中VH/VL類對具有令人期望的生物物理特性。有利的和期望的生物物理特性包括較高的穩定性、較高的表達水平和低的聚集傾向。適合的生物物理特性便于在不同的階段利用集合。例如,如果抗體或其片段是可溶的并且不聚集,且被很好地表達在篩選背景如噬菌體中,那么有利于集合的篩選。以下特性使得諸如用于動物試驗和治療用途的抗體的隨后開發變得容易諸如抗體可溶性、熱穩定性、高水平表達(尤其是作為IgG在哺乳動物中的高水平表達)和低免疫原性。為了確保全部或至少大多數的抗體或其片段具有這些有利的生物物理特性,可提前篩選VH/VL類對以鑒定哪些類對顯示這些特性中的哪些。然后通過合成只編碼那些具有這類有利的生物物理特性的抗體的核酸來構建文庫。當然,不是所有的VH/VL類對都將以相同的程度顯示所有的生物物理特性,并且技術人員將在確定要合成哪些VH/VL類對之前確定哪些特性是更相關的和/或每種特性的平衡。因而,在某些方面,本發明提供了選擇被有效地展示諸如在噬菌體表面上或在其他展示技術中的VH/VL組合的合成抗體文庫。優選地全部、基本上全部或實質上全部的VH/ VL組合被有效的展示。展示效率可通過如在本發明中所述的噬菌體夾心ELISA測量。在其他方面,本發明提供了選擇被以Fab形式很好地表達在大腸桿菌中的VH-VL 組合的合成抗體文庫。優選地全部、基本上全部或實質上全部的VH/VL組合被以Fab形式很好地表達在大腸桿菌中。在大腸桿菌中以Fab形式的表達可被定量且在細菌培養物中優選為多于ang/L、多于5mg/L、多于10mg/L或多于15mg/L。在某些方面,所有的VH-VL以多于2mg/L表達,基本上所有的VH-VL組合以多于5mg/L的水平表達,大部分VH-VL組合以多于10mg/L的水平在細菌培養物中表達,和/或至少兩個、至少三個、至少四個或至少五個 VH-VL組合以多于15mg/L的水平在細菌培養物中表達。在某些方面,本發明提供了選擇被以Fab形式很好地表達在哺乳動物系統中的 VH-VL組合的合成抗體文庫。目前市售的絕大多數基于抗體的治療性生物制品為IgG形式是因為多種原因(i)由于IgG與新生兒受體(Fcfoi)的相互作用,IgG分子在人體內的半衰期非常高(約3周);(ii) IgG分子是高度可溶的、熱力學穩定的且對血液中的蛋白酶是相對耐受的;和(iii) IgG具有清除腫瘤細胞所需的ADCC(抗體依賴性細胞介導的細胞毒作用)和/或CDC(補體依賴性細胞毒作用)活性。Fab形式的特定VL/VH組合的表達不一定與IgG形式的相同的VL/VH組合的表達相關,所以IgG形式的VL/VL組合的表達和可溶性也是重要的獨立因素。哺乳動物系統可包括,例如,哺乳動物懸浮培養、哺乳動物粘附細胞培養、HKBll細胞、PERC. 6細胞或CHO細胞。優選地全部、基本上全部或實質上全部的VH/VL組合被以IgG 形式很好地表達在哺乳動物系統中。在某些方面本發明提供了合成的人抗體文庫,其中所有的VH-VL組合以多于10mg/L的水平以IgG形式被表達在哺乳動物系統中,其中基本上全部的VH-VL組合以多于15mg/L的水平以IgG形式被表達在哺乳動物系統中;其中大多數 VH-VL組合以多于20mg/L的水平以IgG形式被表達在哺乳動物系統中;和/或至少三種、 至少四種或至少五種VH-VL組合以多于25mg/L的水平以IgG形式被表達在哺乳動物系統中。在某些方面,本發明提供了選擇熱穩定的VH/VL組合的合成抗體文庫。優選地全部、基本上全部或實質上全部的組合是熱穩定的,具有至少681、701、721、741或761 的Tm。可以如本文所述測量熱穩定性。在某些方面,本發明提供了合成的人抗體文庫,其中基本上全部的VH-VL組合具有多于68°C的Tm ;基本上全部的VH-VL組合具有多于70°C的 Tm,或多于72°C的Tm ;大多數VH-VL組合具有多于74°C的Tm ;和/或許多VH-VL組合具有多于76°C的Tm。在某些方面,至少三種、至少四種或至少五種VH-VL組合具有多于70°C的 Tm。在某些方面,本發明提供了選擇可溶(即不趨向于聚集)的VH-VL組合的合成抗體文庫。可以通過如下方式確定可溶性例如,通過測試的Fab在細菌宿主或IgGl在真核宿主中良好的折疊和表達特征或在純化后通過分析性尺寸排阻色譜而確定的聚集。低免疫原性可被預測或通過本領域已知的方法直接測試,但也可以通過以下事實推斷給定VH/VL類對在文庫中是最豐富的并且使用的蛋白序列是基本上的種系蛋白序列。如本文所述,抗體序列數據可以從B細胞獲得,例如,幼稚B細胞、公開可用的數據庫和/或文獻。可將每個抗體序列與最接近的種系家族和/或基因比對。從這個數據,人們能夠確定豐富的VH和VL種系家族和/或基因和/或VH/VL類對。確定豐富的VH和VL種系家族和/或基因和/或VH/VL類對后,人們能夠選擇測試哪些VH和VL種系家族和/或基因和/或VH/VL類對的有利的生物物理特性。一種方法是根據豐度將VH和VL種系家族和/或基因排序,然后測試最豐富的VH和VL種系家族和 /或基因,例如前20最豐富的VH和VL種系家族和/或基因。此外,人們可以組合前20種最豐富的VH和VL種系家族和/或基因,產生例如400個VH和VL的組合,并測試它們的有利的生物物理特性。另外或補充地,人們能夠測試最豐富的VH/VL類對的有利的生物物理特性。有利的生物物理特性包括但不限于⑴它們以Fab形式被很好地展示在噬菌體上;(ii)它們以IgG形式被很好地展示在哺乳動物細胞上;(iii)它們以Fab形式被大量表達在例如大腸桿菌中,以及以IgG形式被大量表達在例如哺乳動物細胞中;(iv)是熱力學穩定的;(ν)具有高血清穩定性;(vi)具有低聚集傾向(即高可溶性);和(vii)具有低免疫原性風險。在一些方面,本發明包括編碼如下抗體或其片段的合成核酸的集合所述抗體或其片段包含以至少0. 5 %的VH和VL類對的濃度存在于至少1 X IO5個B細胞的樣品中的VH 和VL類對。在一些實施方案中,VH和VL類對以至少的VH和VL類對的濃度存在于至少IXlO5個B細胞的樣品中。在一些實施方案中,VH和VL類對以至少2%的VH和VL類對的濃度存在于至少IXlO5個B細胞的樣品中。在一些實施方案中,B細胞分離自人宿主。 在一些實施方案中,B細胞是幼稚的。在一些方面,集合包括編碼包含種系VH和VL構架區的抗體或其片段的核酸。在一些實施方案中,集合包括至少IX IO4種核酸序列、至少IX IO6 種核酸序列、至少1 X IO8種核酸序列、至少1 X IOltl種核酸序列、或至少1 X IO11種核酸序列。在一些方面,本發明包括包含如下序列數據的試劑盒,所述序列數據闡述編碼如下抗體或其片段的核酸所述抗體或其片段包含在至少IXlO5個幼稚的人B細胞的樣品中存在的核酸,其中所述序列數據在可讀介質上。在一些實施方案中,本發明包括編碼抗體或其功能片段的核酸的集合。在一些實施方案中,載體是噬菌體展示載體。在一些實施方案中,載體是噬菌粒載體。在一些方面,本發明包括用集合載體轉化的宿主細胞,所述集合載體包括編碼抗體或其功能片段的核酸的集合。在一些實施方案中,宿主細胞是原核的。在一些實施方案中,宿主細胞是大腸桿菌。在一些實施方案中,宿主細胞是真核的。在一些實施方案中,宿主細胞是哺乳動物細胞。在一些方面,本發明包括生產編碼抗體或其片段的合成核酸的集合的方法,所述方法包括合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少 0. 5%的VH和VL類對的濃度存在于至少1 X IO5個B細胞的樣品中的VH和VL類對。在一些實施方案中,B細胞分離自人宿主。在一些實施方案中,B細胞是幼稚的。在一些實施方案中,通過包括如下步驟的方法鑒定存在于至少1 X IO5個B細胞的樣品中的VH和VL類對aa)從一個或更多個人宿主中收獲幼稚B細胞;ab)從步驟aa)中收獲的B細胞分離DNA ;和ac)分析在步驟ab)中分離的DNA。在一些實施方案中,分析DNA的步驟包括對DNA測序。在一些實施方案中,分析DNA 的步驟還包括鑒定每個VH和VL類對存在于樣品中的頻率。在一些實施方案中,這些方法還包括將核酸插入到載體的集合中。在一些實施方案中,載體是表達載體。在一些實施方案中,載體是展示載體。在一些實施方案中,展示載體是噬菌粒載體。在一些實施方案中, 所述方法還包括將所述載體轉染到適合的宿主細胞中。在一些實施方案中,宿主細胞是原核的。在一些實施方案中,宿主細胞是大腸桿菌。在一些實施方案中,宿主細胞是真核的。 在一些實施方案中,宿主細胞是哺乳動物細胞。在一些方面,本發明包括鑒定對免疫原特異的抗體或其抗體片段的方法,所述方法包括如下步驟a)合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 5%的VH和VL類對的濃度存在于至少1 X IO5個B細胞的樣品中的VH和VL類對; b)針對特定免疫原篩選該集合;和c)篩選對所述免疫原特異的一種或更多種抗體或其片段。在一些實施方案中,B細胞分離自人宿主。在一些實施方案中,B細胞是幼稚的。在一些實施方案中,通過包括如下步驟的方法鑒定存在于至少1 X IO5個B細胞的樣品中的VH和 VL類對aa)從一個或更多個人宿主中收獲幼稚B細胞;ab)從步驟aa)中收獲的B細胞分離DNA ;和ac)分析在步驟ab)中分離的DNA。在一些實施方案中,分析DNA的步驟包括對DNA測序。在一些實施方案中,分析 DNA的步驟還包括鑒定每個VH和VL類對存在于樣品中的頻率。在一些實施方案中,合成集合的步驟還包括將所述核酸插入到載體的集合中。在一些實施方案中,所述方法還包括將所述載體轉染到適合的宿主細胞中。在一些實施方案中,所述方法還包括展示所述集合。
實施例棚列1甚應言辦卿AtfT辦歹_立神種限吿丨瞧搬,點避系FRl區一方面,本公開內容描述了包括含種系蛋白序列的構架區特別是FRl的抗體的集合。預期具有種系序列將降低抗體在施用于人時的免疫原性風險。然而,必須使用相容的限制酶切位點以使得能將編碼抗體集合的核酸標準地克隆到展示載體和/或表達載體中, 以便可針對免疫原篩選抗體。過去,用于克隆的限制酶切位點通常位于構架區內,從而修飾核酸和/或氨基酸序列遠離種系。為了確保本公開內容的每種抗體的至少構架I(FRl)區保持種系蛋白序列,在FRl內應該沒有任何非天然存在的限制酶切位點。因此,本公開內容的一個方面是在原核信號序列和人前導序列的C端內具體是在三個C端殘基內摻入相同的或至少相容的限制酶切位點。另外,包含相同的或相容的限制酶切位點的信號序列和前導序列必須是有功能的并且容許抗體或其片段在原核和哺乳動物表達系統中均有良好的展示和表達水平。^MM 1. 1 在大腸桿菌信號序歹Il的C端豐富的某的分析以下描述了要摻入信號序列大腸桿菌ompA和phoA的C端中的限制酶切位點的選擇和得到的信號序列的功能性的評估。第一步,分析在信號序列的C端三個氨基酸(_3到-1)處的常見氨基酸殘基,并且產生如表1所示的共有序列。見Chou等人,Prediction of protein signal sequences (蛋白信號序列的預測),Protein Pept. Sci. 3(6) =615-22(2002 年 12 月)。信號序列的三個C端氨基酸的共有序列-3-2-1ALASAGVSST Q在-3位,主要觀察到A、S、V和T氨基酸。在_2位,主要觀察到L、A、S和Q氨基酸。在-1位,主要觀察到A、G和S。棚列1.2:(DhoA) _吿丨瞧爐在比較表1中所示的共有序列與已知限制酶切位點后,選擇以下三個限制酶切位點AflII、NheI和AvrII用于摻入到phoA C端中并隨后研究其表達水平。重要的是注意到哪些情況下將野生型核苷酸序列改變成修飾的核苷酸序列氨基酸序列也被改變。選擇的限制酶切位點的核酸序列和對應的氨基酸序列顯示在表2中。表2 AflllVLS
GTC TTA AGY
NhelVLA
GTG CTA GCN
AvrllVLG
GTC CTA GGN作為對照,研究野生型phoA信號序列的表達水平。包括3個C端序列的野生型 PhoA信號序列的核酸和氨基酸序列顯示在表3中。表3 野生型大腸桿菌phoA信號序列(從-3位到-1位的C端氨基酸序列是沒有限制酶切位點的TKA)MKQSTIALALLPLLFTPVTKAATGAAACAGAGCACCATTGCCCTGGCCCTGCTGCCGCTGCTGTTTACCCCAGTGACCAAAGCCPhoA 野生型 C 端 TKAACC AAA GCC為了評估表達水平,將表2中所示的限制酶切位點摻入到phoA信號序列中,從而還修飾了野生型氨基酸序列。得到的信號序列用來表達包含a)VH3-23或b)VHl_69種系蛋白序列的Fab片段。選擇這些種系序列因為它們已知是穩定的并且被很好地表達。將 4D5抗體的CDR-H3 (WG⑶GFYAMDY)摻入到VH3-23和VH1-69種系基因序列中,并且JH4種系基因序列用于FR4。4D5抗體被公開在(PDB條目IFVC ;Carter, P.,Presta, L.,Gorman, C. Μ. , Ridgway, J. B. , Henner, D. , Wong, W. L.等人(1992) ; Humani ζ at ion Biophysical Properties of Human Antibody Domains551 of an anti-p 185HER2 antibody for human cancer therapy (用于人癌癥治療的抗pl85HER2抗體的人抗體結構域551的人源化生物物理特性)· Proc. Natl Acad. Sci. USA, 89,4285-4289 中。產生基于 pMORPHXll (示于圖 50)的質粒,所示質粒包括a)包含表2的C端限制酶切位點和氨基酸序列的phoA信號序列,b) VH3-23和VH1-69的VH序列,該VH序列如以上所示摻入了 CDR-H3和JH4,和c)來自 M0R03207的穩定的且很好地表達的輕鏈。在Geneart (Regensburg,Germany)產生了所有的基因。通過在周質提取后進行抗Fd ELISA來檢查表達和周質運輸。在周質提取后使用 BBS緩沖液的抗Fd表達ELISA的結果顯示在圖1中。如所示的,在VH3-23組中,包括C端限制酶切位點AfIII (VLS)、NheI (VLA)和AvrII (VLG)的信號序列保持在野生型(TKA)范圍內的表達水平,其中NheI(VLA)比野生型(TKA)表現得更好。另外,在搖瓶中過夜培養后進行大腸桿菌中的Fab表達,并且在通過親和色譜和緩沖液更換的Fab純化后確定了 Fab生產水平。結果顯示在表4中。表 4 使用包括C端限制酶切位點AfIII (VLS) ,NheI (VLA)和AvrII (VLG)的信號序列相比于野生型(TKA)的Fab表達
66Fab構建體表達率(mg/L)
VH3-23 TKA11.0
VH3-23 VLS2.0
VH3-23 VLA11.0VH3-23 VLG9.0
VHl-69 TKA7.5
VH1-69 VLS5.0
VHl-69 VLA2.5
VH1-69 VLG3.5如所示的,包括C端限制酶切位點AfIII (VLS)、NheI (VLA)和AvrII (VLG)的信號序列相比于野生型(TKA)表達相似量的Fab。基于以上數據,選擇NheI (VLA)限制酶切位點摻入到重鏈信號序列(phoA)中。修飾的NheI (VLA) phoA信號序列的核酸和氨基酸序列顯示在表5中。^ 5具有C端VLA和NheI限制酶切位點(=GCTAGC)的修飾的大腸桿菌phoA信號序列MKQSTIALALLPLLFTPVVLAATGAAACAGAGCACCATTGCCCTGGCCCTGCTGCCGCTGCTGTTTACCCCAGTGGTGCTAGCC實施例1.3 用于κ和λ輕鏈大腸桿菌信號序列(ompA)的限制酶切位點的選擇與實施例1. 2中所述相似的方法用于選擇摻入到κ和λ的輕鏈信號序列(ompA) 的C端中的限制酶切位點。在比較表1中所示的共有序列與已知的限制酶切位點后,選擇以下限制酶切位點NdeI (AYG)、NdeI (AYA)和BsiWI (TYA)摻入到ompA C端,從而還修飾該氨基酸序列,隨后研究其表達水平。選擇的限制酶切位點的序列顯示在表6中。表 6
NdelAYG
GCA TAT GGN
NdelAYA
GCA TAT GCN
BsiWITYA
ACG TAC GCN作為對照,研究野生型ompA信號序列的表達水平。包括3個C端序列的野生型 ompA信號序列的核酸和氨基酸序列顯示在表7中。表7 野生型大腸桿菌ompA信號序列(從_3位到_1位的C端氨基酸序列是沒有限制酶切位點的AQA)
MKKTAIAIAVALAGFATVAQAATGAAAAAAACCGCCATTGCCATTGCCGTGGCCCTGGCAGGCTTTGCCACCGTGGCGCAGGCCOmp 野生型 C 端 A Q AGCG CAG GCC為了評估表達水平,將表6中所示的限制酶切位點摻入ompA信號序列中。得到的修飾的信號序列用于表達Fab片段,所述Fab片段包括a) κ 1012 (IGKV1-39),b) k3L6(IGKV3-11),或c) λ Vl-13 (IGLV1-40)種系基因序列。選擇這些種系序列因為它們已知是穩定的并且被很好地表達。在a) κ 1012(IGKVl-39)和b) κ 3L6 (IGKV3-11) 中,摻入了 CDR-L3 區QQHYTTPPT(對于 κ ),在 c) λ 1 Vl-13 (IGLV1-40)中,摻入了 CDR-L3區QSYDSSLSGVV (對于λ ),并且在a) -c)中,Jkl種系基因序列用作κ輕鏈的FR4;并且J12/3種系基因序列用作λ輕鏈的FR4。產生了 pMORPHXll (圖50中所示)質粒,其包括a)包含表6的C端限制酶切位點的ompA信號序列,b)VL種系序列 κ 1012(IGKVl-39)、b) κ 3L6 (IGKV3-11)或 c) λ 1V1-13 (IGLV1-40),該 VL 種系序列如上所述摻入了⑶R-L3和FR4,以及c)在實施例1. 2中所述的為重鏈的IGHVH3-23TKA構建體。 在 Geneart (Regensburg, Germany)產生了所有的基因。通過進行在大腸桿菌中的過夜Fab生產、周質提取、和周質提取后的抗Fd ELISA, 檢查了表達和周質運輸。在周質提取后使用BBS緩沖液的抗Fd表達ELISA的結果顯示在圖2中。如所示的,包括NdeI (AYA)的信號序列顯示與野生型(AQA) —樣好或更好的表達。另外,在搖瓶中過夜培養后進行大腸桿菌中的Fab表達,并且在通過親和色譜和緩沖液更換的Fab純化后確定了 Fab生產水平。結果顯示在表8中。表 8 使用與野生型(AQA)相比包括C端限制酶切位點NdeI (AYA)的信號序列的Fab表達。
構建體表達率(mg/L)
VK1-39 AQA8.5
VK1-39 AYA5.5VK3-11 AQA7.0
VK3-11AYA9.5
VL1-40 AQA5.0
VL1-40 AYA5.0基于以上數據,選擇NdeI (AYA)限制酶切位點摻入到κ和λ信號序列(ompA)中。 修飾的NdeI (AYA) ompA信號序列的核酸和氨基酸序列顯示在表9中。^ 9具有C端AYA和NdeI限制酶切位點(=CATATG)的修飾的大腸桿菌ompA信號序列MKKTAIAIAVALAGFATVAYAATGAAAAAAACCGCCATTGCCATTGCCGTGGCCCTGGCAGGCTTTGCCACCGTGGCATATGCC實施例1. 4 在噬菌體展示中Fab片段被信號序列展示的效率的評估
如實施例1. 2和1. 3中所述,選擇以下限制酶切位點摻入到Fab信號序列和IgG 前導序列的C端重鏈可變區(phoA和重鏈前導序列):NheI (VLA)輕鏈可變區(κ和λ) (ompA禾口 κ前導序列)Nde I (AYA)圖3顯示選擇的限制酶切位點和對應的氨基酸序列。為了顯示這些修飾的信號序列介導Fab片段的有效運輸和生產,產生了摻入選擇的信號序列到三順反子展示載體中的載體構建體,該載體構建體編碼VH、VL和pill (用于噬菌體展示的噬菌體外殼蛋白ρΙΠ)。這樣做是為了證實包含所選的信號序列的這些載體能夠提供有用的噬菌體展示率。產生了 PJPdl (圖48所示)三順反子載體構建體,其包含VH3-23或VH1-69種系基因的VH,或VL1-40、VK3-11、或VK1-39種系基因的VL,以及選擇的重鏈(PhoA)限制酶切位點NheI (VLA),且野生型phoA(TKA)作為對照,或選擇的輕鏈 (ompA)限制酶切位點NdeI (AYA),且野生型ompA(AQA)作為對照。此外,產生了包含相同組分的pM0RPH30(圖51所示)三順反子載體構建體作為對照。相對展示率顯示在表10中。表10
權利要求
1.合成抗體或其功能片段的集合,所述合成抗體或其功能片段包含可變重鏈構架區和可變輕鏈構架區,其中所述可變重鏈構架區和所述可變輕鏈構架區包含種系蛋白對的種系蛋白序列, 其中所述種系蛋白對包含如下特性i)以Fab形式的相對展示率包括在采樣的前75%Fab中的值;ii)與FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性; ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在血清中的穩定性;其中所述抗體或其功能片段的集合包括至少兩個不同的種系蛋白對的種系蛋白序列,并且其中所述種系蛋白對由種系基因對編碼。
2.根據權利要求1所述的集合,其中所述可變重鏈構架區和所述可變輕鏈構架區基本上由包含如下特性的種系蛋白對的種系蛋白序列組成i)以Fab形式的相對展示率包括在采樣的前75%Fab中的值;ii)與FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性; ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。
3.根據權利要求1或2所述的集合,其中所述可變重鏈構架區和所述可變輕鏈構架區由包含如下特性的種系蛋白對的種系蛋白序列組成i)以Fab形式的相對展示率包括在采樣的前75%Fab中的值;ii)與FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性; ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。
4.根據前述權利要求中任一項所述的集合,其中所述種系基因對以至少0.05%的濃度存在于人免疫組庫中。
5.根據前述權利要求中任一項所述的集合,其中所述種系基因對以至少0.23%的濃度存在于人免疫組庫中。
6.根據前述權利要求中任一項所述的集合,其中所述種系基因對以至少0.51%的濃度存在于人免疫組庫中。
7.根據前述權利要求中任一項所述的集合,其中所述種系基因對以至少0.07%的濃度存在于幼稚的人免疫組庫中。
8.根據前述權利要求中任一項所述的集合,其中所述種系基因對以至少0.52%的濃度存在于幼稚的人免疫組庫中。
9.根據前述權利要求中任一項所述的集合,其中所述種系基因對以至少0.88%的濃度存在于幼稚的人免疫組庫中。
10.根據前述權利要求中任一項所述的集合,其中所述抗體或其功能片段包括人序列。
11.根據前述權利要求中任一項所述的集合,其中所述抗體或其功能片段的集合包括至少十七個不同的種系蛋白對的種系蛋白序列。
12.根據前述權利要求中任一項所述的集合,其中所述抗體或其功能片段包括含種系蛋白序列的一個或更多個互補決定區。
13.根據前述權利要求中任一項所述的集合,其中所述抗體或其功能片段包括含種系蛋白序歹丨J的FRl區、CDRl區、FR2區、CDR2區和FR3區。
14.根據前述權利要求中任一項所述的集合,其中所述抗體或其功能片段包括選自由以下組成的組的FR4區JH4、J κ 1禾口 J λ 2/3。
15.根據前述權利要求中任一項所述的集合,其中所述抗體或其功能片段包括多樣化的HCDR3區。
16.根據前述權利要求中任一項所述的集合,其中所述抗體或其功能片段包括多樣化的LCDR3區。
17.根據前述權利要求中任一項所述的集合,其中所述集合包括IXIO4種抗體或其功能片段。
18.根據前述權利要求中任一項所述的集合,其中所述種系蛋白對包括包含在采樣的前60% Fab中的值的以Fab形式的相對展示率。
19.根據前述權利要求中任一項所述的集合,其中所述種系蛋白對包括與Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表達水平。
20.根據前述權利要求中任一項所述的集合,其中所述種系蛋白對包括以Fab形式在 70°C或更高溫度持續至少45分鐘的熱穩定性。
21.根據前述權利要求中任一項所述的集合,其中所述種系蛋白對包括與M0R03080相比至少0. 6的以IgG形式的表達水平。
22.根據前述權利要求中任一項所述的集合,其中所述可變重鏈構架區和所述可變輕鏈構架區包括選自由以下組成的組的種系蛋白對的種系蛋白序列IGHV3-23/ IGKV1-5 ;IGHV3-23/IGKV3-20 ;IGHV4-39/IGKV3-15 ;IGHV3-23/IGKV3-15 ;IGHV4-39/ IGKV1-39/1D-39 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ; IGHV1-69/IGKV1-39/1D-39 ; IGHV5-51/IGLV1-40 ; IGHV4-39/IGKV3-20 ; IGHV3-23/ IGLV2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV1-69/IGKV3-20 ;IGHV3-48/IGKV3-20 ;IGHV1-2/IGKV3-20 ;IGHV3-30/IGKV4-1 ; IGHV5-51/IGLV 2-14 ; IGHV5-51/IGKV3-20 ; IGHV3-7/IGKV1-39/1D-39 ; IGHV3-7/ IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ;IGHV3-23/IGKV3-11 ;IGHV3-30/ IGKV1-5 ;IGHV3-30/IGKV3-15 ; IGHV3-21/IGKV1-5 ; IGHV3-21/IGKV3-15 ; IGHV3-30/IGLV 1-51 ;IGHV3-21/IGLV 1-51 ;和 IGHV1-69/IGKV3-11。
23.根據前述權利要求中任一項所述的集合,其中所述抗體的所述功能片段選自由 Fab、F (ab ‘ ) 2、Fab,、Fv 禾口 scFv 組成的組。
24.編碼根據前述權利要求中任一項所述的集合的核酸的集合。
25.—種載體,所述載體包含權利要求M所述的核酸。
26.一種重組宿主細胞,所述重組宿主細胞包含權利要求M所述的核酸或權利要求25 所述的載體。
27.如權利要求沈所述的重組宿主細胞,所述重組宿主細胞是原核的或真核的。
28.根據權利要求27所述的重組宿主細胞,所述重組宿主細胞是大腸桿菌(E.coli)或哺乳動物細胞。
29.合成抗體或其功能片段的集合,所述合成抗體或其功能片段包含可變重鏈構架區和可變輕鏈構架區,其中所述構架區包括種系蛋白序列, 其中所述種系蛋白序列包含如下特性 i)在互補決定區中四個或更少的翻譯后修飾; )在互補決定區中兩個或更少的甲硫氨酸;iii)一個或更少的未成對半胱氨酸;iv)一個或更少的潛在T細胞表位; ν)中等或低的聚集傾向;和vi)至少7. 5的等電點;且其中所述抗體或其功能片段的集合包括至少兩種不同的可變重鏈種系蛋白序列, 其中所述種系蛋白序列由種系基因序列編碼。
30.根據權利要求四所述的集合,其中所述可變重鏈種系基因序列或可變輕鏈種系基因序列以至少0. 5%的濃度存在于人免疫組庫中。
31.根據權利要求四或30所述的集合,其中所述抗體或其功能片段的集合包括至少五種不同的可變重鏈種系蛋白序列。
32.根據權利要求四-31中任一項所述的集合,其中所述抗體或其功能片段包括人序列。
33.根據權利要求四-32中任一項所述的集合,其中所述可變重鏈種系基因序列或可變輕鏈種系基因序列以至少5. 0%的濃度存在于人免疫組庫中。
34.根據權利要求四-33中任一項所述的集合,其中所述抗體或其功能片段包括含種系蛋白序列的一個或更多個互補決定區。
35.根據權利要求四-34中任一項所述的集合,其中所述抗體或其功能片段包括含種系蛋白序列的FRl、CDRl、FR2、CDR2和FR3。
36.根據權利要求四-35中任一項所述的集合,其中所述抗體或其功能片段包括選自由以下組成的組的FR4區JH4、J κ 1禾口 J λ 2/3。
37.根據權利要求四-36中任一項所述的集合,其中所述抗體或其功能片段還包括多樣化的HCDR3區。
38.根據權利要求四-37中任一項所述的集合,其中所述抗體或其功能片段還包括多樣化的IXDR3區。
39.根據權利要求四-38中任一項所述的集合,其中所述集合包括IXIO4種抗體或其功能片段。
40.根據權利要求四-39中任一項所述的集合,其中所述可變重鏈種系蛋白序列選自由以下組成的組IGHV3-23 ; IGHV3-30 ; IGHV4-39 ; IGHV4-34 ; IGHV4-59 ; IGHV1-69 ; IGHV5-51 ;IGHV3-7 ;IGHV1-18 ;IGHV3-48 ;IGHV3-15 ;IGHV3-21 ;IGHV1-2 ;IGHV3-33 ; IGHV4-31 ;IGHV3-53 ;IGHV3-11 ;IGHV3-9 ;IGHV4-4 ;IGHV1-46 ;IGHV3-74 ;IGHV1-24 ; IGHV4-61 ; IGHV1-8 ; IGHV1-3 ; IGHV3-49 ; IGHV3-43 ; IGHV4-28 ; IGHV3-64 ;禾口 IGHV7-81。
41.根據權利要求四-40中任一項所述的集合,其中所述可變κ輕鏈種系蛋白序列選自由以下組成的組 JGKV3-20 ; IGKV1-39/1D-39 ; IGKV1-5 ; IGKV3-15 ; IGKV4-1 ; IGKV3-11 ; IGKV2-28/2D-28 ; IGKV1-33/1D-33 ; IGKV2-30 ; IGKV1-9 ;IGKV1-17 ; IGKV1-27 ; IGKV1-8 ; IGKV1-16 ; IGKV1-6 ;IGKV1-12 ; IGKV2D-29 ;IGKV1-13 ; IGKV1D-8 ;和 IGKV2-24。
42.根據權利要求四-41中任一項所述的集合,其中所述可變λ輕鏈種系蛋白序列選自由以下組成的組 JGLV2-14 ;IGLV1-40 ;IGLV1-44 ;IGLV1-51 ;IGLV2-23 ;IGLV3-21 ; IGLV1-47 ;IGLV3-1 ;IGLV2-11 ; IGLV2-8 ; IGLV6-57 ; IGLV3-25 ; IGLV7-46 ;IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;和 IGLV3-27。
43.一種生產根據權利要求1-3中任一項所述的合成抗體或其功能片段的集合的方法。
44.根據權利要求43所述的方法,其中所述生產的步驟還包括產生含可變重鏈構架區和可變輕鏈構架區的抗體或其功能片段的集合,其中所述可變重鏈構架區和所述可變輕鏈構架區包含種系蛋白對的種系蛋白序列, 其中所述種系蛋白對包含如下特性i)以Fab形式的相對展示率包括在采樣的前75%Fab中的值;ii)與FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性; ν)與M0R03080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性;且其中所述抗體或其功能片段的集合包括至少兩個不同的種系蛋白對。
45.根據權利要求43或44所述的方法,其中所述生產的步驟還包括如下步驟a)獲得包括在人免疫組庫中存在的可變重鏈和可變輕鏈種系基因對的數據;b)鑒定包含如下特性的可變重鏈和可變輕鏈種系蛋白對i)以Fab形式的相對展示率包括在采樣的前75%Fab中的值;ii)與FabpMxll_FH VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度持續至少45分鐘的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性; ν)與M0R3080相比至少0. 4的以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性;且c)產生包含在步驟b)中鑒定的種系蛋白對的可變重鏈種系蛋白序列和可變輕鏈種系蛋白序列的抗體或其功能片段的集合。
46.根據權利要求45所述的方法,其中步驟b)還包括如下步驟ba)鑒定以至少0. 05%的濃度存在于人免疫組庫中的可變重鏈和可變輕鏈種系基因對;bb)產生包含在步驟ba)中鑒定的種系蛋白對的抗體或其功能片段;和 be)評估所述種系蛋白對的如下特性i)以Fab形式的相對展示率;ii)以Fab形式的表達水平;iii)以Fab形式在60°C或更高溫度的熱穩定性;iv)以Fab形式在37°C持續大于十天的在牛血清或小鼠血清中的穩定性; ν)以IgG形式的表達水平;和vi)以IgG形式在37°C持續十四天的在牛血清中的穩定性。
47.根據權利要求45或46所述的方法,其中步驟a)還包括如下步驟aa)從樣品中分離人B細胞;ab)從所述B細胞產生cDNA;ac)PCR擴增來自所述B細胞的cDNA ;ad)對PCR產物測序;ae)鑒定每種PCR產物的種系基因。
48.根據權利要求43-46中任一項所述的方法,其中產生集合的所述步驟還包括如下步驟ca)合成編碼所述抗體或其功能片段的核酸;cb)將所述核酸克隆到載體中;cc)表達所述抗體或其功能片段。
49.根據權利要求43-48中任一項所述的方法,其中所述種系基因對以至少0.05%的濃度存在于人免疫組庫中。
50.根據權利要求43-49中任一項所述的方法,其中所述種系基因對以至少0.23%的濃度存在于人免疫組庫中。
51.根據權利要求43-50中任一項所述的方法,其中所述種系基因對以至少0.51%的濃度存在于人免疫組庫中。
52.根據權利要求43-51中任一項所述的方法,其中所述種系基因對以至少0.07%的濃度存在于幼稚的人免疫組庫中。
53.根據權利要求43-52中任一項所述的方法,其中所述種系基因對以至少0.52%的濃度存在于幼稚的人免疫組庫中。
54.根據權利要求43-53中任一項所述的方法,其中所述種系基因對以至少0.88%的濃度存在于幼稚的人免疫組庫中。
55.根據權利要求43-54中任一項所述的方法,其中所述抗體或其功能片段包括人序列。
56.根據權利要求43-55中任一項所述的方法,其中所述抗體或其功能片段包括至少十七個不同的種系蛋白對的種系蛋白序列。
57.根據權利要求43-56中任一項所述的方法,其中所述抗體或其功能片段包括含種系蛋白序列的一個或更多個互補決定區。
58.根據權利要求43-57中任一項所述的方法,其中所述抗體或其功能片段包括含種系蛋白序歹丨J的FRl、CDRl、FR2、CDR2和FR3。
59.根據權利要求43-58中任一項所述的方法,其中所述抗體或其功能片段包括選自由以下組成的組的FR4區JH4、J κ 1禾口 J λ 2/3。
60.根據權利要求43-59中任一項所述的方法,其中所述抗體或其功能片段包括多樣化的HCDR3區。
61.根據權利要求43-60中任一項所述的方法,其中所述抗體或其功能片段包括多樣化的IXDR3區。
62.根據權利要求43-61中任一項所述的方法,其中所述集合包括IXIO4種抗體或其功能片段。
63.根據權利要求43-62中任一項所述的方法,其中所述種系蛋白對包括包含在采樣的前60% Fab中的值的以Fab形式的相對展示率。
64.根據權利要求43-63中任一項所述的方法,其中所述種系蛋白對包括與Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表達水平。
65.根據權利要求43-64中任一項所述的方法,其中所述種系蛋白對包括以Fab形式在 70°C或更高溫度持續至少45分鐘的熱穩定性。
66.根據權利要求43-65中任一項所述的方法,其中所述種系蛋白對包括與M0R03080 相比至少0. 6的以IgG形式的表達水平。
67.根據權利要求43-66中任一項所述的方法,其中所述可變重鏈構架區和所述可變輕鏈構架區包括選自由以下組成的組的種系蛋白對的種系蛋白序列IGHV3-23/ IGKV1-5 ;IGHV3-23/IGKV3-20 ;IGHV4-39/IGKV3-15 ;IGHV3-23/IGKV3-15 ;IGHV4-59/ IGKV1-39/1D-39 ; IGHV4-39/IGKV1-39/1D-39 ; IGHV4-59/IGKV3-20 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ; IGHV1-69/IGKV1-39/1D-39 ; IGHV5-51/ IGLV 1-40 ;IGHV3-23/IGKV4-1 ;IGHV4-39/IGKV3-20 ;IGHV3-23/IGLV 2-14 ;IGHV4-39/ IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV3-30/ IGKV3-11 ;IGHV1-69/IGKV3-20 ;IGHV3-48/IGKV3-20 ;IGHV1-2/IGKV3-20 ;IGHV3-30/ IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV4-59/IGKV4-1 ;IGHV5-51/IGKV3-20 ;IGHV3-7/ IGKV1-39/1D-39 ; IGHV3-7/IGKV1-5 ; IGHV3-15/IGKV3-20 ; IGHV4-39/IGLV 2-14 ; IGHV4-39/IGLV 2-8 ; IGHV3-23/IGKV3-11 ; IGHV3-30/IGKV1-5 ; IGHV3-30/IGKV3-15 ; IGHV3-21/IGKV1-5 ;IGHV3-21/IGKV3-15 ;IGHV3-30/IGLV1-51 ;IGHV3-21/IGLV 1-51 ; IGHV3-53/IGLV 1-44 ; IGHV4-59/IGKV3-15 ;IGHV5-51/IGKV4-1 ; IGHV1-69/IGKV4-1 ;和 IGHV1-69/IGKV3-11。
68.根據權利要求43-67中任一項所述的方法,其中所述抗體的所述功能片段選自由 Fab、F (ab ‘ ) 2、Fab,、Fv 和 scFv 組成的組。
69.一種分離的核酸,所述分離的核酸編碼含C端限制酶切位點的信號序列或前導序列。
70.根據權利要求69所述的核酸,其中所述限制酶切位點是NheI。
71.根據權利要求69或70所述的核酸,其中所述信號序列或前導序列包括phoA或人重鏈前導序列。
72.根據權利要求69所述的核酸,其中所述限制酶切位點是NdeI。
73.根據權利要求69或72所述的核酸,其中所述信號序列包括ompA或人κ前導序列。
74.一種載體,所述載體包含根據權利要求69-73中任一項所述的核酸。
75.一種宿主細胞,所述宿主細胞包含權利要求74所述的載體。
76.根據權利要求75所述的宿主細胞,所述宿主細胞是原核的或真核的。
77.根據權利要求75或76所述的宿主細胞,所述宿主細胞是大腸桿菌細胞。
78.根據權利要求75或76所述的宿主細胞,所述宿主細胞是哺乳動物細胞。
79.一種分離的抗體或其功能片段,所述分離的抗體或其功能片段包括含種系蛋白對的種系蛋白序列的FRl、⑶Rl、FR2、⑶R2和FR3,其中所述種系蛋白對選自由以下組成的組IGHV3-23/IGKV1-5 ; IGHV3-23/IGKV3-20 ; IGHV4-39/IGKV3-15 ; IGHV3-23/ IGKV3-15 ; IGHV4-39/IGKV1-39/1D-39 ;IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ;IGHV1-69/IGKV1-39/1D-39 ;IGHV5-51/IGLV 1-40 ;IGHV4-39/ IGKV3-20 ; IGHV3-23/IGLV 2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/ IGKV3-20 ; IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV5-51/IGKV3-20 ;IGHV3-7/ IGKV1-39/1D-39 ;IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ;IGHV3-23/ IGKV3-11 ; IGHV3-30/IGKV1-5 ; IGHV3-30/IGKV3-15 ; IGHV3-21/IGKV1-5 ; IGHV3-21/ IGKV3-15 ; IGHV3-30/IGLV1-51 ; IGHV3-21/IGLV 1-51 ;和 IGHV1-69/I。
全文摘要
本公開內容使得鑒定人免疫組庫中的VH和VL類對、確定最普遍的VH和VL類對和具有有利的生物物理特性的VH和VL類對的方法成為可能。更具體而言,本公開內容的集合包括具有高度多樣化的CDR的最普遍的和/或最優選的VH和VL類配對。
文檔編號C07K16/00GK102449149SQ201080022793
公開日2012年5月9日 申請日期2010年5月29日 優先權日2009年5月29日
發明者喬瑟夫·普拉斯勒, 塔賈·赫爾曼, 托馬斯·蒂勒, 斯特法妮·尤林格, 馬庫斯·恩澤爾伯格 申請人:莫佛塞斯公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 张家港市| 黔西| 隆安县| 福州市| 石首市| 乡宁县| 大余县| 柘荣县| 左云县| 凤城市| 博乐市| 东辽县| 遂昌县| 如皋市| 平遥县| 大连市| 北安市| 英山县| 千阳县| 吐鲁番市| 香河县| 鄂托克前旗| 阿拉善右旗| 福泉市| 新源县| 社会| 海盐县| 吴川市| 汉中市| 延边| 小金县| 宝兴县| 精河县| 斗六市| 辽中县| 株洲市| 卫辉市| 上蔡县| 陆川县| 新安县| 遂平县|