接頭是一段序列已知的短核苷酸序列,與目標(biāo)核酸片段兩端連接,測序時與測序芯片上的已知序列進(jìn)行雜交,從而將文庫結(jié)合到芯片上,進(jìn)而啟動測序。隨著測序技術(shù)的發(fā)展,接頭種類越來越多,比如單端/雙端接頭、UMI接頭、轉(zhuǎn)座酶接頭、完整/不完整接頭等等,適配于多種應(yīng)用場景。下面一起系統(tǒng)地梳理下這些接頭,看看該如何選擇!
接頭結(jié)構(gòu)介紹
●P5和P7端:illumina平臺中,與測序芯片上的P5和P7端結(jié)合,將待測文庫固定到測序芯片上,以便于通過橋式PCR進(jìn)行成簇反應(yīng);
●Rd1 SP和Rd2 SP:測序引物結(jié)合的區(qū)域,指示序列開始讀取的位置;
●Index:用于區(qū)分不同樣本的一段已知的合成序列
圖1. Illumina平臺單端index 文庫示意圖
圖2. MGI平臺單端index文庫示意圖
Index/Barcode的作用
Index也稱Barcode,隨著測序通量的提升,可實(shí)現(xiàn)多個樣本同時測序,因此就在接頭中引入了index或Barcode的序列以區(qū)分不同的樣本。 Index長度一般為6nt-18nt的已知合成序列,根據(jù)index的數(shù)目分為單端index和雙端index,雙端index分別位于待測片段的兩端。在選擇index組合的時候需要考慮到堿基平衡和熒光平衡。
堿基平衡,指的是Index的復(fù)雜度和平衡度,是多個Index之間的平衡,而非單個Index內(nèi)部的堿基平衡,需要從堿基種類和堿基分布兩個方面考慮,組合的原則是:同一組index中的A/T/C/G四種堿基都需要包含,且這4種堿基的比例接近,各占25%左右。
熒光信號平衡,是指在不能保證堿基平衡的情況下,選擇保證熒光信號的平衡。在Illumina平臺中的4通道測序儀中,dG/dT使用綠色熒光標(biāo)記,dC/dA使用紅色熒光標(biāo)記。測序時每個循環(huán)里綠色和紅色兩種熒光信號都必須存在以保證測序順利進(jìn)行。因此在選擇Index時需要考慮綠色信號和紅色信號的平衡。
● 雙端index之UDI&UDB:減少index hopping和misassignment的好幫手
Unique Dual Index&Unique Dual Barcode,雙端唯一index,兩端index一一對應(yīng),成組設(shè)計(jì),兩端可交叉驗(yàn)證;
● 雙端index之CDI:Combined Dual Index,一對多的接頭,即可以根據(jù)一定的要求對兩端的index進(jìn)行組合,最終形成的是雙端index文庫;
Illumina為了進(jìn)一步提升通量與擴(kuò)增效率,降低測序成本,為Novaseq等高通量型測序儀引入了陣列式流動槽(PFCT)和排他性擴(kuò)增(ExAmp)成簇技術(shù),但無意間卻放大了Index hopping的樣本標(biāo)簽錯配現(xiàn)象。
圖3. Illumina不同儀器型號采取Non-patterned Flow Cell或Patterned Flow Cell模式圖
為了彌補(bǔ)HiSeq3000/4000、HiSeq X Series及NovaSeq等測序平臺凸顯的標(biāo)簽跳躍問題,Illumina提出在文庫的兩端都帶上獨(dú)特標(biāo)簽(UDI)的策略,可以進(jìn)行雙側(cè)校驗(yàn),剔除標(biāo)簽錯配的接頭。采用雙端唯一index分析數(shù)據(jù)時,可以將index錯誤分配率降低到0.01%,與之前常規(guī)的index排列組組合方法對比,Index hopping降低了兩個數(shù)量級。
在PCR-free的文庫構(gòu)建中,可選擇單端index接頭,其標(biāo)簽錯配主要是由于測序錯誤錯誤引起,整體而言,標(biāo)簽錯配率較低(平均為 0.0004%,最高至 0.001%);但在靶向捕獲文庫構(gòu)建中,由于多個步驟都會導(dǎo)致標(biāo)簽錯配,因此串?dāng)_問題則被放大,通常會采用UDI/UDB的接頭。
UMI接頭:低頻突變檢測、絕對定量的利器
Unique molecular identifier,單一分子標(biāo)簽,是一段序列已知的隨機(jī)合成序列,可以設(shè)計(jì)為完全隨機(jī)的核苷酸鏈、部分簡并核苷酸鏈或者固定核苷酸鏈,長度通常為10nt(單端UMI)或5-8nt(雙端UMI)。其作用是凍結(jié)DNA片段擴(kuò)增前的狀態(tài),每個DNA分子對應(yīng)一個UMI,因此生信分析時可以區(qū)分不同來源的DNA模板,分辨哪些是PCR擴(kuò)增及測序過程中的隨機(jī)錯誤造成的假陽性突變,哪些是患者真正攜帶的突變,從而過濾掉背景噪音,實(shí)現(xiàn)低頻和極低頻突變的準(zhǔn)確檢測,對不同DNA分子進(jìn)行絕對定量等。廣泛應(yīng)用于低頻突變檢測,尤其是在腫瘤的研究領(lǐng)域中。
圖4. illumina平臺UMI接頭結(jié)構(gòu)示意圖
完整接頭&不完整接頭&Tn5接頭
除Tn5接頭外,接頭通常以TA連接的方式與目的片段連接。按照有無完整的P5端和P7端(Illumina平臺)分為完整接頭和不完整接頭:
●完整接頭:PCR-free文庫構(gòu)建的必備產(chǎn)品
完整接頭包含測序時所需要的全部序列,如在Illumina平臺中有P5端、P7端、RdS1及RdS2,同時根據(jù)建庫測序要求包括Index序列、UMI序列等,可不進(jìn)行PCR反應(yīng)引入其它接頭成分而直接上機(jī)測序,可用于構(gòu)建PCR-Free的文庫,PCR-free文庫可以減少PCR擴(kuò)增偏好性、錯誤率以及序列重復(fù),提高一些高GC或者高AT區(qū)域的覆蓋度,在群體基因組研究中應(yīng)廣泛。
圖5. 完整接頭示意圖
●不完整的接頭
不完整接頭需要在接頭連接反應(yīng)后,通過PCR的方式加上其它部分序列,以形成一個完整的接頭,也就是說不完整接頭最終一定要通過PCR擴(kuò)增形式形成完整接頭才能上機(jī)測序,PCR的過程一方面是是對完整文庫的一個富集作用,保證有效文庫的濃度,同時還可以引入雙端index和UMI序列;
●Tn5接頭:片段化與接頭連接同步進(jìn)行,省時省樣本
Tn5接頭是通過Tn5的限制性內(nèi)切酶活性,在識別并切割雙鏈DNA時,將接頭的部分序列連接到DNA片段兩端,最后經(jīng)過PCR的方式引入其余部分序列以及index、UMI等序列,最后形成完成的文庫??捎糜贑UT&Tag文庫構(gòu)建。
圖6. Tn5接頭文庫構(gòu)建示意圖
接頭產(chǎn)品推薦
DNA文庫構(gòu)建配套接頭產(chǎn)品
平臺 |
產(chǎn)品名稱 |
接頭類型 |
貨號 |
規(guī)格 |
產(chǎn)品詳情 |
濃度 |
Illumina |
不完整接頭UDI |
12404/12405/12406/12407-ES01 |
12×2 T/96×2 T/192×2 T/384×2 T |
分別包含12/96/192/384種 index接頭,預(yù)混液形式 |
接15μM; 引物12.5μM |
|
不完整接頭CDI |
12412/12413-ES02 |
96×2 T |
分為2個set,共包含384種接頭 |
接15μM; 引物25μM |
||
Tn5不完整接頭-雙端index(8bp) |
12610ES96 |
96T |
共96種 index |
- |
||
Hieff NGS® Dual UMI UDI Adapter Kit for Illumina®,Set1-Set2 |
不完整接頭-UMI 雙端index |
13370/13371-ES04/16 |
48×4 T/16T |
共96種index |
- |
|
完整接頭-單端Index(8bp) |
13519/13520-ES04/ES16 |
48×4 T/48×16T |
分為兩個Set,每個Set48種,共96種 |
15μM |
||
MGI |
Hieff NGS® Dual UMI UDB Adapter Kit for MGI®,Set1/Set2 |
不完整接頭-雙端index-UMI -UDB |
13367/13368-ES02/7ES04 |
48 x 2 T/48 x 4 T |
分為2個Set,共96種 |
接頭10μM; 引物12.5μM |
Hieff NGS® Unique Dual Index Primer Kit for MGI®,Set1/Set2/Set3/Set4 |
不完整接頭-雙index-UDI |
13536/13537/13538/13539-ES02/ES04 |
96 x 2 T/96 x 4 T |
分為4個Set,共384種 |
接頭10μM; 引物10μM |
|
完整接頭-單端Index |
13360ES02/04/96 |
8×2 T/8×4 T/8×100 T |
8種index ,41-48 |
10μM |
||
13361ES02/04/96 |
16×2 T/16×4 T/16×100 T |
16種index ,57-72 |
||||
13362ES02/04/96 |
96×2 T/96×4 T/96×100 T |
96種 index,1-96種 |
RNA文庫構(gòu)建接頭產(chǎn)品
平臺 |
產(chǎn)品名稱 |
接頭類型 |
貨號 |
規(guī)格 |
產(chǎn)品詳情 |
可搭配建庫試劑盒 |
濃度 |
Illumina |
不完整接頭-雙端index |
12414ES02/12415ES02 |
96×2 T |
分為2個set,共包含384種接頭 |
12252/12301/ |
接15μM;引物10μM |
|
MGI |
不完整接頭-雙端index |
13365ES02/13366ES02 |
96×2 T/96×2 T |
16×24共384種 |
13330/13333 |
接頭10μM;引物10μM |
使用注意事項(xiàng)
1)為了您的安全和健康,請穿實(shí)驗(yàn)服并戴一次性手套操作;
2)本試劑盒中DNA Adapter接頭使用量根據(jù)所用試劑盒進(jìn)行調(diào)整,具體使用方法對應(yīng)的文庫構(gòu)建說明書;
3)MGI平臺的接頭需要特定的Index組合保持堿基平衡,使用時按照說明書的要求進(jìn)行混樣和使用;
4)勿將接頭與連接體系預(yù)混,容易造成接頭自連,導(dǎo)致連接和擴(kuò)增效率低;
5)切勿加熱接頭和置于高溫環(huán)境中,否則容易結(jié)構(gòu)改變,導(dǎo)致連接效率下降,應(yīng)在室溫讓其緩慢溶解,實(shí)驗(yàn)室溫度最好設(shè)置為20-25℃;
6)接頭避免反復(fù)凍融,可短暫存放于4℃;
7)本產(chǎn)品僅作科研用途!