20年前,科學(xué)家宣布讀取了一個(gè)人的全部脫氧核糖核酸(DNA),其實(shí),他們漏掉了少許。現(xiàn)在,由于讀取DNA方法的改進(jìn),科學(xué)家終于可以從頭到尾讀取人類(lèi)的全部基因組了!據(jù)生物預(yù)印本網(wǎng)站(biorxiv)近日?qǐng)?bào)道,美國(guó)科學(xué)家對(duì)全部人類(lèi)基因組30.55億個(gè)堿基對(duì)進(jìn)行了測(cè)序,與此前結(jié)果相比,新結(jié)果增加了2億個(gè)堿基對(duì)以及2000多個(gè)基因。
人類(lèi)擁有數(shù)萬(wàn)個(gè)基因,它們儲(chǔ)存于DNA分子中,基因信息以4種堿基(C、G、T和A)的形式存在,兩個(gè)堿基相互配對(duì)形成堿基對(duì)。
科學(xué)家于1990年啟動(dòng)了人類(lèi)基因組測(cè)序項(xiàng)目,并于2001年公布了首個(gè)人類(lèi)基因組草圖。但當(dāng)時(shí)不得不將基因組分成小段讀取,然后重新組裝在一起,而這樣無(wú)法將一些高度重復(fù)的片段放回原位。隨后遺傳學(xué)家繼續(xù)改進(jìn),但重點(diǎn)還是放在提高現(xiàn)有序列的精確度,而非增加新序列,仍有約8%的序列缺失或錯(cuò)誤。
新版本基因組由“端粒到端粒”(T2T)聯(lián)盟繪制。該聯(lián)盟由加州大學(xué)圣克魯斯分校的卡倫·米加和國(guó)家人類(lèi)基因組研究所的亞當(dāng)·菲利皮領(lǐng)導(dǎo)。
研究人員選擇從一個(gè)被稱(chēng)為CHM13的細(xì)胞系中讀取DNA。該細(xì)胞系來(lái)自水泡狀胎塊——一種妊娠失敗情況,可以在實(shí)驗(yàn)室中培養(yǎng)這種細(xì)胞。菲利皮說(shuō):“CHM13的獨(dú)特之處在于,它不是任何人的基因組。”
普通人類(lèi)細(xì)胞的每段DNA都有兩個(gè)副本,往往存在重大差異,一個(gè)來(lái)自母親,另一個(gè)來(lái)自父親,這使得對(duì)DNA精確測(cè)序變得更加困難,因?yàn)橐闱宄裁词菧y(cè)序過(guò)程中的失誤、什么是真正的差異非常棘手。使用CHM13避免了這個(gè)問(wèn)題,因?yàn)閮蓚€(gè)副本幾乎完全相同。
為組裝基因組序列,研究團(tuán)隊(duì)利用了兩種技術(shù):一種是能讀取非常長(zhǎng)(超過(guò)100萬(wàn)個(gè)堿基對(duì))片段的測(cè)序技術(shù);另一種是精確度極高、能處理差別極小的片段(比如同一個(gè)基因的多個(gè)副本)的技術(shù)。
2020年7月,該團(tuán)隊(duì)公布了完整的決定性別的人類(lèi)X染色體。現(xiàn)在,他們公布了完整的人類(lèi)基因組,新版本比上一個(gè)版本增加了近2億個(gè)堿基對(duì)以及2226個(gè)新基因,是自人類(lèi)參考基因組首次發(fā)布以來(lái)進(jìn)行的最大改進(jìn)。
(記者劉霞)
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。