产品详情
 
当前位置
产品详情
高重复区序列测序

       目前,绝大部分的人类基因组已获得测定。但基因组中仍有许多的区域未获得测序。这其中的首要原因是在每条染色体的中心区域(称为着丝粒)含有大量重复DNA序列。这些重复片段中常常含有不少未知功能的基因,不同个体间重复片段的拷贝数不同。不少科学家认为诸如红斑狼疮、精神发育迟滞、精神分裂症、色盲、牛皮癣,以及和年龄相关的眼部黄斑变性等疾病都与此相关。因此,对重复片段数量、含量以及位置测序就显得尤为重要。

      但目前的测序方法都依赖于大量相同拷贝的读取,因而大量扩增的CGG重复(>100)只能生成不连贯的信号。这阻碍了研究人员获得单碱基分辨率的测序数据。现在,利用Pacific Biosciences公司的单分子实时(SMRT)测序技术,可以从大量扩增的CGG重复序列中产生高质量的测序数据,其原始读长可以超过10 kb,采用BLASR算法将长读取装配成环状共有序列(CCS),而目标序列的覆盖度至少为3倍,使得环状共有序列覆盖了超过750个CGG重复片段。