德州仪器量测序领域常用名词解释大全

转载:http://blog.csdn.net/shmilyringpull/article/details/8135855

 

什么样是MTK量测序?

高通量测序技术(High-throughput
sequencing,HTS)是对价值观Sanger测序(称为一代测序技术)革命性的改变, 一遍对几八千0到几百万条核酸分子进行体系测定, 由此在多少文献中称其为后辈测序技术(next
generation sequencing,NGS )足见其划时代的改观, 同时德州仪器量测序使得对贰个物种的转录组和基因组实行鬼斧神工全貌的辨析成为或许, 所以又被称之为深度测序(Deep
sequencing)。

什么是Sanger法测序(一代测序)

Sanger法测序利用一种DNA聚合酶来拉开结合在待定连串模板上的引物。直到掺入一种链终止核苷酸截止。每2遍连串测定由一套多个独立的反应构成,种种反应含有全部多种脱氧核苷酸三磷酸(dNTP),并混入限量的一种区别的双脱氧核苷三磷酸(ddNTP)。由于ddNTP贫乏延伸所供给的3-OH基团,使延长的寡聚核苷酸选用性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一个dNTPs和ddNTPs的对峙浓度能够调整,使反应获得一主管几百至几千碱基的链终止产物。它们具有共同的初叶点,但甘休在分裂的的核苷酸上,可由此高分辨率变性凝胶电泳分离大小不一的部分,凝胶处理后可用X-光胶片放射自显影或非同位素标记举行检查和测试。

 

怎样是基因组重测序(Genome Re-sequencing)

全基因组重测序是对基因组类别已知的私人住房实行基因组测序,并在个人或群体水平上举行差别性分析的措施。随着基因组测序开支的继续不停下挫,人类疾病的致病突变切磋由外显子区域扩张到全基因组范围。通过创设差别尺寸的插入片段文库和短系列、双背后测序相结合的国策进行德州仪器量测序,达成在全基因组水平上检查和测试疾病关联的宽广、低频、甚至是文彩四溢的急转直下位点,以及
结构形成等,具有至关心重视要的科学探讨和家事价值。

什么是de novo测序

de novo测序也叫做从头测序:其不供给任何现有的种类资料就足以对某些物种实行测序,利用生物音讯学分析手段对队列实行拼接,组装,从而获得该物种的基因组图谱。获得3个物种的全基因组连串是
加快对此物种精晓的要紧走后门。随着新一代测序技术的火速发展,基因组测序所需的工本和岁月较古板技艺都大大降低,大规模基因组测序渐入佳境,基因组学商讨也迎来新的上进契机和革命性突破。利用新一代德州仪器量、高功效测序技术以及强大的生物音讯分析能力,能够长足、低本钱地质衡量定并分析全数生物的基因组体系。

 

哪些是外显子测序(whole exon sequencing)

外显子组测序是指利用连串捕获技术将全基因组外显子区域DNA捕捉并丰盛后开始展览MediaTek量测序的基因组分析方法。外显子测序相对于基因组重测序开支较低,对切磋已知基因的SNP、Indel等具有较大的优势,但无能为力商讨基因组结构变异如染色体断裂重组等。

什么是mRNA测序 (RNA-seq)

转录组学(transcriptomics)是在基因组学后新兴的一门学科,即研讨特定细胞在某一效益状态下所能转录出来的有所宝马7系NA(包蕴m奥迪Q7NA和非编码HavalNA)的类型与拷贝数。Illumina提供的mPRADONA测序技术可在方方面面mLacrosseNA领域展开各个相关钻探和新的意识。m福特ExplorerNA测序不对引物或探针进行规划,可随意提供关于转录的合理性和权威新闻。琢磨人口仅要求3遍考试即可神速转移完整的poly-A尾的EscortNA完整类别新闻,并分析基因表达、cSNP、全新的转录、全新异构体、剪接位点、等位基因特异性表明和罕见转录等最全面的转录组音信。不难的样品制备和数目解析软件扶助在享有物种中的m奥迪Q7NA测序商量。

 

什么是small RNA测序

Small 揽胜NA(micro
哈弗NAs、siRubiconNAs和 pi 索罗德NAs)是人命活动主要的调节和控制因子,在基因表达调节和控制、生物个体发育、代谢及疾病的产生等生理过程中起着十分重要的成效。Illumina能够对细胞可能协会中的全体Small
汉兰达NA举行深度测序及定量分析等研究。实验时首先将18-30
nt范围的Small
本田UR-VNA从总本田CR-VNA中分离出来,两端分别拉长一定接头后体外反转录做成cDNA再做特别处理后,利用测序仪对DNA片段进行单向后边直接测序。通过Illumina对Small RAV4NA大规模测序分析,能够从中得到物种全基因组水平的miOdysseyNA图谱,达成包蕴新miCRUISERNA分子的发掘,其职能靶基因的前瞻和评判、样品间差异表明分析、mi瑞虎NAs聚类和表明谱分析等不利使用。

什么是miRNA测序

成熟的microRNA(miRNA)是17~24nt的单链非编码大切诺基NA分子,通过与m奥迪Q3NA相互功能影响目的m奇骏NA的大吉大利及翻译,最后诱导基因沉默,调节和控制着基因表达、细胞生长、发育等生物学进度。基于第贰代测序技术的micro库罗德NA测序,能够二遍性得到数百万条micro本田UR-VNA连串,能够快速鉴定出分歧团体、差别发育阶段、差异疾病状态下已知和未知的micro奥迪Q3NA及其表达差别,为钻探micro普拉多NA对细胞进度的功效及其生物学影响提供了强压工具。

 

什么是Chip-seq

染色质免疫性共沉淀技术(ChromatinImmunoprecipitation,ChIP)也称组成位点分析法,是商测量身体内蛋白质与DNA相互成效的强有力工具,日常用于转录因子结合位点或组蛋白特异性修饰位点的钻研。将ChIP与第3代测序技术相结合的ChIP-Seq技术,能够赶快地在全基因组范围内检查和测试与组蛋白、转录因子等互作的DNA区段。

 

ChIP-Seq的原理是:首先通过染色质免疫性共沉淀技术(ChIP)特异性地富集目标蛋白结合的DNA片段,并对其举办提炼与文库创设;然后对充足获得的DNA片段进行高通量测序。商讨人士通过将取得的数百万条体系标签精显著位到基因组上,从而取得全基因组范围内与组蛋白、转录因子等互作的DNA区段消息。

什么是CHIRP-Seq

CHI福睿斯P-Seq( Chromatin
Isolation by 奥迪Q7NA Purification )是一种检查和测试与汉兰达NA绑定的DNA和蛋清的MTK量测序方法。方法是经过统一筹划维生素或链霉亲和素探针,把对象LacrosseNA拉下来之后,与其贰头作用的DNA染色体片段就会附在到磁珠上,最终把染色体片段做高通量测序,那样会得到该奥迪Q5NA可以整合到在基因组的哪些区域,但鉴于蛋白测序技术不够成熟,不大概知晓与该卡宴NA结合的蛋白。

什么是RIP-seq

KugaNA Immunoprecipitation是研讨细胞内讴歌ZDXNA与蛋白结合情形的技能,是询问转录后调节和控制互连网动态进程的无敌区工作具,能支持大家发现mi福特ExplorerNA的调节和测试靶点。那种技能使用针对对象蛋白的抗体把相应的凯雷德NA-蛋白复合物沉淀下来,然后经过分离纯化就能够对组合在复合物上的陆风X8NA举办测序分析。

LANDIP能够作为是普遍接纳的染色质免疫性沉淀ChIP技术的切近利用,但由于切磋对象是昂科雷NA-蛋白复合物而不是DNA-蛋白复合物,XC90IP实验的优化条件与ChIP实验不太一样(如复合物不须要稳定,CRUISERIP反应种类中的试剂和抗体相对不可能含有LacrosseNA酶,抗体需经途睿欧IP实验注明等等)。汉兰达IP技术下游结合microarray技术被称呼揽胜IP-Chip,帮助大家更高通量地领悟癌症以及任何病症全部品位的中华VNA变化。

什么是CLIP-seq

CLIP-seq,又称为HITS-CLIP,即紫外交联免疫性沉淀结合德州仪器量测序(crosslinking-immunprecipitation
and high-throughput sequencing), 是一项在全基因组水平公布路虎极光NA分子与路虎极光NA结合蛋白相互成效的批判性技术。其重要原理是基于奥迪Q5NA分子与奥迪Q5NA结合蛋白在紫外照射下产生耦联,以凯雷德NA结合蛋白的特异性抗原将LacrosseNA-胡萝卜素复合体沉淀之后,回收在这之中的奇骏NA片段,经添加接头、CRUISERT-PC凯雷德等手续,对那些成员举办MTK量测序,再经生物音信学的分析和处理、总计,挖掘出其一定规律,从而深刻揭破逍客NA结合蛋白与奥德赛NA分子的调节和控制功能及其对生命的意义。

何以是metagenomic(宏基因组):

Magenomics探究的对象是全部微生物群落。相对于古板单个细菌商讨以来,它装有众多优势,个中很重点的两点:(1) 微生物平常是以群人体模型式共生于某一小生境中,它们的居多性情是基于整个群落环境及个人间的互相影响的,由此做Metagenomics研商比做单个个体的钻研更能发现其特色;(2)
Metagenomics研讨无需分离单个细菌,能够钻探那个不能够被实验室分离作育的微生物。

    宏基因组是基因组学二个新生的没错钻探方向。宏基因组学(又称元基因组学,环境基因组学,生态基因组学等),是钻探一向从环境样本中提取的基因组遗传物质的课程。古板的微生物商量正视于尝试
室培育,元基因组的起来填补了不恐怕在守旧实验室中铸就的微生物切磋的空白。过去几年中,DNA测序技术的上扬以及测序通量和分析方法的创新使得人们得以一窥这一不解的基因组科学领域。

什么样是SNP、SNV(单核苷酸位点变异)

单核苷酸多态性singlenucleotide
polymorphism,SNP 或单核苷酸位点变异SNV。个体间基因组DNA连串同一职分单个核苷酸变异(替代、插入或干枯)所引起的多态性。差别物种、个体基因组DNA连串同1人置上的单个核苷酸存在出入的场景。有那种差别的基因座、DNA连串等可看成基因组作图的阐明。人基因组上平均约每1000个核苷酸即大概出现一个单核苷酸多态性的生成,当中有个别单核苷酸多态性大概与疾病有关,但只怕超过百分之五十与病魔无关。单核苷酸多态性是探讨人类家族和动物植物物品系遗传变异的主要依照。在研究癌症基因组变异时,相对刘芳规组织,癌症中特有的单核苷酸变异是一种体细胞突变(somatic
mutation),称做SNV。

 

何以是INDEL (基因组小部分插入)

基因组上小部分(>50bp)的插入或短少,形同SNP/SNV。

什么是copy number
variation (CNV):基因组拷贝数变异

基因组拷贝数变异是基因组变异的一种样式,平时使基因组中山大学片段的DNA形成畸形的正片数量。例如人类健康染色体拷贝数是2,有个别染色体区域拷贝数变成1或3,那样,该区域产生拷贝数缺点和失误或充实,位于该区域内的基因表达量也会遇到震慑。假如把一条染色体分成A-B-C-D多少个区域,则A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分别发出了C区域的扩大与扩大及缺失,扩大与扩张的职位能够是三番五次扩大与扩张如A-B-C-C-D也足以是在其余岗位的扩大与扩大,如A-C-B-C-D。

 

怎么着是structure
variation (SV):基因组结构形成

染色体结构变异是指在染色体上发生了大片段的朝令暮改。重要不外乎染色体大片段的插入和缺乏(引起CNV的成形),染色体内部的某块区域暴发翻转颠换,两条染色体之间爆发结合(inter-chromosome
trans-location)等。一般SV的显得利用Circos 软件。

什么是Segment
duplication

貌似称为SD区域,串联重复是由种类相近的局地DNA片段串联组成。串联重复在人类基因二种性的灵长类基因中公布首要功效。在人类染色体Y和22号染色体上,有十分大的SD类别。

 

什么是genotype and
phenotype

既基因型与表型;一般指有些单核苷酸位点变异与表现方式间的涉及。

 

 

什么是Read?
德州仪器量测序平台产生的行列标签就称为reads。

什么是soft-clipped
reads

当基因组爆发某一段的干枯,或转录组的剪辑,在测序进程中,横跨缺点和失误位点及剪接位点的reads回帖到基因组时,一条reads被切成两段,匹配到不相同的区域,那样的reads叫做soft-clipped
reads,那个reads对于评判染色体结构形成及外源种类整合全部首要功效。

 

什么是multi-hits
reads

是因为大部分测序获得的reads较短,2个reads能够合作到基因组多少个职位,无法区分其诚实来源的地点。一些工具根据统计模型,如将这类reads分配给reads较多的区域。

什么是Contig?
东拼西凑软件基于reads之间的overlap区,拼接获得的队列称为Contig(重叠群)。

什么是Scaffold?
基因组de
novo测序,通过reads拼接得到Contigs后,往往还索要创设454
Paired-end库或Illumina
Mate-pair库,以博得一定大小片段(如3Kb、6Kb、10Kb、20Kb)两端的类别。基于那些连串,可以明确部分Contig之间的逐一关系,这几个先后顺序已知的Contigs组成Scaffold。

微生物,什么是Contig N50?
Reads拼接后会获得部分分歧长度的Contigs。将享有的Contig长度相加,能获取贰个Contig总院长度。然后将具备的孔蒂gs遵照从长到短进行排序,如获得Contig
1,Contig 2,孔蒂g 3…………Contig
25。将Contig依照这几个顺序依次相加,当相加的尺寸达到Contig总厅长度的一半时,最终多个抬高的Contig长度即为Contig
N50。举例:Contig
1+Contig 2+ Contig 3+Contig 4=Contig总市长度*3/6时,孔蒂g 4的长度即为Contig
N50。Contig
N50得以当作基因组拼接的结果好坏的3个判定标准。

什么是Scaffold N50?
Scaffold N50与Contig N50的定义类似。孔蒂gs拼接组装获得部分分裂长度的Scaffolds。将享有的Scaffold长度相加,能获得一个Scaffold总秘书长度。然后将富有的Scaffolds遵照从长到短实行排序,如得到Scaffold
1,Scaffold
2,Scaffold
3…………Scaffold 25。将Scaffold根据这几个顺序依次相加,当相加的长短达到Scaffold总委员长度的3/6时,最终一个增进的Scaffold长度即为Scaffold
N50。举例:Scaffold
1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold总院长度*八分之四时,Scaffold 5的长度即为Scaffold
N50。Scaffold
N50足以用作基因组拼接的结果好坏的一个论断标准。

怎么是测序深度和遮住度?
测序深度是指测序得到的总碱基数与待测基因组大小的比值。假使二个基因大小为2M,测序深度为10X,那么获得的总额据量为20M。覆盖度是指测序获得的行列占全部基因组的比例。由于基因组中的高GC、重复系列等繁杂结构的存在,测序最终拼接组装获得的种类往往不或然掩盖全部的区域,那有的没有到手的区域就称为Gap。例如1个细菌基因组测序,覆盖度是98%,那么还有2%的种类区域是不曾经过测序得到的。

什么是RPKM、FPKM

RPKM,Reads Per Kilobase of exon model per Million mapped reads, is
defined in thisway [Mortazavi etal.,
2008
]:
每1百万个map上的reads中map到外显子的每1K个碱基上的reads个数。
要是有1百万个reads映射到了人的基因组上,那么具体到种种外显子呢,有多少映射上了啊,而外显子的长度不一,那么每1K个碱基上又有些许reads映射上了吧,这差不多便是这一个LX570PKM的直观解释。

微生物 1 

假定对应特定基因的话,那么正是每1000000
mapped到该基因上的reads中每kb有多少是mapped到该基因上的exon的read
Total exon reads:This is the number in the column with header Total
exonreads in the row for the gene. This is the number of reads that have
beenmapped to a region in which an exon is annotated for the gene or
across theboundaries of two exons or an intron and an exon for an
annotated transcript ofthe gene. For eukaryotes, exons and their
internal relationships are defined byannotations of type
m科雷傲NA.映射到外显子上海市总的reads个数。那一个是炫耀到某些区域上的reads个数,这一个区域可能是已知注释的基因或然跨多个外显子的分界或者是有些基因已经注释的转录本的内含子、外显子。对于真核生物来说,外显子和它们本人内部的涉及由某项指标mLacrosseNA来诠释。

Exonlength: This is the number in the column with the header Exon length
inthe row for the gene, divided by 1000. This is calculated as the sum
of thelengths of all exons annotated for the gene. Each exon is included
only once inthis sum, even if it is present in more annotated
transcripts for the gene.Partly overlapping exons will count with their
full length, even though theyshare the same
region.外显子的长度。计算时,总括有所有个别基因已注释的享有外显子长度的总额。就算有些基因以各样申明的转录本展现,这么些外显子在求和时只被含有
三次。即便一些重叠的外显子共享相同的区域,重叠的外显子以其总司长来测算。
Mapped reads: The sum of all the numbers in the column with header
Totalgene reads. The Total gene reads for a gene is the total number
ofreads that after mapping have been mapped to the region of the gene.
Thus thisincludes all the reads uniquely mapped to the region of the
gene as well asthose of the reads which match in more places (below the
limit set in thedialog in
figure18.110)
that have been allocated tothis gene’s region. A gene’s region is that
comprised of the flanking regions(if it was specified in
figure 18.110),
the exons, the introns andacross exon-exon boundaries of all transcripts
annotated for the gene. Thus,the sum of the total gene reads numbers is
the number of mapped reads for thesample (you can find the number in the
中华VNA-Seq
report).map的reads总和。映射到某些基因上的持有reads总数。由此那包罗全体的绝无仅有映射到那么些区域上的reads。

比喻:比如对应到该基因的read有1000个,总reads个数有100万,而该基因的外显子总院长为5kb,那么它的EvoquePKM
为:10^9*1000(reads个数)/10^6(总reads个数)*伍仟(外显子长度)=200要么:一千(reads个数)/1(百
万)*5(K)=200以此值反映基因的发挥水平。

FPKM(fragments per kilobase of exon per million fragments mapped).
FPKM与MuranoPKM总括形式基本一致。差别点正是FPKM计算的是fragments,而宝马7系PKM总括的是reads。Fragment比read的意义
更广,因而FPKM包涵的意思也更广,能够是pair-end的3个fragment,也足以是1个read。

何以是转录本重构

用测序的数据组装成转录本。有三种组装格局:1,de-novo创设;
2,有参照基因组重构。当中de-novo组装是指在不重视参考基因组的情状下,将有overlap的reads连接成三个更长的行列,经过持续的延长,
拼成贰个个的contig及scaffold。常用工具包蕴velvet,trans-ABYSS,Trinity等。有参考基因组重构,是指先将
read贴回到基因组上,然后在基因组通过reads覆盖度,junction位点的新闻等获取转录本,常用工具包含scripture、
cufflinks。

什么是genefusion

将基因组地方差异的四个基因中的一有的或任何结合到一块,形成新的基因,称作融合基因,或嵌合体基因。该基因有恐怕翻译出融合或嵌合体蛋白。

如何是发挥谱

基因表达谱(geneexpression
profile):指通过塑造处于某一一定情景下的细胞或团体的非偏性cDNA文库,大规模cDNA测序,收集cDNA体系片段、定性、定量分析其m中华VNA群众体育组成,从而描绘该特定细胞或团体在一定情景下的基因表达体系和丰度消息,那样编写制定成的数据表就叫做基因表达谱

何以是功力基因组学

意义基因组学(Functuionalgenomics)又屡次被称为后基因组学(Postgenomics),
它应用结构基因组所提供的音信和产物,发展和使用新的试验手段,通过在基因组或种类水平上无微不至剖析基因的效用,使得生物学探讨从对单一基因或维生素得研讨转向两个基因或维生素同时实行系统的斟酌。那是在基因组静态的碱基连串弄明白以往转入对基因组动态的生物学效能学研商。研讨内容包罗基因功效发现、基因说明分析及骤变检查和测试。基因的效果包罗:生物学效应,如作为类脂激酶对特异血红蛋白实行磷酸化修饰;细胞学功效,如参预细胞间和细胞内信号传递途径;发育上功用,如参预形态建成等。采取的手段包蕴经典的减法杂交,差示筛选,cDNA代表差别分析以及m陆风X8NA差别展现等,但那个技巧无法对基因实行完善系统的辨析,新的技巧出现,包罗基因表达的连串分析(serial
analysis of gene expression,SAGE),cDNA微阵列(cDNA
microarray),DNA 芯片(DNA chip)和连串标志片段展现(sequence
tagged fragmentsdisplay。

什么是比较基因组学

相比较基因组学(ComparativeGenomics)是依据基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来询问基因的效用、表达机理和物种进化的教程。利用情势生物基因组与人类基因组之间编码顺序上和布局上的同源性,克隆人类疾病基因,揭发基因作用和疾病分子机制,声明物种进化关系,及基因组的内在结构。

什么是表观遗传学

表观遗传学是商量基因的核苷酸系列不发生改变的景色下,基因表达了可遗传的变型的一门遗传学分支学科。表观遗传的景色很多,已知的有DNA甲苯化(DNAmethylation),基因组印记(genomicimpriting),母体效应(maternaleffects),基因沉默(genesilencing),核仁显性,休眠转座子激活和哈弗NA编辑(宝马X3NA editing)等。

怎么是计量生物学

测算生物学是指开发和选取数据解析及理论的方法、数学建立模型、总括机仿真技术等。当前,生物学数据量和复杂不断增高,每1半年基因钻探发生的数码就会翻一番,单单依靠观看和尝试已难以应付。由此,必须依靠广大总括模拟技术,从海量音讯中提取最实用的数据。

怎么是基因组印记

基因组印记(又称遗传印记)是指基因依据亲代的不等而有差异的表述。印记基因的存在能造成细胞中多个等位基因的二个表达而另二个不揭橥。基因组印记是一例行进度,此境况在一些低等动物和植物中已觉察多年。印记的基因只占人类基因组中的少数,大概不超过5%,但在胎儿的生长和行为发育中起重视大的效果。基因组印记病首要表现为过度生长、生长迟缓、智障、行为十三分。方今在肿瘤的切磋中觉得印记缺点和失误是引起肿瘤最广泛的遗传学因素之一。

怎么是基因组学

基因组学(英文genomics),学士物基因组和哪些采纳基因的一门学问。用于回顾涉及基因作图、测序和任何基因组功用分析的遗传学分支。该科目提供基因组新闻以及相关数据系统利用,试图缓解生物,艺术学,和工业领域的严重性题材。

什么是DNA甲基化

DNA十五烷化是指在DNA十八烷化转移酶的意义下,在基因组CpG二核苷酸的胞嘧啶5’碳位共价键结合四个加氢苯基团。平常状态下,人类基因组“垃圾”系列的CpG二核苷酸相对稀少,并且一而再处在乙基化状态,与之相反,人类基因组中山高校小为100—一千 bp左右且富含CpG二核苷酸的CpG岛则总是处于未乙烷化状态,并且与56%的人类基因组编码基因有关。人类基因组连串草图分析结果表明,人类基因组CpG岛约为28887个,大多数染色体每1
Mb就有5—1四个CpG岛,平均值为每Mb含10.四个CpG岛,CpG岛的数据与基因密度有美好的应和关系[9]。由于DNA对二甲苯化与人类发育和肿瘤疾病的密切关系,特别是CpG岛异戊二烯化所致抑癌基因转录失活难题,DNA十一烷化已经济体制改良成表观遗传学和表观基因组学的重中之重切磋内容。

什么是基因组注释

基因组注释(Genomeannotation) 是利用生物消息学方法和工具,对基因组全体基因的生物学效应拓展MediaTek量注释,是眼前效应基因组学研讨的三个热门。基因组注释的商讨内容囊括基因识别和基因作用注释八个方面。基因识别的宗旨是规定全基因组类别中持有基因的贴切地方。

转自:测序中中原人民共和国

相关文章