基因启动子查询
启动子:RNA聚合酶特异性识别和结合的DNA序列,控制基因表达(转录)的起始时间和表达的程度,启动子是位于结构基因5'端上游的DNA序列,能活化RNA聚合酶,使之与模板DNA准确的结合并具有转录起始的特异性。以小鼠的nestin基因为例介绍启动子查询
1.打开NCBI网站http://www.ncbi.nlm.nih.gov/
数据库选择gene,输入nestin mouse搜索如下对话框
选择第一个基因,打开链接,出现如下对话框
链接:http://www.ncbi.nlm.nih.gov/gene/18008
2.在如基因组信息区域选择genebank,会出现该基因的基因组信息,链接http://www.ncbi.nlm.nih.gov/nuccore/NC_000069.6?from=87971093&to=87980451&report=genbank
出现如下截图
3.将红色箭头设置序列对话框向前设置3000bp,后点击update view按钮
更新后的页面链接
http://www.ncbi.nlm.nih.gov/nuccore/372099107?report=fasta&from=87971093&to=87980451
此时的3000bp序列就是小鼠的nestin启动子序列
>gi|372099107:87968094-87971093 Mus musculus strain C57BL/6J chromosome 3, GRCm38.p3 C57BL/6J
TATGTTAGAGCAAATCTCTGGTATACAGATGATTTTTCCATTTTTAAAAGATAAAAGAAGGGGTGGGGGA
GTCTGGGGAGAACGTTCAGAAGTGGCACCTCACGAGGGGAAGGAAAAGAGGGAAGAACAGGTCACCAGCC
TTGGACCTCAGGTGACTGAAGGAGAGAATGTATTTGTTGCCTGTCAGACCTTTGCGTCCTTCAGTGACAC
CCTTGTCCATGTTACTGATCTTTCTGGCAAGGAAACCGTCTGCCGTGTGACTGGCAGGATGAAGGTAAAG
GCTGCCTGAGATGAGTCCTCTCCGTATGCAGCCATGTTGGCTGCCCAGGATGTTGCCCAGAGGTGCAAGG
GGCTGGGCATCACCACCCTGTGTATCAAACTCCGGGCCACAGGAGGAAACAGGACCAAGACCCCAGGACC
TGGAGCCCAGTCAGCCCTCAGAGCTCTGGGATGAGGATTGGGCAGATAGAAGTTGTCATCCCCATCCCCT
CTGACAGCACTGGAAGGAAGAGGGTCATCATGGTTGTCATCTGTGAACAGGACTTCTCAAATTATTTTCT
GTTAATGAATTGCTTTGTGTAAGCTAAAAAAAAAAAAAAAGATGAAAGGAGATTTCCCTGCGAATGGGAA
GGATTGCTTGCTTATTGTTTTTTCGAGACAGGTTTCTCTGTGTAGCCCTGGCTGTCCTGGAACTCACTTT
GTAGACCAGGCTGGCCTCGAACTCAGAGATCCACCTGCCTCCACCTGCCTCTGCCTCCCAAGTGCTGGGA
TTAAAGGCATGCGCCACCACTGCCTGGCCTGCTTGTTTATGCTTATGTAGAGCTGAATCTTGCCTGAACA
TTTGGTACTTCAGGTCCATGATGGAACACCTTCAACATTTTCAGAATTGATCCATACTTTAATTTAAAAA
AATAGTTTATTGTTATTTGTGTGTGTGTGTGTGTGTGTGTGTGTGCATGGGCGTGTATATCTGTGTGTGG
ATGCATGCAGAGGTCAGAGGCTTTGATGTCCCTGGAGCTGCATGTGGGTGCTGGGAATGGTACTTGAGTC
CTCTGGAAGAGCAGCAAGTGCTTTTGACTACTGAGCGTCTGTCTCTCCAGCCCAGATATCCTGATTTCGT
AACCATCAGTGCTGAGAATGCCAATCTGTATGAACGATTCTGCCCATAGAAGTATGTTTAGGACCATTTC
AGACATTTTTGGAAATTTTGTCCTAATCCCAAGTCAAAATTCACTGAACGATTTATTTATTTATTATATA
TAAGTACACTGTAGCTGTCTTCAGACACACCAGAAGAGGGCATCAGATCTCATTGCAGATGGTTGTGAGC
CACCGTGTAGTTGCTTGGAATTGAACTGAGGACCTCTGGAAGGGTAGTCAGTGCTCTTAATTACTGAGCA
GTCTTTCCAGCCCCCTATTTTTTTTTTCTTTTAAGGCAGGATCTGACTATGTAATCCTGGGTGGCCCAGA
ACTCATTTGCTATGTAGAGGCTGGCCTCAAACTCAGAGATTGGCTTTATTCTTTCTCTTGCGTGCTGGGG
TTAAAGGGATTAAACTGGCCTCACTGAACAAAGTTTGATGAAACTCATGTCATTGACTCAAACAGCTATT
TTAAAGAATTTAGATTTATTATTGTTCTTCTTATTATTGGTGTGTGTGTGTGTGTGTGTGTGTACAGGTG
CACCATGCCACAGTATGCCATGTGGGAACCAGTCTCTCCTCAGCTCACTATGCGGGTCCTGAACATCACA
GTAGGGAGCATGGCAACAGGCAGGCGGTTATGGCACTGGAACAGCAGCTGAGAGCTCAGGTCTCAATGTA
CAAGCACAAGCCTGCCCCCAGTGACACACCTCCTCCAACAAGGCCATTCCTCCCAATCCTTTTTTTTTTT
TTTTTTTTTTTTTTGGATTTTTGAGACAGGGTTTCTCTGTGTAGCTCTGGCTGTCCTGGAACTCACTCTG
TAGACCAGGCTGGTCTCGAACTCAGAAATCCGCCTGCCTTTGCCTCCCAAGTGCTGGGATTAAAGACATG
TGCCACCACTGCCCGGCCCCAATCTTTTTAAACAGGTCCTCCACCTGGGGAGCAAGCATTCAAATATTTG
AGCCTGAAATATTGGTCCCTTGTAGAAAATCTACAGCTTCATTTCTTTCTTCGCCAAACTTCATGCTTAG
CCACCAGGGGGCTCTCTTGAGAGCCGCGTAACTTCTTCACTAAATGACAAGAGGGATCGAACTTCAAAGG
AGAAAAACTTTCCCTTGCTAGTCTCCTTTTCCTGGTGCGGGGTAGGGTAGGGTAGGACGTCCCTCTGCGG
GTACGAACTGGGCATTGTGTCTGCTAACATTAACTGGGCAGGGGTACTGGCACAGGCATTTAATCCCAGC
ACTGGGGAAGCTATGGCAGGAGCGTCCCTGAGACCTGCCTGATCTACATAGCCATACCAACCATCTGAAG
AAAAGGGGTGGTGGTGGTGTTTACTACCCAGGCTGGTGTCAATCCTACTTCAGCCTCCGGAGCACTGGCA
GACTTCCCTCAGTACCAGTGGGCTCCTCTTTCTTCGGGCAGTGTTTCTTCGCAATGTTGCCTCTCTTGGG
GGTGAGTATTTACTGTTATACACAAAACACTGCACCGTCCGTTTTTCCAACAGTTCACGAGGTTTCCAAC
ACCAAGCCATTTTATAAATGAGGAGCTGAGTCCTAGAGGATTTGAGTAAGAGTGTAGAGAAAGGAGGTCC
TGGGGCCCAGTTCTGTGCATCTTAGGGTGTTCTGGGCTGTCTGGCTGTATCTCAAGCCTCTTTCGGAAAA
TCACCCGCACCGGACGGGATCCCCGCCAGGGCGAGGCTACAATTTGATTCTTCTCTGCTGAGCTGGGATG
ATGCAGGGACCCGGGCTGTGTGTTGCACTGAACTCTAAAGGGTTAAGGCCTAGGGACCGCCCCTTTTCCG
CCCGGCCGGCGGGAGTATGAATACCCTCGCTTCAGCTCGCTGCTGGAATCCTCCGCTTCC