1. 打开NCBI网站,第一个框选择Gene,第二个框输入基因名称,如ALK基因,点击 Search。
2. 进入第二页面后,会看到如下一系列跟ALK基因相关的信息,根据description 和location 的信息,找到自己需要的基因。空色框中表示的是物种,我需要的是人类的基因,故选择第一个。点击ALK,进入下一个页面。
3. 进入后,会看到以下关于ALK基因的详细信息:
这些信息可以略过,往下查看,点击下图红色框中的See ALK in Genome Data Viewer,进入下个页面。
4. 进入后会看到如下页面,:
将鼠标箭头放在图中红色框中的绿色线上2--5秒,不用点击。会看到下面的界面: (有些基因会出现好几个,根据自己的要求选择)
第一个红色框中:
NP 004295.2 表示蛋白质序列,NP代表蛋白质,004295是编号,后面的 .2 代表更新状态,数值越大,版本越新。 NM 004304.4 表示mRNA 序列,NM表示mRNA,004304是编号,后面的 .4 代表更新状态,数值越大,版本越新。
第二个红色框中:
CCDS33172.1 表示CDS序列,CCDS表示CDS,命名规则同上。
第三个红色框中:
NC 000002.12(29,192,774...29,921,611) 表示完整的基因序列,NC表示基因组。括号中的数字表示这个基因的碱基长度,从29,192,774bp到29,921,611bp。
要下载蛋白序列、mRNA 序列、CDS序列、基因序列,直接点击红色框中的链接即可。
5. 这里下载基因序列,点击后出现如下界面:
点击右边的Send complete record file format(有好几种格式) Create File。 常用的是FASTA 格式和 GenBank 格式。 GenBank 格式保存的信息更全面。
至此就把ALK基因的序列下载了。
二.几种代号的意思
因篇幅问题不能全部显示,请点此查看更多更全内容