要下载某物种基因组,可参考以下方法:
- 访问专业数据库
- 国家基因组科学数据中心(NGDC):访问 https://ngdc.cncb.ac.cn/gwh/,在搜索框输入需下载名称,筛选相关基因组数据。
通过文献获取
查找相关基因组研究论文。下载文中提到的基因组数据。
4. 综合类数据库检索
NCBI:访问 https://www.ncbi.nlm.nih.gov/,选择Genome,然后在搜索框输入需下载名称,筛选相关基因组数据。
Phytozome:访问 https://phytozome-next.jgi.doe.gov/,在搜索框输入需下载名称,选择合适的基因组版本下载。
其中国家基因组科学数据中心(NGDC)收录了NCBI的数据
下载数据类型:
- 基因组序列 (Genome Sequence): 通常是FASTA格式 (
.fa,.fasta) 文件。包含染色体的全部序列。 - 注释文件 (Annotation File): 通常是GTF或GFF格式 (
.gtf,.gff) 文件。描述基因、外显子、启动子等基因组特征的位置和信息。 - 原始测序数据 (Raw Sequencing Data): 通常是FASTQ格式 (
.fq,.fastq) 文件。来自测序仪器的原始读数,用于重新分析。 - 处理后的数据 (Processed Data): 如BAM格式 (
.bam) 的比对文件,或者VCF格式 (.vcf) 的变异检测文件。
下载方式:
- 通过网页浏览器直接下载
- wget
NCBI通过FTP方式下载