By zhenzixu, 30 September, 2025
Forums

要下载某物种基因组,可参考以下方法:

  1. 访问专业数据库
  2. 国家基因组科学数据中心(NGDC):访问 https://ngdc.cncb.ac.cn/gwh/,在搜索框输入需下载名称,筛选相关基因组数据。
  3. 通过文献获取

    查找相关基因组研究论文。下载文中提到的基因组数据。

    4. 综合类数据库检索

NCBI:访问 https://www.ncbi.nlm.nih.gov/,选择Genome,然后在搜索框输入需下载名称,筛选相关基因组数据。

Phytozome:访问 https://phytozome-next.jgi.doe.gov/,在搜索框输入需下载名称,选择合适的基因组版本下载。

 

其中国家基因组科学数据中心(NGDC)收录了NCBI的数据

 

下载数据类型:

  • 基因组序列 (Genome Sequence): 通常是FASTA格式 (.fa, .fasta) 文件。包含染色体的全部序列。
  • 注释文件 (Annotation File): 通常是GTF或GFF格式 (.gtf, .gff) 文件。描述基因、外显子、启动子等基因组特征的位置和信息。
  • 原始测序数据 (Raw Sequencing Data): 通常是FASTQ格式 (.fq, .fastq) 文件。来自测序仪器的原始读数,用于重新分析。
  • 处理后的数据 (Processed Data): 如BAM格式 (.bam) 的比对文件,或者VCF格式 (.vcf) 的变异检测文件。

 

下载方式:

  1. 通过网页浏览器直接下载
  2. wget

NCBI通过FTP方式下载