侃大山,随便聊聊。有啥新奇特的Idea都可以分享。
原始数据在/data/public_92/Torreya_grandis/NCBI-20230420,是鑫哥整理的版本
容器用的是鑫哥的061b51fa0bb3
数据处理
把从ncbi上下载的sra数据转换为fastq
下载sratoolkit
1. 创建专用环境
conda create -n sra_tools python=3.9
2. 激活环境
conda activate sra_tools
3. 安装 sratoolkit
conda install -c bioconda sra-tools
使用
单端测序(或RNA测序数据,最开始受网上信息的误导,博主讲RNA数据用单端测序,但是运行完发现,下载数据是双端测序的数据):
fastq-dump SRR23105320.sra -O /home/lry
转换完成后,根据华东师兄的方法,压缩为gz文件
双端测序
fastq-dump SRR14306907.sra --split-3 --gzip -O ./
用华东师兄的流程跑,config,info文件的内容
PROJECT: ganhan

