Description

如果有什么常用的资源,可以大家一起分享的,请在此处分享。

By wuzhenzhen, 25 September, 2025
Forums

截止2025.09.25,BreedRupal 香榧品种数据库一共进行了三次备份:

注意:需要在每一次大批量导入数据前后,都需要备份数据库。

第一次: 2024-11-26

本次记录是在完成潘母港的全部数据录入后。
具体操作:

By zhenzixu, 30 August, 2025
Forums

一、 准备环境 确保已安装: 

• bedtools(用于基因组操作) 

• samtools(用于索引基因组文件) 

• grep、awk(文本处理) 

如未安装,运行以下命令:

sudo apt-get update 

sudo apt-get install bedtools samtools 

二、 准备输入文件 

• 基因组文件 genome.fa 

• 注释文件 .gff 

三、 提取 

1.生成索引基因组文件 samtools faidx genome.fa 

2.创建基因位置提取脚本 

注:将脚本以.txt格式上传,extract_promoters.txt 

3.执行脚本

 # 使脚本可执行 

chmod +x extract_promoters.sh 

# 运行脚本 

./extract_promoters.sh 

结果验证: 

# 查看提取的基因数量 

grep -c ">" target_promoters.fa 

# 查看序列长度分布 

By zhenzixu, 30 June, 2025
Forums

注:使用脚本在附件中

•main.py - 自动化流程控制 

•bmk_spatial_h5ad.py - 数据转换脚本 

将数据转换为Scanpy兼容的h5ad格式 

•S1000_Scanpy_v1.0.py - 可视化分析 

(1)预处理 ①展示在所有细胞中占比最高的基因的计数(top10); ②过滤;③标准化; ④识别高度多变的基因(top2000); ⑤利用回归模型消除不同细胞的counts之间的差异(测序导致) 

(2)聚类 

(3)差异分析(每个聚类top20)