Description

侃大山,随便聊聊。有啥新奇特的Idea都可以分享。

By ruiyuan Li, 5 November, 2024
tgra_comparison.csv文件包含所有的新旧id的对应关系 如何只找的我们关注的旧id所对应得新id 使用方法 python 脚本名字 对应关系文件 旧id文件 output_file
By wuzhenzhen, 7 September, 2024

1. ingroup物种选择错误

ingroup需要填写感兴趣的物种;outgroup是研究的物种的外类群。但是,需要注意的是ingroup和outgroup不应该包含全部的物种。

2. Blast报错

# 报错的具体信息:
Error:(803.7)Blast-def-line-set.E.seqid.E.local.str
Bad char [0x9]in Visiblestring at byte 252

该错误是由于物种的蛋白质序列文件出错所导致的,需要利用gffread根据基因组序列文件和注释文件重新生成蛋白质序列文件。但,并不清楚到底为什么下载的蛋白质序列文件会在makeblastdb这一步报错。

3. 基因ID不规范导致的报错

By chenyi, 7 September, 2024

Drupal中,内容和设计分开处理。内容存储在数据库中,而主题系统负责呈现设计和样式。当前大部分CMS都采用这种前后台分开的方式,因为这样可以在重复利用网站后台功能的前提下,开发出不同的网站前台样式,以更灵活的方式去满足不同的设计需求。

By wuzhenzhen, 18 August, 2024

基于基因组数据文件和注释文件,利用gffread命令生成蛋白质序列文件时,出现了下面报错信息:

# 提取蛋白质的输入命令:
gffread R.vialii
.gff -g R.vialii
.fasta -y R.vialii
.protein.fa

# 报错信息:
Warning: couldn't find fasta record for 'GWHCAXW00000027'!
Error: no genomic sequence available (check -g option!)

但是通过提取基因组文件和注释文件中的染色体名称后,发现两个文件中都有 'GWHCAXW00000027' 这一条染色体的相关信息,并不存在序列确实的文件。重新运行该命令后依旧会报错。

后续发现,gffread命令会在中途生成一个 .fai 的索引文件,在这个索引文件中包含了所有的染色体信息。但是第一次使用gffread的时候,生成的文件少了一条序列,所以后续的反复尝试都是基于这个文件进行的,所以重新运行后也一直在报错。