By chuand, 22 April, 2024
Forums

使用皮尔逊相关系数计算两个基因的共表达,通常会筛选出很多的候选基因,多达上千个,这对后续的分析是非常不友好的;另外将基因的共表达关系分为正共表达和负共表达也是不合理的,因为A和B之间负共表达,则B和A之间肯定是正共表达,从这一点说划分为正共表达和负共表达无意义。

A的共表达对有1000,例如B是其中的一个partner;而和B共表达的partners有2000,A也处于其中。在什么情况下可以认为A和B发生了共表达。可以使用互惠排名来进行,如果排名排在了一定的阈值范围内的时候,则认为A和B发生了共表达。下面公式是互惠排名的一个公式。

其中Rank(A->B)表示与A共表达的对中B的排名;Rank(B->A)表示B的共表达的对中A的排名,当rank小于一定阈值的时候认为两者之间发生了共表达。

下面的数据库COXPRESdb就是用了这样的原理构建了共表达关系(引用量还可以)。

为了实现这个过程,我写了一个代码来实现

用法

https://www.kdocs.cn/l/ckkcQoPxNj2f?from=docs&reqtype=kdocs&startTime=1713763676278&createDirect=true&newFile=true