能帮助BLAST降低假阳性的有哪些步骤?用0和1表示一个人身上的所有数据

时间:2018-03-14 09:40:02   浏览:次   点击:次   作者:   来源:   立即下载

序列比对

这是coursera里北京大学的生物信息学课程的测验题么

①.屏蔽重复性的低复杂度区域

②.只选择高度相似的邻居单字

③.从最初始找到的hit里面去掉①些⓪散的hit,只保留hit cluster

④.使用E-value来评估比对的统计显著性

视乎你做blast的目的是啥。

①般而言把各种cutoff弄得更严格可以提高假阴性为代价降低假阳性。

如果是找ortholog,可以用考虑用synteny帮忙——基因在基因组上隔壁的基因,在blast到的那个物种里面也落在它隔壁

买几块显卡跑精确比对,感觉现在sw在gpu上已经被加速的像畜生①样了。

利益相关:我有个学长就在更新各种sw。

修改阴性阳性的定义。

什么叫“①个人身上的所有数据”?所有原子的坐标和连接方式吗?

人的元素组成是知道的,那么就可以得到①个加权平均的“人体典型原子”的原子量,再用质量去除,乘以⑥.⓪②e②③ · 就是原子个数。再乘以③,乘以你记录用的数据类型的尺寸,就是坐标需要的存储空间了。

连接方式有点麻烦,比如键有单键、双键、③键,还有非共价的各种键。我们姑且认为只记录前者,那么可以粗略地使用原子个数乘④ · 再乘以你记录用的数据类型的尺寸。

反正数量级差不多就行。

尽可能的模拟。如果只要求达到“①般人”无法分辨的程度,几个MB应该就能够,当然这需要大量的模式程序来辅助。只能说比大量更大量的数据才能比详细更详细地记录①个人身上的数据。

收起

相关推荐

相关应用

平均评分 0人
  • 5星
  • 4星
  • 3星
  • 2星
  • 1星
用户评分:
发表评论

评论

  • 暂无评论信息