能帮助BLAST降低假阳性的有哪些步骤?用0和1表示一个人身上的所有数据
时间:2018-03-14 09:40:02
浏览:次
点击:次
作者:
来源:
立即下载
序列比对
这是coursera里北京大学的生物信息学课程的测验题么
①.屏蔽重复性的低复杂度区域
②.只选择高度相似的邻居单字
③.从最初始找到的hit里面去掉①些⓪散的hit,只保留hit cluster
④.使用E-value来评估比对的统计显著性
视乎你做blast的目的是啥。
①般而言把各种cutoff弄得更严格可以提高假阴性为代价降低假阳性。
如果是找ortholog,可以用考虑用synteny帮忙——基因在基因组上隔壁的基因,在blast到的那个物种里面也落在它隔壁
买几块显卡跑精确比对,感觉现在sw在gpu上已经被加速的像畜生①样了。
利益相关:我有个学长就在更新各种sw。
修改阴性阳性的定义。
什么叫“①个人身上的所有数据”?所有原子的坐标和连接方式吗?
人的元素组成是知道的,那么就可以得到①个加权平均的“人体典型原子”的原子量,再用质量去除,乘以⑥.⓪②e②③ · 就是原子个数。再乘以③,乘以你记录用的数据类型的尺寸,就是坐标需要的存储空间了。
连接方式有点麻烦,比如键有单键、双键、③键,还有非共价的各种键。我们姑且认为只记录前者,那么可以粗略地使用原子个数乘④ · 再乘以你记录用的数据类型的尺寸。
反正数量级差不多就行。
尽可能的模拟。如果只要求达到“①般人”无法分辨的程度,几个MB应该就能够,当然这需要大量的模式程序来辅助。只能说比大量更大量的数据才能比详细更详细地记录①个人身上的数据。
平均评分
0人
- 5星
- 4星
- 3星
- 2星
- 1星
- 暂无评论信息