GATK中如何计算Inbreeding coefficient
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,GATK中如何计算Inbreeding coefficient,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。关于近交系数是什么的定义
千家信息网最后更新 2025年12月01日GATK中如何计算Inbreeding coefficient
GATK中如何计算Inbreeding coefficient,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
关于近交系数是什么的定义,除了英文资料,中文上也给出了很清晰的定义,这里引用一下:
近交系数(inbreeding coefficient)是指根据近亲交配的世代数,将基因的纯化程度用百分数来表示即为近交系数,也指个体由于近交而造成异质基因减少时,同质基因或纯合子所占的百分比也叫近交系数,普遍以F或f来表示。
GATK近交系数的计算程序在github上可以找到:AS_InbreedingCoeff.java
代码不短,但计算思路非常简单,很容易看懂,我这里主要展示一下这个计算的核心部分,并在代码中做些许注释,如下:
protected double calculateIC(final VariantContext vc, final Allele altAllele) {
final int AN = vc.getCalledChrCount();
final double altAF;
final double hetCount = heterozygosityUtils.getHetCount(vc, altAllele);
//shortcut to get a value closer to the non-alleleSpecific value for bialleleics
final double F;
if (vc.isBiallelic()) {
double refAC = heterozygosityUtils.getAlleleCount(vc, vc.getReference());
double altAC = heterozygosityUtils.getAlleleCount(vc, altAllele);
double refAF = refAC/(altAC+refAC); altAF = 1 - refAF;
// inbreeding coefficient F = 1.0 - (hetCount / (2.0 * refAF * altAF * (double) heterozygosityUtils.getSampleCount()));
} else {
//compare number of hets for this allele (and any other second allele) with the expectation based on AFs //derive the altAF from the likelihoods to account for any accumulation of fractional counts from non-primary likelihoods, //e.g. for a GQ10 variant, the probability of the call will be ~0.9 and the second best call will be ~0.1 so adding up
//those 0.1s for het counts can dramatically change the AF compared with integer counts altAF = heterozygosityUtils.getAlleleCount(vc, altAllele)/ (double) AN;
// 计算inbreeding coefficient
// heterozygosityUtils.getSampleCount() 获取总样本数 F = 1.0 - (hetCount / (2.0 * (1 - altAF) * altAF * (double) heterozygosityUtils.getSampleCount())); }
return F;}通过利用哈迪温伯格定律来进行计算的: 1.0 - (hetCount / (2.0 (1 - altAF) altAF(double)N ,其中N是人数。这个值给出的是期望的杂合变异的个数。所以参数F(近交系数)说的就是"实际的hetCount"除以"期望的hetCount"再与1.0取差。当F值越接近0,就意味着实际的hetCount与理论的hetCount越接近。
关于GATK中如何计算Inbreeding coefficient问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。
近交
系数
基因
问题
代码
实际
更多
百分
帮助
期望
解答
易行
简单易行
世代
个体
个数
人数
参数
变异
同质
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
计算机网络技术实验考试
腾讯互联网科技城规划
逃离塔科夫斯洛伐克服务器
服务器的最高下载速度
安徽网络技术推广
Pg数据库中的表操作 打开表
数据库技术导论期末总结
软件开发团队管理在哪些工作
网络技术植入病毒
中国网络安全法处罚规定
互联网 科技强警
数据库原理期末考试题
2021年中国睡眠指数数据库
简述网络安全的挑战
登陆的jsp有数据库
怎么将数据库放到桌面
计算机网络技术网络互动
数据库dblink的用法
数据库表操作命令
水果店管理系统数据库代码
北京团建无忧科技互联网
中小企业网络安全管理
怎样做平台软件开发
扶持重点网络安全技术和项目
网络安全 pdca
数据库管理亮点
乡镇网络安全自检自查报告
人间地狱匹配不到服务器
高新区网络技术服务怎么样
计算机三级网络技术大题总结