已解决
vcf 文件如何修改染色体修改样本名称提取样本
来自网友在路上 189889提问 提问时间:2023-10-11 03:48:58阅读次数: 89
最佳答案 问答题库898位专家为你答疑解惑
大家好,我是邓飞。
对于vcf文件和plink文件是经常用的文件,对于基因型数据的处理,一般分为:
- 数据质控
- 数据提取
- 染色体修改名称
- 样本修改名称
今天介绍一下vcf文件的三个处理方法:
- 1,染色体修改
- 2,样本名称修改
- 3,样本提取
用到的软件是bcftools
,用到的系统是Linux
。
1. 数据描述
数据使用GWAS-Cookbook中的GWASdat1中的数据,将数据变为vcf格式。
相关基因型数据,可以在这里下载:快来领取 | 飞哥的GWAS分析教程更新啦
将plink的二进制文件,变为vcf的代码:
plink --bfile ../../gwas_cookbook/GWAS-dat1/1_QC_GWAS/HapMap_3_r3_1 --recode vcf-iid --out test1
vcf预览:
2. vcf文件修改染色体名称
整理染色体修改对应关系:
awk '{print $1}' HapMap_3_r3_1.bim |sort |uniq >chr.txt
awk '{print $1,"chr"$1}' chr.txt >chr_rename.txt
整理好的对应关系:
$ cat chr_rename.txt
1 chr1
10 chr10
11 chr11
12 chr12
13 chr13
14 chr14
15 chr15
16 chr16
17 chr17
18 chr18
19 chr19
2 chr2
20 chr20
21 chr21
22 chr22
23 chr23
25 chr25
3 chr3
4 chr4
5 chr5
6 chr6
7 chr7
8 chr8
9 chr9
代码:
bcftools annotate --rename-chrs chr_rename.txt -Oz -o test2.vcf.gz test1.vcf
gzip -d test2.vcf.gz
less -S test2.vcf
修改后的结果:
可以看到,已经修改过了。
3. 修改样本的名称
样本对应关系txt文件整理:
awk '{print $2}' HapMap_3_r3_1.fam |head >sname.txt
awk '{print $1,"new_"$1}' sname.txt >sname_change.txt
对应关系文件内容:
$ head sname_change.txt
NA06989 new_NA06989
NA11891 new_NA11891
NA11843 new_NA11843
NA12341 new_NA12341
NA12739 new_NA12739
NA10850 new_NA10850
NA06984 new_NA06984
NA12877 new_NA12877
NA12275 new_NA12275
NA06986 new_NA06986
代码:
bcftools reheader -s sname_change.txt test1.vcf -o test3.vcf.gz
修改后的vcf:
4. 提取vcf样本
代码:
bcftools view -S sname.txt test1.vcf -Ov > test4.vcf
提取后的文件:
搞定!
查看全文
99%的人还看了
相似问题
- 斯坦福机器学习 Lecture2 (假设函数、参数、样本等等术语,还有批量梯度下降法、随机梯度下降法 SGD 以及它们的相关推导,还有正态方程)
- 340条样本就能让GPT-4崩溃,输出有害内容高达95%?OpenAI的安全防护措施再次失效
- FSOD论文阅读 - 基于卷积和注意力机制的小样本目标检测
- 数智竞技何以成为“科技+体育”新样本?
- [深度学习]不平衡样本的loss
- Python实战:绘制直方图的示例代码,数据可视化获取样本分布特征
- 某汽车金融企业:搭建SDLC安全体系,打造智慧金融服务样本
- 计算样本方差和总体方差
- 小样本分割的新视角,Learning What Not to Segment【CVPR 2022】
- 学习笔记|两独立样本秩和检验|曼-惠特尼 U数据分布图|规范表达|《小白爱上SPSS》课程:SPSS第十二讲 | 两独立样本秩和检验如何做?
猜你感兴趣
版权申明
本文"vcf 文件如何修改染色体修改样本名称提取样本":http://eshow365.cn/6-18732-0.html 内容来自互联网,请自行判断内容的正确性。如有侵权请联系我们,立即删除!
- 上一篇: java基础之重载与重写
- 下一篇: 【每日一记】OSPF中Hello报文详讲