2021.04.12丨对测序样品统一命名

编程入门 行业动态 更新时间:2024-10-10 08:24:03

2021.04.12丨对测序<a href=https://www.elefans.com/category/jswz/34/1751283.html style=样品统一命名"/>

2021.04.12丨对测序样品统一命名

 

  • 摘要
    • 在公司已经待了几个月,项目也有条不紊地推进。RNA-seq流程是早就搭建好了的,奈何拿到的测序样品数据名称和后缀经常会有一些变化,比如R1.fq.gz, R1_001.fq.gz, R1_001.fastq.gz等等。导致每次都要到流程里面改一下后缀。为了尽早实现标准化,周末闲来无事,把这个统一命名的问题解决了一下
  • 环境配置
    • python:3.8.5
  • 使用代码
#encoding=utf-8
import os
path = "./"
filelist = os.listdir(path) #该文件夹下所有的文件(包括文件夹)
for file in filelist:print(file)
for file in filelist:   #遍历所有文件Olddir=os.path.join(path,file)   #原来的文件路径#print(Olddir)'''if os.path.isdir(Olddir):   #如果是文件夹则跳过continue'''filename=os.path.splitext(file)[0]   #文件名filetype=os.path.splitext(file)[1]   #文件扩展名if "_R1" in filename:filename=filename.split('_R1')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R1.fastq"+filetype)print(Newdir)elif "_1" in filename:filename=filename.split('_1')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R1.fastq"+filetype)print(Newdir)if "_R2" in filename:filename=filename.split('_R2')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R2.fastq"+filetype)print(Newdir)elif "_2" in filename:filename=filename.split('_2')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R2.fastq"+filetype)print(Newdir)else:continue#os.rename(Olddir,Newdir)#重命名

结果展示:

处理前

处理后

总结:慢慢地还要通过脚本去解决一些小问题,比如单/双端测序在snakemake工作流上的识别,一次性输入解决样品的差异分组等。完成这些小问题都有助于完善流程的标准化。

代码参考:(1条消息) python实现文件重命名_不负韶华,逐梦如初-CSDN博客_python重命名文件名

 

 

 

 

 

更多推荐

2021.04.12丨对测序样品统一命名

本文发布于:2024-02-11 15:41:45,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1681794.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:样品

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!