昆明动物所发布生物序列处理工具FasParser2

昆明动物研究所 孙艳波 2018-03-12

  从大量的序列数据中挖掘有用的生物学信息,已成为众多研究领域的必备手段,这就需要我们掌握一些常用的序列处理操作。针对序列的处理,已有一些优秀的工具包供使用,大致可以分为两类:一类是命令行程序,如EMBOSS等,这一类工具的特点是运行速度较快,灵活性很高,可以和其他工具融合形成分析流程和批处理化。然而,这类工具往往需要用户熟悉Unix-like操作系统的使用,甚至要求用户具有编写脚本的能力。另一类是窗口程序,如MEGA、BioEdit等,这一类工具具有友好的用户操作界面,使用起来非常方便,但是它们往往只能对单文件进行操作,且很难和其他程序形成自动化分析流程,导致它们难以应付越来越多的序列文件。基于此,中国科学院昆明动物研究所两栖爬行类多样性与进化研究组的博士孙艳波于2017年在Zoological Research发布了FasParser程序,以实现在友好的界面窗口下对一些常规序列操作,尤其像多基因的串联合并、序列的提取、低质量序列的鉴定等,进行批处理化。 

  近日,孙艳波对FasParser进行了较大幅度的更新,并以FasParser2: A Graphical Platform for Batch Manipulation of Tremendous Amount of Sequence Data为题,在生物信息学国际期刊Bioinformatics上在线发布了新版本,以满足科研人员对序列操作更高的需求。最新程序(v2.3.0)可在该地址免费下载:https://github.com/Sun-Yanbo/FasParser/releases。 

  增加的功能主要包括:(1)重新设计的文件上传界面具有更好的批处理效率;(2)增加了有效过滤序列比对质量的模块,尤其适用于大规模检测序列中经历达尔文正选择的位点,以及重建系统发育等分析;(3)增加若干序列过滤的功能,可实现序列中对非同源序列的清除,尤其适用于从一堆数据中抽取感兴趣的序列;(4)增加了蛋白序列的一些操作接口,如利用蛋白序列的比对结果生成DNA的比对结果等;(5)增加了检测正选择(借助于PAML)、PCR引物设计(借助于Primer3)的功能;(6)增加了专门的序列编辑工具(FasParser::Editor),以实现更方便的序列查看和编辑功能;(7)增加其他一些附属功能。 

  该工作得到了国家自然科学基金面上项目、中科院战略先导专项(B)以及中科院青年创新促进会的支持。 

    文章链接:https://doi.org/10.1093/bioinformatics/bty126

 昆明动物所发布生物序列处理工具FasParser2