家犬作为人类生活和事情中的同伴,其进化研究一直是遗传学领域中的热点之一。然而目前使用的家犬参考SNP数据集,不但数量少,采样地不敷广泛,并且测序笼罩度差别大,SNP数据主要只来源于两个品种的两个犬只,并倒运于家犬的群体遗传研究。
目前,二代测序爆发了大宗高质量的家犬和其祖先物种灰狼的全基因数据。为了弥补参考SNP数据集的缺乏及满足大数据复用的需求,球速体育赵文明课题组和球速体育昆明动物所张亚平实验室的事情人员配合建立了第一个犬类SNP数据库—DoGSD (the Dog and wolf Genome SNP Databae),该结果于2014年11月在国际生物信息学领域期刊Nucleic Acids Research在线宣布。
DogGSD包括了参考SNP数据集,69个家犬及8个灰狼的全基因组SNP数据,所包括的SNP数量是原参考数据集的7倍,弥补了原数据集采样地少,笼罩度差别大的问题,并且第一次在SNP数据集加入了中领土狗的数据。DoGSD为用户提供了友好的检索、盘问及下载页面,其中的同义/非同义SNP检索页面,比较盘问功效将为用户检索基因相关SNP及视察个体间SNP的差别提供很大的便当。别的,DoGSD第一次在数据库中提供了重要的群体遗传学参数的盘算结果:Fst和等位基因频率,便当用户筛选和进一步剖析有选择信号的SNP。
该项研究获得了球速体育、科技部的资助,也获得了球速体育高性能盘算平台和大数据存储平台的大力支持。
数据库页面
论文链接