加载中
人类基因组时代的泛基因组学

全文6,627字,阅读 25 分钟。 ----/ START /---- 今天想分享一个主题:人类基因组时代的泛基因组学。主要内容源自今年《Nature Reviews Genetics》上一篇题为《Pan-genomics in the human g...

有谁和我一样,国自然五个评委意见中只有一个不赞同,但最后却还是没中的吗?

全文480字,阅读3分钟。 ----/ START /---- 今天上午国自然正式放榜了,很遗憾没有中。下午收到了评审意见,发现五个评委中只有一个持反对意见,但看出来项目是上会之后被X的,很遗憾,也很可...

09/18 21:11
211
基因组学中的深度学习

全文6,743字,阅读30分钟。 这一篇文章的主题是深度学习在基因组学中的应用情况的。文章较长,读完要花些时间,不过我的建议是通读第一部分——关于如何进行模型训练的内容,读完后你应该可以...

共同一作深度分享:华大基因组装出迄今最完整人类单倍体水平基因组的重要技术细节(一二)

本周二“YH二倍体分级组装”的文章终于在Nature子刊上发表了,这个做了将近五年的项目也终于完成了!所有人都舒了一口气,正如曹爷说的,万里长征终于走到头了!有幸作为其中一个主要参与者我...

2015/05/29 00:52
170
【分享】YH基因组单倍体组装的重要技术细节(3-7)

这两天越来越多的同事、同学在询问文章中的诸多细节,一一回复起来着实挺累的,这迫使我再次感到把剩下的关键细节点写出来的重要性和紧迫性。 在上一篇博文中我们说到了fosmid clone的定位和...

2015/06/03 08:07
28
Scikit-bio:新一代的生物信息学应用软件开发包

Scikit-bio(官方发音:sigh-kit-buy-oh) 是一个专门用于处理基因组数据的Python 开源程序包。这名字的来源估计是受Python的机器学习包:Scikit-learn的影响。从功能和风格上看应该算是Seq...

2015/06/11 00:51
128
【干货】这么说,FPKM和RPKM真的是错的咯?!——关于FPKM/RPKM的深度反思

两周前,我接触了一个RNA-seq的项目,做完之后,我重新思考了FPKM和RPKM的计算,觉得它们很可能是不对的,后来查阅了一些文献终于验证了我的想法。现在我重新将这个过程记录下来: 1. FPKM和...

2015/08/25 02:30
27
Deep Learning在生物信息学中的又一个应用

Deep Learning,现在几乎到处都能看到它的应用。看!紧随DeepBind,在生物信息中又来了一个DeepSEA——这是一个适用于表观遗传研究和应用的工具,它只从基因组的序列出发,并没用其他有关于表...

如何使用Python绘制GWAS分析中的曼哈顿图和QQ图

【前言】其实这篇文章是为了简单介绍一下geneview的用法,它是一个Python高级库,建立在matplotlib的基础之上,专门用于基因组数据的可视化,目的是为了使创建高大上(精致)的基因组数据图表...

2016/02/06 00:50
383
【推荐】如何才能够免费获取Cell、Nature、Science等任意杂志中的文献

其实早已有人碰到了这个问题,确实有一个简单的办法,用https://sci-hub.io/ —— 这是由一个俄罗斯牛人开发的可以下载任意文献杂志的工具!只要输入你想要下载的文献链接就可以获取到该文献...

2016/03/10 13:17
210
浅析CNV

什么是CNV CNV的全称是Copy Number Variantion ,这里特指“人类基因组拷贝数变异”。我们知道人类基因组是由60亿个化学碱基(核苷酸)所构成的。这60亿个化学碱基一共组合成了23对(46条)染...

2016/07/17 20:37
15
Watson在医学应用中的巨大潜力,就因这两个字

直接就是正文: 1) PubGene: 他们做的就是genome data 的SearchEngine,目的是为医院服务。但毫无意外,医院不愿意买它们的服务,无奈之下,只能和医院一同申请经费来做这个SearchEngine,做...

为什么同一个物种的基因组里,有的基因序列进化快,有的进化慢?

以下内容源自中山大学杨教授(Philip Yang)在知乎上的回答,略有修改。 作者:Philip Yang 链接:https://www.zhihu.com/question/31128369/answer/50740716 我下面的讨论只是针对蛋白质序列...

amp
2016/12/09 00:32
36
从零开始完整学习全基因组测序数据分析:第1节 测序技术

前言 基因测序已是时下热门,目前除了华大基因之外,其他分布于全中国的大型测序平台(HiSeq X 10)还有约10个,每个每年大概能完成1.8万人的高深度全基因组测序,加起来就是18万人,如果加上...

从零开始完整学习全基因组测序数据分析:第2节 FASTA和FASTQ

在WGS数据的分析过程中,我们会接触到许多生物信息学/基因组学领域所特有的数据文件和它们特殊的格式,在这一节中将要介绍的FASTA和FASTQ便是其中之一二。这是我们存储核苷酸序列信息(就是D...

2017/08/11 20:08
41
从零开始完整学习全基因组测序数据分析:第3节 数据质控

从这一节开始详细讲述正式流程的搭建,我将结合具体的例子努力争取将这个系列写成比GATK最佳实践更加具体、更具有实践价值的入门指南。整个完整的流程分为以下6部分: 原始测序数据的质控 re...

2017/08/25 22:33
59
从零开始完整学习全基因组测序数据分析: Trimmomatic、SOAPnuke、sickle和seqtk的比较

在第4节开始之前,先来一段插曲。在上一节中,我们说到可以使用Trimmomatic、sickle、seqtk或者SOAPnuke对fastq数据进行过滤。那么也许你会好奇,那他们都有什么特点,都一样好吗或是有哪些差...

从零开始完整学习全基因组测序数据分析:第4节 构建WGS主流程

这是本系列中最重要的一篇文章。但在开始之前,我想先说一句:流程的具体形式其实是次要的,WGS本质上只是一个技术手段,重要的是,我们要明白自己所要解决的问题是什么,所希望获取的结果是...

2017/09/19 21:00
76
科普 | 怎样对一个人的基因组进行测序?

(该科普视频来自:TED-Ed,以下内容有删改) 你大概已经听说过什么是人类基因组——它是巨量的基因总和,并且在你身体中每一个细胞里都有一份。你很可能也知道我们已经对人类基因组进行了测序...

2017/09/26 20:00
55
GATK中如何计算Inbreeding coefficient(近交系数)

这是我个人博客上一篇小短文,文章很短,预计2分钟可以读完,今天有同事问到了这个问题,因此就重新在这里分享出来。 关于近交系数是什么的定义,除了英文资料,中文上也给出了很清晰的定义,...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部