ggplot2详细主题设置(2)

theme(),本文将专门讲解一下。凡是与数据无关的图形设置可以归为主题类,ggplot2中主题设置十分多,根本不可能讲解完,只能稍微讲点皮毛,灵活运用才是关键,本文只是总体上略作介绍。正如R语言大神Hadley Wickham所讲的,ggplot2只是提供了一个平台,可以根据自己的需要无限创造。理论上来讲,只要能想到的图形,ggplot2都能实现。

Read more

Science重磅|历时13年六倍体小麦基因组图谱终完成(详细解读)

转自 生新人发表的Science重磅|历时13年六倍体小麦基因组图谱终完成(详细解读)

2018年8月17日Science杂志在线刊发题为“Shifting the limits in wheat research and breeding using a fully annotated reference genome”的研究论文,相比于2014年7月发布的草图序列,该版本序列组装指标明显提升,基因组序列由原先的10.2Gb上升到14.5Gb,Scaffold N50提升到22.8Mb。该研究论文是在国际小麦基因组测序联盟(International Wheat Genome Sequencing Consortium,IWGSC)协作下完成的,西北农林科技大学旱区作物逆境生物学国家重点实验室的宋卫宁教授团队作为中国唯一参与并承担实质性研究工作的团队,完成了其中7DL染色体物理图谱构建及序列图谱破译工作。

Read more

shell语言脚本构建4-处理用户输入

目前为止,你已经看到了如何编写脚本,处理数据、变量和Linux系统上的文件。有时,你编写的脚本还得能够与使用者进行交互。bash shell提供了一些不同的方法来从用户处获得数据,包括命令行参数(添加在命令后的数据)、命令行选项(可修改命令行为的单个字母)以及直接从键盘读取输入的能力。本章将会讨论如何在你的bash shell脚本运用这些方法来从脚本用户处获得数据。

Read more

Bioconductor的质谱蛋白组学数据分析

这篇主要简单的记录下如何基于bioconductor的R包对蛋白组质谱数据进行分析。在看到这篇biocondutor官网文档Mass spectrometry and proteomics data analysis之前,我一直以为质谱数据的分析过程就是用一些商业化软件或者开源软件将谱图转化为肽段/蛋白的表达谱,由于蛋白组应用未如NGS数据那般广泛及热门,所以就未去搜索过是否能用R包来对质谱数据进行一定程度的分析。

Read more

置换检验(Permutation Test)

我们一般平时较为常用的检验要属有参检验,但是其要求样本必须满足近似正态,无离群点,数据量大等要求;而有些时候其实很难都满足以上前提条件,则这时需要使用无参检验,其只关注数据的秩,但是无参检验有时也无法处理一些样本数较少的情况,这时则可以使用置换检验

置换检验,是Fisher提出的一种基于大量计算(computationally intensive),利用样本数据的随机排列(置换检验的核心思想,故名Permutation test),进行统计推断的方法。因其对总体分布自由,特别适合用于总体分布未知的小样本数据,以及一些常规方法难以使用的假设检验情况。

Read more

interproscan的安装及使用

简介

Interpro是一个数据库,它里面有蛋白功能,蛋白家族等信息。而Interproscan就是可以将你的蛋白序列跟这个这个数据比对,从而给你的序列功能注释。 Interproscan5新增了一些功能Phobius用来预测跨膜和信号肽可以把结果map到上传的数据上寻找蛋白可能的生物学代谢途径新的输出格式XML和GFF3.0提升了图形界面

Read more