一:如何从零开始掌握生物信息分析技巧
选择一种语言
生物学家可以从各种各样的编程语言中选择一种,对于许多应用来说,随便选择一种都可以,不过目前最流行的可能就是Python 和 R。“就目前而言,这就像是科学研究的二重奏”,来自加州大学戴维斯分校的生物信息学家Vince Buffalo说,他刚完成了一本名为《生物信息学数据分析技巧》(O’Reilly Media Inc.)的新书。
Python 和 R相对来说都比较好用,但前者能完成多项任务,而后者主要针对的是统计方面的内容,两种语言都有其各自的使用用户群,因此具有特定功能预生成代码(prebuilt code)数据文库,比如以R语言为基础的Bioconductor Project (www.bioconductor.org),能为显微,测序和芯片数据提供模块。另外Python 公共文库也有:Anaconda (continuum.io/downloads)。
来自华盛顿大学基因组科学系的助理教授Cole Trapnell利用R语言完成了单细胞基因组数据集的处理,“单一细胞基因组学问题牵涉到许多的统计学方面的内容,R语言很适合。”
此外,还有一种受到大家认可的语言,那就C/C++(Julia (www.julialang.org)),这种语言特别合适用于那些相对较慢或内存密集型任务,Trapnell说。
如果能将Python的语法,R语言的图形灵敏性和C++的速度结合在一起,那就完美了,“这也就是说,这种代码很好编写,而且也很快,”,来自加州大学戴维斯分校的遗传学副教授Titus Brown说,但这需要你花费大量经历掌握这些语言,他建议,可以选择你同事已经在应用的语言,这样他就能帮助你解惑。
所需的工具
UNIX 和 Linux系统都有预安装软件,如果你没有,那么通过操作系统管理员也很容易获取。Macs系统包含一个现成的Python 解释器和C/C++ 编译器,但必须单独安装 R(www.r-project.org)。Windows系统在默认状态下,不包含任何一种编程语言,因此你可能需要自己安装。
程序员还需要的一个工具就是一个好用的文本编辑器,这是用于处理纯文本文件的程序,与之相对的就是处理特殊格式的程序,如Microsoft Word。核心程序员通常喜欢使用命令行编辑器 vi 或 emacs,在Linux 和 Mac系统中这两者都有预装。现在也有一些很强大的可配置程序,但是对于新手来说很难掌握,“这要求你自己想代码,因此我还是建议使用自己擅长的方法,”Trapnell说。
同时你还需要找到一种能够用特定颜色标记特殊语言关键词(“syntax highlighting”),语法检查 (比如说要能找到错误的方括号和圆括号),代码格式,以及处理多种文件的编辑器。
常用的两种就是Windows系统的Notepad++ (no......余下全文>>
二:用生物信息学怎么分析一个基因的结构与功能
1,去NCBI上进行Blast,如果与已知的基因相同,可以直接点开它的基因简介,一般都会有该基因的结构功能说明。
2,如果与已知的序列有差异,就可以上EXpasy进行在线预测
三:如何通过生物信息分析物种间亲缘关系
生物分类学家和进化论者根据各类生物间的亲缘关系的远近。在进化树上每个叶子结点代表一个物种:生物进化有一个规律,从低等到高等。有相关图书一册,把各类生物安置在有分枝的树状的图表上,简明地表示生物的进化历程和亲缘关系,怎么使用phytozome 进化树在生物学中,都是从水生到陆生,那么两个叶子结点之间的最短距离就可以表示相应的两个物种之间的差异程度。从进化树中还可看出,用来表示物种之间的进化关系生物信息学,如果每一条边都被赋予一个适当的权值,从简单到复杂
四:生物信息学对数据的处理一般是一个什么样的过程
高通量数据类型主要包括基因芯片和基因测序,我估计你想知道的是具体的内容。
具体的内容其实是指的高通量测序技术的应用,例如microarray,RNA-Seq,Exome-Seq,Target-Seq,Whole-genome-sequencing,宏基因组,16S RNA,microRNA,lncRNA测序等。
研究的问题就更五花八门了,像现在精准医疗的概念很火,主要是以基因测序为入口,后面的应用,例如产前诊断,孕前诊断等,甚至像亲子鉴定,肿瘤靶标等都可以通过生物信息学的分析手段来搞定。
生物信息分析分为几个层次,第一个层次基本上就是用别人做好的成熟软件,直接分析出你要的结果,再深入就是你会根据问题找到更合适的一些软件或者模块,自己组建一些分析流程,包括自己写一些辅助的程序脚本,更深入的层次就是市面上没有符合你要求的软件或者统计算法,你依据自己的需求,定制自己的分析过程,自己从头开始写基础程序,写统计算法,写模型等。到了这个程度就没有那么多限制了,主要比的是个人的思维想法以及眼界开阔程度。
现在也很多生物信息的分析方法应用在大数据的各个领域。本质是各种统计思维方法的实现,找出特定的模式结果。
五:如何利用生物信息学分析一个基因的DNA序列
如何利用生物信息学分析一个基因的DNA序列
基因克隆是70年代发展起来的一项具有革命性的研究技术,可概括为∶分、切、连、转、选。最终目的在于通过相应技术手段,将目的基因导入寄主细胞,在宿主细胞内目的基因被大量的复制。
"切"是指用序列特异的限制性内切酶切开载体DNA,或者切出目的基因;"连"是指用DNA连接酶将目的DNA同载体DNA连接起来,形成重组的DNA分子;"转"是指通过特殊的方法将重组的DNA分子送入宿主细胞中进行复制和扩增;"选"则是从宿主群体中挑选出携带有重组DNA分子的个体。基因工程技术的两个最基本的特点是分子水平上的操作和细胞水平上的表达,而分子水平上的操作即是体外重组的过程,实际上是利用工具酶对DNA分子进行"外科手术"。
六:生物技术和生物信息哪个好?
生物信息学要好一些。
1,、从学科交叉角度,生物信息学是利用计算机知识来处理生物学问题,两门学科你都得掌握,往往这样的专业最具生命力。
2、从就业前景来看,生物信息学的就业面要宽一些,生物、计算机方面的工作都是可以胜任的。
3、学生物信息的懂生物技术,但学生物技术的不懂生物信息。
4、做系统实验、发paper的时候,往往需要有大量的数据分析,而生物数据的分析要用到生物信息学知识,单纯学生物技术的学生就只能请别人帮你分析了。
5、生物信息学正处于飞速发展阶段,潜力很大。
七:生物信息分析靠谱的公司,各位推荐下?
百迈客云,同学做研究时用过,听说很好用,是它们自己的专业团队自主研发,网上可以查到相关新闻,亲可以参考以下。