研究生基本知识和技能学习指南 (v2024)

相关资料获取:坚果云团队版/GxELab/Resources/Library/推荐参考书


01. Linux

如果使用Linux和Mac OS操作系统,可以直接在终端(Terminal)练习命令行的操作。如果使用Windows系统,可以从Windows应用商店安装Windows Subsystem for Linux (WSL2)。

使用 WSL 在 Windows 上安装 Linux

我们的学习目的只是为了使用Linux运行一些专业的生物信息学软件,利用R或者python做数据分析,而不是成为专业的Linux系统管理员或者工程师,因此只需要有基本知识并了解常用的命令即可。相关的网络资源有很多,这里我们推荐:《Linux命令行大全-第二版》(The Linux Command Line, 2nd edition)。可以跟着教程快速过一遍,没有必要死记硬背,在电脑上多加练习即可。掌握怎么查询每个命令的使用方法(cmd -h; man cmd;百度谷歌),以后需要的时候可以快速找到帮助,多用几次就熟悉了。

Linux常用命令自查清单:https://gitee.com/mt1022/bioinfo_tutorials/blob/master/basics/Linux.md

登录远程Linux服务器的免费开源客户端:

在大型公共Linux集群上提交任务需要学习slurm的客户端命令: squeue/sinfo/srun/sbatch等。


02. R

R语言在统计分析和图形化展示方面具有独到的优势,在生物信息学和基因组学研究中广泛应用,我们必须对R语言和常用的package有足够的了解,才能在将来的工作中得心应手。

R语言入门

  • An Introduction to R (HTML, PDF)(官方简介;如果毫无基础可以花两天时间快速浏览一遍)
  • Advanced R (R语言的深入剖析,想把R用的得心应手必看)
  • R for Data Science (2e)(R语言数据分析的基础;推荐后看)

其他参考资料

需要掌握的常用第三方package

  • tidyverse系列 - dplyr + tidyr + readr+ggplot2需要非常熟练。
  • data.table

IDE推荐: RStudio


03. Python

网上有无数免费的python学习资源,B站也有很多视频教程,根据自己的喜好选择一个即可,重要的是得上手练,不能只看。专门讲如何用python做数据分析的书包括:

JupyterLab使得用python做数据分析更加方便。

需要掌握的常用第三方package

python代码书写规范

IDE推荐:Visual Studio Code,Jupyter Lab


04. 概率统计与机器学习

应该尽量在本科阶段学习高等数学,线性代数,概率论和数理统计;如果只学了高数也没关系,抽时间自学另外两门课就可以了。可以从这几本书开始:

概率

  • A First Course in Probability (中文书名《概率论基础教程》)
  • Introduction to Probability Models (中文书名《应用随机过程:概率模型导论》)

统计

  • Modern Mathematical Statistics with Applications (Jay L. Devore, Kenneth N. Berk, Matthew A. Carlton; 3rd, 2021)
  • Bayesian Data Analysis

机器学习

除此之外,推荐这些书籍,可以作为补充学习的材料,也可以作为参考,需要时查阅:

StatQuest的视频讲各类统计学的概念非常直观,而且简单易懂,强烈推荐。


05. 分子细胞遗传基础
  • Molecular Biology of the Cell (7e, 2022)
  • 如果你本科专业不是生物科学或生物技术,强烈建议阅读以上书籍快速了解相关的基础知识。即使你学的是相关专业,也可以通过本书获得更清晰的细胞内基本过程的图像。


06. 生物信息学

强烈推荐:

其他网上资源:

不错的参考书:

  • Biological sequence analysis - Probabilistic models of proteins and nucleic acids
  • Bioinformatics Algorithms
  • Bioinformatics and Functional Genomics (中文书名《生物信息学与功能基因组学》第三版)
  • 生物信息学(第二版,樊龙江主编)


07. 演化生物学

群体遗传学方面,推荐下面这本书,内容比较连贯,容易理解,更深入或者复杂的内容请看其他参考书:

分子进化方面只推荐下面这一本书,从基本的理论知识到常用软件的算法写的非常详细:

以下是领域内多位专家联合编写的分子进化和群体遗传学方面的手册,内容较新,并且涉及很多近年出现的应用,可以作为参考手册:

其他参考书:


科研训练

文献阅读

学术交流

学术写作

  • Scientific Writing and English for Academic Research (416133001)

相关资源

© 2024 GxE Lab