最近想学一下生信编程,但是由于自己是生物专业,对计算机编程也不是太了解,所以感觉还是有很大困难。其实自己对编程还是有一定兴趣,以前也有自学过JAVA,不过现在大家编程好像都用python了,所以在网上找了几本在生物学中应用python编程解决生物学问题的书籍学习一下,并想着通过写笔记的方式督促并记录自己的学习过程。
给自己的第一个任务是《Python for Bioinformatics》这本书,作者是Sebastian Bassi,是一位在软件开发和生物信息学研究方面拥有丰富经验的生物技术专家。
本书主要包括三个部分共22章内容。
第一章 介绍
第二章 安装及初步了解python
第三章 基本编程:数据结构
第四章 流程控制
第五章 文件处理
第六章 代码模块化
第七章 处理错误
第八章 面向对象编程介绍
第九章 Biopython 介绍
第十章 网络应用
第十一章 Xml
第十二章 Python和数据库
第十三章 正则表达式
第十四章 Python绘图
第十五章 批量序列操作
第十六章 过滤载体污染的Web应用
第十七章 使用Primer3寻找pcr引物
第十八章 从引物集计算解链温度
第十九章 从 GenBank 文件中过滤掉特定字段
第二十章 推断剪切位点
第二十一章 多重对齐网络服务器
第二十二章 使用存储在数据库中的数据绘制标记位置
书上所有代码都放在了github上,可以下载下来,如果安装了Jupyter,可以使用Jupyter notebook打开运行,这样更加直观。
地址:https://github.com/Serulab/Py4Bio
介绍基本概念,如指令,数据类型,变量。
一个简单的Python程序:
seq_1 = ’Hello,’
seq_2 = ’ you!’
total = seq_1 + seq_2
seq_size = len(total)
print(seq_size)
这个Python程序指把字符串‘Hello,’赋值给seq_1,把字符串’ you!’赋值给seq_2,将seq_1和seq_2的字串相加然后把结果赋值给total,并将total字符串的长度赋值给seq_size,打印seq_size的值,最后输出11。
print(seq_size)就是指令;
数据类型:
- 数字(整型, integers,或浮点型,float);
- 字符串;
- 其它数据类型;
变量:
是一个名字,它可以代表一个值,这个值在程序的运行过程中可以改变;
注意var = value,这里不是数学里相等的意思,相等具有交换性,而在编程中,在右边的项(value)只是取了左边项(var)的名字。比如
seq_1 = ‘Hello,’
在赋值之后,变量seq_1就可以使用了,如
len(seq_1)
“返回一个名为seq_1的值的长度”,由于字串‘Hello,’具有六个字符,因此这个命令得到的值是6。