发布时间:2025-10-09
浏览次数:0
开发方向存在诸多,其中包含机器学习,还有数据挖掘,以及网络开发,甚至爬虫等等。实际上于生信领域,并不会展现出绝对的优势,生信的多数软件流程系由shell编写而成,或者是用Perl编写的,并且已然足够好用。我作出选择是由于我想要顺便学习一些数据挖掘方面的内容,还有机器学习方面的东西,而且这些年其愈发火爆,发展态势远远超过其他脚本语言,所以学习它必然是没有错误的。
一、入门标准
入门比较难定义,什么程度才算入门呢?
掌握基本的语法,熟练使用的内置类型、内置函数和数据结构。
了解一些基本的模块的使用,能够实现一些简单的需求。
后面存在一个实例,要是你能够简便地完成,那么无疑我笃定你已然入门了。
二、基本知识点
1.基本语法
缩进,它是依靠代码缩进来对代码层次逻辑予以确定的,通常来讲会约定采用4个空格 。
主要存在版本方面的问题,其中涵盖2.x系列的,还有3.x系列的,这两者在语法上存在差异,并且是不相兼容的,存在部分模块,其只能在指定的版本状况下进行安装 ,建议采用3.x版本,要是遇到特殊的问题,再去运用指定版本解决 。
文件编码声明,会前往环境变量当中找寻解释器,倘若代码里面含有中文,那么就要采用utf-8编码。
#!/usr/bin/env python
#-*- coding: utf-8 –*-
变量定义:使用前要先定义
dir 函数,用于列出一个数据类型或者对象的所有方法,该函数非常好用,与 help 函数具有相同的作用 。
文件相关操作:f 等于打开操作,f 进行关闭操作;借助 with 语句以打开操作执行并将其赋予 f ,操作系统路径相关操作,操作系统路径相关操作,操作系统路径相关操作。
目录操作:使用os.mkdir()进行目录创建,使用os.rmdir()进行目录删除,os还存在其他操作,使用os.chdir()用于改变目录
开发环境选择:
进行数据处理,其中基本数据类型包含,布尔类型,整型类型,浮点型类型,字符串类型。
# 字符串的内置函数,都比较有用
'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill'
2.2 基本数据结构:列表、元组、字典、集合。
数据结构就是一种容器,用于在内存中存放我们的数据。
列表:任意元素组成的顺序序列,以位置为索引。
# 列表的内置函数
'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort'
有一种数据结构叫元组,它类似于那种不可变的列表,具备防止出现错误修改的特性,还能够节省内存方面的开销,这就是元组,而元组解包
# 元组的内置函数
'count', 'index'
字典:键值对,没有顺序,键必须是常量。
# 字典内置函数
'clear', 'copy', 'fromkeys', 'get', 'items', 'keys', 'pop', 'popitem', 'setdefault', 'update', 'values'
集合,它不具备可称作顺序的特性,其所含元素彼此之间不存在重复现象sublime text python,从某种意义上可以理解为,它类似于舍弃了具体值的字典。针对集合,存在着诸如&,|,-,^sublime text python,=等这样的操作
# 集合内置函数
'add', 'clear', 'copy', 'discard', 'pop', 'remove', 'update'
'isdisjoint','issuperset','issubset','symmetric_difference','difference','union', 'intersection', 'symmetric_difference_update','intersection_update','difference_update',
2.3 控制语句
条件:if…else…
循环:for,while,break,
2.4 模块使用
存在着极为友善亲切的模块进行安装的方式,仅凭借一个pip命令,差不多能够安装为数众多的绝大多数模块,提议在使用模块之前,多多去看与之相关的API文档。
最为常用的模块存在着,sys,os,re,csv,gzip,time;于百度之上有着诸多相当不错的模块使用入门教程。
三、入门实例
题目:从诸多FASTA文件里提取特定序列,并且针对所提取的序列施行某些处理(像是求取反向互补序列),句号
描述:假设你存有许多测序数据,这些数据分别存放于不同文件夹内的不同文件当中,此刻给予你一些序列名,要求你从众多的这些数据里提取出特定的序列。
特别说明:此处原本应当存有诸多实例,并且大神亲自录制了好些视频,能够在我们的论坛(网址为http://www..com/forum-90-1.html)寻觅到每个实例的详尽描述,以及代码,还有解题思路 。
遍历每一个文件夹,遍历每一个文件,读取文件,判断序列,输出序列(处理),关闭文件,处理数据,添加一个函数即可 。
四、精通标准
固然这仅是个噱头,熟练掌握的路途是没有尽头的,接下来只是陈列了一些平常的高级特性。
五、最后
只不过是一门编程语言 ,并且是一种实现工具 ,我们能够用好多语言将它替换掉 ,我们之所以做出选择 ,原因在于我们喜爱它给予我们的方便捷迅 。要是你想潜入某个领域 ,实际上真正关键重要的是技术背后的算法 。
六、推荐资源
生信菜鸟专栏属于生信技能树论坛的版主团队,团队成员生信技能背景多样,在文件格式方面有对应人才,在数据资源方面有对应人才,在软件使用方面有对应人才,在脚本技巧方面有对应人才,在统计绘图方面有对应人才,在组学实战方面有对应人才。并且本专栏会从基础入手并深入展开,为毫无基础的各位解析生信技能。
科研路,不孤单!^ ^
FS科研软件库,汇集60多款医学科研的必备神器,此刻全部进行打包予以分享,
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码