发布时间:2025-10-09
浏览次数:0
以下为文章全文:
开发方向数量众多,其中涵盖机器学习,还有数据挖掘,网络开发,爬虫等等。实际上在生信领域,并未展现出绝对优势,生信的多数软件流程是用shell编写的,或者是用Perl编写的,再说它们已然足够好用。我之所以选择,是由于我想要顺便学习一些数据挖掘方面的内容,以及机器学习方面的内容sublime text python,并且这些年其愈发热门,发展态势远远超越其他脚本语言,因而学习它必定不会出错。
一、入门标准
入门比较难定义,什么程度才算入门呢?
掌握基本的语法,熟练使用的内置类型、内置函数和数据结构。
了解一些基本的模块的使用,能够实现一些简单的需求。
往后存在一个实例,要是你能够简易地完成,那么我敢断定你已然入门了。
二、基本知识点1.基本语法
这是一种方式 ,它是借助代码缩进 ,以此来判定代码层次逻辑 ,通常有着这样的约定 ,采用4个空格 。
有版本方面的状况,其涵盖了2.x系列一同还有3.x系列的,这两者之间具有不同的语法并且呈现出不兼容的态势,存在部分模块仅仅能够于指定版本的情形下开展安装操作行为,由此建议选用3.x版本,在遭遇相关特殊问题之际再去采用指定版本 。
文件编码声明,会前往环境变量中找寻解释器,倘若代码当中存在中文,那么就要采用utf - 8编码,
#!/usr/bin/env python
#-*- coding: utf-8 –*-
变量定义:使用前要先定义
能够列出一个数据类型或者对象的所有方法的dir()、和help()一样好用 ,极其便利 ,相当实用 。
针对你提供的内容存在不完整的情况,不太能准确按照要求改写。文件操作中open函数的使用示例为f = open('文件名','打开模式') ,关闭文件用f.close() ;使用with open('文件名','打开模式') as f: 可自动管理文件关闭,os.path模块有检查路径是否存在os.path.() 、获取文件大小os.path.() 、获取文件绝对路径os.path.() 等方法 ,你可补充完整后重新提需求 。
目录相关操作:os.mkdir(),os.rmdir(),os.(),os.chdir()
开发环境选择:
2. 对数据予以处理,2.1 存在基本数据类型,分别为布尔,整型,浮点型,字符串 。
# 字符串的内置函数,都比较有用
'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill'
2.2 基本数据结构:列表、元组、字典、集合。
数据结构就是一种容器,用于在内存中存放我们的数据。
列表:任意元素组成的顺序序列,以位置为索引。
# 列表的内置函数
'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort'
元组,它等同于那种不可变的列表,其作用是能够防止出现错误修改的情况,并且还能节省内存方面的开销sublime text python,这就是元组,还有元组解包 。
# 元组的内置函数
'count', 'index'
字典:键值对,没有顺序,键必须是常量。
# 字典内置函数
'clear', 'copy', 'fromkeys', 'get', 'items', 'keys', 'pop', 'popitem', 'setdefault', 'update', 'values'
集合,其不存在顺序,元素相互之间不存在重复,它等同于舍弃了值的字典,集合操作包含(&,|,-,^,=)
# 集合内置函数
'add', 'clear', 'copy', 'discard', 'pop', 'remove', 'update'
'isdisjoint','issuperset','issubset','symmetric_difference','difference','union', 'intersection', 'symmetric_difference_update','intersection_update','difference_update',
2.3 控制语句
条件:if…else…
循环:for,while,break,
2.4 模块使用
有一种极为友善的模块安装方式,仅需一个pip命令,它几乎能够把绝大多数的模块给安装好。在使用模块之前,建议多多去看与之相关的API文档 。
最为常用的模块存在着:sys,os,re,csv,gzip,time;于百度之上有着许多相当不错的模块运用入门教程。
三、入门实例
题目;从数目众多的FASTA文件里提取明确指定的序列,并且针对提取出来的序列开展某些特定的处理(比如说求取反向互补的序列)。
假定你存有大量测序数据,这些数据分别被放置于不同文件夹的不同文件之中,此刻给予你一些序列名,要求你从诸多数据里提取出特定的序列。
附言:此地原本应当存有海量实例,并且极具威望的高手还亲自录制了诸多视频,能够于我们的论坛(网址为http://www..com/forum-90-1.html )寻觅到每个实例的详尽阐释以及代码与解题思路 。
依次对每一个文件夹展开遍历,针对每一个文件进行遍历,读取文件,判别序列,输出经处理后的序列,关闭文件,处理数据,添加一个函数便可。
四、精通标准
诚然这实属一顶噱头,熟稔的路径是无尽头的,接下来仅是陈列了一些平常的高级习性。
五、最后
仅是一门编程语言,是一种实现工具,我们能够拿多种语言替换它,我们进行选择,是缘由于我们喜爱它给予我们的便捷,要是你打算深入某个领域,实际上真正有着重要意义的是技术背后的算法。
六、推荐资源
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码