python如何读取文件
python读取文件出错?
python读取文件出错?
在open文件时候,说找不到文件,可是我能够cat到,不知道为什么
多了‘
’
从报错看:
1、文件路径问题
2、代码中多了个
3、把这段代码贴出来,一起看看
4、把代码中的路径先声明成一个常量,后续代码中引用,逻辑清晰一些
5、如果使用的python2,建议升级到python3,对中文,一些库会强大一些,容错性好一些
示例如下:
with open(filepath, w, encodingutf8) as f:
f.writelines([北京加油!
, 中国加油!
])
如何使用Python Pandas模块读取各类型文件?
Pandas 是基于tNumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型t,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
数据加载类型总览
Pandas加载csv文件
read_csv常用参数
headerNone 指定第几行作为列名(忽略注解行),如果没有指定列名,默认header0 如果指定了列名headerNonenames指定列名,如果文件中不包含header的行,应该显性表示headerNone,[A, B, C] 自定义列名index_col[A, B...] 给索引列指定名称,如果是多重索引,可以传listskiprows[0,1,2] 忽略某几行或者从开始算起的几行,默认从文件头0开始skip_footer从文件尾开始nrowsN 需要读取的行数,前N行chunksizeM 返回迭代类型TextFileReader,每M条迭代一次sep|指定分割符,默认,,如果不指定参数,会自动解析,C引擎不能自动检测分隔符,但Python解析引擎可以skip_blank_linesFalse 默认为True,跳过空行,如果选择不跳过,会填充NaNconverters{col1, func} 对选定列使用函数func转换,通常表示编号的列会使用(避免转换成int)encoding: 编码方式dtype: {‘a’: np.float64, ‘b’: } 指定数据类型
Pandas加载Json文件
read_json参数
path_or_buf 就是json文件路径或者json格式的字符串。orient 是表明预期的json字符串格式。orient的设置有以下几个值:split/index/columns/valuesorient 参数说明
split : dict like {index -gt [index], columns -gt [columns], data -gt [values]}。由索引,列字段、数据矩阵构成的json格式。key名称只能是index、columns、data,dump.json文件内容如下。
示例代码如下:
records : list like [{column -gt value}, ... , {column -gt value}]。由列字段为键,值为键值,每一个字典就构成了dataframe的一行数据,dump.json文件内容如下。
示例代码如下:
index : dict like {index -gt {column -gt value}}。以索引为键,以列字段与值构成的字典为键值。dump.json文件内容如下:
示例代码如下:
columns : dict like {column -gt {index -gt value}}。由列为键,对应一个值字典的对象。这个字典对象以索引为键,以值为键值构成的json字符串。dump.json文件内容如下:
示例代码如下:
values : just the values array。values这种我们就很常见了。就是一个嵌套的列表。里面的成员也是列表,2层的。dump.json文件内容如下
示例代码如下:
Pandas加载Excel文件
read_excel的主要参数
io : excel文档路径sheetname : 读取的excel指定的sheet页header :设置读取的excel第一行是否作为列名称skiprows : 省略指定行数的数据skip_footer :省略从尾部数的int行数据index_col :设置读取的excel第一列是否作为行名称names : 设置每列的名称,数组形式参数代码示例如下