首页 > 编程语言 > python

编程语言Python爬虫基础讲解(八):数据持久化——文件操作

admin python 2021-05-25 09:25:44 爬虫 讲解 持久 操作 文件 
后台-系统设置-扩展变量-手机广告位-内容正文底部

计算机的文件,就是存储在某种长期储存设备上的一段数据长期存储设备包括:硬盘、U盘、移动硬盘、光盘...

文本文件和二进制文件

文本文件:

  • 可以使用文本编辑软件查看o本质上还是二进制文件
  • 例如: python的源程序

二进制文件:

  • 保存的内容不是给人直接阅读的,而是提供给其他软件使用的。
  • 例如:图片文件、音频文件、视频文件等等
  • 二进制文件不能使用文本编辑软件查看
Python爬虫基础讲解:数据持久化——文件操作

关注微信公众号,免费领取资料

1. 文件的基本操作

操作文件的函数/方法

在Python中要操作文件需要记住1个函数和3个方法

Python爬虫基础讲解:数据持久化——文件操作

  • open函数负责打开文件,并且返回文件对象
  • read / write/ close三个方法都需要通过文件对象来调用

1. 1读取文件

open

函数的第一个参数是要打开的文件名(文件名区分大小写)

  • 如果文件存在,返回文件操作对象
  • 如果文件不存在,会抛出异常
  • read方法可以一次性读入并返回文件的所有内容
  • close方法负责关闭文件
    如果忘记关闭文件,会造成系统资源消耗,而且会影响到后续对文件的访问
  • 注意:read方法执行后,会把文件指针移动到文件的末尾
# 1.打开-文件名需要注意大小写
file = open("README")

#2.读取
text = file.read()
print(text)

#3.关闭
file.close()

1.2 打开文件的方式

open函数默认以只读方式打开文件,并且返回文件对象
语法如下:

f = open("文件名","访问方式")

Python爬虫基础讲解:数据持久化——文件操作

提示

  • 频繁的移动文件指针,会影响文件的读写效率,开发中更多的时候会以只读、只写的方式来操作文件

写入文件示例

#打开文件
f = open ("README","w")

f.write( "he17o python! \n")
f.write("今天天气真好")

#关闭文件
f.close()

1.3按行读取文件内容

  • read()方法
    默认会把文件的所有内容一次性读取到内存。如果文件太大,对内存的占用会非常严重。
  • readline方法
    readline方法可以一次读取一行内容。方法执行后,会把文件指针移动到下一行,准备再次读取。这是读取大文件的正确姿势。

2. 目录操作

  • 在终端/文件浏览器、中可以执行常规的文件/目录管理操作,例如:
    创建、重命名、删除、改变路径、查看目录内容、…….
  • 在Python中,如果希望通过程序实现上述功能,需要导入os模块

2.1 文件操作

Python爬虫基础讲解:数据持久化——文件操作

2.2 目录操作

Python爬虫基础讲解:数据持久化——文件操作

提示:文件或者目录操作都支持相对路径和绝对路径

文章来源:https://www.cnblogs.com/qshhl/p/14781279.html

后台-系统设置-扩展变量-手机广告位-内容正文底部
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:https://www.jcdi.cn/pythonjc/30757.html

留言与评论(共有 0 条评论)
   
验证码:
后台-系统设置-扩展变量-手机广告位-评论底部广告位

教程弟

https://www.jcdi.cn/

统计代码 | 京ICP1234567-2号

Powered By 教程弟 教程弟

使用手机软件扫描微信二维码