python 操作文件与目录

时间：04-01来源：作者：点击数：46

一、查找某个文件夹的指定后缀文件，是否包含指某字段：

def find_file(route,suffix,keyword):
	""" 查询某个文件夹，指定后缀文件，是否包含指定的关键字
		route：文件夹路径，suffix：文件后缀，keyword：关键字； """
	import os
	os.chdir(route)
	d = os.popen('findstr/s "{}" *.{}'.format(keyword,suffix))
	d=d.read().split()
	return d

执行结果：

二、文件写入:

file是文件的路径加名称, mode就是操作文件的模式，主要有r,w,rb，wb等，细节网上很多,buffering = -1是用于指示访问文件所采用的缓存方式。0表示不缓存；1表示只缓存一行，n代表缓存n行。如果不提供或为负数，则代表使用系统默认的缓存机制。

file_name = 'a.txt'
with open(file=file_name,mode='w',buffering=-1) as f:
    f.write('hello')

三、文件读取:

with open('a.txt','r') as f:
    data = f.read()

四、序列化操作:

import pickle

d = ['pickle']
with open('a.txt','wb') as f:
    pickle.dump(d,f)  # 序列化

with open('a.txt','rb') as f:
    ud = pickle.load(f) # 反序列化

五、os 与 sys模块常用操作

import os #os模块

os.getcwd() #查看当前工作目录

os.chdir("path") #改变工作目录

os.listdir("path") #列举指定目录的文件名,'.'(当前),'..'(上一级)

os.environ['COMPUTERNAME'] # 获取计算机名称

# 关闭进程，2种方法

from signal import SIGTERM
pid = os.getpid()
os.kill(pid,SIGTERM)  # 方法1

os.system('taskkill /f /pid %s'%pid)  # 方法2

#列出指定目录后缀为.py的文件,2种方法

[n for n in os.listdir("path") if n.endswith('.py')] #方法1

import glob #方法2

glob.glob('path'+'/*.py') #和方法1不同的是,它会把路径也列出

os.mkdir("path") #创建单层目录

os.makedirs("path\\path\\...") #创建多层目录

os.remove("path") #删除文件

os.rmdir("path") #删除单层非空目录

os.removedirs('path\\path\\...') #删除多层非空目录

os.rename('a','y') #将a重命名为y

os.system("cmd") #运行系统的shell命令

os.popen("cmd").read() # 执行系统的shell命令,并返回结果

os.sep #输出操作系统的路径分隔符; os.linesep #输出当前系统终止符

os.stat(file) # 获取文件属性

os.startfile(file) # 打开文件

#os.path模块

os.path.join(r"C:\python","1.txt")#组合成完整路径:C:\\python\\1.txt

os.path.split(r"a\l.txt") #分割路径和文件名:"a","1.txt"

os.path.getsize('1.py') #获取文件的字节尺寸

os.path.getatime(file) #获取文件最近访问时间

os.path.getctime(file) #获取文件创建时间

os.path.getmtime(file) #获取文件最近修改时间

..exists(path) #判断是否存在此目录或文件

..isdir(path) #判断是否存在此目录

..isfile(path) #判断是否存在此文件

# sys 模块

sys.argv # 实现从程序外部向程序传递参数。

sys.exit([arg]) # 程序中间的退出，arg=0为正常退出。

sys.getdefaultencoding() # 获取系统当前编码

sys.setdefaultencoding() # 设置系统默认编码，执行dir（sys）时不会看到这个方法，在解释器中执行不通过，可以先执行reload(sys)，在执行 setdefaultencoding('utf8')，此时将系统默认编码设置为utf8。

sys.getfilesystemencoding() # 获取文件系统使用的编码方式

sys.path # 获取指定模块搜索路径的字符串集合，可以将写好的模块放在得到的某个路径下，就可以在程序中import时正确找到。

sys.platform # 获取当前系统平台。

import sys

sys.path.append("python") #模块a7在桌面的python文件夹

import a7 #导入a7模块,注:从桌面一个py文件导入

from imp import reload

reload(a7) #如导入的模块中间出现了变动,则需如此重载

六、struct模块，读取二进制文件数据，下面以通达信的 .day 文件为例

from struct import unpack
import os
from datetime import datetime

def read_data(fname,code):
    ''' 读取通达信day数据 '''
    data = []
    with open(fname, 'rb') as f:
        buf = f.read()
    num = len(buf)  # 总长度
    no = num / 32    # 分块长度
    b = 0            # 开始指针
    e = 32            # 每一个小块的长度

    for i in range(int(no)):
        a = unpack('IIIIIfII', buf[b:e])
        dd=datetime(a[0]//10000,a[0]%10000//100,a[0]%100)
        openPrice = a[1] / 100.0
        high = a[2] / 100.0
        low = a[3] / 100.0
        close = a[4] / 100.0
        amount = a[5] / 100.0
        vol = a[6] / 100.0

        # 把数据添加到列表
        # [日期时间，开盘价，最高价，最低价，收盘价，成交额，成交量，股票代码]
        data.append([dd, openPrice, high, low, close, amount, vol, code])

        b += 32
        e += 32

    return data

fname = r'D:\新建文件夹\vipdoc\sz\lday\sz000001.day'
code = 'sz000001'

data=read_data(fname,code)

print(data[0])

Out：[datetime.datetime(1991, 12, 23, 0, 0), 27.7, 27.9, 27.6, 27.8, 35306.0, 1270.0, 'sz000001']