遍历操作"/>
【pyhton路上小记】读取本地文件遍历操作
以遍历路径并选择所有xml文件进行操作为例
使用os模块,os.walk、os.path.join等方法
# coding=utf-8
import os
import re
import hashlib
#
def main():houzhui = [".xml"]rootPath = 'Y:/a/b/c/d'for root, dirs, files in os.walk(rootPath):# print('root_dir:', root) # 当前目录路径# print('sub_dirs:', dirs) # 当前路径下所有子目录# print('files:', files) # 当前路径下所有非目录子文件for filename in files:xml_path = os.path.join(root, filename) # 合并成一个完整文件路径ext = os.path.splitext(xml_path)[1] # 获取文件后缀if ext in houzhui:print(xml_path)with open(xml_path, "r", encoding='utf8') as f:xmltext = f.read()# 打开后还可以进行其他操作,这里只计算md5为例contents = xmltext.encode(encoding="utf8")xmlmd5 = hashlib.md5(contents).hexdigest()# 记录文件名字和md5到数据库insertsql = 'insert into tablename (id,xmlmd5) VALUES ("%s","%s");'%(filename,xmlmd5)
更多推荐
【pyhton路上小记】读取本地文件遍历操作
发布评论