文档章节

Python使用difflib对比两个文件操作实例

henni_719
 henni_719
发布于 2017/04/22 17:11
字数 738
阅读 2
收藏 0
#coding=utf8
'''
该库用来管理文件。
初始化函数调用读取配置文件模块中的Config类
用来获取下载路径、保存路径。
模块包含四个方法:
clearResultCSV(): 用来删除下载路径下所有的result开头的csv文件
moveCSVToSave():把下载路径下的result.csv文件重命名,并把重命名后的文件移动到保存路径下
getLastFileWithPath():获取保存路径下最新的文件,并带路径返回该文件
getLastFile():获得最新文件的命令并返回

'''
import os
#操作文件的包
import shutil
import re
import time
import difflib
#导入读取配置文件库的Config
from readConfig import Config

class FileManger(object):
    def __init__(self,configObj=Config()):
        try:
            #创建一个Config对象实例
            self.config=configObj
            #通过对象实例调用方法getDownPath()
            #获取下载路径
            self.down=self.config.getDownPath()
            #通过对象实例调用方法getSavePath()
            #获取保存路径
            try:
                self.save=self.config.getSavePath()
                if os.path.exists(self.save):
                    pass
                else:
                    os.mkdir(self.save)
                    self.save=self.save
            except Exception,e:
                print "Save Report Error:",e
        except Exception,e:
            print e
      
            
    def clearResultCSV(self):
        try:
            #获取下载路径下的所有文件
            #并把文件保存在list变量fileList中
            fileList=os.listdir(self.down)
            #判断fileList是否为空,不为空执行if模块
            if  fileList:
                #对fileList中的元素进行循环
                for item in fileList:
                    #查找下载路径下是否存在result开头的csv文件
                    #如果存在,则删除
                    if re.match("result(.*).csv",item):
                        #删除result开头的csv文件
                        os.remove(self.down+"\\"+item)
        except Exception,e:
            print e   
    
    def moveCSVToSave(self):
        try:
            #获取下载路径下的所有文件
            #并把文件保存在list变量fileList中
            fileList=os.listdir(self.down)
            #获取当前时间并转换为字符串格式
            now=time.strftime("%Y%m%d%H%M%S")
            #判断fileList是否为空,不为空执行if模块
            if  fileList:
                #对fileList中的元素进行循环
                for item in fileList:
                    try:
                        #查找下载路径下是否存在result.csv文件
                        #如果存在,对文件进行重命名
                        if re.match("result\.csv",item):
                            #获取带有路径的result.csv文件
                            oldfilename=self.down+"\\"+item
                            #重命名的命令格式是符:20170306143330.csv
                            newfileName=self.down+"\\"+now+".csv"
                            #对文件result.csv进行重命名为格式如:20170306143330.csv
                            os.rename(oldfilename,newfileName)
                            #把重命名的文件移动到保存路径下
                            shutil.move(newfileName, self.save) 
                    except Exception,e:
                        print e                                                   
        except Exception,e:
            print e
    
    def getLastReqement(self):
        try:
            #获取下载路径下的所有文件
            #并把文件保存在list变量listfile中
            listfile=os.listdir(self.save)
            #判断listfile是否为空,不为空执行if模块
            if len(listfile)>1:
                #保存带有路径的最新文件
                try:
                    self.diffPath=self.config.getDiffPath()
                    if os.path.exists(self.diffPath):
                        pass
                    else:
                        os.mkdir(self.diffPath)
                        self.diffPath=self.diffPath
        
                    lastfile=self.save+"\\"+listfile[-1]
                    #获取第二个比较新的文档
                    twofile=self.save+"\\"+listfile[-2]                    
                    lastestFile=open(lastfile,"r").readlines()
                    secondLastestFile=open(twofile,"r").readlines()
                    diffInf=difflib.ndiff(lastestFile,secondLastestFile)
                    diffHtml=open(self.diffPath+"\\"+"diff.log","w")             
                    diffHtml.writelines(diffInf)                        
                except Exception,e:
                        print "Save Diff Error:",e              
        except Exception,e:
            print e         
                  
                    
def test():
    '''
    创建一个测试脚本,执行冒烟测试。
    用来验证程序功能能正常运行。
    '''
    #创建一个Config对象实例
    fm=FileManger()
    #fm.clearResultCSV()
    
    fm.moveCSVToSave()
    print fm.getLastFileWithPath(),os.listdir(fm.save)
    
if __name__=="__main__":
    test()

© 著作权归作者所有

henni_719
粉丝 2
博文 466
码字总数 343938
作品 0
信阳
QA/测试工程师
私信 提问
python使用difflib对比文件示例

使用difflib模块对比文件内容 1 示例:字符串差异对比 vim duibi.py #!/usr/bin/env python -- coding: utf-8 -- import reimport osimport difflibtex1="""tex1:this is a test for difflib......

super李导
2018/05/10
0
0
【Python】 字符串相似性度量,用difflib还是Levenshtein

【作者笔记】 difflib(Python自带):不一定为字符串,数组也可以匹配,但数组匹配时只有单个元素完全匹配才计入相似。 Levenshtein(第三方插件):需要输入为字符串,匹配时是整体匹配,数...

qcyfred
03/19
0
0
python中的difflib

#############difflib############## 文件差异对比 示例1: import difflib text1 = 'hello westos' text2 = 'hello zhan' text1_lines = text1.splitlines() text2_lines = text2.splitlines......

2017lw
2018/06/26
0
0
python中的difflib

#############difflib############## 文件差异对比 示例1: import difflib text1 = 'hello westos' text2 = 'hello zhan' text1_lines = text1.splitlines() text2_lines = text2.splitlines......

2017lw
2018/06/26
0
0
Python文件对比

环境: python2.6.6 linux系统 对比文件差异用Python里的difflib模块: Python自带difflib模块,无需安装。 对比两个文件是否一样总体思路就是:将文件里的内容读出来然后再对比 示例一: #!...

天道酬勤VIP
2017/09/05
0
0

没有更多内容

加载失败,请刷新页面

加载更多

只需一步,在Spring Boot中统一Restful API返回值格式与统一处理异常

统一返回值 在前后端分离大行其道的今天,有一个统一的返回值格式不仅能使我们的接口看起来更漂亮,而且还可以使前端可以统一处理很多东西,避免很多问题的产生。 比较通用的返回值格式如下:...

晓月寒丶
昨天
59
0
区块链应用到供应链上的好处和实际案例

区块链可以解决供应链中的很多问题,例如记录以及追踪产品。那么使用区块链应用到各产品供应链上到底有什么好处?猎头悬赏平台解优人才网小编给大家做个简单的分享: 使用区块链的最突出的优...

猎头悬赏平台
昨天
28
0
全世界到底有多少软件开发人员?

埃文斯数据公司(Evans Data Corporation) 2019 最新的统计数据(原文)显示,2018 年全球共有 2300 万软件开发人员,预计到 2019 年底这个数字将达到 2640万,到 2023 年达到 2770万。 而来自...

红薯
昨天
65
0
Go 语言基础—— 通道(channel)

通过通信来共享内存(Java是通过共享内存来通信的) 定义 func service() string {time.Sleep(time.Millisecond * 50)return "Done"}func AsyncService() chan string {retCh := mak......

刘一草
昨天
58
0
Apache Flink 零基础入门(一):基础概念解析

Apache Flink 的定义、架构及原理 Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态或无状态的计算,能够部署在各种集群环境,对各种规模大小的数据进行快速...

Vincent-Duan
昨天
60
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部