Python快速去重脚本是什么

发布时间:2021-11-29 14:21:33 作者:iii
来源:亿速云 阅读:231

本篇内容介绍了“Python快速去重脚本是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

一、下载pyhon脚本到本地

 Python快速去重脚本是什么

二、用法

1、必须python2环境

2、把去重的文件和该python脚本放到一起

3、新建几个有重复内容的文件,放到一个与python脚本不在一起的位置/root/123

Python快速去重脚本是什么

4、修改python脚本

#coding=utf-8import sys, re, osdef file_merge():    input_path = "/root/123/" #此处填好自己的路径,注意最后的"/"    #使用os.listdir函数获取路径下的所有的文件名,并存在一个list中    #使用os.path.join函数,将文件名和路径拼成绝对路径    whole_file = [os.path.join(input_path,file) for file in os.listdir(input_path)]    content = []    #对于每一个路径,将其打开之后,使用readlines获取全部内容    for w in whole_file:        with open(w,'rb') as f:            content = content+f.readlines()    #构造输出的路径,和输入路径在同一个文件夹下,如果该文件夹内没有这个文件会自动创建    output_path = os.path.join(input_path,'合并所有文件.txt')    #将内容写入文件    with open(output_path,'wb') as f:        f.writelines(content)  def getDictList(dict):    regx = '''[\w\~`\!\@\#\$\%\^\&\*\(\)\_\-\+\=\[\]\{\}\:\;\,\.\/\<\>\?]+'''    with open(dict) as f:        data = f.read()        return re.findall(regx, data)  def rmdp(dictList):    return list(set(dictList))  def fileSave(dictRmdp, out):    with open(out, 'a') as f:        for line in dictRmdp:            f.write(line + '\n')  def main():    try:        dict = '/root/123/合并所有文件.txt'        out = '/root/123/去重所有文件.txt'    except Exception, e:        print 'error:', e        me = os.path.basename(__file__)        exit()      dictList = getDictList(dict)    dictRmdp = rmdp(dictList)    fileSave(dictRmdp, out)    if __name__ == '__main__':    file_merge()    main()

5、python2 quchong.py运行脚本,会在/root/123目录下生成去重文件

Python快速去重脚本是什么

6、工作原理 

将当前目录下所有文件合并为一个文件:合并所有文件.txt,对该文件进行去重,最终生成去重所有文件.txt,该文件就是最后想要的文件。

“Python快速去重脚本是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

推荐阅读:
  1. 快网CDN怎么样统计脚本
  2. python脚本指的是什么

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python

上一篇:Python中的list怎么使用

下一篇:C/C++ Qt TreeWidget单层树形组件怎么应用

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》