文档章节

python利用set实现两个文件并集,计数

婷瑄
 婷瑄
发布于 2015/04/21 16:48
字数 143
阅读 563
收藏 3

--python实现两个文件并集,排序,计数

--(1)python版本2.3以上,低版本的python不支持set(),本文采用的是python2.7。

import sys

import time

time_start=time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))

print time_start

num=0

s1 = set(open('/home/work/ctt/20150409.uid','r').readlines())

for i in range(0,10):

  print i

  str="/home/work/ctt/data/0409logbefore/00000%s_0"%(i)

  print str

  s2=set(open(str,'r').readlines())

  s3=s1.union(s2)

  s1=s3

for item in s3:

 num=num+1

# print item

print num

time_end=time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))

print time_end



© 著作权归作者所有

婷瑄
粉丝 3
博文 42
码字总数 5316
作品 0
海淀
程序员
私信 提问
Python标准库--collections模块的Counter类

最近发现Python标准库自带的工具类十分方便,特别是这个collections容器模块,可以用来代替Python的list、tuple、dict、set,而且还提供了更多有用的功能。在collections模块中分别有6个常用...

有苦向瓜诉说
2018/11/26
0
0
Python | K近邻实现(KNN)

01 KNN可以做点什么呢? 在李航的《统计学习方法》中,详细讲解了一中分类算法:K近邻(K Nearest Neighbor),具体的算法过程和关键点可以参考这篇文章: 统计学习方法 | k近邻法 算法的理论基...

邓莎
2018/06/04
0
0
文本分类指南:你真的要错过 Python 吗?

雷锋网按:本文为雷锋字幕组编译的技术博客,原标题 A Comprehensive Guide to Understand and Implement Text Classification in Python ,作者为 SHIVAM BANSAL 。 翻译 | 马力群 于泽平 ...

雷锋字幕组
2018/07/18
0
0
大数据分析挖掘技术学习:Python文本分类

引言 文本分类作为自然语言处理任务之一,被广泛应用于解决各种商业领域的问题。文本分类的目的是将 文本/文档 自动地归类为一种或多种预定义的类别。常见的文本分类应用如下: • 理解社交媒...

加米谷大数据
2018/07/19
3
0
MongoEngine文档翻译__新手教程(四)查询数据库

Document类有一个objects 属性,用来访问在数据库中跟这个类有关的数据。这个objects 属性其实是一个QuerySetManager ,它会创建和返回访问的一个新的 QuerySet。这个QuerySet 可以是在数据库...

LeafSummer
2013/05/12
1K
1

没有更多内容

加载失败,请刷新页面

加载更多

CentOS 7 搭建源码包搭建LNMP环境

1,安装epel源 yum install -y epel-release 2, 安装需要的软件 yum install -y gcc automake autoconf libtool make gcc-c++ glibc libxslt-devel \libjpeg libjpeg-devel libpng libpng......

hansonwong
42分钟前
5
0
基于 K8s 做应用发布的工具那么多, 阿里为啥选择灰姑娘般的 Tekton ?

作者 | 邓洪超,阿里云容器平台工程师, Kubernetes Operator 第二人,云原生应用标准交付与管理领域知名技术专家 导读:近年来,越来越多专门给 Kubernetes 做应用发布的工具开始缤纷呈现,...

阿里巴巴云原生
43分钟前
2
0
ZStack的普惠云计算到底是“随大流”还是真功夫?(转自社区)

作为一名深耕技术圈的“老男人”,也算是经历过云计算领域的成长。近些年云计算技术不断成熟,百行百业开始云上之路,各大云计算厂商开始逐渐意识到云计算是一项“普惠”技术。 我一直很看好...

ZStack社区版
44分钟前
4
0
一个备份MySQL数据库的简单Shell脚本

Shell脚本是我们写不同类型命令的一种脚本,这些命令在这一个文件中就可以执行。我们也可以逐一敲入命令手动执行。如果我们要使用shell脚本就必须在一开始把这些命令写到一个文本文件中,以后...

旺仔大战肥五花
49分钟前
2
0
TiDB Binlog 源码阅读系列文章(四)Pump server 介绍

作者: satoru 在 上篇文章 中,我们介绍了 TiDB 如何通过 Pump client 将 binlog 发往 Pump,本文将继续介绍 Pump server 的实现,对应的源码主要集中在 TiDB Binlog 仓库的 pump/server.go...

TiDB
53分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部