文档章节

Python Excel 内容转换

 阿豪boy
发布于 2017/08/31 20:43
字数 322
阅读 6
收藏 0
点赞 0
评论 0

将这样的数据格式

 

转化为如下,方便使用爬虫验证文件是否有效

# coding=utf-8
from bs4 import BeautifulSoup
import urllib
import urllib2
import sys
import requests
import cookielib
import re

reload(sys)
sys.setdefaultencoding('utf8')

import xlwt
import xlrd

data = xlrd.open_workbook('in.xls')

table = data.sheets()[0]  # 通过索引顺序获取

# 获取行数和列数
nrows = table.nrows
ncols = table.ncols

# 循环行列表数据
pattern_url = re.compile(u'http://(.*?) 密')
pattern_code = re.compile(u'密码(.*)')

all_rows = []
for i in range(nrows):
    '链接:http://pan.baidu.com/s/1nvOFRxZ 密码:1uqh'
    try:
        s = table.cell(i, 1).value

        # url = s.split(' ')[0].split(u':')[1]
        # code = s.split(' ')[1].split(u':')[1]

        url = 'https://' + re.findall(pattern_url, s)[0]
        code = re.findall(pattern_code, s)[0][1:]

        data = {
            'title': table.cell(i, 0).value.strip(),
            'url': url.strip(),
            'code': code.strip()
        }
        # print table.cell(i, 0).value, url, code
        all_rows.append(data)
    except Exception as e:
        print e
        continue

for i in all_rows:
    print i['title'], i['url'], i['code']

# 将 all_rows 输出

# 新建一个excel文件
file = xlwt.Workbook()  # 注意这里的Workbook首字母是大写,无语吧

# 新建一个sheet
# 如果对一个单元格重复操作,会引发
# returns error:
# Exception: Attempt to overwrite cell:
# sheetname=u'sheet 1' rowx=0 colx=0
# 所以在打开时加cell_overwrite_ok=True解决

table = file.add_sheet('demo', cell_overwrite_ok=True)
# 写入数据table.write(行,列,value)
table.write(0, 0, u'课程名称')
table.write(0, 1, u'网盘链接')
table.write(0, 2, u'提取密码')

row_num = 1
for i in all_rows:
    table.write(row_num, 0, i['title'])
    table.write(row_num, 1, i['url'])
    table.write(row_num, 2, i['code'])
    row_num += 1

# 保存文件
file.save('demo.xls')

 

© 著作权归作者所有

共有 人打赏支持
粉丝 21
博文 877
码字总数 630930
作品 0
西安
Python处理csv、xlsx、pdf

一、csv文件的处理 CSV(Comma-Separated Values)即逗号分隔值,可以用Excel打开查看。由于是纯文本,任何编辑器也都可打开。与 Excel 文件不同,CSV 文件中: 值没有类型,所有值都是字符串 ...

blackfoxya ⋅ 06/08 ⋅ 0

使用nmap-converter将nmap扫描结果XML转化为XLS实战

1、前言 作为网络安全从业人员,有时候需要使用端口扫描利器nmap进行大批量端口扫描,但Nmap的输出结果为.nmap、.xml和.gnmap三种格式,还有夹杂很多不需要的信息,处理起来十分不方便,而将...

林鸿风采 ⋅ 05/08 ⋅ 0

Python实现批量解析PDF文件提取内容并写入到Excel中

摘要:最近需要将一批PDF文件中的某些数据整理到Excel中,因为文件数量接近20w+,手动更新几乎不现实,于是就提取关键词和内容动手写了个Python小工具,以实现自动完成上述目标。 要求: 基本...

_周小董 ⋅ 05/20 ⋅ 0

156个Python网络爬虫资源,妈妈再也不用担心你找不到资源了

本列表包含Python网页抓取和数据处理相关的库。 前几天有私信小编要Python的学习资料,小编整理了一些有深度的Python教程和参考资料,从入门到高级的都有,文件已经打包好了,正在学习Pytho...

雁横 ⋅ 05/02 ⋅ 0

python开源工具列表【持续更新】

以下是个人在工作中整理的一些python wheel,供参考。 这个列表包含与网页抓取和数据处理的Python库 网络 通用urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库(基于pycurl)。...

武耀文 ⋅ 04/25 ⋅ 0

python操作excel表格(xlrd/xlwt)

python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。可从这里下载https://pypi.python.org/pypi。下面分别记录python读和写excel. python读excel——xlrd 这个...

_周小董 ⋅ 05/24 ⋅ 0

如何用 Python 和 API 收集与分析网络数据?

本文以一款阿里云市场历史天气查询产品为例,为你逐步介绍如何用 Python 调用 API 收集、分析与可视化数据。希望你举一反三,轻松应对今后的 API 数据收集与分析任务。 雷同 上周的研究生课,...

王树义 ⋅ 05/21 ⋅ 0

C/C++ 和 Python混合编程

链接:https://www.zhihu.com/question/23003213/answer/56121859 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 #include int main(int argc, char *...

sirius_0 ⋅ 04/21 ⋅ 0

请看罗永浩先生如何吹牛他的Excel

来来,大家先看一个段子: 欲知详情,想看视频: 【锤子科技】2018鸟巢新品发布会视频(Excel部分)-罗永浩-老罗 看完罗永浩先生关于他Excel操作的视频,我只想呵呵一笑。我很想给他这段视频...

EasyCharts ⋅ 05/21 ⋅ 0

入门数据分析,从python开始

Python是目前学习数据分析课程中,非常重要的一块,也是目前非常受行业欢迎的。因此,学习非常重要,下面是Python学习的一些重要步骤和知识! 步骤1:熟悉Python 对数据科学,Python和R都是不...

weixin_41852491 ⋅ 05/28 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

十五周二次课

十五周二次课 17.1mysql主从介绍 17.2准备工作 17.3配置主 17.4配置从 17.5测试主从同步 17.1mysql主从介绍 MySQL主从介绍 MySQL主从又叫做Replication、AB复制。简单讲就是A和B两台机器做主...

河图再现 ⋅ 57分钟前 ⋅ 0

docker安装snmp rrdtool环境

以Ubuntu16:04作为基础版本 docker pull ubuntu:16.04 启动一个容器 docker run -d -i -t --name flow_mete ubuntu:16.04 bash 进入容器 docker exec -it flow_mete bash cd ~ 安装基本软件 ......

messud4312 ⋅ 今天 ⋅ 0

OSChina 周一乱弹 —— 快别开心了,你还没有女友呢。

Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 @莱布妮子 :分享吴彤的单曲《好春光》 《好春光》- 吴彤 手机党少年们想听歌,请使劲儿戳(这里) @clouddyy :小萝莉街上乱跑,误把我认错成...

小小编辑 ⋅ 今天 ⋅ 7

mysql in action / alter table

change character set ALTER SCHEMA `employees` DEFAULT CHARACTER SET utf8mb4 DEFAULT COLLATE utf8mb4_general_ci ;ALTER TABLE `employees`.`t2` CHARACTER SET = utf8mb4 , COLLAT......

qwfys ⋅ 今天 ⋅ 0

Java 开发者不容错过的 12 种高效工具

Java 开发者常常都会想办法如何更快地编写 Java 代码,让编程变得更加轻松。目前,市面上涌现出越来越多的高效编程工具。所以,以下总结了一系列工具列表,其中包含了大多数开发人员已经使用...

jason_kiss ⋅ 昨天 ⋅ 0

Linux下php访问远程ms sqlserver

1、安装freetds(略,安装在/opt/local/freetds 下) 2、cd /path/to/php-5.6.36/ 进入PHP源码目录 3、cd ext/mssql进入MSSQL模块源码目录 4、/opt/php/bin/phpize生成编译配置文件 5、 . ./...

wangxuwei ⋅ 昨天 ⋅ 0

如何成为技术专家

文章来源于 -- 时间的朋友 拥有良好的心态。首先要有空杯心态,用欣赏的眼光发现并学习别人的长处,包括但不限于工具的使用,工作方法,解决问题以及规划未来的能力等。向别人学习的同时要注...

长安一梦 ⋅ 昨天 ⋅ 0

Linux vmstat命令实战详解

vmstat命令是最常见的Linux/Unix监控工具,可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率,内存使用,虚拟内存交换情况,IO读写情况。这个命令是我查看Linux/Unix最喜爱的命令...

刘祖鹏 ⋅ 昨天 ⋅ 0

MySQL

查看表相关命令 - 查看表结构    desc 表名- 查看生成表的SQL    show create table 表名- 查看索引    show index from  表名 使用索引和不使用索引 由于索引是专门用于加...

stars永恒 ⋅ 昨天 ⋅ 0

easyui学习笔记

EasyUI常用控件禁用方法 combobox $("#id").combobox({ disabled: true }); ----- $("#id").combobox({ disabled: false}); validatebox $("#id").attr("readonly", true); ----- $("#id").r......

miaojiangmin ⋅ 昨天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部