加载中
相似度语句计算

import distance def edit_distance(s1, s2): return distance.levenshtein(s1, s2) strings = [ '你在干什么', '你在干啥子', '你在做什么', '你好啊', '我喜欢吃香蕉' ] target = '......

10/10 00:12
0
提取一篇文章中的关键字,生成词云

1,读取jie.txt中的文章 2,使用jieba进行分词 3,读stopwords.txt中的停运词,来判读清洗文章中的停运词。 4,使用jieba提取关键词,withWeight =True中的TRUE表示提取词向量,FALSH表示不提...

09/29 22:48
0
word2vec学习

wqx.txt文件,是使用jieba模块分词好的文件 #词向量 from gensim.test.utils import common_texts, get_tmpfile from gensim.models import word2vec sentences = word2vec.LineSentence('wq...

09/28 17:06
9
中文词频统计

我这属于个人笔记,记录的比较杂 安装import nltk比较麻烦,请找单独的教程 可用jieba模块,进行·中文分词 import nltk from snownlp import SnowNLP # 需要操作的句子 text = '你站在桥上看...

09/24 22:52
1
nltk模块安装

使用pip install nltk安装 直接来个这个报错 快下班了,不写了 https://www.cnblogs.com/zrmw/p/10869325.html 看这个连接 英文分词 from nltk.tokenize import TreebankWordTokenizer toke...

09/24 01:59
0
python的while不断加一

sum = 1 while sum <= 13: sum += 1 print(sum)

09/20 03:05
0
猿人学第一题

我当个人笔记的。就不写过程了 import requests import re from lxml import etree import execjs import requests import time work=int(time.time()*1000) with open('yuanrenxue.js', 'r'...

09/14 23:41
0
pyecharts的x轴数据不全

在我使用可视化时,遇到了这样一个坑 x轴的数据没有展示出来。 解决办法 红的为增大像素 黄的为修改字体倾斜度,现在为0,不倾斜 import pandas as pd from pyecharts.charts import * from ...

09/11 02:01
0
selenium无头浏览爬取搜狐新闻

个人笔记 import requests import re from lxml import etree from selenium import webdriver from selenium.webdriver.chrome.options import Options def hebej(): url="http://www.hebei...

09/07 00:48
0
scrapy携带参数post爬取

个人笔记 # -*- coding: utf-8 -*- import scrapy import re import time from datetime import datetime, date, timedelta from scrapy.http import Request from fzggw.utils import * fro...

09/03 21:50
0
中文乱码处理

个人笔记 html_temp=requests.get(url=url,headers=headers) html_temp .encoding = html_temp .apparent_encoding print(html_temp.text) 记住·,先转码,后txt 原链接 添加链接描述......

09/01 18:33
0
Python对时间的处理

from datetime import datetime current=1 item_data='2021-08-19' date_time = datetime.strptime(item_data, "%Y-%m-%d")#格式化时间,使其规范 now_time = datetime.now()#获取当前时间 ...

08/20 18:22
0
Python的txt文件转wps

from docx import Document document = Document() f = open('./隐私收集器APP潜在风险整改思路.txt', 'r', encoding='UTF-8') content = f.read() f.close() print('读取完毕') document.a...

07/22 17:42
0
python读取和解压zip文件

读取` import zipfile z = zipfile.ZipFile("E://MIS//MIS//API_NY.GDP.PCAP.KD_DS2_zh_csv_v2_2262867.zip", 'r' ) # 这里的第二个参数用r表示是读取zip文件,w是创建一个zip文件 for f in...

05/19 22:17
17
批量更改sql表头

1,首先你的把所有表明提取出来 组合sql语句就行 import pymssql import os import pandas as pd import random conn = pymssql.connect(host='ip', user='', password='', database='数据库...

05/10 18:29
0
更改csv文件表头

#更改csv文件表头。可根据以前代码,批量更改表头 file_path = r'E:/mimwqx/open/Demographic/Population/195_DT_YAB_0003_20210429152421.csv' df = pd.read_csv(file_path, header=0) df.c...

05/06 19:19
0
爬虫根据标题爬去数据

个人笔记 while k < 10: params['page'] = k enum_url = enum_base + '?' + urlencode(params) headers['Referer'] = enum_url content = get(enum_url, headers) h......

04/13 16:41
0
保存html文件

page = 1 while 1: file_name = f'index_{page}.html' file_path = os.path.join(index_html_data_path, file_name) if os.path.exists(file_path): page += 1 ......

04/13 01:30
0
读取本地html文件进行清洗

import os import re path = "C:\dyta\Resource_File\机器学习实战教程" #文件夹目录 files= os.listdir(path) #得到文件夹下的所有文件名称 files.sort()#排序 for file in files: #遍历文件...

04/08 19:26
0
python那些好用的方法

startsWith() 方法用于检测字符串是否以指定的前缀开始。 参数 prefix – 前缀。 toffset – 字符串中开始查找的位置。 txt = "Hello, welcome to my world." x = txt.startswith("Hello") ...

04/08 17:43
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部