python破解qq密码_央·python编程之QQ数据清洗

编程知识 更新时间:2023-05-03 03:38:08

一般我们从网上下下来的数据都很杂乱的,什么样的情况都有,不利于我们整理,所以在拿到数据的时候我们会先做一遍数据清理,把垃圾数据清理掉。

今天我们拿QQ数据做示范。

我们命令行是怎么看数据!

[Asm] 纯文本查看 复制代码more zy.txt

#然后空格进行翻页

效果如图:

1.png (11.5 KB, 下载次数: 0)

2018-1-30 17:54 上传

从数据中得知:

---- 中间4个-

左边是账号,右边是密码

目前QQ最多就11位,密码最长16位,所以数据中位数最多31位(4+11+16),大于的都是垃圾(第一轮筛选)

我先用python 读取QQ操作

[Asm] 纯文本查看 复制代码import codecs

filepath=r"C:\Users\Administrator\Desktop\zy.txt"

file=codecs.open(filepath,"rb","gbk","ignore")#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

#savefilepath="C:\Users\Administrator\Desktop\zy1.txt"

for line in mylist:

QQlist=line.split('----')

print(QQlist[1])

2.png (19.57 KB, 下载次数: 1)

2018-1-30 17:55 上传

注:此方法是读取到内存,所以很占空间,会很卡。

数据中我们看到很多垃圾数据,我们看下垃圾数据

[Asm] 纯文本查看 复制代码import codecs

filepath=r"C:\Users\Administrator\Desktop\zy.txt"

file=codecs.open(filepath,"rb","gbk","ignore")#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

#savefilepath="C:\Users\Administrator\Desktop\zy1.txt"

for line in mylist:

QQlist=line.split('----')

if len(line)>31:

print(line)#打印垃圾数据

22.png (26 KB, 下载次数: 0)

2018-1-30 17:56 上传

进行QQ清洗,在分别保存账号文本和密码文本。

[Asm] 纯文本查看 复制代码import codecs

filepath=r"C:\Users\Administrator\Desktop\zy.txt"

file=codecs.open(filepath,"rb","gbk","ignore")#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

savegoodfilepath=r"C:\Users\Administrator\Desktop\zyQQGood.txt"

savebadfilepath=r"C:\Users\Administrator\Desktop\zyQQbad.txt"

filegood=open(savegoodfilepath,"wb")

filebad=open(savebadfilepath,"wb")

for line in mylist:

if len(line)>31 or len(line)<=15:#(4+5+6)

filebad.write(line.encode("utf-8"))

else:

QQlist = line.split('----')

if len(QQlist)==2:

filegood.write(line.encode("utf-8"))

else:

filebad.write(line.encode("utf-8"))

filebad.close()

filegood.close()

效果图:

44.png (38.09 KB, 下载次数: 0)

2018-1-30 17:57 上传

附件:

中央纪委pyhon数据清理.zip

(3.81 KB, 下载次数: 25)

2018-1-30 17:58 上传

点击文件名下载附件

下载积分: 吾爱币 -1 CB

更多推荐

python破解qq密码_央·python编程之QQ数据清洗

本文发布于:2023-04-30 10:20:00,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/8b82e9deb41f153a34698a951e6af04a.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:密码   数据   python   qq   QQ

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!

  • 114007文章数
  • 28898阅读数
  • 0评论数