爬虫爬取QQ号|电子爱好者

admin管理员组
文章数量:1646706

这个爬虫是拿来练手的，可以爬取网络中的QQ号，然后存储到本地。

import urllib.request
import ssl
import re
import os
from collections import deque #导入队列库

def writeFileBytes(htmlBytes,topath):
    with open(topath,'wb') as f:
        f.write(htmlBytes)
def writeFileStr(htmlBytes,topath):
    with open(topath, 'w') as f:
        f.write(str(htmlBytes))

def QQCrawler(url, topath):
    headers = {
        "User-Agent": "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; 360SE)"
    }          #修改一下浏览器表头（User-Agent）
    req = urllib.request.Request(url, headers=headers)  # 请求体
    context = ssl._create_unverified_context()          #加上此行可以爬取https格式
    response = urllib.request.urlopen(req, context=context)
    HTMLStr = response.read()
    # writeFileBytes(HTMLStr,r"G:\python代码\爬虫\QQ号.html")
    # writeFileStr(HTMLStr,r"G:\python代码\爬虫\QQ号.txt")

    htmlStr=str(HTMLStr)

    pat=r'\b(([\w-]+://?|www[.])[^\s()<>]+(?:[\w\d]+[\w\d]+|([^[:punct:]\s]|/)))'  
    #网址的正则表达式
    re_url=repile(pat)
    urlsList=re_url.findall(htmlStr)
    urlsList = list(set(urlsList))


    #找到所有的QQ
    pat=r"[1-9][\d]{5,9}"        #QQ号的正则表达式
    re_q=repile(pat)         #编译
    qqList=re_q.findall(htmlStr)
    qqList=list(set(qqList))   #过滤重复QQ号
    f=open(topath,'a')
    #写入文件
    for qq in qqList:
        f.write(qq+"\n")
    f.close()


    return urlsList  #返回一个存储这个网页中的超链接



#队列，得到一页中的网址，然后加入队列，爬取每个网页的QQ号
def center(url,topath):
    queue=deque()
    queue.append(url)
    while len(queue)!=0:
        targetUrl=queue.popleft()
        urlList=QQCrawler(targetUrl, path)

        for item in urlList:
            tempUrl=item[0]
            queue.append(tempUrl)

url = r"https://www.douban/group/topic/17359302/" #爬取链接
path = r"G:\python代码\爬虫\QQ号.txt" #存储路径
# QQCrawler(url,path)
center(url,path)

还存在一些问题：url的正则表达式存在问题，不能匹配所有的链接。运行时也存在问题，爬取到本地的数据只有2M多，程序就停止运行了。

本文标签：爬虫 qq

版权声明：本文标题：爬虫爬取QQ号内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1729444861a1201328.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

QQ自动登录QQ登录器程序源代码VS2010VS2012VCMFC

7小时前

学习豪迪，研究了一下QQ自动登录怎么写。以前QQ登录的介面先用SPY来找到QQ登陆框，然后再把密码copy进去，就可以了。现在的QQ登录介面这招不行&#xff0c

淘宝京东京粉QQ 消息转链软件

7小时前

基于酷Q 的插件 QQ 京东淘宝转链软件是用来： 将别人QQ发送的优惠信息经过软件内部转链，转发到目标群。设置一个QQ群内需要监控发优惠信息的人，在软件设置页面时输入返利信

ShareSDK第三方登录获取QQ和微信的unionid

7小时前

在项目开发过程中,使用ShareSDK提供的第三方登录功能,后台传参中需要unionid下面介绍unionid的获取 1 . 微信 unionid 的获取微信 unionid 的获取很简单 : Platform weChat

ERROR: Unknown host 'android-mirror.bugly.qq.com'.

7小时前

1. Android Studio打开一个项目自动Run一会马上就报错： ERROR: Unknown host android-mirror.bugly.qq. You may need to adjust the

Qt实现类似QQ好友列表

7小时前

思路做个类似QQ好友列表的控件。网上查询到的思路： 利用一组一组的QToolButton的来实现。采用QLisview和QTreeView实现。通过代理来设置每一个项的样子。采用QListWidget&

python使用scrapy爬取qq音乐（一）

7小时前

url分析，拿到初始url（start_url） 要爬取的内容为qq音乐的排行榜中的歌曲，首先我们要分析url： 1.打开qq

Mac如何找到和清理微信与QQ的文件和照片？

7小时前

微信 ~LibraryContainerscom.tencent.xinWeChatDataLibraryApplication Supportcom.tencent.xinWeChat 都在这个文件夹里面我们在微信打

NSIS教程(9): NSIS+duilib仿QQ安装包

7小时前

推荐：NSIS-UI-Plugin 开源NSIS UI插件框架，支持任意第三方界面库，默认提供使用Qt作为界面库的安装包示例。本文在NSIS教程(8): 基于第三方界面库的安装包界面基础上，分享如何使用NSIS结合duilib高仿QQ安装

SQL第十三章QQ

7小时前

--向QQUser表插入数据INSERT INTO QQUser(QQID,PassWord,lastLogTime,Online,Level)VALUES(54789625,'add512#&','

QQ飞车奖励列表

7小时前

开QQ飞车永久装备① 永久A车草莓果冻：帝王，天启（永久） 【NEW】大青虫: 【锐速】、【黑夜传说】（永久&#

wpf实现仿qq消息提示框

7小时前

1、实现步骤 1.1 另起一个窗口作为消息提示的窗口，在主窗体中调用，先处理一下消息框的展示问题， AllowsTransparency"True"

java Swing QQ登陆界面

7小时前

这几天写了一个QQ登录界面，本来想做到高仿的，但是现在得做Kinect项目，无奈这个就得放一放了，但是现在这里做个记录先说一下思想&#xff

图解QQ空间日志爬虫的全部日志获取与日志实际地址分析.

7小时前

http:wwwblogsdennisitarchive201301032842925.html 无聊的元旦,用Java实现QQ空间备份器时分析了如何进行模块爬取实际地址中的需要信息的感悟,与图解步骤,写出来与大家共享,交流

在网页中添加QQ聊天按钮

7小时前

“QQ在线状态”是一种快速沟通服务，可以让你在不加好友的情况下和域中的朋友发起临时会话。从而进行个人沟通、商业交流或提供线上即时客户服务，使不断地扩大网站的影响力以及知名度。我们经常会在一些网站、

解决从onenote 中文字复制后再粘贴到QQ变成图片格式

7小时前

一、问题描述从onenote 中文字复制后再粘贴到QQ变成图片格式； 二、解决方法 1、最开始的解决方式是先粘贴到txt中，再复制到qq中使用，此方法还要多一层操作&

Ubuntu20.04LTS 安装QQ 微信钉钉最简单，最好用的方式！

7小时前

在我折腾了CrossOver,PlayOnLinux 两个封装wine的平台，以及直接wine xxx.exe 后，发现都不满意，要么中文乱码，qq记住密码无解，微信不能输入个或者直接不能运行等bug后，直接裂开。后来发现了deepi

qq聊天记录词频查询 python实现

7小时前

为了给后期聊天机器人提供大量的聊天词汇写了这个脚本，感兴趣的朋友可以看一下下面是代码：#-*-coding:utf8-*-import redef getWordRate(name,path,requestL):file =

分享失败,错误码:-24006,错误描述:尚未设置QQ的URL Scheme

7小时前

解决方法： 登录QQ互联（http:open.qq）注册成为开发者并登记应用取得AppId（如果配置QQ空间时已申请应用Id可以不需要重复申请&

QQ登录界面因果图法设计测试用例

7小时前

从别的网站上转载了这篇文章，虽然在这个测试存在很多漏洞，但是方法还是值得提倡的。不过有些地方需要进行在更新。 1. QQ的账号范围，对于正常情况，要测

安卓使用无障碍服务监听微信和QQ的收款信息

7小时前

导读： 资深的安卓程序员想必都了解，安卓的通知监听服务（NotificationListenerService）可以监听通知栏的信息&#xff

电子爱好者 - 最新技术资讯及电子产品介绍！

爬虫爬取QQ号

更多相关文章

QQ自动登录QQ登录器程序源代码VS2010VS2012VCMFC

淘宝京东京粉QQ 消息 转链 软件

ShareSDK第三方登录获取QQ和微信的unionid

ERROR: Unknown host 'android-mirror.bugly.qq.com'.

Qt实现类似QQ好友列表

python使用scrapy爬取qq音乐（一）

Mac如何找到和清理微信与QQ的文件和照片？

NSIS教程(9): NSIS+duilib仿QQ安装包

SQL第十三章QQ

QQ飞车奖励列表

wpf实现仿qq消息提示框

java Swing QQ登陆界面

图解QQ空间日志爬虫的全部日志获取与日志实际地址分析.

在网页中添加QQ聊天按钮

解决从onenote 中文字复制后再粘贴到QQ变成图片格式

Ubuntu20.04LTS 安装QQ 微信 钉钉 最简单，最好用的方式！

qq聊天记录词频查询 python实现

分享失败,错误码:-24006,错误描述:尚未设置QQ的URL Scheme

QQ登录界面因果图法设计测试用例

安卓使用无障碍服务监听微信和QQ的收款信息

发表评论

推荐文章

基于C++(QT框架)设计的网络摄像头项目(支持跨平台运行)

Python3.11教程3：模块和包（pipconda）、文件系统(os shutiljsonpickleopenpyxlxlrd)

Ubuntu 18.04 安装nvidia-smi 后开机黑屏的解决方法

CST软件如何设置硬件加速选项GPU DCMPI token？

重装win7系统后修复linux启动引导

热门文章

flask session 使用 sqlalchemy postgresql 时的问题

前端实现视频或者图片直链下载

win11右键显示全部菜单

各大搜索引擎网站收录提交入口

清理win7C盘空间

未能加载文件或程序集“System.Data.OracleClient, Version=4.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e0

投资平台服务器状态未知,投资者说20130606:503 service unavailable错误解决教程

Microsoft SQL Server 数据库 错误号大全

Ubuntu20.04系统中安装微信、QQ和钉钉等应用(使用DeepinWine)

关于smtp.exmail.qq.com:25端口访问超时的问题

最新文章

win10备份为wim_Win10也能玩转一键自动还原

UCWEB CEO俞永福：手机浏览器要深化本地化服务

[任天堂社长访谈之：Nintendo 3DS内置软件

苹果、google、微软的那些事(iPhone)

微信成犯罪分子工具

win10自带的快捷键

感受移动互联网的气息

其实大多数人没必要买iphone5

收集：现场救人、抗震救援、灾后心理援助、地震和救灾的常见误区、地震时使用手机报平安办法...

[zz]关于相机

Windows重启-自带触摸键盘无法弹出

刚性捆绑，无线运营新模式

牛人犀利的对苹果，微软，黑莓和安卓等手机系统的见解

智能手表的未来：独立还是附属，这是个问题！

移动社交：一场愈演愈烈的社交变革

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

淘宝京东京粉QQ 消息转链软件

Ubuntu20.04LTS 安装QQ 微信钉钉最简单，最好用的方式！

Microsoft SQL Server 数据库错误号大全

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载