admin管理员组文章数量:1604637
注: 抓取Google评论的时候,'hl=en' 这个参数是关键,en是英语,所以你看到的评论就是英语的,其他地区看不到
以下是针对chrome浏览器的评论抓取
APP链接: https://play.google/store/apps/details?id=com.android.chrome&showAllReviews=true&hl=en
第一页的数据 用 Xpath 或者 正则 的方式获取评论 ,其中用户名称,评论时间,打星数量都有
翻页抓取
上面的这个字符串是下一页的标识 (获取方式是请求当前访问的URL链接 (https://play.google/store/apps/details?id=com.android.chrome&showAllReviews=true&hl=en) 然后用正则获取整个json,然后取出)
下面是使用方法
curl 'https://play.google/_/PlayStoreUi/data/batchexecute' \
--data-raw 'f.req=[[["UsvDTd","[null,null,[2,null,[40,null,\"CsUBCsIBKpsBCm73O5rLG_____9nYWlhOjAwMDAwMGU2YTRiMTNmOTQ6MTp2bToxMDczODQ5MjEwOTI0ODU4NDI0OQD_Af_-Z2FpYTowMDAwMDBlNmE0YjEzZjk0OjE6dm06MTA3Mzg0OTIxMDkyNDg1ODQyNDkAARAoIWtbxE9mhitbOQAAAADkNGXESAFQAFoLCWDbJ26NiKTXEANgwdyvoQIyIgogCh5hbmRyb2lkX2hlbHBmdWxuZXNzX3FzY29yZV92MmE\"],null,[]],[\"com.android.chrome\",7]]",null,"generic"]]]&hl=en' \
--compressed
form_data中 [[["UsvDTd","[null,null,[2,null,[40,null,\" 后面这堆字符串是下一页的参数
form_data中 hl=en 是控制抓取内容语言的功能, 切换地区可换,如 hl=id, hl=zh-CN
请求返回的json,需要处理一下,json当中存在下一页的参数,在json的最后
一个简单的Google Play评论的抓取就完成了,大家可以参考这个案例去抓取其他APP的评论。
源代码就不发了,自己操作一遍就能明白,学会了是自己的,在这里祝大家步步高升。
版权声明:本文标题:Google Play评论抓取 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dongtai/1728465936a1159449.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论