如何使用puppeteer(nodejs applicatie)抓取instagram帖子的网址

编程入门 行业动态 更新时间:2024-10-09 12:30:47

<a href=https://www.elefans.com/category/jswz/34/1771452.html style=如何使用puppeteer(nodejs applicatie)抓取instagram帖子的网址"/>

如何使用puppeteer(nodejs applicatie)抓取instagram帖子的网址

通过对当前Instagram api的所有更改,我试图构建一个刮板。环顾四周后,我发现了p。尽管这似乎很直截了当,但我遇到了一个问题,似乎无法解决问题。

问题如下:我知道帖子的div标签是(.v1Nh3.kIKUG._bz0w),以及如何调用它(元素=等待页面。$$('。v1Nh3.kIKUG._bz0w');)

如果我正确理解$$函数,则应该向我返回一个包含“页面”上所有帖子的数组的诺言。

我的第一个问题是这个假设是否正确,而我的第二个问题是如何获取数组。 (如果一切正常,那么如何获取子href中包含的重定向URL)

问候,

Daneel

回答如下:

为了获得具有特定类的元素并返回它们,您必须使用page.evaluate方法。这是一个异步调用,它返回一个Promise。

因此,在您的用例中,它应该看起来像这样:

const result = await page.evaluate(() => {
    let elements = document.querySelectorAll('.v1Nh3.kIKUG._bz0w');
    //elements holds a NodeList so it is needed 
    //to convert it into an array
    let elementsArr = Array.prototype.slice.call(elements);
    return elementsArr;
});

更多推荐

如何使用puppeteer(nodejs applicatie)抓取instagram帖子的网址

本文发布于:2024-05-06 19:11:36,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1753705.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:如何使用   网址   帖子   puppeteer   applicatie

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!