问题描述
限时送ChatGPT账号..有没有办法提取光束 pcollection 中的前 n 个元素?该文档似乎没有表明任何此类功能.我认为这样的操作首先需要一个全局元素编号分配,然后是一个过滤器 - 拥有这个功能会很好.
Is there any way to extract first n elements in a beam pcollection? The documentation doesn't seem to indicate any such function. I think such an operation would require first a global element number assignment and then a filter - would be nice to have this functionality.
我使用 Google DataFlow Java SDK 2.2.0
.
推荐答案
PCollection 本身是无序的,因此不存在前 N 个元素"的概念 - 然而:
PCollection's are unordered per se, so the notion of "first N elements" does not exist - however:
如果您需要按某种标准排在前 N 个元素,您可以使用 顶部变换.
如果你需要任何 N 个元素,你可以使用 示例.
In case you need any N elements, you can use Sample.
这篇关于Beam/Dataflow 2.2.0 - 从 pcollection 中提取前 n 个元素的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
更多推荐
[db:关键词]
发布评论