Flink流批一体化处理框架|电子爱好者

admin管理员组
文章数量:1566360

Flink流批一体化处理框架

一、简介
二、框架对比
三、编程实现
- 1.流处理
- 2.批处理
四、结语

一、简介

Apache Flink 是一个框架和分布式处理引擎，支持实时流数据处理与离线数据批处理计算。用户案例有阿里、腾讯、华为、小米、滴滴、ebay、亚马逊等，比较知名的阿里双十一交易大屏实时展示技术就是建立在该框架之上。

二、框架对比

Spark Streaming是把流转化成一个个小的批来处理，Flink是把批当作一种有界的流。

1、Storm是第一代流处理框架，数据吞吐量和延迟上表现不尽人意，而且在数据准确性方面也存在不足。
2、Spark Streaming是第二代流处理框架，每次只能处理一小批数据，以接近实时处理的效果。
3、Flink是第三代流引擎框架，基于数据有界和无界的思想，可支持流式和批量处理，吞吐量更高，延迟更低。

摘自知乎

三、编程实现

1.流处理

所谓流处理，就是说有条消息通道，不断地有数据过来，然后进行处理。

我们用nc监听9999端口（TCP服务器），客户端编程连接此服务器，接收消息进行wordcount统计。

创建TCP端口监听，若要创建udp端口加参数-u即可：

nc -lk 9999

连接：

nc 127.0.0.1 9999

客户端连接后键盘发送消息即可：

客户端代码：
pom.xml

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache/POM/4.0.0"
         xmlns:xsi="http://www.w3/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache/POM/4.0.0 http://maven.apache/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.example</groupId>
    <artifactId>test01</artifactId>
    <version>1.0-SNAPSHOT</version>

    <properties>
        <mavenpiler.source>8</mavenpiler.source>
        <mavenpiler.target>8</mavenpiler.target>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-scala_2.11</artifactId>
            <version>1.14.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-clients_2.11</artifactId>
            <version>1.14.0</version>
        </dependency>
    </dependencies>

    <build>
        <plugins>
            <!-- 该插件用于将Scala代码编译成class文件 -->
            <plugin>
                <groupId>net.alchim31.maven</groupId>
                <artifactId>scala-maven-plugin</artifactId>
                <version>3.4.6</version>
                <executions>
                    <execution>
                        <!-- 声明绑定到maven的compile阶段 -->
                        <goals>
                            <goal>testCompile</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-assembly-plugin</artifactId>
                <version>3.0.0</version>
                <configuration>
                    <descriptorRefs>
                        <descriptorRef>jar-with-dependencies</descriptorRef>
                    </descriptorRefs>
                </configuration>
                <executions>
                    <execution>
                        <id>make-assembly</id>
                        <phase>package</phase>
                        <goals>
                            <goal>single</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>
        </plugins>
    </build>
</project>

FlinkStreamWordCount.scala

package com.llqqww

import org.apache.flink.streaming.api.scala._


object FlinkStreamWordCount {

  def main(args: Array[String]): Unit = {

    println("开始")
    //初始化流计算环境
    val env = StreamExecutionEnvironment.getExecutionEnvironment

    //读取数据
    val stream = env.socketTextStream("vm.test",9999)

    //转换计算
    val result = stream.flatMap(_.split(" "))
      .map((_, 1))
      .keyBy(0)
      .sum(1)

    //打印结果到控制台
    result.print()

    //启动流式处理，如果没有该行代码上面的程序不会运行
    env.execute("WordCount")

  }
}

执行结果：

2.批处理

批处理，即处理离线数据，该数据不会再变化的。我们直接读取resources目录下的文件进行单词统计。

FlinkBatchWordCount.scala

package com.llqqww

import org.apache.flink.api.scala._

object FlinkBatchWordCount {

  def main(args: Array[String]): Unit = {

    //初始化流计算环境
    val env = ExecutionEnvironment.getExecutionEnvironment

    //读取数据
    val file= getClass.getResource("/wc.txt");

    val data = env.readTextFile(file.getPath)

    //转换计算
    val result = data.flatMap(_.split(" "))
      .map((_, 1))
      .groupBy(0)
      .sum(1).print()

  }
}

执行结果：

四、结语

本文只是在本地进行模拟运行，还没有提交到Flink引擎上运行。

学习资料：尚学堂Flink教程（Apache Flink 从入门到精通）

【转载请注明出处：https://leytton.blog.csdn/article/details/121066066】

本文标签：框架 Flink 流批一体化

版权声明：本文标题：Flink流批一体化处理框架内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1725866790a1045806.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Flink流批一体化处理框架

Flink流批一体化处理框架

一、简介

二、框架对比

三、编程实现

1.流处理

2.批处理

四、结语

更多相关文章

miui 谷歌框架_小米1MIUI开发版可用的google服务框架

5大自动化测试的Python框架 | 实用干货

自己动手写决策树（一）——初步搭建决策树框架

JAVA框架Spring 全面详解（学习总结）

Windows下部署Appium教程(Android App自动化测试框架搭建)

移动端开发框架mui代码在安卓模拟器上运行2（HbuilderX连接到模拟器）模拟器窗口及多开设置

RT-Thread设备框架使用指南之二——硬件定时器设备

Flink服务器无响应,apache-flink

腾讯 Node.js 非侵入开发框架 Tars.js 2.0 正式发布

android开源torrent解析,Android之Bt框架

vivo8.0系统机器最完美激活xposed框架的方法

vivo8.0以上系统如何不root激活Xposed框架的方法

vivo4.0系统怎么不ROOT激活Xposed框架的教程

vivo7.0系统机器(亲测有效)激活Xposed框架的教程

最简单vivo机器怎么不root激活XPOSED框架

大模型应用开发技术：Multi-Agent框架流程、源码及案例实战（六） 多智能体通用统计

手机端MUI---html5框架

基于openstack的云桌面开源框架

零门槛微调大模型：基于 Ludwig 低代码框架使用 LoRA 技术微调实践

全景地图使用flash框架在谷歌浏览器下不显示，其他浏览器都正常显示

发表评论

推荐文章

考研英语 长难句训练day5

Selenium元素定位神器工具谷歌浏览器插件-ChroPath介绍,安装与使用

测试必存！12种网站崩溃的原因及排查方法！

PhotoEnhancer老照片修复，旧照修复，图像去噪，黑白照上色，AI图像修复，AI图像去噪，一键自动修复照片，附下载链接

Git使用总结(包含Git Bash和Git GUI的使用)

热门文章

5安卓输入法键盘显示 搜索_手机输入法谁更黑科技？讯飞搜狗百度大PK

本地电脑与远程桌面无法复制粘贴怎么办

谷歌游览器安装包

Google[您的时钟快了]

电脑开机提示计算机无法启动不了,电脑无法启动并出现“System Halted”如何解决？...

mysql php宝塔 root_宝塔优化之php mysqlnginx 负载

电脑文件数据恢复，U盘文件数据恢复修复

自我保护第一课加密与防破解

windows系统下Python环境的搭建

Photoshop CC v19 Linux 安装项目教程

最新文章

chrome浏览器获取编码格式

使用selenium启动谷歌Chrome浏览器

最好用的chrome 浏览器翻译插件(附下载链接)

如何离线更新安装chrome浏览器

Chrome 浏览器下载速度慢？一个开关就可解决

selenium工具启动Chrome浏览器时配置选项详解

chrome点击下载链接没有反应

【Linux】Linux下怎么下载安装Chrome？

如何清除chrome浏览器缓存

如何下载与Chrome浏览器的版本相匹配的ChromeDriver

chrome浏览器（block）屏蔽http文件下载，如何解除？

chrome下载文件竟然都有缓存！

Chrome视频下载插件–Video Downloader for Chrome

ubuntu下载各个版本chrome方法

2022 chrome离线下载包

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

大模型应用开发技术：Multi-Agent框架流程、源码及案例实战（六）多智能体通用统计

考研英语长难句训练day5

5安卓输入法键盘显示搜索_手机输入法谁更黑科技？讯飞搜狗百度大PK

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载