爆款云主机2核4G限时秒杀,88元/年起!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心

      《Apache Flink官方文档》 Apache Flink介绍

      首页 知识中心 其他 文章详情页

      《Apache Flink官方文档》 Apache Flink介绍

      2023-03-16 07:51:15 阅读次数:645

      Apache

      下面是关于Apache Flink(以下简称Filnk)框架和流式计算的概述。为了更专业、更技术化的介绍,在Flink文档中推荐了一些“概念性”的文章。

      1、无穷数据集的持续计算

      在我们详细介绍Flink前,复习一下当我们计算数据选择运算模型时,很可能会遇到的一个更高级别的数据集类型。下面有两个观点经常容易混淆,很有必要去澄清它们。

      (1)两种数据集类型:

      ①无穷数据集:无穷的持续集成的数据集合。

      ②有界数据集:有限不会改变的数据集合。

      很多现实中传统地认为有界或者批量的数据集合实际上是无穷数据集,不论这些数据是存储在HDFS的一系列目录中还是在那些基于日志的系统中(如 Apache Kafka)。

      包含无边界数据集的场景,举例如下:

      ①终端用户用手机或者web应用做的交互。

      ②物理传感器提供的测量数据。

      ③金融市场产生的数据。

      ④服务器上的日志数据。

      (2)两种数据运算模型

      ①流式:只要数据一直在产生,计算就持续地进行

      ②批处理:在预先定义的时间内运行计算,当完成时释放计算机资源

      用任意一种运算模型去计算任何一种数据集是可能的,尽管这种选择不是最佳的。比如,批处理长期应用于处理无穷数据集,尽管存在视窗、状态管理和无序数据等潜在的风险问题。

      Flink 是基于直观地去处理无穷数据集的流式运算模型:流式运算会一直计算持续生成的数据。数据集与运算模型的对应,在准确性和性能上有很大的优势。

      2、功能特点:为什么选择Flink?

      Flink是一个开源的分布式流式处理框架:

      ①提供准确的结果,甚至在出现无序或者延迟加载的数据的情况下。

      ②它是状态化的容错的,同时在维护一次完整的的应用状态时,能无缝修复错误。

      ③大规模运行,在上千个节点运行时有很好的吞吐量和低延迟。

      更早的时候,我们讨论了数据集类型(有界 vs 无穷)和运算模型(批处理vs流式)的匹配。Flink的流式计算模型启用了很多功能特性,如状态管理,处理无序数据,灵活的视窗,这些功能对于得出无穷数据集的精确结果是很重要的。

      • Flink保证状态化计算强一致性。”状态化“意味着应用可以维护随着时间推移已经产生的数据聚合或者,并且Filnk的检查点机制在一次失败的事件中一个应用状态的强一致性。

      《Apache Flink官方文档》  Apache Flink介绍

      • Flink支持流式计算和带有事件时间语义的视窗。事件时间机制使得那些事件无序到达甚至延迟到达的数据流能够计算出精确的结果。

      《Apache Flink官方文档》  Apache Flink介绍

      • 除了提供数据驱动的视窗外,Flink还支持基于时间,计数,session等的灵活视窗。视窗能够用灵活的触发条件定制化从而达到对复杂的流传输模式的支持。Flink的视窗使得模拟真实的创建数据的环境成为可能。

      《Apache Flink官方文档》  Apache Flink介绍

      • Flink的容错能力是轻量级的,允许系统保持高并发,同时在相同时间内提供强一致性保证。Flink以零数据丢失的方式从故障中恢复,但没有考虑可靠性和延迟之间的折衷。

      《Apache Flink官方文档》  Apache Flink介绍

      • Flink能满足高并发和低延迟(计算大量数据很快)。下图显示了Apache Flink 与 Apache Storm在完成流数据清洗的分布式任务的性能对比。

      《Apache Flink官方文档》  Apache Flink介绍

      • Flink保存点提供了一个状态化的版本机制,使得能以无丢失状态和最短停机时间的方式更新应用或者回退历史数据。

      《Apache Flink官方文档》  Apache Flink介绍

      • Flink被设计成能用上千个点在大规模集群上运行。除了支持独立集群部署外,Flink还支持YARN 和Mesos方式部署。

      《Apache Flink官方文档》  Apache Flink介绍

      3、Flink,流模型和有界数据集

      当你阅读Flink的文档时,可能会发现文章中既有面向无穷数据集的数据流api,也有面向有界数据的数据集api。

      此前的写作,我们介绍了直观上适合无穷数据集的流式运算模型(持续地执行处理,一次一个事件)。所以有界数据集是如何与流式运算范例相关呢?

      这是Flink 数据集API所呈现的。Flink内部将有界数据集作为“有限的流”处理,这种方式使得Flink在如何管理有界与无穷数据集上仅仅有非常少的差异。

      所以用Flink去处理有界数据和无穷数据是可能的,这两个Api运行在相同的分布式流式运算引擎。这是一个简单又高效的模型。

      4、从下至上,Flink整体结构

      《Apache Flink官方文档》  Apache Flink介绍

      (1)部署模式

      Flink能部署在云上或者局域网中,能在独立集群或者在被YARN或Mesos管理的集群上运行。

      (2)运行期

      Flink的核心是分布式流式数据引擎,意味着数据以一次一个事件的形式被处理,这跟批次处理有很大不同。这个保证了上面说的那些Flink弹性和高性能的特性。

      (3)API

      • Flink的数据流API适合用于那些实现在数据流上转换的程序(例如:过滤,更新状态,定义视窗,聚合)
      • Flink的数据集API适合用于那些实现在数据流上转换的程序(例如:过滤,映射,加入,分组)
      • 表Api适合于关系流和批处理,能轻松嵌入Flink的数据集APi和数据流API的类SQL表达式的语言(java和Scala)
      • 流式SQL允许在流和多表上执行SQL查询。这个句法是基于 Apache Calcite。

      (4)代码库

      Flink还包括用于复杂事件处理,机器学习,图形处理和Apache Storm兼容性的专用代码库。

      5、Flink和其他的框架

      从最基本的水平上看,一个Flink程序由下面几部分组成:

      • 数据源:Flink处理的输入的数据。
      • 转化:Flink对数据进行处理的步骤。
      • 接收器:Flink将处理之后的数据发送的地点。

      《Apache Flink官方文档》  Apache Flink介绍

      一个发展挺好的生态系统对于进出一个Flink程序的数据作高效移动是非常必要的,Flink支持范围广泛的用于数据源和连接器的第三方系统的连接。如果想学习更多,这里收集了Flink生态系统的信息。

      6、后续

      总而言之,Apache Flink是一个开源流处理框架,可以消除通常与开源流引擎相关联的“性能与可靠性”折衷,并在两个类别中始终保持一致。 接下来介绍,我们建议您尝试我们的快速人们,下载最新的稳定版本的Flink,或查看文档。

      我们鼓励您加入Flink用户邮件列表,并与社区分享您的问题。 我们在这里帮助您充分利用Flink。

      版权声明:本文内容来自第三方投稿或授权转载,原文地址:http://ifeve.com/apache-flink-introduction/,作者:并发编程网,版权归原作者所有。本网站转在其作品的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如因作品内容、版权等问题需要同本网站联系,请发邮件至ctyunbbs@chinatelecom.cn沟通。

      上一篇: shell自动拉取镜像并运行容器的shell脚本

      下一篇:《Groovy官方文档》1.1 下载Groovy

      相关文章

      2025-05-06 09:18:38

      【Linux 从基础到进阶】Apache服务器搭建与优化

      Apache HTTP服务器(简称Apache)是世界上使用最广泛的Web服务器之一,以其稳定性、灵活性和广泛的模块支持而著称。无论是初学者还是专业开发者,Apache都是一个强大且易于配置的Web服务器解决方案。

      2025-05-06 09:18:38
      Apache , CentOS , 安装 , 服务器 , 虚拟主机
      2025-03-18 09:59:07

      深入了解Java在人工智能领域的最新应用

      Java不仅是传统企业级开发的主要语言,在人工智能(AI)领域也表现出强大的适应能力。

      2025-03-18 09:59:07
      Apache , Hadoop , Java , Spark , 学习 , 深度
      2025-03-05 09:22:45

      大规模数据可视化

      大规模数据可视化

      2025-03-05 09:22:45
      Apache , 可视化 , 处理 , 实时 , 工具 , 数据
      2025-01-08 08:40:08

      HDFS是什么?HDFS介绍

      HDFS,即Hadoop Distributed File System(Hadoop分布式文件系统),是Hadoop项目的核心组件之一,专门设计用于存储大规模数据集。

      2025-01-08 08:40:08
      Apache , Hadoop , HDFS , 存储 , 数据 , 文件
      2025-01-08 08:40:08

      Paimon 是什么?Apache Paimon简介

      Apache Paimon是一个流式数据湖存储项目,旨在将Apache Flink的Streaming实时计算能力和Lakehouse新架构优势结合,促进数据在数据湖上的实时流动,并提供实时离线一体化的开发体验‌‌1。

      2025-01-08 08:40:08
      Apache , Flink , 实时 , 数据 , 读取
      2024-12-20 07:55:03

      使用Apache Spark进行Java数据分析

      Apache Spark是一个强大的大数据处理引擎,它支持批处理和流处理,特别适合处理大规模数据集。在Java中使用Spark,我们可以利用其强大的数据处理能力来进行各种数据分析任务。

      2024-12-20 07:55:03
      Apache , CSV , Java , JSON , Spark , 数据分析 , 数据处理
      2024-12-17 08:21:45

      java 生成Excel的几种方式

      Apache POI是一个流行的用于处理Microsoft Office文档的Java库。它提供了一组API,可以用于创建、读取和修改Excel文件。可以使用Apache POI来创建新的Excel文件并填充数据,或者将现有的数据导出到Excel文件中。

      2024-12-17 08:21:45
      Apache , Excel , Java , 创建 , 文件
      2024-12-13 06:53:39

      大数据技术栈简要介绍

      大数据(Big Data)是IT行业中的一个重要术语,它指的是那些无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。这些数据集合具有海量的数据规模、快速的数据流转、多样的数据类型以及相对较低的价值密度等特征。大数据需要新的处理模式来增强其决策力、洞察发现力和流程优化能力,从而成为具有战略意义的信息资产。

      2024-12-13 06:53:39
      Apache , 可视化 , 处理 , 技术 , 数据 , 数据分析 , 数据处理
      2024-12-13 06:53:12

      PHP 伪静态详解及实现方法

      在现代 Web 开发中,URL 的设计对用户体验和搜索引擎优化(SEO)至关重要。动态 URL 虽然功能强大,但往往显得冗长且不友好。伪静态(URL 重写)技术通过将动态 URL 转换为静态样式,不仅提高了用户体验,也增强了搜索引擎的抓取效率。

      2024-12-13 06:53:12
      Apache , URL , 文件 , 服务器 , 静态
      2024-11-18 09:54:27

      linux下Apache服务器的配置(2.0)

      对于www等大型服务器,建立日志文件是一项必不可少的工作。通过分析日志文件不仅可以监控Apache的运行情况,而且还能分析出错原因和找出安全隐患。

      2024-11-18 09:54:27
      Apache , 字段
      查看更多
      推荐标签

      作者介绍

      阿莱
      天翼云用户

      文章

      11

      阅读量

      4712

      查看更多

      最新文章

      使用POI操作Excel的基本读写

      2024-10-30 08:08:04

      《Flink官方文档》示例总览

      2024-09-25 10:13:46

      Log4j2 重大漏洞,影响面超乎想象

      2024-04-17 02:49:19

      Apache hdfs日常操作

      2023-07-04 07:10:17

      Apache-DBUtils

      2023-06-12 09:35:08

      Tomcat基础 通过MANIFEST.MF,查看JSP Servlet EL的版本信息

      2023-06-06 05:55:42

      查看更多

      热门文章

      《Apache RocketMQ用户指南》官方文档

      2022-11-08 07:33:31

      《Flink官方文档》示例总览

      2024-09-25 10:13:46

      Centos6.5 Apache搭建SSL

      2023-05-18 09:33:22

      Tomcat基础 通过MANIFEST.MF,查看JSP Servlet EL的版本信息

      2023-06-06 05:55:42

      Apache-DBUtils

      2023-06-12 09:35:08

      Apache hdfs日常操作

      2023-07-04 07:10:17

      查看更多

      热门标签

      linux java python javascript 数组 前端 docker Linux vue 函数 shell git 节点 容器 示例
      查看更多

      相关产品

      弹性云主机

      随时自助获取、弹性伸缩的云服务器资源

      天翼云电脑(公众版)

      便捷、安全、高效的云电脑服务

      对象存储

      高品质、低成本的云上存储服务

      云硬盘

      为云上计算资源提供持久性块存储

      查看更多

      随机文章

      使用POI操作Excel的基本读写

      Tomcat基础 通过MANIFEST.MF,查看JSP Servlet EL的版本信息

      《Flink官方文档》示例总览

      Log4j2 重大漏洞,影响面超乎想象

      《Apache RocketMQ用户指南》官方文档

      Centos6.5 Apache搭建SSL

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号