什么是流处理

什么是流处理流处理正变得像数据处理一样流行。流处理已经超出了其原来的实时数据处理的范畴,它正在成为一种提供数据处理(包括批处理),实时应用乃至分布式事务的新方法的技术。 1、什么是流处理? 流处理是不断合并新数据

什么是流处理

什么是流处理

流处理正变得像数据处理一样流行。流处理已经超出了其原来的实时数据处理的范畴,它正在成为一种提供数据处理(包括批处理),实时应用乃至分布式事务的新方法的技术。

1、什么是流处理?

流处理是不断合并新数据以计算结果的动作。在流处理中,输入数据不受限制,并且没有预定的开始或结束。它只是形成一系列事件,这些事件到达流处理系统,例如信用卡交易,网站点击或来自物联网设备的传感器读数。

流是一种数据分发技术,其中数据生产者将数据记录写入有序数据流,数据使用者可以从中按相同顺序读取数据。这是一个简单的数据流图,说明了数据生产者,数据流和数据使用者。

什么是流处理

每个数据流产品都对使用案例和要支持的处理技术进行了一系列假设。这些假设导致了某些设计选择,这些选择影响可以使用它们实现的流处理行为的类型。

来自维基百科;

流处理是一种计算机编程范例,等效于数据流编程,事件流处理和反应式编程,它使某些应用程序可以更轻松地利用有限形式的并行处理。
流处理是一项强大的技术,可以扫描来自传感器,信用卡刷卡,点击流和其他输入的大量数据,并几乎即时找到可行的见解。例如,流处理可以检测到包含数百万合法购买的流中的单个欺诈性交易,充当推荐引擎来确定特定客户在实际购物时要显示什么广告或促销,或者计算出最佳价格以用于只需几秒钟即可完成汽车服务。

术语“流处理”是指数据以某些外部系统或多个外部系统产生的事件的连续“流”形式进入处理引擎,并且处理引擎的运行速度如此之快,以至于所有决策都无需停止数据流和首先存储信息。

2、典型用例

流处理正在迅速获得普及并在各种业务领域中找到应用程序。随着证券交易所从场内交易转向电子交易,它在金融行业的首次使用得到了证实。如今,在几乎每个行业中,无论是通过人工活动,机器数据还是传感器数据生成流数据的任何地方,它都变得有意义。假设它起飞了,那么物联网将增加数据的数量,种类和速度,从而导致流处理技术的应用程序急剧增加。

流处理可以解决业务问题的一些用例包括:

  • 网络监控
  • 情报和监视
  • 风险管理
  • 电子商务
  • 欺诈识别
  • 智能订单路由
  • 交易成本分析
  • 定价与分析
  • 市场数据管理
  • 算法交易
  • 数据仓库扩充

什么是流处理

3、流处理和Hadoop

大数据架构包含用于实时分析的流处理,以及用于存储各种数据和长时间运行的计算的Hadoop。

Hadoop最初是从MapReduce开始的,后者提供批处理,其中查询耗时数小时,数分钟或最多数秒钟。对于大数据量的复杂转换和计算,这将是非常有用的。但是,对于临时数据探索和实时分析而言,它并不是很好。但是,多家供应商已经进行了改进,并为Hadoop添加了功能,使其不仅具有批处理框架的功能。

DWH,Hadoop和流处理彼此很好地互补。因此,在大数据时代,集成层显得尤为重要,因为您必须组合越来越多的不同接收器和源。

自2016年以来,出现了一个称为Streaming SQL的新想法。我们将一种语言称为“流SQL”,该语言使用户能够编写类似于查询的SQL来查询流数据。现在,几乎所有流处理器都支持流SQL。

4、选择流处理框架

数据流产品有很多,很难知道从哪里开始研究它们,哪些产品可以做什么等等。

在做出决定之前,必须进行典型的评估过程(长清单,短清单,概念证明)。

  • 用于流分析的流处理编程语言

  • 可视化开发和调试,而不是编码

  • 实时分析

  • 监控和警报

  • 支持容错和高度优化的性能

  • 产品成熟度

考虑一下项目需要上述哪些功能。此外,在做出选择之前,必须评估使用框架的成本,生产率,减少的工作量以及产品上市时间。

我们正处于一个数据的时代。在此过程中,时间至关重要,而速度将决定赢家和输家。

当必须快速连续处理数据(即必须实时计算和迅速反应)时,需要进行流处理。这个要求越来越多地出现在各个领域。市场上已经有许多不同的框架和产品。

许多用例需要快速,实时的决策。尽管可以使用数据库或批处理来实现它们,但是使用这种技术只会越来越复杂。相反,流提供了一种更自然的模型来考虑,捕获和实现这些实时流用例。流SQL提供了一种简单而强大的语言来对流用例进行编程。

现实情况是,大多数数据的价值会随着时间而下降

更多Flink,Kafka等相关技术博文,科技资讯,欢迎关注实时流式计算 公众号后台回复 “电子书” 下载300页Flink实战电子书

什么是流处理

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/7536.html

(0)
上一篇 2023-03-18
下一篇 2023-03-18

相关推荐

  • MySQL数据库表设计规范[亲测有效]

    MySQL数据库表设计规范[亲测有效]一、数据库设计 1、一般都使用 INNODB 存储引擎,除非读写比率<1%,才考虑使用 MYISAM 存储引擎;其 他存储引擎请在 DBA 的建议下使用。 2、Stored procedure (包...

    2023-03-19
    119
  • Python Dictionary: 储存和访问数据的有力工具

    Python Dictionary: 储存和访问数据的有力工具在Python中,字典(Dictionary)是一种非常有用的数据类型。它允许你快速地储存和访问键值对,并且可以使用各种方法来处理和操作数据。在本篇文章中,我们将会从多个方面对Python字典进行详细的阐述。

    2024-01-31
    50
  • SQL 根据特定分隔符分割字符串

    SQL 根据特定分隔符分割字符串create function [dbo].[GetSplitStr] ( @str nvarchar(500), –要分割的字符串 @split nvarchar(50), –分隔符号 @in…

    2023-04-08
    96
  • MySQL 8.0 新特性梳理汇总「建议收藏」

    MySQL 8.0 新特性梳理汇总「建议收藏」一 历史版本发布回顾 从上图可以看出,基本遵循 5+3+3 模式 5 GA发布后,5年 就停止通用常规的更新了(功能不再更新了); 3 企业版的,+3年功能不再更新了; 3 完全停止更新了。 总之,一

    2023-05-24
    73
  • hdfs原理详解_hdfs的作用

    hdfs原理详解_hdfs的作用1.HDFS概述 1)数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就 是分布式文件管理

    2023-04-23
    109
  • MySQL学习笔记(8):字符集「终于解决」

    MySQL学习笔记(8):字符集「终于解决」本文更新于2019-06-16,使用MySQL 5.7,操作系统为Deepin 15.4。 常用字符集 字符集 定长 代码宽度 说明 ASCII或ISO-646 是 1字节7位 英文字母、数字、标点符

    2023-03-17
    202
  • Python对指数函数的支持

    Python对指数函数的支持指数函数是高中数学中比较重要的一类函数,在实际应用中也有很广泛的用处。Python作为一门强大且灵活的编程语言,也为我们提供了强大的指数函数支持。本文将介绍Python在指数函数方面的各种应用。

    2024-04-14
    22
  • mysql连接查询「建议收藏」

    mysql连接查询「建议收藏」11.5连接查询(列连接) 问题:学生表有十条数据,成绩表有十条数据。 连接之后有多少条数据(笛卡尔积):10*10=100 连续查询会产生笛卡尔积;假设集合A = {a,b},集合B = {c,d}

    2023-04-14
    104

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注