博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spark Streaming 实时流处理总结
阅读量:6202 次
发布时间:2019-06-21

本文共 306 字,大约阅读时间需要 1 分钟。

hot3.png

1.实时流处理项目 流程图

日志收集框架Flume--->消息队列Kafka--->Spark Streaming--->HBase--->数据处理结果可视化。

实时流处理适用场景:时效性高  数据量大

离线计算和实时计算对比:

数据来源 离线 实时
处理过程 HDFS 历史数据 数据量大 消息队列(kafka),实时记录变化的数据
处理速度 MapReduce:map + reduce Spark Streaming storm flink(Stream)
进程 启动+销毁  实时在线

 

实时流处理架构与技术选型

13145004_ADDm.jpg

转载于:https://my.oschina.net/mrpei123/blog/1927007

你可能感兴趣的文章
设置 java -jar 的进程显示名称
查看>>
mysql 协议的ColumnDefinition包及解析
查看>>
Reduce Side Join实现
查看>>
eclipse的xml文件提示templates的模板
查看>>
浅谈金融大数据
查看>>
Android微信智能心跳方案
查看>>
PostgreSQL 10 PostGIS 兼容性 FIX
查看>>
使用 Cordova 和 Vue.js 创建移动应用
查看>>
前端必须要懂的浏览器缓存机制
查看>>
DLP攻略:五个危险的数据库默认设置
查看>>
车载机器视觉技术在智能交通系统中的辅助应用
查看>>
OpenCascade Jobs
查看>>
《Linux From Scratch》第三部分:构建LFS系统 第六章:安装基本的系统软件- 6.70. 关于调试符号...
查看>>
数据显示:惠普企业业务公司营收已成功超越NetApp
查看>>
惠普加强HAVEn大数据平台以支持新型人类信息应用软件
查看>>
滥用系统Token实现Windows本地提权
查看>>
2009年FCoE会成为下一个牺牲品吗?
查看>>
曙光SaaS级HPC运维神器正式上线
查看>>
高德地图语音交互实测 看周星星导航包
查看>>
各大存储供应商齐聚探“数据化时代”规划
查看>>