博客园
最新
热门
发布
Apache SeaTunnel技术架构演进及其在AI领域的应用
随着数据集成需求的增长,Apache SeaTunnel作为新一代的数据同步引擎,不仅在技术架构上不断演进,也在AI领域展现出其独特的应用价值。在CommunityOverCode Asia 2024大会上,Apache SeaTunnel PMC Chair 高俊 深入探讨SeaTunnel的技术演进路径,分析其在AI领域的应用案例,并展望未来的发展规划。
SeaTunnel
Dataops
发布于2024年08月27日
198浏览
Apache Doris 全新分区策略 Auto Partition 应用场景与功能详解 | Deep Dive系列
在当今数据驱动的时代,如何高效、有序地管理数据库中的海量数据成为挑战。为了处理庞大的数据集,分布式数据库引入了类似分区和分桶策略,通过将数据按特定规则划分成较小的单位并分布到不同节点上,利用并行计算能力以提升处理和分析性能,并加强了数据管理的灵活性。
Doris
PowerData
Faith_xzc
发布于2024年08月27日
204浏览
一个离线IP地址定位库,微秒级别的查询效率,Star 16.5K+!
一个离线IP地址定位库,微秒级别的查询效率,Star 16.5K+!
有趣的开源集市
开源集市
发布于2024年08月23日
453浏览
2点赞
一场宁夏西瓜农事件,如同企业内部站队,最受伤的还是他们。。。
关于站队:YES OR NO?
有趣的开源集市
开源集市
发布于2024年08月23日
500浏览
3点赞
Flink SQL性能优化
在大数据处理领域,Apache Flink以其流处理和批处理一体化的能力,成为许多企业的首选。然而,随着数据量的增长,性能优化变得至关重要。本文将深入浅出地探讨Flink SQL的常见性能问题、调优方法、易错点及调优技巧,并提供代码示例。、
PowerData
忆往昔
发布于2024年08月21日
184浏览
1点赞
一款称为“网络瑞士军刀”的数据处理神器,用简单的办法解决复杂的问题,Star 28K+!
一款称为“网络瑞士军刀”的数据处理神器,用简单的办法解决复杂的问题,Star 28K+!
有趣的开源集市
开源集市
发布于2024年08月21日
213浏览
Doris SQL语句优化
Doris优化是一个综合性的过程,涉及到多个方面的调整和改进,以提升数据库的整体性能和稳定性。这里是收集整理的一些关键的优化策略,供您参考,欢迎投稿。
PowerData
忆往昔
发布于2024年08月21日
288浏览
Bigtop 从0开始
BigTop的应用场景: 1. BigTop通过提供预配置的Docker镜像,极大简化了在不同操作系统上编译大数据组件的rpm或deb包的过程,使之变得快捷且高效。 2. BigTop集成了编译过程中所需的复杂依赖关系,有效解决了常见的编译错误,并且通过代码中的补丁确保了流畅的编译体验。这意味着,用户不再需要为官方包无法编译或搭建复杂的编译环境而感到困扰。 3. 提供了对Apache Ambari
Bigtop
蔡佳良
发布于2024年08月21日
1153浏览
PMC对话华润置地在SeaTunnel的应用实践,一起解读2.3.6版本最新特性
📣对于大数据工程师来说,使用开源软件可能要面对各种各样的问题,而随着开源工具的快速发展,如何又快又好又稳的在生产部署上“开源工具”,是大家面临的挑战之一!👩👩👧👧熟悉社区的老粉都知道,社区举办PMC对话标杆用户的主题活动目的,就是为了让更多人了解并且又快又好又稳的使用上Apache SeaTunnel!
SeaTunnel
Dataops
发布于2024年08月21日
127浏览
2点赞
有哪些开源的大数据管理平台?
大数据基础服务平台是一种用于管理、存储、处理和分析大量数据的平台。它提供了一系列的大数据处理和分析工具,包括 Hadoop、Hive、HBase、Spark、Flink、Zookeeper、Kafka 等,使得企业和组织能够更好地理解和利用他们的数据。
HiDataPlus
Ambari
Bigtop
随风
发布于2024年08月20日
2678浏览
Jiron-cloud 开源项目集成 Dinky 实践分享
在某大型银行的实时数据处理项目中,我们选择了Dinky 作为数据流处理的核心引擎。该项目的主要目标是实现对银行交易数据的实时监控和分析,从而提高反欺诈能力和业务响应速度。
Dinky
文末丶
发布于2024年08月20日
565浏览
一个PDF转Markdown工具,高精准识别,自动去干扰元素,和LLM更配哦!Star 15K+!
一个PDF转Markdown工具,高精准识别,自动去干扰元素,和LLM更配哦!Star 15K+!
有趣的开源集市
开源集市
发布于2024年08月20日
1085浏览
2点赞
6:kubernetes 基本操作
kubernetes 基本操作
Docker
Kubernetes
Linux
久安
发布于2024年08月20日
204浏览
DevOps入门
DevOps 是开发 (Dev) 和运营 (Ops) 的复合词,它将人、流程和技术结合起来,不断地为客户提供价值。
Docker
久安
发布于2024年08月19日
322浏览
1点赞
网站SEO怎么做?
seo优化策略
Web前端
SEO
梦想家
发布于2024年08月19日
116浏览
2点赞
SeaTunnel及SeaTunnel Web部署指南(小白版)
现在你能搜索到的SeaTunnel的安装。部署基本都有坑,官网的文档也是见到到相当于没有,基本很难找到一个适合新手小白第一次上手就能成功安装部署的版本,于是就有了这个部署指南的分享,小主已经把可能遇到的坑都填过了,希望大家都能安安稳稳上路,不掉坑,话不多说,走起~
SeaTunnel
如风掠过指尖
发布于2024年08月19日
4037浏览
Dinky教程--Flink CDC pipline整库同步Doris,与踩坑处理
本文是一篇关于如何使用Dinky平台运行CDC pipeline任务实现MySQL到Doris整库同步并自动建表的教程
Dinky
墨无痕
发布于2024年08月16日
1481浏览
2点赞
Apache Ambari 安装
Apache Ambari 安装步骤详解。
Ambari
随风
发布于2024年08月16日
218浏览
2点赞
大数据 Hadoop 管理工具 Apache Ambari和 HDP
Apache Ambari 是 Hortonworks 贡献给Apache开源社区的顶级项目,它是一个基于web的工具,用于安装、配置、管理和监视 Hadoop 集群。 Ambari 目前已支持大多数 Hadoop 组件,包括 HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop 和 Hcatalog 等。
Ambari
随风
发布于2024年08月16日
313浏览
一文看懂 CDH、HDP、CDP 及HiDataPlus
CDH和HDP侧重的技术领域,目前市面上主流CDH和HDP版本的关键时间点,CDP 介绍。继HDP后的HiDataPlus介绍。
HiDataPlus
随风
发布于2024年08月16日
1046浏览
1
39
40
41
42
43
82