博客园
最新
热门
发布
大型企业与中小型企业的数据治理做法差异
在当今数字化时代,数据已成为企业最宝贵的资产之一,数据治理的重要性日益凸显。然而,由于企业规模、业务模式及资源状况的差异,大型企业与中小型企业在数据治理方面的做法存在显著不同。
数据治理
忆往昔
发布于2024年09月25日
82浏览
Lambda架构和Kappa架构
随着每天都会出现不同的应用场景,数据管理者会相应地评估他们的架构设计。 无论您代表哪个团队,都有一个共同的问题:数据处理。数据处理模式和工具正在不断变化和发展。在本文中,我将介绍Lambda和Kappa数据处理架构作为数据处理架构决策的基础。
数据平台架构
忆往昔
发布于2024年09月24日
148浏览
构建湖仓一体架构关键:统一元数据管理
湖仓一体架构作为一种新兴的数据管理解决方案,通过整合数据湖的灵活性和数据仓库的高性能,为企业提供了一个统一的数据平台。统一元数据管理作为湖仓一体架构的基石,它确保了数据的一致性、可发现性和治理性。
数据平台架构
数据湖
数据仓库/中台
忆往昔
发布于2024年09月23日
254浏览
1收藏
支付宝架构是真的牛逼 !
哈喽,大家好,我是黑板报君,一个资深的软件开发工程师,致力于为大家分享各领域优质开源项目,开发前沿技术以及互联网技术圈动态。
随风
发布于2024年09月19日
70浏览
怎么办?用DolphinScheduler调度执行复杂的HiveSQL时无法正确识别符号
在使用Apache DolphinScheduler调度执行复杂的HiveSQL时,HQL包含多种DolphinScheduler无法正确识别的符号,怎么办?本文提供了可行的思路和方法,供用户参考。
Dolphinscheduler
Hive
实践
随风
发布于2024年09月19日
151浏览
什么是 Apache StreamPark™
实时即未来,在实时处理流域 Apache Spark™ 和 Apache Flink® 是一个伟大的进步,尤其是 Flink 被普遍认为是下一代大数据流计算引擎。
Streampark
Flink
Spark
忆往昔
发布于2024年09月12日
381浏览
Hello 算法 第0章 前言
算法犹如美妙的交响乐,每一行代码都像韵律般流淌。愿这本书在你的脑海中轻轻响起,留下独特而深刻的旋律。
数据结构和算法
忆往昔
发布于2024年09月12日
133浏览
饿了么基于Flink+Paimon+StarRocks的实时湖仓探索
本文整理自饿了么大数据架构师、Apache Flink Contributor 王沛斌老师在8月3日 Streaming Lakehouse Meetup Online(Paimon x StarRocks,共话实时湖仓架构)上的分享。主要分为以下三个内容:1. 饿了么实时数仓演进之路2. 实时湖仓方案选型与探3. 实时湖仓规划及展望。
Flink
Paimon
StarRocks
数智先锋
发布于2024年09月10日
981浏览
记一次Hiveserver2连接异常的解决-腾讯云-emr
离线任务跑的好好的,忽然有一天失败了,查看海豚上的任务执行日志发现是hiveserver2连接超时了。 查看监控发现了几个问题一个是GC变得频繁,另一个是连接数达到上限了。
Hive
随风
发布于2024年09月10日
337浏览
1收藏
shell 文件打开情况工具 lsof
lsof(list open files)是一个列出当前系统打开文件的工具。在linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件。
Linux
随风
发布于2024年09月10日
124浏览
shell 网络工具 netstat
Linux netstat 命令用于显示网络状态。利用 netstat 指令可让你得知整个 Linux 系统的网络情况.
Linux
随风
发布于2024年09月10日
177浏览
1收藏
StarRocks 培训课程重磅上线!专家出品,助你升级打怪不走弯路!
今年已过了大半,大家的学习进度条进展如何?如果你对 StarRocks 的基础知识还有疑惑,或在寻找系统性的学习方法,不必灰心,因为 Rocky 要来助你一臂之力啦!
StarRocks
巨人肩膀小编
发布于2024年09月10日
197浏览
1 简介
中文,免费,零起点,完整示例,基于最新的Python 3版本。 Python是一种计算机程序设计语言。你可能已经听说过很多种流行的编程语言,比如非常难学的C语言,非常流行的Java语言,适合初学者的Basic语言,适合网页编程的JavaScript语言等等。
Python开发
忆往昔
发布于2024年09月09日
156浏览
一篇文搞定消息队列选型-内容有点长
消息队列是重要的分布式系统组件,在高性能、高可用、低耦合等系统架构中扮演着重要作用。可用于异步通信、削峰填谷、解耦系统、数据缓存等多种业务场景。本文是关于消息队列(MQ)选型和常见问题的精心整理。在这篇文章中,我们将详细介绍消息队列的概念、作用以及如何选择适合自己需求的消息队列系统。
Kafka
忆往昔
发布于2024年09月06日
105浏览
大数据技术选型问卷内容征集~~~
计划下周做一个针对大数据技术选型的问卷,写了10个问题,欢迎各位大数据同仁针对这份文件内容提出你的宝贵建议,先谢过了。
数据平台架构
数据仓库/中台
数据治理
PowerData
巨人肩膀小编
发布于2024年09月06日
177浏览
2点赞
1收藏
一个专为引导用户而设计的轻量级前端库,让你的产品更懂用户,Star 22.7K+!
一个专为引导用户而设计的轻量级前端库,让你的产品更懂用户,Star 22.7K+!
有趣的开源集市
开源集市
发布于2024年09月06日
342浏览
2点赞
1收藏
大数据运维实战:Spark作业的监控与深度诊断
Apache Spark是一个强大的大数据处理框架,广泛应用于数据分析、机器学习和实时数据处理等领域。然而,随着数据规模的扩大和作业复杂性的增加,如何有效地监控和诊断Spark作业的资源使用状态变得尤为重要。本文将探讨Spark作业的常用监控工具、任务的资源状态诊断。
Spark
忆往昔
发布于2024年09月05日
505浏览
安装PDF转Markdown工具-Marker-阿里云-centos7
一个开源、先进的PDF转换工具,它利用深度学习技术将PDF文件高保真地转换成Markdown格式。能够处理多种语言,自动去除页眉页脚等非内容元素,并支持表格、代码块和图像的格式化。Marker在保持原有文档结构的同时,提供了快速准确的转换效果。
Python开发
Linux
忆往昔
发布于2024年09月05日
457浏览
一个自托管的翻译平台,无需依赖外部服务,离线版的Google翻译,Star 7.8K!
一个自托管的翻译平台,无需依赖外部服务,离线版的Google翻译,Star 7.8K!
有趣的开源集市
开源集市
发布于2024年09月05日
1807浏览
1点赞
1收藏
一个开源的网页变化监控工具,实时自动化检测网页变化内容,简单实用,Star 16.5K+!
一个开源的网页变化监控工具,实时自动化检测网页变化内容,简单实用,Star 16.5K+!
有趣的开源集市
开源集市
发布于2024年09月05日
1126浏览
1点赞
1收藏
1
37
38
39
40
41
82