无匹配社区
博客园
最新
热门
请选择社区
发布
详解数据湖,概念、特征、架构、方案、场景以及建湖全过程(下)
4.各厂商的数据湖解决方案 5.典型的数据湖应用场景 6.数据湖建设的基本过程 7.总结
洪波涌起
发布于 2024年03月25日
70浏览
详解数据湖,概念、特征、架构、方案、场景以及建湖全过程(上)
1.什么是数据湖 2.数据湖的基本特征 3.数据湖基本架构
洪波涌起
发布于 2024年03月25日
78浏览
漫画讲解Kafka高效的存储设计
今天,跟大家分享一下kafka 的存储机制及如何根据 offset 查找消息的。
Kafka
车车
发布于 2024年03月25日
79浏览
帆软BI的三个优点之:数据从分布式数据库实时传到帆软
从A地到B地,我们首先想到的是乘坐什么交通工具,是坐车,坐船,还是坐飞机。遇到问题其实也是一样的,从问题的这头,到那头,也有很多的工具可以使用。选择对的工具,才能更加便捷轻松的解决问题?今天给大家聊聊帆软BI这款工具。
FineReport
梦想家
发布于 2024年03月22日
77浏览
2点赞
数据治理之元数据管理的利器——Atlas入门实战宝典(7、8)
随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。
Atlas
随风
发布于 2024年03月22日
58浏览
数据治理之元数据管理的利器——Atlas入门实战宝典(5、6)
随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。
Atlas
随风
发布于 2024年03月22日
130浏览
数据治理之元数据管理的利器——Atlas入门实战宝典(1、2、3)
随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。
Atlas
随风
发布于 2024年03月22日
132浏览
AI 算法在大数据治理中的应用
全文目录: 1. 大数据与 AI; 2. 大数据任务健康度评估; 3. Spark 任务智能调参; 4. SQL 任务执行引擎智能选择; 5. AI 算法在大数据治理中的应用展望
随风
发布于 2024年03月22日
93浏览
1点赞
物流大数据在亚马逊的应用
亚马逊是最早玩转物流大数据的电商企业:亚马逊在业内率先使用了大数据,人工智能和云技术进行仓储物流的管理。创新地推出预测性调拨、跨区域配送、跨国境配送等服务,不断给全球电商和物流行业带来惊喜。
物流
随风
发布于 2024年03月22日
101浏览
终于有人把主数据讲明白了......
和大家聊聊主数据的二三事~
随风
发布于 2024年03月22日
39浏览
1点赞
Doris在用户画像人群业务的应用
讲座分为三部分内容: •用户画像群体服务的业务场景 •技术问题、思路与相关业界方案实现情况 •基于Doris的技术实现
用户画像
Doris
蛇年大吉
发布于 2024年03月22日
168浏览
1点赞
Linux 概述
Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和Unix的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的Unix工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。
Linux
随风
发布于 2024年03月22日
57浏览
2点赞
12条SQL不起眼的数仓调优技巧
12条SQL不起眼的数仓调优技巧
Hive
随风
发布于 2024年03月22日
114浏览
Hive和Hbase数据互通(用户画像)
依旧是用户画像的项目,现在标签化的数据存放在hive中,而查询是要在hbase上进行查询,所以需要将hive的数据导入hbase中。
Hive
Hbase
用户画像
随风
发布于 2024年03月22日
137浏览
元数据管理在数据仓库的实践应用
元数据管理是企业数据治理的基础,是数据仓库的提升。作为一名数据人,首要任务就是理解元数据管理。 本篇文章将为大家梳理元数据的概念,介绍元数据管理在数据仓库的地位、场景及工具。
Atlas
随风
发布于 2024年03月22日
82浏览
1点赞
滴滴 Flink 指标系统的架构设计与实践
作为一名平台工程师,深入研究 Flink 指标的应用以及 Flink 指标系统的架构与实践,让我受益匪浅。在这个过程中,我不仅汲取了优秀框架的设计理念,还从平台的视角更加全面地理解了 Flink 指标的实际应用,从而更深刻地理解了 Flink 指标背后的深层含义。
Flink
滴滴
发布于 2024年03月20日
133浏览
滴滴基于 Clickhouse 构建新一代日志存储系统
ClickHouse 是2016年开源的用于实时数据分析的一款高性能列式分布式数据库,支持向量化计算引擎、多核并行计算、高压缩比等功能,在分析型数据库中单表查询速度是最快的。2020年开始在滴滴内部大规模地推广和应用,服务网约车和日志检索等核心平台和业务。本文主要介绍滴滴日志检索场景从 ES 迁移到 CK 的技术探索。
Clickhouse
滴滴
发布于 2024年03月20日
258浏览
1点赞
MySQL8.0如何分析TOP SQL
当要对MySQL进行优化时,找到TOP SQL语句通常是第一步。这里介绍的使用不需要另外安装工具的找出需要优化的SQL的方法。 ● 从操作系统层监控到的最繁忙线程找出TOP SQL ● 慢查询日志 ● 性能视图 ● diagnostics()存储过程 ● ps_trace_statement_digest()存储过程 ● ps_trace_thread()存储过程
MySQL
随风
发布于 2024年03月20日
142浏览
了解spark计算模型
博主认为作为初学spark,了解运行原理可以帮助后期排错,更有帮助。
Spark
洪波涌起
发布于 2024年03月19日
65浏览
工业大数据
工业大数据是指在工业领域,主要通过传感器等物联网技术进行数据采集、传输得来的数据,由于数据量巨大,传统的信息技术已无法对相应的数据进行处理、分析、展示,而在传统工业信息化技术的基础上借鉴了互联网大数据的技术,提出新型的基于数据驱动的工业信息化技术及其应用。
忆往昔
发布于 2024年03月19日
43浏览
1
38
39
40
41
42
72