无匹配社区

博客园

请选择社区

详解数据湖,概念、特征、架构、方案、场景以及建湖全过程(下)

4.各厂商的数据湖解决方案 5.典型的数据湖应用场景 6.数据湖建设的基本过程 7.总结
头像
洪波涌起 发布于 2024年03月25日
70浏览

详解数据湖,概念、特征、架构、方案、场景以及建湖全过程(上)

1.什么是数据湖 2.数据湖的基本特征 3.数据湖基本架构
头像
洪波涌起 发布于 2024年03月25日
78浏览

漫画讲解Kafka高效的存储设计

今天,跟大家分享一下kafka 的存储机制及如何根据 offset 查找消息的。
Kafka
头像
车车 发布于 2024年03月25日
79浏览

帆软BI的三个优点之:数据从分布式数据库实时传到帆软

从A地到B地,我们首先想到的是乘坐什么交通工具,是坐车,坐船,还是坐飞机。遇到问题其实也是一样的,从问题的这头,到那头,也有很多的工具可以使用。选择对的工具,才能更加便捷轻松的解决问题?今天给大家聊聊帆软BI这款工具。
FineReport
头像
梦想家 发布于 2024年03月22日
77浏览2点赞

数据治理之元数据管理的利器——Atlas入门实战宝典(7、8)

随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。
Atlas
头像
随风 发布于 2024年03月22日
58浏览

数据治理之元数据管理的利器——Atlas入门实战宝典(5、6)

随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。
Atlas
头像
随风 发布于 2024年03月22日
130浏览

数据治理之元数据管理的利器——Atlas入门实战宝典(1、2、3)

随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。
Atlas
头像
随风 发布于 2024年03月22日
132浏览

AI 算法在大数据治理中的应用

全文目录: 1. 大数据与 AI; 2. 大数据任务健康度评估; 3. Spark 任务智能调参; 4. SQL 任务执行引擎智能选择; 5. AI 算法在大数据治理中的应用展望
头像
随风 发布于 2024年03月22日
93浏览1点赞

物流大数据在亚马逊的应用

亚马逊是最早玩转物流大数据的电商企业:亚马逊在业内率先使用了大数据,人工智能和云技术进行仓储物流的管理。创新地推出预测性调拨、跨区域配送、跨国境配送等服务,不断给全球电商和物流行业带来惊喜。
物流
头像
随风 发布于 2024年03月22日
101浏览

终于有人把主数据讲明白了......

和大家聊聊主数据的二三事~
头像
随风 发布于 2024年03月22日
39浏览1点赞

Doris在用户画像人群业务的应用

讲座分为三部分内容: •用户画像群体服务的业务场景 •技术问题、思路与相关业界方案实现情况 •基于Doris的技术实现
用户画像Doris
头像
蛇年大吉 发布于 2024年03月22日
168浏览1点赞

Linux 概述

Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和Unix的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的Unix工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。
Linux
头像
随风 发布于 2024年03月22日
57浏览2点赞

12条SQL不起眼的数仓调优技巧

12条SQL不起眼的数仓调优技巧
Hive
头像
随风 发布于 2024年03月22日
114浏览

Hive和Hbase数据互通(用户画像)

依旧是用户画像的项目,现在标签化的数据存放在hive中,而查询是要在hbase上进行查询,所以需要将hive的数据导入hbase中。
HiveHbase用户画像
头像
随风 发布于 2024年03月22日
137浏览

元数据管理在数据仓库的实践应用

元数据管理是企业数据治理的基础,是数据仓库的提升。作为一名数据人,首要任务就是理解元数据管理。 本篇文章将为大家梳理元数据的概念,介绍元数据管理在数据仓库的地位、场景及工具。
Atlas
头像
随风 发布于 2024年03月22日
82浏览1点赞

滴滴 Flink 指标系统的架构设计与实践

作为一名平台工程师,深入研究 Flink 指标的应用以及 Flink 指标系统的架构与实践,让我受益匪浅。在这个过程中,我不仅汲取了优秀框架的设计理念,还从平台的视角更加全面地理解了 Flink 指标的实际应用,从而更深刻地理解了 Flink 指标背后的深层含义。
Flink
头像
滴滴 发布于 2024年03月20日
133浏览

滴滴基于 Clickhouse 构建新一代日志存储系统

ClickHouse 是2016年开源的用于实时数据分析的一款高性能列式分布式数据库,支持向量化计算引擎、多核并行计算、高压缩比等功能,在分析型数据库中单表查询速度是最快的。2020年开始在滴滴内部大规模地推广和应用,服务网约车和日志检索等核心平台和业务。本文主要介绍滴滴日志检索场景从 ES 迁移到 CK 的技术探索。
Clickhouse
头像
滴滴 发布于 2024年03月20日
258浏览1点赞

MySQL8.0如何分析TOP SQL

当要对MySQL进行优化时,找到TOP SQL语句通常是第一步。这里介绍的使用不需要另外安装工具的找出需要优化的SQL的方法。 ● 从操作系统层监控到的最繁忙线程找出TOP SQL ● 慢查询日志 ● 性能视图 ● diagnostics()存储过程 ● ps_trace_statement_digest()存储过程 ● ps_trace_thread()存储过程
MySQL
头像
随风 发布于 2024年03月20日
142浏览

了解spark计算模型

 博主认为作为初学spark,了解运行原理可以帮助后期排错,更有帮助。
Spark
头像
洪波涌起 发布于 2024年03月19日
65浏览

工业大数据

工业大数据是指在工业领域,主要通过传感器等物联网技术进行数据采集、传输得来的数据,由于数据量巨大,传统的信息技术已无法对相应的数据进行处理、分析、展示,而在传统工业信息化技术的基础上借鉴了互联网大数据的技术,提出新型的基于数据驱动的工业信息化技术及其应用。
头像
忆往昔 发布于 2024年03月19日
43浏览
1 383940414272

微信(交流/反馈)

巨人肩膀初心:站在巨人肩膀上,避免无谓的重复劳动。 生产和汇聚行业技术、 知识经验、 工具组件 、案例产品,提供相关环境,为开发者提高生产效率提供切实有效的支持和帮助。并在这一进程中实现多方共赢。

由 深圳数智领航科技有限公司 提供动力 - 数智化领航者。

©2023-2025 - 巨人肩膀 - 粤ICP备2025395551号-1