无匹配社区
博客园
最新
热门
请选择社区
发布
滴滴大数据资产治理实践
数据资产治理是大数据应用中的重要一环。有效的数据治理可以降本增效,提升数据利用效率。数据治理还需要平台化工具来辅助。本文将介绍滴滴出行在大数据资产治理方面的实践。 今天的介绍会围绕下面五方面展开: 1. 滴滴大数据资产管理平台 2. Hadoop 治理实践 3. ES 治理实践 4. 未来规划 5. 问答环节
Hadoop
Elasticsearch
数据治理
数智先锋
发布于 2024年04月10日
26浏览
理想汽车基于Flink on K8s的数据集成实践
本文将介绍理想汽车在 Flink on K8s 的数据集成落地实践。 分享分为四个部分: 1. 理想数据集成的发展与现状 2. 数据集成的落地实践 3. 数据集成云原生的落地实践 4. 未来规划
Flink
Kubernetes
车联网大数据
洪波涌起
发布于 2024年04月10日
43浏览
金融级实时数仓建设实践
本次分享将围绕以下四个方面展开: 1. 蚂蚁实时数仓架构 2. 实时数据质量保障 3. 流批一体应用 4. 数据湖落地展望
Flink
数据仓库/中台
金融大数据
不菜的鸟
发布于 2024年04月10日
21浏览
1点赞
Flink 入门1
flink入门系列
Flink
诗与远方
发布于 2024年04月08日
39浏览
2点赞
众安保险CDP平台:借助Apache Doris打破数据孤岛,人群圈选提速4倍
导读:随着业务在金融、保险和商城领域的不断扩展,众安保险建设 CDP 平台以提供自动化营销数据支持。早期 CDP 平台依赖于 Spark + Impala + Hbase + Nebula 复杂的技术组合,这不仅导致数据分析形成数据孤岛,还带来高昂的管理及维护成本。为解决该问题,众安保险引入 Apache Doris,替换了早期复杂的技术组合,不仅降低了系统的复杂性,打破了数据孤岛,更提升了数据处
Doris
金融大数据
用户画像
随风
发布于 2024年04月08日
29浏览
基于apache-doris-2.0.5版本进行集群部署
基于apache-doris-2.0.5版本进行集群部署
Doris
a九安吖
发布于 2024年04月03日
46浏览
3点赞
Paimon Deletion Vectors:近实时更新与极速查询
实时大数据分析是企业决策的关键,可以让企业获得实时反馈,及时调整策略。Apache Flink 流计算加上 OLAP 系统的组合可以让部分数据实时流动、实时更新、实时查询可见。但是,维护流批两套架构带来的成本、流批割裂、数据封闭等问题,还有大量离线数据无法迁移到实时分析的链路中。
Paimon
不菜的鸟
发布于 2024年04月01日
14浏览
沃尔玛基于 Apache Hudi 构建 Lakehouse
通过说明性的、外行人友好的示例,帮助开发 Apache Hudi 数据Lakehouse的清晰直觉,以及它给沃尔玛数据组织带来的明显好处,Ayush 和 Ankur 彻底解释了该系统的工作原理及其带来的巨大好处可以赋予数据组织。
Hudi
新零售大数据
不菜的鸟
发布于 2024年04月01日
27浏览
网易游戏实时 HTAP 计费风控平台建设
本文整理自网易互娱资深工程师, Flink Contributor, CDC Contributor 林佳,在 FFA 实时风控专场的分享。本篇内容主要分为五个部分:点击查看直播回放 & 演讲PPT众所周知,网易互娱的核心业务之一是线上互动娱乐应用服务,比如大家耳熟能详的梦幻西游、阴阳师等都是网易互娱的产品。不管是游戏产品还是其他应用,都需要做出好的内容来吸引用户进行应用内购买,进而产生盈利。
Flink
游戏大数据
随风
发布于 2024年03月31日
12浏览
京东物流实时风控实践
摘要:本文整理自京东风控数据产品组架构师周文跃,在 FFA 2022 实时风控专场的分享。本篇内容主要分为六个部分:点击查看直播回放 & 演讲PPT 京东集团在 2007 年开始自建物流,是国内领先的以技术驱动的供应链解决方案及物流供应商,一体化的供应链物流是我们的核心赛道。京东物流风控场景主要概括为两种,一种是货品安全,如货物丢失、破损等。另一种是交易风险,主要包括财务支出的一些风控场景。这两种
物流大数据
Flink
随风
发布于 2024年03月31日
28浏览
linux内核常用调优参数
linux内核常用调优参数。
Linux
数智先锋
发布于 2024年03月31日
30浏览
1点赞
基于Kafka->Flink+Drools支持动态规则的设备实时告警系统
目前常见的大数据告警系统更多是基于SparkStreaming+Drools,其实时性是基于微批实现时延相对较高,不支持广播流告警规则的更新只能依赖于广播变量定时更新,且不支持状态计算将不得不引入外部存储如Redis因此降低了系统的吞吐量同时也增大了系统的复杂度。新一代的分布式处理引擎Flink是基于事件驱动且可进行状态计算,大大提高了数据处理能力和简化了平台的复杂度。
基于Flink+Drools可自定义规则的实时告警系统
车联网大数据
游戏大数据
智能制造大数据
新零售大数据
物流大数据
金融大数据
Flink
Drools
数智先锋
发布于 2024年03月30日
64浏览
2点赞
数智化赋能之构建数字化企业架构
企业数字化转型核心目的是利用数字化技术让业务在线,利用大数据、快数据等技术充分挖掘数据价值,驱动业务的创新性发展,从而创造或重构一个新的商业模式,以适应不断变化的市场。 多数企业在数字化转型投入大量的财力人力物力之后,仍然遭遇到失败延迟或预期降低的情况。为什么企业数字化转型往往后劲力量越来越薄弱,无法达到预期效果,问题可能出在根基上。
数智化
数智先锋
发布于 2024年03月28日
14浏览
1点赞
Linkis 简述
Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/Hive/Presto/Flink 等底层引擎,同时实现变量、脚本、函数和资源文件等用户资源的跨上层应用互通,以及通过REST标准接口提供了数据源管理和数据源对应的元数据查询服务。 作为计算中间件,Link
Linkis
数智先锋
发布于 2024年03月27日
14浏览
Apache Doris取代ClickHouse、MySQL、Presto和HBase
Apache Doris 可以取代 ClickHouse、MySQL、Presto 和 HBase,因为它在数据处理管道上拥有全面的功能集合。在数据摄取方面,基于对 Flink CDC 和 Merge-on-Write 的支持,实现了低延迟实时写入。通过其标签机制和事务加载来保证 Exactly-Once 写入。在数据查询方面,它同时支持星型模式和平面表聚合,因此在麻烦的多表连接和大型单表查询中都
Doris
Clickhouse
MySQL
Hbase
数智先锋
发布于 2024年03月27日
68浏览
一文掌握ClickHouse
ClickHouse 是Yandex开源的一个用于实时数据分析的基于列存储的数据库,其处理数据的速度比传统方法快100-1000 倍。 ClickHouse的性能超过了目前市场上可比的面向列的 DBMS,每秒钟每台服务器每秒处理数亿至十亿多行和数十千兆字节的数据。
Clickhouse
数智先锋
发布于 2024年03月26日
16浏览
数据管理、数据治理、数据资产管理,到底有何不同?
数据治理、数据管理、数据资产管理,有什么不同?这是一个我被问的最多的问题。
数据治理
数智先锋
发布于 2024年03月26日
27浏览
1点赞
数据中台建设方案-方法论
1
中台是真正为前台而生的平台(可以是技术平台,业务能力甚至是组织机构),它存在的唯一目的就是更好的服务前台规模化创新,进而更好的响应服务引领用户,使企业真正做到自身能力与用户需求的持续对接。
数据仓库/中台
数智先锋
发布于 2024年03月26日
17浏览
快手BI大数据分析场景性能优化实践
快手大数据分析平台,作为一个数据输出平台,对于用户而言,面临的挑战主要包括: 性能分析难:不清楚耗时在哪个环节,平台对用户来说是黑盒的;不了解数据消费用户的查询特征;性能波动难以归因。 优化门槛高:需要很强的知识背景,很强的专业领域性,而分析用户通常是小白用户无法自己进行分析和优化。 平台方面,也面临一些挑战: 分析复杂度高:30%以上的复杂分析,包含同环比、占比、LOD分析等; 引擎查询复杂度高
数智先锋
发布于 2024年03月26日
8浏览
高效管理湖仓的开源解决方案-Amoro
首先 Amoro 是湖仓管理系统,这里我们借鉴了数据库管理系统的叫法,可能很多同学乍一听会觉得管理系统会类似于实时计算、离线开发一类的工具平台,这里我稍稍做个澄清:工具的目标是帮助用户更高效、便利地执行某种流程,而Amoro 的目标是将一些流程向用户屏蔽,交给用户一个黑盒,他的定位更多是一个基础软件,所以 Amoro 的 MS 类似于 DBMS 中的 MS,我们经常讲一句话:build a box
Amoro
随风
发布于 2024年03月26日
15浏览
1点赞
1
9
10
11
12
13
44