无匹配社区
博客园
最新
热门
请选择社区
发布
【每日使用技巧】DBeaver-SQL编辑器(上下)
DBeaver SQL编辑器功能按钮介绍:执行SQL语句、在新标签中执行SQL、执行SQL脚步、解释执行计划、SQL终端、显示执行日志、显示SQL变量、显示大纲、显示行号
Dbeaver
随风
发布于 2024年05月21日
400浏览
2点赞
Agile Query 的背景和核心技术
数据在业务决策过程中的使用频率越来越高,分析视角从传统的宏观统计,不断地向更细粒度转变,参与计算的数据体量也会不断的增加, 导致看似很小的数据量,经过关系运算后,也会变得庞大,同时分析维度组合不断地切换,也会导致预计算变得越来越困难。
Agile Query
agile query
发布于 2024年05月21日
204浏览
1点赞
Flink 开发利器 Apache StreamPark™
Hadoop 体系虽然在目前应用非常广泛,但架构繁琐、运维复杂度过高、版本升级困难,且由于部门原因,数据中台需求排期较长,我们急需探索敏捷性开发的数据平台模式。
Streampark
Flink
忆往昔
发布于 2024年05月20日
574浏览
1点赞
告警规则未触发问题排查(基于Flink+Drools)
1. 规则更新加载问题 2. 规则逻辑判断触发问题 3. 数据堆积
Flink
规则系统
车车
发布于 2024年05月07日
297浏览
4点赞
基于 Apache Calcite 的多引擎指标管理最佳实践
文章介绍了基于 Apache Calcite 的多引擎指标管理的技术原理与最佳实践,包括指标管理的常见方式、指标管理的最佳实践、指标管理的实现原理以及指标管理在字节跳动未来的一些规划,重点阐述了指标管理在业内常见的解决方案与字节内部使用的一套 SQL 两种语法多引擎指标管理方案的异同;字节内部如何使用一套 SQL 两种语法实现降本增效以及指标管理技术的具体实现方案。
Calcite
洪波涌起
发布于 2024年04月30日
754浏览
Apache Calcite 框架原理入门和生产应用
Calcite 是什么?如果用一句话形容 Calcite,Calcite 是一个用于优化异构数据源的查询处理的基础框架。 最近十几年来,出现了很多专门的数据处理引擎。例如列式存储 (HBase)、流处理引擎 (Flink)、文档搜索引擎 (Elasticsearch) 等等。这些引擎在各自针对的领域都有独特的优势,在现有复杂的业务场景下,我们很难只采用当中的某一个而舍弃其他的数据引擎。.....
Calcite
洪波涌起
发布于 2024年04月30日
850浏览
Flink入门系列3 窗口 一
Flink入门系列3 窗口 一
Flink
诗与远方
发布于 2024年04月25日
363浏览
1点赞
【在线工具推荐】Flink SQL Connector生成-Kafka-MySQL-Doris-JDBC-CDC
Flink SQL Connector生成工具支持根据不同数据源和连接方式可视化生成Flink SQL,目前支持的数据源类型有:Doris、MySQL、Kafka,支持的连接方式有JDBC、CDC。
Flink
Doris
Kafka
MySQL
StarRocks
MongoDB
车车
发布于 2024年04月19日
574浏览
2点赞
Flink入门系列2 keyby reduce process使用
flink入门系列
Flink
诗与远方
发布于 2024年04月19日
378浏览
2点赞
【在线工具推荐】Doris建表语句-其他数据源DDL转Doris-JSONl转Doris
版本区分(持续完善~) 2.动态分区 3.经验值推荐(持续完善~) 4.版本管理 5.转换记录在线分享 6.根据JSON数据样例生成字段信息 7.Mysql、Clickhouse、Presto、Hive DDL -》 Doris DDL 转换(new~new~new~)
Doris
MySQL
随风
发布于 2024年04月19日
512浏览
4点赞
AI编码工具,都是编程利器!
杀疯了,七款 IntelliJ IDEA 智能AI编码工具插件,都是编程利器!
AI编程
AI大世界
随风
发布于 2024年04月19日
560浏览
2点赞
【必知必会】程序员再不用AI编码工具就危险了
通义灵码,是阿里云出品的一款基于通义大模型的智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云的云服务使用场景调优,助力开发者高效、流畅的编码。
AI编程
AI大世界
随风
发布于 2024年04月19日
267浏览
【重要概念】Flink广播状态
地铁短文
Flink
重要概念
随风
发布于 2024年04月18日
114浏览
1点赞
java 地理围栏 R树索引加速判断(RTree-Multi)
在处理大量空间数据时,如何高效地判断一个点是否在一个地理围栏内是一个常见的需求。传统的方法是使用点和多边形之间的关系算法,但是当数据量大时,这种方法的性能会变得很低。为了解决这个问题,可以使用 R 树索引来加速判断。
物理围栏
Kafka
Flink
数智先锋
发布于 2024年04月15日
310浏览
Flink入门系列2 map flatmap算子使用
Flink入门系列2 map flatmap算子使用
Flink
诗与远方
发布于 2024年04月12日
65浏览
3点赞
大数据中台组件管理平台Ambari是个啥?
数据中台经常会用到组件管理平台,一个常见的组件管理平台Ambari是一个apache 顶级开源项目,旨在为Hadoop及其相关生态系统(如Hive、Hbase、Sqoop、Zookeeper等)提供更易于使用的工具。
Ambari
数据仓库/中台
随风
发布于 2024年04月11日
156浏览
3点赞
一文讲清楚什么是数据湖
Data lake这个术语由Pentaho公司的创始人兼首席技术官詹姆斯·狄克逊(James Dixon)提出,他对数据湖的解释是: 把你以前在磁带上拥有的东西倒入到数据湖,然后开始探索该数据。重要的只把需要的数据倒入到Hadoop;如果你想结合来自数据湖的信息和客户关系管理系统(CRM)里面的信息,我们就进行连接,只有需要时才执行这番数据结合。
数据湖
数据仓库/中台
数据治理
林洪勇
发布于 2024年04月11日
376浏览
3点赞
指标中台核心能力建设实践
本文将从数据分析的发展历程和面临的问题,引出为什么需要通过指标去解决这些问题,并分享滴普科技指标中台的核心能力以及技术实践。 全文目录: 1. 现代数据分析的趋势及现状 2. 通过指标实现敏捷高效数据分析 3. 指标中台核心能力及技术实践 4. 结语 5. Q&A
指标中台
数据仓库/中台
数据治理
忆往昔
发布于 2024年04月11日
632浏览
数据分析领域很火的指标中台是什么
指标平台,这个概念现在很火,小伙伴让来讲下,本文就来说说这个概念,以及这个概念在目前一些 BI 体系下,可以怎么结合。
指标中台
数据仓库/中台
数智先锋
发布于 2024年04月11日
146浏览
滴滴大数据资产治理实践
数据资产治理是大数据应用中的重要一环。有效的数据治理可以降本增效,提升数据利用效率。数据治理还需要平台化工具来辅助。本文将介绍滴滴出行在大数据资产治理方面的实践。 今天的介绍会围绕下面五方面展开: 1. 滴滴大数据资产管理平台 2. Hadoop 治理实践 3. ES 治理实践 4. 未来规划 5. 问答环节
Hadoop
Elasticsearch
数据治理
数智先锋
发布于 2024年04月10日
133浏览
1
36
37
38
39
40
72