博客园
最新
热门
发布
大数据职业发展方向&知识图谱
本文系统梳理了大数据领域的三大工作方向(数据开发、平台开发、基础架构)及核心技术栈,涵盖数据仓库、实时计算、数据治理等关键知识点,重点推荐掌握HBase、Flink、Kafka等加★技术。同时提出分布式系统的学习方法论,强调从组件、存储、计算、通信四个维度理解框架设计。
大数据启示录
分布式系统
数据仓库
实时计算
我不是超人
发布于04月19日
94浏览
推荐一款好用的在线智能笔记工具-NotepadAI
NotepadAI是一款多功能智能笔记助手,集成了Notepad++代码编辑器功能,支持语言自动识别。用户可自定义常用AI功能如翻译、扩写等,并临时调用AI无需切换窗口。提供AI工具箱,涵盖代码编程和文本创作工具,支持一键分享和导出。适用于生成周报、代码解释及内容创作等场景,免费使用。
AI应用开发
代码编辑器
智能笔记
AI工具
我不是超人
发布于04月18日
94浏览
京东物流基于Flink & StarRocks的湖仓建设实践
京东物流实时湖仓团队分享了基于Flink和StarRocks的湖仓架构探索,解决复杂业务场景下的实时数据处理挑战。通过分层设计和联邦查询,支持分钟级数据分析,优化存储成本,并满足内外部用户的高时效需求。
数据仓库/中台
数据分析狮
发布于04月18日
222浏览
网易游戏 x Apache Doris:湖仓一体架构演进之路
网易游戏技术中心为解决数据处理时效性差、查询性能低、运维及研发成本高等问题,引入Apache Doris进行架构升级,构建实时数仓和湖仓一体架构。通过整合多个引擎,显著提升查询性能和时效性,日均查询量突破1500万,存储数据达PB级。未来计划推广数据湖方案、实现智能物化,并升级至3.0版本。
数据仓库/中台
数据分析狮
发布于04月17日
211浏览
提效10倍:基于Paimon+Dolphin湖仓一体新架构在阿里妈妈品牌业务探索实践
阿里妈妈基于Paimon+Dolphin湖仓一体架构升级品牌数据链路,解决Lambda架构效率低、存储计算成本高的问题。Paimon支持流批一体与主键更新,结合Dolphin的OLAP优化能力,实现非精确UV计算、SST格式点查提升及高性能查询。业务场景包括实时报表、多目标调控和实时特征生产,整体成本降低60%,时效性达分钟级,查询性能显著提升。
数据仓库/中台
数据分析狮
发布于04月17日
222浏览
腾讯视频指标中台驱动湖仓一体建设实践
腾讯视频构建了指标中台与湖仓一体架构,通过统一管理指标服务(如MQL查询语言、数据地图)解决一致性、时效性与成本问题。湖仓1.0基于Iceberg实现流批一体,2.0引入StarRocks加速查询并优化冷热数据管理,提升开发效率与分析性能。未来规划聚焦指标驱动消费模式与存算分离方案。
数据仓库/中台
数据分析狮
发布于04月17日
196浏览
数据无界、湖仓无界,Apache Doris 湖仓一体典型场景实战指南
本文深入探讨了Apache Doris在湖仓一体架构中的三大场景实践:湖仓分析加速、多源联邦分析和湖仓数据处理。通过本地缓存、物化视图优化提升查询性能,支持多数据源联邦查询解决数据孤岛问题,并提供定时任务调度实现外部数据同步与加工。结合具体配置示例和性能对比,展示了Doris如何高效支持企业级数据分析需求。
数据仓库/中台
数据分析狮
发布于04月17日
180浏览
从 0 到 1 构建湖仓体系, Apache Doris 湖仓一体解决方案全面解读
近年来,数据分析技术栈经历了从数据仓库、数据湖到湖仓一体的演进。湖仓一体架构融合了数据仓库的高性能与数据湖的高扩展性,通过开放数据格式、统一元数据管理及多元计算引擎,解决了数据孤岛、实时性不足等问题。Apache Doris作为湖仓一体解决方案,提供灵活的数据接入、高性能处理及业务迁移能力,支持企业低成本高效转型。
数据仓库/中台
数据分析狮
发布于04月17日
155浏览
从阿里、腾讯、字节、快手四大厂实践,看湖仓一体如何解决大数据核心痛点
四大互联网公司通过湖仓一体技术解决大数据处理三大困境:架构割裂、时效性瓶颈和成本治理难题。阿里妈妈采用Flink+Paimon实现毫秒级实时决策,腾讯视频通过Iceberg+StarRocks统一指标口径,字节跳动基于Hudi构建多引擎协同平台,快手利用Doris+Alluxio提升查询性能。
数据仓库/中台
数据分析狮
发布于04月17日
503浏览
阿里妈妈基于 Flink+Paimon 的 Lakehouse 应用实践
阿里妈妈广告业务依托实时数仓架构演进,从基于TT的烟囱式架构转型为Paimon湖仓方案,解决了数据重复、Schema缺失、资源浪费等问题。新架构通过主键表支持去重、统一实时离线Schema,并引入DWS层提升聚合效率。设计包含实时双链路容灾和离线备份,支持分钟级数据更新与万级TPS查询,降低40%资源消耗及50%开发工作量,同时提升业务决策时效性。
数据仓库/中台
数据分析狮
发布于04月17日
178浏览
干货丨字节跳动基于 Apache Hudi 的湖仓一体方案及应用实践
本文介绍了字节跳动自研的湖仓一体存储方案,针对Lambda架构存在的实时/离线存储计算不统一等问题,基于Hudi数据湖框架扩展实时加速服务层(BTS),实现批流读写统一、秒级延迟可见。方案通过内存服务优化实时处理性能,支持多维分析、流批复用等场景,显著降低组件依赖与资源成本。未来计划提升并发写入、容灾能力及Kafka兼容性。该方案已通过火山引擎LAS产品对外开放。
数据仓库/中台
数据分析狮
发布于04月17日
276浏览
基于 Doris 湖仓一体分析系统在快手的实践
快手等企业采用OLAP分析工具ClickHouse进行大规模数据处理,但面临数据冗余、同步延迟和治理成本高等问题。为此,团队基于Doris构建湖仓一体分析系统,优化元数据缓存、数据预热和自动物化功能,提升查询性能并实现消费驱动生产模式。新系统通过Alluxio缓存管理和Spark退避机制,平衡效率与稳定性,简化数据分析流程。
数据仓库/中台
数据分析狮
发布于04月17日
106浏览
干货|字节跳动在湖仓一体领域的最佳实践
本文回顾了Qcon上海站关于湖仓一体架构的主题分享,探讨了从Hadoop到湖仓一体的演进趋势,剖析了LAS产品的核心优势及关键技术组件。通过抖音电商、用户画像、金融行业和消费行业四个实践案例,展示了湖仓一体架构在解决数据孤岛、提升时效性和降低开发成本中的应用价值。最后提出实时湖仓、智能湖仓和引擎增强三大未来规划方向。
数据仓库/中台
数据分析狮
发布于04月17日
259浏览
DeepSeek在数据仓库的10大应用场景
DeepSeek提供智能数据集成、清洗、建模、分析等12大应用场景,涵盖数据仓库全生命周期管理,支持实时处理、预测分析与自动化运维,帮助企业实现高效数据治理及基于数据的决策支持,推动业务增长与创新。
AI大世界
AI应用开发
数据仓库
数据治理
大数据
人工智能
qiushaohua
发布于04月17日
162浏览
终于有人把“数据建模”讲清楚了!
数据建模是解决企业数据混乱问题的关键,通过结构化设计将业务映射为数据模型,确保数据可读、可用、可分析。数据模型是建模的结果,包含实体、关系和约束。建模过程分为概念建模、逻辑建模和物理建模三个阶段,常见方法包括范式建模(强调一致性)、维度建模(优化分析效率)和实体建模(抽象业务对象)。这些方法协同使用,为数据仓库建设和治理提供坚实基础。
数据仓库/中台
数据模型
数据仓库
维度建模
qiushaohua
发布于04月16日
37浏览
Doris x Paimon湖仓一体建设技术要点
Doris与Paimon构建的湖仓一体方案聚焦查询加速与统一建模,支持多源数据接入与开放格式存储。通过IO优化、数据/元数据缓存及物化视图实现湖仓查询加速(TPCDS测试耗时仅为Trino的1/3),并提供异构数据源统一访问能力。数据处理层结合Flink+Paimon实现流批一体,Doris分层加工后支持数据回写,平衡性能与传统数仓生态。
Doris
数据仓库/中台
Doris
数据湖
统一建模
MPP引擎
Paimon
数据分析狮
发布于04月16日
158浏览
元数据管理:组织数据资产的“导航仪”与“说明书”
元数据是描述数据的数据,分为业务、技术和管理三类,帮助解决数据'找不到、读不懂、不可信'难题,支撑数据治理与资产化。实施元数据管理需四步:制定管控体系、定义标准、技术方案设计与应用。未来趋势是从被动管理转向AI驱动的主动赋能,提升数据治理效率。
数据治理
元数据
数据资产
数据血缘
数据质量
数据治理
数据管理
我不是超人
发布于04月16日
57浏览
如何写出高质量的提示词
本文系统讲解了与AI高效沟通的核心技能——提示词(Prompt)的写作方法,强调明确目标、提供具体细节、结构化表达等8大原则,通过案例展示如何在不同场景中最大化AI效能,并推荐实用工具帮助优化提示词。
AI应用开发
AI大世界
提示词技巧
工具推荐
我不是超人
发布于04月15日
385浏览
畅想描绘:多模态数据治理体系框架
多模态数据治理面临理论体系缺失、技术支撑不足、AI工具不完善及场景难挖掘等挑战,导致实施复杂性与成本增加。现有数据治理框架虽适用,但需融合AI技术与工程化实践。建议结合DAMA和DCMM构建多模态治理体系,通过‘自上而下’或‘自下而上’策略闭环推进,强调技术与业务协同。
数据治理
DAMA框架
DCMM
多模态数据治理
数据质量
AI技术
数据分析狮
发布于04月15日
145浏览
NotepadAI智能笔记助手,效率直接翻倍!
NotepadAI是一款智能笔记助手,专为提升工作效率的学生和职场人士设计。它不仅继承Notepad++的代码编辑功能并支持自动语言识别,还可自定义常用AI操作如翻译、扩写、改写等,支持一键调用或发布到工具箱。用户可临时调用AI功能无需切换窗口,同时提供热门AI工具箱和便捷的分享导出功能,支持团队协作和跨平台使用。
AI应用开发
AI笔记
代码编辑
智能助手
效率工具
数据分析狮
发布于04月10日
101浏览
1
22
23
24
25
26
82