博客园
最新
热门
发布
为何大厂开发者纷纷抛弃小仓,转向大仓monorepo?
在软件开发领域,代码仓库的管理方式对项目的效率和协作有着重要影响。 随着项目结构的日益复杂和开发挑战的不断增长,传统的单一代码库(Monolith)在应对多项目、多库和多服务的情况下显得力不从心,正是在这个背景下,Monorepo(微服务大仓)和Multirepo(微服务多仓)的概念应运而生。
发布于2024年11月28日
260浏览
1点赞
从零开始了解推荐系统全貌
如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可以更有效率的连接用户与内容和服务,节约了大量的时间和成本。 如果把推荐系统简单拆开来看,推荐系统主要是由数据、算法、架构三个方面组成。
发布于2024年11月28日
348浏览
Apache Doris 现行版本 Docker-Compose 运行教程
随着 Apache Doris 项目的火热,很多想尝鲜或者试用的小伙伴都希望通过 Docker 来快速拉起一个功能测试或者开发的集群,但由于一些变更原因,Doris On Docker 这一块的内容还未来得及调整完,所以为了让更多的小伙伴不卡在快速使用的路上,特此出一版教程给大家快速拉起试用。
发布于2024年11月28日
1103浏览
Apache Flink 2.0-preview released
Apache Flink 社区正在积极准备 Flink 2.0,这是自 Flink 1.0 发布 8 年以来的首次大版本发布。作为一个重要的里程碑,Flink 2.0 将引入许多激动人心的功能和改进,以及一些不兼容的破坏性变更。为了促进用户和上下游项目(例如,连接器)尽早适配这些变更,提前尝试这些令人兴奋的新功能同时收集反馈,我们现在提供了 Flink 2.0 的预览版本。
发布于2024年11月28日
111浏览
Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性
大数据引擎的中间数据有两个来源: Shuffle 和 Spill,其中最重要的是 Shuffle,据统计有超过 15%的资源消耗在 Shuffle。
发布于2024年11月27日
179浏览
知乎基于 Apache Celeborn 优化 Spark Shuffle 的实践
知乎Hadoop集群上每天运行着大量的Spark作业,包括调度平台提交的例行作业、Kyuubi提交的Spark SQL作业,每天Spark作业的Shuffle量达到3PB以上,单个Spark作业Shuffle量最大接近100TB,单个Stage 50TB。同时Hadoop集群上每天有1PB左右的MR作业Shuffle,以及DataNode的磁盘IO。
发布于2024年11月27日
641浏览
解析 Apache SeaTunnel 的任务运行过程
解析 Apache SeaTunnel 的任务运行过程,欢迎交流。
发布于2024年11月27日
161浏览
VTS:基于Apache SeaTunnel的开源向量数据迁移工具
VTS(Vector Transport Service),全称向量传输服务,是一个由Zilliz开发的专注于向量和非结构化数据迁移的开源工具。VTS的核心特点在于其基于Apache SeaTunnel开发,这一事实使其在数据处理和迁移方面具有显著的优势。
发布于2024年11月27日
193浏览
SQL SERVER日常运维巡检系列——结构设计
SQL SERVER日常运维巡检系列——结构设计
发布于2024年11月27日
104浏览
7点赞
Redis为什么这么快?
Redis为什么这么快?
发布于2024年11月26日
136浏览
9点赞
1收藏
C++ —— 以真我之名 如飞花般绚丽 - 智能指针
C++ —— 以真我之名 如飞花般绚丽 - 智能指针
发布于2024年11月26日
108浏览
1点赞
如何在 Linux 上查看 SSH 日志?
SSH(Secure Shell)是 Linux 系统中最常用的远程管理协议之一。在服务器管理中,查看 SSH 日志是一项必备技能。通过分析日志,你可以监控登录活动、排查连接问题,甚至发现潜在的安全威胁。本文将深入讲解如何在 Linux 上查看 SSH 日志,从基础到进阶,一步步引导你掌握这一技能。
不菜的鸟
发布于2024年11月23日
881浏览
1点赞
网络安全工程师必须具备的八款工具,一次都分享给你!
网络安全工程师在维护和保护信息系统的安全性方面扮演着至关重要的角色。为了有效地完成这一任务,他们需要掌握并使用多种工具。本文将详细介绍八款网络安全工程师必备的工具,包括Snort、Wireshark、Nmap、Metasploit、Nessus、OpenVAS、Firewall和Proxy server。
不菜的鸟
发布于2024年11月23日
162浏览
阿里云StarRocks使用感受:优点与挑战
在这个信息爆炸的时代,我们的业务对数据的实时性要求越来越高。为了应对这个挑战,我们选择了一款强大的OLAP数据库——阿里云的StarRocks。在这篇文章中,我将分享我们使用StarRocks的心路历程,包括它带给我们的便利,以及我们在使用过程中遇到的一些困扰和问题。
发布于2024年11月20日
1026浏览
2点赞
drools使用指南——动态增加、修改、删除规则
drools使用指南——动态增加、修改、删除规则
发布于2024年11月19日
631浏览
2点赞
Seatunnel 从Kafka到Kafka
Seatunnel 从Kafka到Kafka
发布于2024年11月19日
422浏览
1点赞
Seatunnel 2.3.5 Zeta-Server集群环境搭建与使用
seatunnel集群搭建
发布于2024年11月19日
337浏览
SeaTunnel 基本原理
SeaTunnel 基本原理
发布于2024年11月19日
356浏览
3点赞
Seatunnel 概述
SeaTunnel是一个简单易用的数据集成框架,在企业中,由于开发时间或开发部门不通用,往往有多个异构的、运行在不同的软硬件平台上的信息系统同时运行。数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享
发布于2024年11月19日
541浏览
215点赞
2收藏
测试发布测试发布测试发布
测试发布测试发布测试发布
dddd
发布于2024年11月19日
28浏览
1
40
41
42
43
44
93