博客园
最新
热门
发布
新建文档
测试新的专栏文档同步到博客功能
dddd
发布于2025年01月25日
17浏览
测试测试我的博客
测试测试测试 测试我的新发布博客
dddd
发布于2025年01月25日
6浏览
测试测试我的博客
测试测试测试 测试我的新发布博客
dddd
发布于2025年01月25日
3浏览
万字雄文ToB革命未来产业的重大变革解析
本文主要讨论未来产业的发展趋势和焦点,包括政府支持、技术创新和市场需求等方面。未来产业将由智能、健康、绿色三大主导技术群融合突破与协同支撑,引发社会结构重构和制度环境改进。
忆往昔
发布于2025年01月25日
247浏览
标星20k这个开源笔记应用yyds
思源笔记是款开源知识管理工具,支持Markdown和块级编辑,具备双向链接和思维导图功能。可自定义界面,插件丰富,高效管理文件,保护隐私和数据安全。
忆往昔
发布于2025年01月25日
288浏览
中国好
啊啊啊啊啊
巨人肩膀小编
发布于2025年01月24日
13浏览
DevOps释放协作与自动化的力量
提供开源DevOps解决方案,包括GitLab、Jenkins和Nexus Repository Manager等核心组件,旨在降低成本、提高效率、提升质量和加速创新。无论规模大小,都能为企业提供所需的工具和支持,构建高效、可靠的软件交付管道。
继续前行
发布于2025年01月24日
510浏览
测试自动生成标签
用户需要AI小助手的帮助,要求生成标签。摘要为:用户通过AI小助手生成符合内容的标签,标签数量不少于3个,不多于10个,并需要满足190字以内的摘要要求。
ytu
字符限制
服务请求
梦想家-test
发布于2025年01月24日
42浏览
HTTPS那么强大仅仅就是比HTTP安全那么简单吗
HTTPS通过SSL/TLS协议提供安全通信,采用加密、身份验证和数据完整性机制保护数据传输安全。相比HTTP,HTTPS具备加密传输、数字证书验证、防止中间人攻击和数据完整性保证等优势。
不菜的鸟
发布于2025年01月21日
195浏览
Docker如何管理镜像
Docker镜像是Docker容器技术的核心,通过Dockerfile自动化构建。镜像管理包括创建、构建、推送、拉取及高级管理和安全性考量。合理使用标签、选择轻量级基础镜像、定期安全扫描和最小权限原则等是确保Docker环境安全的关键。
不菜的鸟
发布于2025年01月21日
193浏览
第9章 前向神经网络
深度前馈网络是一类神经网络模型,通过多层感知机实现复杂函数映射。问题涉及多层感知机表示布尔函数的最少层数和节点数。单隐层情况下,需要指数级节点数;多隐层可通过减少层数至对数级别来降低节点数。最少节点数与输入元数呈线性关系,最少层数取决于输入元数的对数。
发布于2025年01月21日
208浏览
第7章 优化算法
无约束优化问题的优化方法有梯度下降法、牛顿法、共轭梯度法等。这些方法适用于不同的场景,如梯度下降法适用于大规模数据集,牛顿法适用于局部极小值较多的情况。此外,还有凸优化中的线性规划、二次规划等也有广泛应用。
发布于2025年01月21日
179浏览
测试校验封面和简介
用户需要测试并校验封面和简介,以确保其准确性、吸引力和传达的信息效果。测试校验封面和简介是确保内容质量的重要环节,有助于提升用户对该内容的兴趣和参与度。
梦想家1号
发布于2025年01月21日
20浏览
1点赞
1收藏
第1章 特征工程
本文介绍了在机器学习中如何处理类别型特征和高维组合特征的问题。通过序号编码、独热编码和二进制编码等方式处理类别型特征,通过降维和基于决策树的方法寻找有效的组合特征,以提高模型的拟合能力。
发布于2025年01月21日
196浏览
机器学习算法工程师的自我修养
本书涵盖了机器学习算法工程师所需的核心知识体系,包括特征工程、模型评估、经典算法、降维、非监督学习、概率图模型、优化算法、采样、前向神经网络、循环神经网络、强化学习和集成学习等方面的内容。本书通过深入剖析各种机器学习模型的理论和实践,帮助读者成为具备扎实理论基础和实际应用能力的机器学习算法工程师。
发布于2025年01月21日
187浏览
白面机器学习-封面
本书由一线机器学习算法工程师撰写,收录超过100道真实场景面试题目和解答。内容涵盖机器学习、神经网络、强化学习等领域,旨在帮助读者掌握成为优秀算法工程师的技能,建立对机器学习的热爱。通过问答形式,生动展示人工智能领域的应用和前景。
发布于2025年01月21日
461浏览
推荐一套开源电商项目数据湖建设实战代码
推荐一套数据湖建设实战项目代码,涉及MySQL、Seatunnel、Doris等组件构建离线数仓和Kafka、Flink等构建实时数仓。代码包括数据采集、任务编排和数据展示等部分。欢迎添加作者讨论。
发布于2025年01月19日
519浏览
成本下降50腾讯音乐StarRocks存算分离大规模实践
腾讯音乐采用StarRocks存算分离架构构建湖仓一体新方案,实现降本增效。通过迁移实践,性能不变且成本降低,简化运维与快速弹性。最佳实践包括数据打散到多个对象存储桶、写入反压改造和集群吞吐配置优化等。监控和调优是关键。
发布于2025年01月19日
428浏览
Apache SeaTunnel 项目介绍
Apache SeaTunnel 项目的定位是 EtLT 时代的新一代数据集成平台。EtLT 是 ETL 和 ELT 的演进,ETL 是早期数据同步到数仓的一种方式,首先从数据源中抽取数据,接着对数据进行转化,比如聚合、校验等计算,再把数据加载到数仓中。随着数据源的增多和数仓架构的演进,ELT 时代到来,数据先加载到数仓,再利用数仓的计算集群进行大批量计算。
发布于2025年01月19日
467浏览
OPPO 选择 SeaTunnel:提升平台开发与生产能力
本文介绍了智能推荐系统的特征平台和样本中心建设,采用Apache SeaTunnel作为数据处理基础,实现特征高效生产和存储,样本管理、生成和回迁。采用Flink流批一体化计算架构,提升效率和一致性。未来规划包括源数据功能深化、多引擎多模式开发和与ChatGPT结合。
发布于2025年01月19日
217浏览
1
31
32
33
34
35
93