发 帖  
  • 发布了文章 2021-6-23 11:40
    一谈到Web页面,可能大家首先想到就是HTML,CSS或JavaScript。...
    0
    10094次阅读
    0条评论
  • 发布了文章 2021-6-21 17:42
    求解连续区间是数据分析、数据仓库笔试面试中常考的SQL题目。...
    0
    7900次阅读
    0条评论
  • 发布了文章 2021-6-21 16:16
    越复杂的系统,数据库中间件的作用越大。...
    0
    8494次阅读
    0条评论
  • 发布了文章 2021-6-13 14:40
    数据倾斜问题剖析 数据倾斜是分布式系统不可避免的问题,任何分布式系统都有几率发生数据倾斜,但有些小伙伴在平时工作中感知不是很明显。这里要注意本篇文章的标题—“千亿级数据”,为什么说千亿级,因为如果一个任务的数据量只有几百万,它即使发生了数据...
    0
    4386次阅读
    0条评论
  • 发布了文章 2021-6-9 18:03
    NumPy是Python中用于数据分析、机器学习、科学计算的重要软件包。它极大地简化了向量和矩阵的操作及处理。python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分(例如scikit-learn、SciPy、pandas和...
    0
    2949次阅读
    0条评论
  • 发布了文章 2021-6-4 15:03
    网上关于各种降维算法的资料参差不齐,同时大部分不提供源代码。这里有个 GitHub 项目整理了使用 Python 实现了 11 种经典的数据抽取(数据降维)算法,包括:PCA、LDA、MDS、LLE、TSNE 等,并附有相关资料、展示效果;...
    0
    2284次阅读
    0条评论
  • 发布了文章 2021-5-28 10:49
    一、Redis 基础数据结构 1. String Redis 里的字符串是动态字符串,会根据实际情况动态调整。类似于 Go 里面的切片-slice,如果长度不够则自动扩容。至于如何扩容,方法大致如下:当 length 小于 1M 的时候,扩...
    0
    1958次阅读
    0条评论
  • 发布了文章 2021-5-25 16:22
    索引,可能让好很多人望而生畏,毕竟每次面试时候 MySQL 的索引一定是必问内容,哪怕先撇开面试,就在平常的开发中,对于 SQL 的优化也而是重中之重。 可以毫不夸张的说,系统中 SQL 的好坏,是能直接决定你系统的快慢的。但是在优化之前大...
    0
    1604次阅读
    0条评论
  • 发布了文章 2021-5-14 10:40
    如今互联网人对于数据的使用可畏常态化,虽然有的是日常工作,有的只是几次需求,但无论对与数据有多少依赖,在数据的使用或解读上,以下情况大家应该都会遇到一二。 1)团队来了一位新同学,想分析某个功能的数据情况,但感觉无从下手。便问老员工这个功能...
    0
    2266次阅读
    0条评论
  • 发布了文章 2021-5-14 10:30
    pandas有一个特别的数据类型叫category,如其名一样,是一种分类的数据类型。category很娇气,使用的时候稍有不慎就会进坑,因此本篇将介绍在pandas中, 1. 为什么要使用category? 2. 以及使用category...
    0
    4558次阅读
    0条评论
  • 发布了文章 2021-5-14 10:23
    前言 接口幂等性问题,对于开发人员来说,是一个跟语言无关的公共问题。本文分享了一些解决这类问题非常实用的办法,绝大部分内容我在项目中实践过的,给有需要的小伙伴一个参考。 不知道你有没有遇到过这些场景: 有时我们在填写某些form表单时,保存...
    0
    2271次阅读
    0条评论
  • 发布了文章 2021-5-3 18:11
    MongoDB 背景 MongoDB 是一款功能完善的分布式文档数据库,是一款非常出名的 NoSQL 数据库。当前国内使用 Mongodb 的大型实践越来越多,MongoDB 为我司提供了重要的数据库存储服务,支撑着每天近千万级 QPS 峰...
    0
    2853次阅读
    0条评论
  • 发布了文章 2021-4-29 17:04
    前言 最近在学习Redis相关知识,看了阿里的redis开发规范,以及Redis开发与运维这本书。分使用规范、有坑的命令、项目实战操作、运维配置四个方向,整理了使用Redis的21个注意点,希望对大家有帮助,一起学习哈 1、Redis的使用...
    0
    2218次阅读
    0条评论
  • 发布了文章 2021-4-29 16:55
    数据处理现状:当前基于Hive的离线数据仓库已经非常成熟,数据中台体系也基本上是围绕离线数仓进行建设。但是随着实时计算引擎的不断发展以及业务对于实时报表的产出需求不断膨胀,业界最近几年就一直聚焦并探索于两个相关的热点问题:实时数仓建设和大数...
    0
    3004次阅读
    0条评论
  • 发布了文章 2021-4-26 11:06
    数据仓库的基本概念数据仓库概念: 英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它出于分析性报告和决策支持目的而创建。 数...
    0
    2176次阅读
    0条评论
ta 的专栏

成就与认可

  • 获得 3 次赞同

    获得 0 次收藏
关闭

站长推荐 上一条 /9 下一条

返回顶部