发 帖  
  • extended explain加上你的sql,然后通过show warnings可以查看实际执行的语句,这一点也是非常有用的,很多时候不同的写法经过sql分析之后实际执行的代码是一样的。...
    0
    1198次阅读
    0条评论
  • 进而,体系的缺位会导致组织的“数据指南针”失效。越是在大型组织当中,指标体系越为重要,因为决策者离一线业务较远;公司的业务虚拟属性越强,指标体系越为重要,因为公司与客户的距离较远。...
    0
    1122次阅读
    0条评论
  • Polars 是一个速度极快的 DataFrames 库。...
    0
    2769次阅读
    0条评论
  • 在使用 Python 批量处理 Excel 时经常需要批量读取数据,常见的方式是结合glob模块,可以实现将当前文件夹下的所有csv批量读取,并且合并到一个大的DataFrame中...
    0
    3077次阅读
    0条评论
  • 日常开发中,经常会碰到秒杀抢购等业务。为了避免并发请求造成的库存超卖等问题,我们一般会用到Redis分布式锁。...
    0
    2017次阅读
    0条评论
  • 主键设计的话,最好不要与业务逻辑有所关联。有些业务上的字段,比如身份证,虽然是唯一的,一些开发者喜欢用它来做主键,但是不是很建议哈。主键最好是毫无意义的一串独立不重复的数字,比如UUID,又或者Auto_incremen...
    0
    895次阅读
    0条评论
  • 我们最多可以可视化 3 维数据。但是我们有时需要可视化超过3维的数据才能获得更多的信息。我们经常使用PCA或t-SNE来降维并绘制它。在降维的情况下,可能会丢失大量信息。在某些情况下,我们需要考虑所有特征,平行坐标图有助...
    0
    3644次阅读
    0条评论
  • 看名字我们就能知道,该模块是专门用来生成透视表(pivot_table),而且是用JavaScript代码来构建的,由于其有GUI界面,所以我们在进行数据分析与可视化操作的时候并不需要写多少代码。...
    0
    934次阅读
    0条评论
  • 分享一篇关于聚类的文章:10种聚类算法和Python代码。...
    0
    2489次阅读
    0条评论
  • 要在Jupyter notebook中使用多个游标,可以按住Alt键并单击所需的位置。这将在每个点击的位置创建一个游标。然后你可以像往常一样进行编辑,更改将同时应用于所有位置。...
    0
    1079次阅读
    0条评论
  • 数据集共有五个文件,包含了'2018-02-01'至'2018-04-15'之间的用户数据,数据已进行了脱敏处理,本文使用了其中的行为数据表,表中共有五个字段,各字段含义如下图所示...
    0
    2423次阅读
    0条评论
  • 凡事预则立,不预则废,训练机器学习模型也是如此。数据清洗和预处理是模型训练之前的必要过程,否则模型可能就「废」了。本文是一个初学者指南,将带你领略如何在任意的数据集上,针对任意一个机器学习模型,完成数据预处理工作。...
    0
    1412次阅读
    0条评论
  • 就像IN一样,我们肯定也要选择NOT IN,这个可能是更加常用的一个需求,但是却很少有文章提到,还是使用上面的数据:...
    0
    1016次阅读
    0条评论
  • 我之前一直守着 matplotlib 用的原因,就是为了我学会它复杂的语法,已经“沉没"在里面的几百个小时的时间成本。这也导致我花费了不知多少个深夜,在 StackOverflow 上搜索如何“格式化日期”或“...
    0
    1555次阅读
    0条评论
  • TinyDB的目标是降低小型 Python 应用程序使用数据库的难度,对于一些简单程序而言与其用 SQL 数据库,不如就用TinyDB, 因为它有如下特点:...
    0
    1845次阅读
    0条评论
ta 的专栏

成就与认可

  • 获得 3 次赞同

    获得 0 次收藏
关闭

站长推荐 上一条 /9 下一条

返回顶部