发 帖  
  • 发布了文章 2023-1-5 15:35
    要在Jupyter notebook中使用多个游标,可以按住Alt键并单击所需的位置。这将在每个点击的位置创建一个游标。然后你可以像往常一样进行编辑,更改将同时应用于所有位置。...
    0
    1077次阅读
    0条评论
  • 发布了文章 2023-1-5 15:33
    数据集共有五个文件,包含了'2018-02-01'至'2018-04-15'之间的用户数据,数据已进行了脱敏处理,本文使用了其中的行为数据表,表中共有五个字段,各字段含义如下图所示...
    0
    2421次阅读
    0条评论
  • 发布了文章 2022-12-21 13:50
    凡事预则立,不预则废,训练机器学习模型也是如此。数据清洗和预处理是模型训练之前的必要过程,否则模型可能就「废」了。本文是一个初学者指南,将带你领略如何在任意的数据集上,针对任意一个机器学习模型,完成数据预处理工作。...
    0
    1412次阅读
    0条评论
  • 发布了文章 2022-11-21 14:44
    就像IN一样,我们肯定也要选择NOT IN,这个可能是更加常用的一个需求,但是却很少有文章提到,还是使用上面的数据:...
    0
    1015次阅读
    0条评论
  • 发布了文章 2022-11-17 15:05
    我之前一直守着 matplotlib 用的原因,就是为了我学会它复杂的语法,已经“沉没"在里面的几百个小时的时间成本。这也导致我花费了不知多少个深夜,在 StackOverflow 上搜索如何“格式化日期”或“增加第二个Y轴”。...
    0
    1554次阅读
    0条评论
  • 发布了文章 2022-10-28 14:16
    TinyDB的目标是降低小型 Python 应用程序使用数据库的难度,对于一些简单程序而言与其用 SQL 数据库,不如就用TinyDB, 因为它有如下特点:...
    0
    1844次阅读
    0条评论
  • 发布了文章 2022-10-28 14:07
    TinyDB 是一个纯 Python 编写的轻量级数据库,一共只有1800行代码,没有外部依赖项。...
    0
    2525次阅读
    0条评论
  • 发布了文章 2022-10-27 13:16
    如何定位慢SQL呢、我们可以通过慢查询日志来查看慢SQL。默认的情况下呢,MySQL数据库是不开启慢查询日志(slow query log)呢。所以我们需要手动把它打开。...
    0
    1480次阅读
    0条评论
  • 发布了文章 2022-10-27 13:14
    这里只有5191.0这个值,没有其他的,且只有7763条数据,这里直接将这列当做异常值,直接将这列直接删除了。...
    0
    1073次阅读
    0条评论
  • 发布了文章 2022-10-25 14:24
    在 Pandas 中有很多种方法可以进行DF的合并。...
    0
    1389次阅读
    0条评论
  • 发布了文章 2022-10-24 14:40
    本文主要介绍时间序列预测并描述任何时间序列的两种主要模式(趋势和季节性)。并基于这些模式对时间序列进行分解。最后使用一个被称为Holt-Winters季节方法的预测模型,来预测有趋势和/或季节成分的时间序列数据。...
    0
    2275次阅读
    0条评论
  • 发布了文章 2022-10-24 10:55
    要想做好数据分析必定要理解和熟悉掌握各类数据分析模型,但大部分文章只是给你罗列出了有哪几种数据分析模型及对应理论,并未用实例来辅助说明。...
    0
    2062次阅读
    0条评论
  • 发布了文章 2022-10-20 14:22
    groupby是Pandas在数据分析中最常用的函数之一。它用于根据给定列中的不同值对数据点(即行)进行分组,分组后的数据可以计算生成组的聚合值。 如果我们有一个包含汽车品牌和价格信息的数据集,那么可以使用groupby功能来计算每个品牌的...
    0
    1658次阅读
    0条评论
  • 发布了文章 2022-7-25 10:46
    Beekeeper Studio 是一个跨平台的 SQL 编辑器和数据库管理客户端,可以在 Linux、Mac、Windows 上使用。...
    0
    4713次阅读
    0条评论
  • 发布了文章 2022-6-16 11:03
    从报表工具的眼光上看,数据准备属于报表之外的事情,可以堂而皇之地拒绝处理。但是,拒绝不等于不存在,这个工作总还要做。没有好的工具,目前报表的数据准备还处于比较原始的硬编码阶段,几百上千行的 SQL、几十上百 K 的存储过程和大量的 JAVA...
    0
    2289次阅读
    0条评论
ta 的专栏

成就与认可

  • 获得 3 次赞同

    获得 0 次收藏
关闭

站长推荐 上一条 /9 下一条

返回顶部