eda的数据分析法,eda数据分析课程

首页 > 生活 > 作者：YD1662024-07-07 07:15:40

eda的数据分析法,eda数据分析课程(1)

作者：Mochamad Kautzar Ichramsyah 翻译：陈超校对：赵茹萱

本文约3900字，建议阅读10分钟

本文将会用常用的iris数据集来学习如何在R和Python中实现探索性因素分析的过程。

eda的数据分析法,eda数据分析课程(2)

图片来自Charlotte Karlsen, Unsplash

什么是EDA？

EDA是我们更好地理解数据集的重要方式之一。几乎所有的数据分析和数据科学专家都在产生新观点或者数据建模之前先做EDA。在现实生活中，依赖于数据集的复杂度和完整性，这个过程会花费大量时间。当然，变量越多，我们在下一步开始前就需要探索越多才能获得结论。

这就是为什么我们会用R或者Python这些最常见的数据分析程序语言，一些包能够帮我们更快更容易地完成EDA，但不会做得更好。为什么呢？因为它只会给我们展示一个结论，我们需要深入探索我们觉得“有趣”的变量。

“80/20规则”适用:80%的数据分析师或科学家的宝贵时间花在简单的查找、清理和组织数据上，只剩下20%的时间用于执行分析。

我们需要哪一个库呢？

在R中我们可以用这些库：

1. dataMaid

2. DataExplorer

3. SmartEDA

在Python中，我们可以使用这些库：

1. ydata-profiling

2. dtale

3. sweetviz

4. autoviz

让我们试用一下上面列出的每个库，看看他们长什么样子以及如何帮助我们做探索性数据分析！在本文中，我将会用常用的iris数据集来学习如何在R和Python中编码。

在R中你可以使用以下代码加载iris数据集：

# iris is part of R's default, no need to load any packages df = iris # use "head()" to show the first 6 rows head(df)

eda的数据分析法,eda数据分析课程(3)

eda的数据分析法,eda数据分析课程(4)

首页 12 3 4 5 下一页

栏目热文

exsl 数据提取（exact提取数据）
阅读全文>>2024-07-07 07:11:14
excel如何快速做nps分析（excel数据分析常用方法包括哪些）
阅读全文>>2024-07-07 06:50:07
expma数据怎么分析（EXPMA指标的设置方法）
阅读全文>>2024-07-07 06:46:35
顾佳看到林有有跟许幻山见面（林有有挑拨许幻山和顾佳的关系）
阅读全文>>2024-07-07 06:33:16
三十而已顾佳教训林有有是哪集（顾佳找林有有谈判完整第几集）
阅读全文>>2024-07-07 06:55:23
exsl数据分析（exsl数据分析组在哪）
阅读全文>>2024-07-07 07:16:10
sps数据分析教程（spps数据分析）
阅读全文>>2024-07-07 07:00:06
sce分析技术（cae结果分析及技术培训）
阅读全文>>2024-07-07 07:17:33
pdf转jpg格式图片怎么弄（pdf怎么转成图片jpg教程）
阅读全文>>2024-07-07 06:32:43
pdf图片怎么免费转成jpg（pdf怎么转成图片jpg高清免费）
阅读全文>>2024-07-07 07:01:56

文档排行

本站推荐

无损开锁原理（错位开锁的基本原理）
阅读全文>>2022-10-26 09:15:34
四个月婴儿可以吃什么东西（四个月宝宝吃什么东西最好）
阅读全文>>2024-06-25 12:13:42
长安cs35p前排气囊位置（长安cs35气囊位置图）
阅读全文>>2023-11-29 10:32:58
西兰花和什么搭配最好（西兰花的最佳搭配和禁忌）
阅读全文>>2022-12-13 00:15:29
白夜追凶小说原著第二季（白夜追凶原著小说大结局）
阅读全文>>2023-05-11 07:27:52
丈母娘年纪轻轻的就来家住怎么办（丈母娘要和我们住一辈子怎么办）
阅读全文>>2022-12-27 23:37:49

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.