如果你经常用到Excel,下面这个令人沮丧的对话框可能对你来说并不陌生。
也可能遇到过这种情况:编辑电子表格时运转非常缓慢,每点击一次鼠标电脑就会卡10秒。
出现这种情况通常是由于文件太大或工作簿中的公式过多。Excel最多可以处理100万行数据,但当你处理大型数据集或进行繁重的分析时,例如,将公式应用于一组单元格、链接多个电子表格或连接到其他工作簿时,在未超出Excel处理的最大行数之前,其操作速度会大大降低。
Excel还有一个可能导致其效率低下的弱点: 结构过于灵活。这听起来有点匪夷所思——灵活性是人们钟爱Excel的原因之一。因为每个单元格都是一个独立的实体,所以可以自由地添加脚注、合并单元格或绘制“刺绣图案”。
但是,如果一个单元格的操作很简单,那么就很难信任整个电子表格的完整性。Excel的灵活性使得在大型数据集中几乎不可能实现一致性和准确性。不管你有多警惕,不管你在电子表格中梳理了多少次拼写错误和错误的公式,你可能仍会有所遗漏。
不过完成这项工作通常有更好的工具。有些小窍门可以帮助你利用Excel知识来学习SQL。
嗨,SQL
在Excel中使用的数据肯定来源于某处。而这个来源就是数据库。即使你感觉数据的来源缺乏技术性(比如Google Analytics、Stripe或Salesforce),但你查询的就是数据库。
我们的网站1月份的访问量是多少? 我们刚刚推出的产品的支付渠道放弃率是多少?哪些销售代表拥有更多的销售渠道?这些都是人类的疑问,而不是计算机语言。作为一个Excel的高级用户,如果拥有正确的数据集,你可能会考虑如何将这些问题写成公式。
那么,如何直接查询数据库呢?在大多数情况下,人们使用SQL( Structured Query Language 结构化查询语言)。SQL会告诉数据库要对哪些数据进行查看和运算操作。
将一些初始运算导入SQL中,可以减少导出的数据量。若使用的数据集较小,那么你可能不会遇到Excel的性能问题。
随着你对SQL的操作熟练度的提高,你可以将越来越多的分析转移到SQL中,直到Excel成为例外,而不是规则。SQL数据库可以处理大量数据而无需担心性能问题,并且具有保护数据完整性的有序结构。
学习一门新语言可能听起来令人望而生畏,就像使用感觉技术性更高的工具一样。但是作为一个Excel用户,你对SQL的了解已经超出自己的预期。