首页后端开发Python如何快速掌握Python的第三方库

如何快速掌握Python的第三方库

时间2023-06-03 08:13:02发布访客分类Python浏览970
导读:如何快速掌握Python的第三方库?您好,感谢您能给我这个机会回答这个问题。python目前已经是市面上很火的语言了,但是入门容易精通难。我用业余时间自学这些库大约用了一年左右。总结一点学习技巧希望能帮到题主和有类似问题的朋友。先浏览了一下...

如何快速掌握Python的第三方库?

您好,感谢您能给我这个机会回答这个问题。

python目前已经是市面上很火的语言了,但是入门容易精通难。

我用业余时间自学这些库大约用了一年左右。总结一点学习技巧希望能帮到题主和有类似问题的朋友。

先浏览了一下这个问题下的其他回答,发现绝大部分都是媒体内容的堆砌(包括但不限于——免费课、笔记、官方手册、书籍、小例子等等)。如果题主并不是准备做相关库开发,换言之是重应用而不太重视背后原理的话,我很不推荐用这种学习方式——这些手册和书籍,名义上确实“系统”地讲解了这些库的各个模块的使用,而且越是质量好的、面向新手的书籍,每个模块和一些“坑”就讲解的越详细。

但很遗憾,在自学体系内,由于新手本身就没有对这些模块重要度的认知,又没有人带着入门,所以只能一视同仁地去学习它们,看似系统,实际上毫无侧重,眉毛胡子一把抓。哲学上来说就是作为新手,未能区分“系统学习matplotlib,numpy,scipy,pandas”这件事里面的主要矛盾和次要矛盾。

我们回顾一下小时候学习汉字,以及后来考托福、雅思的经历。给你一本字典/红宝书,你当然是要先把它们过一遍,然后开始不断背诵记忆。我们当然不否认把整本字典/红宝书倒背如流很厉害,但是很多时候我们也要问自己是否有必要做到这样;相反,我相信大部分情况下对字典/红宝书的掌握都是掌握核心词汇和常见用法为准——很多情况下你用倒背如流整本字典的资源,用来提升其他短板实际上能获得更均衡的提升。

看到这里,如果你有一些悟性,应该大概知道我接下来要说什么了。你以为要这么“系统”学习然后就能解决问题1、2、3、4,实际上你会发现在没人带领以及大量时间复习的情况下,你根本做不到把每个模块的内容都记下来,往往是学了A忘了B,越到后面越学越乱,学习信心也受到很大影响。

所以你一定要加上自己的学习能力,不断的突破自我。

大家可以去看看pandas或者官方文档,会学到挺多的。

看看文档,就会发现这个指南将日常中的事项已经帮你归类为一下几个大类:

IO, 文件读取与保存

Indexing and select, 书籍索引与选取

MultiIndex, 多级索引

Merge, join and concatenate, 数据集合并

Reshaping and pivot table,改变数据形状与透视表

Working with text data, 处理字符串

Working with missing data,处理缺失值

Categorical data,目录型数据(或者说分类型数据)

Nullable integer data type,给“空数据”标记某种特定类型

Visualization, 数据可视化

Computation tools,计算工具

Group by,分组

Time serious,时间序列

Time delta,时间运算

Styling, 自定义风格

Operations and setting,自定义操作方式与设置(包括外围环境设置等)

Enhancing performance,强化效能

Frequent asked questions, Q& A

Pandas cookbook, 奇技淫巧合集(笑)

看起来好像仍然很多,不过稍微花点时间,不难发现,对于初学者,根本没必要关注诸如如下内容:

自定义风格(默认的已经很好用而且通用,大家用下来也没啥批评)

性能增强(走都没会就不用想跑了吧)

Q& A(你会看软件安装协议吗?)

MultiIndex (这是啥玩意,以前都没接触过,不看——当然了,这个本身是pandas一个很重要的类,但是初学者完全可以略过)

相反,我相信正常人都应该更关注下述内容:

IO - 我咋读取Excel,csv和json文件,处理完之后又怎么保存它们呢?

Indexing and select - 读取完成之后我要怎么(按某些条件)筛查数据呢?

Merge - 我怎么合并多个数据集?

Text data & Missing data - 我怎么修改文本格式,处理缺失值?

Visualization - 有没有必要可视化(散点图、直方图),要怎么做?

所以,在你安装完相关库之后,你要做的就是先看一遍手册,大概了解这个库能做什么事情。然后:

找一个格式比较规范的Excel文件(或者某些网上的公开数据集,比如“鸢尾花分类”数据集)

从读取文件开始入手,然后假想你期望从这个数据集上获得的信息并在手册内找到对应内容开始学习——比如我想像Excel那样筛选某个特定条件的数据,我该怎么做;又比如我想获得某些分类的统计量(均值、偏度等)我该怎么做,等等

不断给自己“出难题”,将这些问题拆分成更小的,能够在手册内直接查到的部分,然后反复学习。某些手册内语焉不详的,就去网上搜搜别人怎么做的。

换不同的数据集、更脏的数据集,并在 读文件 -> 数据清洗 -> 分析数据 -> 输出(保存、可视化等)的过程中,逐渐摸索出自己的套路,并反复练习相关代码及各代码模块间的传递和衔接

恭喜,至此你应该对pandas整个库有了比较深刻的感性认识并系统掌握了pandas的大部分内容了

在上面学习pandas的过程中,出于某些原因(比如期待更好更灵活的可视化效果),你应该可以 同时并行学习其他库,但学习方法上和上面的例子类似:即,先树常规靶子,拆解问题并在手册内找到对应解,之后给自己出难题并摸索自己的工作流(解题套路)。

总结:通过上述一些学习内容个方法,相信你也可以学的很好,不断的思考不断突破,一定能成功!

声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!


若转载请注明出处: 如何快速掌握Python的第三方库
本文地址: https://pptw.com/jishu/59388.html
如何解决运行导入TensorFlow包的Python文件报错 notebook是什么

游客 回复需填写必要信息