![深入浅出Python机器学习](https://wfqqreader-1252317822.image.myqcloud.com/cover/94/44510094/b_44510094.jpg)
上QQ阅读APP看书,第一时间看更新
2.3.3 pandas——数据分析的利器
pandas是一个Python中用于进行数据分析的库,它可以生成类似Excel表格式的数据表,而且可以对数据表进行修改操作。pandas还有个强大的功能,它可以从很多不同种类的数据库中提取数据,如SQL数据库、Excel表格甚至CSV文件。pandas还支持在不同的列中使用不同类型的数据,如整型数、浮点数,或是字符串。下面我们用一个例子来说明pandas的功能。在Jupyter Notebook中输入代码如下:
![](https://epubservercos.yuewen.com/89A715/23721687209561106/epubprivate/OEBPS/Images/Figure-P36_22433.jpg?sign=1739525639-623V8lGJQJk6gIUy8EeJzWCnjBIZkeqY-0-09383aff8d99c4442967686b8f39af2c)
运行上述代码,会得到一个数据表如图2-13所示。
![](https://epubservercos.yuewen.com/89A715/23721687209561106/epubprivate/OEBPS/Images/Figure-P37_22432.jpg?sign=1739525639-3kQW3oyn7eKmFy2AKXACdvJqgTMv9ZBu-0-6ba39a8f46d4455165ffadcd39cc1b80)
图2-13 pandas.Dataframe生成的数据表
同时,我们还可以从数据表中进行查询操作,例如我们想把不在北京的同学信息显示出来,可以输入下面这一行代码:
display(data_frame[data_frame.City != "北京"]) #显示所有不在北京的同学信息
运行结果如图2-14所示。
![](https://epubservercos.yuewen.com/89A715/23721687209561106/epubprivate/OEBPS/Images/Figure-P37_2131.jpg?sign=1739525639-HnBKfmKfE7crbrcojpMSOb5EDubYTGYq-0-1cbf67b5371d2eb34f80f1b8008c2d2e)
图2-14 显示所有不在北京的同学信息
现在我们对pandas有了一些初步的了解,在本书后面的内容中,我们还将深入讲解pandas的功能和用法。