彩票走势图

产品

产品
资讯
资源
视频
学院
示例

产品中心
解决方案
行业方案
视频课程
关于慧都

热门产品

UI界面: DevExpress telerik BCGSoft Developer Machines

文档管理: Aspose E-iceblue GrapeCity PDFlib

图表控件: LightningChart Steema Iocomp

数据采集: TAKEBISHI Matrikon

思维导图: TheBrain XMind

开发工具: IntelliJ IDEA MyEclipse Zend PyCharm WebStorm CLion

报表控件: Fast Report Stimulsoft GrapeCity

加密解密: VMPsoft Eziriz Oreans

项目管理: DHTMLX NETRONIC

数据库管理: Devart PremiumSoft

条码工具: Bartender Softek Dynamsoft TEC-IT Byte Aspose.BarCode

解决方案

软件定制解决方案: 软件系统定制高端UI定制业务系统定制

智能制造解决方案: OMES制造执行系统 APS生产排程系统 OQMS质检管理系统 OPTS生产溯源系统 OTPM设备管理系统 OKanban看板管理 DA工业数据采集系统 SRM供应商管理 PDM产品数据管理 WMS仓储管理 OMES ProLine产线MES系统

行业方案

制造行业: 磁性材料行业hot 汽车零配件行业电子行业精密装配行业钣金行业机械加工行业汽车改装行业金属薄膜材料行业灯具照明行业电线电缆行业钢结构行业

其他行业: 石油行业hot 医疗行业金融行业建筑行业

视频课程

产品视频: UI界面类图标报表网络通讯文档管理矢量图像处理位图图像处理音频视频文件格式转码条形码加密解密测试分析地图/CAD/GIS BI/大数据算法工作流 UML 数据库/服务器 IDE 项目管理思维导图其他移动开发扫描识别条形码

学院课程: VIP视频免费视频用户界面图表报表文档管理大数据工作流项目管理测试分析往期公开课项目管理其他

企业培训: 定制培训班

关于慧都

慧都简介慧都文化联系我们合作伙伴典型客户

彩票走势图 > 资讯 > Pandas教程：Python数据框架的10个常见问题

Pandas教程：Python数据框架的10个常见问题

翻译|使用教程|编辑：鲍佳佳|2021-03-04 10:40:31.320|阅读 134 次

概述：当您开始使用Python进行数据分析和数据科学时，Pandas是您将学习的第一个库之一。其可帮助您处理数据集，转换和清理数据以及获取统计信息。在本教程中，我们将回答人们在使用熊猫时遇到的10个最常见的问题。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接：

PyCharm是一种Python IDE，其带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具。此外，该IDE提供了一些高级功能，以用于Django框架下的专业Web开发。PyCharm现已加入在线订购，点击此处了解价格详情。

点击下载PyCharm最新试用版

Pandas教程：Python数据框架的10个常见问题

当您开始使用Python进行数据分析和数据科学时，Pandas是您将学习的第一个库之一。其可帮助您处理数据集，转换和清理数据以及获取统计信息。

Pandas教程：有关Python数据帧的10个常见问题

在本教程中，我们将回答人们在使用熊猫时遇到的10个最常见的问题。

数据集

在本教程的第一部分中，我们将使用包含城市人口样本数据以及有关土地面积和人口密度的一些信息的数据集。

Pandas Loc和iloc

pandas.loc[] 有助于通过标签或布尔数组切片访问一组行和列。

让我们选择墨西哥城的人口。

下面我们仅打印墨西哥城的人口。

使用，.iloc[]您可以使用数字整数索引选择列。

请记住以下几点：

平原:用于选择行/列中的所有数据。
0:2 将选择行/列0和1。不包括2。
-1 将选择最后一个元素。

重命名列

接下来，我们将重命名这些列，以使它们将来更易于访问。

有几种方法可以做到这一点：

直接分配df.columns一个列名称数组。
用df.rename重命名特定列。

在pandas DataFrame中选择多个列

让我们将DataFrame分为两个包含以下内容的DataFrame：

城市，国家和人口。
城市，区域和密度。

我们可以通过几种方式做到这一点：

通过使用.iloc[:, 0:3]，其中括号中的第一个参数选择所有行，第二个参数选择列0，列1和列2。
通过将DataFrame切片为double[]并输入要选择的列名。

熊猫按列合并两个表

接下来，我们将垂直连接我们创建的两个表。这些表具有相同的City列，因此我们将使用该pd.merge函数来连接两个表。

该left_on和right_on参数指示列名在第一和第二个表合并上。

使用pandas更改pandas中的列类型

与数据帧的工作进一步，我们需要转变Population，Area以及Density从字符串列转换为数字。

为此，我们将：

创建一个函数，to_int()它将带有'，'符号的字符串转换为整数。
将apply函数与lambda表达式一起使用。

分组并变成一个DataFrame

现在，让我们对DataFrame进行分组，Country并计算此数据样本中每个国家/地区的人口。
困难之pd.groupby处在于它返回一个groupby对象，而不是DataFrame。在下面的示例中，我们将展示如何从groupby对象创建DataFrame。

我们将对进行分组Country，同时计算Population和Area列的总和。我们将删除密度列，因为我们不再需要它。

如何在Pandas中的DataFrame中的行上进行迭代

尽管遍历行可能不是最快的解决方案，但有时仍然可以派上用场。您可以使用循环.iterrows()功能来做到这一点。

考虑尝试对applyPandas DataFrame的函数或向量化表示执行相同的操作。在大型数据集上，这将提高计算速度。

在下面，我们将Population列除以1000，并以千为单位获得人口数。下面有3个替代代码示例。

如何根据列值从DataFrame中选择行

让我们选择人口超过1000万人，面积不到2000平方公里的国家。
您可以通过在中输入逻辑约束来做到这一点[]。

如何更改DataFrame列的顺序

您可以简单地通过以不同顺序切片现有的DataFrame来做到这一点。

用Pandas清理数据

要开始使用数据，您需要清理数据。

首先的基本步骤是：

在DataFrame中删除重复项。
用有意义的值填充空单元格，或用很多空值删除列。
获取有关列值的统计信息。

让我们下载带有网球比赛结果的数据集。

我们将降大任于重复使用pd.drop_duplicates，以inplace = True将更改应用到数据帧。

现在，让我们找出DataFrame中是否存在NaN值。

df.isna().any() 当该列包含NaN值时为True。

在此minutes列中，我们具有91％的NaN值，因此将其删除，因为它不包含任何有用的信息。

在winner_age，loser_age，loser_rank，和winner_rank列没有太多的NaN值，所以我们会用中位数代替NaN值。

有了df.describe我们，我们可以获得有关数字列数据的统计信息。

这就是我们的Pandas教程。你学会了吗？立即下载体验吧！您有任何疑问或意见欢迎评论！

标签：

本站文章除注明转载外，均为本站原创或翻译。欢迎任何形式的转载，但请务必注明出处、不得修改原文相关链接，如果存在内容上的异议请邮件反馈至chenjj@capbkgr.cn

文章转载自：

上一篇：界面控件DevExpress使用教程：Angular的仪表板组件 - 自定义属性下一篇：Word开发工具Aspose.Words功能演示：使用C ++分割MS Word文档

相关产品

PyCharm

PyCharm是一种提高Python语言开发效率的IDE

最新文章 MORE

彩票走势图相关的文章 MORE

业务系统定制

智能制造解决方案: 工业设计运营管理生产管理

石油工程解决方案: 油气勘探数字化钻井工程数字化数据管理与分析

关于我们: 慧都简介公司动态业务区域典型案例

区域服务电话: 重庆 / 023-68661681 华东 / 13452821722 华南 / 18166486035 华北 / 17347785263

客户支持: 技术培训/ 咨询服务服务热线：400-700-1020 邮箱：sales@capbkgr.cn 微信在线咨询

官方微信

官方微博

服务电话

重庆/ 023-68661681

华东/ 13452821722

华南/ 18100878085

华北/ 17347785263

客户支持

技术支持咨询服务

服务热线：400-700-1020

邮箱：sales@capbkgr.cn

关注我们

地址 : 重庆市九龙坡区火炬大道69号6幢

慧都科技版权所有 Copyright 2003- 2024 渝公网安备 50010702500608号

扫码咨询

添加微信立即咨询

电话咨询

客服热线
023-68661681

TOP

<dir id='lxd60'><del id='lxd60'><del id='lxd60'></del><pre id='lxd60'><pre id='lxd60'><option id='lxd60'><address id='lxd60'></address><bdo id='lxd60'><tr id='lxd60'><acronym id='lxd60'><pre id='lxd60'></pre></acronym><div id='lxd60'></div></tr></bdo></option></pre><small id='lxd60'><address id='lxd60'><u id='lxd60'><legend id='lxd60'><option id='lxd60'><abbr id='lxd60'></abbr><li id='lxd60'><pre id='lxd60'></pre></li></option></legend><select id='lxd60'></select></u></address></small></pre></del><sup id='lxd60'></sup><blockquote id='lxd60'><dt id='lxd60'></dt></blockquote><blockquote id='lxd60'></blockquote></dir><tt id='lxd60'></tt><u id='lxd60'><tt id='lxd60'><form id='lxd60'></form></tt><td id='lxd60'><dt id='lxd60'></dt></td></u>

<code id='lxd60'><i id='lxd60'><q id='lxd60'><legend id='lxd60'><pre id='lxd60'><style id='lxd60'><acronym id='lxd60'><i id='lxd60'><form id='lxd60'><option id='lxd60'><center id='lxd60'></center></option></form></i></acronym></style><tt id='lxd60'></tt></pre></legend></q></i></code><center id='lxd60'></center>

<dd id='lxd60'></dd>

<style id='lxd60'></style><sub id='lxd60'><dfn id='lxd60'><abbr id='lxd60'><big id='lxd60'><bdo id='lxd60'></bdo></big></abbr></dfn></sub>_{<dir id='lxd60'></dir>}