7-pandas数据分组聚合合并
7.pandas数据分组聚合合并
Pandas 处理数据时,常常会对数据分成若干个组,然后对各个组进行数据处理,比如求和、求平均值等,最后再将各个组的数据汇总起来形成一个新的数据集,这个过程通常被描述为“split-apply-combine” 。
所以本篇要讲的就是 Pandas 中涉及 分组、聚合、合并的一些操作。
在本章中依然使用 wine dataset 数据集: ...
6-pandas数据进阶操作
6.pandas数据进阶操作
6.1 按条件查询数据在这里使用wine数据集作为示例:
import pandas as pdimport numpy as np# nrows=6 表示仅仅读取前10行, 并且只使用 usecols 来限定只取部分列数据df = pd.read_csv('./datasets/wine', nrows=10, useco ...
5-pandas数据基础操作
5.pandas数据基础操作
对一个数据对象进行操作,我们一般都是从【增】、【删】、【改】、【查】 这四个方面入手,了解这四个方面的基本用法,就能使用该数据对象应对大部分情况了。
5.1 pandas 创建数据5.1.1 pandas 创建 Series
通过列表创建 Series
import pandas as pds = pd.Series([1, 2, 3, 4]) ...
4-Pandas读取和保存数据文件
4.Pandas读取和保存数据文件
Pandas 主要是用来进行数据处理的,在日常使用时,我们更多的是从文件中读取数据,Pandas 提供了非常多的方法,可以非常方便的读取不同格式的数据文件。
4.1 读写接口概览览Pandas I/O API 提供了一组顶层的读取写方法,使用如 pandas.read_csv(文件名)会返回一个 DataFrame 对象,而使用如 DataFra ...
3-Pandas基础知识
3.Pandas基础知识
注:本教程使用 pandas 2.1.1版本作为示例,不同版本有一些方法可能存在不同,检查pandas版本 :
import pandasprint(pandas.__version__)
3.1 pandas 数据结构
Series
Series 是Pandas库中的一维数据结构,类似于Python中的列表和Numpy中的Ndarray对 ...
2-Pandas与Jupyter环境安装
2.Pandas与Jupyter环境安装
2.1 安装Pandaspip install pandas
但是更加推荐直接安装 Anaconda 包。Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux, Mac, Windows等系统,官网下载https://www.anaconda.com/download。
Anaconda这个包本身就包含 Py ...
1-Pandas教程简介
1.教程简介
1.1 背景本教程是快速了解如何使用Pandas库对数据进行处理,限于时间和精力,仅仅作为一个入门级教程。学习本教程要求会基本python语法。
1.2 章节内容介绍Chapter2 Pandas与Jupyter环境安装安装Jupyter Notebook 和 pandas 库
Chapter3 Pandas基础知识
pandas 数据结构介绍
panda ...
5-感知机
5 感知机
5.1 感知机模型感知机(perceptron)是一种用于二分类的线性分类模型:输入为实例的特征向量,输出为实例的类别,取+1和-1二值。
感知机是19571年提出的,比较早的一个模型,但是它算是SVM和神经网络模型的基础。如果之前已经了解过逻辑回归(logistic regression),其实就比较容易理解感知机了,硬要说的话,逻辑回归其实是从感知机发展而来的 ...
4-线性模型--(下)
4 线性模型—(下)
4.5 逻辑回归(Logistic Regression)逻辑回归(Logistic Regression) 也被称为对数几率回归(Logit Regression),它是在线性回归的基础之上做了改进,输出值依然是连续值,所以称“回归(Regression)”。虽然名字依然是回归,但它主要是用来处理二分类问题的。
这是因为它的输出值依然是连续值,但是它是 ...
4-线性模型--(中)
4 线性模型—(中)
4.2 局部加权线性回归(Locally Weighted Linear Regression)4.2.1 局部加权线性回归的引入上一篇引入线性回归问题时,示例数据 “外卖配送时间” 的散点图如下所示:
从图中的数据分布来看,使用线性回归模型基本上是没太大问题的,因为数据大致还是呈现线性分布的;虽然并不能保证所有的点都落在最后的拟合直线上,但是整体 ...