封面
版权信息
内容简介
前言
第1章 DataFrame
001 使用随机数创建一个DataFrame
002 使用字母设置DataFrame的行标签
003 使用日期设置DataFrame的行标签
004 使用月份设置DataFrame的行标签
005 使用月初日期设置DataFrame的行标签
006 使用星期日设置DataFrame的行标签
007 使用日期范围设置DataFrame的行标签
008 使用等差日期设置DataFrame的行标签
009 使用时间差设置DataFrame的行标签
010 根据工作日移动DataFrame的行标签
011 使用shift()移动DataFrame的行标签
012 根据日期差修改DataFrame的行标签
013 在日期行标签中禁止使用法定节假日
014 在日期行标签中排除自定义的节假日
015 在日期行标签中增加或减少分钟数
016 指定DataFrame的列数据为行标签
017 在DataFrame中移除现有的行标签
018 使用列表设置DataFrame的行标签
019 使用字典修改DataFrame的行标签
020 使用lambda修改DataFrame的行标签
021 在多层索引的DataFrame中设置行标签
022 使用字典修改DataFrame的多层行索引
023 根据DataFrame创建笛卡儿积多层索引
024 使用rename()修改DataFrame的列名
025 使用strip()修改DataFrame的列名
026 使用set_axis()修改DataFrame的列名
027 使用字典修改DataFrame的列名
028 为DataFrame的列名添加前缀或后缀
029 根据DataFrame的列名获取列索引数字
第2章 读取数据
030 从CSV格式的字符串中读取数据
031 从CSV格式的文本文件中读取数据
032 从星号分隔的文本文件中读取数据
033 从制表符分隔的文本文件中读取数据
034 从空格分隔的文本文件中读取数据
035 读取文本文件的数据并自定义列名
036 读取文本文件的数据并重命名列名
037 根据列名读取文本文件的部分数据
038 从文本文件中读取lambda筛选的列
039 读取文本文件的数据并设置列名前缀
040 读取文本文件的数据并设置列类型
041 读取文本文件并使用lambda修改列
042 读取文本文件并使用自定义函数修改列
043 读取文本文件并设置True和False
044 读取文本文件的数据并跳过指定行
045 读取文本文件的数据并跳过奇数行
046 读取文本文件的数据并跳过倒数n行
047 读取文本文件并将列类型转为日期类型
048 读取文本文件的数据并解析日期列数据
049 读取文本文件的数据并合并日期列数据
050 从压缩格式的文本文件中读取数据
051 把DataFrame的数据保存为文本文件
052 从Excel文件中读取单个工作表的数据
053 从Excel文件中读取多个工作表的数据
054 从Excel文件中读取工作表的前n行数据
055 从首行跳过n行读取Excel工作表的数据
056 从末尾跳过n行读取Excel工作表的数据
057 跳过指定行读取Excel工作表的部分数据
058 从Excel文件中读取工作表的偶数行数据
059 从Excel文件中读取工作表的偶数列数据
060 根据列号读取Excel文件的工作表数据
061 读取Excel工作表的数据且取消默认列名
062 读取Excel工作表的数据且自定义列名
063 读取Excel工作表的数据并指定行标签
064 在读取Excel工作表数据时解析千分位符
065 把DataFrame的数据保存为Excel文件
066 在保存Excel文件时不保留默认的行标签
067 使用read_json()函数读取JSON数据
068 将DataFrame的数据保存为JSON文件
069 从指定的网页中读取多个表格的数据
070 将DataFrame的所有数据转换为网页代码
071 将DataFrame的部分数据转换为网页代码
072 根据当前剪贴板的数据创建DataFrame
073 将DataFrame的所有数据保存到剪贴板
074 将DataFrame的部分数据保存到剪贴板
第3章 筛选数据
075 根据指定的列名筛选整列数据
076 使用eq()在指定列中筛选数据
077 使用ne()在指定列中筛选数据
078 使用lt()在指定列中筛选数据
079 在指定列中根据平均值筛选数据
080 使用le()在指定列中筛选数据
081 使用gt()在指定列中筛选数据
082 使用ge()在指定列中筛选数据
083 根据行标签的大小筛选数据
084 根据行标签的范围筛选数据
085 根据行标签步长筛选偶数行数据
086 根据指定的日期切片筛选数据
087 根据指定的日期范围筛选数据
088 根据指定的月份范围筛选数据
089 在日期类型的列中按日筛选数据
090 根据日期列的差值筛选数据
091 使用loc筛选并修改单个数据
092 使用loc筛选并修改多个数据
093 使用loc筛选并修改多行单列数据
094 使用loc筛选并修改单行多列数据
095 使用loc筛选并修改多行多列数据
096 使用loc根据切片筛选并修改数据
097 使用loc筛选并修改单行数据
098 使用loc筛选并修改多行数据
099 使用loc筛选并修改单列数据
100 使用loc筛选并修改多列数据
101 使用loc筛选并修改多层数据
102 使用loc筛选并输出DataFrame
103 使用loc根据大小筛选数据
104 使用loc根据字符串长度筛选数据
105 使用loc根据数值范围筛选数据
106 在loc中使用all()筛选多列数据
107 在loc中使用any()筛选多列数据
108 使用loc筛选数据且指定输出列
109 使用loc筛选IndexSlice结果
110 使用loc根据最后一行筛选列
111 在loc中使用lambda筛选列
112 使用loc根据负数步长倒序筛选列
113 使用loc根据负数步长倒序筛选行
114 使用iloc筛选并修改单个数据
115 使用iloc筛选并修改多个数据
116 使用iloc筛选并修改多行单列数据
117 使用iloc筛选并修改单行多列数据
118 使用iloc筛选并修改多行多列数据
119 使用iloc根据列表筛选并修改数据
120 使用iloc筛选并修改单列数据
121 使用iloc筛选并修改多列数据
122 使用iloc筛选并修改单行数据
123 使用iloc筛选并修改多行数据
124 使用iloc筛选并输出DataFrame
125 使用iloc根据指定的步长筛选数据
126 使用iloc筛选不连续的多行数据
127 在iloc中使用numpy筛选多行数据
128 在iloc中使用numpy筛选多列数据
129 在iloc中使用lambda筛选偶数行数据
130 使用at筛选并修改单个数据
131 使用iat筛选并修改单个数据
132 使用last()筛选最后几天的数据
133 使用truncate()根据行标签筛选数据
134 使用truncate()根据日期范围筛选数据
135 使用between()根据日期范围筛选数据
136 使用between()根据数值范围筛选数据
137 使用between_time()根据时间筛选数据
138 使用contains()在指定列中筛选文本
139 使用contains()不区分大小写筛选文本
140 在contains()中使用或运算符筛选文本
141 在contains()中使用正则表达式筛选文本
142 使用endswith()根据结束字符筛选文本
143 使用startswith()根据开始字符筛选文本
144 使用match()根据多个开始字符筛选数据
145 使用isnumeric()筛选全部为数字的数据
146 使用isin()筛选在指定列表中的数据
147 使用isin()筛选未在指定列表中的数据
148 使用isin()筛选指定列最大的前n行数据
149 使用isin()筛选指定列最小的前n行数据
150 在apply()中调用自定义函数筛选数据
151 在链式语句中调用自定义函数筛选数据
152 在apply()中使用lambda筛选数据
153 在链式语句中调用lambda筛选数据
154 在applymap()中使用lambda筛选数据
155 使用apply()筛选指定列首次出现的数据
156 使用apply()根据日期范围筛选数据
157 使用apply()根据数值范围筛选数据
158 使用select_dtypes()根据类型筛选列
159 使用select_dtypes()根据类型反向筛选列
160 使用filter()根据指定的列名筛选列
161 使用filter()根据指定的条件筛选列
162 使用filter()根据正则表达式筛选列
163 使用filter()根据指定的行标签筛选行
164 使用filter()根据正则表达式筛选行
165 在query()中使用比较运算符筛选数据
166 在query()中使用多个运算符筛选数据
167 使用query()根据平均值筛选数据
168 使用query()根据两列差值筛选数据
169 使用query()根据多列数值大小筛选数据
170 使用query()筛选多列均存在的数据
171 使用query()根据指定列表筛选数据
172 使用query()根据外部变量筛选数据
173 使用query()根据日期范围筛选数据
174 使用query()筛选包含指定字符的数据
175 使用query()根据行标签筛选数据
176 使用query()组合多个条件筛选数据
177 使用query()以链式风格筛选数据
178 使用eval()组合多个条件筛选数据
179 使用rolling()根据样本筛选数据
180 使用sample()根据占比筛选随机子集
181 使用apply()根据指定条件筛选数据
182 在DataFrame中筛选所有数据
183 根据在列表中指定的多个列名筛选列
184 根据在集合中指定的多个列名筛选列
第4章 清洗数据
185 统计DataFrame每列的NaN数量
186 统计DataFrame每行的NaN数量
187 统计DataFrame每行的非NaN数量
188 统计DataFrame每列的NaN数量占比
189 统计DataFrame每行的NaN数量占比
190 统计DataFrame每行的非NaN数量占比
191 使用isna()在列中筛选包含NaN的行
192 使用notna()在列中筛选不包含NaN的行
193 使用isnull()在列中筛选包含NaN的行
194 使用isnull()在列中筛选不包含NaN的行
195 在DataFrame中筛选包含NaN的列
196 在DataFrame中筛选包含NaN的行
197 在DataFrame中筛选不包含NaN的列
198 在DataFrame中筛选不包含NaN的行
199 在DataFrame中删除包含NaN的行
200 在DataFrame中删除包含NaN的列
201 在DataFrame中删除全部是NaN的行
202 在DataFrame中删除全部是NaN的列
203 在DataFrame中根据NaN占比删除列
204 在指定的列中删除包含NaN的行
205 在指定的行中删除包含NaN的列
206 使用fillna()根据指定值填充NaN
207 使用fillna()在指定列中填充NaN
208 使用fillna()根据列平均值填充NaN
209 使用fillna()填充指定列的首个NaN
210 使用fillna()实现自动向下填充NaN
211 使用fillna()实现自动向上填充NaN
212 使用applymap()填充DataFrame的NaN
213 使用mask()填充DataFrame的NaN
214 根据分组已存在的数据填充分组的NaN
215 使用transform()根据分组平均值填充NaN
216 将小数点前后有空格的数据修改为NaN
217 在format()中使用指定字符标注NaN
218 使用指定的颜色高亮显示所有的NaN
219 自定义函数设置NaN的颜色
220 自定义函数设置NaN的背景颜色
221 自定义函数设置非NaN的颜色
222 自定义函数设置非NaN的背景颜色
223 在DataFrame中强制NaN排在首位
224 读取Excel文件并设置NaN的对应值
225 读取Excel文件并按列设置NaN的对应值
226 读取文本文件并设置NaN的对应值
227 读取文本文件并按列设置NaN的对应值
第5章 整理数据
228 使用apply()转换指定列的数据类型
229 使用apply()转换所有列的数据类型
230 使用to_numeric()转换列的数据类型
231 使用astype()转换指定列的数据类型
232 使用astype()将百分数转换为浮点数
233 使用astype()转换千分位符的数字
234 使用astype()将其他时间转为北京时间
235 根据日期类型列的日期解析星期
236 根据日期类型列的日期解析季度
237 使用lower()将指定列的字母变为小写
238 使用rjust()在指定列左端补充字符
239 使用ljust()在指定列右端补充字符
240 使用center()在指定列两端补充字符
241 使用lstrip()删除指定列左端字符
242 使用rstrip()删除指定列右端字符
243 使用strip()删除指定列左右两端字符
244 使用get()提取指定列指定位置的字符
245 使用slice()提取指定列的多个字符
246 使用count()统计指定列的字符个数
247 使用repeat()在指定列中重复字符
248 使用replace()在指定列中替换文本
249 使用replace()在指定列中替换字母
250 在replace()中使用正则表达式替换
251 在replace()中使用lambda替换
252 使用slice_replace()替换指定切片
253 在apply()中调用自定义函数修改数据
254 在apply()中调用lambda修改数据
255 使用apply()删除%符号并转换数据
256 使用mask()根据指定条件修改数据
257 使用where()根据指定条件修改数据
258 使用replace()在指定列中替换数据
259 使用replace()在指定行中替换数据
260 在map()中使用字典修改数据
261 在map()中使用lambda修改数据
262 使用map()格式化指定列的数据
263 使用map()将浮点数转换为百分数
264 使用map()根据时间差计算天数
265 在DataFrame的末尾增加新行
266 在DataFrame的中间插入新行
267 根据行标签在DataFrame中删除行
268 根据条件在DataFrame中删除行
269 在多层索引的DataFrame中删除行
270 使用duplicated()筛选重复行
271 使用drop_duplicates()删除重复行
272 在指定列中使用drop_duplicates()
273 根据表达式初始化DataFrame的新增列
274 使用map()初始化DataFrame的新增列
275 计算DataFrame的单列数据并新增列
276 计算DataFrame的多列数据并新增列
277 使用assign()在DataFrame中新增列
278 使用assign()根据lambda表达式新增列
279 使用列表初始化DataFrame的新增列
280 使用apply()根据列表成员增加新列
281 使用apply()计算多列数据增加新列
282 使用apply()把列表成员扩展成多列
283 使用partition()将一列拆分成两列
284 使用split()将一列拆分成多列
285 使用extract()将一列拆分成两列
286 使用extract()将一列拆分成多列
287 在extract()中根据正则表达式拆分列
288 使用cat()以拼接字符串方式合并列
289 根据字符串日期列拆分年月日列
290 根据日期类型的列拆分年月日列
291 使用加号运算符拼接年月日列
292 使用to_datetime()拼接年月日列
293 根据索引在DataFrame中插入列
294 根据列名在DataFrame中删除列
295 根据条件在DataFrame中删除列
296 使用concat()按行拼接DataFrame
297 使用append()按行拼接DataFrame
298 使用concat()分组拼接DataFrame
299 使用concat()按列拼接DataFrame
300 使用concat()提取两个DataFrame的交集
301 使用merge()根据同名列合并DataFrame
302 使用merge()根据指定列合并DataFrame
303 使用merge()以指定方式合并DataFrame
304 使用join()根据索引列按列合并DataFrame
305 使用combine_first()合并DataFrame
306 使用combine()根据参数合并DataFrame
307 使用Pandas的merge()合并DataFrame
308 使用merge_ordered()合并DataFrame
309 使用merge_asof()合并DataFrame
310 使用compare()比较两个DataFrame
311 使用align()补齐两个DataFrame的列
312 在DataFrame中垂直移动指定的行数
313 在DataFrame中水平移动指定的列数
314 使用round()设置DataFrame的小数位数
315 使用update()更新DataFrame的数据
316 使用clip()修剪DataFrame的数据
317 使用clip()根据列表按列修剪数据
318 使用replace()在DataFrame中替换数据
319 使用replace()执行多值对应替换
320 使用replace()替换所有行列的字母
321 在replace()中使用正则表达式替换
322 在replace()中使用多个正则表达式
323 使用apply()修改DataFrame的数据
324 使用applymap()修改DataFrame
325 使用transform()修改DataFrame
326 使用transform()按行修改DataFrame
327 在DataFrame中按列相加指定的列表
328 在DataFrame中按行相加指定的列表
329 在DataFrame中按列相减指定的列表
330 在DataFrame中按行相减指定的列表
331 在DataFrame中按列相乘指定的列表
332 在DataFrame中按行相乘指定的列表
333 在DataFrame中实现各行数据连乘
334 在DataFrame中按列除以指定的列表
335 在DataFrame中按行除以指定的列表
336 使用add()实现两个DataFrame相加
337 使用sub()实现两个DataFrame相减
338 使用mul()实现两个DataFrame相乘
339 使用div()实现两个DataFrame相除
340 使用sum()在DataFrame中按列求和
341 使用sum()在DataFrame中按行求和
342 使用apply()在DataFrame中按列求和
343 使用apply()在DataFrame中按行求和
344 使用agg()在DataFrame中按列求和
345 使用agg()在DataFrame中按行求和
346 使用select_dtypes()实现按列求和
347 使用select_dtypes()实现按行求和
348 使用expanding()累加前n个数据
349 使用apply()按行累加各列的数据
350 使用apply()按列累加各行的数据
351 使用apply()计算每列数据的平均值
352 使用apply()计算每行数据的平均值
353 使用apply()计算每行最大值的比值
354 使用apply()计算每列最大值的比值
355 使用apply()计算每列数据的极差
356 使用apply()计算每行数据的极差
357 使用diff()计算DataFrame的行差
358 使用diff()计算DataFrame的列差
359 使用diff()计算指定列的差值
360 使用diff()计算差值并筛选数据
361 使用shift()按行计算移动平均值
362 使用shift()按列计算移动平均值
363 使用rolling()按行计算移动平均值
364 使用rolling()居中计算移动平均值
365 使用rolling()计算移动极差
366 在rolling()中设置最小观测期
367 使用pct_change()计算增减百分比
368 使用apply()获取每列数据的最大值
369 使用apply()获取每列数据的中位数
370 使用describe()获取指定列的最大值
371 使用agg()获取所有列的最大值
372 使用tolist()获取DataFrame的数据
373 根据行标签顺序排列DataFrame
374 根据行标签大小排列DataFrame
375 倒序排列DataFrame并重置行标签
376 在DataFrame中根据单个列名排序
377 在DataFrame中根据多个列名排序
378 在DataFrame中根据文本长度排序
379 在DataFrame中降序排列所有的列
380 在DataFrame中倒序排列所有的列
381 在DataFrame中自定义所有列顺序
382 在DataFrame中根据列表调整列顺序
383 使用rank()根据大小生成排名序号
384 使用value_counts()统计列成员数量
385 使用value_counts()统计列成员占比
第6章 透视数据
386 使用melt()将宽表转换为长表
387 使用pivot()将长表转换为宽表
388 使用stack()将宽表转换为长表
389 使用unstack()将长表转换为宽表
390 使用stack()将多行数据转换成一行
391 使用crosstab()根据行列创建交叉表
392 使用crosstab()创建交叉表并计算合计
393 使用explode()将列表成员扩展为多行
394 使用explode()筛选互为好友的数据
395 使用explode()在组内容之前插入组名
396 使用pivot_table()根据指定列进行分组
397 使用pivot_table()获取分组平均值
398 使用pivot_table()获取多级分组平均值
399 使用pivot_table()实现多级分组并求和
400 使用pivot_table()对不同列执行不同函数
401 使用transpose()实现行列数据交换
第7章 分组聚合
402 使用groupby()根据单列数据分组求和
403 使用groupby()根据多列数据分组求和
404 使用groupby()分组并对指定列数据求和
405 在groupby()中设置分组键为非索引列
406 重命名在使用groupby()分组之后的列名
407 自定义在使用groupby()分组之后的列名
408 使用groupby()分组并统计各组的个数
409 使用groupby()分组并获取各组的明细
410 使用groupby()分组并获取多级分组明细
411 使用groupby()分组并遍历各组的明细
412 使用groupby()分组并计算各组移动平均值
413 使用groupby()分组并计算各组累加值
414 使用groupby()分组并获取各组最大值
415 使用groupby()分组并获取各组第二大值
416 使用groupby()分组并添加各组合计
417 使用groupby()分组并添加分组占比
418 使用groupby()分组求和并禁止排序
419 使用groupby()根据lambda进行分组
420 使用groupby()根据行标签进行分组
421 使用groupby()根据索引年份进行分组
422 使用groupby()根据年份月份进行分组
423 使用groupby()根据星期进行分组
424 使用groupby()根据日期进行分组
425 使用groupby()根据列名进行分组
426 使用groupby()根据字典进行分组
427 使用groupby()根据字典类型进行分组
428 使用groupby()根据自定义函数进行分组
429 使用groupby()根据指定字符进行分组
430 使用groupby()根据返回值进行分组
431 使用groupby()根据Grouper进行分组
432 在分组指定列中查找互为相反数的数据
433 使用resample()实现日期重采样分组
434 使用resample()实现先分组再重采样
435 使用cut()根据连续型数据进行分组
436 使用cut()进行分组并设置分组的标签
437 使用cut()进行分组并计算各组平均值
438 使用qcut()根据指定的个数进行分组
439 根据索引层对多层索引的DataFrame分组
440 使用agg()获取分组指定列的最大值
441 使用agg()获取分组某几列的最大值
442 使用agg()自定义分组之后的新列名
443 使用agg()根据字典自定义分组新列名
444 使用agg()转换分组之后的合计数据
445 使用agg()转换分组之后的列数据类型
446 使用agg()通过lambda计算分组极差
447 使用agg()通过自定义函数计算分组极差
448 在agg()中调用带多个参数的自定义函数
449 使用pipe()计算各个分组指定列的极差
450 使用filter()筛选分组指定列的合计
451 使用filter()筛选分组指定列的最大值
452 使用filter()筛选分组指定列的平均值
453 使用filter()筛选分组指定列的所有值
454 使用filter()筛选分组指定列的某个值
455 使用filter()筛选分组成员的个数
456 使用filter()筛选分组大于某值的数据
457 使用apply()获取分组某列的最大值
458 使用apply()获取分组数值列的最大值
459 在apply()中使用lambda计算分组列差
460 在apply()中使用lambda计算分组差值
461 在apply()中使用DataFrame返回分组差值
462 在apply()中调用自定义函数统计分组指标
463 使用apply()将分组数据导出为Excel文件
464 使用unstack()以宽表风格输出多级分组
465 使用quantile()计算各个分组的分位数
466 使用rank()获取各个成员在分组中的序号
467 使用transform()计算平均值并筛选分组
468 使用drop_duplicates()删除分组重复数据
第8章 可视化数据
469 使用format()自定义列的数据格式
470 使用format()将浮点数转为百分数
471 在format()中使用lambda重置列
472 使用指定的颜色设置所有列的背景颜色
473 使用自定义函数设置指定列的背景颜色
474 使用自定义函数设置指定行的背景颜色
475 使用自定义函数设置交错的行背景颜色
476 使用自定义函数设置列切片的背景颜色
477 使用applymap()根据条件设置背景颜色
478 使用指定的颜色设置所有列的数据颜色
479 使用自定义函数设置指定列的数据颜色
480 使用自定义函数设置指定行的数据颜色
481 使用自定义函数设置交错的行数据颜色
482 使用自定义函数设置列切片的数据颜色
483 在所有列中根据值的大小设置背景颜色
484 在指定列中根据值的大小设置背景颜色
485 在所有列中根据值的大小设置数据颜色
486 在指定列中根据值的大小设置数据颜色
487 使用指定颜色高亮显示分位包含的数据
488 使用指定颜色高亮显示所有列的最大值
489 使用指定颜色高亮显示指定列的最大值
490 使用指定颜色高亮显示所有列的最小值
491 使用指定颜色高亮显示指定列的最小值
492 使用自定义函数设置每列的最大值颜色
493 使用自定义函数设置每列的最小值颜色
494 使用指定颜色高亮显示所有行的最大值
495 使用指定颜色高亮显示指定行的最大值
496 使用指定颜色高亮显示所有行的最小值
497 使用指定颜色高亮显示指定行的最小值
498 根据大小使用渐变色按列设置数据颜色
499 根据大小使用渐变色按行设置数据颜色
500 根据大小使用渐变色按列设置背景颜色
更新时间:2023-07-17 18:44:03