资源名称:命令行中的数据科学 完整版pdf

第1章 简介  1
1.1 概述  1
1.2 数据科学就是OSEMN  2
1.2.1 数据获取  2
1.2.2 数据清洗  2
1.2.3 数据探索  3
1.2.4 数据建模  3
1.2.5 数据解释  3
1.3 插入的几章  4
1.4 什么是命令行  4
1.5 为什么用命令行做数据科学工作  6
1.5.1 命令行的灵活性  6
1.5.2 命令行可增强  6
1.5.3 命令行可扩展  7
1.5.4 命令行可扩充  7
1.5.5 命令行无处不在  7
1.6 一个现实用例  8
1.7 延伸阅读  11
第2章 入门指南  13
2.1 概述  13
2.2 设置数据科学工具箱  13
2.2.1 步骤1:下载和安装VirtualBox  14
2.2.2 步骤2:下载和安装Vagrant  14
2.2.3 步骤3:下载并启动数据科学工具箱  14
2.2.4 步骤4:登录(Linux 和Mac OS X)  16
2.2.5 步骤4:登录(微软Windows)  16
2.2.6 步骤5:关闭或重启  16
2.3 必要的概念和工具  17
2.3.1 环境  17
2.3.2 运行命令行工具  18
2.3.3 五类命令行工具  19
2.3.4 命令行工具的组合  21
2.3.5 输入和输出重定向  22
2.3.6 处理文件  23
2.3.7 寻求帮助  24
2.4 延伸阅读  26
第3章 数据获取  27
3.1 概述  27
3.2 将本地文件复制到数据科学工具箱  28
3.2.1 本地数据科学工具箱  28
3.2.2 远程数据科学工具箱  28
3.3 解压缩文件  29
3.4 微软Excel电子表格的转换  30
3.5 查询关系数据库  32
3.6 从互联网下载  33
3.7 调用Web API  35
3.8 延伸阅读  36
第4章 创建可重用的命令行工具  37
4.1 概述  38
4.2 将单行转变为shell脚本  38
4.2.1 步骤1:复制和粘贴  39
4.2.2 步骤2:添加执行权限  40
4.2.3 步骤3:定义shebang  41
4.2.4 步骤4:删除固定的输入  42
4.2.5 步骤5:参数化  42
4.2.6 步骤6:扩展PATH  43
4.3 用Python 和R 创建命令行工具  44
4.3.1 移植shell 脚本  45
4.3.2 处理来自标准输入的流数据  46
4.4 延伸阅读  47
第5章 数据清洗  49
5.1 概述  50
5.2 纯文本的常见清洗操作  50
5.2.1 行过滤  50
5.2.2 值提取  54
5.2.3 值替换和删除  55
5.3 处理CSV  56
5.3.1 主体、头部和列  56
5.3.2 对CSV执行SQL查询  60
5.4 处理HTML/XML 和JSON  61
5.5 CSV的常见清洗操作  65
5.5.1 列的提取和重排序  65
5.5.2 行过滤  66
5.5.3 列合并  67
5.5.4 多个CSV文件的合并  70
5.6 延伸阅读  73

…….


资源截图:

image.png

资源下载资源下载价格6立即支付    升级VIP后免费
本站严重申明:本站创建于香港,主要分享电脑技术以及服务于精简系统爱好者,本站遵守香港的法律法规,并且受到香港法律的保护;本站收集的资源仅供内部学习研究软件设计思想和原理使用,学习研究后请自觉删除,请勿传播,因未及时删除所造成的任何后果责任自负; 如果用于其他用途,请购买正版支持作者,谢谢!若您认为本站发布的内容若侵犯到您的权益,请联系站长QQ:304906607 进行删除处理。 本站资源大多存储在云盘,如发现链接失效,请联系我们,我们会第一时间更新。如要升级VIP会员,请联系QQ:304906607 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!资源仅供学习参考请勿商用或其它非法用途,否则一切后果用户自负!