资源名称:机器学习系统设计 完整版 PDF

第1章 Python机器学习入门  1
1.1  梦之队:机器学习与Python  1
1.2  这本书将教给你什么(以及不会教什么)  2
1.3  遇到困难的时候怎么办  3
1.4  开始  4
1.4.1  NumPy、SciPy和Matplotlib简介  4
1.4.2  安装Python  5
1.4.3  使用NumPy和SciPy智能高效地处理数据  5
1.4.4  学习NumPy  5
1.4.5  学习SciPy  9
1.5  我们第一个(极小的)机器学习应用  10
1.5.1  读取数据  10
1.5.2  预处理和清洗数据  11
1.5.3  选择正确的模型和学习算法  12
1.6  小结  20
第2章 如何对真实样本分类  22
2.1  Iris数据集  22
2.1.1  第一步是可视化  23
2.1.2  构建第一个分类模型  24
2.2  构建更复杂的分类器  28
2.3  更复杂的数据集和更复杂的分类器  29
2.3.1  从Seeds数据集中学习  29
2.3.2  特征和特征工程  30
2.3.3  最邻近分类  30
2.4  二分类和多分类  33
2.5  小结  34
第3章 聚类:寻找相关的帖子  35
3.1  评估帖子的关联性  35
3.1.1  不应该怎样  36
3.1.2  应该怎样  36
3.2  预处理:用相近的公共词语个数来衡量相似性  37
3.2.1  将原始文本转化为词袋  37
3.2.2  统计词语  38
3.2.3  词语频次向量的归一化  40
3.2.4  删除不重要的词语  41
3.2.5  词干处理  42
3.2.6  停用词兴奋剂  44
3.2.7  我们的成果和目标  45
3.3  聚类  46
3.3.1  K均值  46
3.3.2  让测试数据评估我们的想法  49
3.3.3  对帖子聚类  50
3.4  解决我们最初的难题  51
3.5  调整参数  54
3.6  小结  54
第4章 主题模型  55
4.1  潜在狄利克雷分配(LDA)  55
4.2  在主题空间比较相似度  59
4.3  选择主题个数  64
4.4  小结  65
第5章 分类:检测劣质答案  67
5.1  路线图概述  67
5.2  学习如何区分出优秀的答案  68
5.2.1  调整样本  68
5.2.2  调整分类器  68
5.3  获取数据  68
5.3.1  将数据消减到可处理的程度  69
5.3.2  对属性进行预选择和处理  70
5.3.3  定义什么是优质答案  71
5.4  创建第一个分类器  71
5.4.1  从k邻近(kNN)算法开始  71
5.4.2  特征工程  72
5.4.3  训练分类器  73
5.4.4  评估分类器的性能  74
5.4.5  设计更多的特征  74
5.5  决定怎样提升效果  77
5.5.1  偏差?方差及其折中  77


资源截图:

image.png

资源下载资源下载价格6立即支付    升级VIP后免费
本站严重申明:本站创建于香港,主要分享电脑技术以及服务于精简系统爱好者,本站遵守香港的法律法规,并且受到香港法律的保护;本站收集的资源仅供内部学习研究软件设计思想和原理使用,学习研究后请自觉删除,请勿传播,因未及时删除所造成的任何后果责任自负; 如果用于其他用途,请购买正版支持作者,谢谢!若您认为本站发布的内容若侵犯到您的权益,请联系站长QQ:304906607 进行删除处理。 本站资源大多存储在云盘,如发现链接失效,请联系我们,我们会第一时间更新。如要升级VIP会员,请联系QQ:304906607 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!资源仅供学习参考请勿商用或其它非法用途,否则一切后果用户自负!