diff --git a/SUMMARY.md b/SUMMARY.md index 10e52c3..360c229 100644 --- a/SUMMARY.md +++ b/SUMMARY.md @@ -21,7 +21,7 @@ * [4.2 SparkGraphX计算生成最短路径](/chapter4/4.2SparkGraphX计算生成最短路径.md) * [第五章 Spark机器学习实战](/chapter5/5Spark机器学习实战简介.md) * [5.1 Spark机器学习入门](/chapter5/5.1Spark机器学习入门.md) - * [5.2 Spark机器学习实战](/chapter5/5.2Spark机器学习实战.md) + * [5.2 Spark机器学习 - 坦克卫星图片识别分类](/chapter5/5.2Spark机器学习实战.md) diff --git a/chapter5/5.1Spark机器学习入门.md b/chapter5/5.1Spark机器学习入门.md index a736eca..26c6b94 100644 --- a/chapter5/5.1Spark机器学习入门.md +++ b/chapter5/5.1Spark机器学习入门.md @@ -12,7 +12,10 @@ 可以看出机器学习强调三个关键词:算法、经验、性能,其处理过程如下图所示。 -![](https://www.educoder.net/api/attachments/462336) + +

+ +

上图表明机器学习是数据通过算法构建出模型并对模型进行评估,评估的性能如果达到要求就拿这个模型来测试其他的数据,如果达不到要求就要调整算法来重新建立模型,再次进行评估,如此循环往复,最终获得满意的经验来处理其他的数据。 @@ -26,15 +29,22 @@ 是无监督学习,无监督学习不指定目标值或预先无法知道目标值,它可以把相似或相近的数据划分到相同的组里,聚类就是解决这一类问题的方法之一。 -![](https://www.educoder.net/api/attachments/462347) +

+ +

### 5.1.3 如何选择合适的算法 当我们接到一个数据分析或挖掘的任务或需求时,如果希望用机器学习来处理,首先 要做的是根据任务或需求选择合适算法,选择算法一般步骤如下图所示: -![](https://www.educoder.net/api/attachments/462355) + + +

+ +

+ diff --git a/chapter5/5.2Spark机器学习实战.md b/chapter5/5.2Spark机器学习 - 坦克卫星图片识别分类.md similarity index 98% rename from chapter5/5.2Spark机器学习实战.md rename to chapter5/5.2Spark机器学习 - 坦克卫星图片识别分类.md index 2ec12c2..94582a7 100644 --- a/chapter5/5.2Spark机器学习实战.md +++ b/chapter5/5.2Spark机器学习 - 坦克卫星图片识别分类.md @@ -1,7 +1,6 @@ -## 5.1 Spark机器学习实战 +## 5.1 Spark机器学习 - 坦克卫星图片识别分类 -坦克图片识别分类 ### 5.1.1 数据集介绍