📦机器学习

- 修改了特征处理部分的描述，使 one-hot 编码的解释更加准确 - 更新了聚类算法部分的标题，将"分级聚类"改为"层次聚类"
0xcaffebabe · Dec 17, 2024 · 61b90f6 · 61b90f6
1 parent 61d91e6
commit 61b90f6
Show file tree

Hide file tree

Showing 2 changed files with 2 additions and 2 deletions.
diff --git a/doc/数据技术/监督学习.md b/doc/数据技术/监督学习.md
@@ -200,7 +200,7 @@ $$
 H(p_1^{root}-\left(w^{left}H\left(p_1^{left}\right)+w^{right}H\left(p_1^{right}\right)\right)
 $$
 
-对于取指不止两个的特征，可以采取 one-hot 编码，如果一个特征有 k 个取指，那就可以把它转换成 k 个只能取0 1 的特征
+对于取值不止两个的特征，可以采取 one-hot 编码，如果一个特征有 k 个取值，那就可以把它转换成 k 个只能取0 1 的特征
 
 对于拥有连续值的特征，则需要多次尝试不同的取值，使得以该值划分的两类集合获得的信息增益最高
 

diff --git a/doc/数据技术/非监督学习.md b/doc/数据技术/非监督学习.md
@@ -50,7 +50,7 @@ $$
 3. 分布聚类：假设数据符合某种概率分布，例如高斯混合模型（Gaussian Mixture Models，GMM）。试图拟合数据的分布，以确定聚类
 4. 密度聚类：考虑数据点的密度，将高密度区域视为一个聚类簇，并通过密度低的区域将聚类簇分隔开，比如DBSCAN算法
 
-### 分级聚类
+### 层次聚类
 
 不断将最为相似的群组两两合并