Skip to content

Commit

Permalink
📦机器学习
Browse files Browse the repository at this point in the history
- 修改了特征处理部分的描述,使 one-hot 编码的解释更加准确
- 更新了聚类算法部分的标题,将"分级聚类"改为"层次聚类"
  • Loading branch information
0xcaffebabe committed Dec 17, 2024
1 parent 61d91e6 commit 61b90f6
Show file tree
Hide file tree
Showing 2 changed files with 2 additions and 2 deletions.
2 changes: 1 addition & 1 deletion doc/数据技术/监督学习.md
Original file line number Diff line number Diff line change
Expand Up @@ -200,7 +200,7 @@ $$
H(p_1^{root}-\left(w^{left}H\left(p_1^{left}\right)+w^{right}H\left(p_1^{right}\right)\right)
$$

对于取指不止两个的特征,可以采取 one-hot 编码,如果一个特征有 k 个取指,那就可以把它转换成 k 个只能取0 1 的特征
对于取值不止两个的特征,可以采取 one-hot 编码,如果一个特征有 k 个取值,那就可以把它转换成 k 个只能取0 1 的特征

对于拥有连续值的特征,则需要多次尝试不同的取值,使得以该值划分的两类集合获得的信息增益最高

Expand Down
2 changes: 1 addition & 1 deletion doc/数据技术/非监督学习.md
Original file line number Diff line number Diff line change
Expand Up @@ -50,7 +50,7 @@ $$
3. 分布聚类:假设数据符合某种概率分布,例如高斯混合模型(Gaussian Mixture Models,GMM)。试图拟合数据的分布,以确定聚类
4. 密度聚类:考虑数据点的密度,将高密度区域视为一个聚类簇,并通过密度低的区域将聚类簇分隔开,比如DBSCAN算法

### 分级聚类
### 层次聚类

不断将最为相似的群组两两合并

Expand Down

0 comments on commit 61b90f6

Please sign in to comment.