预测喜欢的电影
小明的观影记录
| 序号 | 片名 |
|---|---|
| 1 | 疯狂动物城 |
| 2 | 美国队长2 |
| 3 | 龙珠Z:复活的弗利萨 |
| 4 | 速度与激情8 |
| 5 | 战狼2 |
| 6 | 赛尔号大电影6:圣者无敌 |
近期上映的电影列表
星际特工、叶问、疯狂动物城、美国队长2、龙珠Z:复活的弗利萨、速度与激情8、战狼2、赛尔号大电影6:圣者无敌
分类
按类型分:
| 类型 | 片名 | 是否都看过或都没看过 |
|---|---|---|
| 动作 | 速度与激情8、战狼2、叶问 | 否 |
| 科幻 | 星际特工、美国队长2 | 否 |
| 动漫 | 疯狂动物城、龙珠Z:复活的弗利萨、赛尔号大电影6:圣者无敌 | 是 |
按票房分:
| 票房 | 片名 | 是否都看过或都没看过 |
|---|---|---|
| 高(>2亿美金) | 速度与激情8、战狼2 | 是 |
| 低 | 叶问 | 是 |
按产地分:
| 产地 | 片名 | 是否都看过或都没看过 |
|---|---|---|
| 美国 | 美国队长2 | 是 |
| 法国 | 星际特工 | 是 |
如此安排分类条件是否合理?如何使用算法来优化分类?
熵
熵,热力学中表征物质状态的参量之一,用符号S表示,其物理意义是体系混乱程度的度量。 信息熵是一个系统混乱程度的度量,信息熵越大,系统越混乱;信息熵越小,系统越有序。如八宝粥和小米粥。
计算公式:假如一个随机变量X的取值为$X={x_1,x_2,…,x_n}$,每一种取到的概率分别是${p_1,p_2,…,p_n}$,那么X的熵定义(单位:bit)为:$H(X)=-\sum_{i=1}^{n}p_ilog_2p_i$。