【NLP】文本分类

feature_importance = best_model.feature_log_prob_[0, :] - best_model.feature_log_prob_[1, :]
feature_sort = feature_importance.argsort()

feature_names = count_vectorizer.get_feature_names()
for idx in feature_sort[:10]:
    print(feature_names[idx], feature_importance[idx])

for idx in feature_sort[-10:]:
    print(feature_names[idx], feature_importance[idx])

两类特征分别打印出来是：

非常感谢 -3.9134764940561295 大赞 -3.856318080216181 超好 -3.7956934583997466 稻香村 -3.7956934583997466 超快 -3.753133843980951 又快又好 -3.7311549372621755 很赞 -3.7311549372621755 给力 -3.662162065775224 赞赞赞 -3.662162065775224 棒棒 -3.5880540936215013

将近 2.984228449072506 差劲 3.1040296488851267 显示 3.1200299902315676 再也不会 3.151282533735672 投诉 3.151282533735672 凉皮 3.1815878832310007 迟到 3.1815878832310007 告诉 3.2253905058893944 米线 3.358921898513916 差评 4.5678822443508915

可以看出，特征还是很显著的。

您的支持将鼓励我继续创作！

【NLP】文本分类

【NLP】文本分类

方法

方法的选择

特征重要性

Recommend

Five Essentials Before Your First Cryptocurrency Purchase

How to Save Custom Data in Image Files

Facebook Mariana Trench Helps Developers to Find Vulnerabilities in Android and...

网络战——没有硝烟的战争

Vedantu成为印度今年第28家新晋独角兽

Smart Algo prevents equity loss with new unique crypto traders Insurance Fund

Oyo已提交IPO申请，计划募资11.6亿美元

动点汽车：沃尔沃新标识、蔚来ET7风阻最佳、极星即将上市

重磅：前 Apple 设计总监 Jony Ive 宣布与法拉利建立多年合作伙伴关系

Amazon Announces QuickSight Q General Availability

About Joyk