如何计算信息增益？

2024-09-28 01:26:29 发布

男 | 程序猿一只，喜欢编程写python代码。

我想计算我的数据集的每个单词的information gain，但我只在我的研究和应用中得出这个解。Mutual information gain。你知道吗

dataset = pd.read_csv("labelled_text.txt", delimiter="\t")

vectorizer = TfidfVectorizer(stop_words = 'english')
X = vectorizer.fit_transform(dataset.Sentence)
Y = dataset['Class']

res_mi = dict(zip(vectorizer.get_feature_names(), mutual_info_classif(X, Y, discrete_features=True)))

它们在sklearn中的计算是一样的吗？你知道吗

Tags： csv 数据 text txt read information 单词 dataset

0条回答

目前没有回答

编程相关推荐

java如何使用Flyway回滚迁移？
sql试图在java中连接两个表，但我遇到了一个错误
java使用commons apache API复制文件内容
java无法解析模块
原因：java。lang.IllegalArgumentException:org。冬眠QueryException:无法解析属性：
java使用TNT4J，TrackingLogger统计数据仅显示该类的统计数据，如果我想要应用程序范围的统计数据呢？
java项目Euler#19，答案只有在1900年开始时才正确？
java显示标签上的选定值列表
java在局部变量中缓存属性吗？
java preparedStatement。setString（1，“null”）被解释为null而不是字符串（在preparedStatement.addBatch（）之后）

热门问题

为什么在使用strptime时会出现未进行转换的数据错误？
10 个回答
为什么在使用strptim时会出现这个datetime日期错误
8 个回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
4 个回答
为什么在使用sum（）函数时会发生“int”对象不可调用的错误？
3 个回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”？
6 个回答
为什么在使用tabla时会得到一个空的数据帧？
1 个回答
为什么在使用tensorboard时需要add_graph（）的第二个参数？
3 个回答
为什么在使用TensorFlow Lite转换YOLOv4时，推断时间/大小没有改进？有什么可能的改进吗？
4 个回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏？
3 个回答
为什么在使用tensorflow时会收到警告/错误（使用函数API，但未实现错误）
9 个回答
为什么在使用tetpyclient发出POST请求时出现403错误？
5 个回答
为什么在使用TextBlob时会出现HTTP错误？
1 个回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature？
11 个回答
为什么在使用timedelta格式化之后，我在python中的日期是错误的？
9 个回答
为什么在使用timeit或exec函数时，函数中的变量不会在提供的全局命名空间中搜索？
1 个回答
为什么在使用tkinter时不能使用复选框？
1 个回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID？
8 个回答
为什么在使用TQM时，在调整图像大小时，处理时间会有很大的差异？
8 个回答
为什么在使用Tweepy下载用户时间线时收到错误消息
8 个回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000？
7 个回答

如何计算信息增益？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何计算信息增益？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >