我用beauthoulsoup收集了一些数据,并保存为.txt文件。数据来自电影评论IMDB.com网站 我发现了一个很好的单词计数python代码,所以我可以制作一个单词频率excel表格。然而,我不能仅仅用频率表来绘制图形。在
我想用UCINET绘制语义网络图(节点大小应基于中间性中心度)。
我的问题是如何将文本文件转换成邻接矩阵数据来绘制UCINET图形。 像这样http://www.umasocialmedia.com/socialnetworks/wp-content/uploads/2012/09/senatorsxsenators1.png 我想用评论家用的词画网络图。在
(如果两个单词出现在同一个句子中,当它们行和列行匹配时,计算出现的频率)
或者。你能告诉我如何用Python代码绘制网络图吗??
制作一个2D 20x20数组,遍历每个输入字符串,然后使用该字符串更新矩阵:
一个类似于
update_matrix
的函数可能很有用,其中matrix
是邻接矩阵,mapping
是单词到邻接矩阵中索引的映射,string
是示例回顾。在你需要根据你的需要修改这个。输入可能有句点或其他噪声字符,这些字符需要去除。在
相关问题 更多 >
编程相关推荐