我有很多千兆字节的Facebook/Twitter/RSS数据。在
我用它来追踪一个普通人群的甲状旁腺功能亢进的演变,从一个人被诊断出患有某种疾病,通过他们一直服用的药物,治疗和最终结果。在
我是NLTK的新手,我确实有很好的Python/SQL经验。在
我的所有数据中都有parathyroid
;但是,正如下面的(twitter数据示例)所示,它在语言上非常糟糕:
omg i think my parathyroid is screwed up!!!
Have been stuck at parathyroid hormone. STOP GETTING ON TWITTER JASMINE.
Cryopreservation of Parathyroid Tissue after Parathyroid Surgery for Renal Hyperparathyroidism
The Parathyroid as a Target for Radiation Damage
it's for the parathyroid hormone la
所有这些数据都存储在数据库中。我们也有海报、帖子ID、帖子文本等字段
我想知道是否有人能为我指出正确的方向:
目前没有回答
相关问题 更多 >
编程相关推荐