对于这些变量的文档分类,我应该使用什么分类算法?我试图对页面进行分类,特别是搜索页面,在文档中基于单词包、页面布局、是否包含表格、是否有粗体标题等。在此前提下,我为每个文档创建了一个pandas.DataFrame,如下所示: page ...2024-05-15 已阅读: n次