擅长:python、mysql、java
<p><code>TfidfVectorizer()</code>对象尚未安装数据。在</p>
<p>在建造管道之前,请执行以下操作-</p>
<pre><code>vec = TfidfVectorizer()
vec.fit(data['free text column'])
pipeline = Pipeline([
('features', Features()),
('union', FeatureUnion(
transformer_list=[
('title', Pipeline([
('selector', ItemSelector(key='title')),
('tfidf', vec),
])),
... other features
</code></pre>
<p>如果您想再次调整数据以用于测试目的,这有助于。。。因为对于测试数据,管道将自动对<code>TfidfVectorizer</code>使用transform()函数,而不是fit()函数,这是在构造管道之前必须显式执行的</p>