沟通节点.js使用Python和获取数据延迟

exports.crawlData = ()=>{ var dataArr = []; var temp; var py = spawn('python', ['dataCrawler.py']); var data = [totalUrl, gubun]; var dataFromPy = null; py.stdout.on('data', function(result){ var dataArr = encoding.convert(result, 'utf-8') dataArr = JSON.parse(encoding.convert(result, 'utf-8')); py.stdout.on('end', function(){ temp = dataArr }); }); py.stdin.write(JSON.stringify(data)); py.stdin.end(); return temp; }

def crawling(url, gubun, page_count): idx = 0 result = [] jsonData = {} for i in range(1, page_count + 1): .... crawling code .... return result def main(): lines = sys.stdin.readlines() paraFromServer = json.loads(lines[0]) url = paraFromServer[0] gubun = paraFromServer[1] result = crawling(url, gubun, page_count) print(result) main()

2条回答

网友

1楼 · 编辑于 2024-10-02 10:23:10

或者，如果不需要考虑并行运行，可以使用spawnSync

exports.crawlData = () => {
    const result = spawnSync('python', ['dataCrawler.py'], {
      input: JSON.stringify([totalUrl, gubun])
    });

    return JSON.parse(encoding.convert(result, 'utf-8'));
}

网友

2楼 · 编辑于 2024-10-02 10:23:10

你没有解释javascript的异步特性。您需要做的是，将回调方法传递给crawlData方法，一旦完成了刮取，就会调用该方法。你知道吗

exports.crawlData = (cb)=>{
 ....
 py.stdout.on('data', function(result){
    var dataArr = encoding.convert(result, 'utf-8')
    dataArr = JSON.parse(encoding.convert(result, 'utf-8'));

    py.stdout.on('end', function(){
        cb(dataArr); // ideally the pattern is cb(error, data)
    });

 });

...

所以server.js变成：

var crawler = require("./crawling")
crawler.crawlData((data) => { 
    console.log(data); 
    // Do whatever you want to do with the data.
});

回调可能导致Callback hell。尝试探索promises或async/await。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章