使用python创建dechtech网站

2024-10-03 11:12:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在寻找一种从这个网站上搜集数据的方法:http://www.dectech.org/football/index.php最好使用Python。我似乎遇到的困难是,数据没有硬编码到网站的HTML中,似乎被包装在一个叫做mochi kit(http://mochi.github.com/mochikit/)的东西中。你知道吗

我做了一些研究,似乎像BeautifulSoup这样的东西可能对我有用,但我认为我可能没有正确地使用它。我也尝试过使用urllib来解析网站,但没有任何乐趣。你知道吗

我的最终目标是有一个监控dectech网站的程序,当发布新的预测时,使用Betfair API自动挑选价值投注。你知道吗


Tags: 数据方法orggithubhttp编码index网站
1条回答
网友
1楼 · 发布于 2024-10-03 11:12:27

看起来javascript正在从这个url加载数据

http://www.dectech.org/cgi-bin/new_site/GetUpcomingGames.pl?divID=0

它回来了

{
   "games" : [
      {
         "apct" : 0.377838,
         "dpct" : 0.263445,
         "expGoalDiff" : -0.04086,
         "awayID" : "6",
         "homeID" : "17",
         "date" : "20/10/2012",
         "away" : "Chelsea",
         "home" : "Tottenham",
         "hpct" : 0.358717
      },
      {
         "apct" : 0.237829,
         "dpct" : 0.250146,
         "expGoalDiff" : 0.594234,
         "awayID" : "1",
         "homeID" : "8",
         "date" : "20/10/2012",
         "away" : "Aston Villa",
         "home" : "Fulham",
         "hpct" : 0.512025
      }, /* shortened for brevity */

所以你非常幸运,你不需要刮取数据(这是很棘手的),你只需要检索和解析它,就像他们用mochi做的那样。你知道吗

Python的simplejson模块将能够解析它。。。你知道吗

相关问题 更多 >