提问
 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,极速登录

除了用python或第三方网页采集工具先采集到数据库外,FR自身能完成网页数据采集吗?

alu  浪迹天涯(Lv4)
发表于 2018-10-11 17:22 | 显示全部楼层 |取消关注该作者的回复
10F豆

我想在FR中使用http://publicholiday.co.nz/nz-public-holidays-2016.html上的假期数据,除了用python或第三方网页采集工具先采集到数据库外,FR自身能完成网页数据采集吗?

截图201810111722095555.png

最佳答案

查看完整内容

我通过htmlfinder函数弄过,也使用文件数据集弄过, 但是 如果都使用python抓取了。为啥不直接用python入库呢。。。。
此帖共有 10 位番薯登录后查看
回复

使用道具 举报

flyingsnake 社区微信达人实名认证 番薯互助团队 文档共创团队 互助叫兽、助理编辑
发表于 2018-10-11 17:22 | 显示全部楼层 |取消关注该作者的回复
alu 发表于 2018-10-11 17:26
http://bbs.fanruan.com/forum.php?mod=viewthread&tid=24576
有朋友说“可以通过程度读网页数据,转为 ...

我通过htmlfinder函数弄过,也使用文件数据集弄过,
但是
如果都使用python抓取了。为啥不直接用python入库呢。。。。
  • 评论

回复

使用道具 举报

flyingsnake 社区微信达人实名认证 番薯互助团队 文档共创团队 互助叫兽、助理编辑
发表于 2018-10-11 17:23 | 显示全部楼层 |取消关注该作者的回复
可以使用html的分析,用查找特征字符的方式实现一些简单功能。但耗时耗力,不推荐。
  • 评论

回复

使用道具 举报

flyingsnake 社区微信达人实名认证 番薯互助团队 文档共创团队 互助叫兽、助理编辑
发表于 2018-10-11 17:26 | 显示全部楼层 |取消关注该作者的回复
Html页面元素查找函数。第一个参数为要查找的html页面的地址,第二个参数为查询的dom标记。HtmlFinder("http://www.baidu.com", "a[href]")可以查找到baidu首页的所有超级链接内容。其他语法规则可以参看这里:https://jsoup.org/cookbook/extracting-data/selector-syntax.
  • 评论

回复

使用道具 举报

alu  浪迹天涯(Lv4)
发表于 2018-10-11 17:26 | 显示全部楼层 |取消关注该作者的回复
flyingsnake 发表于 2018-10-11 17:23
可以使用html的分析,用查找特征字符的方式实现一些简单功能。但耗时耗力,不推荐。

http://bbs.fanruan.com/forum.php?mod=viewthread&tid=24576
有朋友说“可以通过程度读网页数据,转为程序数据集”
这个如果用python的话,具体怎么办呢?
  • 评论

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

Copyright © 帆软|联系帆软| 联系管理员@兔子酱|免责声明|手机版|帆软社区 ( 苏ICP备14031611号-3 )

GMT+8, 2018-10-16 09:49 , Processed in 0.294554 second(s), 97 queries , Gzip On.

返回顶部 返回列表