设为首页收藏本站

小猪浏览器

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 16582|回复: 52

小猪浏览器-采集器部分 使用指南 (最方便最快速的采集器,所见即所得)

    [复制链接]
发表于 2010-7-15 14:45:15 | 显示全部楼层 |阅读模式
小猪浏览器包括功能比较多,这边对小猪采集器部分做个简单的使用说明。

小猪采集器的思想是所见即所得,您看到了好的文章、帖子只需简单动动鼠标既可发布到自己的网站。(请刚接触小猪的一定要注意这一点,避免走弯路)

如果您从来没用过采集器,那么恭喜你一开始就选对采集器了,我陆续用过狂人 et2等采集器,最后才找到小猪,因为市面普通的采集器有这样或者那样的缺点,而小猪的更新是有目共睹的,最近小猪作者每天做一次更新来优化,您看到这篇文章的时候小猪采集器部分已经比较完善了。

如果您用过其他采集器,那么请区别小猪采集器和其他采集器,因为小猪内置了市面大部分通用网站的规则,并自动识别大部分网站自动发布,而其他采集器或多或少需要由用户自己编写采集规则、编写繁琐的发布设置之类,之后后才能正常工作。而小猪在一定条件下3分钟内既可采集网站并发布到您自己的网站,相比其他软件至少需要半天才能采集并发布到您自己的网站是不是太简单呢?本人当初就是因为用过其他采集器导致上手后直接想去编写规则,又去寻找教程,下载软件2天才正常使用,那时候才知道原来这么简单!所以这边写个简单的说明来节约大家的时间!

好了,长话短说,一开始请到程序发布下载最新的小猪浏览器,http://bbs.webpig.org/?fromuid=7164 页面选择程序发布,目前最新的版本是2.1.2.0。解压程序到硬盘上任意目录(建议英文名的目录,我是放在E:\xiaozhu\,这个目录下)

在小猪官方网注册个账号,这样以便登录进小猪浏览器软件,这个很简单吧,小猪是免费的!
小猪登录界面.JPG

登录进去后就看到小猪浏览器了,在浏览器地址栏输入您要发帖的网址并回车,就看到自己的网站了,鼠标右键点击采集助手下的“我的网站”文件夹,选择添加当前网站,小猪会自动识别所添加网站的模板,如果自动识别出的的模板不对,可以手动选择,这样发帖网站就添加进去了。
操作界面1.JPG

这边我们还需要对发帖的用户名账号密码做个设置,否则除非您的网站允许游客也发帖,那么肯定是发不了帖子的。
2用户名设置.JPG

在小猪浏览器输入要采集的网址,并且登陆进去,不登陆可能下载不到相关的附件,就可以找自己需要采集的内容来采集发布了
采集设置.JPG

以上操作应该会对刚接触小猪的用户有所帮助,如果有不清楚的我会不断补充主贴。

如果需要看视频官方现在已经有视频教程,在线观看地址:采集助手入门教程 http://460262.146.hostcn.cn/help/webpig-02/01.htm



这边说一下小猪采集器部分的和普通采集器的关键区别:

可以采集到任意附件,并且发布到目标站附件名字不会改变(发布就类似于人工在网站上发布一个帖子,并且会自适应目标站最短发帖时间,避免因为目标站防灌水设置导致发帖失败),方便目标站用户下载附件,狂人采集器暂时下载不到相对地址的附件,et2采集器采集到的附件会重新命名,用户下载下来几个文件不解压就不知道什么内容,并且目前大部分采集器采集到的附件是利用ftp上传到目标网站,这样导致删除采集到的带附件帖子后,附件没有自动删除,对于附件很多的源站采集越多麻烦越多,当然你不删除一般也不会有问题,但是看到太垃圾的帖子恐怕大部分站长都会去删掉的吧,删除掉还得人工到ftp去删除避免垃圾,还有就是如果不是发布到自己的网站,估计没人肯告诉你ftp权限,这样你采集到有附件图片的帖子发布不到其他人的网站,嘿嘿,小猪就没有这些问题,我就是因为这点才研究起小猪!

小猪采集器还就个特点就是自动采集发布,可以自动生成相应的任务循环采集更新,狂人需要人工干预多,et2从采集规则到配置可以发布,即使熟手至少也需要以小时计算虽然et2设置好之后就可以自动采集发布,但相比较而言,小猪的自动化程度就太高了,鼠标点击几下就可以生成一个采集发布任务。

小猪采集器内置规则已经去除掉大部分站点的防复制码,并且可以统一过滤掉比较小的图片表情之类,这样自定义采集规则采集到的小图片会自动忽略,人性化程度高,其他采集器需要人工查找源码并且设置规则去除不需要的内容。

小猪采集器是免费的,规则内置,狂人采集器180元以上,规则定制要一定费用,et2免费使用,但是规则定制要一定费用,接口定制也要一定费用(接口不是普通人能搞定的)。

小结:就以上几个关键区别来看,选择哪款采集器是很简单的事情了。


小猪采集器相关的解释:

1.小猪采集器内置采集规则暂时还不是万能的,不过会并且不断更新添加网站模板,发布兼容性列表看这边
http://bbs.webpig.org/viewthread ... hlight=%D6%A7%B3%D6

2.如果在采集兼容列表的网站模板,而不能正确采集到的,一般是源站做过改动,比如加插件之类导致内置规则识别不了,这种情况可以到“采集脚本”自定义采集规则,理论上可以采集到浏览器看到的任意网站所有内容,契合所见即所得(附件下载不到一般是没登陆或者没相关权限下载)

3.如果自己的网站在兼容列表而发布不了内容,可能是发布站做过相关的改动比如加插件,导致发布规则不能正常工作,可以在官网发帖,官方会在一定时间内决定是否增加兼容列表

4.由于目前网站个性化比较多,内置规则不可能面面俱到,采集到的内容会包含不需要的内容,比如需要威望,源站的个性化表情等,这些暂时需要自定义规则来消除,后面可能会出辅助采集规则(自定义部分规则与内置规则协同工作),简化规则编写,方便客户采集


小猪采集器操作技巧:
小猪采集器是基于ie内核,采集发帖的时候 如果在ie浏览器里面会切换不同的发帖用户名,所以要管理自己网站最好用非ie内核的浏览器来管理自己网站,这样不会互相干扰!
采集可以按 ctrl+q 终止任务。
更新任务需要到“及时更新任务管理”里面停止任务才能关闭任务。

发表于 2010-7-15 20:19:57 | 显示全部楼层

发表于 2010-7-16 07:42:37 | 显示全部楼层

发表于 2010-7-20 10:11:52 | 显示全部楼层
 楼主| 发表于 2010-8-19 13:14:39 | 显示全部楼层
呵呵,我们是努力做个兼容性好的工具出来,当然路还很长。有些模板还需要继续加入,如果客户发现不支持的,如果是大众网站程序、blog之类的发布平台,可以到论坛发帖要求支持!
 楼主| 发表于 2010-8-19 13:14:39 | 显示全部楼层
呵呵,我们是努力做个兼容性好的工具出来,当然路还很长。有些模板还需要继续加入,如果客户发现不支持的,如果是大众网站程序、blog之类的发布平台,可以到论坛发帖要求支持!
发表于 2010-8-23 22:37:37 | 显示全部楼层
发表于 2010-9-1 17:24:54 | 显示全部楼层
发表于 2010-9-13 15:54:31 | 显示全部楼层
发表于 2010-9-16 04:48:25 | 显示全部楼层
回复 13# ybpg1968


    我和楼主老大的经历简直是一模一样,我也是在狂人、et2下摸索、使用了好一段时间才转到小猪来的,几乎没用花费学习的时间,看了一遍视频教程便可以上手了,小猪的智能和高效的确让我钦佩,期待小猪更多更好的功能!
发表于 2010-9-23 13:07:30 | 显示全部楼层
发表于 2010-9-30 16:44:09 | 显示全部楼层
发表于 2010-10-5 15:55:06 | 显示全部楼层
发表于 2010-10-5 23:52:20 | 显示全部楼层
发表于 2010-10-9 02:38:00 | 显示全部楼层
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小猪内置发布规则列表
通用论坛通用CMS(后台首页添加)Blog(后台首页添加)大型网站博客/免费博客大型网站论坛/免费论坛百科小说
Discuz 6.0/6.1/7.0/7.1/7.2
Discuz NT 3.0/3.1/3.2
DiscuzX 1.0/1.5/2.0/2.5/3.0
Phpwind 6.32/7.0/7.32/7.5/8.0/8.3/8.5/9.0
Dvbbs 8.0/8.2/8.3
Vtbbs
6kbbs
dreamsun
leadbbs
dedecms 5.5/5.6/5.7
phpcms2007
supersite 7.5
uchome 2.0
powereasy6.8
phome6.0
新云CMS
phpcms v9
diypage
.....
blogcn
boblog2.11
pbblog 2.0/3.0
wordpress 2.83/2.84/2.92/3.0/3.1
zblog
...
sina博客
baidu空间
sohu博客
163博客
blogbus
hexun
cnfol
blogcn
....
5d6d
uueasy
baidu tieba
17173
qq
taobao bangpai
chinaz
A5
discuz
同城
落伍
...
hdwiki
tipask
jieqi

QQ|小黑屋|手机版|Archiver|网络小猪论坛 ( 贵公网安备 52010302000032号  

贵公网安备 52010302000032号

GMT+8, 2018-1-17 18:34 , Processed in 0.392828 second(s), 27 queries .

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表