标签归档:织梦采集侠

关于织梦采集侠破解版,有些问题不吐不快

首先声明,采集侠的破解版是用不了的,就算现在能用,可能过一会就用不了了,我们也进行了采样统计,市面上流传的破解版基本都是加入后门,骗人安装的,网站做好了,也是给他人做嫁衣,特别是一些技术薄弱的站长,遇到一点问题都不懂解决,更不要用什么破解版了。

采集侠从10年发布至今,已经四年多了,基本用dedecms搭建网站有采集需求的,大多都会选择采集侠进行采集,虽然采集侠功能简单,但基本能满足绝大多数站长的采集需求,也就因为采集侠简单,站长上手更加容易,对比起来火车头那一大堆菜单,是让人望而却步的。
继续阅读

采集侠V2.7正式版发布,加入规则导入导出等新功能

姗姗来迟的采集侠V2.7正式版终于发布了,商业版用户依旧可以通过后台在线更新升级至最新版。新增的功能不多,仅加入了规则导入导出、自动文章自定义属性、标题随机关键词和一项新的采集方式,更加快速简便的采集内容。主要是对老版本存在的一些问题,进行改进和修复,使插件越趋完善。

继续阅读

织梦采集侠V2.6版补丁发布,修复V2.6版若干问题

  该补丁适用于

  采集侠V2.6版本发布后,2012年2月12日之前(不含2月12日),从采集侠官方网站上下载或者从2.5版本升级上来的用户。
  2012年2月12日后从官方网站上下载安装或者由2.5版升级上来的用户,已修复存在的问题,无须使用该补丁。
  该补丁修复V2.6版本发布后发现的若干问题,如可能导致采集内容乱码等。

下载地址:CaiJiXia_V2.6_Patch_1.zip

  使用方法:

  补丁依旧区分gbk或utf-8版本,根据您的CMS编码情况使用不同的补丁进行覆盖
  dede
  Plugins
  均为补丁文件夹,dede为织梦默认后台文件夹,如您的默认后台dede文件夹更名,请修改补丁文件夹dede为您的后台文件夹名称。
  用FTP上传覆盖 dede和Plugins两文件即可

  补丁使用如有不明白的地方可联系采集侠客服QQ:79702151,寻求帮助!

采集侠 V2.6正式版发布,用户体验、搜索优化功能再度提升

  这个版本似乎发布的有些迟,在此感谢广大用户的耐心等待,再迟也是发布了,商业版用户依旧可以升级到最新。该版本更新完善的功能不多,但这次更新对于采集侠的用户体验,以及搜索优化功能有较大的提升,开放更多自定义设置,优化程序性能等。

  采集侠 V2.6正式版更新说明:

  [√]加入图片下载设置,可设置为下载至本地、远程链接、过滤图片
  [√]加入采集目标页keywords、description设置,可自由选择是否采集目标页或是插件提取
  [√]加入每个栏目每小时采集(审核)上限设置
  [√]加入百度地图、谷歌地图的自动生成,利于搜索引擎优化
  [√]加入选中单个栏目采集功能
  [√]加入默认作者和文章来源设置
  [√]加入是否采集TAG

采集侠官方网站:http://www.caijixia.net
采集侠V2.5版下载地址:http://www.caijixia.net/index.php?action=down
咨询购买:79702151

  采集侠v2.6,有三款不同的版本,免费版,高级版及专业版。

  免费版:每个栏目可添加1个关键词进行采集,高级设置、伪原创、搜索优化功能不可用,无远程触发定时定量采集更新服务,无技术支持。

  高级版(150元):支持1个域名绑定,每个栏目可添加20个关键词,无使用期限,高级设置、伪原创、搜索优化功能可用,免费升级为最新版本,提供远程触发定时定量采集更新服务,有技术支持。

  专业版(200元):支持3个域名绑定(需要多域名支持可联系官方),栏目无关键词上限限制,无使用期限,无使用功能限制,免费升级为最新版本,提供远程触发定时定量采集更新服务,有技术支持。

  商业版本插件收费便宜,比起动辄花费数千元购买的站群管理系统来说我们更为体贴,在使用效果我们绝对不会逊色于同类软件。 而且采集侠不仅仅是一款采集插件,更是一款织梦必备伪原创及搜索优化插件!

  我们的承诺:一样的产品我们比质量;一样的质量我们比价格;一样的价格我们比售后服务;一样的售后服务我们比信誉!

  除免费版本外,高级版和专业版均有技术支持远程辅导、QQ群支持、QQ在线解答、电话技术支持及Email技术支持等。官方技术指导,和站长们探讨行业及关键字选取方法,以便更好的帮助站长们发展。

织梦采集侠V2.5正式版发布 文章内容完美采集

      按照惯例自新版功能预览发布后,新版将会在之后的几天内正式发布,不辜负大家对我们的期望,经过这几天的周密测试,对最后几处用户体验细节方面进行完善,新版织梦采集侠V2.5版终于赶在今天和大家见面了,新版本中加入了几项新功能,修复之前版本存在的一些BUG,优化了采集流程算法、用户体验,提升插件的工作效率以及采集内容的精确度。

      在新版中我们完善了定向采集功能,开放更多自定义设置,配置简单规则即可精确采集文章标题、正文、作者、来源等信息。该改进将会代替传统编写复杂采集规则进行采集的模式,采集本来就是件很简单的事情,新版中我们将最原本,最简单的采集方式还原,让采集变得更加简单!

织梦采集侠V2.5新版功能预览:http://www.dedeadmin.com/?p=2672
织梦采集侠专题网站:http://www.caijixia.net
织梦采集侠V2.5版下载地址:http://www.caijixia.net/index.php?action=down
咨询购买:79702151

      织梦采集侠 功能介绍

      1)一键安装,全自动采集
织梦采集侠安装十分简单方便,只需一分钟,立即开始采集,而且结合简单、健壮、灵活、开源的dedecms程序,新手也能快速上手,而且我们还有专门的客服为商业客户提供技术支持。

      2)一词采集,无须编写采集规则
和传统的采集模式不同的是织梦采集侠可以根据用户设定的关键词进行泛采集,泛采集的优势在于通过采集该关键词的不同搜索结果,实现不对指定的一个或几个被采集站点进行采集,减少采集站点被搜索引擎判定为镜像站点被搜索引擎惩罚的危险。

      3)RSS采集,输入RSS地址即可采集内容
只要被采集的网站提供RSS订阅地址,即可通过RSS进行采集,只需要输入RSS地址即可方便的 采集到目标网站内容,无需编写采集规则,方便简单。

      4 )页面监控采集,简单方便采集内容
页面监控采集只需要提供监控页面地址和文字URL规则即可指定采集指定网站或栏目内容,方便简单,无需编写采集规则也能进行针对性采集。

      5)多种伪原创及优化方式,提高收录率及排名
自动标题、段落重排、高级混淆、自动内链、内容过滤、网址过滤、同义词替换、插入seo词语、关键词添加链接等多种方法手段对采集回来的文章加工处理,增强采集文章原创性,利于搜索引擎优化,提高搜索引擎收录、网站权重及关键词排名。

      6)插件全自动采集,无需人工干预
织梦采集侠按照预先设定是采集任务,根据所设定的采集方式采集网址,然后自动抓取网页内容,程序通过精确计算分析网页,丢弃掉不是文章内容页的网址,提取出优秀文章内容,最后进行伪原创,导入,生成,这一切操作程序都是全自动完成,无需人工干预。

      7)手工发布文章亦可伪原创和搜索优化处理
织梦采集侠并不仅仅是一款采集插件,更是一款织梦必备伪原创及搜索优化插件,手工发布的文章可以经过织梦采集侠的伪原创和搜索优化处理,可以对文章进行同义词替换,自动内链,随机插入关键词链接和文章内包含关键词将自动添加指定链接等功能,是一款织梦必备插件。

      8)定时定量进行采集伪原创SEO更新
插件有两个触发采集方式,一种是在页面内添加代码由用户访问触发采集更新,另外种我们为商业用户提供的远程触发采集服务,新站无有人访问即可定时定量采集更新,无需人工干预。

      9)定时定量更新待审核文稿
纵使你数据库里面有成千上万篇文章,织梦采集侠亦可根据您的需要每天在您设置的时间段内定时定量审核更新。

      织梦采集侠v2.5,有三款不同的版本,免费版,高级版及专业版。

      免费版:每个栏目可添加1个关键词进行采集,高级设置、伪原创、搜索优化功能不可用,无远程触发定时定量采集更新服务,无技术支持。

      高级版(150元):支持1个域名绑定,每个栏目可添加20个关键词,无使用期限,高级设置、伪原创、搜索优化功能可用,免费升级为最新版本,提供远程触发定时定量采集更新服务,有技术支持。

      专业版(200元):支持3个域名绑定(需要多域名支持可联系官方),栏目无关键词上限限制,无使用期限,无使用功能限制,免费升级为最新版本,提供远程触发定时定量采集更新服务,有技术支持。

      商业版本插件收费便宜,比起动辄花费数千元购买的站群管理系统来说我们更为体贴,在使用效果我们绝对不会逊色于同类软件。 而且织梦采集侠不仅仅是一款采集插件,更是一款织梦必备伪原创及搜索优化插件

      我们的承诺:一样的产品我们比质量;一样的质量我们比价格;一样的价格我们比售后服务;一样的售后服务我们比信誉!

      除免费版本外,高级版和专业版均有技术支持远程辅导、QQ群支持、QQ在线解答、电话技术支持及Email技术支持等。官方技术指导,和站长们探讨行业及关键字选取方法,以便更好的帮助站长们发展。

织梦采集侠V2.5新版发布在即,新功能预览

      感谢广大用户的耐心等待,新版织梦采集侠V2.5版的开发已经接近了尾声,新功能已经基本完成,我们正对各项功能进行测试,新版插件将在近期发布,敬请期待!商业版用户依旧可以免费升级到最新版本。

      新版插件功能亮点众多,开放更多自定义设置,采集效果越趋完美,使用更加人性化,织梦采集侠V2.5将会让您抛弃您以往繁琐的采集方式,不在需要编写复杂的采集规则,简单设置即可精确采集文章标题、正文、作者、来源等信息。

      亮点一:简单设置精确采集文章标题、正文、作者、来源等信息

      在织梦采集侠V2.2版本中我们加入了指定站点采集的功能,可以通过RSS和页面监控采集的方式指定站点进行采集,这两款新功能弥补了根据关键词采集的不足,只需要设置RSS或者监控页和文章URL规则,便能够定向采集某个站点,某个栏目里面的内容,正文部分再由织梦采集侠正文识别系统来识别提取,无需进行过多的设置便能轻松采集到需要的内容。

      V2.2版本是我们对定向采集的新探索,正文部分是依靠算法来智能提取,互联网网站众多,页面布局都各不一样,在提取某些网站正文部分时可能会出现提取到多余内容或者没能提取完全的情况。该问题都能在织梦采集侠V2.5中得到解决,简单配置标题、正文、作者、来源等规则即可精确采集,无多余内容。

      亮点二:绑定织梦采集节点,让织梦自带的采集功能也可定时自动采集伪原创SEO发布

      其实织梦采集侠V2.5可以精确采集标题、正文、作者、来源等信息后,可以放弃使用织梦自带的采集功能了,不再需要繁琐的设置。但我们考虑到已经配置好采集规则的用户,也想像织梦采集侠那样定时自动采集更新,还能对采集回来的文章进行伪原创和搜索优化处理,利于提升排名和获得流量,所以我们也在新版中加入了绑定织梦采集节点的功能,让织梦自带的采集功能也能定时自动采集更新。

      亮点三:定时审核待审核的稿件

      不少用户平日工作繁忙,有时好几天也不能上网更新文章内容,希望能自动将后台内待审核稿件,在今后的几天内每天审核发布几篇,可以保持网站每天都有新文章更新,利于搜索引擎优化。

      现在已经不再是难题,纵使你数据库里面有成千上万篇文章,织梦采集侠亦可根据您的需要每天在您设置的时间段内定时定量审核更新。

      更多细节方面的改善期待你们来发现!

      织梦采集侠V2.5虽然较之前几个版本的更新周期长了些,但始终没有辜负大家的期望,新版功能虽然强大,但为了让更多用户使用上,感谢大家一直以来对织梦管理员之家的支持,对我们开发插件的支持,插件的价格始终如一,依旧保持这个低价

【案例】利用织梦采集侠建站群为主站带来高质量流量

      年初在《每一位站长都可以使用织梦采集侠推广自己的网站》一文中探讨过非织梦CMS搭建的网站或者是织梦CMS搭建的网站,但主站又不想进行采集的网站都可以使用织梦采集侠推广自身网站,为主站带来流量的方法。主要采用织梦cms搭建站群,然后给做站群的网站安装织梦采集侠,站群网站都是用织梦采集侠进行采集,内容采集多了,有一定流量了,可以采用跳转、弹窗的形式,将流量引导到主站来。

      对于建站群采用跳转、弹窗给主站带来流量还有疑问的朋友,都可以在《每一位站长都可以使用织梦采集侠推广自己的网站》一文中得到解答,这里就不再复述,那我们就直接看案例吧!

      案例:

      我们的主站是织梦采集侠的官方网站:http://www.caijixia.net ,使用http://www.opendedecms.com 这个域名搭建了一个以目前主流CMS采集为关键词进行采集的网站,该站点上线也有好几个月了,从上线至今一直默默采集,配置好后,一直没怎么进入过后台,都是由织梦采集侠定时自动采集伪原创更新的,我们也没有对该站点进行推广,就连友情链接我们也没有交换,由于我们没有对该站点进行推广,现在日流量不多,每天也就几百IP,跳转到主站http://www.caijixia.com 的IP每天也有两三百个,对于一个销售软件的站点来说,两三百潜在用户访问浏览的确能提高不少销量,现在每日销量比没有加入弹窗之前略有提升。如果你是做淘宝客站点的,有明显的潜在用户访问量增加,我想你的淘宝客站点的成交量也会增加不少的。

      http://www.caijixia.net主站通过 http://www.opendedecms.com 弹窗每天获得200-300流量,随着采集站点的流量越多,所获得的流量也就越多,单个站点获得两三百,十个八个就两三千了,对于有不少栏目不少分类的网站来说,可以采用每个栏目建一个采集站点,都采用弹窗的形式将流量导入到主站,同主站内容相关的流量质量还是比较高的,转化率也高,而且采用织梦采集侠搭建的站群还不需要花时间进行打理。

      我们所采用的弹窗方式是以jquery实现的,有别于传统的弹窗形式,此方法不会被浏览器等软件所屏蔽,百分百展示给访客浏览,而且对搜索引擎优化又不会造成不良影响,又能给主站带来流量。

      相关代码在压缩包内

下载:弹窗代码.zip

织梦采集侠正文内容智能识别系统问题反馈,可获赠专业版授权码

      大家在使用织梦采集侠正文内容智能识别系统的时候,如果发现哪些文章URL采集不到,或者采集内容不完整的情况,可以通过跟帖向我们反馈,我们会对存在的问题进行完善。

      正文内容智能识别系统介绍:http://www.dedeadmin.com/?p=2395
      正文内容智能识别系统:http://www.caijixia.net/spider/
      正文内容智能识别系统问题反馈:http://bbs.dedeadmin.com/thread-32-1-1.html

      以下几种情况是采集不到的:
      一、纯图片站点采集不到,比如壁纸站、美女站等,不过正文里面的插图是可以采集到 的;
      二、首页、栏目页等非文章页,无实质内容的可能采集不到,建议使用文章页进行测试;
      三、分页内容采集不到,织梦采集侠可以采集到分页,但测试系统暂时还没加入分页采集测试;

      跟帖反馈得注明 测试URL和测试情况,以便我们针对存在的问题给您解答和测试修正。
      格式:
      测试URL:http://www.chinaz.com/news/2011/0326/168021.shtml
      描述存在问题….

      我们会针对反馈的问题,如果是我们自身存在的缺陷,而又对您反馈的问题进行修复,将获赠一个域名授权的专业版授权码,感谢您对我们的支持。

      给我们反馈问题的同时也是让您能更好的使用上这款高智能采集插件。

织梦采集侠正文内容智能识别系统上线,邀您体验高质量采集

      织梦采集侠其强大的根据关键词采集和指定站点采集功能,无须用户编写过多的采集规则,便可方便的采集到正文内容,源于其高度智能的正文提取算法。只有通过一套高度智能的正文提取算法,才能让用户真正的解放双手,无须采集某个网站,都得针对该网站编写复杂的采集规则。

      织梦采集侠同时还能定时自动采集更新,对采集回来的内容进行伪原创和SEO处理,利于搜索引擎优化,更好的获得排名和流量。就连手动发布的文章亦能经过插件的伪原创和SEO处理,是目前织梦站长首选的集定时自动采集、伪原创和搜索引擎优化为一体的多功能插件。

      织梦采集侠正文内容智能识别系统的正式上线,让用户无须安装织梦采集侠亦能体验到插件的正文内容识别效果,是目前首家提供在线测试正文采集效果的采集插件。我们希望能通过简单方便的测试方式,能让更多用户认识到织梦采集侠,能让插件给您带来帮助,同时也希望开放的功能测试,能让更多用户向我们反馈测试情况,比如哪些站点采集不到,哪些正文内容提取不了或者不完整有多余等,让我们共同将插件进行完善。

      通过织梦采集侠正文内容智能识别系统,您可以简单方便的测试某个站点能否采集到,采集的效果如何以及正文内容智能识别所花费的时间等,测试中存在的各种问题,可以通过跟帖回复反馈给我们,我们会对存在的问题进行修正。我们会针对反馈的问题,如果是我们自身存在的缺陷,而又对您反馈的问题进行修复,将获赠一个域名授权的专业版授权码,感谢您对我们的支持。

      正文内容智能识别系统:http://www.caijixia.com/spider/

      正文内容智能识别系统问题反馈:http://bbs.dedeadmin.com/thread-32-1-1.html

利用织梦采集侠的RSS采集功能,采集最新指定关键词新闻

      织梦采集侠强大的功能有很多,就连指定站点的采集方式都有两种,一种是根据目标站点提供的RSS进行采集,另一种是页面监控采集,匹配网站页面URL规则,然后进行采集。

      只要获取到文章页面URL,插件就能通过页面智能分析算法,将文章标题,正文内容提取出来,无需编写麻烦的采集规则,而且又能实现定时自动采集文章,经过伪原创SEO后发布,被广泛应用在使用织梦cms搭建的网站上,为站长提供帮助。

      不少站长向我反映不懂得怎么查找网站RSS,查找RSS其实很简单的,无非就两种方法,第一种就是通过浏览页面查找有没有RSS相关的链接或者图标,点击进去一般都是RSS;另一种在页面上看不到明显的RSS链接或者标记,但可以通过查看源码获得,打开源码,搜索一下RSS,再仔细查看一下是否是RSS源,而不是其他和RSS有关的内容。

      比如我要采集百度新闻搜索(http://news.baidu.com)中关于“织梦”这个关键词的新闻内容,可以进去百度新闻搜索页面,输入“织梦”点击百度一下,如下图:

      百度新闻搜索不像百度页面搜索那样什么内容都有,百度新闻搜索,只搜索出来是新闻源网站里面和搜索关键词相关的内容,质量相对较高。

      查看这个源码获取RSS地址,可以看到这段代码,其中href之后的,就是RSS地址了,但他没有给出绝对地址,只显示了一个相对地址,不过这些问题难不倒我们站长,我们可以将相对地址补充完整,完整的RSS地址是:

http://news.baidu.com/ns?word=%D6%AF%C3%CE&ie=gb2312&cl=2&rn=20&ct=0&tn=newsrss&class=0

      然后在插件设置里面,输入这段RSS地址,进行采集就行。具体RSS采集使用方法可以通过这篇教程《织梦采集侠RSS采集/页面监控采集使用方法》进行学习。

      通过RSS采集的方式,可以采集到最新包含该关键词的新闻,做地区新闻站点,做行业站点,只需要输入地区或者行业的名称就能采集到相关的内容,而且还能定时采集,无需站长进入后台点击采集,无需打理网站每天都能保持更新。