站点反馈:
网站主体内容都是js生成,针对用户访问,没有做优化;但是网站特针对爬虫抓取做了优化,且将图片也直接做了base64转化;然而优化后发现内容却不被百度收录。
页面质量很好,还特意针对爬虫做了优化,为什么内容反而不收录了呢?
工程师分析:
1、网站针对爬虫爬取做的优化,直接将图片二进制内容放到了html中导致页面长度过长,网站页面长度达164k;
2、 站点优化后将主体内容放于最后,图片却放于前面;
3、爬虫抓取内容后,页面内容过长被截断,已抓取部分无法识别到主体内容,最终导致页面被认定为空短而不收录。
工程师建议:
1、不建议站点使用js生成主体内容,如js渲染出错,很可能导致页面内容读取错误,页面无法抓取
2、 如站点针对爬虫爬取做优化,建议页面长度在128k之内,不要过长
3、针对爬虫爬取做优化,请将主题内容放于前方,避免抓取截断造成的内容抓取不全
我们经常看到有些网站PC和手机访问的时候显示不同的页面,而且网址是一样的,右击查看源代码也是一样的,这就属于响应式自适应的网站,那么仿制自适...
仿站网下面教大家如何确定站点目标?在创建网站时,决定站点的目标是第一步。设计者应清楚建立站点的目标,即确定它将提供什么样的服务,网页中...
曾经非常多的关于工商银行的钓鱼网站,他们是利益和工商银行的页面一样,并且域名也差不多,利用不懂网络的人的心态去欺骗别人的工商银行账户和密...
说实话,您要的不只是网站,要的是 能带来客户的网络平台。☉ 不知道怎么利用网站赚钱?☉ 有了网站,不过网站实在看不下去?☉ 网站没有功能,时常出...
个人仿站基本各行业都会有,无非就是哪些类型仿的多,哪些类型仿的少而已。下面给大家介绍下一些常见的个人仿站类型。一、流量类站点,一般包括影...
1:超低的仿站价格2:上线时间加快,增加效益3:网站效果更加得到提升以及保证