WordPress实现301跳转到www标准形式的方法

考虑到对于搜索引擎的收录和友好度,一般我们需要对wordpress网站做301重定向。讲一些非标准形式,跳转到www的标准形式,如http://leranl.com/,跳转到http://www.leranl.com/。

一般方法:在后台中,打开设置-常规,在WordPress 地址(URL),以及站点地址(URL)中填写www的标准形式http://www.leranl.com/,记住要带http://不然没法保存,会报错。

301tiaozhuan

 

之前一直用的这种方法解决,但是这次不行,设置之后,输入http://leranl.com/一样可以访问,并没有做跳转,不知道是不是又是win主机的问题。于是又尝试了第二种办法,这个成功了。

修改 wordpress 根目录下的 wp-blog-header.php ,并在文件开头 <?php 之后加入以下代码,添加成功后将文件保存,覆盖原始文件即可:
if (strtolower($_SERVER[‘SERVER_NAME’])!=’www.leranl.com’)
{
$URIRedirect=$_SERVER[‘REQUEST_URI’];
if(strtolower($URIRedirect)==”/index.php”)
{
$URIRedirect=”/”;
}
header(‘HTTP/1.1 301 Moved Permanently’);
header(‘Location:http:/www.leranl.com’.$URIRedirect);
exit();
}

英文文章伪原创的方法与途径

上次提到google对于英文文章伪原创的算法,详见:Google如何判断伪原创的算法,这次主要整理一下英文文章伪原创的一些方法与途径。

目前的伪原创方法主要有以下途径

1.       利用基于Google或Bing等的免费翻译工具:该方法主要是将采集到的文章进行多国语言互翻,如英-德-英。这种方法操作优点是操作比较简单而且免费,但是这种方法得到的文章原创性与可读性都比较一般,而且如果使用Google自身的翻译工具,被识别的可能性会更高一点。此种方法可以针对用来提交到文章站建设外链。

2.       在线伪原创工具,基本都是一些关键字的替换,它主要包括就是两种形式:简单和嵌入,主要就是把同义词进行替换,嵌入也就是添加,在原来的句中加入一些单词。可读性比较差,且存在之前提出的标点指纹识别的问题。且不能批量的处理,可操作性不高。

3.       伪原创工具:目前比较好的伪原创工具如the best spinner,它的词库比较强大,伪原创后的可读性也比较好,此款工具为收费版。

4.       人工介入+伪原创:完全依靠程序来玩成伪原创的工作目前来看收录没有问题,但是如果想做精品站取得好的排名的话,人工介入是不可或缺的。

常见伪原创的流程:

采集文章源:根据网站的关键词(核心与长尾关键词)可使用火车头采集工具,autoblogged等,批量采集一些文章到本地,发布至wordpress

在工具的辅助下,配合网站的主题,将采集到的文章,针对多篇文章合为一篇,或是采用一句话,二句话,三句话随机插入,增加段落量,对于比较长的段落,可以将其打散,分为几个段落,或者删除中间的一部分,自己寻找一些图或视频,将其添加到采集的文章中。

标题与正文第一段,一定要作改写处理,最好能将关键词或长尾关键词融入进去。图片一般不出现在首段,中间部分图片应加上图片属性alt=”含有关键词的短句”,另外图片下面最好有适当的文字说明或者文章标题。

Google如何判断伪原创的算法

做英文网站的朋友都会遇到语言的问题,完全原创的的难度比较大,所以一般会做一些伪原创处理,但是google的算法已经很强大,对于文章伪原创也有是别的一套算法。

Google主要是通过相似度、搜索指纹和代码噪音来判断文章是否原创。

相似度是搜索引擎去重用的最多的算法,主要依靠词频和反文档频率两个来判断。词频指的是某一个给定的词语在该文件中出现的次数。反文档频率指的是:如果包含词条的文档越少,反文档频率越大,则说明词条具有很好的类别区分能力。大概意思是如果某个词或短语在一篇文章中出现的频率高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。当两篇文章的特征向量趋于一致的时候,我们认为这两篇文章的内容接近,如果一致则说明是重复的。

数据指纹算法:当搜索引擎通过相似度把文章收集起来后,要判别一下是否是重复文章,经常用的就是数据指纹,数据指纹有很多种算法,常见的比如讲文章的标点符号提出,进行对比,因为对于两篇不同的文章,标点符合不太可能是完全一致的。指纹算法其核心在于统计出段落之中的标点符号有多少来分辩出原创还是伪原创,算法认为没有一篇的文章的标点符号数量一样的,只要算法中统计所有文章的符号和数量进行比对就能分辩出原创和伪原创的文章来,如果想避开这一算法可采用在伪原创文章中再插入其它段落,增加段与段之间的标点符号和数量来扰乱算法的对符号的计算工作。

Google

但是指纹算法肯定不只标点符号这一点这么简单,猜测文字信息提取指纹的要素一般为下面信息:标题、作者、发布时期、修改日期、主要关键词。其中关键词的选取可以有几种方法:提取网页中设置的keywords与description、信息中出现频率高的8个关键词、文章开头或结尾一段话、文章中固定位置的一段话。

有了这些代表信息后,便可以形成指纹信息,若再对这些信息进行Hash运算、MD5等方式加密、变化,生成一段定长(如256字节)的信息,就可以作为该信息的“指纹”,经过加密主要是防止对信息内容的篡改和对指纹的替换。这种方法有些象数字签名技术,但要相对简单,并且不进行加密运算时的标题等信息可以直接作为检索的关键字使用,统计信息表明:对一个文本信息提取指纹,当选取8个关键词及其词频作为其指纹时,准确度在98%以上,查全率在30%左右。这说明要能“概括”该信息,找出其8个使用频率最高的词汇,基本可以代表这个信息。

所以在我们进行伪原创或使用一些伪原创工具的时候,如果只是把关键词进行了替换,标点符号指纹是不变的,甚至连词频都不变。还有对文章进行段落的重拍,这个的确是打乱了标点符号,但是向量和词频问题依然存在。

代码噪音:前面说的这些,都是基于一个条件的,就是搜索引擎要知道文章是什么,因为每个网站的模板都不同,代码也不同,各种信息混合在一起,如果能找到正文就是搜索引擎第一要处理的。一般Google都会通过对代码的布局和噪音比例进行区分,哪些是导航,哪些是正文,并可以对一些典型的代码进行忽略。那么我们在做模板的时候,就要注意整页面降噪,方便搜索引擎进行正文的确认,但是正文区要适当的加燥,增加搜索引擎识别重复性的难度。

 

wordpress自动添加水印(water mark)插件

自己的建立的个人网站中有很多辛苦制作的图片,但是往往轻易被盗用,转载者也不说明来源,为图片增加水印是一个比较有效的办法,但是每次都用ps处理太麻烦,寻找了一款可以自动为wordpress增加水印的插件watermark reloaded。

加了水印多少会影响图片美观,一般图片站的话可能要慎用,鱼与熊掌不可兼得啊

首先到官方下载该插件,下载地址:watermark reloaded,在后台安装激活后进入设置页面。

如图所示,主要有以下几项设置:

Enable watermark for:需要添加水印的图片类型

Watermark alignment:需要添加水印的位置

Watermark offset:水印尺寸设定,单位像素

Text watermark:水印文字的字体,颜色等设置

watermark

设置好之后,点击保存,再上传新图片的时候就可以看到图片水印的效果了,如果觉得不喜欢,可以自己再调整图片水印的位置和文字的大小颜色。

 

 

怎样优化手机与平板网页搜索结果

手机移动市场快速发展。如果想抓住手机市场,不仅是网页开发人员与设计人员,我们都需要去适应新的手机市场的搜索规则。手机搜索引擎优化有它独有的不同于网页版的一些规则,以下是一些对于优化手机市场重要的地方:

1. 手机用户在搜索时一般使用短的关键词/描述

手机用户在搜索时一般使用比较短的短句或关键词。主要原因还是手机键盘操作不方便。一般查询的关键词是1到2个,如果你没有简短的关键词排名,那你可能要流失一大部分手机用户。

2476235_114740442197_2

2.  搜索信息本地化

手机用户大多搜索本地的信息。除了简短的关键词之外,手机用户一般一般针对本地的信息搜索。比如用户在某个地方,搜索附近的东西,寻找附近的饭店,或者某个路线。比如在南京,关于“新街口”相关的搜索应该会很多。

3.符合当前的手机搜索的一些热门信息

体育比赛结果,新闻,天气,金融等是手机搜索中比较热门的。手机用户一般搜索附近的饭店,购物区,体育比赛结果,热门新闻,天气情况,市场信息以及其他类似的主题,最好是能提供时间以及定位的服务,这个现在很受欢迎。如果你的网站其中之一的主题,但是你的网站对于手机搜索并不友好那么你会流失很多的访客。甚至我们可以考虑开发两种版本,一个是针对普通的网页版,一个针对手机版。

4.在手机网页中,要做到前三名

用户不喜欢很长的下拉页面以及翻页等。网页版用户不喜欢有很长的下拉列表的页面,手机版用户更不喜欢这一点。网页版一般一页显示10条搜索结果,所以前10名都在首页,但是对于手机用户来说一屏只能显示前四个甚至三个,所以严格来讲手机用户的第一页必须排到前三名,这样是最具有吸引力的位置。

5.增加网站的手机平台目录入口

将网站提交到手机搜索引擎、手机门户网站、手机网址导航以及目录书签网站等。能有来自谷歌或其他搜索引擎的访客最好,但是如果你想要更多的流量,以上提到的几点就显得很重要了。目前这些手机导航资源为带来流量提供了很大的帮助,所以不要忽视他们。很多手机用户往往不用搜索引擎,而是到一些他熟悉的目录网站去找。如果你的网址刚好列在上面,用户可能就会直接从目录网站而不是搜索引擎进入你的网站。举个例子,如果你是一家pizza的饭店,那么你需要将网站提交到包含所有pizza店目录或者包括你所在位置的所有饭店的目录。

6. 遵循手机通信标准

手机搜索与传统搜索不同,如果你的网站想要被抓取应该遵循它的规则。查看万维网协议中关于移动通信网站的标准。即使你的网站不符合移动通信标准,它可能也会被列在搜索结果中,但如果你遵循相关标准,结果可能会让你大吃一惊。转码器将普通的网页转换成手机网页的格式,但是并不是所有的都能成功。

7.注意meta.txt文件

meta.txt文件是用于简要介绍你的网站信息以及最佳版本。搜索引擎爬虫可直接读取meta.txt文件(存放在根目录下),所以即便你的网站不能成功访问,你可能依然会出现在搜索结果中。Meta.txt 类似网页版的robots.txt但同时也像我们网页中的mate标签,因为你可以将描述放进去(类似我们平时的描述与关键词)。meta.txt内容是用冒号隔开的与robots.txt类似。文件中的格式类似:<fieldname>:<value>。meta.txt的好处在于可以易于搜索引擎和用户识别。

8.手机搜索中不要使用冗长的页面

移动用户往往没有时间阅读很长的页面,所以最好使用简短的文章。我们之前提到了手机搜索用户不喜欢长的关键语句,同样他们更不喜欢长的页面。所以最好能开发一个针对手机的专业简洁版本。简短的网页并不意味着你要忽略关键词,关键词是在移动搜索中是相当重要的,所以不要忽略他们,但是也不要堆积关键词。

9.提示预测搜索在手机用户中很受欢迎

    搜索提示在网页版中很常见。移动搜索中也很受欢迎,因为这样可以减少打字。如果你的关键词包含在这些可能的搜索中,会增加网页被搜索的机会。当然,关键词是不断变化的,我们不可能完全正确,但至少可以努力试一下。

10.观察预览手机版网站情况

要随时观察手机版网站的情况。随着手机性能的不断改良以及手机屏幕的不断改变,我们不可能时时检查网站的情况,但是我们可以有针对性的监测一些关键点。因为即便用户通过手机搜索引擎来到你的网站,如果网站显示的是一个扭曲的乱码之类的状态,用户会离开,且留下不好的印象。转码是网站乱码的原因之一,所以让你的网站遵循移动互联规则而不是依靠搜索引擎的转码是非常重要的。

手机搜索是一个新兴的但是可预见未来非常重要的领域。如果你不确定你的网站是否值得针对移动搜索优化,可以使用google adword工具在确定你的关键词在手机搜索的情况。如果搜索量很多,或者某个特定的词非常好,那么就投入更多的时间和精力去优化。

 

WORDPRESS主题下载及安装方法

我们利用WORDPRESS搭建好博客之后,第一件事就是选择合适的WORDPRESS主题下载,安装。WORDPRESS主题的选择以及下载安装比较简单,方法如下:

一.WORDPRESS主题的选择

  • 确定网站主题:在挑选博客主题前,一定要先弄明白自己网站的基本定位和自己对颜色、栏目、基本功能的想法。因为WP主题是在是太多了,有时候经常无从下手,最起码你需要知道自己的博客是用于干什么。
  • 主题文件齐全,一般主题都应包括:style.css(样式表),single.php(单篇文章页面),sidebar.php(侧边栏),search.php(搜索), page.php(页面模板),index.php(首页),header.php(页眉),footer.php(页脚),comments.php (评论),archives.php(存档),404.php(404 错误页面)等11个文件。另外还有category.php(分类页面),links.php(友情链接),author.php(作者页面),tag.php(标签页面)等等。
  • 尽量选择两栏式或三栏式主题
  • 身材健康的主题:如果你的Wordpress主题身材过于“臃肿”,势必 影响页面载入速度,影响用户体验。

二、WODPRESS主题下载地址

  • 去官网下载(推荐):官网的主题比较符合标准,而且不易有病毒或者被攻击
  •                                 地址: http://wordpress.org/extend/themes/
  • 从搜索引擎搜索:进入Google或百度,输入“WordPress免费主题”,立刻有很多介绍免费主题的条目出现
  • 从一些Wordpress主题站下载

三.WORDPRESS主题的安装

将下载的主题文件在本机上解压

1. ftp工具:安装ftp工具,推荐使用flashfxp,如下图,点击站点-站点管理器-新建站点,输入相应的域名、用户名、密码,右侧为ftp文件,左侧为本机的文件,

2. 利用ftp工具,将文件夹上传到服务器中,上传文件时,右击文件“上传”即可,路径: /网站根目录/wp-content/themes/

3. 进入网站后台,有两种方法来设置主题,

在左侧工具栏的Appearance下找到Themes

进入主题设置页面,点击主题下方的Activate,这样就好啦。

wordpresszhuti

Google斑马算法更新

Google继去年的企鹅与熊猫算法更新后,在2013年2月推出“斑马”算法,此次算法并没有找到官方的出处,很多人对它的真假性存在怀疑,但是它提到的一些点确实有参考性。

• Too many retweets with keywords included around a link

• Facebook updates with too many shares from people not in your industry

• Any Google+ shares as this will look spammy (Google+ is a graveyard right, so any activity looks suspicious?!)

2012年的两大算法更新,其中熊猫算法针对的是打击低质量内容网站,核心在于站内;企鹅算法的重点倾向于打击低质量外部链接,核心在于网站的外部建设;而此次的斑马算法则是针对社交网络,不管此次算法更新是否真实,社交网络一直在网站推广占重要比重。

1. twitter过多的针对同一关键字同一链接的转发,个人理解如利用僵尸粉,大量的转发或发布针对同一关键词同一链接。

2. Facebook中大量的分享,但是这些分享人并不属于你的行业,或者相关行业。个人理解如花钱或利用大量的僵尸粉做一些转发,这些转发在斑马算法中会被识别惩罚。

3. 任何在Google+上做类似以上两种方法的将被视为垃圾内容。
Google zebra update

 

为什么我们用Ehcache?

Ehcache是java非常常用的缓存工具,它配置简单,使用方便,而且提供了多种策略供用户选择。相信很多java项目都会使用它,我们的项目就是其中一个。在逐渐使用这个工具的过程中,我发现Ehcache本身作为一个项目,从架构框架到代码也是非常优秀的。换句话说,如果国内某个公司来做这样一个缓存工具,不一定甚至肯定达不到Ehcache的水平。

那么从这两个方面来单独介绍下,首先说代码框架,说它是好的框架,主要包括以下几个方面:

一,丰富的API接口,Ehcache可以作为hibernate的二级缓存,也可以单独使用,单独使用时,可以根据静态模板配置,也可以动态配置。对于每个Cache,我们可以监听它的增加和删除事件,对于每个Element,我们同样可以。

二,不断改良的功能,如果查看Ehcache的官方网站,我们发现最新版本的Ehcache是2,5,x,它支持哪些功能呢?你会发现它支持更丰富的分布式部署,支持BigMemory,甚至支持Ruby了。这在前面比较老的版本,是不存在的,后面的版本逐步完善的。用时髦的话说,叫“持续改进”。

附Ehcache版本列表

Ehcache 2.5.x

Ehcache 2.4.x

Ehcache 2.0-2.3

Ehcache 1.7.1

Ehcache 1.6

Ehcache 1.5

Ehcache 1.4

Ehcache 1.3.0

Ehcache 1.2.4

Ehcache 1.2.3

Ehcache 1.1

三,良好的扩展性,不用举例,第二条不断改良的功能,便可知,一个糟糕的架构,后面几乎不可能再优化,不断的优化,只能带来不断的Bug。

再从代码细节来说,Ehcache给了我个人很大的思考,我们自己写代码,总是有好多细节,理所当然的遗漏,比如线程数过多,内存溢出,等等等等。而Ehcache,则理所当然的考虑方方面面,下面列几个代码细节,算是给自己提醒,可以时刻看齐。

一,同步保护,我在调用Ehcache的put和get方法时,担心这两个操作冲突,造成数据异常,所以我封装的方法中,做了同步保护。后来看看Ehcache的代码,发现每次put和get,它都做了同步保护。

二,工厂模式的使用,Ehcache工厂模式的应用,实际可以作为学习这种设计模式的教材。

三,线程控制,Ehcache虽然提供了高速缓存,而且提供了文件存储,但是它本身并非无限制的开线程处理。每个Cache有一个永久线程,当Ehcahe启动的时候,这个线程就建立了。每次put操作,都如同一个“生产者-消费者”模式,生产者put元素,消费者根据配置策略决定有的缓存,有的持久化。

关于4G网络

4G是第四代移动通信及其技术的简称,是集3G与WLAN于一体并能够传输高质量视频图像且图像传输质量与高清晰度电视不相上下的技术产品。 4G系统能够以100Mbps的速度下载,比拨号上网快2000倍,上传的速度也能达到20Mbps,并能够满足几乎所有用户对于无线服务的要求。此外,4G可以在DSL和有线电视调制解调器没有覆盖的地方部署,然后再扩展到整个地区。 很明显,4G有着不可比拟的优越性。

4G

WordPress中文标签(Tag)显示404怎么办-win主机

上次解决了如何去除WordPress的URL中的index.php又出现中文的tag词打开后无法找到页面,显示404报错新问题,win主机的中文版真是各种问题不断啊。

中文的tag词打开后无法找到页面,显示404报错,烦躁。下面讲一下解决的过程,有三种解决办法,大家可以根据自己的情况更改,如果三种方法都无效,可以更换个主题试试,我开始就是主题导致的各种方法都不行,换了个主题后就好了:

1.手动将每个中文标签(tag)词的URL更改为英文的方式,但是这样对于tag词比较少的网站可
以,如果很多的话,太麻烦了,我不想每次都去一个一个改,放弃这种办法。


tag

2.针对Win服务器

打开 wp-includes/rewrite.php,找到第1039行,把:

if ( empty($this->permalink_structure) )

注意:此文件下有很多的“if ( empty($this->permalink_structure) )”,需修改的是位于第1039行,“function get_extra_permastruct($name)”函数下的那一个。

替换为:

if ( !empty($this->permalink_structure) )

注意:别用windows自带的记事本修改(推荐UltraEdit,Dreamweaver等)。

这样出现的tag url是http://www.leranl.com/?tag=%e4%b8%ad%e6%96%87%e6%a0%87%e7%ad%be这种形式,中间有个?,感觉对搜索引擎不友好,会影响tag词的收录,同样放弃这个方法。

3.转换编码解决 WordPress 中文 Tag 链接问题(推荐)

打开文件:wp-includes\classes.php ,wordpress 3.+ 版本是 wp-includes\classe-wp.php

查找:

$pathinfo = $_SERVER['PATH_INFO'];

修改为:

$pathinfo = mb_convert_encoding($_SERVER['PATH_INFO'], "UTF-8", "GBK");

再查找:

$req_uri = $_SERVER['REQUEST_URI'];

修改为:

$req_uri = mb_convert_encoding($_SERVER['REQUEST_URI'], "UTF-8", "GBK");

保存,上传,问题解决啦^-^