この記事の所要時間: 416
doi

上野動物園のパンダは残念だったけど、ついにアメリカ産のパンダがやってきたよ(汗)

 

こんにちは、ゆーすけです。

昨日の朝はあっちこちでパンダの話題で盛り上がってましたね。

 

  material_99_10_s応援されたら嬉しいよね(笑) 

 

パンダ・アップデートが始まりました

 

えぇ(笑)

いよいよgoogleのスパム対策「パンダ・アップデート」が

日本と韓国に上陸したようです。

 

 

このパンダ・アップデートっていうのは全くパンダ(大熊猫)とは

関係なく、パンダさんというgoogleの社員の名前から取られているそうです。

 

 

ペンギン・アップデートというのも4月の下旬にありましたが、

この2つの違いをあなたはちゃんと分かっていますかね?

過剰に反応する必要はありませんが、ネットで商売をしていく気があるのなら

知っていて損はないことなのです。

 

ペンギンとパンダの違い

【共通点】

スパムサイトを排除し、検索の健全化を図る

 

【違い】

●ペンギン・・・過剰なSEO対策としてのリンクを受けている・しているサイトを排除

●パンダ・・・中身の無いサイトを排除

 

 

ざっくり言うと以上の点です。

なんでこんなことをgoogleがやるのかは、あなたが

googleの社長だったらどうしますか?ってことですね。

 

 

googleはお客様である検索者(私達)が知りたい情報を

しっかりと提供することが会社としての使命なわけです。

でも残念ながら訳の分からないサイトが1ページ目のトップ

に来ていることってあるじゃないですか。その時、検索者に

「googleつかえねーな」て思われたら存在意義がなくなりますよね。

 

 

だから、

そういう質の悪いページを排除しましょうね。という自然の流れなんです。

 

 

 

基本検索ページの1位に表示するためには

 

「被リンクをどれだけもらっているか」

「コンテンツ内のキーワードが●%あるか」

 

とかいろいろと項目があったようです。

その条件をうまいこと達成すると1ページ目にビックキーワードでも

表示させられたりしたみたいなのです・・・。有料リンクを購入したり

中小検索エンジンに登録をしていくことで上位表示を目指すような。

 

 

こうして、googleを欺いて、儲かればいいやという

アフィリエイターたちがの一部がgoogleの禁止事項に反して

SEO対策をしていったんですね。

 

 

ついに、googleが怒り、二匹の動物を世の中に放ったのです。

それが、パンダとペンギンです。

 

ペンギンが不正なリンクを排除し、パンダがしっかりと

記事の中身を調べ(パクリはないか、自動生成じゃないかなど)て

無罪か有罪かを判定するようになったのです。

 

 

歴史的には「パンダ」→「ペンギン」の順なのですが、

日本と韓国は「パンダ」が導入してなかったんですね。

 

 

なぜパンダが遅れたか? コレは推測です・・・

欧米系の言語は基本SVO構造(SはOをVする)という

構造なのですが、日本語と韓国語はSOV構造(SはOをVする)なんです。

 

 

テキストマイニング(text mining)って言葉きいたことありますかね?

大量の文字データからある一定法則を導く統計学的手法のことです。

 

 

マーケティングリサーチの世界では、今通常のアンケート

を数量分析するだけでは不十分なので、記述された文字を

統計学的に解析するとより顧客の「質」をより明確する手法をとり始めています。

 

 

私も大学院時代にSPSSのClementineっていうソフト(数百万?)

で一度データマイニングしたこと有りましたが。

超難しいですが(笑)

 

 

使用例としては、例えば

コールセンターでお客さんの声をすべて録音して文字に起こします。

その中から頻度の高い言葉や前後の文脈からつながりやすい言葉を

くっつけていく(クラスター分析)とある一定の法則が見つかるようになります。

(大量のデータから一定の法則を導く手法を「データマイニング」といいます)

 

調べてみたら、

「壊れやすい」という言葉と「右のボタン」という言葉が密接に

くっついているとか

 

 

これって問題の本質が分析できますよね。

単に、「故障クレームではなく、どこに問題があるかという質が高まる」わけです。

 

 

日本語って英語に比べると言葉の配置が自由なのでこうした

分析がしづらいので、欧米諸国よりもやっぱり研究が遅れていました。

(専門用語では形態素解析といいます)

 

 

例えば「私はりんごを食べた」という時に、日本語では

1)私は りんごを 食べた

2)りんごを 私は 食べた

3)食べた 私は りんごを

4)りんごを 食べた 私は

 

としても意味が通じますよね。

ところが、

英語の場合、日本語の1)?4)は語順の入れ替えで表現出来ないのです。

 

I ate apples.

Ate I apples. や Apples I ate. のご順で意味を成すことが出来ないのです。

 

 

 

これをスパムサイトで置き換えた時に

英語のサイトならおそらく

 

Hey, I was looking for a very nice site! Click this → http://

 

なんて書き方してるでしょう。

 

 

これはすべて私の推測ですが、パンダは

Click +リンクとなっているのが多いサイトは「スパム」

という判定を下すのではないか?ということです。

 

 

日本語なら

「ねぇ、昨日こんなにいいサイトを見つけたんだ。ここだよ→http://」

「http://っていう良いサイトを機能見つけたんですよ。」

「ちょーすげーサイト昨日見つけちゃった。http://なんだけどね」

 

なんて自由に同じ意味合いで変えることができるんですよね。

このへんがパンダが手を伸ばしきれなかった理由でしょうか?

 

 

日本語と韓国語は文法の構造が似ていますから

おそらく文法のゆらぎをルール化することが難しかったのは?

 

 

これって携帯電話のiPhoneのSiriとdocomoのしゃべってコンシェルの

精度の違いにもつながってくるかもしれませんね。

 

 

Word95の時代のMS-IMEと一太郎のATOKの違いぐらい

海外製と日本製では「日本語解析力」が違うんですよ。

 

 

 

もう、googleパンダは学習しました。逃げられません。

 

 

 

彼らは日本語を知り尽くし、スパムと思われるコンテンツを

根絶やしにすることでしょう。

 

 

考えてみると私も昔は記事やコンテツの自動生成を使って

本当のスパムを作ってたことがあるのでわかりますが、

やっぱりある一定の法則が見えますよね。

 

 

ちょろっと記事を書いてすぐアフィリリンク・・

 

 

これ鉄板じゃないですか?

そういう過去のスパムであろうサイトをgoogleは蓄積し、

その中から法則を見つけ出してパンダを生み出したわけですよ。

 

 

そら、昔は稼げたかもしれないような手法で質が悪い手法なら

今後はダメになりますよね・・・。

 

 

 

パンダとペンギンから身を守って稼ぎ続けるための唯一のキーワードは

 

 

 

「誠実」

 

 

 

 

これしかないんじゃないですかね。

自分の言葉で「誠実」にコンテンツを作っていくこと。

 

 

ちょっと周りの方もきっとパンダの記事は多く書いているので

言語学的な観点からパンダを語ってみました。

(SEOはあまり専門でもないので、専門家からは厳しい指摘をされるかもですが・・・)