WELQ問題は検索プラットフォームの寡占問題でもある

COLUMNGoogle,WELQ,アルゴリズム,カスタム検索,医療IT,検索エンジン

 

 

search-engine

[2018/1/11追記]このコラムでご提案していた「カスタム検索」ページは、2017年12月に実施された検索アルゴリズムのアップデート(既報)により現時点で求められる一定の役割を終えたと考え、閉鎖いたしました。編集部内で協議の上、今後必要な状況が生まれれば再度掲載いたします。
[2016/12/5追記]
キャプチャ画像での囲み指示(⑥の位置)に一部間違いがございました。お詫びして訂正致します。

WELQ問題が明らかにしたもうひとつの問題

medit.tech編集部河田です。先週のWebでの話題は、ご存知の通りWELQ問題でもちきりでした。あちこちで報じられていますので、こちらで改めて振り返ることはせず、今回の件で顕在化したもうひとつの問題についてお話できたらと思います。その問題とは、インターネットの基本である検索行動を支える検索エンジンのアルゴリズムに「質」「倫理」が組込まれていないことです。アルゴリズムに関しGoogleは具体的、明示的な基準を出したことはありませんが、アドバイスとしてこのようなページをWebマスター向けに開示しています。この公表を機に「Googleもコンテンツの質を評価しているよ」というメッセージを折りにふれ出していますし、今のそのスタンスをとっています。しかしWELQの問題は、図らずもこの「建前」がほとんど機能していないことを明らかにしてしまいました。

 

Googleの評価する「質」は人間の評価する「質」に追いついてない

いったいなぜ機能していないのか。それはひと言にすれば、結局は「目に見えるテキストの有り様しか見ていない」からです。Googleはコンテンツを適切に評価するための200以上の基準を持っている(内容は非公表)としていますが、巷にあふれるSEOの「定石」を解説するサイトには、ほぼ必ず「キーワードの出現率」といった用語や「被リンクの数」というのが出てきます。そのページがどういった内容を書いているかを同一キーワードの出現率で、内容が評価されているかを被リンクの数で見ているとされています(もちろん他にも基準はたくさんあるといわれます)。Googleは公式には認めていませんが、「定石」に沿ってテキストを形成すれば、全文盗用といった極端なものでないかぎり、内容がどこからか剽窃されたり転載されたものであっても、ほぼ上位表示されてきたというのが事実です。

対して私たちは、コンテンツの内容をどういう基準で評価しているでしょうか。「この内容は正しいの?」「信頼性あるの?」「これは見たことない」「面白い」「感動した」「ためになった」「嘘を書いている」「人を侮辱している表現で気分が悪い」といったものではないでしょうか。すべて、「そのページがどんな内容を書いているのか」という最低限の確認より上位の基準ですが、現在の検索エンジンはそれらが明示化された基準になりづらいため、理解できていません。つまりそもそも、まだ人間の基準に追いついていないわけです。

 

Googleが試みているひとつの回答

といってもGoogleもこの問題をまったく認知していない訳ではなく、また医療や健康情報の分野に関してはかなりクリティカルであることも理解しており、2015年2月から、英語版に関しては疾患キーワードの検索結果ページに、公的機関などの信頼できる情報のみを掲載するように仕様変更を進めています。英語版ではすでに900程度の疾患キーワードに対応していて、実は日本でも「ジカ熱」だけですが対応しています。

なるほど、ではそれが完了するのを待っていれば問題解決めでたしめでたし、という考えもありますが、果たしてそうでしょうか。検索プラットフォームを事実上独占している民間企業のGoogleが「信頼できる情報ですよ」と能動的に情報を「検閲」して提供しているわけで、今回の措置はポジティブな結果を導くためのものとはいえ、仕組みとしてはあまりいいものとは思えません。それともうひとつ言えるのは、英語版でのGoogleの対応スピードを考えると、日本語での対応完了はいつになるのか分からないと考えるのが自然で、クリティカルの度合いからすれば待っていられるような状況ではないということです。

 

自分で基準を作り込んでいける「カスタム検索」

そこでご紹介するのが、Googleの「掌の上」ではありますが、自分で信頼できるサイトを重視させたり、信頼できないと思うサイトを除外できる「カスタム検索」機能です。検索フォームに「-site:」「site:」と引数をつけられることは知られていますが、それよりももっと多機能に設定ができます。ただ誰でも使えるものではなく、どうもWebサイトを持っていてAdsenseやSearch Consoleを活用しているユーザーにしか提供していないようです。そうでないユーザーでもカスタム検索ができるよう、medit.techでもこの機能を利用してカスタム検索できるフォームを設置しました(どうしても広告が出てしまいます。申し訳ありません)。こちらを使っていただけたら非常にありがたいですが、設置できる立場の方は積極的に活用していただきたいので、設定の方法をこちらに載せたいと思います。自分でやってみて、少し作り方が分かりにくいと感じたので、キャプチャを使って説明してみます。

 

1.とりあえず自分の検索エンジンを作成する

cse-1-1

仕様としてはウイジェットを作るような感じで、とにかくまず名前を付けていちど「作成」を押下する必要があります。その際、面倒でも①のところで、適当でいいのでいったん何らかのドメインを入れてください。というのは、カスタム検索エンジンの主な想定は、サイト運営者が自サイト内の検索をカスタマイズする用途のようで、ここで何か入れないと次へ進めないのです。

 

2.重み付けするドメイン、除外するドメインを設定

cse-2-2

「作成」を押下するとこの画面へ遷移します。表示されたら「追加したサイトを重視して、ウェブ全体を検索する」を選択してください(そうしないと設定したドメインの中だけを検索する設定になります)。あとは、重視したいサイトのドメイン、除外したいサイトのドメインを各々設定します(もちろん複数設定できます)。その他、デザインや画像検索も可能とするかなど、タブにいろいろと設定がありますのでのぞいてみてください。最後に「保存してコードを取得する」を押下すると、htmlに貼付けるjavascriptコードが表示されます。

 

実際にカスタム検索をしてみるとこうなる

最後に、カスタム検索のビフォーアフターをお見せしたいと思います。現在でもWELQのページは上位表示のままで、例えば有名な事例で「胃腸炎」で検索すると今でもこんな感じですが

welq-1

 

WELQやNAVERを除外し、or.jpやac.jpなどの公的機関や信頼できそうなサイトを指定すると、こんな検索結果が出ます。

welq-2

 

いかがでしょうか?少し作業が必要ですが、随分と検索結果が改善したように思います。もし作成できる方はぜひお試しになってみてください。作成できない環境の方は、手前味噌ですがmedit.techのカスタム検索フォームをお使いいただけましたら嬉しく存じます。

 

関連記事