2021/05/18

ウェブサイトの記事を完全に削除する方法

ブログにちょっと書き留めておくのは、自分にとっても良いことなのかもしれない。
備忘録ブログはよく目にするが、今まではそもそもブログを持っていなかったので考えたことがなかった。
書いたのに見つからないのが一番困るのだが、ブログならそういうこともなく、検索もすぐできる。


「ウェブサイトの記事を完全に削除する方法」


まず、以下の3つにパターン分けをするとよいのではないか。

①私のウェブサイト(ブログ)内にA記事が存在するか
②Google検索結果のキャッシュにA記事が存在するか
③他のウェブサイト(ブログ)にA記事が存在するか

③の場合は、黄色の枠内を読んでほしいのだが、ウェブサイトの管理人に削除依頼をする必要がある。


Googleサポートページ



繰り返しになりますが、ウェブは Google が所有しているものではありません。Google は、ユーザーの情報検索をお手伝いしているだけです。Google 以外の第三者が所有するウェブサイトに削除すべき情報が掲載されていたとしても、Google がウェブサイトの所有者に削除を命じることはできません。Google としてできるのは、必要に応じて Google 検索結果から削除することだけです。ご理解のほどお願い申し上げます。

と黄色の枠内には書いてある。
次に①についてだが、この確認は簡単だし、最初にするべきだろう。
これは、自分の家の中を家探しする話である。
例えばブロガー(GoogleBlogger)なら、「ブログ内検索」のガジェットから簡単に確認できる(ブログならふつうはブログ内検索のウィンドウがあるはず)。


ブログ内検索


検索窓に、A記事のタイトルを入力したり、重要なキーワードを入力したり、そうするとA記事が表示されるだろうか。
もう削除して自分のサイト内に「ない」ならば、ひとまずOKである。
これが、下記(a)の場合である。

(a)A記事を公開⇒削除
(b)A記事を公開⇒修正⇒A’記事

しかし、(b)の場合もよくあるわけで、この場合、A記事は更新されてA’記事になっているわけだが、更新前のデータは通常、次回の検索エンジンのクロール(情報収集)で「上書き」されるため、ワードファイルが上書きされるのと同じ理屈で古い記事のキャッシュは消える。
よって、一義的には、(a)の問題と同じである。
ところが、削除されていないこともあり、また、更新の前後でURLを変更するとA記事は現在のA’記事とは別個のURLでGoogle検索結果に残っていることがある。
前者について私は詳しく知らないのだが、サポートの記述を読むと、こういうことも想定されているようである。
後者は、ファイル名が違うとワードファイルが上書きされないのと同じ話であり、こちらの方は分かりやすいだろう。
上書きではないから昔のワードファイルは消えないということ。
特に、URLを自動生成する仕様だと、上書きされずに以前の記事が残るというモンダイがしばしば起こり得る。
例えば、ブロガー(GoogleBlogger)だと、URLの末端が自動で日付となるため、下記のような場合にURLが「0301」から「0310」に自動変更される。

(例)
3月1日に公開(A記事)⇒下書きに戻す⇒修正⇒3月10日に再公開(A'記事)
(A記事)https://www.d-punipuni.com/2021/blog.date.0301
(A'記事)https://www.d-punipuni.com/2021/blog.date.0310

このような場合、「0301」のA記事がまだGoogle検索結果に残っている可能性がある。
例えば3月1日のA記事では、「山田太郎先輩はキャバクラでツケを払わないことで有名な男だ」と書いたのだが、あとで見つかって殴られるのが恐いので下書きに戻したとしよう。
その後、3月10日になり、「知り合いのYさんは金払いがよくないことで有名な人だ」と控えめに書き直し、再度公開したのがA’記事だとする。
これはもう、A記事が間違いなく削除されていることが重要だが、Googleの検索エンジンがA記事をストックしているかいないか、表示されるかされないかを確かめる必要がある。
この時、A記事のURLを自分が正確に把握しているかどうかが非常に重要となる。
とにかくそこが非常に重要。
なぜなら、仮にGoogleに対してA記事の削除依頼をする場合に、そのURLを正確に指定する必要があるからだ。
まあ、言われてみれば当たり前のことだね。


GoogleSearchConsoleからの記事削除


上記の「Google Search Console」による削除方法は、緑の枠内の記述のとおりだが、いかんせんURLを指定できなくちゃ話にならないわけである。
Googleのサポートページを見ると、赤い枠内(最初の画像)にこう書いてある。

コンテンツがソース ウェブページからすでに削除されている場合
リクエストでは正しい URL を使用してください。URL を間違えた場合、結果は削除されません。

ということなのだ。
とはいえ、URL自動生成の仕様だと、私たちは以前のURLを正確になんか把握していないと思うのだよね。
実は、私がそうだったので、今回の記事を書いた。
では、A記事のURLが正確に分からない場合、どうすればよいのか、A記事の存否を確認する何か良い方法はないのか。
以下はシロウトの私なりの方法だが、「Google Search Console」の検索パフォーマンスからURLを突き止めるのが良いと思う。

「Google Search Console」にログイン⇒左上の「検索パフォーマンス」⇒下へスクロールして、「ページ」をクリック(クエリの右)⇒ここの一覧表示からA記事のURLを人力で突き止める(リンクから見れるので、それほど時間はかからないと思う)⇒URLをクリップボードにコピー⇒Google検索してみる⇒キャッシュが残っていればそこをクリック⇒昔の記事を発見!!⇒必要に応じて削除手続、という流れ

以下、私のA記事、A'記事の例をあげる。
この記事は最初、Googleの「クラウドサービス」Googleworkspaceをほめる記事だったが、のちに、ダービースタリオンの「サイキョウクラウド」の思い出話に全面的に書き直したというものである。
おや、Google検索をすると、A記事がまだ残っているようだ(黒い丸のところに▼があり、これをクリックすると緑の丸のように「キャッシュ」と表示される)。
もしかすると、Googleworkspaceは使いやすいからサイキョウクラウドだ~と書いたから、わざと消されてないのかもね。
まあ、Googleもなかなか愛嬌があっていいじゃないか。

(A記事)https://www.d-punipuni.com/2020/06/gsuite.html
(A'記事)https://www.d-punipuni.com/2020/06/blog-post_18.html