今更ですが、朝日新聞デジタルのサイト内検索の対象期間が5年に変わっていました。
記事の検証で使う人も居るので改めて整理したいと思います。
- 過去には1年間だった朝日新聞デジタルのサイト内検索
- 2019年4月からはサイト内検索は5年間
- "unavailable"タグが削除されている
- 有料記事は前からサイト内検索で1年以上前のものもヒット
- メタタグ事件がきっかけか
- なぜか削除されている記事
- まとめ
過去には1年間だった朝日新聞デジタルのサイト内検索
記事検索ができる期間はどのぐらいですか | Q&A(よくある質問):朝日新聞デジタル(2018年5月22日魚拓)
朝日新聞紙面や朝日新聞デジタルに掲載された記事は1年間分収録されています。(一部の記事を除きます)
1年以上前の記事を検索したい場合は、記事検索サービス「朝日新聞デジタルselect 朝刊ダイジェスト」(有料)をご利用ください。
朝日新聞デジタルのサイト内検索が1年間有効だったということはよく知られた話。
2019年4月からはサイト内検索は5年間
検索機能について教えてください | Q&A(よくある質問):朝日新聞デジタル:魚拓
「朝日新聞デジタル」には、「サイト内記事検索」と、有料会員(フルプラン)限定の「新聞記事検索」の2つの検索機能があります。
▼サイト内記事検索
「朝日新聞デジタル」に掲載された記事を検索できます。検索の対象期間は5年間です。検索結果の記事は、「更新日時順」と「関連度順」を切り替える事で表示順を並べ替えることが可能です。
「公開日時 : 2019/04/17 00:00 更新日時 : 2019/04/17 13:11」
2019年4月からはサイト内検索は5年間有効になったようです。
新聞記事検索の方は引き続き1年間のみの検索が可能です。
なお、2017年4月の無料記事もヒットしているのですが、この仕様にいつ変更されたのか、どこまでさかのぼれるのかは調べていません。
「地毛証明書」、都立高の6割で 幼児期の写真を要求も:朝日新聞デジタル
"unavailable"タグが削除されている
— ケーシング (@keishimpo) September 5, 2018
「朝日新聞社幹部、知人女性に不適切な言動」という記事を例にあげますが、1年前にはこのように「meta name="googlebot" content=unavailable_after:〇〇」のように、グーグル上の検索にヒットしなくなる日付を設定していました。
同じ記事を今見ると、そういったメタタグは付けていません。
つまり5年後の日付のメタタグをその都度入れているのではなく、一般的にメタタグを付けない仕様であり、時期が来たら検索にヒットしないようにしてるのでしょう。
(まさか手動でやるとは思えないが…)
有料記事は前からサイト内検索で1年以上前のものもヒット
「文庫本「図書館貸し出し中止を」 文芸春秋社長が要請へ」のサイト内検索結果:朝日新聞デジタル
「【アーカイブ】(奨励会物語 棋士をめざして:番外編)勝負・出会い、財産に」のサイト内検索結果:朝日新聞デジタル
有料会員限定記事は前々からサイト内検索上で1年以上前のものでもヒットしていたようでした。
ただし、以下の記事(リンクは魚拓)は有料会員限定記事でも2012年のものなので、現在は消されて見れません。
木嶋佳苗被告の手記 1万2千字書き直しなし(アーカイブ):朝日新聞デジタル
おそらく、有料会員限定記事も5年間サイト内検索が有効のようです。
メタタグ事件がきっかけか
2018年8月に、朝日新聞デジタル上の記事に"noindex""nofollow"のメタタグが付けられていることをネットユーザーが発見し、重要な記事がグーグル検索上でヒットしないように意図的に隠ぺいされていることが明らかになりました。
この事件の検証をしている当時はサイト内検索は1年間の制限があったので、仕様変更はそれ以降ということになります。
なぜか削除されている記事
2018年8月に起きた事件を報道した記事について魚拓をとって検証していたのですが、なぜかドンキホーテでの韓国人カップル医薬品大量万引き事件の記事が消されています。
これは5年以内のものなので通常であれば残っているはずなのですが、どうやら手動で削除されたようです。
これは朝日新聞だけでなく他の産経以外のメディアでも同様でした。
まとめ
デジタル版の記事の扱いは各社によってバラバラです。
ネットメディアと呼ばれている所(たとえばJ-CASTニュースやZAKZAK)はずっと閲覧可能ですし、産経新聞も有効期限を設けていません。
制限を設けている事自体は問題ではなく、資源が有限である以上は当然のことです。また、一般にネット上で検索できるものとは別に創刊時からのデータベースもあります。
そういった各媒体の特性を理解した上でシェア・引用しておくとよいでしょう。
以上