IT法務・AI・暗号資産ブロックチェーンNFT・web3の法律に詳しい弁護士|中野秀俊
グローウィル国際法律事務所
03-6263-0447
10:00~18:00(月~金)

【スクレイピングと法律】スクレイピングって法律的に何がOKで何がOUTなのかを弁護士が解説。【2022年12月加筆】

著作権に関する法律

スクレイピングによってデータベースを作りたい!はいいのか?

スクレイピングとは、ウェブサイトから、ウェブページのHTMLデータを取得して、取得したデータの中から、特定のトピックに関わるデータを抽出、整形しなおすことをいいます。

スクレイピングは、ウェブ上にあるデータを取得する際に、クローラを用いて、自動的に取得することによって、短時間で膨大な情報を収集することができることに特徴があります。

このような技術を用いて、政府公開情報や他企業の情報、ニュース記事などの中から、自社に必要な情報を抜き出して、分析し、自社のデータベースを作成することが行われています。

一般的に、スクレイピングによって、データベースを作成する手段をまとめると以下のようになります。

  1. クローリングによってウェブサイトからHTMLデータを取得し、当該データから必要な情報をスクレイピングして事業者のサーバに保存
  2. 収集・保存されたデータを解析して、一定の目的に合わせたデータベースを作成する
  3. 作成されたデータベースを自社の顧客に配信する

ここで問題なのは、他者の情報をスクレイピングして、自社のデータベースを作成する行為が、法律上大丈夫なのかという点です。

そこで、スクレイピングが、法律上問題ないのか、みていくことにしましょう。

スクレイピングと著作権の問題

他者のウェブサイト等から、情報を取得することになるので、他人の著作権を侵害しているのではないかが問題になります。

他人のコンテンツには、オリジナリティがあれば「著作物」として著作権法上、保護されます。

そのようなコンテンツをコピーしたり、自社側のサーバに保存する行為は、著作権者の同意がない限りは、著作権侵害になる行為です。

著作権法上の例外規定「情報解析のための複製」

スクレイピングで取得するコンテンツは、膨大になることから、コンテンツ一つ一つに同意を取ることは現実的ではありません。

著作権法では、例外規定として、情報解析のための複製等を著作権者の同意なく行うことを認めています(著作権法47条の7)

この例外規定では、以下の点に関して、法律上、許されています。

  1. コンピュータによる情報解析を行うことを目的する場合で
  2. 記録媒体への記録又は翻案

翻案とは、元のコンテンツに新たな創作的表現を加えることをいいます。

よって、スクレイピングの結果、データベースの作成に際して、情報解析を行う場合には、記録媒体への記録を行うことは、法律上、許されます

ただし、以下のような行為は、法律上禁止をされてます。

違法な場合①~収集したコンテンツの複製物の譲渡~

スクレイピングによって、収集されたコンテンツを他人に譲渡する(ネット配信なども含む)行為は、著作権法上、違反とされています。

よって、スクレイピングによって、コンテンツ情報を取得した事業者は、集めたコンテンツを自社で分析して再構成し、その結果を自社の顧客などに提供する必要があります。

違法な場合②~目的外利用の場合~

また、上記例外は、あくまで情報解析の場合のみ認められたものです。

よって、情報解析目的以外で、スクレイピングによって、他者のコンテンツを情報収集することは認められていませんので、注意が必要です。

利用規約違反(民事上の責任)

著作権法の論点とは別に、民事上の責任が生じる可能性がある場合として、他者の利用規約違反が生じる場合があります。

つまり、他者のウェブサイト上の利用規約で「スクレイピング禁止」と記載されている場合には、スクレピングを行うと、利用規約違反になり、損害賠償請求などがされる可能性があります。

ただし、利用規約がユーザとの間で効力を生じさせるためには、以下の措置が必要になります。

  1. 利用規約をユーザに示し
  2. 取引の開始に当たり、同意クリックをさせる

よって、会員登録の必要がなく、誰でも見られるコンテンツを、スクレイピングする場合には、上記利用規約違反は、問題になりません。

不法行為責任

スクレイピング対象のサイトが、クローラのウェブサイトのアクセスを制限するための措置(robot.txtなど)が取られている場合には、そのような措置を破って、クローリングした場合には、民法上の不法行為に該当する可能性があります。

偽計業務妨害罪の可能性(刑事上の責任)

通常のスクレイピングでは、ウェブサイトの更新頻度に合わせて情報をアップデートしていくために、定期的にクローリングしていくのが通常です。

そのため、一定の間隔で当該ウェブサイトにアクセスすることになりますが、その間隔が短くなると、当該サイトのサーバにかかる負荷が重くなり、正常なサイト運営を妨げることとなる場合があります。

このような場合には、当該サイト事業者の業務を妨害したとして、偽計業務妨害罪が成立する可能性があります(刑法233条)。