IT法務・AI・暗号資産ブロックチェーンNFT・web3の法律に詳しい弁護士|中野秀俊
グローウィル国際法律事務所
03-6263-0447
10:00~18:00(月~金)

AI(人工知能)開発における「学習用データ」の取り扱いに関する法律的なポイント

ロボット・AI・ドローンの法律

AI(人工知能)における「学習用データ」を集めるあたっての注意点

AIは、多くのデータを与え分析させることによって、より有意な結果を得ることができます。

このデータを「学習用データ」と呼びます。この「学習用データ」の量に応じて、AIの有意性は大きく変わってくるのです。

事業者としては、多くのデータを収集する必要がありますが、これは特に制限なくできるのでしょうか?データの種類に分けて、みていきたいと思います。

個人情報を含むデータ

「学習用データ」として、移動、購買履歴、ウェアラブル機器からの情報などについては、個人情報が含まれている場合があります。

このように、事業者が、個人情報を含む情報を扱う場合には、個人情報保護法が適用され、この法律を遵守する必要があります。

では、個人情報保護法についてみていきましょう。

利用目的の特定・目的外の利用禁止

個人情報保護法では、個人情報取扱事業者は、以下のように規定されています。

  • 個人情報を取り扱うに当たっては、その利用目的をできる限り特定しなければならない
  • 利用目的を変更する場合には、変更前の利用目的と関連性を有すると合理的に認められる範囲を超えて行ってはならない

AIに与えるデータとして個人情報を取得するのであれば、その旨の利用目的を特定する必要があります。

これは、個人情報を含んだデータを収集する際には、事業者はプライバシーポリシーなどで、利用目的を規定する必要があります。

また、個人情報保護法では、本人の同意ない利用目的外の利用を禁止しています。

利用目的を定めていて、それに応じて個人情報を集めていた場合、AIに与え分析させることは、利用目的の範囲を超えるので、本人の同意が必要になります。

医療に関するAIは、要配慮個人情報に注意

病歴や医学的検査など医療に関するAIの活用には、要配慮個人情報に注意が必要です。
要配慮個人情報とは、以下のような情報を言います。

  • 人種
  • 信条
  • 社会的身分
  • 病歴
  • 犯罪の経歴
  • 犯罪により害を被った事実
  • 身体障害、知的障害、精神障害があること
  • 健康診断その他の検査の結果

このような情報を取得する場合には、予め本人の同意が必要とされています。

AI学習用データの第三者提供の問題

AIの開発については、複数の企業でデータのやり取りが行うことが想定されています。そうすると、個人情報を含む情報を第三者に提供することも考えられるのです。

個人情報を第三者提供するには、本人の同意が必要ですし、第三者に提供する場合には、提供する側と受け取る側については、記録義務が生じます。

改正個人情報保護法施行!個人情報を第三者提供する場合の事業者の義務とは

AI開発には、匿名加工情報の活用

上記のように、個人情報を含むデータを扱うには、本人の同意など、様々なハードルが生じます。

しかし、匿名加工情報という形であれば、本人の同意なく、目的外利用や第三者提供ができるようになります。

匿名加工情報については、「【匿名加工情報】改正個人情報保護法の改正における「ビッグデータ」活用のポイント」を参照してください。

著作物データとAI

AI大量のデータを読み込ませることが必要です。「大量のデータ」には、それぞれの著作権が発生しているはずです。そうすると、著作権との関係で、問題になってくると思われますが、実際のところ、どうなのでしょうか?

これに関しては、機械学習・ディープラーニングに必要なデータと著作権の関係で解説しています。

また、2018年2月23日の閣議で、AI・人工知能の学習のため大量の画像を読み込ませるなど、技術革新に伴う著作物の新たな利用に対応するため、権利者の利益を害さないと判断される場合は、許諾がなくても利用を認めるなどとした著作権法の改正案を決定しました。

著作物の新たな利用に対応 著作権法改正案を閣議決定

これにより、著作物データについても、幅広く、機会学習・ディープラーニングができるようになり、AIのますますの発展が期待されています。

不正競争防止法の「営業秘密」情報

AIに読み込ませるデータが、不正競争防止法の「営業秘密」に当たる場合には、不正競争防止法に基づき、営業秘密を不正に取得したような場合には、損害賠償、差止請求をされる可能性があります。

不正競争防止法の「営業秘密」に当たるためには、以下の要件が必要です。

  1. 秘密として管理されていること(秘密管理性)
  2. 事業活動に有用な技術上または営業上の情報であること(有用性)
  3. 公然と知られていないこと(非公知性)

【不正競争防止法】東芝データ漏えい事件にみる自社の営業秘密が盗まれたときの対策とは?

AI・学習用データの発展により「価値あるデータ」を保護する

AI・学習用データが発展により、著作物に該当しない、営業秘密には該当しないようなデータについても、価値が生じてきました。

このようなデータについては、法律上、十分な保護が与えられていません。そこで、そのようなデータについては、契約によって、保護を与える方法が考えられています。

具体的には、当事者間の契約で権利義務を設定し、価値あるデータを保護するのです。

経済産業省は、「データに関する取引の推進を目的とした契約ガイドライン」、「データの利用権限に関する契約ガイドライン」を策定しました。

企業としては、自社のデータについては、契約でしっかりと守るようにしましょう。