AIの学習済みパラメータについての著作権法上の取扱いについては、法律上、どうなるのでしょうか?
学習済みパラメータは、学習用データセットを、AIのプログラム部分に読み込ませることで生成され、数値行列として表現されることが多いと考えられます。
このようにプログラムを操作することによって、アウトプットが発生するものについても、当該アウトプットが著作物の要件を満たす限り著作権が発生します。
裁判例では、裁判所は、衆議院議員総選挙の立候補者の当落予測を○、△、▲の記号で示した当落予想表について、国政レベルの政治動向の一環としての総選挙の結果予測をしたものであり、しかも、その表現には作成者の個性が表れているとして、著作物性を認めています。
したがって、学習済みパラメータが数値であることだけを理由に、著作物性が認められないということにはなりません。
それでは、数値で表現された学習済みパラメータは著作物として保護されるのでしょうか?
前述の通り、学習済みパラメータが著作権法で保護されるためには、著作物としての要件を満たす必要があります。
ここでは、(1)思想または感情の表現と(2)創作性があるか問題となります。
学習型AIの場合、学習済みパラメータの生成は、AIのプログラムが自動的に行います。
著作物は、思想または感情を表現したものである必要があるところ、AIには思想または感情がないと解されているため、AIが生成した表現は著作物としての要件を満たしません。
学習済みパラメータの生成に際し、まず、人間が学習用データセットを作成し、AIのプログラムに学習用データセットを与えるという点において人間が関与する必要があります。
しかし、そのような学習用データセットを与えたことのみによって、学習済みパラメータが人間の思想または感情を表現したものであるとするのは困難であると考えられます。
もっとも、学習済みパラメータの数値は、ニューラルネットワークの構造をベースに、そこに設定された活性化関数、出力層からの出力と正解データとの誤差(損失)率の計算方法、誤差の最小化方法などによって計算されることになります。
これらは、学習済みモデル作成者の思想を体現したものです。
また、AIに投入する学習用データセットについて、どのようなデータを使用し、どのような前処理をするか、AIをどのように学習させるか、学習回数を何回と設定するかなどによっても影響を受けます。これらも学習済みモデル作成者の思想が表されたものです。
文化庁著作権審議会第9小委員会報告書では、コンピュータ・システムを利用して創作したコンピュータ創作物について、人間による「創作意図」と、創作過程において具体的な結果を得るための「創作的寄与」があれば、コンピュータを道具として創作したものとして著作性が肯定されたとする見解を示しています。
そうだとすると、学習済みパラメータの作成について、学習済みモデル作成者の創作的意図と創作的寄与があるのであれば、コンピュータを道具として創作したものであり、学習済みパラメータは、学習済みモデル作成者の思想または感情を創作的に表現したものとして著作物性を肯定されるケースもあり得ます。
そして仮に、学習済みパラメータが著作物として認められるとした場合、その場合に誰が著作者になるのかということが次に問題となります。
学習済みパラメータの作成に創作的に寄与した者は誰かを考えると、それは学習済みモデルの作成者ということになります。
これに対し、元データや学習用データセットの単なる提供者は著作者としては認められないことになります。