書いてあること
- 主な読者:外部への委託開発によりAIやビッグデータを活用している経営者
- 課題:自社で蓄積したAIの学習済みモデルやデータの流用・転用を防ぎたい
- 解決策:著作権、特許権、営業秘密などで一部保護される可能性はあるが、完全ではない。取り扱いや流用・転用の可否などについて、しっかりと契約で定めておく
1 自社のデータで学習させた売上予測システムが無断流用!
【モデルケース】
あなたは全国コンビニチェーンAの経営者です。あなたは、全国にある店舗レジから収集したPOSデータと、日時、曜日、天気、気温、イベントの有無その他の多様な社会データとをひも付けて、AIを使って機械学習させることにより、いつ何がどのセグメントに売れるかを高い精度で予測できる学習済みモデルを開発しました。
ただし、実際に開発したのは委託先のシステム開発会社Bであり、Bから納品されました。
その後、Bはあなた(A)に無断で、以下の行為をしていることが発覚しました。
- AのPOSデータを学習させて開発した学習済みモデルを、Aと競合する別のコンビニチェーンCに利用させて料金を受領した。
- Aと競合するCから委託を受けて、AのPOSデータを学習させて開発した学習済みモデルに、さらにCのPOSレジデータを学習させ、短期間に安いコストで、より精度の高い派生モデル(第二次学習済みモデル)を開発した。
- AのPOSデータそのものをデータベース化して、システム開発会社Dに提供した。
あなた(A)は、Bの各行為に対して、どのような対応をとることができるでしょうか?
2 AI解析モデルやデータの法的保護、その限界と対処方法
1)AIの学習済みモデルやデータは知的財産権だけでは保護できない!
冒頭のモデルケースについて、結論からいうと、あなた(A)ができる対応は、非常に限られたものになる可能性があります。なぜなら、
AIの学習済みモデルやデータは、著作権、特許権、営業秘密などでは完全に保護されることはない
からです。ですから、
事前に当事者間(B)の契約で、学習済みモデルやデータについての取り扱い、流用・転用の可否などについて、しっかりと定めておく
必要があります。
2)データは所有権の対象外
そもそも、
データは、単に情報を提示する無体物ですから、所有権の対象ではありません。
従って、有体物の所有者のように、故意・過失の侵害者に対して、その返還、妨害排除、妨害予防を請求することはできません。このため、
実質的にデータにアクセスできる者は、自由にそのデータを利用できるのが原則
ということになります。まずは、このことをきちんと理解しておく必要があります。
3)AI解析やデータの経済的価値の向上に法整備が追いつかず
AIやIoTを活用して付加価値の高いサービスや商品を提供したり、競争優位性を獲得、維持したりしていくことは、ビジネスを遂行していく上で不可欠の視点となっています。
その開発過程においては、生データ(ユーザーやベンダーから取得する一次的なデータ)、AIの学習用データセット(対象となる学習方法による解析を容易にするための二次的な加工データ)、AIの学習済みモデル(学習済みパラメータを組み込んだ推論プログラム)など、非常に高い経済的価値を持つ成果物が生成されます。
その一方で、それらの成果物に対する、法律上の権利関係や法的保護はまだ十分に整備されているとはいえません。ただし、AIの学習済みモデルやデータなどを守るために、法律上は、いくつかの「ツール」を利用することができます。どんなツールがあるのか、また、それぞれのツールの強みと弱みは何なのか、これらをしっかりと理解しておくことが、ビジネスを長期的に成功させるためには非常に重要です。
次章以降では、AIの学習済みモデルやデータを守るための「ツール」としての著作権、特許権、営業秘密、契約について詳しく解説します。
3 AI解析モデルやデータには基本的に「著作権」はない
「学習済みモデル」や「生データ」にも著作権がありますよね、というご相談を受けることがあります。しかし、結論からいえば、残念ながら、基本的には著作権はない、と考えておく必要があります。
著作物として認められるためには、著作権法上、「思想または感情を創作的に表現したもの」(著作権法第2条第1項第1号)である必要があります。ところが、その本質が関数である「学習済みモデル」や、単なる情報の提示に過ぎない「データ」は、「アルゴリズム」や「プログラム言語」などと同様に、通常は創作的表現とは認められません。従って、著作物には当たらないと考えられます(注)。
(注)なお、学習済みモデルのプログラム部分(推論プログラム)は、そのソースコードについてプログラムの著作物(著作権法10条1項9号)として、著作権法上の保護を受けられる可能性もあると考えられています(経産省「AI・データの利用に関する契約ガイドライン」参照)。
従って、冒頭のモデルケース1.~3.では、あなた(A)のデータではあるものの、通常は、当該データ、学習済みモデル、派生モデルについて著作物性は認められませんので、
あなた(A)が著作権に基づいてBの各行為に異議を述べることは難しい
ということになります。
ただし、学習用データセットのように、一定のルールや分類に従って整理されたデータであって、それらを電子計算機を用いて検索することができるように体系的に構成したものについては、「データベースの著作物」(著作権法第12条の2)として、著作物性が認められる場合があります。
4 AI解析モデルやデータには原則として「特許権」もない
AIの学習済みモデルやデータについては、原則として、特許権も成立しません。なぜなら、単なるデータや関数そのものは、特許法上の発明の定義である「自然法則を利用した技術的思想の創作のうち高度のもの」(特許法第2条第1項)に該当しないからです。
もっとも、データが構造を有することによりコンピュータにおいて一定の処理が可能となる場合には、発明性が肯定される可能性はあります。また、学習済みモデルも、具体的な処理に組み込まれるなどして「プログラム」と認められる場合や、コンピュータの処理を規定するものとして「プログラムに準ずるもの」といえる場合には、特許法上の発明に該当する可能性はあります。
従って、冒頭のモデルケース1.~3.では、仮にデータ構造や学習済みモデルに特許権が成立したとしても、その創作はBが行っているわけですから、あなた(A)が契約などでデータ構造や学習済みモデルについて特許権を取得しておかない限り、
あなた(A)がBの各行為に異議を唱えることはできない
ということになります。
5 AI解析モデルやデータは「営業秘密」として守られるか?
不正競争防止法(以下「不競法」)では、「営業秘密」について、その不正な開示や利用、提供などを行うことが違法とされています。生データは、一定の要件のもとでは、不競法上の「営業秘密」(不競法第2条第6項)ないし「限定提供データ」(不競法第2条第7項)として保護対象となり得ます。
従って、冒頭のモデルケース3.では、あなた(A)が提供するPOSレジデータが営業秘密等に該当する場合には、
あなた(A)は、BがDにデータベースを提供する行為について、阻止できる可能性がある
ということになります。
しかし、仮にPOSレジデータが営業秘密等に該当するとしても、これを学習して生成された学習済みモデルそのものには、すでにAのデータは含まれていません。このため、冒頭のモデルケース1.および2.では、
あなた(A)は、Bが学習済みモデルを流用または転用する行為を、直接的に不競法を根拠に阻止することは難しい
ということになります。
6 AI解析モデルやデータの保護には、事前の「契約」が重要
以上の通り、AIの学習済みモデルやデータについては、特許権、著作権、営業秘密などで一部保護される可能性はありますが、どれも完全ではありません。
一方で、当事者間の契約で定める場合には、こういった点は、契約の中でかなり自由に定めることができます。従って、前述しましたが、学習済みモデルやデータについての取り扱い、開発完了後の追加開発や流用・転用などの可否、これらデータの保存方法などについては、しっかりと契約で定めておく必要があります。
契約で定めるという場合も、一般的なひな型を用いて、「開発の結果得られた知的財産権は共有とする」といった条項では、全く不十分です。なぜなら、前述したように、AIの学習済みモデルやデータに対しては「知的財産権が生じない」場合も多くあり、仮に特許権が生じたとしても、それが共有になると共有特許は各共有者が自由に自己実施できます。結果として、相手方に無断で流用されてしまうような事態を回避できないからです。
こうして見ていくと、データに関しては、クラウドアクセス権を持つ者が優位に立てることが分かります。ですから、AIやデータに関する開発や共同利用を行う際は、「開発後のビジネスモデル」「データ」「学習済みモデル」を、それぞれがどのように利用できるかといった点について、しっかりと契約スキームを作り、それを契約で取り決めておくことが重要と言えます。
AIとビッグデータを活用する際は、事前に契約をしっかりと作りこむ。経営者はこのことを忘れずに、ビジネスをよりブーストアップしていきたいところです。
以上(2022年7月)
(執筆 明倫国際法律事務所 弁護士 田中雅敏)
pj60310
画像:areebarbar-Adobe Stock