生成AIと著作権の問題の終局的解決

生成AIと著作権の問題は重要な問題となっている。生成AIと著作権の問題の終局的解決が問題となる。終局的解決には、大きく2つの方向性があると思われる。

1.AI学習データを著作権的にクリーンにする(スーパークリーンアーキテクチャ―

2.AI自身が著作権的に問題のある出力を出さないようにコンプライアンスを行う(コンプライアンスアーキテクチャー

いずれの方向性にも有用となるのが、一般から大量のデータを集められるデータインカムの制度である。

1.スーパークリーンアーキテクチャ―の方向性

現在は、インターネットをクロールしたデータなど、著作権的にクリーンでないデータでAIが学習されていることが多い。

インターネットをクロールしたデータのデータ量は、たとえばコモンクロールは数PB(ペタバイト)と巨大である。しかし、日本の人口を1億として人数で割ると、一人50MB程度にしかならない。これは、個々人がどの程度のデータをインターネットに上げているか(SNS、ブログなどをやっていない人はほぼゼロ、やっている人でもたとえば数MBなど)からフェルミ推定すればわかるであろう。

よって、データインカムの制度で、1億人から1人当たり50MB程度(たとえば写真20枚分)を集めれば、データ量としては、数PB(ペタバイト)になる。

問題は、インターネットをクロールしたデータは、多様性があることである。品質は様々だが、インターネットには多様なデータがある。

データインカムの制度で、一般からデータを集めたとき、十分に多様性のあるように募集をかけて、データの品質を高めることができれば、著作権的に安全な生成AIを容易に作れるようになるだろう。

もっとも、データインカムの制度では、他人の作品を盗用したりする人が出るという懸念を感じる人もいると思われる。しかし、これは特許の審査などでも同様であり、審査官を故意に騙せば、特許詐欺罪により処罰されうる。そもそも、データインカムでもらえる報酬は、多くの人からデータを集めるために、1個人当たりでは大きな金額ではないので、そのようなリスクを冒すのは、全く引き合わないであろう。また、生成AIの使用の有無・程度や自己が作成したデータであること等の申告も必要であり、審査は、AIを活用して行われ、インターネットや既存著作物データベースに入っている著作物と類似していないかなどはAIが入念に審査するので簡単に発覚する。万が一発覚せず、超巨大データベースの中に入った後も、問題が発覚すれば除去され、データインカムがもらえないだけでなく、損害賠償等も課されるように制度設計できるので、全く引き合わない。また、ルール違反をした人はデータインカムの制度を一定の期間利用できなくなるように制度設計できる。

高品質なデータは、企業や著作権管理団体等からも集めることができる。著作権者が望む場合のみ、超巨大データベースに入れることができるので(Opt-In方式)、著作権者は自己の著作物をAIに学習させるか否かを選択できるようになる。

また、データインカムの制度は外国からもデータを集めることができる。既に十分に集まったデータ(たとえばスズメの画像)は、事前に募集終了が表示され、データの多様性を確保する。

また、データの多様性の確保と共に、AI開発企業等が「このようなデータが欲しい」という要望を出して、必要性が高いデータを重点的に集めることもできる。

このように、著作権的にクリーンな超巨大データベースを作っていく方向性が考えられる。制度設計を工夫する必要があるが、自律AIの時代には不可欠な制度となろう。

2.コンプライアンスアーキテクチャーの方向性

AI自身が著作権的に問題のある出力を出さないようにコンプライアンスを行うコンプライアンスアーキテクチャーの方向性も考えられる。上記との併用も可能である。

コンプライアンスAIは、たとえば、著作権法上の「類似性」を満たすか否かを判断する。

現在の著作権判定AIでも、一定の類似度のチェックをするなどして、ある程度の判定はできる。しかし、裁判所の判断とほぼ完全に一致するものを作るには、著作権の判例だけでは全くデータが足りない。

著作権法上の類似性の判定データを専門家から大量に集める必要があり、データインカムの制度が有用となると思われる。

裁判所の判断自体に振れ幅があるため、完璧なものは作れないが、誤認識率が極めて低くなった時点で、著作権判定AIを国などの公的機関が認証し、それを出力前に使ってコンプライアンスアーキテクチャーを採用したAIについては免責・補償するという法制度にすることが考えられる。それにより、著作権的に安全な生成AIを作ることができ、生成AIと著作権の問題の終局的な解決に向かうことができる。

3.さらに詳しく知りたい方へ

 上記アーキテクチャーについては、法律を守るAIのアーキテクチャーの研究として、人工知能学会で発表をしている。

 また、データインカムについて詳しく知りたい人のリンクからより詳しい情報にアクセスできる。

 現在の生成AIと著作権の問題は、今後の自律AIの時代に適応できていないと思われる。たとえば、非常に煩雑なAIの適切な利活用等に向けた知的財産の保護及び透明性に関するプリンシプル・コード(仮称)(案)が検討されており、多くのAI事業者に大きな負担がかかってくるおそれがある。それで著作権者側の問題が解決するわけでもない。生成AIと著作権の問題の終局的解決ができないと、誰も幸福になれない未来になってしまうおそれがある。

 生成AIと著作権の問題の終局的解決に向けて、データインカムの制度について検討を深めていく必要があると思われる。

タイトルとURLをコピーしました