2017/05/27

pixiv論文問題と、MOOC学習履歴データの研究利用について

今週行われた人工知能学会全国大会で発表された、pixiv上の作品を用いた学会発表のことを先ほど知りました。

立命館大学の論文が炎上 pixivのR-18小説を「有害な情報」の分析対象に - エキサイトニュース(1/2) http://www.excite.co.jp/News/smadan/20170525/E1495701323038.html




確かにpixivは登録すれば誰でも閲覧できるサービスなので、分析対象となった作品は「公表された著作物」であるから引用による利用は認められ、「公正な慣行」で「正当な範囲」の利用であれば問題ない、との解釈は可能です。しかしpixivが趣味仲間による内々のネットワークにもなっていることを踏まえれば、この発表を行った研究者らの行動は作者の心情に対し配慮を欠いていたように思われます。

著作権法 | 国内法令 | 著作権データベース | 公益社団法人著作権情報センター CRIC
http://www.cric.or.jp/db/domestic/a1_index.html#032

引用が認められる条件(文化庁 著作権Q&A) http://www.bunka.go.jp/chosakuken/naruhodo/answer.asp?Q_ID=0000304

この事案から想起したのは、MOOCの学習履歴データの扱いについて、中でもディスカッションボードに書きこまれたテキストの扱いについてです。私はいくつかの研究でMOOCのディスカッションボードに書かれた内容を分析対象として扱っています。それなりに突っ込んだ議論も巻き起こるディスカッションボードのデータの扱いを誤れば、受講者のプライバシーを侵害してしまうこともあり得ます。

これに関して、gaccoでは以下のような規約により、ディスカッションボードに書き込まれたテキスト(投稿情報)の扱いを定めています。

---
gacco 利用規約(抜粋)
https://support.gacco.org/hc/ja/articles/200749224-%E3%83%A6%E3%83%BC%E3%82%B6%E3%83%BC%E3%82%B5%E3%83%BC%E3%83%93%E3%82%B9%E5%88%A9%E7%94%A8%E8%A6%8F%E7%B4%84

第22条   知的財産権

3. 会員の投稿情報についての著作権は当該会員に帰属するものとします。ただし、会員は、対価の請求をすることなく、当社および講座提供者が、本サービスの提供を含む事業運営上その他必要な範囲で、全世界において、投稿情報を複製する権利、公衆送信する権利、編集する権利、改変する権利、翻案・翻訳する権利およびその他の使用又は利用するために必要な権利を当社および講座提供者に対して無償で許諾するものとします。なお、当該権利の許諾は、会員資格が抹消された後においても、有効に存続するものとします。

ーーー
gacco プライバシーポリシー
https://support.gacco.org/hc/ja/articles/200749314-%E3%83%97%E3%83%A9%E3%82%A4%E3%83%90%E3%82%B7%E3%83%BC%E3%83%9D%E3%83%AA%E3%82%B7%E3%83%BC

3. 利用目的

当社は、取得した個人情報の利用目的について、以下の通り定めます。

(1) 本人確認、与信管理、本サービスの提供、本サービスの利用代金の計算・請求、およびこれらに関する会員へのご連絡等の実施
(2) 本サービスの品質改善等に向けたアンケート調査の実施、新たなサービス等の企画開発、当社キャンペーンの情報提供、その他サービスに関連する業務の実施
(3) 本サービスにおいて提供する講座の適切な運営、受講者のサポート、推奨する講座等の情報提供および対面学習との連携
(4) オンライン教育の発展、学術研究、広報活動
---

このように例えばgaccoでは、書き込み(投稿情報)の著作権を利用者に保持しながらも、学術研究含めた限定された範囲での利用を講師や運営母体であるドコモgaccoに対して認めています。(ただこの規約では書き込みの公衆送信だけでなく、編集・改変・翻案・翻訳まで認めており、少し広げ過ぎの感はあります)

このような利用条件をもとに、私もディスカッションボードの書き込みを分析して、受講者の傾向や講座改善に役立つポイントの抽出を見いだす研究をしています。近い将来、研究成果を学会や論文で発表すると思いますが、私自身は研究の公表に際して、

1) テキストの改変と翻案は行わないこと
2) ユーザ名を特定されるような引用を行わないこと

を自分に課しています。その理由は、テキストの改変と翻案は研究用途だとほぼ不要であり、やり方によっては発言者の意見の趣旨を変えてしまうおそれがあるからです。またユーザ名は、利用者が他のサービスでも同様のID文字列を使い、ネット空間では他のサービスをまたいで一種の実名として通用している可能性もあることから、そのユーザIDがネット上で何らかのアイデンティティを有しているかもしれないこと、また、発表や論文での公表を通じて、何かのきっかけでユーザIDと特定の個人の紐付けがなされてしまうおそれがあるからです。

pixiv論文の件は、パチパチと物事を短絡的に進めてしまいがちな情報系分野に指先を突っ込んでいる身として大いに考えさせられました。要反省です。