小説投稿サイトでの本文取得防止に関する思いつき

Publish to anyone 2017-05-29 00:07:29 214views 1

先日来、女性向け二次創作作品が不用意に研究利用されてしまったことが衝撃を与えているようなので、ちょっとデーターホルダーサイドで自衛が可能か考えてみた。


1.背景と目的

2017/05/24 人工知能学会全国大会で発表されその予稿が世界的に公開された(その後非公開になった)論文[1]において、女性向け二次創作作品を中心として10件の成人向け作品が研究利用され、作品URLと作者名が掲載されるという事態が発生した。女性向け二次創作界隈以外には理解しにくいかとは思うが、女性が性的なコンテンツを書くということに伴うトラブルや、二次創作が法的にグレーであることからくる閉鎖性のため、このことは界隈に非常に深刻に受け止められている[2]。また、その結果として作品が取り下げられたり非公開になったため、当該研究の継続自体も困難な状況となってしまっている。

ユーザにとっては「タグなどで住み分けてごく私的に仲間内だけで共有している」という認識であっても、作品にアクセス可能なユーザ数が何万という規模であるため、既存の法律では「不特定多数に公開」とみなされ、引用や大規模な情報収集に対して拒否することは難しい。研究倫理で対応できる可能性があるが、それに対しても「学問の自由が脅かされる」という点を危惧する声もあり[3]、コンセンサスを得られるかは今後の状況の推移を見なければならない。このあたりは、ソーシャルメディアの普及により近年急速に拡大した私空間という状況に既存の法律や倫理が追いつけていないという話でもある。

このような状況では、女性二次創作者の「自分の私的なものは研究利用されたくない」という要望に、法や倫理で応えることは難しい。であるので、本論では技術的にその要望に応えることを検討してみる。

2.本文取得防止

近年、研究でのネットからのデータ収集が盛んになっている原因のひとつとしては、その取得のしやすさがある。情報処理しやすい電子化されたデータを簡単に取得できてしまうのが、研究でも安易に用いられてしまう原因となっている。本来、今回データを収集されてしまったサイトでは、一般向けのWebAPIを用意してはいなかったのだが、それでも取得されてしまった(ただし、今回は少数の手動コピペだったとは見られる)し、今後も防止することは難しい。

このような利用を防止するために、以下の機能の追加を提案する。

(A)ブラウザ上での本文コピー禁止
(B)HTTPのGETデータの難読化または暗号化

機能Aについては、複数の歌詞サイトでも実装されており、特段実装上の難易は少ないと考える。しかし、これだけでは、情報収集のために使われるWebクロウリングを阻止することができない。このため、機能Bを同時に実装することで、Webクロウリングで取得したデータの解析を困難にすることを提案する。研究上の利用をほぼ不可能にするには暗号化が望ましい。

暗号化については次節にて述べる。

3.GETデータの暗号化

本論で提案するGETデータの暗号化処理を下図に示す。



サーバ側では、作品の取得要求があった際に、まずユーザ情報からキーを生成し、そのキーを使って作品データ(小説本文だけで良い)を暗号化、JavaScriptで書いた復号化メソッドと共に整形して送るようにする。受け取ったブラウザ側では、まずユーザ情報からキーを取得し、復号化メソッドでキーを用いて戻して表示する。こうすることで、GET段階では暗号化されたデータしか見えなくなる。ソースを見ても通常は同様になる。

もちろん復号化メソッドを同時に送っている以上、それから独自にプログラムを組めば回避は可能である。しかし、回避行為自体が技術的保護手段の回避[4]におそらくは抵触するはずであるので、法に違反しかねない行為はできない正式な研究においては利用できなくなることが期待できる。

5.関連事例

著作権保護のために保存または送信データを暗号化するという手法そのものは、主にこれまで動画領域でおこなわれてきた。2012年の著作権改正でその主な対象となったDVDやブルーレイディスクの各種アクセスコントロールが良く知られている[4]。また、音楽や動画配信ではDRM(Digital Rights Management)[5]というコンテンツ保護がおこなわれている。

これまでテキストコンテンツについては、大きな商業的な被害が発生しにくいことからこのような対策が取られてはこなかったが、アイデア的にはこのような保護技術を(簡単な形で)テキストにも応用してみた、というだけであり、これらの技術を流用した方が早い可能性もある。

6.おわりに

かつて、レッシグが指摘したように、サイバー空間において人の行動を規制するにあたってはコード(アーキテクチャ)が重要な意味を持つ[6]。本件では、私企業がその情報を保有しているのであるから、自身のコードを変更することで、今回の研究のような外部者による目的外利用を防止し、そのユーザが安心するサービスを提供することができるだろう。

本論は単なる思いつきに過ぎず、特にアイデアの所有権を主張するものではない。むしろ願わくば、自由にこのような機能の導入を検討してみていただきたい。

参考文献

[1] 近江龍一・西原陽子・山西良典,『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』, 人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日
[2] Togetterまとめ, 『「pixiv論文」に絡む、著作権的にグレーなものは他のいかなる権利の侵害も訴えられないのか? という疑問』, https://togetter.com/li/1114409, 2017年5月27日
[3] Togetterまとめ, 『立命館Pixiv事件、学問の自由が抑圧されるのを憂慮する意見』, https://togetter.com/li/1113936, 2017年5月27日
[4] 有限会社フェイズアウトブログ記事,『DVD・BDのリッピングも違法「改正著作権法について」』, http://www.phase.co.jp/blog/?p=83, 2013年4月1日
[5] 大和 哲, 『第616回:DRM とは』, http://k-tai.watch.impress.co.jp/docs/column/keyword/602115.html, 2013年6月4日
[6] ローレンス・レッシグ,『CODE VERSION2.0』, 翔泳社, 2007年12月20日


結城由羅@世界忍者国 @yura_yuki 2017-05-29 01:07:14
メモ:ぴくぶらさん https://pictbland.net/ を見に行ったら、コピペ防止機能はすでに実装されてました。

You have to sign in to post a comment or to favorites.

Sign in with Twitter


結城由羅@世界忍者国
アイドレスというゲームで世界忍者国(http://t.co/uECplC88Ku)という仮想国家の藩王をしています(ってどんなや) / 結城由良(創作活動用) / 結城由羅(ゲーム用) / 十五夜(コア・二次創作用)
Share this page

Theme change : 夜間モード
© 2017 Privatter All Rights Reserved.