ネット上のデータを引っ張って学習するという性質上、
そのデータの出自や違法性、許諾の有無までは考慮されない。
AI用のデータとして許可したもののみ、と制限すると、
極端に性能が落ちてしまうので現実的ではない。
古参のネットユーザからすれば、
アクセス出来る時点で公開データという感覚もあるけど、
勝手に自分の顔とか見える形で使われるとイヤなのも確か。
せめて元のデータが分からない程度に生成すべき、
というぐらいの制約は必要なのかなぁ。
本来は流出データの方を叩くべきだけど、
生成に使用した元データ全てを開示ってのは無理な話か。
0 comments:
コメントを投稿