生成式AI爆火背后：数据确权、隐私与版权争议

返回首页　

设为首页　

加入收藏　

今天是:

网站首页人工智能商业智能智能家居智能手表智能手机智能通信智能电视智能汽车智能机器人

生成式AI爆火背后：数据确权…
小李谈腕表：盘点世界十大名…
世界十大手表排行榜
世界十大名表排行榜-新排名2…
全球十大名表排名
全球十大名表排行榜（排名不…
24考研题源外刊阅读《自然》…
名人名言励志语录经典短句英…
英语截图怎么翻译？分享三个…
手机游戏常见类型及英文缩写…
智能学习机必备的口语评测功…
vivo手机如何开启智能车载
打通手车生态壁垒 vivo智能车…
深耕用户需求vivo智能车载多…
打造智慧出行新体验 vivo智能…
vivo与百度合作再升级携手C…
智能家居英语单词（智能家居…
标贝科技多语种识别数据库让…
万物互联下的智能家居
力合微(688589)：深圳市力合…
智能家居：下一个20年智慧人…
智能代车
技术加快迭代自动驾驶商业化…
全面智能化揭秘奔驰新款E级…
智能汽车的概念、架构、发展…
智能汽车的技术核心是？
十大最耐用的电视机
2008十大用户口碑最佳的液晶…
2014年中国LED、液晶电视十大…
权威液晶电视推荐！十大电视…
2013年中国液晶电视十大品牌…
日本智能美女机器人Erica 将…
人工智能日本机器人艾丽卡将…
日本最美AI 机械人Erica 首闯…
日本限制电影：脑洞很大AI智…
日本人形机器人将出演科幻片
企业营销管理创新的必要性
营销创新的多层面思考
产品创新的重要性
从消费感性化趋势谈营销创新…
新时代下营销创新的价值与意…
一个AI续写一个AI演播如果人…
知见录AI续写贝多芬胡一峰
百度赴港上市用AI续写科技新…
微软摊开 AI 高分作业在线求…
AI续写贝多芬未完成作品风格…
500块的智能手表上手体验OPP…
干货满满！从500到1500元价位…
“美丽废物”智能手表每年收…
华为儿童手表 5X 系列发布：…

专题栏目

您现在的位置：智能制造网 >> 人工智能 >> 正文

高级搜索

生成式AI爆火背后：数据确权、隐私与版权争议

作者：佚名文章来源：本站原创点击数：更新时间：2022/12/15 16:07:30 | 【字体：小大】

　　无字拼图4老牌杂志《经济学人》的封面一向以辛辣和构思独特取胜，而今年年中，《经济学人》的杂志封面《Ais New Frontier》竟是一张Midjourney人工智能生成的图片。美国科罗拉多州博览会美术大赛的冠军作品《太空歌剧院（Thtre Dopra Spatial）》，也是由AI所生成。

　　普通人可以用AI生成媲美艺术家的作品，这让“一句话生成图片”在网络上爆红。硅谷知名投资机构红杉也写了一篇文章，叫做《Generative AI: A Creative New World》，一时间，也成为投资人竞相追逐的赛道，业内人士将生成式AI的赛道称之为AIGC（Artificial IntelligenceGenarated Content）。

　　本期节目，《硅谷101》邀请到了美国西北大学工业工程及管理科学系和计算机科学系助理教授汪昭然和大厂数据科学家钟凯祺来聊聊我们的使用体验，并尝试回答“一句话生成图片”到底是什么，以及AI生成图片的数据与版权问题。

　　《硅谷101》：您觉得在使用AIGC生成图片的过程中，有什么有意思的地方，跟大家介绍一下你的使用经验？

　　钟凯祺：你之前提到看过一幅照片，后面全是图书馆里的书，前面是几个机器人，那张图就是我画的。制图过程当中感觉比较重要的事是，后面一定要去学很多描述风格的装饰词，甚至是你需要的艺术家风格要明确的告诉它。比如在那一幅图里面，我就很明确地说是一个比较中古的油画风，一个人和一些机器人一起合作，在一个巨大的古老的图书馆当中一起工作。需要把这种感觉描述出来，越精确越好。接下来就是去试结果，可能试了大概20次左右，已经得到一个不错的结果。再去看看别人有没有一些更好的方案。还挺好玩的，像拆盲盒一样。

　　《硅谷101》：让我想起来在片头提到了这幅获奖作品，叫做《太空歌剧院》，我其实看了那幅作品，觉得他绝对不是一个“一句话生成图片”的初级玩家，一定是个高级玩家。

　　钟凯祺：要参赛的图片，一般是先用 Midjourney 画一个底稿，专业的画家会在这基础上再去对它用电脑做一些精修。

　　二是直接做局部：我在某一个局部想要什么，把这个做出来，然后再把几个局部的图片“捏”起来，做自己想要的构图。

　　这几类的方法现在都有，不完全直接用 AI 制图。就像摄影技术，照片生成的时候摄影也不太好直接出，因为有可能过度曝光等等的原因，必须要在弄完之后加很多的操作，这种逻辑也是一样的。等于现在还处在我们和AI作画技术不断磨合、进步的这么一个过程当中。

　　第二是整个训练和推理的过程，会在过程当中不断地进行调试：设置一定的函数，来保证达到的效果是它们想要的。它们会对某一既定的、一致的美学风格去给一些征照的打分，等等的方式来调优每一个模型自己的美学风格。

　　当然这一块我不是特别专业，但我看到过有一些专业的画师在用了各大产品后，非常详尽的评测，对它们的美学风格是有一定的差异性评价的。

　　《硅谷101》：我片头开始讲到了那幅获奖的作品《太空歌剧院》，说它引来了版权争议。这个作品它算不算你创作的？它的版权归谁？我用DALLE2生成的我们播客封面图的这两张照片，它的版权又是归谁，其他人能不能用这两幅图？它目前其实是没有任何的法律保护，在一个真空地带的。您怎么看？

　　汪昭然：这里面包含一个非常严重的问题，就是数据确权的问题。数据生成出来的模型到底归谁，包括一直到下游，你的 Prompt 生成出来的特定的图片，这个图片的版权归谁？其实现在有很大的争议。

　　这也是另外一个值得研究的热点，就是数据怎么定价、数据怎么确权、你怎么保护你自己的隐私。包括GBP-3做代码生成，还有微软现在的产品集成到Visual Studio Code里，它从把Github上的代码给读了一遍，生成出来代码到底算谁的。有些代码它的许可证可能不允许你去直接抄。如果我的模型生成代码出来的是一模一样的，比如生成了3行一样的，你很有可能就被告了。像谷歌被Oracle告Java的专利侵权，这其实是类似的。就算是人完全看一遍，自己记住再写一遍，其实也不能保证完全不一样。所以这其实是一个很大的问题。

　　那具体到数据集里面，如果出现特定人的脸，就算不是一模一样，但是大同小异，到底算不算侵犯隐私，或者我干脆就愿意把我的数据卖给 Open AI 或者是 Stability 做训练，它应该给我付多少钱，下游的分成应该分多少。这是一个很大的问题，在广义的经济学上，信息是怎么定价的？也是有很多值得研究的课题。

　　但是另外一方面，这也是好事。我们可以这样想：如果出现了一个非常严格的、可执行的数据确权、数据定价的规则，那么它马上就能形成一个非常大的数据的市场。不仅仅是大模型的，包括现在的推荐系统用到的这些数据，本质上也是从用户手里面给“骗”来的。你推荐的这些利润是不是应该给用户分一部分，现在还是非常模糊的阶段。

　　但是现在数据隐私的立法已经很完善了，我们可能马上也能看到数据的交易。不论是在美国、欧洲或者中国，可能也会有一些政策层面的改变，在这些政策下会发掘出来什么机会。很有意思，同时也有很多新的挑战需要解决。

　　《硅谷101》：我稍微补充一点，刚刚我们提到的在AI图片生成平台生成的作品，它们采用的版权协议叫做 CC0机制：它是一个开放版权协议，它的版权并不完全是属于我的。比如我虽然可以被认为是跟机器共同创作作品的作者，但是这个作品同时也可以被其他的人去使用或者修改。所以现在应该来说在法律上它是最宽泛的一种，但未来会不会收紧我们不知道。

　　我们刚刚提到的是数据的隐私的问题，但另外还有一个是昨天我看见有人转发了一条即刻，是一期Joe Rogan（美国一个非常著名的播客主持人），跟Steve Jobs（乔布斯）的采访对话。听到这里大家肯定会非常奇怪，因为大家知道乔布斯已经去世了，是不可能接受采访的。所以第一反应是不是生前的采访？它其实是一段假的，也是就AI生成的。根据比如 Joe Rogan 的数据，和乔布斯生前的采访的东西，把它整理成的一个AI的采访对话。我没有全部听，大概点进去稍微听了一下，感觉还挺顺畅的，它相当于是一个假的播客作品。因为GPT3也能写，那以后是不是AI可以生成这种大量的假新闻。我记得AI生成图片火之前，有一段时间 Deepfake（深度伪造技术）也很火。未来这种技术要怎么样去做好安全性，完全靠这些企业的道德标准吗？

　　汪昭然：对，这就是一个非常大的挑战。其实大家可能也没有什么好的解决方法，因为从原理来看，以前我们说有知识产权的保护，是因为可以很严格的比对，你到底有没有侵犯专利，有没有抄袭文章。但是现在很多东西，你说它是抄了，它也没有完全抄，但却有一些神似。就像在连续空间上不可能有两个点完全重合，概率是非常非常小的。

　　所以我觉得这些都是一些需要研究的问题，特别像生成模型，其实很多时候它会带来一些想不到的技术难点，就像您说的 Deepfake（深度伪造技术），或者是生成得一些很有冒犯性的内容，这些在某种意义上也回到了“可控生成”的问题上：什么是冒犯性的内容？其实我们可能也都没有一个共识。怎么严格定义、立法定义，因为确立规则是在这个东西出来之后，本质上都会有一些滞后性。甚至在这个时代已经不太好定义什么叫做“不好的内容”，这是非常有挑战性的。我其实就非常感兴趣在这方面有没有一些简单的解决方案，这些都是一些研究性的前沿理论。

　　钟凯祺：其实我觉得这一块未来会碰到的边界越来越多，也不断会有法规完善，可能法规和业界的发展磨合会是不断发生的，有一个碰撞的过程。Stability 的CEO Emad Mostaque 在Twitter上就说过，包括Open AI 的 CEO Sam Altman也在Twitte上说过，生成式AI的最终目标是做一个类似于像新时代的搜索引擎。

　　当你想要一幅画或者一句话、一段语音等等的时候，输入你想要的内容，直接得到一个根据历史拼接出来的结果。这个过程当中一定会有越来越多的，可能是版权、可能是安全性所带来的问题。但是我认为这个过程确实是一个未来的趋势以及不可逆的。在这个过程当中肯定也就会有数据定价。

　　前面所讨论到的问题，我理解目前技术可能还暂时不支持，但肯定会有发展的空间，因为目前学界在做的很多，包括深度学习的可解释性等等的探索，如果未来真的可以定位到一些图片或者是音频当中所用到的语料、或者是素材库的一个可解释性，比如根据Transformer当中的Attention（注意力机制）来定位到一些真正的图片当中的对象，到底哪一个在图片当中的占比最大？可能是来自于哪个艺术家等等。运用这样的深度学习的逻辑，或者是用Prompt当中的一些归因的逻辑，去确定一些数据源头的定价，这应该会成为一个新的搜索引擎以及数据定价的一个模型。感觉会有很大一段发展和思潮的路要去走。

　　汪昭然：我觉得很有意思的是，从艺术家的角度，现在的商业模式是不是会有改变？现在大家把一个特定的画去拍卖，比如画家成名之后拍卖得更贵、转卖、收藏，像NFT这种风格的。但是另外一方面，如果在未来，作为一个画家，我有没有可能去卖我的风格？因为我的风格可以生成无限多的类似风格的图片。其实已经出现了一些例子，比如有人就在他的Prompt里面加入一个画家的名字，这个画家是专门画龙的，画得特别逼真。那是不是加入画家的名字，生成出来的就有他的风格，这个画家好像现在就遇到了这样一些法律上的麻烦，到底算不算侵犯我的知识产权，反过来想，这对于画家是不是也算是一种新的机会？我来卖我的名字，卖我的风格，其实是超越了一幅特定的画、特定的作品，更广义上的一种知识产权，或者是一种艺术升华，我觉得其实也是一个很有意思的方向，可以思考。

　　一个人工智能实验室，由营利组织OpenAI LP与母公司非营利组织OpenAI Inc组成，是特斯拉创始人Elon Musk与前YC总裁Sam Altman共同创建。

　　一款AI绘画工具，只要输入你想到的文字，就能通过人工智能产出相对应的图片，耗时只有大约一分钟。

　　本文来源于钛媒体钛度号。该文观点仅代表作者本人，钛媒体平台仅对用户提供信息及决策参考，本文不构成投资建议。

　　想和千万钛媒体用户分享你的新奇观点和发现，点击这里投稿。创业或融资寻求报道，点击这里。敬原创，有钛度，得赞赏557人已赞赏>

人工智能录入：admin 责任编辑：admin
	上一个人工智能：一个AI续写一个AI演播如果人工智能学会讲故事脑洞会不会比人还大？下一个人工智能：没有了

　栏目文章

生成式AI爆火背后：数据确权、隐私与版权争议 (12-15)	一个AI续写一个AI演播如果人工智能学会讲故事… (12-15)
知见录AI续写贝多芬胡一峰 (12-15)	百度赴港上市用AI续写科技新故事 (12-15)
微软摊开 AI 高分作业在线求抄 (12-15)	AI续写贝多芬未完成作品风格很贴近贝多芬 (12-15)
家有人工智能机器人 (12-14)	一文读懂什么是人工智能机器人 (12-14)
ChatGPT爆火我们是否可以信任聊天机器人？ (12-14)	让马斯克疯狂的人形机器人！万亿级新蓝海揭秘… (12-14)
5款加持人工智能的机器人 (12-14)	中国人工智能语音语言技术发展历程、产业链、… (12-14)
未来人工智能智能语音技术使生活更便利｜数据… (12-14)	人工智能语音交互应用领域的开拓者 (12-14)
人工智能上的一颗“明珠”：智能语音 (12-14)	人工智能语音测试 (12-14)
黑科技海报 (12-14)	《人工智能》概念海报曝光不日或将上线 (12-14)
科技巨头争相布局AIGC 美图公司AI绘画推动产业… (12-14)	人工智能画海报给电影来个大变样 (12-14)

	设为首页加入收藏联系站长友情链接版权申明网站公告管理登录
	智能制造网声明：登载内容出于传递信息之目的，绝不意味着赞同其观点或证实其描述，若侵权请来信告知，我们将及时处理！