ChatGPT很厉害,但还有关键问题悬而未决
2023-01-30
作者: 齐健
来源:虎嗅APP
1月27日,路透社消息称法国顶尖学府之一的巴黎政治学院宣布该校将禁止使用ChatGPT,对使用该软件的处罚可能会严重到被学校开除,甚至被整个法国高等教育开除。
“ChatGPT软件正在向全世界的教育工作者和研究人员提出一个涉及欺诈和剽窃的严肃问题,”巴黎政治学院在这份通知中称,“在没有透明参考的情况下,除特定课程目的外,学生不得使用该软件制作任何书面作品或演示文稿。”
巴黎政治学院并不是第一所宣布禁用ChatGPT的学校。ChatGPT发布不到一个月,就引起了美国教育界的高度重视。多所美国中学及大学陆续宣布校内禁用ChatGPT,并通过减少课后作业的方式,避免学生利用家庭网络访问ChatGPT作弊。美国纽约市教育部,甚至要求全纽约市的学生和教师不要使用这款AI工具,并对下辖的教育部设备或互联网设卡,限制访问ChatGPT。
AI生成内容的伦理和法律问题,正在引发社会各界的广泛讨论与思考。
AI背后的学术隐忧
“ChatGPT很好玩,但它不是作者”,这是《Science》期刊主编Holden Thorp在1月26日发表的一篇关于人工智能的社论。Holden Thorp指出,“原创”是Science发表论文的基础,而利用ChatGPT编写文本的行为,等同于从ChatGPT中抄袭。
“我们正在更新编辑政策,要求作者不要使用ChatGPT(或任何其他人工智能工具)生成的文本、数据、图像或是图形。违反这一政策将被Science期刊视为学术不端行为,这与篡改图像或抄袭无异。”不过Holden Thorp也表示,上述规定并不包含AI论文中以研究为目的生成的数据。
在AI学界,知名机器学习会议之一的ICML(International Conference on Machine Learning)最近也宣布禁止“发表包含从大型语言模型(LLM,Large Language Model)生成的文本(例如 ChatGPT)的论文(相关研究除外)”,以免出现“意想不到的后果和无法解决的问题”。
对于学术期刊和顶会论文来说,AI生成的内容最大的问题在于知识权属和责任确定问题。作为论文作者,研究人员无疑要对论文的观点和内容负责,而AI要如何对文章内容负责?如果AI生成的内容出现了谬误、不恰当、造假,甚至是抄袭剽窃,又该如何追责呢?
考虑到“AI作弊”带来的普遍问题,目前从OpenAI官方,到学术期刊出版商,以及“草根”开发者都在研究如何分辨一篇文章的“作者”到底是人还是机?
目前,OpenAI正在研发相应的AI检测工具。OpenAI客座研究员Scott Aaronson在德克萨斯大学的一次演讲中表示,他们正在通过给AI生成内容打“水印”来打击作弊。这项技术将通过调整ChatGPT生成单词的规则,在生成内容的特定位置制造“伪随机”的特定单词,读者很难察觉,但就如同密电码一样,“握有密钥”的人就轻易判断这篇内容是否是ChatGPT生成的了。
《Nature》的出版商Springer Nature也正在开发可以检测LLM的技术。而就在前不久,普林斯顿大学的一位22岁的华裔学生Edward Tian研究出了一款专门给ChatGPT挑毛病的应用GPTZero,可以通过检测文本的“困惑性(Perplexity)”和“突发性(Burstiness)”这两项指标,来判断内容是人类创作还是机器生成。
AI引发版权问题
在校外,AI本身的“道德”问题,则让美术“老师”们对新生的AI绘图工具提出了严重的质疑,这直指另一个至关重要的问题——版权。
自从AIGC火了以后,很多行业的配图工作变得轻松了许多。以媒体行业为例,严肃媒体对新闻配图要求高,既要符合文意,又要对版权负责。所以无论是美术作品还是照片,要么是亲手创作,要么来自授权图库,但很多文章受客观条件限制,要找到一张符合要求的配图并不容易。
有了AI绘图以后,很多媒体人开始尝试用AI画配图,甚至是直接绘制新闻人物的肖像。那发自己用AI做的图,总不会侵权吧?这个问题,还真不一定。
使用6penAI生成的拜登&特朗普画像
2022年下半年,AIGC刚刚蹿红,就有一些小有名气的艺术家对AI绘图提出了抗议。2022年,Erin Hanson等众多美国艺术家发起了反对Stable Diffusion的抗议行动,他们认为Stable Diffusion生成的部分画作抄袭了他们的风格,而这种行为严重侵犯了他们的合法权益。
AIGC虽然叫做AI生成,但其本身并没有创造能力,只能通过不断学习人类的生产过程,照猫画虎,AI绘图就是典型。在AI训练过程中,需要“投喂”大量的人类画作,从而学习人类的构图、绘画技巧,实现AIGC(AI Generative Content,AI生成内容)。
不过在这个生成的过程中,AI学的实在太像了,以至于很多画作直接与模型库中的人类画师风格完全一致。
“稍有名气的画师可能都遇到过作品被盗用、创意被侵权的事件。”一位国内某知名游戏公司的美术总监向虎嗅表示,虽然AI没有完全盗用画师的作品,但画师对风格上的抄袭也是很难接受的,不论抄袭者是人类还是AI。“如果有人拿着与我绘图风格完全一样的画,说是学习或是参考我觉得没什么。但如果说这是他‘生成’的,那就跟声明原创没什么差别了。不管是否用于商业用途,我都会觉得被严重冒犯了。”
AI的抄袭、剽窃和作弊不应该只是道德问题,还需要法律法规的约束。而目前,AI在很多领域都存在法律盲区。
我国AI领域的立法还处于建章立制阶段。当前已经出台了两部与AI相关的监管条例,分别是《互联网信息服务算法推荐管理规定》和《互联网信息服务深度合成管理规定》,并均已开始生效。除此以外,还有一些分散在《民法典》、《数据安全法》、《网络安全法》、《个保法》、《网络音视频信息服务管理规定》、《网络信息内容生态治理规定》等法律法规中的个别条款规定以及一些支持产业发展性质的文件,目前来说还没有成为一个完整的体系。
“AI生成内容是一项新兴的技术,法律的滞后性和稳定性导致目前还没有专门对这种AI疑似抄袭的现象进行规制。”观韬中茂律师事务所合伙人王渝伟表示,从国外行业实践来看,越来越多的平台和AI绘图工具对作品版权作出了严格要求,谨防AI抄袭导致著作权侵权。在我国,目前还是应当根据《著作权法》,判断AI生成内容与人类艺术家作品之间是否存在实质性相似,进而认定是否抄袭。
除了涉嫌抄袭艺术家作品的AIGC内容,在另一方面,即使是随机生成的内容及画作,也还是会涉及版权问题。
AI绘图在抖音和小红书上刚刚兴起之时,即有脑洞大开的网友提出,可以把AI生成的图片挂到付费图库作为收费资源,实现“躺赚”。
面对这样的骚操作,Adobe选择“有限制”地开放AI绘图。只要符合特定标准,就允许在图片库Adobe Stock中上传生成式 AI 艺术品进行售卖。但上传前必须标记 AI 制作的内容,并且需要拥有其参考图像或文本的商业版权。
作为一款开源模型,Stable diffusion的开发者Stability AI和RunwayML则认为既然开源,那么它也应该依此引用开源CC0协议,即版权归公,同时任何人也可以自由地使用,包括商业使用。而对于DALL-E 2和Midjourney这样并未开源的AIGC模型来说,生成内容的权属则相对模糊。
目前AIGC市场上也存在很多版权乱象,一些基于Stable Diffusion开发应用的厂商声称,使用自己AI程序生成的图片版权归自己,甚至依此生产NFT向使用者兜售。
对此,王渝伟认为,AI应用的使用者,在使用这种应用进行创作时,生成的图片如果符合独创性的要件,就能够构成《著作权法》上的作品。而厂商已明确告知了使用者著作权的归属问题,相当于在合同中已经进行了约定,所以这种作品的著作权应当归属于厂商。 并不是说AI应用基于开源模型开发,它所生成的作品就不存在著作权,还是应当根据《著作权法》的规定判定著作权归属。
“目前相关法律制定最大的障碍和阻力,可能是法律如何保持科技发展和伦理价值的平衡。”王渝伟提出,一方面,AI技术的高速发展,可能会与人类的基本伦理认知相违背,违反社会公序良俗;另一方面,法律的规制也不能对AI技术设置过于严苛的标准,影响AI的进一步发展。