生成式AI发展与监管白皮书2:知产侵权、算法黑箱何解?
时间:2023-07-25 19:08:58来自:21世纪经济报道字号:T  T

编者按:自1956年“人工智能”的概念首次被提出已过60余年,此间,人工智能从虚化的代码逐渐转化成实践应用,催生出一批批商业故事。不过,人工智能规模化商用并非坦途,概念的火热一直以来未能助推技术突破与商业应用。

时间来到2022年,生成式AI发展为人工智能发展再注入一针强心剂。ChatGPT横空出世,被视为通用人工智能的起点和强人工智能的拐点,引发新一轮人工智能革命。人工智能发展似乎找到了自己的主流叙事。

不过,技术创新的同时也带来了监管难题。如何平衡发展与安全,中国正在摸索自己的AI治理路径。南财合规科技研究院与观韬中茂律师事务所推出《中国AI治理的独立思考——生成式人工智能发展与监管白皮书》,通过分析生成式AI的发展现状、政策导向、实操中面临的风险,以及各国的监管路径,以期为未来的AI治理提供有益思路。

海量数据、庞大算力、巧妙算法,是生成式人工智能发展的三个核心要素。在“海量数据”这一暴力美学催生下,生成式人工智能突破了某种桎梏,变得无所不知,可以就任何问题侃侃而谈。

正如海面上的冰山,只是我们所能看见冰山的一部分,巨大的风险和未知隐藏在冰山之下。

海量数据作为燃料催动大模型,但因大模型厂商数据来源的不合规,现实生活中面临来自知识产权保护创意和创新的反击,不少企业面临侵权诉讼提告。

而作为人工智能“发动机”的算法,驱动人工智能继续发展,但考虑算法本身透明度和可知性的有限,人工智能能否如同最初所设想走在正确道路之上、助力人类发展,同样面临来自现实的挑战和考验。

海量数据:或侵犯知识产权及商业秘密大模型面临的数据侵权风险,是其发展过程中的先天不足。可以看到的是,当前中国,数据已经成为生产要素之一在发挥着自己作用。但同时,数据权利归属复杂,相关产业链多方主体间利益纠葛、应用场景的复杂多样,都给数据发展和利用蒙上了一层不确定性的面纱。

大模型亦无法解决因不确定性带来的知识产权法律挑战。如近日,一批匿名人士向OpenAI,以及其投资方之一的微软公司发起集体诉讼。因OpenAI秘密从互联网上窃取了3000亿个单词,窃听了“书籍、文章、网站和帖子——包括未经同意获得的个人信息”。这并不是OpenAI第一次陷入数据安全、个人信息泄露相关的指控,同样也不会是最后一次。

具体来看,生成式人工智能的知识产权法律风险主要来自于著作权侵权、侵犯商业秘密等。

著作权侵权方面,基于大模型对语料丰富度的较高需求,无论是模型输入端,还是模型输出端,均存在较大的侵犯著作权的可能性与风险。

在输入端,大模型在构建过程中需要“学习”大量文本语料,而在获取文本语料时,可能会因未征得权利人许可复制、改变或者传播而涉嫌侵犯他人著作权。例如,某全球知名图片提供商起诉了某AI绘画工具的开发者,称其未经许可从自己的网站上窃取了数百万张图片。需要注意的是,将生成式AI模型应用于商业用途本身已经明显超出知识产权法律中界定的“合理使用”的范畴。

在输出端,判断著作权侵权的第一步是看生成内容能否被判定为著作权法中所定义的“作品”。根据以往判例,法院在对“作品”进行判断时,曾认定“作品的创作主体应限定为自然人”;同时,是否满足“独创性”也是判定是否构成作品的标准。

不过,就算生成内容无法达到作品的标准,与原作品构成实质性近似,仍可能构成知识产权侵权。此外,大模型训练的文本语料数量越是匮乏,生成内容的知识产权侵权风险就会越高。生成内容还将受到使用者提问方式的影响,如使用者的提示词极为限缩、精准,也将增大生成内容侵犯他人知识产权的风险。

商业秘密侵权方面,训练数据是修炼大模型的“原材料”,在大模型的静态与动态训练的过程中,可能会出现使用来源不明或者非法的数据信息的情况,如果前述信息中包含商业秘密,那么依据竞争法下的相关规定,将构成对他人商业秘密的侵害。

同时,随着大模型影响力的扩大,企业可能会将其纳入办公系统以提升工作效率。而企业员工在训练和使用模型的过程中,如不慎输入企业的商业秘密,不仅可能造成公司商业秘密的直接泄露,甚至可能被模型存储于数据库中作为训练数据,如遭受黑客攻击,公司将进一步蒙受损失。

从企业防止商业秘密外泄的角度,如何约束员工在利用大模型提高工作效率的同时,又能避免对企业商业秘密的侵犯,也将成为相关法律合规部门需要思考的问题。

技术底座:或存不正当竞争和垄断风险生成式人工智能的未来,不只是对话和沟通,甚至会成为新的基础设施,赋能行业和产业的发展。以目前趋势,大模型将成为上层应用的技术底座,会支撑智能终端、系统、平台等产品应用落地。

竞争角度来看,生成式人工智能或将面临不正当竞争和反垄断风险。

不正当竞争方面,大模型在协助编程、广告设计、文学创作等领域表现优异。用户在使用大模型生成广告文案时,其生成内容可能与他人广告文案、知名商品名称、知名企业名称等存在相似。考虑到这类文案、名称等通常篇幅简短,较难

  • 浏览记录
  • 我的关注
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持