树大招风的 ChatGPT 又遭起诉用以训练的数据究竟值多少钱？焦点热议

当前位置：资讯 > >正文

2023-06-29 10:26:59 ZAKER科技

财联社 6 月 29 日讯（编辑马兰）人工智能虽然是今年最大的趋势之一，但事实上业内外对这一技术现在都有些摸着石头过河的感觉，无论是监管还是行业内部都不知道如何规范其发展。

【资料图】

而 ChatGPT 作为掀起人工智能热潮的产品，更是处于风口浪尖。周三，美国一家律师事务所向加州北区联邦法院提起集体诉讼，指控 OpenAI 和微软使用互联网抓取的信息来训练 ChatGPT 时，严重侵犯了无数人的版权和隐私，要求公司赔偿 30 亿美元。

Clarkson 律师事务所的执行合伙人 Ryan Clarkson 表示，希望代表信息被窃取并被商业应用的人采取法律行动。

其在诉状中指出，尽管制定了购买和使用个人信息的协议，但被告采取了不同的方式：盗窃。OpenAI 和微软系统性地从互联网中窃取了 3000 亿个单词，包括未经同意获取的个人信息。

诉状称，OpenAI 秘密进行了数据的窃取，而没有按照适用法律的要求，注册为数据经纪人。数百万人的个人信息，包括账户信息、姓名、联系方式、支付信息、聊天记录等隐私数据都在未经许可的情况下，被 OpenAI 和微软收集、存储、共享和披露。

课本费

这一诉讼无疑触到了生成式人工智能的一个重大问题，即训练人工智能用到的大量 " 课本 "，需不需要相关公司来买单。

Clarkson 认为，写下数十亿字的人们从未同意让 OpenAI 这样的公司用来训练模型并谋取私利，他希望法院能够就人工智能算法的训练方式，以及人们数据被使用时如何获得补偿制定一系列监管措施。

Clarkson 律所还称，之所以起诉 OpenAI 和微软，也是枪打出头鸟。因为 ChatGPT 的推出引发了人工智能军备竞赛，刺激了大量对手推出 AI 模型，因此，OpenAI 和微软当然是第一目标。

目前已有 16 名人士列席原告，Clarkson 律师事务所还在寻找更多的原告。

虽然 OpenAI 并没有透露其最新模型 GPT-4 使用了那些数据，但此前的 GPT 版本已被证实使用了维基百科、各大新闻和社交媒体评论中的数据。谷歌和其他公司的聊天机器人也采用了类似的数据集。

Gunderson Dettmer 事务所的知识产权律师 Katherine Gardner 分析，艺术家和其它创意专业人士若证明他们受版权保护的作品被用来训练人工智能模型，或许可以对人工智能公司提起异议，但仅仅在网站上发帖或评论的人，不太可能用版权保护来获得赔偿。

截至目前，OpenAI 和微软尚未对此事发表评论。

X 关闭

往期话题

科技助力打造高性能中国冬奥“战衣”