禁止白嫖!知名程序员问答网站Stack Overflow将收费提供数据训练AI – 蓝点网

最近禁止白嫖的禁止将收据训公司还挺多,继 Reddit 宣布调整 API 计划并要求训练 AI 的白嫖公司必须签订单独的商业协议才能获取 Reddit 的数据,获取的知名站数据可以用于商业目的包括训练 AI 模型,之前 Reddit 并未限制这种商业目的程序的数据使用。
今天另一个大型网站 Stack Overflow 也宣布了类似的员问政策,Stack Overflow 是答网点网程序员圈子里最知名的网站之一,是费提聚焦于技术开发的问答网站,上面有各种代码类、供数技术类的练AI蓝提问和高质量的回答。
显然对于 AI 公司来说 Stack Overflow 的禁止将收据训数据肯定是个宝库,上面数以亿计的白嫖提问 / 帖子不仅可以训练 AI 的语言能力,还可以训练编程能力。知名站只不过后来者不能再白嫖了,程序必须付费才能使用。员问
Stack Overflow 将在今年年中推出适用于大型 AI 开发公司的专属 API,要开通该 API 并用于模型训练需要付费,具体费用未知,不过付费套餐包括 5000 万条提问 / 回答,这个数据量对模型训练来说也是至关重要的。
Stack Overflow 首席执行官 Prashanth Chandrasekar 表示:为 LLMs 提供动力的社区平台绝对应该因其贡献而获得补偿,这样像我们这样的公司就可以重新投资我们的社区,继续让社区蓬勃发展。
Prashanth Chandrasekar 将付费 API 计划描述为确保该网站能够吸引用户和是保持高质量信息的关键,这反过来也有助于未来的 LLMs 训练。
此外 Prashanth Chandrasekar 还强调任何开发者现在都可以通过 API 抓取 Stack Overflow 上的内容,但是!LLM 开发者已经违反了服务条款,正如 Stack Overflow TOS 所说,该网站提供的所有内容均采用知识共享许可,这意味着使用数据必须注明来源且开源。
而 AI 公司向客户销售他们的模型时,他们无法将数据归因于具体的问题和答案因此无法提及对应的帖子和作者,所以这是违反知识共享许可的。(言外之意就是诸如 OPENAI、微软、谷歌等公司实际上都是侵权的)
相关文章
- 2018年3月,哈佛大学Sinclair团队在《Cell》上宣告的一项试验服从展现,NMN可清晰逆转哺乳植物因朽迈引起的心脑血管老化以及举念头能进化,并使暮年试验植物的体力抵达了同龄比力组的1.6倍以2025-04-06
- 618周全开启618周全开启。随着苍生经济的昏迷提速,作为年内规模最大、优惠力度最高的匆匆销节点之一,越来越多的企业用户也启动散漫自己营业睁开的需要,在工业物料台式电脑、办公配置装备部署、员工福利等方2025-04-06
- 新华网北京6月6日电记者 樊曦)记者6日从中国国家铁路总体有限公司懂取患上,6月8日起,宁杭高铁、京港高铁合黄段合肥南—黄梅东)将正式推出30日定期票、20次计次票等新型票制产物新华网北京6月6日电记2025-04-06
- 1. 用户直接或者经由种种方式直接运用慧博投研资讯所提供的效率以及数据的行动,都将被视作已经无条件接受本申明所涉全副内容;若用户对于本申明的任何条款有异议,请停止运用慧博投研资讯所提供的全副效率微信2025-04-06
- 市场经济不断的睁开,越来越多的美食出如今餐桌之上,良多破费者都很喜爱中餐行业的美食,想要投资一个特色的中餐品牌。百艳青花餐厅投资便是一家颇为有特色的中餐厅,这个品牌主打中西散漫,差距的口胃相互融会,受2025-04-06
- 自古就有“女为悦己者容,君为知己者去世”之说,以是女子为了鉴赏自己的人服饰是不甚么不可以的自古就有“女为悦己者容,君为知己者去世”之说,以是女子为了鉴赏自己的人服饰是不甚么不可2025-04-06
最新评论