全球热头条丨马斯克硬刚 OpenAI,用户惨遭池鱼之殃
只听说过社交媒体想方设法让用户多停留的,没听说过主动给人加个上限的。如今开眼了,埃隆 · 马斯克正在给所有推特用户加 " 未成年人保护 ",而这一切,居然是被 AI 逼的?
(相关资料图)
如今推特用户每天最多能浏览多少推特,不取决于手速或者舍不舍得熬夜,而是有一个明确的数字:已验证(也就是付费的 " 蓝鸟 " 服务)账户 10000 条、未验证账户 1000 条,而新注册的未验证账户只有 500 条。
就这,还是马斯克面对愤怒的用户,两次提高后的标准。至于原因,是 " 为了解决极端水平的数据抓取和系统操纵问题 "。
他指的正是 AI 公司们,为了训练模型,这些企业需要大量数据作为喂养的饲料。去年 12 月,马斯克切断了与 OpenAI 的数据联系,今年 4 月又指责微软非法使用推特的数据。
在马斯克为阻止数据抓取采取激进措施的同时,OpenAI 正在面临一项集体诉讼。诉讼的原告有 16 名,都是个人,换句话说,都是普通的互联网冲浪人。他们指控 OpenAI 秘密地 " 从互联网抓取了 3000 亿字词 ",未经允许从互联网那个用户那里窃取 " 大量私人信息 ",以培训 ChatGPT。
一边是互联网用户和多年来积累大量 UGC 内容的平台,另一面是新兴的 AIGC 企业,一场围绕数据抓取、隐私安全的战争已经打响。
周五周五,敲锣打鼓。好不容易要周末了,推特的用户却傻了,屏幕上显示报错信息,提醒其已经超过了 " 速率限制 ",违反了推特的规则,查看了过多推文。
人们压根不知道这是什么意思,推特老板马斯克站了出来,表示的确是有速率限制,而且宣布:为了解决极端水平的数据抓取和系统操纵问题,已验证、未验证、新注册未验证账户每天的浏览上限是 6000、600 和 300 条推文。
在此之前,马斯克刚宣布推特开始禁止未登录的用户浏览内容,用户尚且能接受。限制实锤,用户麻了,继而看着这验证与否的区别对待,眉毛挑起来了:你个老六该不会是想用这招推行 " 蓝鸟订阅 " 吧?在评论区,不止一位用户评论:" 现在得用钱制胜了?"不满的声音很大,推特的竞品 Hive、Mastodon、Tumblr 等出现在热门话题里,一张推特墓碑的梗图被大量使用。争议声中,马斯克两次提高标准至验证用户 10000 条浏览、未验证用户 1000 条。
一个马斯克的高仿号调侃道:" 我设置限制,是因为你们这些推特成瘾者需要出去走走。我这是在为世界做好事啊 "。这种上价值的思路好,马斯克反手就是一个转发,自己还单独发了条 " 去拜访下你的朋友和家人吧 "。不过玩笑归玩笑,马斯克为自己的这次 " 测试 " 给出了明确的解释:应对数据爬取。用户的不满,也在于限流的做法是否有效,而不在数据爬取的问题上。AI 初创公司跑来推特 " 扒数据 " 的情况有多严重呢?马斯克在一条推文中说,流量激增,推特不得不启用备用服务器:" 在紧急情况下启用大量在线服务器,仅仅是为了给某些 AI 初创公司高得离谱的估值帮忙,这太令人恼火了。"
在限流风波的前一天,Epic Games 的 CEO 蒂姆(Tim Sweeney)还发推抱怨推特也在建墙,马斯克回复:" 数百个(甚至更多)阻止正在极其激进地爬取推特数据,到了影响用户体验的地步。我们应该怎么做?我对所有想法都保持开放。"
刚才还在抱怨的蒂姆,很快就给出了认真的建议,如在推特的服务条款中加入禁止数据爬取、以信息安全工程保护平台,以及针对大规模滥用推特的公司采取法律行动。
值得注意的是,马斯克在回复中提到," 绝对 " 会对那些窃取数据的人采取法律行动:"(乐观地说)从现在起 2 到 3 年,期待在法庭上看到他们。"
不管 " 为付费订阅添柴 " 的猜想是不是以小人之心度了马斯克之腹,马斯克高举用户隐私大旗之外,多少有可能抱有私心。4 月,马斯克被传出成立 X.AI 新人工智能公司,要对抗 ChatGPT。如果真的要训练大语言模型,推特的用户数据,当然是只给自己用最好。
不论如何,主动给平台限流都做得出来,马斯克已经做好准备,要和 AI 初创公司们硬刚到底了。
就在马斯克重拳出击给全平台限流的时候,这场 AICG 热潮的 " 始作俑者 "、ChatGPT 的造物主 OpenAI,正卷入一场集体诉讼中。
这起诉讼在美国加州北区地方法院发起,原告 16 人,均为匿名,均为个人。诉状很长,足足有 157 页,以斯蒂芬 · 霍金的一句话作为开头:" 强大人工智能的崛起,要么是人类有史以来最好的事,要么是最糟的。" 被告除了 OpenAI,还有为其注资上百亿美元的微软。
核心指控是,ChatGPT 使用从互联网上收集的数据来 " 训练其技术 " 时,侵犯了 " 无数人的版权和隐私。"
起诉书中称,OpenAI 从互联网上秘密抓取 3000 亿字词,窃听了 " 书籍、文章、网站和帖子,包括未经同意获得的个人信息 ",违反了隐私法。其中就提到了 OpenAI 爬取大量网络数据,包括社交媒体中的数据。
他们还指出 OpenAI 有个专有 AI 语料库,积累了大量个人数据,包括从 Reddit 帖子及其链接到网站中获取的数据。
这是训练模型方面的指控,此外,原告还称用户与 OpenAI 的产品的互动、在产品中的私人信息,也都被 OpenAI 非法访问、大规模盗用。
这已经不是 OpenAI 第一次在美国面临集体诉讼。去年 11 月,就有 Github 程序员对 Github、OpenAI 和微软发起集体诉讼的事件,指控 OpenAI 涉嫌违反开源许可,使用他们贡献的代码训练专有 AI 工具 GitHub Copilot。
彼时 ChatGPT 还没有上线,如今回头看,AI 训练的问题那时就已经暴露。如今,最新的集体诉讼针对的是用户更为广泛、被侵犯人群也更加广泛(基本上就是全员受害)的 ChatGPT,更重要的是,在 AIGC 的狂潮之下,任何法律先例都可能影响未来。代理该案的克拉克森公益律师事务所(Clarkson)在一封声明中,将这次的集体诉讼称作 " 里程碑式 " 的联邦案件,是对整个人工智能的警告。
从这个角度看,OpenAI 肩上的担子的确很重。
OpenAI 因数据抓取和隐私安全已经惹上诸多麻烦,平台上锁、用户翻脸都只是冰山一角。
在欧洲,OpenAI 已经遭到了多个国家的调查,甚至在今年 4 月,意大利担心 ChatGPT 会违反欧洲数据保护法,暂时封禁过 ChatGPT。
针对整个人工智能领域的监管正在推进。法国于 5 月推出人工智能行动计划,其中在 AIGC 方面,法国隐私监管机构特别关注一些 AI 模型从互联网上搜集数据、建立数据集,用来训练大语言模型的做法。
最重磅的是欧盟人工智能监管法案(EU AI Act),目前已经走向收尾阶段。该法案将有可能成为全球 AI 治理的范本。
平台、用户、监管,三股力量已经形成合围之势,誓要尽早给 AIGC 立立规矩,并且要从大模型训练这个起点开始。
一方面,时间紧迫,AIGC 发展得太快。
马斯克说 " 估值高得离谱的 AI 初创公司 " 指的是谁,咱也不知道。但这话一出,中箭的确实不少,毕竟现在 AIGC 领域融资一波接一波,全是热钱。
在初创公司里,OpenAI 估值近 300 亿美元,融资总规模 113 亿美元,是 AIGC 里最有钱的;然后是 Anthropic,第二有钱,估值超过 40 亿美元。而前几天才以 13 亿美元融资震惊硅谷的 Inflection,估值也已经有 40 亿美元,而它成立不过一年多。
大的可能还在后头。Inflection 用的是自家的大语言模型,这次 13 亿美元到手,宣布要搞 2.2 万张英伟达 H100 芯片,做全球最大的人工智能集群。如此大规模算力,目标参数量和数据集势必也是惊人的。
另一方面,ChatGPT 横空出世,等它暴露出问题时,想 " 修补 " 并不是那么容易。OpenAI 的几代大语言模型,GPT-2 数据集有 40GB 文本,GPT-3(也就是 ChatGPT 发布时用的模型)训练数据有 570GB,至于今年才发布的 GPT-4,数据集大小压根没透露。
海量的数据并没有从一开始就做好记录。谷歌前研究科学家尼西亚 · 桑巴斯万曾在采访中表示,科技公司不会记录它们是如何收集或注释 AI 训练数据的,甚至不知道数据集中到底有什么。木已成舟的 ChatGPT 就像一个黑匣子,而且是一个打造在密室里的黑匣子,如今要做透明化、隐私保护,比如罗列到底爬取了哪些数据、阐释使用过程中会如何使用这些数据、应用户要求删除某条数据,其实很难。
互联网冲浪人和监管死咬 OpenAI 们,还有一个不容忽视的原因——在社媒发展壮大的那些年,对个人网络数据保护的意识还在襁褓中,待要抗衡时,发现已错过太远。
当扎克伯格 2018 年首次坐上国会听证席时,他的社交媒体平台 Facebook 已经推出了 14 年。彼时 Facebook 身陷 " 剑桥丑闻 ",公司首席技术官称有 8700 万用户受影响。那也是一次因数据抓取酿成的大错。
等到今年 5 月阿尔特曼坐上美国国会听证席,议员频频表达着在社媒时代行动不足的悔恨,意思很明了:这一次,就算不能超前,也至少要跟上 AIGC 的脚步。
一个接一个的大模型仍然在训练当中,数据抓取是一根线头,攥住它才有望理清 AIGC 的糊涂账。
参考资料:
1、新浪科技:《马斯克跟微软杠上了?Twitter 称微软非法使用其数据》
2、黑马程序员:《这些程序员把 GitHub 告了!要求索赔 649 亿》
3、界 - 面新闻:《欧盟 AI 法案出炉,OpenAI 等公司可打几分,核心争议点有哪些?》
4、腾讯科技:《对数据的渴求正反伤 OpenAI?多国指控其违反数据保护法》
5、网易科技:《ChatGPT 在意大利恢复上线 但 OpenAI 的监管麻烦才刚刚开始》
标签:
您可能也感兴趣:
为您推荐
东莞市品牌学校工作室揭牌 长安镇中心小学获授牌
东莞横沥新的社会阶层人士联合会和新阶联揭牌成立
东莞市石排镇政务服务中心:智慧管理系统助力群众高质量服务
排行
精彩推送
- 全球热头条丨马斯克硬刚 OpenAI,用户惨遭池鱼之殃
- 今日热门!珠海三大政策“礼包”赋能预制菜产业 希望企业“用...
- 焦点速讯:逆水寒手游铁衣3V3思路与技能搭配分享 铁衣PVP心得
- 天天日报丨“我来抱!”孩子晕倒抽搐,保安抱娃飞奔送急救
- 伏特加打火机能点_伏特加怎么用打火机点火
- 八月运势大爆发,九月迎来人生转折点,财源不断,喜事接二连...
- 祝融号
- 世界通讯!点球练习赛_关于点球练习赛介绍
- 天天微动态丨外媒:日本时隔7年下调10年期国债票面利率
- 7月4日福建申远己内酰胺价格动态
- 中外合作办学是什么意思(小窃喜是什么意思)
- 罗夫莱多家族几代农民在酒乡建立了一个帝国 每日热点
- 弃()图()(弃()图())
- 世界通讯!湛江海关开展打击卷烟走私集中打击行动
- Win11系统安装WSL2 全球热讯
- 全球观速讯丨线上问诊被指花“冤枉钱” ,在线问诊乱象调查
- 中南大学与湖南艺术职院联合共同探讨红色育人模式
- rayon和viscose的区别(rayon)
- 提出多项政治目标!韩国40万人大罢工“剑指尹锡悦”
- 通讯!欧洲将提前达到天然气储存目标
- 西洋参价格100克多少钱_西洋参的价格是多少_天天关注
- 每日视点!市属公园将动态调整放票量
- 死缓是什么意思(死缓是什么意思有机会活吗)
- 每日热讯!海蛎子鸡蛋面的做法?
- 什么是村民代表大会_什么是村民代表?|每日精选
- vero moda是什么牌子汉语意思 新闻(Vero moda是什么牌子...
- 播报:光大银行客服电话24小时人工服务电话_光大银行客服电话
- 小米手机按关机键没反应
- hdmi线材对画质的影响(hdmi线材)
- 动态焦点:学思想 强党性 重实践 建新功丨河北省煤田地质局...
- 今日播报!清风半夜鸣蝉是什么季节_清风半夜鸣蝉
- 筑梦中国“芯”:康佳集团争做高水平科技自立自强“排头兵”-...
- 世界热点评!滴水贷怎么协商还款最划算?怎么注销?
- 五岳的由来的主要内容50字-五岳的由来_热门看点
- 济川药业(600566.SH):拟斥2000万元至4000万元回购股份
- 投诉中通快递怎么投诉最有效的方法(中通快递怎么投诉 95311...
- 世界聚焦:外观设计专利设计特征认定
- 爷青回!Uzi用VN帮助EDG逆袭WE
- 新消息丨天眼查联合华为云发布全球首个商查大模型:“天眼妹...
- 峨眉林雪贞下半部(峨眉神女林雪贞续)|全球速看料
- 今日建行纸白银价格走势图最新行情(7月3日)
- 自动驾驶:99分等于0,最后1分需要20年-热点聚焦
- 创智教育教师登录_创智教育教师登陆
- 现金大奖等你拿!“添彩广州红”第三届“一城百面” 打卡活...
- 环球要闻:让太行老区工业焕发新活力
- 2023安徽芜湖市公安局辅警招聘岗位计划核减公告
- 18895名岛内小学毕业生被电脑派入中学 厦门六区完成小升初派...
- 最高8000元!厦门第三批租房补贴正在申请!快来领钱啦!
- 杨紫诉生物公司侵权索赔20万 生物公司侵权杨紫李现被起...
- 热文:摸组词和部首(摸组词)
- 【速看料】山东将迎较强降雨 局地9级雷雨阵风 预报济南南部...
- backdrop & background 各自的根源;页码106,牛津高阶...
- 【环球时快讯】中国天楹:预中标8605.98万元海安高新区农村环...
- 全球快消息!江苏大学:瞄准农机特色 助力农业建设
- 世界热资讯!李斯特LFT-C透露为205mph F型敞篷车
- 全球关注:晨会聚焦
- 美重返教科文组织,为抢AI高地?
- 4k高清视频下载网站(高清视频免费下载网站) 每日动态
- “借道”期货产业重生?股民嗨了!-全球观天下
- including besides except区别_including
- 赣州技校有哪些_赣州技校
- 为什么有些高速限速80_为什么有些高速限速100 全球关注
- 天空体育:达成协议,布伦特福德将以2300万镑签下狼队后卫柯林斯
- 华晨宇承认和张碧晨生子_华晨宇和张碧晨一起参加的节目
- pt900铂金回收价格今日多少钱一克(2023年07月02日)|世界聚看点
- 欧洲部分地区Steam显示30天游戏最低价
- 速看:红米打游戏手机
- 重点梳理!2023年多肽药股票概念有哪些?(7月2日)
- 每日快看:山东济宁理工职业学院_济宁理工职业学院
- 哥伦比亚大学图书馆 哥伦比亚大学图书馆内部)_当前速看
- 全球滚动:有望四季度上市 全新哈弗H5谍照曝光
- 世界即时:限量发售1500台 奔驰G 500 V8限量版官图发布
- 焦点快报!无损伴奏 YacirJ Taisheng Music Do PoPo 'm Not Romeo pockiy Taisheng
- 世界要闻:075期蒋大拿双色球预测奖号:红球重号分析
- 沈阳五爱市场最新营业时间 沈阳五爱市场-环球短讯
- 客户服务体系相关视频(客户服务体系)
- 阿玛拉王国惩罚一贫如洗(阿玛拉王国一贫如洗)
- 索尼a7s2详细参数(索尼a7s2)
- 超大型灯泡贯流式机组?水电智能调度技术国际领先!_环球聚焦
- 十个尾兽哪个最厉害_九大尾兽的实力排名无法划分
- 今日热讯:东丽区围绕核心定位打造都市休闲消费目的地 推进...
- 光线传媒:6月30日召开业绩说明会,投资者参与-播报
- 同余方程_同余 观速讯
- 快消息!2023年07月02日05时30分欧元/人民币汇率最新报价
- 中锋替补!19年8号秀海斯2年底薪加盟湖人,放弃班巴找到天赋怪...
- 世界观速讯丨举报电话公布!事关漳州各小区全体业主
- 世界球精选!最美的不是下雨天 是曾与你躲过雨的屋檐歌词(...
- 适合夏天的穿衣搭配,凉快又舒服!
- 今日热门!总投资150亿元!高铁新城板块将大变样
- 圆锥角膜怎么确诊病因_圆锥角膜怎么确诊 每日视讯
- 都回来了?uzi怒锁vn开秀!赛后语音怒吼,可以追全杀了!
- 快播:比兴的诗句(比兴)
- 小米折叠屏什么手机发布(小米的折叠屏手机发布了吗)|世界时讯
- 消息!基于MPC的车辆控制及轨迹规划
- 生活跌宕起伏无暇谈恋爱的星座有哪些?|环球热文
- 意甲升班马弗洛西诺内官宣新帅,前罗马主帅迪弗朗西斯科上任...
- 评论丨起哄跳楼者“不跳不是人”,为何没有追刑责_当前热闻
- 官满
- 每日视讯:如何使用阿里巴巴云公测福利密码
- 全通教育监测平台 全通教学质量监测平台入口
今日要闻
- 李生论金:美联储降息,量化宽松 全球资产寻求避风港 黄金是首选
- 李兴淼:活久见 卫生蔓延全球导致的一系列问题 黄金市场巨变差点成本暴涨10多倍
- 受疫情影响,全球多家矿区停摆 黄金大幅攀升
- 疯狂的空头!黄金日内最多跌近40美元 分析师最新技术分析和预测
- 机构大胆预测:现货黄金和黄金期货双双飙升 黄金将于夏季飙升至2500美元
- 多家投行暗示黄金拐点已到!美国大规模刺激改变黄金游戏规则 两大加拿大投行建议逢低买入
- 美国经济面临黑暗时刻:股市跌跌不休 失业人数激增
- 比特币大跌下“矿圈”生态调查 230万台蚂蚁S9被迫关机 40余款主流矿机触及“关机价”
- 美股经历“黑色一周”为了应对疫情冲击 一揽子刺激计划待出
- 黄金交易提醒:金价结束六连阴!并重启金融危机时期的商业票据融资工具 避险情绪短时回归主导