爸放手我是你媳妇改编电视剧雷军爸放手我是你媳妇改编电视剧也成了AI语音的受害者?_ZAKER新闻
雷军爸放手我是你媳妇改编电视剧也成了AI语音的受害者?_ZAKER新闻
但是,欧洲不是非要参与美国的这场权力游戏。正如法国总统埃马纽埃尔·马克龙2023年早些时候一针见血指出的,卷入这样的博弈“对欧洲而言是个陷阱”。
本文来自微信公众号:王智远,作者:王智远,原文标题:《雷军,可能有点心烦 ...》,题图来自:AI 生成雷军最近可能有点心烦……烦什么?你听到了吗?最近,有不少人用雷军的声音进行二次创作,做成各种段子。我听完之后,觉得既搞笑又无奈。比如:" 老子踏 * 一眨眼,国庆节就过去了,我又得拖着一大堆破行李去上那个 X 班;假期里,躺在抖音上刷视频的废物们,大家好,我是雷军,你们千万不要用小米手机看黄片。"还有更雷人的内容,在哔哩哔哩上,他的 AI 语音被用来制作各种游戏解说、话题封面语,比如打篮球、打麻将,主打一个 " 不爽 ",吐槽和评论非常犀利。至于让我感到无奈的部分,却不太好描述。在写这篇文章之前,我把其中一个短视频发给了我爸,并问他:" 你觉得这个短视频有什么特别之处吗?"我爸回答说:" 挺有意思的。" 但他并没有提到语音的问题,换句话说,他根本没意识到这是 AI 生成的语音。可见,AI 语音已经能够达到以假乱真的地步了。一不过,这次假语音和之前 "Are you ok?" 有很大不同。Are you ok,内容属性不强,本身没什么恶意,也不会引发误会,最多让本人觉得有点尴尬;雷军甚至还幽默地回应过,还把版权买下来,从营销的角度来看,这反而成了一种正面的宣传。但 AI 语音有点不一样。现在网络上,大部分雷军 AI 语音,都是网友们用他的声音说的一些很过分的话,什么 " 远程操控小米手机炸死你 " 或者 " 我开小米 SU7 撞死你全家 "。这些话相当极端。不了解的人,会认为真是雷军说的,已经涉及到造谣的问题。AI 语音有很多种形式,常见的包括:语音合成、语音克隆、语音识别、深度伪造和自然语言处理。前三种大家比较熟悉,后两种是最近两年才逐渐流行起来的。深度伪造(Deepfake)是由 " 深度学习 "(deep learning)和 " 伪造 "(fake)组合而来,意思是用深度学习技术来模仿人的声音和图像。而自然语言处理(NLP)是让计算机理解和处理人类语言的技术,应用非常广,比如:智能客服和语音助手。很多创作者在给视频配音时,为了省时省力又不想出镜,通常会先写好文字,再用 AI 来朗读和合成。拿我来说:一般会选择港版男普通话、广西表妹或东北话,这样让文本画面和其他地域口音结合,刚好形成了鲜明的反差感。这些技术的作用是停留在语音合成和搞笑方面,确实没什么特别的影响;但是,一旦涉及到名人 IP 效应再加上搞笑,同时还试图进行文化层面的输出,情况就大不相同了。因为这不再是单纯的逗趣,还可能引发各种社会反应。之前关于 " 三只羊 " 卢某某的录音想必不少网友刷到过,那段语音听起来非常逼真,引起了很多人的讨论和担忧,我听完后都感觉像真的,甚至还在群里吐槽事件本身太颠覆三观了。不过,9 天后(2024 年 9 月 26 日),合肥市公安局很快发布了官方回应,说那是假的,并提醒大家不信谣、不传谣。假语音威力不比短视频小,短视频有画面,更容易分辨真假,但语音却很难区分,这就更容易误导人们。二国外也有类似事件。我用 Perplexity 查了一下关于 AI 造假的新闻,发现他们甚至把目标对准了总统,问题上升到了政治层面。根据《连线》杂志的报道,今年年初,一些新罕布什尔州的选民接到了冒充 " 拜登总统 " 的自动语音电话,试图误导他们在初选中投票。白宫新闻秘书确认,电话是伪造的,并非总统录音。美国联邦通信委员会(FCC)主席杰西卡 · 罗森沃塞尔(Jessica Rosenworcel)表示,近年来,机器人电话中使用的 AI 生成语音变得越来越先进,这些语音可以模仿名人、政治候选人,甚至亲密家人的声音,从而制造虚假信息,误导公众。她强调,如果语音克隆公司在开发应用时涉及名人、可能误导公众、传播风险高的内容,应该在传播中加上明显的标识,提醒公众注意。" 我们建议,将使用 AI 生成语音的机器人电话(robocall)视为非法。"另外,还有知名歌手泰勒 · 斯威夫特的 AI 伪造 " 不雅照 " 在网上疯传,这类 AI 造假事件引发了人们对人工智能的广泛担忧。几天后,造假的人被找到,他坦言自己用 AI 工具 ElevenLabs,仅花了不到 20 分钟和 1 美元就完成了造假,是不是很惊人?今年 3 月,一位记者发现,只要在上传文件开头加入一分钟的静音,就可以绕过规则,成功克隆特朗普和拜登的声音,尽管技术可以用来对抗技术,但 AI 检测软件往往无法有效识别 AI 生成的音频。难道,AI 生成语音真的能强大到这种地步吗?其实我也有疑虑。自从 " 三只羊 " 卢某某 AI 录音事件后,我一直关注着回应此事的品牌(某声)的进展。他们的网站上确实有雷军的 AI 合成声音,大家可以自己去试听,音色与真人非常接近,而且发布的数量也不少,这给了许多蹭热度的机会,他们利用名人的声音制造话题。不仅是雷军,现在很多互联网平台,比如抖音、B 站,都有大量与马保国、葛优、" 麦克阿瑟(一位模仿网红)" 等名人声音相关的视频。这些视频利用的是 AI 配音技术,你只要选择相应的人物声音,然后输入文字,就能生成该人物声音的内容;虽然很多程序会用代称来规避版权问题,但提供的声音种类多达上百种,还可以调整语速和语调。图释:某声品牌社区广场,仍可以搜到一些名人音频截至写这篇文章,在(某声)社区角色市场,依然可以找到雷军、蔡徐坤、卢本伟、刘亦菲、成龙等名人的仿声合成音,你很难分辨是否是真人。我并不是单单批评某一个软件,而是整个语音生态似乎都存在一些问题,这引发了我们的思考:以前互联网平台只对图文和视频进行管理,现在进入了 AI 时代,AI 成了一种新媒介。那么,AI 作为媒介载体做出来的平台,是不是自身也要自我管理?是不是得要求用户,非本人不能用别人的声音伪造?至少现在看来,属于三不管的地带,没有很细节的法律条文、也缺乏清晰的社区规则。三既然提供技术的平台监管不到位,那么,发布平台就真的无法监测吗?比如,我将 AI 语音发布到抖音、快手等平台,难道它们就无法检测到问题?问了一圈懂行的朋友,他们说,这涉及到两方面问题。从技术角度,语音模型的自动语音识别(ASR)和文生文、文生图的原理相似,它们首先都要大量的语料来进行训练,只有这样才能生成更多精细化的模型。这些模型越细分,语音识别效果就越好。这让我感觉,这像是一个层层递进的套娃游戏。另外,目前国内主流的 ASR 技术多采用端到端模型(End-to-End Models)。这种模型通过一个网络,将输入的语音直接转换为输出结果,简化了传统 ASR 系统中多个复杂组件的流程。这使得识别过程更加高效,但中间环节也减少了。比如说:当你对着手机说 " 今天天气怎么样?",端到端模型能直接将语音转为文字,查询天气信息,并告诉你结果,这种方式非常快捷,但它不具备中间的感知能力。虽然现在主流的 AI 语音模型开始采用更深度的学习框架,如循环神经网络(RNN)、长短时记忆网络(LSTM)和 Transformer 来处理一些关键部分,但这些技术仍处于早期阶段。面对一些更复杂的情况,如方言和多音轨的噪音,模型依然存在局限性,因为训练数据不够全面,模型能力有限。从审核机制来看,问题就更明显了。一位技术朋友提到:2018 年,有一则新闻,今日头条的创始人张一鸣发表了一封公开信,回应 " 内涵段子 " 被关停的事件。在信中,他提到为了弥补算法和机器审核的不足,需要加强人工运营和审核,将 6000 人的审核团队扩大到 10000 人。同样,快手当年也采取了类似措施,将 2000 人的审核团队扩展到 5000 人。他们都认识到,在 " 算法是否具备价值观 " 的问题上,必须加大投入。当年视频面临的问题,现在 AI 语音也遇到了。平台审核机制分为两部分:机器审核和人工审核。机器审核能快速识别明显违规的内容,但对于隐晦、复杂的内容,机器可能判断不准确,就要人工审核。AI 语音的复杂性不亚于视频,不同语种、口音、语速等都会影响识别效果。要逐帧处理这些因素,并且应对 AI 生成的以假乱真的音频,是一项极大的挑战。你想想看,用 AI 生成一个音频,再让它自己识别是 AI 生成的,这种循环无疑是对技术的极大考验。要想实现 " 魔法打败魔法 " 的效果,平台要投入更多资金和资源,这不仅困难,还要时间;因此,我们正处在一个技术、伦理与监管并行发展的新阶段。四一个在大厂工作的朋友告诉我,目前传播内容的平台针对这种 " 灰度空间 " 有三种处理办法:第一,检查元数据是否有隐性标识。所谓隐性标识,即音频里用来确定内容的来源或生成的方式,目前,这项技术已经有所发展和应用。类似于字节跳动早年自研的隐藏水印算法,现在已经应用到各种产品上。今年 3 月 14 — 15 日,中国人工智能产业发展联盟(AIIA)发布了 " 信元令 " 数字隐写标识平台,也在大力推广。简单来说,他们都在解决同一个问题,即让 AIGC 生成的内容自带标识,这种标识人看不到,技术却看得到。第二个办法,提醒用户自行添加说明。如果平台未检测到隐性标识,会提醒用户主动标明内容来源。你可能也见过在发布内容时,可以选择标注 " 取自网络 ""AI 生成 " 或 " 原创拍摄 "。用户不想自己声明,也没有隐性标识,那平台会进行第三种办法:抽样检测。一旦发现语音中有 AI 的痕迹,就会直接添加提醒标识。了解了这些,你就能明白,为什么有些视频下方会出现 " 疑似使用 AI 生成技术,请注意甄别 " 的提示。为什么说是 " 疑似 " 呢?因为目前 AI 还无法完全准确地识别另一个 AI 生成的内容。不过,有一个前提:除非某个内容真的引发了广泛关注和巨大舆论,平台才会主动干预。否则,面对海量内容,平台很难做到逐一审核。所以,防范 AI 语音,不只是个人和企业的责任,更要技术提供商和社会各界一起努力。在深度伪造泛滥的时代,雷军成为了国内第二个因 AI 语音造假而受到影响的人,我们看看段子就好,千万不要成为传播的始作俑者。总结AI 正在模仿真人。我想提醒大家,在网上浏览视频时,要多留一个心眼,最好不要默认一切都是真实的。技术无罪,就怕别有用心,希望我们能明智地使用它,推动社会向积极的方向发展。本文来自微信公众号:王智远,作者:王智远koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:张国柱
TOP1热点:河工大要搬回河北
“这实实在在解决了我们的顾虑,终于可以放心‘拍黄瓜’了!”7月12日,个体工商户于丽看到新修订的《食品经营许可和备案管理办法》(以下简称《办法》)对“拍黄瓜”、泡茶等简单食品制售简化许可,立即点赞、留言、转发。。
时代是思想之母,实践是理论之源。习近平总书记关于网络强国的重要思想,源于网络强国建设的生动实践,又指导网络强国建设取得重大成就,体现了历史逻辑和时代逻辑、理论逻辑和实践逻辑的内在统一。
TOP2热点:2024图灵奖颁布
科学的世界观和方法论是我们研究问题、解决问题的“总钥匙”。
TOP3热点:1元发卡巴黎世家卖到2700元XXXXXL19Dwc
监制|刘鑫席罗曦
8月26日,习近平在乌鲁木齐专门听取新疆维吾尔自治区党委和政府、新疆生产建设兵团工作汇报。习近平强调——
TOP4热点:海底捞输了的要让对方随意处罚作文
4月19日,贵州电网公司党委与大方县委召开专题工作会,双方决定共同组建工作专班,加快电网建设改造。4月24日,项目建设工程全面启动。
TOP5热点:蜘蛛会「继承」其他蜘蛛的蛛网吗浏览器被屏蔽了怎么办
“谁剪吴江一幅绡,巧裁衣样缕华袍。”吴江的这幅绡,就是为人津津乐道的宋锦,曾经的宫廷锦绣在节目中被巧妙融入品馔会的场景,每一个花纹、每一种技法都有了新时代的新寓意,经纬交织的中式之美以一种全新的姿态飞入了寻常百姓家。
当人类开始进入信息时代,中国共产党人紧密结合最新的发展,以深厚的人民情怀、博大的天下胸襟,书写着气势恢宏的马克思主义中国化、时代化的崭新篇章。
TOP6热点:河工大要搬回河北甘雨给旅行者喝椰奶
人民就是江山,江山就是人民。
时间紧、任务重,如何确保工程如期、高质量完成?项目采取“党建+基建”的工作模式,从各地紧急抽调党员骨干力量驰援,让支部领办,党员打头阵、挑大梁。
TOP7热点:你捡过最大的漏是什么交大排名全国第几
首期节目中备受好评的“十二月鱼鲜集市”,便是节目组的手笔,灵感来源于苏州饮食讲究的“不时不食,无鱼不宴”和苏州园林的传统手法“借景”中的“互借”。糟溜的塘鳢鱼用爽口的糟味唤醒苏州人一整年的味蕾、酸甜酥脆的松鼠桂花鱼酱汁披身鲜爽开胃、绵密醇厚的毛豆子烧鲃鱼每一口都是精华中的精华,还有配咸肉的昂刺鱼、配猪臀肉的鲫鱼……穿过黎里古镇的百年市河巧妙连接每月一鱼的时令美食,无限放大吴江饮食文化的灵魂,当水乡美景遇见水乡美食,引得不少观众“闻香而来”。
TOP8热点:海底捞回应有人往火锅撒尿欲海沉沦
中体未来董事长王健光表示:“2018年,在云南省政府的支持下,昆明市政府、西甲联盟以及中体未来达成战略共识,就建设西甲昆明国际足校、西甲希望杯等项目达成合作,2019年首届西甲希望杯成功举办,观看人数高达数千万次,西甲希望杯是中国目前青少年国际赛事唯一全赛程、全场次、全直播青少年国际赛事。不仅为中西青少年搭建了绿茵场上的竞技舞台,也为中西两国青少年绿茵场外构建人文交流的友谊驿站。”
当地时间8月23日上午,金砖国家领导人第十五次会晤在约翰内斯堡杉藤会议中心举行。国家主席习近平发表题为《团结协作谋发展勇于担当促和平》的重要讲话。人民网带您重温习近平主席讲话要点并邀请专家解读。
TOP9热点:为什么日本出不了 DeepSeek鄂州一家人聊天记录截图
行之力则知愈进,知之深则行愈达。
TOP10热点:比亚迪天闪计划曝光子宫日记纪录片cctv
科学的世界观和方法论是我们研究问题、解决问题的“总钥匙”。