黑丝 91 每10份音频就有8份被“胡编”？OpenAI语音转寄托具被曝存紧要残障

发布日期：2024-10-28 19:39 点击次数：134

生成式东谈主工智能限度的领军者OpenAI黑丝 91，曾吹嘘其东谈主工智能转寄托具Whisper具有接近 “东谈主类水平的踏实性和准确性”。关联词，跟着该转寄托具在九行八业被越来越多地擢升使用，其问题似乎也正运行突显——把柄业内媒体对十多位软件工程师、建筑东谈主员和学术计议东谈主员的采访，如今Whisper所存在的一个紧要残障已愈发退却冷落：它很容易会捏造大段翰墨，致使是整段句子。这些业内大师暗示，一些捏造出的翰墨——在行业内被称为“幻觉”，可能包括种族言论、暴力措辞，乃至统共杜撰出的医疗

　　生成式东谈主工智能限度的领军者OpenAI黑丝 91，曾吹嘘其东谈主工智能转寄托具Whisper具有接近 “东谈主类水平的踏实性和准确性”。
　　关联词，跟着该转寄托具在九行八业被越来越多地擢升使用，其问题似乎也正运行突显——把柄业内媒体对十多位软件工程师、建筑东谈主员和学术计议东谈主员的采访，如今Whisper所存在的一个紧要残障已愈发退却冷落：它很容易会捏造大段翰墨，致使是整段句子。
　　这些业内大师暗示，一些捏造出的翰墨——在行业内被称为“幻觉”，可能包括种族言论、暴力措辞，乃至统共杜撰出的医疗提出。
　　大师们越来越惦念这种“胡编乱造”可能变成严重成果，因为Whisper面前正被全球多个行业用于翻译和转录采访实质、生成文本以及为视频制作字幕。天然OpenAI曾申饬不应在“高风险限度”使用该用具，但当今一些好意思国医疗中心齐正运利用用基于Whisper的用具，来记载患者与大夫间的对话。
　　据时常使用Whisper的计议东谈主员和工程师暗示，他们在责任中时常会遭受该用具出现“幻觉”。举例，密歇根大学的别称计议东谈主员在计议人人会议的转录准确率时发现，他所审核的每十份音频转录中，便有八份存在“幻觉”。
　　一位机器学习工程师则称，在他分析的100多个小时的Whisper转录中，他领先发现大概有一半存在“幻觉”。第三位建筑东谈主员指出，在他用Whisper创建的26000份记载中，险些每一份齐发现了胡编乱造的风光。
　　即使是在那些录制细腻的苟简音频样本里，问题也已经存在。在最近的一项计议中，盘算机科学家们在审查的朝上13000个明晰音频片断中发现存187个存在“幻觉”问题。
　　计议东谈主员暗示，这种趋势将导致在数百万段灌音中出现洪水横流的失误转录。
　　成果严重
　　曾在拜登政府开辟白宫科技策略办公室责任的Alondra Nelson暗示，这种失误可能会变成“杰出严重的成果”，尤其是在病院里。
　　当今，包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的朝上30000名临床大夫和40个卫生系统，已运利用用法国AI疗养公司Nabla基于Whisper打造的用具。
　　Nabla公司的首席期间官Martin Raison暗示，该用具把柄医学语言进行了微调，以转录和纪念大夫与病东谈主间的互动。该用具转录的就诊记载当今已多达约700万次。该公司官员还指出，他们知谈Whisper会产生幻觉，并正在辛勤经管这个问题。
　　当今担任普林斯顿高级计议院教悔的Nelson暗示，“莫得东谈主但愿出现误诊。(该限度)应该有更高的步伐。”
　　当今，Whisper还被用于为聋东谈主和听力拦阻者制作字幕——这是一个绝顶容易因出现失误转录而堕入窘境的东谈主群，因为聋东谈主和听力拦阻者统共无法识别“荫藏在通盘文本中”的捏造实质。
　　这种幻觉在Whisper中的遍及存在，已促使无边大师、观念者和OpenAI前职工命令好意思国政府推敲制定东谈主工智能章程。他们指出，OpenAI至少需要经管这一残障。本年2月因惦念公司的发展标的而从OpenAI离职的工程师William Saunders就暗示，如若OpenAI圆润优先经管这个问题，这个问题似乎是不错经管的。而如若你永久把它放在那边，而东谈主们对它的功能过于自信，并把它集成到通盘这些其他系统中，那就有贫乏了。
　　天然大大齐建筑东谈主员齐觉得转寄托具不成幸免会拼错单词或出现其他失误，但不少工程师和计议东谈主员暗示，他们从未见过其他东谈主工智能转寄托具像Whisper同样容易产生幻觉。
　　当今，该用具已被集成到OpenAI旗舰聊天机器东谈主ChatGPT的某些版块中，同期亦然甲骨文和微软云盘算平台的内置居品，为全球数千家公司提供干事。它还可用于将文本转录和翻译成多种语言。
在线视频国产欧美另类
　　仅在上个月，开源东谈主工智能平台HuggingFace上的一个Whisper最新版块就被下载了420多万次。该平台的机器学习工程师Sanchit Gandhi暗示，Whisper是最流行的开源语音识别模子，从呼唤中心到语音助手，齐内置了Whisper。
　　康奈尔大学教悔Allison Koenecke和弗吉尼亚大学教悔Mona Sloane，当今已计议了他们从卡内基梅隆大学的计议尊府库TalkBank中取得的数千个苟简音频片断。他们发现，近40%的幻听是无益的或令东谈主担忧的，因为语言者的欢喜可能被曲解或误会。
　　计议东谈主员并不笃定Whisper和近似用具产生幻觉的原因，但软件建筑东谈主员暗示，这些胡编乱造经常发生在出现停顿、布景声息或音乐播放时。OpenAI此前在网上露出的信息中曾提出，不要在决议情境中使用Whisper，因为准确性上的残障会导致纵脱上的彰着残障。
　　而针对最新爆料，有OpenAI发言东谈主回复称黑丝 91，OpenAI会在接下来的模子更新中加入相应的反映机制。

黑丝 91 每10份音频就有8份被“胡编”？OpenAI语音转寄托具被曝存紧要残障

相关资讯

友情链接：