Chrome字幕!- - - - - -

Chrome为任何Web音频源带来实时标题

机器生成的字幕非常适合播客,即兴演奏器等。

谷歌是正式带来它的“实时字幕”技术与任何网站的新版本Chrome。的特性,首次亮相在像素电话上,应在大多数Android 10+设备上可用,让您轻松向文本技术应用于任何音频源,使得在缺乏可访问部门缺乏的音频上进行关闭标题。从今天开始,Google开始向Chrome 89和桌面PC上推出该功能。

您可以通过进入“高级”和“可访问性”,然后打开“Live Tresction”,从Chrome设置启用功能。Live Tablions出现在网页上作为灰色框,填充文本作为视频或音频播放。您可以拖动框,以便永远不会妨碍,您甚至可以选择两种尺寸。Live Prescion将尝试使用Web上的每个音频源;您可以在加载页面时暂时关闭框,但没有办法在某些网站上启用它并将其禁用其他网站。

一些Google服务,如youtube和Google相遇,已经有一段时间的机器生成的标题,所以它在那里并不是很有用的,但它对其他一切都是一个很好的乐队援助。这意味着播客,抽搐流,社交媒体网站,其他视频聊天服务,流传输站点以及更多都被覆盖。该功能甚至试图进行标题音乐。这并不完美,但对于清晰的话语,它很好地运作。

谷歌表示所有处理都在您的设备上本地发生,不会在互联网上结束。有趣的是,第一次打开该功能将触发10秒的下载。在我的电脑上,它看起来像Chrome将大约130MB的语音数据丢弃成两个名为“SODA”的新文件夹(演讲设备上的API和“索德兰语。”现在,该功能仅适用于英语,唯一的语言包是“en-US”,但它看起来像多种语言支持最终会到达。

目前,谷歌表示,Live Caption“目前支持英语,并在全球范围内提供Windows,Mac和Linux设备上的最新版本,并将即将推出Chromeos。”

清单图像by.Isaac Bowen / Flickr

67读者评论

  1. 最后!我可以陷入困境的所有苏格兰和南非编程,我一直在努力听到。

    开玩笑,我很高兴看到更多选择需要标题的人。当youtube限制了很多这一点时,我知道这是一个很大的待办事项(虽然文章指出这不会为此工作)。
    |注册了977个帖子
  2. mightypez.写道:
    最后!我可以陷入困境的所有苏格兰和南非编程,我一直在努力听到。

    开玩笑,我很高兴看到更多选择需要标题的人。当youtube限制了很多这一点时,我知道这是一个很大的待办事项(虽然文章指出这不会为此工作)。


    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p
    4733帖子|挂号的
  3. 这个特性对我很有用!

    作为一个deafie,我一直在使用一个虚拟音频电缆技巧来标记我的一些东西。长期来看,这应该是一个操作系统功能,因此所有应用程序都被标题为。Android现在有了它,但想要一个Windows / Mac等价物。
    |注册了1645个帖子
  4. gmerrick写道:
    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p

    我是个聋子,用这玩意,我会说出来的。

    这不是2015年。在过去的几年里,在一些情况下,最好的标题引擎中的人工智能使得优于人类速记员的生活标题。我看到实时标题速度飙升到每分钟400多个单词,快速说话的Livestream精度为95%。

    你的steno不容易做到这一点。甚至与我的外部标题应用程序(OTT​​ER)一起使用YouTube 1.5x速度播放 - 有时2倍!

    在某些情况下,它会很混乱,难以理解,但现在这种情况发生的几率不到10%。对于大多数字幕流,通常只有5%的同音异义错误,我的大脑可以自动更正。

    现在,像Otter这样的云字幕管理员通常比普通的离线字幕管理员拥有更好的训练有素的字幕AI,但需要测试谷歌的功能。

    最后编辑mdrejhon.在3月18日星期四,2021年12:07 PM

    |注册了1645个帖子
  5. 想到他们有一个只有130MB的高可靠性语音到文本引擎,这是相当令人惊讶的。我认为老式的Dragon的安装是这个的好几倍,他们需要大量的安装后培训,以达到85-90%的准确率。
    14494帖子|挂号的
  6. 我去找查尔斯巴克利“无法萎缩”封闭的标题图片作为一个笑话,这让我想到了这些:

    https://11points.com/11-incredible-clos ...灾难/

    https://11points.com/11-incredible-clos ...士 - 2 /

    是的,这些是listicles,但其中相当一部分让我12岁的内心发笑。
    2021帖子|挂号的
  7. mdrejhon.写道:
    gmerrick写道:
    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p

    我是个聋子,用这玩意,我会说出来的。


    我没有听过之前使用过的术语。这常用于描述聋人吗?适合非聋人使用术语或将被认为是令人反感的?
    |注册了169篇帖子
  8. 一方面,这对听力障碍的人来说很棒。

    另一方面,它是谷歌,所以他们很可能在收集我在听什么,什么时候听的数据。

    所以,呃......我很冲突。
    4665帖子|挂号的
  9. 我们在几天前的一次webex会议上发现了这一点。我不知道webex使用的是谁的技术,但它比英语配音的Netflix CC更准确。有时在Netflix上,就好像有两个不同的脚本。
    3143帖子|挂号的
  10. 本G.写道:
    我去找查尔斯巴克利“无法萎缩”封闭的标题图片作为一个笑话,这让我想到了这些:

    https://11points.com/11-incredible-clos ...灾难/

    https://11points.com/11-incredible-clos ...士 - 2 /

    是的,这些是listicles,但其中相当一部分让我12岁的内心发笑。


    昨晚看了什么(我们总是用CC观看)。
    房子前门的人在门敲门(可以清楚地听到敲门)。
    CC:[门铃圈]

    几年前我还记得一件CC的事情,当时我在测试它被谈论打印查尔斯时。

    破解了我,但可能是因为我在前一天晚上凌晨3点工作了建立问题。您的链接有更好的。
    3143帖子|挂号的
  11. Fic.写道:
    我们在几天前的一次webex会议上发现了这一点。我不知道webex使用的是谁的技术,但它比英语配音的Netflix CC更准确。有时在Netflix上,就好像有两个不同的脚本。


    这可能不是netflix的错。配音经常与翻译进行创造性的自由,以便润滑同步,因此有技术上可以提供两个单独的字幕轨道(SDH / CC AKA DUB,与观看外语音频轨道的人的准确翻译)。并非所有电影都可以使用,因此,如果Netflix仅被赋予文字字幕轨道而不是SDH 1,则您可以看到上述结果。

    最后编辑rene gollent.2021年3月18日周四12:26

    2308帖子|挂号的
  12. 在Hoogouts会议上注意到这一点(也许2019年?)。虽然对我而言,但对我来说并不是很严重的,但根据他们的听证情况,与他人非常有用。
    10个帖子|挂号的
  13. gmerrick写道:
    mightypez.写道:
    最后!我可以陷入困境的所有苏格兰和南非编程,我一直在努力听到。

    开玩笑,我很高兴看到更多选择需要标题的人。当youtube限制了很多这一点时,我知道这是一个很大的待办事项(虽然文章指出这不会为此工作)。


    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p

    他们在YouTube视频中使用它,我最近注意到了。

    结果主要是可辨认的,但与过去的语音听写系统一样,它们的准确性约为90%,而且几乎没有标点符号。可以用背景噪音/音乐制作的单词倾向于完全忽略。任何低卷的东西也都被忽略了。

    所以谁在谈论,何时和所有这些往往留给观众,以通过语境来解释,而不是由语法来解释。

    这当然比什么都没有好,但这确实会冒犯语法老师的感情。
    14763帖子|挂号的
  14. 乔纳写道:
    一方面,这对听力障碍的人来说很棒。

    另一方面,它是谷歌,所以他们很可能在收集我在听什么,什么时候听的数据。

    所以,呃......我很冲突。

    我可以告诉你没有RTFA,这是通过用户机器上的代理在本地处理的,没有什么可以传输给Google。
    14494帖子|挂号的
  15. 我还要多久才能把这个和离线翻译结合起来,得到亚洲流行歌曲歌词的实时本地翻译?
    526帖子|挂号的
  16. Afidel.写道:
    乔纳写道:
    一方面,这对听力障碍的人来说很棒。

    另一方面,它是谷歌,所以他们很可能在收集我在听什么,什么时候听的数据。

    所以,呃......我很冲突。

    我可以告诉你没有RTFA,这是通过用户机器上的代理在本地处理的,没有什么可以传输给Google。

    谷歌说它是本地的,但谷歌不值得信赖。我们如何知道他们没有收集遥测?
    4665帖子|挂号的
  17. rene gollent.写道:
    Fic.写道:
    我们在几天前的一次webex会议上发现了这一点。我不知道webex使用的是谁的技术,但它比英语配音的Netflix CC更准确。有时在Netflix上,就好像有两个不同的脚本。


    这可能不是netflix的错。配音经常与翻译进行创造性的自由,以便润滑同步,因此有技术上可以提供两个单独的字幕轨道(SDH / CC AKA DUB,与观看外语音频轨道的人的准确翻译)。并非所有电影都可以使用,因此,如果Netflix仅被赋予文字字幕轨道而不是SDH 1,则您可以看到上述结果。

    我还看到了配音演员与提供的脚本带来自由的场合,但字幕未更新。

    有很多方法可以让字幕错过音频。
    526帖子|挂号的
  18. 乔纳写道:
    Afidel.写道:
    乔纳写道:
    一方面,这对听力障碍的人来说很棒。

    另一方面,它是谷歌,所以他们很可能在收集我在听什么,什么时候听的数据。

    所以,呃......我很冲突。

    我可以告诉你没有RTFA,这是通过用户机器上的代理在本地处理的,没有什么可以传输给Google。

    谷歌说它是本地的,但谷歌不值得信赖。我们如何知道他们没有收集遥测?

    您可以尝试断开和使用Chrome播放本地文件。你知道,而不是毫无原地猜测。或者设置像Fiddler这样的代理并检查流量,或检查防火墙的日志等。
    526帖子|挂号的
  19. 引用:
    但是没有办法在某些网站上启用它并将其禁用其他网站。

    该死的,谷歌。这真的很愚蠢。真的。
    5674帖子|挂号的
  20. 如果它是youtube的实现,我想知道是否偶尔的视频,它将自动转换为一个完全不同的语言,从视频(英语)和我的IP的地理位置和假定的主导语言(美国英语)。

    我的意思是,我欣赏看到自动翻译的东西以易于使用,但我无法阅读韩语或葡萄牙,而史蒂夫在Gamersnexus可以谈得很快......
    249帖子|挂号的
  21. Techw.写道:
    mdrejhon.写道:
    gmerrick写道:
    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p

    我是个聋子,用这玩意,我会说出来的。


    我没有听过之前使用过的术语。这常用于描述聋人吗?适合非聋人使用术语或将被认为是令人反感的?

    不同的聋人社区、不同的国家有不同的情况。

    我比平均聋人/大声/呼和浩特/呼和浩特更多地主流,所以与听证会更多。上下文很重要。
    |注册了1645个帖子
  22. FATESRIDER.写道:
    gmerrick写道:
    mightypez.写道:
    最后!我可以陷入困境的所有苏格兰和南非编程,我一直在努力听到。

    开玩笑,我很高兴看到更多选择需要标题的人。当youtube限制了很多这一点时,我知道这是一个很大的待办事项(虽然文章指出这不会为此工作)。


    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p

    他们在YouTube视频中使用它,我最近注意到了。

    结果主要是可辨认的,但与过去的语音听写系统一样,它们的准确性约为90%,而且几乎没有标点符号。可以用背景噪音/音乐制作的单词倾向于完全忽略。任何低卷的东西也都被忽略了。

    所以谁在谈论,何时和所有这些往往留给观众,以通过语境来解释,而不是由语法来解释。

    这当然比什么都没有好,但这确实会冒犯语法老师的感情。


    虽然自动overuff对任何人都很难以听到的人来说,但这确实让我惊讶于我有多少大型YouTube频道没有适当的潜艇。这些视频显然有很多时间和很多钱投入到他们身上,他们仍然没有真正的潜艇?在你的专业视频下,这个半连贯的混乱感觉不专业?

    我没有任何听力问题,但是当人们不清楚时,良好的潜水艇仍然有助于,但自动化的潜艇在这里没有帮助(我的Squishware神经网络仍然比他们的软件版本更好)。
    290帖子|挂号的
  23. 需要将其集成到Android电视机中。使用My Hdhomerun调谐器,为实时活动(本地新闻,体育等)的关闭标题只是由于大规模延迟而不起作用。
    396帖子|挂号的
  24. Qaz”写道:
    FATESRIDER.写道:
    gmerrick写道:
    mightypez.写道:
    最后!我可以陷入困境的所有苏格兰和南非编程,我一直在努力听到。

    开玩笑,我很高兴看到更多选择需要标题的人。当youtube限制了很多这一点时,我知道这是一个很大的待办事项(虽然文章指出这不会为此工作)。


    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p

    他们在YouTube视频中使用它,我最近注意到了。

    结果主要是可辨认的,但与过去的语音听写系统一样,它们的准确性约为90%,而且几乎没有标点符号。可以用背景噪音/音乐制作的单词倾向于完全忽略。任何低卷的东西也都被忽略了。

    所以谁在谈论,何时和所有这些往往留给观众,以通过语境来解释,而不是由语法来解释。

    这当然比什么都没有好,但这确实会冒犯语法老师的感情。


    虽然自动overuff对任何人都很难以听到的人来说,但这确实让我惊讶于我有多少大型YouTube频道没有适当的潜艇。这些视频显然有很多时间和很多钱投入到他们身上,他们仍然没有真正的潜艇?在你的专业视频下,这个半连贯的混乱感觉不专业?

    我没有任何听力问题,但是当人们不清楚时,良好的潜水艇仍然有助于,但自动化的潜艇在这里没有帮助(我的Squishware神经网络仍然比他们的软件版本更好)。

    不幸的是,让内容易于访问仍然是事后的想法。最重要的是,它是昂贵的事后想想,直到它以某种形式被强制执行,即使是老牌的创造者和企业也乐于削减成本。
    6283帖子|挂号的
  25. gmerrick写道:
    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p


    我听力不太好,但被主流化了——我的问题主要是弄清楚这些词是什么,而不是对话的存在。所以我很容易发现错误——我不知道他们说了什么,但我知道它和标题不匹配。我也能判断出字幕师(或AI)认为自己的解读是正确的,但事实并非如此。

    我最近一直在YouTube上看关于电动汽车的视频,因为我希望我的下一辆车就是电动汽车。出于某种原因,YouTube非常一致地认为电动汽车是“eevee”。显然,出于某种原因,谷歌的AI(可能就是Chrome使用的AI)想要拼出这个缩写。

    我找不到报告此错误的方法,我不知道它是如何出现的。我知道一些缩略语通常在散文中拼写出来,但如果审稿人说“EV”,我希望标题说“EV”。由于上下文,这不明显吗?YouTube不知何故,没有从网站上的数百名EV审核者那里获得正确的信息?

    Google如何解决这样的错误?这对像我这样的人来说,这不是一个很好的人来说,这对它听到足以知道它是一些“出于某种原因”错误的“拼写”错误,而是一个完全聋的人可能不知道。

    此外,我尝试了铬,但不喜欢它,我使用Firefox。这确实需要添加到它中。
    1535帖子|挂号的
  26. mdrejhon.写道:
    Techw.写道:
    mdrejhon.写道:
    gmerrick写道:
    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p

    我是个聋子,用这玩意,我会说出来的。


    我没有听过之前使用过的术语。这常用于描述聋人吗?适合非聋人使用术语或将被认为是令人反感的?

    不同的聋人社区、不同的国家有不同的情况。

    我比平均聋人/大声/呼和浩特/呼和浩特更多地主流,所以与听证会更多。上下文很重要。


    另一个deaffie在这里关注。是的,它变化。对自己来说,如果听到人们称之为,我并不真正关心。除非上下文有令人反感意外,否则它对它没有任何令人反感的语气。
    231帖子|挂号的
  27. 好的,谁能弄清楚如何以编程方式使用这个?
    83帖子|挂号的
  28. 现在我迫不及待地等待音频描述符!
    3338帖子|挂号的
  29. Fic.写道:
    我们在几天前的一次webex会议上发现了这一点。我不知道webex使用的是谁的技术,但它比英语配音的Netflix CC更准确。有时在Netflix上,就好像有两个不同的脚本。


    我目前在netflix上重视陌生人的东西(练习我的听力技巧),我把音频和字幕用俄语,但75%的时间文字和音频不是同一个词......这很烦人但是,我认为这支团队能够在音频和字幕的完全不同的团队中彼此通信。
    1334帖子|注册
  30. mdrejhon.写道:
    gmerrick写道:
    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p

    我是个聋子,用这玩意,我会说出来的。

    这不是2015年。在过去的几年里,在一些情况下,最好的标题引擎中的人工智能使得优于人类速记员的生活标题。我看到实时标题速度飙升到每分钟400多个单词,快速说话的Livestream精度为95%。

    你的steno不容易做到这一点。甚至与我的外部标题应用程序(OTT​​ER)一起使用YouTube 1.5x速度播放 - 有时2倍!

    在某些情况下,它会很混乱,难以理解,但现在这种情况发生的几率不到10%。对于大多数字幕流,通常只有5%的同音异义错误,我的大脑可以自动更正。

    现在,像Otter这样的云字幕管理员通常比普通的离线字幕管理员拥有更好的训练有素的字幕AI,但需要测试谷歌的功能。


    我经常向全球观众做演讲,我的公司使用的一些服务可以实时翻译和字幕。我不知道它的效果如何,但如果有人抱怨,他们没有来找我。与几年前相比,今天的工作是如此天衣无缝,这是非常不可思议的。
    118帖子|挂号的
  31. 逐行为“黑客”将恶意软件代码插入Chrome标题的内容是什么......
    475帖子|挂号的
  32. 它似乎考虑/了解了一些背景。经常会备份并修改已显示的标题。例如,弄清楚与“em三毫米”有关的几点尝试,但最终确实定居在“M3 x 8mm”上,这是完全正确的。(嗯,我可能更喜欢M3×8mm,但我喜欢太多的排版。)

    YouTube自动标题留给“M3到8毫米”。YouTube也在“3D打印”中留下小写的'D'(虽然既没有包括连字符。​​“实际上,YouTube一直在留下一切小写,包括应该是初始资本和代词”I [SIC]。
    1761帖子|挂号的
  33. 在观看视频时,我很难在观看视频时使用标题,并且我对汽车生成的最大投诉是具有许多技术术语的材料。一旦开始使用首字母缩略词,初始化和简单的技术术语,DCS世界训练视频的自动标题有时可以无意义。
    5487帖子|挂号的
  34. 我希望其他浏览器也能加入这个功能……至少作为一种延伸。
    182个帖子|挂号的
  35. Techw.写道:
    mdrejhon.写道:
    gmerrick写道:
    你确定字幕不会像它听到的那样把它拼出来,而且它仍然是无法理解的吗?: p

    我是个聋子,用这玩意,我会说出来的。


    我没有听过之前使用过的术语。这常用于描述聋人吗?适合非聋人使用术语或将被认为是令人反感的?


    在不知道您所指的个人的情况下,请勿使用此术语作为听证者。如果您随机互联网人提到我的另一个随机互联网人员,您将添加到我的敌人列表中,我再也没有读过你。
    254帖子|挂号的
  36. jamesb2147写道:
    rene gollent.写道:
    Fic.写道:
    我们在几天前的一次webex会议上发现了这一点。我不知道webex使用的是谁的技术,但它比英语配音的Netflix CC更准确。有时在Netflix上,就好像有两个不同的脚本。


    这可能不是netflix的错。配音经常与翻译进行创造性的自由,以便润滑同步,因此有技术上可以提供两个单独的字幕轨道(SDH / CC AKA DUB,与观看外语音频轨道的人的准确翻译)。并非所有电影都可以使用,因此,如果Netflix仅被赋予文字字幕轨道而不是SDH 1,则您可以看到上述结果。

    我还看到了配音演员与提供的脚本带来自由的场合,但字幕未更新。

    有很多方法可以让字幕错过音频。

    通常来说,字幕比配音更忠于原著是一个特点,而不是一个漏洞。Thankyouverymuch。
    5674帖子|挂号的
  37. jamesb2147写道:
    我还要多久才能把这个和离线翻译结合起来,得到亚洲流行歌曲歌词的实时本地翻译?


    有2件事。

    首先是谷歌的翻译能力仍然很漂亮臭名昭著的对于东亚语言。

    第二是有时歌词只是没有意义。
    131帖子|挂号的
  38. 加勒兰写道:
    它似乎考虑/了解了一些背景。经常会备份并修改已显示的标题。例如,弄清楚与“em三毫米”有关的几点尝试,但最终确实定居在“M3 x 8mm”上,这是完全正确的。(嗯,我可能更喜欢M3×8mm,但我喜欢太多的排版。)

    YouTube自动标题留给“M3到8毫米”。YouTube也在“3D打印”中留下小写的'D'(虽然既没有包括连字符。​​“实际上,YouTube一直在留下一切小写,包括应该是初始资本和代词”I [SIC]。


    从我所看到的那样,它令人惊讶的是,在计算机程序员术语中令人惊讶的是,因为一家可能的公司可能期望的是吃的公司和呼吸计算机编程术语。当然,它比这些术语更好地表现出人。
    734帖子|挂号的

你必须评论。

渠道ARS Technica