日期:2023-07-27 16:47:29 来源:互联网
最近,大型语言模型(LLM)取得了许多新的进展和发展。这些模型是一种人工神经网络,具有许多参数,并使用自监督学习或半监督学习对大量文本数据进行训练。
这些大型语言模型为新的生成式 AI 工具提供了支持,例如Google Bard和 OpenAI 的 ChatGPT。最近,谷歌研究人员推出了一种名为 AudioPaLM 的新语言模型,该模型在听、说、译方面都能表现出色。
(资料图)
AudioPaLM 是一种多模态架构,结合了两种现有模型的优点:PaLM-2 和 AudioLM。该系统可以处理和生成文本和语音,并可应用于语音识别或用原始语音创建翻译。
PaLM-2 是一种基于文本的语言模型,能够熟练地理解文本特定的语言知识。AudioLM 擅长保留副语言信息,例如说话者身份和语气。
通过结合这两个模型,AudioPaLM 使用 PaLM-2 的语言能力和 AudioLM 的副语言信息保存功能,从而对文本和语音进行更深入的理解和生成。
该模型还可以对多种语言进行零样本语音到文本的翻译,甚至是在训练期间没有看到的语音组合。此功能对于实时多语言通信等现实应用程序非常有用。
AudioPaLM 还可以根据简短的语音提示跨语言传输语音,并且可以捕获和再现不同语言的不同语音。
AudioPaLM 在语音翻译基准测试中取得了顶级成绩,并在语音识别任务中展现了具有竞争力的性能。
Google 搜索的透视过滤器
谷歌在上个月的年度开发者大会 Google I/O 2023 上宣布了一种名为“Perspectives”的新 Google 搜索过滤器。现在,差不多一个半月后,该公司开始向全球所有 Google 搜索用户推出新的 Perspective 过滤器。
谷歌 通过其社交媒体账号上的帖子宣布了这一消息。“上个月,我们在#GoogleIO 上分享了我们对搜索所做的更新,以帮助您找到并探索专家和普通人的不同观点。今天你就可以尝试一下,”该公司在其官方 Twitter 账号上发帖写道。
Google 搜索的新视角过滤器为搜索结果提供了人性化的一面。目前,用户在平台上看到的搜索结果受到该公司算法的影响,该算法基于日期、作者、评级和邻近度等多种因素。现在,新的透视功能通过引入真实人类的观点和建议来改变这一现状。
标签:
下一篇: 最后一页
谷歌推出AudioPaLM一种可以用语音翻译文本的新语言模型
鸿海印度布局或有新动作 有意设立四到五条芯片产线
关于对“大型复杂高层钢结构建筑关键技术”等项目的公示
名雕股份(002830)7月27日主力资金净卖出235.12万元
IMF:世界经济增长预期上调 仍存下行风险
修仙家族模拟器二阶下品灵脉怎么获得 修仙家族模拟器二阶下品灵脉获得攻略
房地产再迎利好 80家房企融资总量环比回升
“索尼克”系列全新作《索尼克 超级巨星》宣布与乐高联名!
鲁大师PC半年报:AMD锐龙跑分霸榜 RTX 4090性能无人能敌
盛安传动自曝财务内控曾存不规范行为,2022年营收净利双下滑
普通不锈钢焊条规格型号(焊条规格型号)
广州南沙区第三季度重大项目开工竣工,总投资超1300亿元
辽宁检察机关依法对闫实涉嫌受贿案提起公诉
走进宁德时代:从三线小城崛起的锂电巨头
力拔山兮气盖世时不利兮骓不逝(力拔山兮)
国内市场占有率怎么计算 市场占有率怎么计算
美股异动 | 法拉第未来(FFIE.US)涨近15% 成交量超3372万
车企价格战收场,工程机械惊呆!
中国充电联盟:6月公共充电桩同比增长40.6%
东吴证券:光储平价刺激大储需求高增 南非、东南亚等新兴市场需求迎非线性增长
德赛西威现3.53亿元折价大宗交易 折价率6.88%
荣耀手表4曝光 双卡双待 APP消息提醒
大连热电连收5个涨停板,公司提醒:重组的资产审计、评估等工作尚未完成
智能制造成为制造业高质量发展的“助推器” 智能制造装备产业规模超过3.2万亿元
万人说新疆|“00后”直播带货小姐姐