第三媒体软件中心软件网络资讯互联网资讯 → Soul App自研端到端语音通话大模型上线,拓展人机交互新体验 TTL

Soul App自研端到端语音通话大模型上线,拓展人机交互新体验

上传:shapone     来源:信息存储服务     日期:2024-09-03

[摘要]  
   近日,社交平台Soul App(以下简称“Soul”)语音大模型再次升级,上线自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言
 
[正文]    
   近日,社交平台Soul App(以下简称“Soul”)语音大模型再次升级,上线自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。目前,Soul自研的端到端语音通话大模型能力已上线旗下“异世界回响”实时通话场景(内测中),并将在后续拓展至AI苟蛋等多个AI陪伴、AI互动场景。

   自2016年上线,Soul一直致力于以创新的技术方案和产品设计,实现社交体验的拓展。2020年,Soul启动对AIGC的技术研发工作,系统推进在智能对话、语音技术、虚拟人等AIGC关键技术能力研发工作,并推动AI能力在社交场景的深度落地。

   以AI升级社交的过程中,Soul的技术重点之一是致力于实现拟人化、自然化情感陪伴体验。其中,声音是重要环节之一。作为传递信息和情感的重要媒介,声音最能在沟通中赋予“情绪温度”和“陪伴感”。特别是在社交场景中,情感化、低延迟、多风格、类真实的声音能力,可以打破“次元壁”,让线上社交尤其是人机互动中,也能实现真实生活场景聊天的自然流畅感和沉浸现场感,真正完成类现实生活化互动场景中的交互体验。

   因此,为给用户带来更好的情绪反馈和陪伴感,情绪理解、延迟问题一直是Soul技术团队关注的焦点。

   此前,Soul团队推出了自研的语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力,支持真实音色生成、语音DIY、多语言切换、多情感拟真人实时对话等,目前已应用于Soul “AI苟蛋”、站内狼人游戏“狼人魅影”AI语音实时互动、独立新产品“异世界回响”等场景。

   与国际最前沿的技术发展保持同频,Soul持续完善自身语音技术能力积累,创新AI社交应用体验。今年7月,在人工智能领域顶级的国际学术会议——国际人工智能联合会议(International Joint Conference on Artificial Intelligence,IJCAI)举办的第二届多模态情感识别挑战赛(MER24)上,Soul 语音技术团队于SEMI(半监督学习)赛道获得第一名,在国际赛事舞台上展现了Soul的前沿洞察和技术能力。

   如今,自研端到端语音通话大模型的率先上线,再次证明了Soul在行业中扎实的技术能力积累。

   区别于传统的级联方案,语音到语音的端到端建模,意味着语音交互体系的颠覆式升级,即不再需要从“语音识别、自然语言理解、语音生成”等多个环节流转,直接语音输入—语音输出的端到端模型能够最大程度实现信息无损传递,降低响应延迟时间。

   此次Soul自研的端到端语音通话大模型便具备超低交互延迟、快速自动打断、超真实声音表达和丰富情绪感知理解能力的特点,支持更自然的人机交互体验。

   在延迟方面,于实际应用过程中,用户体验与“异世界回响”中虚拟人实时语音通话效果时,延迟时间少于行业平均水平,真正实现即时的AI交流和陪伴。

   值得一提的是,端到端的语音语义理解和响应以及更自然的语音指令控制,让Soul语音通话大模型不仅能够给予情感关怀、理解人声情绪情感并给出有温度的回应,还能够理解物理世界的声音场景,模拟物理世界动物声音、理解多人聊天内容,实现多风格语言切换、文艺内容创作和即兴演唱,接近现实交流互动场景需要。

   接下来,Soul将持续推进多模态端到端大模型能力建设和应用落地,以AI辅助社交、提升关系建立的质量和效率的同时,构建人机交互新场景,让用户可以与AI进行更加有温度、沉浸、趣味的互动交流,不断创新社交体验。

   (新闻稿 2024-09-03)

频道首页 】【 评论 】 【 打印 】 【 字体:
   上一篇:下一本书,阅读星辰和大海|在Soul,看见更大的世界
   下一篇:速来围观!阿丘科技2024新品发布即将开幕
导航:报价 | 大全 | 排行榜 | 产品大全 | 参量 | 订阅 
 Advertisement
 十大最受关注的新闻
1  C口A口U盘如何选 金士顿带你一图读懂
2  轻薄AI笔记本标杆,HUAWEI MateBook X Pro 2024用料分析
3  三星Galaxy Ring:自在轻盈,引领健康科技新风尚
4  颜值算力都拿捏 高性能AI超轻薄本华硕灵耀16 Air开学季有礼
5  暑期6K价位AI超轻薄本好价来袭 华硕灵耀14 2024到手仅需6999元
6  你的超级智能营销助手上线!人+AI协作时代启航!
7  高速存储畅玩3A大作 8月游戏电脑配置参考
8  装备福利全都要!开学季线下购华硕AI轻薄本赠a豆真无线耳机
9  从80后到00后:2024年青年婚恋观念的代际差异与社会影响
10  「风行者2」参数全部曝光!200元首个TMR磁变阻摇杆游戏手柄
 十大热门驱动/软件下载
1  [手机驱动]手机usb万能
2  [热门常用软件]QQ2008正式版下载【腾讯QQ2008官方版Beta1】
3  [热门常用软件]E话通下载【E话通4.5 正式版】
4  [手机驱动]Samsung三星 手机USB驱动1.0版For Win98SE/ME/...
5  [手机驱动]Microsoft微软 ActiveSync同步软件4.5中文版Fo...
6  [摄像头驱动]万能摄像头 FOR Windows
7  [热门常用软件]皮皮播放器下载【PPFilm皮皮播放器 2.1.0....
8  [手机驱动]诺基亚 PC套件下载
9  [热门常用软件]面对面游戏下载【面对面视频游戏大厅】
10  [手机驱动]Microsoft微软 Windows Mobile Device Center ...
 十大最受关注的品牌
1  三星手机(SAMSUNG)
2  诺基亚手机(NOKIA)
3  华硕笔记本(ASUS)
4  摩托罗拉手机(MOTOROLA)
5  英特尔CPU(Intel)
6  华硕主板(ASUS)
7  LG手机(LG)
8  索爱手机(Sony Ericsson)
9  联想笔记本(lenovo)
10  宏碁笔记本(acer)
 十大热门常用软件下载
1  QQ2008正式版下载【腾讯QQ2008官方版Beta1】
2  E话通下载【E话通4.5 正式版】
3  皮皮播放器下载【PPFilm皮皮播放器 2.1.0.2版】
4  面对面游戏下载【面对面视频游戏大厅】
5  DVD解码器下载【NVIDIA DVD Decoder 1.02】
6  迅雷5下载【迅雷5.8.1.507官方版】
7  QQ2007 II正式版下载【腾讯QQ2007官方版本】
8  QQ2006正式版下载【腾讯QQ2006官方版本】
9  联众世界游戏大厅下载【联众世界2.7.0.8官方版】
10  MTV下载器【MTV下载精灵 8.31版】
11  pplive最新版下载【PPLive网络电视V1.9.35版】
12  迅雷(Thunder)下载【迅雷v5.7.12.493官方版】
13  腾讯QQ2008下载【腾讯QQ官方版2008极速贺岁版KB1】
14  Total Video Converter下载【Total Video Converter v3.1...
15  QQ拼音输入法下载【腾讯QQQQ拼音输入法V1.4.1版】
16  皮皮高清影视播放器下载【PIPIPlayer 2.7.0.3版】
17  eMule下载【电驴eMule官方v0.49a正式版】
18  极点五笔输入法下载【极点五笔6.1标准版】
19  QQ2009正式版下载【腾讯QQ2009 SP4官方版】
20  Vagaa哇嘎画时代版下载【哇嘎 2.6.5.10】
   >> 查看评论   
 
   >> 查看更多评论   [共有0条评论]
发表评论
        
        
   点评:
   姓名:  
            字数: 0
     
新闻精选
·赵峰:提升销售领导力,实现业绩跨越式发展
·《斗破苍穹》《凡人修仙传》《庆余年》…UC小
·下一本书,阅读星辰和大海|在Soul,看见更大
·让拍摄无限轻松,猛玛为创作者再出发|品牌焕
·inne:分龄营养精准施策,科学构筑儿童成长营
·Soul App自研端到端语音通话大模型上线,拓展
  ·速来围观!阿丘科技2024新品发布即将开幕
·小度全线产品接入大模型能力,添添闺蜜机Pro
·基金理财哪个软件好 来京东App上万只基金产品
·极响应年轻消费者需求,TATA木门匠心打造冠军
·2024年品牌年轻化趋势:Soul引领下的社交营销
·瑞数信息荣获国家级专精特新“小巨人”企业称