搜狗分身技术再突破,AI合成主播或迎“明星潮”?

5月17日,在北京举办的“搜狐科技5G & AI峰会”上,由搜狗联合搜狐新闻客户端倾力打造的演员柳岩同款明星“数字人”惊艳亮相。目前,该明星“数字人”已经在搜狐新闻客户端“24小时频道”正式上岗,再次展示了搜狗分身技术的魅力与领先实力。

明星播报提升“视听”体验

人工智能技术的发展和5G时代的到来,使得传媒产业及新闻资讯行业正在快速进入智能化、多元化、个性化、视听一体化的轨道,在互联网上,传统的“读文”或者“读图”方式已经难以满足大众的要求。

在此前提下,由搜狗引领的AI合成主播得以快速落地、广泛运用、迅猛发展,搜狗与新华社合作开发的全球首款AI合成主播“新小浩”、与俄罗斯塔斯社合作开发的全球首款俄语主播LiSa、搜狗自有形象合成主播“雅妮”等也成为人们耳熟能详的名字。

与新小浩、雅妮等“前辈”相比,除了形象栩栩如生、播报专业流畅、感情丰富逼真等一脉相承的优点之外,因为搜狗分身技术的持续迭代和柳岩明星效应的加持,还能够给用户带来更加沉浸的视频播报、更加愉悦的视听感受和更加尊贵的使用体验。

技术突破成就“分身”魅力

峰会现场,明星“数字人”在播报新闻时语调抑扬顿挫、动作自然顺畅,无论是简单的动作、细微的唇动,还是招牌性的表情,都和柳岩本人一模一样,此外,还能在一条新闻中无缝切换河南、湖南、四川、陕西、东北等多种方言,更是让柳岩“自愧不如”,这一切均得益于搜狗分身技术的持续创新与突破。

搜狗分身技术基于搜狗业界领先的AI能力,仅靠少量真实音、视频数据即可定制出高逼真度的分身模型,帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域实现升级。

柳岩明星“数字人”的重要突破,在于创新运用了搜狗提出的“StyleTTV端到端合成框架”, 将搜狗自研的端到端语音合成框架StyleTTS技术再次向前推进一步,通过音视频联合端到端建模以及合成,能够实时生成风格多样、自然逼真的数字人视频内容。其中,风格化语音合成实现的创新技术突破,能够实现不同发音人的韵律模型以及音色模型的自由重组搭配,语音播报风格、口音、情感、特色方言等维度能够灵活选择与控制,从而实现抑扬顿挫的韵律节奏和丰富立体的情感表达,让“分身”的语音表达更加真实、更具表现力和感染力,满足不同场景的需求。

AI合成主播或迎“明星潮”?

“黑科技”不仅让普通人惊叹,对于明星也具备吸引力,搜狗首个明星形象AI合成主播——柳岩同款明星“数字人”的诞生就是一个很好的证明。

依照当前AI技术的进步速率和搜狗分身的发展趋势,未来人手一位明星“同款”助理或许并不是幻想,因为“她”的运用不仅有利于平台、为用户提升了使用体验,同时也维护和巩固了明星自身的曝光度和影响力,可谓一举多得。

从这个意义上来说,柳岩同款明星“数字人”的诞生起了个好的开头、迈出了第一步。下一阶段,AI合成主播、或者说AI助理迎来“明星潮”,或许可以成为一个值得期待的事情。