计算产业新征程丨“口述一段故事,10秒钟内变成动画”

2022-11-01 10:23 加入收藏


11月4日至5日,2022世界计算大会将在长沙举行。围绕大会主题,湖南日报今天起开设“计算万物·湘约未来——计算产业新征程”专栏,展现湖南计算产业发展成果,聚焦世界计算大会精彩瞬间,助力湖南强化“三力”支撑,加快抢占数字经济发展高地。

“中国发展离不开世界,世界发展也需要中国”……在微博、抖音、B站等热门网络平台上,虚拟数字人“AI千言”推出“手语关注二十大”系列视频。

“AI千言”是湖南省马栏山计算媒体研究院开发的虚拟数字人,看上去十分逼真。

伴随元宇宙兴起,虚拟数字人走入大众视野。目前,虚拟数字人以AI主播、虚拟座席、数字员工等形象出现,是多种新技术交织融合的综合体。

“虚拟数字人的核心技术就是媒体计算。”湖南省马栏山计算媒体研究院院长高春鸣介绍。媒体计算应用领域广泛,目前主要应用于超高清视频、VR和新媒体以及数字教育、数字医疗等领域,可以说是数字经济的底座。以数字人为例,不仅外形要美观,还有脸部表情和手势、行走、口唇同步、发声驱动等,需要较长计算流程。

高春鸣曾是湖南大学信息科学与工程学院的教授。多年来,湖南大学60多名师生共同参与研发计算媒体SaaS系统。高春鸣在2017年退休后,牵头把这项技术成果在马栏山视频文创产业园进行产业化落地。

让技术找到更广泛应用空间。2019年底,马栏山计算媒体研究院成立,构筑计算媒体SaaS服务平台,推进视频自动化生产,为影视、动漫、教育等数字企业提供AI赋能。

目前,研究院联合中科院自动化所、湖南大学、中南大学、北京理工大学、华为等,开展多模态预计算大模型、言语智能、3D计算建模、计算动画等领域研究,承担“5G智能化融媒体关键技术开发与应用示范”等省科技创新重点工程项目等。

从实体人到数字人,需要强大计算力作支撑。“另辟蹊径,在技术方法上进行创新。”高春鸣说,简单来讲,就是把需要几个月时间的大模型计算,进行压缩和重新编译优化,对算法进行“减重”,再嵌入到计算流程当中,从而大大减少计算时间。“在核心技术上获得突破后,如今我们只要数小时就可以生产一个高真实感的数字人,走在国内前列。”

目前,研究院已完成面向动漫的虚拟人三维重建与驱动技术服务平台,可提供虚拟人、虚拟人动作SaaS功能,帮助应用企业降低15%的成本。

“口述一段故事,10秒钟内变成动画。”高春鸣描述技术发展前景。研究院依托计算媒体SaaS平台,把几百种甚至上千种算法组成一条“生产线”,用语音或文本输入一个创意,经过人工智能流程计算,就能直接输出一段完整视频。最近,某国家级高新区委托研究院开发一种展陈新模式,园区在接待参观者时,不再只是播放现成宣传片,而是随时“捕捉”参观者在交谈中的兴趣点,实时在线生成展示视频,满足不同参观者的个性化需求。

这套技术完全实现后,动画、电视剧、电影等可以通过计算产生,带动文创领域产业变革,还能辐射先进制造、信息产业等领域,市场前景广阔。

在马栏山计算媒体研究院研发大楼,工作人员介绍,自去年8月入驻后,一天比一天热闹。现在,一楼摆放设备,二楼用于研发,三楼准备上新的人工智能生产线。

“马栏山视频文创园管委会提供从政策优惠到资源支持的保姆式服务,研究院实现快速发展。”高春鸣说,“我们有信心立足马栏山,引领国内媒体计算潮流,打造国际先进水平的媒体计算平台。”

上一篇:杜家毫在省卫生计生系统调研时强调:主动认识适应引领新常态 努
下一篇:没有了