武汉大学人工智能学院成立
谷歌推出新一代视频生成模型Veo 2
我国科学家建立生成式模型为医学AI训练提供技术支持
微信公众号上线“作者朗读音色”功能
传媒科技速递
【2024012第二十二期】

  过去一周,科技板块有哪些重点动态?

  欢迎来到星辰在线推出的“传媒科技速递”栏目。我们将化身“信息捕手”,结合大数据以及内容新鲜度、话题讨论度,精心筛选并整理出最具价值、最具前瞻性的资讯内容。

  以下是以2024年12月20日为中心的一周内的多项重要动态:

AI 助力全球工程:从无人驾驶到文生视频,工程成就中的智能力量

  由中国工程院院刊《工程》(Engineering)评选的2024全球十大工程成就18日在京发布,CAR-T细胞疗法、嫦娥六号、低轨通信卫星星座、柔性显示、高温气冷堆核电站、智能工厂、无人驾驶汽车、手术机器人、文生视频大模型Sora、超大型风力发电装备入选。

  中国工程院秘书长、《工程》(Engineering)执行主编陈建峰院士介绍,全球十大工程成就主要指近5年已经完成且实践验证有效,并产生全球性影响的工程科技重大创新成果。2024全球十大工程成就经由全球征集提名、专家遴选推荐、公众问卷调查、评选委员会审议确定。

  陈建峰表示,本次评选的全球十大工程成就体现了三个特点:一是代表了某一个或多个工程科技领域最先进的技术水平或者重大的原创性突破,能引领未来技术进步方向,如CAR-T细胞疗法标志着细胞治疗时代的到来;二是通过技术整合、资源优化配置达成了整体目标,呈现出显著的系统集成创新特色,如低轨通信卫星星座以其独特的技术优势,正逐步成为全球通信网络的重要组成部分;三是催生新产业、新动能,如无人驾驶汽车、柔性显示都代表了新质生产力发展方向,拥有广阔的应用场景。

  当天,中国工程院还发布了《全球工程前沿2024》报告,按照中国工程院9个学部所属的学科领域,通过数据分析与专家研判相结合,筛选获得了92个工程研究前沿和92个工程开发前沿,并对其中最重要的27个研究前沿和27个开发前沿进行深入解读,制定重点前沿发展路线图。

  来源:央视网

音乐大模型市场“群雄逐鹿”

  目前国内AI音乐大模型企业主要有三类:以字节跳动豆包旗下海绵音乐为代表的大型科技公司,以昆仑万维旗下的天工SkyMusic为代表的新兴大模型厂商,以及以趣丸科技旗下的天谱乐为代表的垂直赛道公司。

  海绵音乐主打利用AI技术帮助用户生成个性化音乐作品。用户只需输入一句灵感或上传一张图片,即可生成专属音乐作品。相比Suno,海绵音乐生成的中文歌曲吐字清晰度和演唱流畅性更高,曲风更符合国人喜好。

  天工SkyMusic基于昆仑万维“天工3.0”超级大模型打造,能够生成多种风格的音乐作品。它采用音乐音频领域类Sora模型架构,支持生成80秒44100赫兹采样率双声道立体声歌曲。

  天谱乐于今年7月发布,是一个多模态配乐大模型。它集成图片理解算法、旋律生成算法、视频理解算法、配器识别算法等技术。值得注意的是,天谱乐不仅支持文生音乐、音频生音乐,还具备图片、视频生成音乐的功能。

  此外,腾讯音乐和网易云音乐也推出了相关产品。

  来源:新华网

越发真假难辨?谷歌推出新一代视频生成模型Veo 2

      当地时间16日,美国谷歌旗下的“深层思维”公司宣布,推出新一代人工智能视频生成模型Veo 2,在视频分辨率与图像质量以及模拟真实世界物理规律方面大幅提升。

图片来源:央视网

  该公司称, Veo 2可以创建4K分辨率、时长两分钟的视频,大幅领先美国开放人工智能研究中心(OpenAI)日前公布的最新视频生成模型Sora Turbo。据介绍, Veo 2能根据文本提示或参考图像生成视频,可以更真实地模拟运动、流体力学和光的特性,实现不同的镜头和电影效果,以及“细致入微”的人类表情。

  “深层思维”公司产品副总裁柯林斯表示,在接下来的几个月里,公司将继续根据用户的反馈对产品进行迭代。他承认目前Veo 2仍有不足,该模型生成视频的“连贯性和一致性尚需改进”,在生成复杂细节、快速复杂动作以及突破现实局限方面也有进步空间。

  公司还表示,为应对深度伪造的风险,将利用水印技术把隐形标记嵌入Veo 2生成的视频帧中。

      来源:央视网

长沙6个上榜!2024年先进计算赋能新质生产力典型应用案例名单公布

  近日,2024年先进计算赋能新质生产力典型应用案例名单公布,长沙6家企业上榜。

  传统产业领域:焊联工业互联网有限公司、湖南云智迅联科技发展有限公司;

  新兴产业领域:中国铁建重工集团股份有限公司、湖南湘江智能科技创新中心有限公司;

  未来产业领域:湖南马栏山视频先进技术研究院有限公司、万兴科技(湖南)有限公司。

  来源:长沙发布

微信公众号上线“作者朗读音色”功能

  据微信方面介绍,作者需要下载一个“公众号助手”APP,点击“我-设置-朗读音色”,就可以录制例句,例句也会复刻作者的语气和情感。录制完成并点击应用,即可在公众号里拥有自己的个性化语音。

图片来源:环球网

  微信方面称,每一个公众号都可以创建多个不同的音色。

  来源:环球网

武汉大学人工智能学院成立

  据悉,武汉大学于2024年7月起谋划人工智能学科建设方案,2024年9月组织相关专家对人工智能学科单独建院建设方案进行评估论证,并于2024年12月发文成立,由校长张平文亲任院长,秉承“坚持学科引领、坚持一流目标、统筹发展与稳定”的筹建原则,助力一体推进教育科技人才事业发展,强化学科组织建制对学科建设、人才培养、科技创新的支撑和促进作用,更好地服务学校“5至10年建成中国特色世界一流大学”战略目标。

  来源:武汉大学新闻网

图片来源:武汉大学新闻网

我国科学家建立生成式模型为医学AI训练提供技术支持

  北京大学与温州医科大学的研究团队建立一种生成式多模态跨器官医学影像基础模型(MINIM),可基于文本指令以及多器官的多种成像方式,合成海量的高质量医学影像数据,为医学影像大模型的训练、精准医疗及个性化诊疗等提供有力技术支持。该成果已于近期在国际权威期刊《自然·医学》上在线发表。

图片来源:科普中国

  医学影像大模型是利用深度学习和大规模数据训练的AI通用模型,可自动分析医学影像以辅助诊断和治疗规划。但要提升大模型的性能,就需要大量数据不断进行训练。然而,由于患者隐私保护、高昂的数据标注成本等多种因素,要获得高质量、多样化的医学影像数据往往存在障碍。为此,近年来,研究者们开始探索使用生成式AI技术合成医学影像数据,以此来扩充数据。

  来源:人民网

  策划 | 肖湘

  编辑 | 何灿 万云章

作者:编辑:周婷值班主任:黄斯达值班编委:唐小涛
2024-12-20